Türkiye’de henüz uygulanmayan yeniden söyleyicilik (YS) yönteminde, canlı yayında işitilen sözel içerik, kısmen kısaltılıp yoğunlaştırılarak yinelenir. Otomatik konuşma tanıma yoluyla elde edilen yazılı metin, bir altyazılama bileşeninde düzenlenerek yayına verilir. Bu çalışmada ileride TV haber/tartışma programlarında YS'ye başvurulduğu takdirde Türkçe konuşma dilinin hangi yönlerinin dikkate alınması gerekeceği araştırılmıştır. Haber bülteni, ekonomi ve tartışma program kesitlerinden oluşturulan bir derlem (toplam 76 dakika 6 saniyelik ses/görüntü kaydı ve çevriyazı) nitel yöntemle çözümlenmiştir. Konuşma dilinin metin düzenleme işlemini etkileyebilecek yönleri arasında, sözdizim düzeyinde tümce uzunluğu, sözcük dizilişi ve anlatım bozukluklarının, anlambilim/edimbilim düzeyinde kip, kiplik ve sözeylem ifadelerinin, söylem düzeyinde ise bilgi içeriği düşük ögelerin bulunduğu saptanmıştır. Kısaltma/yoğunlaştırma amacıyla başvurulan stratejiler arasındaysa atlama, gecikmeyi önlemek bakımından yeniden biçimlendirmeye göre daha uygun görünmektedir.
canlı altyazılama yeniden söyleyicilik otomatik konuşma tanıma atlama yeniden biçimlendirme
Respeaking is a live subtitling method not yet practised in Turkey. A respeaker dictates the verbal content of a live TV program in reduced form to an automatic speech recognition engine which renders a written text to be post-edited on a subtitling component. This study presents a number of observations on those aspects of spoken Turkish which may be relevant to prospective respeaking practices for TV news and debates as well as on possible strategies to be employed while transforming the original content into subtitles. A qualitative analysis of a transcribed audiovisual corpus (total duration 76 min. 6 sec.) comprising clips from news/economics programs and debates has shown that the following factors might influence text reduction during respeaking: sentence length, word order and ungrammaticality/disfluency on syntactic level; mood, modality and speech act expressions on semantic/pragmatic level and elements with low information content (e.g. fillers, redundantly used discourse markers) on discursive level. An evaluation of the data with respect to two text reduction strategies, namely omission and reformulation, has suggested that omission may be prioritized in order to prevent latency.
Live subtitling respeaking automatic speech recognition omission reformulation
Birincil Dil | Türkçe |
---|---|
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 30 Haziran 2021 |
Yayımlandığı Sayı | Yıl 2021 |
Bu eser
Dergi DOI:10.18492/dad