Live-ondertiteling & spraakherkenning De invloed van reductie bij live-ondertiteling op de perceptie van de ondertitels bij senioren (Masterverhandeling Lisa Kussé) Raphaël de Pitteurs Yoshi Denis
Live-ondertitelen ◦ Reductie Spraakherkenning Onderzoek Lisa Kussé Implicaties
Live ondertiteling De geschreven weergave van wat er gezegd wordt op een live show op televisie (Kussé, 2010)
Waarom live-ondertiteling? Initieel voor doven en slechthorenden maar volgens onderzoek door VRT bleek het al snel buiten die groep in de smaak te vallen, vooral bij senioren.
Proces live-ondertiteling
Neon (Nederlandse Ondertiteling) Neon (Nederlandse Ondertiteling) Ondertitelingsproces wordt met behulp van spraaktechnologie met 40% versneld (Nog) niet mogelijk om volledig geautomatiseerd te ondertitelen
Reductie Het weglaten en herformuleren van ondertitels om ze aan te passen aan de gemiddelde leessnelheid (Kussé, 2010)
Waarom reductie? Gemiddelde presentatiesnelheid van ondertitels is 120 à 125 woorden per minuut Gemiddelde spreeksnelheid tijdens liveshows is 180 woorden per minuut
Onderzoeksopzet 35 senioren tussen 62 en 84 jaar vulden een vragenlijst in over hun begrip en waardering van verschillende ondertitelde fragmenten Controlegroep van 30 studenten 3 fragmenten met telkens 3 verschillende ondertitelvarianten: ◦ Letterlijke variant ◦ Samengevat (25% reductie) ◦ Maximaal gereduceerd (50% reductie)
Resultaten van het onderzoek Beelden ◦ Reductie verhoogt het begrip van de beelden maar niet van de inhoud. Ondertitels ◦ Gereduceerde ondertitels geven meer tijd om de beelden te bekijken maar krijgen een lagere waardering
Kanttekening bij het onderzoek Leeftijdsverschil binnen de doelgroep is vrij groot, in hoeverre is dit representatief voor senioren? Wanneer wordt iemand als een ‘senior’ beschouwd?
Nood aan ondertiteling Gerrit Callewaert
Wat is spraakherkenning? De technologie om te identificeren en te reageren op hetgeen een wat een persoon zegt (Kotelly, 2003)
Wat zijn de mogelijke toepassingen? ◦ Zowel private als maatschappelijke toepassingen
Private toepassingen o Zelfstudie Leren van een vreemde taal door middel van “computer-assisted learning” o Gaming en vrijetijdsbesteding Locatie restaurants, taxi’s, sportcomplexen,... op smartphone, PC, tablet bv. “Welke goede restaurants zijn hier?” Uitleg toeristische bezienswaardigheden bij GPS-toestellen Mens-systeem dialogen bij gaming of simulaties
Maatschappelijke toepassingen Zorgsector: ◦ Computersystemen om patiënteninformatie op te vragen ◦ Hulp voor patiënten met een spraakgebrek ◦ Opmaak documenten ◦ Controle op afstand voor patiënten die zelfstandig willen blijven wonen E-government ◦ Informatieverstrekking buiten de openingstijden ◦ Verbetering zoekfunctie binnen officiële archieven ◦ Zoeken naar relevante passages binnen parlementaire zittingen
Cultureel erfgoed ◦ Verbetering zoekfunctie binnen digitaal beschikbaar gemaakt erfgoed (d.m.v. geautomatiseerde “knowledge bases”) ◦ Voorziening van automatische ondertiteling van gearchiveerd geluids- en beeldmateriaal Veiligheid ◦ Snelle verwerking van grootschalige informatiestromen Media mining ◦ Aanpassing digitale informatie naar tekst en spraak ◦ Behering persoonlijk profiel op gsm, PDA, etc.
Wat zijn de huidige implicaties? Voorlopig enkel Engels? Relatief stille omgeving nodig Spraakproblemen
Voorbeelden Watson Siri
Bedankt voor uw aandacht!