Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq
ATraNoS workshop Antwerpen 17 september 2004 ATraNoS = Automatische Transcriptie en Normalisatie van Spraak Doelstellingen: –transcriptie van spontane spraak –conversie van deze transcripties volgens de noden van de gebruikers, bv. ondertiteling
ATraNoS workshop Antwerpen 17 september 2004 Vocabularium grootte Spraakherkenningsproblemen Spraak commando’s Name dialing Directory assistance Dialoog- systemen Natuurlijke conversatie Kantoor- toepassingen Spreekstijl geïsoleerd verbonden voorgelezen vloeiend spontaan moeilijkheids- graad
ATraNoS workshop Antwerpen 17 september 2004 Benchmarks mens vs. computer
ATraNoS workshop Antwerpen 17 september 2004 ATraNoS architectuur akoestisch model lexicon module samengestelde woorden audio segmentatie detectie haperingen spraak decoder taalmodel P2G convertor statistische ondertiteling regel- gebaseerde ondertiteling combinatie audiospraak woorden fonemen ondertitel betrouwbaarheid
ATraNoS workshop Antwerpen 17 september 2004 ATraNoS architectuur akoestisch model lexicon module samengestelde woorden audio segmentatie detectie haperingen spraak decoder taalmodel P2G convertor statistische ondertiteling regel- gebaseerde ondertiteling combinatie audiospraak woorden fonemen ondertitel betrouwbaarheid bestond voor atranos
ATraNoS workshop Antwerpen 17 september 2004 ATraNoS architectuur akoestisch model lexicon module samengestelde woorden audio segmentatie detectie haperingen spraak decoder taalmodel P2G convertor statistische ondertiteling regel- gebaseerde ondertiteling combinatie audiospraak woorden fonemen ondertitel betrouwbaarheid bestond voor atranos ontwikkeld in atranos aangepast in atranos
ATraNoS workshop Antwerpen 17 september 2004 Partners en Werkpakketten WP1: segmentatie van audiostroom in homogene segmenten: Universiteit Gent, ELIS WP2: behandeling van OOV woorden: –P2G converter: Universiteit Antwerpen, Centrum voor Nederlandse Taal en Spraak (CNTS) –samengestelde woorden: K.U.Leuven, Centrum voor Computerlinguïstiek (CCL) –betrouwbaarheidsmaten: K.U.Leuven, ESAT
ATraNoS workshop Antwerpen 17 september 2004 Partners en Werkpakketten WP3: spontane spraak problemen: –detectie van haperingen (ELIS) –statistisch taalmodel (ESAT) WP4: ondertiteling: –statistische ondertitelingsmodule (CNTS) –linguïstische ondertitelingsmodule (CCL)
ATraNoS workshop Antwerpen 17 september 2004 Programma van vandaag 9u30:onthaal 10u:inleiding en overzicht: Patrick Wambacq 10u30: segmentatie van audio en detectie van haperingen in spraak: Jean-Pierre Martens, Frederik Stouten, An Vandecatseye 11u45:automatische transcriptie van spraak: Jacques Duchateau 12u30:lunch 14u:behandeling van spontane spraakfenomenen: Frederik Stouten, Jacques Duchateau 14u45:automatische generatie van ondertitels: Erik Tjong Kim Sang, Vincent Vandeghinste 15u45:conclusies en afsluiting: Patrick Wambacq 16u15:borrel