Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq
ATraNoS workshop Antwerpen 17 september 2004 ATraNoS = Automatische Transcriptie en Normalisatie van Spraak Doelstellingen: –transcriptie van spontane spraak –conversie van deze transcripties volgens de noden van de gebruikers, bv. ondertiteling
ATraNoS workshop Antwerpen 17 september 2004 Vocabularium grootte Spraakherkenningsproblemen Spraak commando’s Name dialing Directory assistance Dialoog- systemen Natuurlijke conversatie Kantoor- toepassingen Spreekstijl geïsoleerd verbonden voorgelezen vloeiend spontaan moeilijkheids- graad
ATraNoS workshop Antwerpen 17 september 2004 Benchmarks mens vs. computer
ATraNoS workshop Antwerpen 17 september 2004 ATraNoS architectuur akoestisch model lexicon module samengestelde woorden audio segmentatie detectie haperingen spraak decoder taalmodel P2G convertor statistische ondertiteling regel- gebaseerde ondertiteling combinatie audiospraak woorden fonemen ondertitel betrouwbaarheid
ATraNoS workshop Antwerpen 17 september 2004 ATraNoS architectuur akoestisch model lexicon module samengestelde woorden audio segmentatie detectie haperingen spraak decoder taalmodel P2G convertor statistische ondertiteling regel- gebaseerde ondertiteling combinatie audiospraak woorden fonemen ondertitel betrouwbaarheid bestond voor atranos
ATraNoS workshop Antwerpen 17 september 2004 ATraNoS architectuur akoestisch model lexicon module samengestelde woorden audio segmentatie detectie haperingen spraak decoder taalmodel P2G convertor statistische ondertiteling regel- gebaseerde ondertiteling combinatie audiospraak woorden fonemen ondertitel betrouwbaarheid bestond voor atranos ontwikkeld in atranos aangepast in atranos
ATraNoS workshop Antwerpen 17 september 2004 Partners en Werkpakketten WP1: segmentatie van audiostroom in homogene segmenten: Universiteit Gent, ELIS WP2: behandeling van OOV woorden: –P2G converter: Universiteit Antwerpen, Centrum voor Nederlandse Taal en Spraak (CNTS) –samengestelde woorden: K.U.Leuven, Centrum voor Computerlinguïstiek (CCL) –betrouwbaarheidsmaten: K.U.Leuven, ESAT
ATraNoS workshop Antwerpen 17 september 2004 Partners en Werkpakketten WP3: spontane spraak problemen: –detectie van haperingen (ELIS) –statistisch taalmodel (ESAT) WP4: ondertiteling: –statistische ondertitelingsmodule (CNTS) –linguïstische ondertitelingsmodule (CCL)
ATraNoS workshop Antwerpen 17 september 2004 Programma van vandaag 9u30:onthaal 10u:inleiding en overzicht: Patrick Wambacq 10u30: segmentatie van audio en detectie van haperingen in spraak: Jean-Pierre Martens, Frederik Stouten, An Vandecatseye 11u45:automatische transcriptie van spraak: Jacques Duchateau 12u30:lunch 14u:behandeling van spontane spraakfenomenen: Frederik Stouten, Jacques Duchateau 14u45:automatische generatie van ondertitels: Erik Tjong Kim Sang, Vincent Vandeghinste 15u45:conclusies en afsluiting: Patrick Wambacq 16u15:borrel
ATraNoS workshop Antwerpen 17 september 2004 Conclusies wetenschappelijke vooruitgang geboekt doelstellingen van het project zijn gehaald: –deliverables zijn er allemaal –disseminatie en valorisatie verlopen vlot goede samenwerking tussen partners leidt tot nieuwe gezamenlijke activiteiten
ATraNoS workshop Antwerpen 17 september 2004 Disseminatie tot nog toe 25 artikels in CLIN(01, 02, 03), ICSLP(02, 04), ROBUST04, ACL04, LREC(02, 04), ASRU(01, 03), EuroSpeech03, CoNLL(02, 03), ICASSP02, JMLR02 artikels te vinden op website,
ATraNoS workshop Antwerpen 17 september 2004 Valorisatie resultaten of delen ervan worden gebruikt in heel wat projecten van de projectpartners MUSA, CALL, FLaVoR, METIS II, ONTOBASIS, PASCAL network, SPACE (?), Stevin programma (??) specifiek voor ondertiteling: MUSA (EU 5e kader) met partners ILSP, Systran, BBC, LCC, CNTS, ESAT, zie