De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 22 oktober 2003 Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau

Verwante presentaties


Presentatie over: "Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 22 oktober 2003 Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau"— Transcript van de presentatie:

1 Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 22 oktober 2003 Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau jacques.duchateau@esat.kuleuven.ac.be

2 Taalmodellen voor spontane spraak - Jacques Duchateau 2 Overzicht van WP 3, deel ESAT laatste 2 jaar van het ATraNoS-project 4 delen van een half jaar –1e half jaar: ontwikkeling baseline herkenners Engels, gebaseerd op Switchboard: afgewerkt Nederlands, gebaseerd op CGN: vertraging –2e half jaar: software-ontwikkeling –3e half jaar: experimenten enkele voorlopige resultaten –4e half jaar: integratie met WP 3, deel ELIS

3 Taalmodellen voor spontane spraak - Jacques Duchateau 3 Baseline herkenner Switchboard vorige periode: eerste versie –32.1% WER, cf. 19.8% (CU) en 35.6% (ISIP) –2 x trager dan real time, cf. 200 x (CU, ISIP) afwerking, verbeteringen –test vocabularium met 27k woorden: 31.7% –2 keer meer gaussianen (120k): 30.8% –5 keer meer zoeken: 30.0% –spraakdetector: 30.0% –4-gram taalmodel: 29.6%

4 Taalmodellen voor spontane spraak - Jacques Duchateau 4 Spontaan LM: probleemstelling beschikbaarheid van traindata –geschreven tekst, vb kranten: 300M woorden –spontane spraak, vb Switchboard: 3M woorden haperingen –geschreven tekst: typisch goed gevormde zin –spontane spraak: haperingen maken de context bij het N-gram minder uniform

5 Taalmodellen voor spontane spraak - Jacques Duchateau 5 Spontaan LM: oplossing LM interpreteren als Markov Model extra: in sommige gevallen is de nieuwe context anders of is er zelfs keuze software: implementatie van algemeen format om dit te beschrijven

6 Taalmodellen voor spontane spraak - Jacques Duchateau 6 Spontaan LM: experimenten (1) Herhaling, vb. ‘Dat is wat wat ik denk’ Opties:BlijftWegKeuze WER:39.2%39.0%39.2%

7 Taalmodellen voor spontane spraak - Jacques Duchateau 7 Spontaan LM: experimenten (2) Zin herstart, vb. ‘Dat is wat... Zo is het’ Opties:Geen herstartKeuze WER:39.2%39.5%

8 Taalmodellen voor spontane spraak - Jacques Duchateau 8 Conclusies, verder werk baseline Switchboard: laat gewenste experimenten toe (WER, snelheid) baseline CGN: vertraging volgende periode: afwerking software, uitvoeren experimenten daarna: integratie –akoestische problemen, vb afgebroken woorden –gebruik hapering-detector ELIS


Download ppt "Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 22 oktober 2003 Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau"

Verwante presentaties


Ads door Google