Statistische Taalmodellen voor Spontane Spraak

Slides:



Advertisements
Verwante presentaties
SINT LUKAS HOGESCHOOL BRUSSEL
Advertisements

> Met websitestatistieken naar een betere website Rick Koopman.
1 19 jan Urk. 2 de context van 2Korinthe 3  Paulus reageert op beschuldigingen dat hij onbevoegd zou zijn (3:1,2);  Paulus plaatst zijn Evangelie.
28 juni 2009 Paëllanamiddag 1 Paëllanamiddag 28 juni 2009 Voorbereiding vrijdagavond (Loopt automatisch - 7 seconden)
NEDERLANDS WOORD BEELD IN & IN Klik met de muis
1 Resultaten marktonderzoek RPM Zeist, 16 januari 2002 Door: Olga van Veenendaal, medew. Rothkrans Projectmanagement.
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Uitgaven aan zorg per financieringsbron / /Hoofdstuk 2 Zorg in perspectief /pagina 1.
Obesitas De obesitasepidemie en de evolutie van het aantal bariatrische ingrepen bij MLOZ-leden Dr. Katrien Van Rie Dr. Jan Van Emelen.
Personalisatie van de Archis website Naam: Sing Hsu Student nr: Datum: 24 Juni 2004.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
7 april 2013 Zoetermeer 1. 1Korinthe Maar, zal iemand zeggen, hoe worden de doden opgewekt? En met wat voor lichaam komen zij? 2.
STAPPENPLAN GRAMMATICUS.
Ronde (Sport & Spel) Quiz Night !
Keuzeondersteunend model voor inbouwpakketten bij herbestemmingsprojecten Eindcolloquium Wiebrand Bunt.
prNBN D addendum 1 Deel 2: PLT
Start.
Kb.1 Ik leer op een goede manier optellen en aftrekken
Leiden University. The university to discover. ICLON, Interfacultair Centrum voor Lerarenopleiding, Onderwijsontwikkeling en Nascholing Denkgereedschap.
Nooit meer onnodig groen? Luuk Misdom, IT&T
Passie - Verrijzenis Arcabas
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 4 mei 2004 Modellering van spontane spraak Jacques Duchateau
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 11 mei 2001.
S1S1 S2S2 S3S3 22 november 2001K.U.Leuven-ESAT/PSI Spraak WP2 Detectie en behandeling van OOV woorden l OOV woorden detecteren door betrouwbaarheid van.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 22 oktober 2003 Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Gebruikerscommissie 4 mei 2004 Patrick Wambacq.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
presentatie Atranos 9 april '03 Universiteit Gent-ELIS-Speech Lab 1 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 22 november 2001.
S1S1 S2S2 S3S3 WP2 OOV woorden in herkenners WP2.2 Betrouwbaarheidsmaten Jacques Duchateau ESAT – PSI - Spraakgroep.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 28 oktober 2002.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 9 april 2003.
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
1 introductie 3'46” …………… normaal hart hond 1'41” ……..
Oefeningen F-toetsen ANOVA.
Neuron.
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
Les 12b : MODULE 1 Snedekrachten (4)
Les 12b : MODULE 1 Snedekrachten (4)
Wie het kleine niet eert ... (quarks, leptonen,….)
Reductil ® Overgewicht en CV risicofactoren Link tussen de taille-omtrek en het metabool syndroom.
“Waarom zouden we Genesis 1 op de letterlijke manier lezen? Genesis 1 is geen krantenverslag.” 3.
1 7 nov Rijnsburg 7 nov Rijnsburg. 2 Hebreeën 7 15 En nog veel duidelijker wordt het, als naar het evenbeeld van Melchisedek een andere priester.
Pasen & Pinksteren op één dag!
De FFT spectrumanalyzer
User management voor ondernemingen en organisaties
2009 Tevredenheidsenquête Resultaten Opleidingsinstellingen.
ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B
ribWBK11t Toegepaste wiskunde Lesweek 02
Landelijke dag RMC- coördinatoren Aanpak uitrol Loket VSV 4 juni 2008.
Hoe gaat dit spel te werk?! Klik op het antwoord dat juist is. Klik op de pijl om door te gaan!
1 Controleplan 2005 Raadgevend comité Hotel President – donderdag 21 april 2005.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 5.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 3.
Fractale en Wavelet Beeldcompressie
Fractale en Wavelet Beeldcompressie
De financiële functie: Integrale bedrijfsanalyse©
Samen-bouwen … over paneelbouw en de rest!
Logistics: a driver for innovation Low costs High value Flexibility now and later Superior technology Timwood - T > No transport - I > No Inventory - M.
aangename ont - moeting
22/11/ DE ADVIEZEN VAN BEURSMAKELAAR BERNARD BUSSCHAERT Week
JOUW WERELD MIJN WERELD
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
13 november 2014 Bodegraven 1. 2 de vorige keer: 1Kor.15:29-34 indien er geen doden opgewekt worden...  vs 29: waarom dopen?  vs.30-32: waarom doodsgevaren.
1 DE ADVIEZEN VAN BEURSMAKELAAR BERNARD BUSSCHAERT Week Us$ stijgt en de VS markten en grondstoffen markten+ obligatie markten storten ineen.
Dienstregelingen en Wiskunde
1 DE ADVIEZEN VAN BEURSMAKELAAR BERNARD BUSSCHAERT Week
Transcript van de presentatie:

Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau K.U.Leuven - ESAT/PSI - Spraakgroep

Doelstelling Doel: statistische taalmodellen voor spontane spraak behandelen van haperingen Toegepast op spraakherkenning Statistisch model : N-gram oplossing 1: een model per spraakmode oplossing 2: bijkomende vrijheidsgraden voor het N-gram (cf. Markov model) K.U.Leuven – ESAT/PSI - Spraakgroep 9 April 2003

Probleemstelling Beschikbaarheid van traindata Haperingen geschreven tekst, vb. kranten: 300M woorden spontane spraak, vb. Switchboard: 3M woorden Haperingen geschreven tekst: typisch goed gevormde zinnen spontane spraak: haperingen maken de context bij het N-gram minder uniform K.U.Leuven – ESAT/PSI - Spraakgroep 9 April 2003

Baseline herkenners Voor het Engels: Switchboard telefoonspraak (8 kHz) benchmark: ter vergelijking baseline ontwikkeld in de voorbije periode Voor het Nederlands: CGN face-to-face (16 kHz) gebruik in systeem voor ondertiteling vertraging beschikbaarheid data CGN voorlopig enkel herkenner voor voorgelezen spraak K.U.Leuven – ESAT/PSI - Spraakgroep 9 April 2003

Switchboard: de data Trainen van de modellen data 1995: workshop JHU 65 uur akoestische data 2M woorden voor het taalmodel akoestische segmentatie, geen afgebroken woorden data 2002: transcripties ISIP 310 uur akoestische data 3M woorden voor het taalmodel segmentatie per zin, met afgebroken woorden Benchmark test: HUB5 eval 2001 akoestische data: via LDC referentietranscripties: via ftp van nist.gov K.U.Leuven – ESAT/PSI - Spraakgroep 9 April 2003

Switchboard: benchmark resultaten CU ATT BBN IBM SRI JHU ISIP ESAT CMS X LDA O VTLN MLLR 310u O/X cw-cd ? MMIE LM+ Rover WER 19.8% 20.3% 20.5% 21.9% 23.3% 26.2% 35.6% K.U.Leuven – ESAT/PSI - Spraakgroep 9 April 2003

Stap 1 : JHU data context-onafhankelijk : 56.4% (WER) context-afhankelijk : 39.9% ook positie-afhankelijk : 38.6% decorrelatie op niveau gaussianen : 38.6% 60k gaussianen ipv 20k : 36.2% K.U.Leuven – ESAT/PSI - Spraakgroep 9 April 2003

Stap 2 : suggesties andere systemen CMS : (1) niet adaptief, (2) gegeven PEM-files adaptief, zonder PEM : 36.2% niet adaptief, zonder PEM : 35.5% adaptief, gegeven PEM : 35.7% niet adaptief, gegeven PEM : 35.5% keuze MEL-banden (met versnelde training) 0 tot 17 : 37.3% 0 tot 18 : 36.5% 1 tot 17 : 36.9% 1 tot 18 : 36.3% 125Hz tot 3800Hz : 36.5% instellen aantal features: 25 vs. 39 1 tot 17 : 36.9% vs. 34.9% 125Hz tot 3800Hz : 36.5% vs. 34.3% K.U.Leuven – ESAT/PSI - Spraakgroep 9 April 2003

Stap 3 : ISIP transcripties akoestische modellen: 310 uur data 65 uur data (JHU) : 34.3% 310 uur data (ISIP) : 32.5% aantal parameters (gaussianen) gelijkgehouden taalmodel (3-gram): 3M woorden ipv 2M JHU akoestische modellen : 33.8% ISIP akoestische modellen : 32.1% K.U.Leuven – ESAT/PSI - Spraakgroep 9 April 2003

Conclusies, verder werk Switchboard: ontwikkelde baseline laat toe het gewenste onderzoek te doen CGN: vertraging beschikbaarheid CGN levert geen wezenlijke problemen Volgende periode: ontwikkeling modules om het spontane taalmodel te verbeteren Eerste, nog beperkte experimenten werden al uitgevoerd en voorgesteld op CLIN-02 Integratie met detector voor haperingen K.U.Leuven – ESAT/PSI - Spraakgroep 9 April 2003