S1S1 S2S2 S3S3 WP2 OOV woorden in herkenners WP2.2 Betrouwbaarheidsmaten Jacques Duchateau ESAT – PSI - Spraakgroep.

Slides:



Advertisements
Verwante presentaties
1.larmoire. 2. lescalier 3. La grand-mere 4. Le canapé
Advertisements

Leer de namen van de noten 1
Downloaden: Ad-aware. Downloaden bestaat uit 3 delen: •1. Zoeken naar de plek waar je het bestand kan vinden op het internet •2. Het nemen van een kopie.
Prekenserie Handelingen - deel 6 (slot) ‘Gods Woord overwint omdat het mensen in de vrijheid zet!’ Hand 28,31.
Stagedagboek IAB opleiding - 16/02/2013.
Ronde (Sport & Spel) Quiz Night !
Urk 1 december Want ALLEN hebben gezondigd en derven de heerlijkheid Gods, 24 en worden OM NIET GERECHTVAARDIGD uit zijn GENADE, door de verlossing.
Nieuwe data voor (nieuwe) OV modellen
Klaar met school en dan…? Kansen op de arbeidsmarkt en hoe pak je die? Jos Sanders, TNO.
Naar het Jaareinde toe
Leer de namen van de noten 2
© GfK 2012 | Title of presentation | DD. Month
WISKUNDIGE FORMULES.
Ondergrondse Geo-Informatie GIS bij tunnel-engineering
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent GEAUTOMATISEERD SPRAAKVERSTAANBAARHEIDSONDERZOEK fantasie of werkelijkheid? Jean-Pierre Martens Catherine.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 4 mei 2004 Modellering van spontane spraak Jacques Duchateau
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 11 mei 2001.
S1S1 S2S2 S3S3 22 november 2001K.U.Leuven-ESAT/PSI Spraak WP2 Detectie en behandeling van OOV woorden l OOV woorden detecteren door betrouwbaarheid van.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 22 oktober 2003 Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Gebruikerscommissie 4 mei 2004 Patrick Wambacq.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 22 november 2001.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 28 oktober 2002.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 9 april 2003.
Statistische Taalmodellen voor Spontane Spraak
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
Natuurlijke Taalverwerking
Beslisbomen Robert de Hoog College Beslissingsondersteuning 26 september 2002.
TUDelft Knowledge Based Systems Group Zuidplantsoen BZ Delft, The Netherlands Caspar Treijtel Multi-agent Stratego.
Les 12b : MODULE 1 Snedekrachten (4)
Les 12b : MODULE 1 Snedekrachten (4)
1 Voorwaarden hergebruik Modulair ontwerp Low coupling High cohesion.
1 WIJZIGINGEN UNIEK VERSLAG. 2 Agenda Verbeteringen Veranderingen formulieren Praktische herinneringen Nieuwe formulieren Sociale en culturele participatie.
INFORMATICA ACADEMIE >> Opleidingen ism VERA. INFORMATICA ACADEMIE Voor informatici... CNAP (cursus netwerkbeheerder) volgende sessie start in januari.
Werken aan Intergenerationele Samenwerking en Expertise.
Breuken-Vereenvoudigen
Aanvullende vragen Collegesheets M&S3
Train de trainer energiedeskundigen type A september/oktober 2012
De eerste presentatie voor Nederlands
2009 Tevredenheidsenquête Resultaten Opleidingsinstellingen.
PLAYBOY Kalender 2006 Dit is wat mannen boeit!.
Het Heiligdom Een Afbeelding voor Redding 4e Kwartaal 2013 INLEIDING
Chronologie van maatregelen tegen de joden in het Derde rijk
Wouter Jansweijer, 16 September, Literatuur zoeken Project informatiewetenschappen october 2002.
Economische impact sluiting Ford Genk Ludo Peeters en Mark Vancauteren (Universiteit Hasselt)
“Decentraal wat kan, centraal wat moet”
ATRaNoS T1-T6 CNTS Team: Bart Decadt Erik Tjong Kim Sang Walter Daelemans.
Context-Driven Adaptation of Mobile Services Vergadering met Gebruikerscommissie na jaar 2.
A H M F K EB C x 91 Van hand veranderen voor de X splitsen en Rechangeren. Met de nieuwe partner op.
A H M F K EB C x 85 Korte zijde bij C 2 e secties volte 14 m en op afstand komen ( 0,5 rijbaan)
ZijActief Koningslust 10 jaar Truusje Trap
Voorrangsregels bij rekenen (1)
ECHT ONGELOOFLIJK. Lees alle getallen. langzaam en rij voor rij
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 5.
USABILITY MYTHBUSTERS BASTIAAN KLOOSTER & PETER AKERBOOM CONGRES WEBREDACTIE 2011.
S.V.T.B. Curius 2 3 Vorige bijeenkomst S.V.T.B. Curius 4 Vorige bijeenkomst Voorstelrondje Wie ben je, wat doe je en wat ga je doen?
De financiële functie: Integrale bedrijfsanalyse©
1 BUE: de eerste cijfers Gijs Martens HRM Netwerk 22/02/02.
© Alert Management Consultants Slim Werk Vinden Programma.
Ontwikkeling van aanbevelingsalgoritmen voor online social games Jan Heuninck.
POL (MO)-methode  Dit is de kapstok waar je de rest van de zin aan op kunt hangen.  Vervolgens kijk je of er eventueel een meewerkend voorwerp in.
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
Strijd tegen de zonde?.
ZijActief Koningslust
Tuinvogels herkennen.
Transcript van de presentatie:

S1S1 S2S2 S3S3 WP2 OOV woorden in herkenners WP2.2 Betrouwbaarheidsmaten Jacques Duchateau ESAT – PSI - Spraakgroep

S1S1 S2S2 S3S3 28 oktober 2002K.U.Leuven – ESAT – PSI - Speech Betrouwbaarheidsmaten: overzicht Doel: aanwijzen verkeerd herkende woordenDoel: aanwijzen verkeerd herkende woorden InformatiebronnenInformatiebronnen zoekalgoritme zoekalgoritme taalmodel taalmodel akoestische modellen akoestische modellen Scores op woordniveauScores op woordniveau Combinatie scores: logit modelCombinatie scores: logit model Evaluatie: genormaliseerde kruisentropie ; ROCEvaluatie: genormaliseerde kruisentropie ; ROC Herkenningstaak: WSJHerkenningstaak: WSJ 20k woorden - 1.9% OOV - 8.0% WER 20k woorden - 1.9% OOV - 8.0% WER

S1S1 S2S2 S3S3 28 oktober 2002K.U.Leuven – ESAT – PSI - Speech Informatiebronnen: overzicht ZoekalgoritmeZoekalgoritme verloopt de herkenning moeilijk? verloopt de herkenning moeilijk? goede indicator: aantal onderzochte opties goede indicator: aantal onderzochte opties TaalmodelTaalmodel past het woord in de zin? past het woord in de zin? achterwaarts taalmodel toevoegen aan voorwaarts achterwaarts taalmodel toevoegen aan voorwaarts paper op ICASSP-02 paper op ICASSP-02 Akoestisch modelAkoestisch model past het woord akoestisch gezien? past het woord akoestisch gezien? goede normalisatie likelihood nodig goede normalisatie likelihood nodig paper op ICSLP-02 paper op ICSLP-02

S1S1 S2S2 S3S3 28 oktober 2002K.U.Leuven – ESAT – PSI - Speech Akoestisch model: normalisatie 1 ReferentieReferentie zoekalgoritme + taalmodellen19.3% zoekalgoritme + taalmodellen19.3% Normalisatie met onconditionele likelihoodNormalisatie met onconditionele likelihood referentie + akoestisch model24.8% referentie + akoestisch model24.8% Normalisatie met likelihoods uit foneemherkenner met 2-gram of 5-gramNormalisatie met likelihoods uit foneemherkenner met 2-gram of 5-gram referentie + akoestisch model (2-gram)23.9% referentie + akoestisch model (2-gram)23.9% referentie + akoestisch model (5-gram)22.9% referentie + akoestisch model (5-gram)22.9%

S1S1 S2S2 S3S3 28 oktober 2002K.U.Leuven – ESAT – PSI - Speech Akoestisch model: normalisatie 2 ReferentieReferentie zoekalgoritme + taalmodellen19.3% zoekalgoritme + taalmodellen19.3% Normalisatie met onconditionele likelihoodNormalisatie met onconditionele likelihood referentie + akoestisch model24.8% referentie + akoestisch model24.8% Extra normalisatie met verwachte waarde, geschat uit dev. test set of uit alle traindataExtra normalisatie met verwachte waarde, geschat uit dev. test set of uit alle traindata referentie + ak. model (dev. test)24.5% referentie + ak. model (dev. test)24.5% referentie + ak. model (traindata)24.5% referentie + ak. model (traindata)24.5%

S1S1 S2S2 S3S3 28 oktober 2002K.U.Leuven – ESAT – PSI - Speech Combinatie van scores via gaussianen ReferentieReferentie zoekalgoritme + taalmodellen18.1% zoekalgoritme + taalmodellen18.1% Normalisatie met onconditionele likelihoodNormalisatie met onconditionele likelihood referentie + akoestisch model22.0% referentie + akoestisch model22.0% Normalisatie via foneemherkennerNormalisatie via foneemherkenner referentie + akoestisch model (2-gram)19.9% referentie + akoestisch model (2-gram)19.9% referentie + akoestisch model (5-gram)20.9% referentie + akoestisch model (5-gram)20.9% Extra normalisatie met verwachte waardeExtra normalisatie met verwachte waarde referentie + ak. model (dev. test)22.4% referentie + ak. model (dev. test)22.4%

S1S1 S2S2 S3S3 28 oktober 2002K.U.Leuven – ESAT – PSI - Speech Integratie deeltaken WP2 Conversie foneem naar grafeem (CNTS)Conversie foneem naar grafeem (CNTS) - duid onzekere woorden aan - doe foneemherkenning - converteer in grafeemstring - duid onzekere woorden aan - doe foneemherkenning - converteer in grafeemstring paper op ICASSP-02 paper op ICASSP-02 Probleem samengestelde woorden (CCL)Probleem samengestelde woorden (CCL) integratie in herkenner ESAT integratie in herkenner ESAT WER van 14.8% naar 13.2% (automatisch) of 11.4% (manueel samenstellen van woorddelen) WER van 14.8% naar 13.2% (automatisch) of 11.4% (manueel samenstellen van woorddelen) paper op ICSLP-02 paper op ICSLP-02

S1S1 S2S2 S3S3 28 oktober 2002K.U.Leuven – ESAT – PSI - Speech Toekomst Onderzoek i.v.m. betrouwbaarheidsmaten in WP2: afgerondOnderzoek i.v.m. betrouwbaarheidsmaten in WP2: afgerond Onderzoek i.v.m. taalmodellen voor spontane spraak in WP3Onderzoek i.v.m. taalmodellen voor spontane spraak in WP3 volgende twee jaren volgende twee jaren pilootexperiment uitgevoerd pilootexperiment uitgevoerd