ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.

Slides:



Advertisements
Verwante presentaties
KWALITEITSZORG november 2012
Advertisements

De elektronische verzamelaanvraag Ruben Fontaine Markt- en Inkomensbeheer – dienst Aangiftes.
Wat was toen het grootste het grootste probleem van de van de FOD?
Presentatie cliëntenonderzoek. Algemeen Gehouden in december 2013 (doorlopend tot eind januari) DoelgroepVerzondenOntvangen% LG wonen en dagbesteding.
Werkwoorden d t dt.
NEDERLANDS WOORD BEELD IN & IN Klik met de muis
WAAROM? Onderzoek naar het meest geschikte traject voor de verlenging tot in Sint-Niklaas van het bestaande fietspad naast de Stekense Vaart en de Molenbeek.
1 Resultaten marktonderzoek RPM Zeist, 16 januari 2002 Door: Olga van Veenendaal, medew. Rothkrans Projectmanagement.
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Uitgaven aan zorg per financieringsbron / /Hoofdstuk 2 Zorg in perspectief /pagina 1.
1 - RA patiënten – Februari 2009 REUMATOÏDE ARTRITIS KENNIS – OPVOLGING – PERSOONLIJKE EVALUATIE Patiëntenonderzoek Initiatief van met de steun van nv.
SCEPTRE symposium, 29 januari 2009
Duurzaamheid en kosten
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
ADOBE PRESENTER Willem vanden Berg Dienst Onderwijsondersteuning en –ontwikkeling KaHo Sint-Lieven 1.
MP3 Compressie van geluid.
Ronde (Sport & Spel) Quiz Night !
Natuurlijke Werkloosheid en de Phillipscurve
INITIATIE DEFINITIESELECTIECONCIPIËREN INBEDDING IN ORGANISATIE ONDERHOUD Opdrachtgever/ Projectleider Eigenaar Architect en zijn team Stakeholders INITIATIEDEFINITIESELECTIECONCIPIËRENINBEDDINGONDERHOUD.
Tevredenheids- enquête 2012 P. Grouwels Inleiding Mogelijke antwoorden: Zeer goed: 4 sterren ****: volledig tevreden; Goed: 3 sterren ***:
Randstad Werkmonitor state of mind arbeidsmarkt (werknemer perspectief) juli – augustus 2007 B
Gepresenteerd door Melissa Billiau o.l.v.: Dr. F. Martens P. Dedeckere 1.
Nooit meer onnodig groen? Luuk Misdom, IT&T
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent GEAUTOMATISEERD SPRAAKVERSTAANBAARHEIDSONDERZOEK fantasie of werkelijkheid? Jean-Pierre Martens Catherine.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 4 mei 2004 Modellering van spontane spraak Jacques Duchateau
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 11 mei 2001.
S1S1 S2S2 S3S3 22 november 2001K.U.Leuven-ESAT/PSI Spraak WP2 Detectie en behandeling van OOV woorden l OOV woorden detecteren door betrouwbaarheid van.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 22 oktober 2003 Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Gebruikerscommissie 4 mei 2004 Patrick Wambacq.
WP1 Segmentatie in homogene delen Objectieven voor eerste 12 maanden –Analyse van literatuur (LIMSI, Philips,…) –Realisatie van basissysteem voor spraak/niet-spraak.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
presentatie Atranos 9 april '03 Universiteit Gent-ELIS-Speech Lab 1 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 22 november 2001.
S1S1 S2S2 S3S3 WP2 OOV woorden in herkenners WP2.2 Betrouwbaarheidsmaten Jacques Duchateau ESAT – PSI - Spraakgroep.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 28 oktober 2002.
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS WP1 : Segmentatie van audiofiles in homogene delen Johan Depoorter Jean-Pierre Martens ELIS-DSSP.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 9 april 2003.
Statistische Taalmodellen voor Spontane Spraak
WP1 Segmentatie in homogene delen Objectieven voor eerste 6 maanden –Analyse van literatuur Philips, LIMSI, BBN, HTK, IBM, Eurecom –Realisatie van basissysteem.
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
Elke 7 seconden een nieuw getal
Lineaire functies Lineaire functie
Differentieer regels De afgeleide van een functie f is volgens de limietdefinitie: Meestal bepaal je de afgeleide niet met deze limietdefinitie, maar.
1 het type x² = getal 2 ontbinden in factoren 3 de abc-formule
LAATSTE SCRIPTIESEMINARIE
Oefeningen F-toetsen ANOVA.
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
In dit vakje zie je hoeveel je moet betalen. Uit de volgende drie vakjes kan je dan kiezen. Er is er telkens maar eentje juist. Ken je het juiste antwoord,
Seminarie 1: Pythagoreïsche drietallen
Ministerie van de Vlaamse Gemeenschap Afdeling HRM BUE Middenkader 2005 Een eerste verkenning van de resultaten.
Meten BMI Dat is in de veilige zone, want de BMI zit tussen 18,5 en 25
ribwis1 Toegepaste wiskunde – Differentieren Lesweek 7
Inger Plaisier Marjolein Broese van Groenou Saskia Keuzenkamp
Obesitas & Schouderdystocie
Help! ‘Niet vorderende ontsluiting’
SAMENWERKING WO EN HBO BIJ AANSLUITINGSONDERZOEK V0-HO Rob Andeweg DAIR 7 en 8 november 2007.
Technische universiteit eindhoven 1 1 OO2-project: Beeldbewerking G. de Haan EH9.27.
EFS Seminar Discriminatie van pensioen- en beleggingsfondsen
Afstudeer Presentatie Application of the Wavelet Transform Modulus Maxima method to T-wave detection in cardiac signals Pieter Jouck 22/12/2004.
Hoe gaat dit spel te werk?! Klik op het antwoord dat juist is. Klik op de pijl om door te gaan!
Op reis naar een dierentuin
AVEBE Project Door: Tim Bas Tjibbe Pieter.
Sociaal en Cultureel Planbureau Ground Golf OBC/
Laatste Scriptieseminarie
STIMULANS KWALITEITSZORG juni 2014.
Hoe en waar wordt de keuze voor de nieuwe auto bepaald? AutoRai 2005 Amsterdam, 10 februari 2005 Anne Hoff Research Director Interview-NSS.
Gezondheid oudere migranten in Utrecht (selectie)
1 BUE Middenkader 2004 Een eerste verkenning van de resultaten.
Transcript van de presentatie:

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Overzicht Doel van werkpakket 3 - detectie van haperingen in spontane spraak - methoden om deze te behandelen in ASR. In deze presentatie - bespreking detectieresultaten - nieuwe features - korte demo - herkenningstesten op CGN-data - toekomstplannen

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Inleiding Vorige periode –identificatie van de verschillende prosodische en akoestische features per spraaksegment. stabiel interval, stilteduur voor/na, graad v. stabiliteit,... –klassificatie met GMM en MLP. GMM = “filter” : elimineer segmenten die zeker geen FP zijn MLP : finaal onderscheid tussen segmenten. Huidige periode –verdere verbeteringen van het systeem –evaluatie op nieuwe testset –vergelijking met bestaande methodes

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Betere stiltedetectie. Indien log energie 3 dB onder threshold → pas threshold aan Over een periode van 3 seconden geen stilte gevonden → threshold = het kleinste minimum over die 3 sec. Keer terug naar positie van minimum om verder stiltes te zoeken Stilte : log-energie minder dan 3 dB boven threshold. t 3 sec E(dB) sil Adaptieve threshold

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Betere stiltedetectie. Volgens deze methode : E[SilVoor | FP] = 12.6, E[SilNa |FP]= 18.4, E[Sil|NFP] = % van de FP’s heeft nu een stilte voor of na (vroeger 75 %) stilte voor geen stilte voor stilte na geen stilte na

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Detectieresultaten Supervised training THRRec.(%)Prec.(%) Embedded training THRRec.(%)Prec.(%) Voor FP’s 0.15 sec : Rec. = 72.4 ; prec. = 77.7 Systeem is niet in staat korte FP’s te detecteren.

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Vergelijking met literatuur Eigen methode –rec. = 75 % en prec. = 85 % Methode van M. Gabrea, D. O’Shaughnessy –in hun paper : rec. > 90% en prec > 90% –rec. = 60.5 % en prec. = 65.5 % Methode van M. Goto, K. Itou, S. Hayamizu –rec. = 84.9 % en prec. = 91.5 % –Japans spraakcorpus, gecompliceerde front-end

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Demo We luisteren naar de demo … oorspronkelijke audio demodemo : 26 gedetecteerde segmenten, waarvan sommige naburig zijn. gefilterde audio Data niet uit CGN, afkomstig van “Workshop Doctoreren”. Real-time = nuttig voor ESAT Input : wave bestand (signaalverwerking ook online). Artikel in Proc. of IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU) 2003

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Onderzoek van bijkomende kenmerken. Literatuur vermeldt pitch als kenmerk: nog niet gebruikt Pitch beschikbaar via het oormodel Eerste kenmerk : relatieve pitchligging (RPL) Verhouding pitch van segment t.o.v. gemiddelde pitch van N aanliggende segmenten FP’s hebben (gemiddeld genomen) een lagere RPL : E[RPL | FP] = 0.96 E[RPL | NFP] = 1.00 N = 7

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Onderzoek van bijkomende kenmerken. Pitchregressiecoëficiënt (PRC) E[PRC | FP] = Hz/cs genormeerd op gemiddelde NFP-segmenten vertonen een grotere variantie op de PRC, maar hebben ongeveer zelfde gem. waarde f (Hz) t (10 ms)

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Onderzoek van bijkomende kenmerken. Laatste pitch-kenmerk: pitchmodulatie variantie (PMV) Tegengesteld aan verwachtingen: FP’s gemiddeld een grotere PMV f(Hz) t (10 ms) Geen grote verbetering verwacht, nog te doen

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Gevulde pauzes en ASR Reacties van ASR op FP’s –Herkennen als uh:uh → uh –Herkennen als functiewoord:uh → uit –Omliggende woorden verkeerd : uh de → nut duiden Mogelijke remedies –FP weglaten in de input –Kans van FP vergroten op basis van detectie –Negeren van uh in de context van taalmodel Voorbeeld … ik ga naar de | uh | markt … P(markt | naar, de) is de goede LM-probabiliteit maar, P(markt | de, *) wordt gebruikt

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Gevulde pauzes en ASR Reacties van ASR op FP’s –Herkennen als uh:uh → uh –Herkennen als functiewoord:uh → uit –Omliggende woorden verkeerd : uh de → nut duiden Mogelijke remedies –FP weglaten in de input –Kans van FP vergroten op basis van detectie –Negeren van uh in de context van taalmodel Voorbeeld … ik ga naar de | uh | markt … P(markt | naar, de) is de goede LM-probabiliteit maar, P(markt | de, *) wordt gebruikt

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Baseline systeem Evaluatiestrategie –Enkel foutieve inhoudswoorden bekijken Experiment 1 –oorspronkelijk lexicon (40k woorden) –FP-rate = 5.9 % –WER = % Experiment 2 –toevoegen van /uh[m]/ aan lexicon –toevoegen van OOV-woorden aan lexicon –WER = % [H = 4130, D = 545, S = 2420, I = 674]

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Systemen met weglating van FP’s Cheating experiment –Weglaten van manueel gelabelde FP’s –WER = % ; R.I. = 7.32 % –1.25 inhoudswoord verbeterd per FP Echt experiment –Weglaten van gedetecteerde FP’s –WER = % ; R.I. = 3.64 % –0.62 inhoudswoord verbeterd per FP

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Enkele voorbeelden Insertiefout en substitutiefout opgeheven REF: … heel veel ambiance |uh| zeker honderden mensen staan …(!) BAS: … heel veel albion zou zeker honderden mensen staan … REF:... heel veel ambiance zeker honderden mensen staan … DEF:... heel veel ambiance zeker honderden mensen staan … Substitutiefout opgeheven, maar insertiefout niet REF: … en |uh| de winnares van het jaar daarvoor … BAS: … en nut duiden winnares van het jaar daarvoor … REF: … en de winnares van het jaar daarvoor … DET: … en naar de winnares van het jaar daarvoor …(lengtered.)

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Enkele voorbeelden Substitutiefout omwille van klankverlenging REF: … de gezondheidstoestand … BAS: … deuren gezondheidstoestand … REF: … de gezondheidstoestand … DET: … de gezondheidstoestand … Insertiefout opgeheven REF: … een |uh| internationale wedstrijd … BAS: … een uit internationale wedstrijd … REF: … een internationale wedstrijd … DET: … een internationale wedstrijd …

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Conclusie FP detectie kan nog beter Detectie van andere disfluencies –herhalingen –woordafbrekingen –FP’s startpunt bij detectie (dikwijls combinatie) Overleg met ESAT over integratie in ASR