WP1 Segmentatie in homogene delen Objectieven voor eerste 6 maanden –Analyse van literatuur Philips, LIMSI, BBN, HTK, IBM, Eurecom –Realisatie van basissysteem.

Slides:



Advertisements
Verwante presentaties
Optimalisatie van de stapgrootte in de Systematische Probleem Aanpak (SPA) in Competentie-gebaseerde Multimediale Practica (CMP’s) Rob Nadolski, Paul Kirschner,
Advertisements

SportMinistry. AIA, de kerk en sport  Kerken willen graag relevant zijn en in hun wijk getuigen van Jezus, maar hoe doe je dat?  AIA: sport als taal.
Roundtable 8 Teach as you preach: training in toepassen van het 4C-ID model volgens het model Symposium 4C-ID IV, 14 april 2011, Utrecht Studiecentrum.
Video Verwerking Movie Maker
evenwicht zoeken tussen ‘graag zien’ en ‘neen zeggen’
Succesvol verbeteren.
Adobe formulieren : stand van zaken.
Prestaties Schatten en Managen
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent GEAUTOMATISEERD SPRAAKVERSTAANBAARHEIDSONDERZOEK fantasie of werkelijkheid? Jean-Pierre Martens Catherine.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 4 mei 2004 Modellering van spontane spraak Jacques Duchateau
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 11 mei 2001.
S1S1 S2S2 S3S3 22 november 2001K.U.Leuven-ESAT/PSI Spraak WP2 Detectie en behandeling van OOV woorden l OOV woorden detecteren door betrouwbaarheid van.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 22 oktober 2003 Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Gebruikerscommissie 4 mei 2004 Patrick Wambacq.
WP1 Segmentatie in homogene delen Objectieven voor eerste 12 maanden –Analyse van literatuur (LIMSI, Philips,…) –Realisatie van basissysteem voor spraak/niet-spraak.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
presentatie Atranos 9 april '03 Universiteit Gent-ELIS-Speech Lab 1 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 22 november 2001.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 28 oktober 2002.
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS WP1 : Segmentatie van audiofiles in homogene delen Johan Depoorter Jean-Pierre Martens ELIS-DSSP.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 9 april 2003.
Statistische Taalmodellen voor Spontane Spraak
Spraaksynthese.
Welkom bij de presentatie van het
1 Inleiding tot de besturingssystemen Prof. K. De Bosschere Vakgroep ELIS Universiteit Gent.
Aleksandras Stulginskis University - March 22, 2012 Nabeschouwing Teaching: Home and Away Prof. Dr. Luc François.
BiO-M Wiskundig Modelleren BiO-M Wiskundig Modelleren Lineair Programmerings-modellen Hoorcollege 2.
Media & Creativiteit / Pia Terstroet (wiki)
Acceptatie en Commitment Therapie Ouderen
WWB proces + Inbedding in Risicomanagement ISO 31000
Lokale zoekmethoden Goed in de praktijk:
Hoofdstuk 5 Integer leiderschap
Behandeling van spierspanningshoofdpijn met Botuline toxine A
Oefeningen Akoestische grondslagen en Sonologische analyse Dr
De balans methode Een goede methode om vergelijkingen mee op te lossen
Een verhandeling bij marketing Belangrijke punten, afspraken, en tips Marketing Research Group K.U.Leuven.
HBO-I Conference Tour RUP| versie 1.0 | 18 maart 2010 RUP toegepast binnen DUO Een korte impressie hoe we binnen DUO RUP ingevoerd hebben (aan het.
Leiderschap bij verandering of verandering in leiderschap
1 Project PA4: goede toestand/goed potentieel zoet oppervlaktewater Plenaire vergadering ISC 2007 Brussel Door trekker Eric Lacasse.
1 Datastructuren Een informele inleiding tot Skiplists Onderwerp 13.
Evaluatie ‘Met de fiets minder file’
Vergelijkingen oplossen.
Links Rechts mensen zijn sociaal en hebben veel voor anderen over mensen zijn vooral gericht op hun eigen belang slecht gedrag komt door de.
Voorlichting fysieke belasting
Voorlichting fysieke belasting
Voorlichting fysieke belasting
Ruimte Afstemming in de ruimt eist dat de spieren samenwerken: Intermusculaire coördinatie.
Werken in K.U.Loket Syllabi. 1 ZoekmogelijkhedenVolledige lijst opvragen is ook mogelijk, maar kan lang duren Start in K.U.Loket de toepassing “mijn syllabi”
Individueel transitieplan (ITP) voor arbeidsintegratie
Dag Van Het Afstudeeronderzoek Presentatie Elaine van der Poorten.
Docent: Ans Sarianamual - oktober 2014
Psychologisch contract
TI2710-D Imaging project Groep 5 Marnix de Graaf Raoul Harel Tim Rensen Mirko Dunnewind Daniël Vermeulen.
© imec 2000 © imec 2001 MAX+PLUS II Installatieprocedure.
© Intomart GfK 2013 | Boekenbranche meting 24 | Mei RAPPORTAGE BOEKENBRANCHE METING 24 Purchase journey kopen en lenen van boeken Ewout Witte Bastiaan.
Loopbaan oriëntatie en begeleiding
Empirical librarianship ceci n’est pas un texte De bibliotheek als onderzoeker Workshop - template kaartjes Jeroen Bosman & Bianca Kramer Universiteitsbibliotheek.
Anton van den Noort1 FOTOSHOWS MAKEN HCC DEVENTER.
Klankbordgroep – start in gebruik name 25 augustus 2009 PROTIDE.
Kritische internet- en onderzoeksvaardigheden: 4 modellen vergeleken Hanneke Banine-de Smit.
Arts-patiënt communicatie rondom uitleg van SOLK: een kwalitatieve studie van Schotse audioconsulten Madelon den Boeft.
Grafiek Generator Monitor de Bibliotheek op school
Slim tellen.
Onderzoek water!! WaterLab www. onderzoekwater.nl Kijkje terug
Slim tellen.
Tweefactor authenticatie wijzigen bij SMS methode uitzetten
De WAKOSTA?! – APP De wegwijzer in jouw budget.
Transcript van de presentatie:

WP1 Segmentatie in homogene delen Objectieven voor eerste 6 maanden –Analyse van literatuur Philips, LIMSI, BBN, HTK, IBM, Eurecom –Realisatie van basissysteem Spraak / niet-spraaksegmentatie Segmentatie spraak volgens omstandigheden (achtergrond, bandbreedte) Detectie van sprekerbeurten, maar nog geen sprekerclustering Tegen maand 12: evaluatie op BN en CGN ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Algemene opzet Stap 1: eliminatie van niet-spraak –evaluatie: hoeveel spraak is verloren gegaan? Stap 2: segmentatie van spraakfragmenten –sprekerbeurten –veranderingen akoestische condities Stap 3: clustering van segmenten –vooral sprekerclustering Stap 4: classificatie van segmenten –gender en akoestische condities ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Stap 1: eliminatie van niet-spraak Trainen van GMMs –3 GMMs voor spraak (zuivere spraak, spraak in muziek (BN), spraak in andere ruis) –2 GMMs voor achtergrond (muziek (BN), andere) Combinatie van GMM-scores tot segmenten –HMMs in parallel plaatsen –inter-model kost invoeren –grensposities verfijnen Eliminatie van niet-spraak –enkel lange segmenten (>1 seconde) elimineren ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Experimenten op CGN Gevolgde procedure –problemen: chunk-grenzen, weinig niet-spraak (NS), geen spraak-in-ruis-aanduiding –slechts 2 GMMs: een S-GMM en een NS-GMM –S-GMM: getraind op centrale delen van S-chunks –NS-GMM: getraind op alle frames van NS-chunks –HMMs met minimale lengte (200 ms) per segment Resultaten –clean: 97% NS-frames OK, 15% NS in spraak –alles: 90% NS-frames OK, 18% NS in spraak ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Experimenten op BN Gevolgde procedure –training van 5 GMMs (HTK) –training in 2 stappen: selectie van frames op basis van beschikbare labeling verbetering op basis van forced alignment met HMMs + GMM-labels (e.g. selectie van stiltes in spraak) –a priori negatie van lange niet-getranscribeerde fragmenten op basis van beschikbare labels Resultaten –nog niet beschikbaar (na terugkeer van Jan) ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Stap 2: Segmentatie van spraak LIMSI,Philips: agglomeratieve clustering –initialisatie: grenzen bij spectrale veranderingen –LL-verlies bij wegnemen van een grens of een model (=classificatie) –extra kost voor aantal grenzen, aantal modellen –minimale segmentduur IBM, Philips (>98), Eurecom: BIC (Bayesian Information Criterion) –gemotiveerde kost voor modelcomplexiteit –werkt van links-naar-rechts (real-time) ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Segmentatie op basis van BIC Basisprincipes –zoek naar eerste grens in (T b,T b +D) (D>1 seconde) –is 1 gaussiaans model voor (T b, T b +D) slechter dan 2 : 1 voor (T b,T b +t) en 1 voor (T b +t,T b +D)? BIC(t) = LLR(t) - c. (#pars/model). logD –  t met BIC(t)>0  grens gevonden, herstart daar. –geen t met BIC(t)>0  verhoog D en herbegin Aandachtspunten –t niet te dicht bij 0 of D (onnauwkeurige modelpars) –veel rekentijd (vaak herbeginnen) ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Segmentatie op basis van BIC ELIS-strategie (zie ook Eurecom) –definieer afstandsmaat D(t) op basis van vaste vensters (duur Tv) aan weerszijden van t –selecteer significante maxima (>Dmin) in D(t) als mogelijke grenzen –gebruik maxima voor selectie van grens en voor verlenging van vensterlengte D in BIC Vrije parameters –Tv, Dmin en c (zie vorige slide) ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Evaluatie van segmentatie Nood aan standaard evaluatieprocedure –iedereen doet het anders –resultaten moeilijk te vergelijken Beschikbare segmentinformatie dezelfde –segmenten met (Tb,Te) –segmentattributen: spreker ID(s), bandbreedte, achtergrond (muziek/overige) –segmenten kunnen overlappen –segmenten dekken niet de gehele file (bij BN!!) ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 ELIS-evaluatieprocedure Stap 1: omvorming van segmentinformatie –sequentie van aaneensluitende delen –selectie van grenzen volgens behoefte Stap 2: dynamische alignatie van grenzen –grensweglating indien te groot tijdsverschil –pas nu eliminatie van te korte segmenten (<Tmin) Stap 3: evaluatie van alignaties –Receiver Operation Curves (ROC) –Details over grensafwijkingen, deleties/inserties ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Evaluatieresultaten in globo ROC (Receiver Operation Curve) –recall: hoeveel procent van de te vinden grenzen werden er gedetecteerd? –precision: hoeveel procent van de gedetecteerde grenzen waren eigenlijk te vinden grenzen? ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Detectie van sprekerveranderingen ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

WP1 Samenvatting en conclusies Basissegmentatiesysteem –GMM-trainingsprocedure is klaar –integratie van GMMs in HMM-topologie is klaar –BIC-algoritme is klaar –Integratie van beide delen in 1 systeem is lopende Evaluatie –evaluatieprogramma is klaar –eerste verkennende testen op CGN en BN zijn er Prognose: in lijn tegen T0+12 ATRANOS gebruikersgroep, 11 mei 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent