ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS WP1 : Segmentatie van audiofiles in homogene delen Johan Depoorter Jean-Pierre Martens ELIS-DSSP.

Slides:



Advertisements
Verwante presentaties
Stad Gent worstelt met betalingachterstand Vraag Johan Deckmyn 1.
Advertisements

Rekenen met procenten Rekenen met procenten.
Kruiscilinder Werken met enkel de kruiscilinder of
Visual Knowledge Building
CIMSOLUTIONS B.V. CIMSOLUTIONS Automation for Industry & Business SIG Embedded “Proces Ellende” André Vink CDP real-time embedded 28 september 2005.
Op zoek naar een ondernemingsmodel dat werkt
WIA Wet Werk en Inkomen naar arbeidvermogen
FGP GENT Autocrim Groendreef GENT Laders + kabels.
havo/vwo D Samenvatting Hoofdstuk 2
Een samenwerking tussen
Alumni-portals gezien vanuit een ICT-perspectief Robert van ‘t Sant.
Presentaties •Leerjaar 1 Informatiekunde - Presentaties maken.
vwo A/C Samenvatting Hoofdstuk 3
MP3 Compressie van geluid.
Record Linkage: Simulatie Resultaten Adelaide Ariel Biolink NL 28 maart 2014.
Wie is aan zet ? - 1 jaar BYOD op het Liemers. Stand van zaken: – Devices mógen: iedereen weet dat – Regels hanteren ? – Neemt het aantal devices toe.
1 Nederland klaar voor IBAN en SEPA? Branches en bedrijven klaar? SEPA-middag VNO-NCW en MKB-Nederland 4 oktober 2012 Michiel van Doeveren, Secretaris.
BESTURINGS SYSTEMEN Vincent Naessens.
Rekenen met procenten Rekenen met procenten.
1 Mis geen enkele storing Testen van netvoedingskwaliteit in back-upsystemen.
Muziek downloaden PVGE Computerclub 5 JANUARI 2012.
Gepresenteerd door Melissa Billiau o.l.v.: Dr. F. Martens P. Dedeckere 1.
REKENEN.
Workshop gebruikerscommissie SimForTree Gent, 19 Oktober 2010 Het Sim4Tree DSS W W W.K U L E U V E N.B E.
Hoofdstuk 6: Controle structuren
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent GEAUTOMATISEERD SPRAAKVERSTAANBAARHEIDSONDERZOEK fantasie of werkelijkheid? Jean-Pierre Martens Catherine.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 4 mei 2004 Modellering van spontane spraak Jacques Duchateau
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 11 mei 2001.
S1S1 S2S2 S3S3 22 november 2001K.U.Leuven-ESAT/PSI Spraak WP2 Detectie en behandeling van OOV woorden l OOV woorden detecteren door betrouwbaarheid van.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 22 oktober 2003 Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Gebruikerscommissie 4 mei 2004 Patrick Wambacq.
WP1 Segmentatie in homogene delen Objectieven voor eerste 12 maanden –Analyse van literatuur (LIMSI, Philips,…) –Realisatie van basissysteem voor spraak/niet-spraak.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
presentatie Atranos 9 april '03 Universiteit Gent-ELIS-Speech Lab 1 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 22 november 2001.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 28 oktober 2002.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 9 april 2003.
WP1 Segmentatie in homogene delen Objectieven voor eerste 6 maanden –Analyse van literatuur Philips, LIMSI, BBN, HTK, IBM, Eurecom –Realisatie van basissysteem.
Terrain Analysis Seminar GIA najaar 2004 Joost Voogt.
Spraaksynthese.
1 Inleiding tot de besturingssystemen Prof. K. De Bosschere Vakgroep ELIS Universiteit Gent.
Ombudspersonen.
Een fundamentele inleiding in de inductieve statistiek
1 Datastructuren Skiplists. 2 Skiplists  Vrij eenvoudige datastructuur  “Makkelijker” dan gebalanceerde bomen  Kunnen hetzelfde als gebalanceerde bomen.
Lokale zoekmethoden Goed in de praktijk:
Cijfer verwerkings systeem Door: Ridvan Fatih saqib.
1 Datastructuren Een informele inleiding tot Skiplists Onderwerp 13.

Cooperative Transport Planning
Kees van Overveld B i g I m a g e s – Visuele Communicatie -1- De textuurlaag: textuur als elementair percept textuur, schaal en oriëntatie textuur – een.
MrSearch: Wat en Waarom?
Doorsnede van een rivier
Cluster Moves in Monte Carlo simulaties om deze sneller te maken.
Coderen.
Hoofdaannamen van Appreciative Inquiry
Netwerk Ouderenzorg Regio Noord Transitie experiment: stand van zaken Erik Buskens (hoogleraar MTA) - Projectleider - Lid coördinatiecommissie NPO - Voorzitter.
Maarten Van Lier 2 e Master Computerwetenschappen.
Inhoud  Aanvragen door 41 scholen  Gehonoreerd - 33 aanvragen  Niet gehonoreerd- 8 aanvragen Verdeling over de regio: Elburg 3 Epe 4 Ermelo 6 Harderwijk.
Coachen en reflecteren De kracht van coaching Leerlijn 3.
Hoorcollege 1: efficiëntie en complexiteitsontwikkeling.
Hoorcollege 1: efficiëntie en complexiteitsontwikkeling.
HERZIENING INFORMATICA DEEL 1.
Schoolondersteuningsprofiel 2017 Maaike Luttik, beleidsmedewerker SWV
Evaluatie circuittraining oktober 2017
Archipro – digitaal archief overdragen
OPENINGSCASE: De Victoria Country Fire Authority in Australië geeft hulp met nieuwe informatiesystemen.
Auteur: Magrite Kalverboer Gemaakt door Jolien Vanoverbeke
Transcript van de presentatie:

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS WP1 : Segmentatie van audiofiles in homogene delen Johan Depoorter Jean-Pierre Martens ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Stand van zaken op T18 Spraak/niet-spraak (SNS) segmentatie –werkend systeem gebaseerd op HTK –op BN97eval: 70% niet-spraak gevonden, 0.5% spraak verloren Segmentatie van spraakfragmenten –spreker, achtergrond, bandbreedte (studio/telefoon) –werkt in continue mode –op BN97eval: 70% grenzen gevonden, 30% grenzen tussengevoegd

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Werkzaamheden in T18-T24 Nieuw SNS-segmentatiesysteem Systeem voor sprekerclustering –spraakfragmenten van zelfde spreker krijgen zelfde label –maar: label nog niet verder gekarakteriseerd (gender, single- of multi-spreker) Deliverable T12 bijgewerkt (deel van T36) Gestart met onderzoek naar nieuwe algoritmes –betere on-line sprekerclustering (klaar) –gebruik van prosodische kenmerken (op stapel)

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Nieuw SNS segmentatiesysteem Oud systeem –gebaseerd op HTK –werkte off-line: eerst file opladen en dan verwerken –kon BN97eval niet in zijn geheel verwerken Nieuw systeem –gebaseerd op eigen software –continue mode: geforceerde decisie in Viterbi-search –wanneer: als logp(pad2) < logp(pad1) -  logP –geen (getrainde) transitieprobabiliteiten meer Resultaten (BN97eval) –werkt nog iets beter dan oud systeem

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Sprekerclustering Drie on-line algoritmes onderzocht –eenvoudig on-line algoritme –on-line algoritme van IBM –on-line algoritme van ELIS Evaluatie op BN97eval –totale clusterzuiverheid (P tot ) –gemiddelde clusterzuiverheid (P gem ) –aantal gegenereerde clusters N gc –ideale clustering: P itot, P igem, N ic (afh. van segmentatie)

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Sprekerclusteringalgoritmes I Eenvoudig on-line algoritme –clustering na segmentatie (spraakfragment <30s) –werk segment (S) per segment af bepaal minimale  BIC(S,C) (over alle C)  BIC(C,S) < 0 : voeg S bij C  BIC(C,S) > 0 : voeg S toe aan cluster set Evaluatie –P tot = 94.2%, P gem = 86.9% bij N gc / N ic = 189 / 118 –resultaten afhankelijk van segmentatie –iets beter als aantal segmenten niet te groot is (doel van segmentatie in het oog houden)

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Sprekerclusteringalgoritmes II On-line algoritme van IBM –clustering na segmentatie (spraakfragment <30s) –minimale  BIC(S,X): S=segment, X = cluster/segment –  BIC < 0 : S en X samengevoegd –  BIC > 0 : S (X=cl) of X en S (X=s) bij clusterset –herhaal dit tot alle segmenten verwerkt zijn Evaluatie –even snel als eenvoudig algoritme –P tot = 94.2%, P gem = 88.5% bij N gc / N ic = 181 / 118 –vooral betere P gem bij laag aantal clusters

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Sprekerclusteringalgoritmes III On-line algoritme van ELIS –clustering na segmentatie (spraakfragment <30s) –twee nieuwe principes P1: zoek eerst naar nieuwe clusters alvorens segmenten bij bestaande clusters te voegen P2: beperk de grootte van de clusters

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Sprekerclusteringalgoritmes III On-line algoritme van ELIS, versie 1 –per S : d s als minimale  BIC(C,S) (over alle C) –bepaal S met grootste d s (d sM ) en kleinste d s (d sm ) –d sM > 0 : voeg S met d sM toe als nieuwe cluster –d sM < 0 : voeg S met d sm toe aan dichtste C –herhaal dit tot alle segmenten verwerkt zijn

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Sprekerclusteringalgoritmes III On-line algoritme van ELIS, versie 2 –BIC algoritme werkt best indien er een zekere balans is tussen #frames in vergeleken objecten –Dus: beperk grootte van de clusters –Hoe: door samenvoegen van S bij C te verhinderen indien C reeds voldoende frames (> ) bevat

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Sprekerclusteringalgoritmes III Evaluatie van IBM –P tot = 94.2%, P gem = 88.5% bij N gc / N ic = 181 / 118 –P tot = 91.3%, P gem = 86.5% bij N gc / N ic = 138 / 118 Evaluatie van ELIS, versie 1 –P tot = 94.3%, P gem = 88.5% bij N gc / N ic = 180 / 118 –P tot = 92.2%, P gem = 86.1% bij N gc / N ic = 142 / 118 Evaluatie van ELIS, versie 2 –P tot = 94.9%, P gem = 88.4% bij N gc / N ic = 181 / 118 –P tot = 92.0%, P gem = 88.1% bij N gc / N ic = 137 / 118

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Vergelijking van IBM en ELIS

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Vergelijking van IBM en ELIS

ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS Geplande werkzaamheden in T24-T30 Onderzoek naar nut van prosodie –introductie van prosodie: extractie, voorstelling –prosodie voor segmentatie (ook voor SNS?) –prosodie voor clustering –prosodie voor single/multi-spreker en gender Onderzoek naar detectie van haperingen –frequenties van voorkomen opsporen (CGN) –annotatie van haperingen (CGN, prosodiecorpus) –identificatie van akoestische kenmerken –ontwikkelen van detector (probabilistisch)