De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

WP1 Segmentatie in homogene delen Objectieven voor eerste 12 maanden –Analyse van literatuur (LIMSI, Philips,…) –Realisatie van basissysteem voor spraak/niet-spraak.

Verwante presentaties


Presentatie over: "WP1 Segmentatie in homogene delen Objectieven voor eerste 12 maanden –Analyse van literatuur (LIMSI, Philips,…) –Realisatie van basissysteem voor spraak/niet-spraak."— Transcript van de presentatie:

1 WP1 Segmentatie in homogene delen Objectieven voor eerste 12 maanden –Analyse van literatuur (LIMSI, Philips,…) –Realisatie van basissysteem voor spraak/niet-spraak en detectie van veranderingen binnen spraak Situatie na 6 maanden –spraak/niet-spraak lijkt in orde –aantal gedetecteerde veranderingen is OK –teveel valse alarmen Dus: segmentatie van spraak moet beter ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

2 WP1 Gevolgde werkwijze Segmentatie-algoritme (BIC) verbeteren –bleek niet zo goed te lukken Interferentie met spraak/niet-spraak? –gemiddelde segmentduur veel korter dan echt Stap 1: verbeteren van spraak/niet-spraak –creatie van betere beginpositie Stap 2: grondige aanpak van BIC –kan pas nu, na inwerkperiode van 6 weken ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

3 WP1 Spraak/niet-spraaksegmentatie Basissysteem behouden –GMMs trainen en in parallel plaatsen –inter-model kost invoeren (Cb) Post-processing verbeterd –eliminatie van korte niet-spraaksegmenten (T6) –eliminatie van alle korte segmenten (T14) –verlenging van spraaksegmenten (T14) Evaluatie op Hub4 (BN) ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

4 WP1 Exp 1: korte niet-spraak weg (T6) ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

5 WP1 Exp 2: alle korte segmenten weg ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

6 WP1 Exp 3: nog extra spraakverlenging ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

7 WP1 Resultaten samengevat spraak/niet-spraak scheiding minstens vergelijkbaar met gegevens uit literatuur slechts 1% van de spraak gaat verloren terwijl 65% van de niet-spraak geëlimineerd wordt gemiddelde duur spraaksegmenten nu 65 seconden (vroeger: 43, echt: 95 seconden) HOOP: beter vertrekpunt voor verdere segmentatie van spraakfragmenten ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

8 WP1 Segmentatie van spraakfragmenten Basisprincipes behouden –zoeken van mogelijke grenzen op basis van een afstandsmaat (GLR) –reduceren van overtollige grenzen d.m.v. BIC (Bayesian Information Criterion) Aandachtspunten –effecten van de controleparameters –wat loopt er precies mis? –welke rol spelen de niet-spraakintervallen? ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

9 WP1 Evaluatie van grenzen Sprekers in drie categorieën: MALE en FEMALE NEUTER (multi-speaker) Gezochte grenzen sprekerverandering (ook die met neuter) verandering van omstandigheden Evaluatiematen Recall: hoeveel te vinden grenzen gedetecteerd? Precision: Hoeveel gedetecteerde grenzen te vinden? Details per categorie ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

10 WP1 Evaluatie op T12 (ongeveer = T6) ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Invloed van de venster-lengte Tv

11 WP1 Evaluatie op T14 ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent

12 WP1 Evaluatie: details op T14 ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Deleties per grenscategorie Deleties per grenssoort

13 WP1 Resultaten samengevat Nieuwe spraak/niet-spraak geeft inderdaad een iets betere uitgangspositie De meeste grenzen (behalve die van multi- sprekerfragmenten) worden gevonden. Er is nog werk aan de winkel om het aantal ingevoegde grenzen te verlagen –meer gedetailleerde analyse nodig ATRANOS, 28 okt 2001 ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent


Download ppt "WP1 Segmentatie in homogene delen Objectieven voor eerste 12 maanden –Analyse van literatuur (LIMSI, Philips,…) –Realisatie van basissysteem voor spraak/niet-spraak."

Verwante presentaties


Ads door Google