Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 4 mei 2004 Modellering van spontane spraak Jacques Duchateau

Slides:



Advertisements
Verwante presentaties
___________________________________________________________ Opvoedingswinkel Zuid-Limburg Opvoedingswinkel Z u i d - L i m b u r g.
Advertisements

Sprint Jabbla.
Project ICT–ondersteuning voor kinderen met leerstoornissen
Leren spellen, feedback en de computer
Werkwoorden d t dt.
NEDERLANDS WOORD BEELD IN & IN Klik met de muis
1 Resultaten marktonderzoek RPM Zeist, 16 januari 2002 Door: Olga van Veenendaal, medew. Rothkrans Projectmanagement.
Economische groei.
Personalisatie van de Archis website Naam: Sing Hsu Student nr: Datum: 24 Juni 2004.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
Probus Leuven Vesalius bezoekt Lier op
21 januari 2012 Ben Vaessen (Metrisquare B.V.) in samenwerking met:
Dynamische tijdbalk Een dynamische tijdbalk geeft een uitvergroot deel van de algemene tijdbalk weer. Hij heet dynamisch omdat hij er voor elke periode.
STAPPENPLAN GRAMMATICUS.
MERKWAARDIGE PRODUCTEN
Welkom, ouders van groep 7!!
Persoonlijk worden.
Nooit meer onnodig groen? Luuk Misdom, IT&T
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent GEAUTOMATISEERD SPRAAKVERSTAANBAARHEIDSONDERZOEK fantasie of werkelijkheid? Jean-Pierre Martens Catherine.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 11 mei 2001.
S1S1 S2S2 S3S3 22 november 2001K.U.Leuven-ESAT/PSI Spraak WP2 Detectie en behandeling van OOV woorden l OOV woorden detecteren door betrouwbaarheid van.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 22 oktober 2003 Statistische Taalmodellen voor Spontane Spraak Jacques Duchateau
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Gebruikerscommissie 4 mei 2004 Patrick Wambacq.
Reductie van aantal OOV- woorden dmv lexiconuitbreiding Vincent Vandeghinste Centrum voor Computerlinguïstiek KULeuven.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
presentatie Atranos 9 april '03 Universiteit Gent-ELIS-Speech Lab 1 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 22 november 2001.
S1S1 S2S2 S3S3 WP2 OOV woorden in herkenners WP2.2 Betrouwbaarheidsmaten Jacques Duchateau ESAT – PSI - Spraakgroep.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent Presentatie Atranos 22 oktober 2003 Atranos project Werkpakket 3 Detectie van haperingen in spontane spraak.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 28 oktober 2002.
ELIS-DSSP Sint-Pietersnieuwstraat 41 B-9000 Gent ATraNoS WP1 : Segmentatie van audiofiles in homogene delen Johan Depoorter Jean-Pierre Martens ELIS-DSSP.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 9 april 2003.
Statistische Taalmodellen voor Spontane Spraak
WP1 Segmentatie in homogene delen Objectieven voor eerste 6 maanden –Analyse van literatuur Philips, LIMSI, BBN, HTK, IBM, Eurecom –Realisatie van basissysteem.
Meisjes en wiskunde (Waarom) is wiskunde moeilijk?
Oefeningen F-toetsen ANOVA.
Debriefing 24 januari 2012.
Kunnen we leren kiezen? Jan Bransen Alumnidag 2006.
Neurale Netwerken Kunstmatige Intelligentie Rijksuniversiteit Groningen April 2005.
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
Automatische piloot in RPG’s gebaseerd op online learning
Wie het kleine niet eert ... (quarks, leptonen,….)
1 7 nov Rijnsburg 7 nov Rijnsburg. 2 Hebreeën 7 15 En nog veel duidelijker wordt het, als naar het evenbeeld van Melchisedek een andere priester.
MEDMEC – JAAR 1 – Q1 PLANNING Les 1 - 2/9: uitleg vak medmec en kennismaking Les 2 - 9/9: creatief denken en proces Les /9: divergeren en convergeren.
2009 Tevredenheidsenquête Resultaten Opleidingsinstellingen.
Behandeling van spierspanningshoofdpijn met Botuline toxine A
Steroiden bij acute dwarslesie
Benchmarking Publiekszaken 2006 Benchmarking Publiekszaken Stuurgroepbijeenkomst 2 juni 2006 Den Haag.
Uitspraak trainen met een computer: is dat mogelijk? Ambra Neri Catia Cucchiarini, Helmer Strik Radboud Universiteit Nijmegen, CLST.
1 Wie durft er nog in een vliegtuig, trein of auto te stappen? Over betrouwbaarheid van software Frits Vaandrager Institute for Computing and Information.
Hoe gaat dit spel te werk?! Klik op het antwoord dat juist is. Klik op de pijl om door te gaan!
1 Controleplan 2005 Raadgevend comité Hotel President – donderdag 21 april 2005.
Centraal Examen op ‘t Aletta 2013 HAVO 5 & Vwo 6.
INFORMATIE AVOND VWO 6 MAANDAG 19 SEPTEMBER.  WELKOM  OUDERRAAD (mevr. Jacobs)  ENQUÊTE ( Fleur Drijvers, Gina Slenders)  INFORMATIE EXAMENJAAR (
HOGER INSTITUUT VOOR DE ARBEID Jan Van Ongevalle / Rafael Peels27th November 2009 Pagina 1 Meten van effectiviteit van ontwikkelingseducatie en andere.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 3.
Opleiding CMS website Gent Bart Nelis Gent: #239/ docentengang Brussel: /naast bibliotheek
Samen-bouwen … over paneelbouw en de rest!
tafel van 1 tafel van 1 x 1 = 1 x 1 = 1 2 x 1 = 2 3 x 1 = 3 4 x 1 = 4
aangename ont - moeting
Centrummaten en Boxplot
IMAGI Door Jens Van den Driessche & Ruben Junius.
13 november 2014 Bodegraven 1. 2 de vorige keer: 1Kor.15:29-34 indien er geen doden opgewekt worden...  vs 29: waarom dopen?  vs.30-32: waarom doodsgevaren.
Evangeliënkring Sliedrecht
Samen naar het examen informatie voor ouders over periode 4
Donderdag 2 april 2015 Roosterwijzigingen Let op!! De oude leerlingpassen mogen niet gebruikt worden!! Als je deze gebruikt voor een kluis, dan kan de.
Het belang van plannen.
RNA-Seq data-analyse pipeline integratie in GALAXY Van Middelem Robin.
EXPERIMENT SHEET A/B TEST
Transcript van de presentatie:

Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS - 4 mei 2004 Modellering van spontane spraak Jacques Duchateau

Modellering van spontane spraak - Jacques Duchateau 2 Overzicht van WP 3, deel ESAT laatste 2 jaar van het ATraNoS-project 4 delen van een half jaar –1e half jaar: ontwikkeling baseline herkenners Engels, gebaseerd op Switchboard Nederlands, gebaseerd op CGN –2e half jaar: software-ontwikkeling LM –3e half jaar: experimenten LM –4e half jaar: integratie met WP 3, deel ELIS

Modellering van spontane spraak - Jacques Duchateau 3 Update planning WP 3, deel ESAT 1e half jaar: –ontwikkeling baseline Engels 2e half jaar: –software (1-pass) + experimenten LM 3e half jaar: –ontwikkeling baseline Nederlands –software (2-pass, grafen) + experimenten LM 4e half jaar: –integratie met WP 3, deel ELIS –extra LM modellering

Modellering van spontane spraak - Jacques Duchateau 4 Baseline herkenner Nederlands (1) CGN train:oudtrain:nieuwtest:nieuwstest:broadc comp-f V V comp-g V comp-i V V comp-j V V comp-k V V comp-l V V comp-m V comp-n V comp-o V minuten%tussenw %OOV perpl. test:nieuws % 3.1% 192 test:broadc % 3.5% 255

Modellering van spontane spraak - Jacques Duchateau 5 Baseline herkenner Nederlands (2) kenmerken herkenner –akoestische modellen: 40 uur data –taalmodel: krantenartikels (30M woorden) –tussenwerpsels (vb uh) met unigram prob. conversie modellen probleemloos resultaten herkenner train: oud train: nieuw test: nieuws 16.1% 15.9% test: broadcast 46.5% 37.7%

Modellering van spontane spraak - Jacques Duchateau 6 Spontaan LM: probleemstelling beschikbaarheid van traindata –geschreven tekst, vb kranten: 300M woorden –spontane spraak, vb Switchboard: 3M woorden probleem gebruik geschreven tekst voor spontaan LM –stilistisch verschillend –haperingen

Modellering van spontane spraak - Jacques Duchateau 7 Haperingen: oplossing 3 opties: hapering blijft in context / hapering verwijderd / keuze aan herkenner vb. herhaling: ‘Dat is wat wat ik denk’

Modellering van spontane spraak - Jacques Duchateau 8 Haperingen: experimenten experimenten met Switchboard resultaten –herhaling: significante verbetering bij keuze aan herkenner: 36.7% vs 35.1% WER –aarzeling: niet significant slechter –herstarten zin (geconditioneerd op aarzeling): niet significant slechter mogelijk oorzaak verschillend gedrag: zwakke akoestische detectie aarzeling

Modellering van spontane spraak - Jacques Duchateau 9 Conclusies, verder werk baseline Nederlands beschikbaar oplossing haperingen werkt voor herhaling verbetering voor andere haperingen: integratie aarzeling-detector ELIS nodig extra: gebruik geschreven tekst omdat dit het effect van de hapering-modellering kan versterken