De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Watskeburt? Niets! Zo praten wij gewoon Helmer Strik et al. Radboud Universiteit Nijmegen, CLST.

Verwante presentaties


Presentatie over: "Watskeburt? Niets! Zo praten wij gewoon Helmer Strik et al. Radboud Universiteit Nijmegen, CLST."— Transcript van de presentatie:

1 Watskeburt? Niets! Zo praten wij gewoon Helmer Strik et al. Radboud Universiteit Nijmegen, CLST

2 Helmer StrikDe dag vd Fonetiek, Utrecht, Inleiding “Watskeburt” zingt De Jeugd Van Tegenwoordig (2005) "Gijwabbedoel" schreef Jan Kuitenbrouwer in zijn Hedenlands-column in De Volkskrant (12 november 2003) Multi-Woord Expressies: MWEs

3 Helmer StrikDe dag vd Fonetiek, Utrecht, Overzicht presentatie Resultaten 1e onderzoek D. Binnenpoorte, C. Cucchiarini, L. Boves & H. Strik (2005) Multiword Expressions in Spoken Language: an exploratory study on pronunciation variation. Computer, Speech & Language 19(4), pp Vervolgonderzoek  Bram Elffers & Dusan Bavcar  Case study: ‘op een gegeven moment’  Selectie van MWEs

4 Helmer StrikDe dag vd Fonetiek, Utrecht, Average Weighted Disagreement als‘tware av. %disagr #canonical phonemes 324 AWD = (30.56* * *4)/(3+2+4) = 23.15%

5 Helmer StrikDe dag vd Fonetiek, Utrecht, Result of 3-grams 3-gramAWD in MWE context AWD in andere context verschil zoiets van ja in ieder geval af en toe op die manier ’t is natuurlijk weet ik niet dat is natuurlijk hoe heet dat ook helemaal niet als ’t ware

6 Helmer StrikDe dag vd Fonetiek, Utrecht, Result of 4-grams 4-gramAWD in MWE context AWD in andere context verschil dat vind ‘k ook op een gegeven moment dat maakt niet uit dat is niet zo of wat dan ook ‘k weet niet precies dat weet ik niet weet ik veel wat dat weet ik nog als ’t goed is

7 Helmer StrikDe dag vd Fonetiek, Utrecht, Conclusies 1e onderzoek Er zijn N-grammen waarvan de uitspraak (sterk) afwijkend is, t.o.v.  Canoniek  Dezelfde woorden in andere contexten Meer reductie Multi-Woord Expressies

8 Helmer StrikDe dag vd Fonetiek, Utrecht, MWEs, apart behandelen? MWEs – (veel) meer reductie Spraaktechnologie - ASR, APT, Segm.  Apart behandelen  Bijv. aparte entries in het lexicon  OVIS onderzoek (98&99): MWEs => lagere WER Psycholinguistiek - Spraakproductie, perceptie, acquisitie  Apart behandelen?  Bijv. aparte entries in het lexicon?

9 Helmer StrikDe dag vd Fonetiek, Utrecht, MWEs bestuderen  Interessant  Verbeteren prestaties van machines  Maar hoe? Selecteren, bijv. in het CGN  Maar hoe?  Selectie criteria?  Definitie ontbreekt Case study: ‘op een gegeven moment’  CGN – component a (spontaan)

10 Helmer StrikDe dag vd Fonetiek, Utrecht, RealisationSubDelIns% Disagr. xe xe mEnt momEnt mEnt Ge md Ge mt xe mnt Ge Ge Gev mEnt (2x) xe mEnd Ge Ge Gev Gev mEnt mEnt (2x) Average: Kerncorpus: 22 realisaties; DP oplijning met canonieke transcriptie (7 syllabes, 16 fonemen): Sub(stituties)Sub(stituties) Del(eties)Del(eties) Ins(erties)Ins(erties) %Disagreement%Disagreement

11 Helmer StrikDe dag vd Fonetiek, Utrecht, opeengegevenmoment Freq. MWE22 Andere Lengte (# fonemen) MWE Andere Verschil %Verschil-1%-38%-30%-35% Duur MWE Andere Verschil %Verschil-24%-52%-35%-49% Articulatie snelheid MWE Andere Verschil %Verschil+30%+29%+8%+27%

12 Helmer StrikDe dag vd Fonetiek, Utrecht, Selectie criteria Selectie van N-grammen met verschillende criteria Frequentie ALD: Absolute Length Difference #fon. realisatie - #fon. canoniek RLD: Relative Length Difference 100% * ALD / #fon. canoniek ART: ARTiculation rate #fon. / duur Etc.

13 Helmer StrikDe dag vd Fonetiek, Utrecht, Hoogste Freq. RankOrthography#wordsFRQALDRLDART 1ja dat is ja maar da 's en dan ja dat 't is of zo als je oh ja

14 Helmer StrikDe dag vd Fonetiek, Utrecht, Hoogste ALD RankOrthography#wordsFRQALDRLDART 1op een gegeven moment ook een gegeven moment ook op een gegeven moment een gegeven moment gegeven moment ook natuurlijk helemaal dan op een gegeven moment is in ieder geval gegeven moment je op een gegeven

15 Helmer StrikDe dag vd Fonetiek, Utrecht, Hoogste RLD RankOrthography#wordsFRQALDRLDART 1een gegeven een gegeven moment gegeven moment je op een gegeven hè als als je als is in ieder geval ze natuurlijk gegeven moment ook een gegeven moment ook

16 Helmer StrikDe dag vd Fonetiek, Utrecht, Conclusies Verschillende selectiecriteria leiden tot verschillende N-grammen (MWEs). Welke selectie criteria? Combinatie: welke? ‘Moeder – kind’ probleem Evaluatie?  Andere taken (o.a. APT, Segm., ASR): Vergelijken met referentie (handmatige annotatie)  Hier?

17 Helmer StrikDe dag vd Fonetiek, Utrecht, ‘op een gegeven moment’ CGN – component a (alles) : 477 x op een gegeven moment 37 xop gegeven moment 12 xgegeven moment ?xxx gegeven moment ?op een uh gegeven moment ?op een gegeven mo ?op een gegeven m ?op een gegeven Wat is MWE? Wat is ‘andere context’?

18 Helmer StrikDe dag vd Fonetiek, Utrecht, Discussie Selectie van MWEs is problematisch Niet te algemeen; meer specifiek?  Sommige taken (o.a. ASR, APT, Segm.)  Optimaliseren van een criterium  Vergelijken met referentie (handmatige annotatie)  Andere taken?  Psycholinguistiek? Spraaktechnologie (applicaties):  MWE: wel / niet? Toevoegen aan lexicon  En wat? (20 realisaties van o.e.g.m.)

19 Helmer StrikDe dag vd Fonetiek, Utrecht, Meer informatie Voor meer informatie, zie //lands.let.ru.nl/ //lands.let.ru.nl/staff/strik.php zap.to/helmer =

20 Helmer StrikDe dag vd Fonetiek, Utrecht, Meer informatie Voor meer informatie, zie //lands.let.ru.nl/ //lands.let.ru.nl/staff/strik.php zap.to/helmer =


Download ppt "Watskeburt? Niets! Zo praten wij gewoon Helmer Strik et al. Radboud Universiteit Nijmegen, CLST."

Verwante presentaties


Ads door Google