Grafeem-foneemomzetting voor spraaksynthese

Slides:



Advertisements
Verwante presentaties
Informatieavond 3 Groep 3.
Advertisements

Paralellen tussen zelfbewaking bij het spreken en identificatie van spraaksegmenten door luisteraars Sieb Nooteboom & Hugo Quené UiL OTS 1.
De Dactylische Hexameter
De R plaagt de dubbelklank -eer, -eur en -oor je hoort bir: je schrijft beer je hoort dur: je schrijft deur je hoort bor: je schrijft boor.
Communiceren Leidinggeven Blz. 53.
Informatieavond 2 Groep 3.
klankoefeningen klinkers: a –e –o –u -i
Informatieavond 3 Groep 3.
Informatieavond Groep 4 Flamingo’s 2013/2014.
Marokko.
Eva Croonen, Koen Klinkers, Gijs Wijnholds, Melchior Langeveld
Fonologie 1.
Fonetiek de studie van spraak (en zang) Gerrit Bloothooft
Fonetiek de studie van spraak (hoofdstuk 4) Gerrit Bloothooft
Klanken 1.
Taal met één hand Taal- en spraaktechnologie: groepsproject
Spraaksynthese.
Gerrit Bloothooft Spraaktechnologie Gerrit Bloothooft
daar baar bar been ben deen den boos bos doos dos dook dok bok baan
Natuurlijke Taalverwerking 3e trimester 98/99 docent: Gosse Bouma.
Transcripties Klankleer college 2.
Open Dag op Locatie Fonologie
Informatie avond groep 3
Fonemisch bewustzijn / aanvankelijk lezen Groep 1 t/m 4
Eu de letter neus n eu s neus deze clown heeft een lange neus.
B de letter boek oe k b boek wat een raar boek is dat.
Project Text To Speech Wat houdt het text-to-speech project in
Leerlijnen in relatie met de methode
Een taalopdracht maken (e-ee/ u-uu/o-oo/a-aa)
Spelling college 4.
Scanderen.
huis haas hees hijs zij bij hij haas haar haan haak pet net het het
Letters en klanken van het Nederlands
Instructiegroep 4 Ouderkring 16 september 2014
Vandaag gaan we werken aan spelling.
w e b wat moet ik doen r i b b ie b b e d h oe d g oe d ik stop.
wat moet ik doen b ij l w ie l m uu r k ou s l ij m n u l p ie k j eu
m o l w ij n d eu k l i k p ij l b oe r t ie n v o s wat moet ik doen ik stop.
m a s t v l ie g v l a g z ei l t ou w w ie s h oe d aa p ik stop wat moet ik doen.
Gemaakt door Rosan Derkx hijs. Gemaakt door Rosan Derkx tak.
samenstellingen, aan elkaar of los, trema
Spaans.
Syllabe/Lettergreep in het Nederlands en in het Tsjechisch herfstspreeuwzmrzlina???
In de stripkeswinkel kun d’ alle stripkes ale. G’oef gin bonne mee, want g’oef dèèr nie te betale. In de stripkeswinkel zijn alle stripkes grates. Dus.
Grote getallen.. Om de 3 cijfers een stip. Begin achteraan te tellen. Duizendstip Miljoenstip Miljardstip.
Aanvankelijk lezen Aanvankelijk lezen en spellen is de term die het proces aangeeft waarin een kind leert lezen en spellen. In Nederland gaat men ervan.
Mol en beer.
Je leert met de klankgroepen regelwoorden goed te schrijven.
Mol en beer.
Mol en beer.
Spelling woorden met lange klank
Breng de brief naar het goede huisnummer
Mol en beer.
Mol en beer.
doos roos boos poos buik ruik duik puik oor door boor voor noor aar
1 woorden met ui 2 woorden met oe 3 woorden met ou en nu 4.
Tellen allesvoorengels.nl.
Mol en beer.
daar baar bar been ben deen den boos bos doos dos dook dok bok baan
Klankleer Practicum.
TAALFOKUS: Klanke, spelling, skryftekens en punktuasie
Dactylische Hexameter
KLANKE VOKALE.
2010 Maart Maandag Dinsdag Woensdag Donderdag Vrydag Saterdag Sondag
Internasionale Moedertaal dag!
Aflevering 3: Het koppelteken‘-’.
Mol en beer.
Groep 4 blok 1 Weet je het nog?.
*Bekijk het zwarte woordje
Vokale, konsonante en diftonge
Transcript van de presentatie:

Grafeem-foneemomzetting voor spraaksynthese

fasen in tekst-naar-spraak Tekstbewerking niet-letters, afkortingen, niet-Nederlandse woorden Morfologische decompositie samenstellingen, syllabegrenzen [morfologie] Grafeem-foneemomzetting lettersymbolen -> klanksymbolen [fonologie] Melodie en ritme (prosodie) woordklemtoon [fonologie] en zinsaccenten [parsing, semantiek] Synthese akoestische realisatie [fonetiek]

gebruikelijk ontwikkeltraject Dag: eerste 50% Week: volgende 25 % Maand: volgende 10 % Jaar: volgende 10 % ?: laatste 5%

tekstbewerking: cijfers getallen, 5 -> "vijf", 21 -> "een en twintig"  (twenty-one) telefoonnummers 020-6680470 -> "nul twintig zes zes tachtig vier zeventig"  geldbedragen euro 32.54 -> "twee en dertig euro vier en vijftig"  huisnummers 13-hs -> "dertien huis"  Romeinse cijfers MDCCLXIV -> "zeventien honderd vier en zestig" 

tekstbewerking: afkortingen als losse letters KLM -> "K L M"  als woord VARA -> "vara"  als afgekort woord tel. -> "telefoon"  maar let op de juiste interpretatie van de punt (telefoon vs tel – de laatste tel.)

tekstbewerking: leestekens punten, komma's, puntkomma, etc -> prosodie

foneem-grafeemomzetting symbolen voor spraakklanken fonetisch alfabet IPA International Phonetic Alphabet - lastige tekenset in pre-Unicode tijdperk œ ø Λ Ʒ ʧ ʑ Ə … computer fonetisch alfabet verschillende voorbeelden, bv SAMPA (speech assessment methods phonetic alphabet) spreek uit en luister naar je klanken!

symbool omzetting 1 naar 1 p -> p , a -> A 1 naar 2 o -> O~ 2 naar 1 (dus onderzoek altijd eerst contekst!) ch -> x , sj -> S , ee -> e , ie -> i , ng -> N 2 naar 2 ij -> Ei

contekst afhankelijkheid positie in woord omringende letters ban -> bAn bang -> bAN final devoicing dak -> dAk bad -> bAt woordbegin <-> woordeinde lat -> lAt tal -> tAL wit -> wIt ruw -> ryW assimilatie zakdoek -> zAgduk en geen zAkduk

Voorbeelden

C*V*C* woorden zonder diacrieten positie van letter in woord positie van letter in cluster onset-nucleus-coda identificatie helpt Klinkerclusters l-eeu-w, g-eëe-rd Specifieke medeklinkerclusters Fonotactische restricties -> ook voor syllabegrenzen, maar vgl wegrennen

Contextgevoeligheid (C) in C*V*C* Ongevoelig in monosyllabe f, k, m, p, r, t, v, x, z Volgende context b (#), c (varia), d (#), g (goa), j (#), l (#), n (ng, #), q (qu), s (sj), w (#) Vorige context h (ch), j (ij), g (ng) vet als segment nemen

Contextgevoeligheid (V) in C*V*C* Veel op te lossen door segmentdefinitie aai, eeu, ooi, ieu mooi-er , ui-en aa, ee, oo, uu, ie, oe, eu [1 symbool] ai, oi, au, ou, ij, ei, ui [2 symbolen] ua, io [grens uV* iV*] korte klinkers a, i, o, u, y afhandelen na lange klinkers en tweeklanken kan, act = uitzondering e lastig: e, E, @, I

Regelvolgorde mooier eerst langste cluster: ooi m-ooi-e-r -> moj@r (mO:j@r) en niet m-oo-ie-r -> moir of m-o-o-i-e-r -> mOOIEr

plofklanken wrijfklanken nasalen labiaal (lippen) p (pad) b (bad) f (fiets) v (vat) m (mat) alveolair (achter de tanden) t (tak) d (dak) s (sap) z (zat) n (nat) palataal (verhemelte) tj (potje) dj (djintan) S (sjaal) Z (plantage) nj (anjer) velair (achter) k (kat) g (zakdoek, goal) x (lach) G (gat) N (bang) glottaal (stem) _ (stilte)  h (huis)

Liquida en halfvokalen woordbegin woordeinde Liquida l (lang, alle) r (rug) L (al) r (haar) R (haar) Halfvokalen w (wit) j (jan) W (sneeuw) na / i, e, y / J (aai)

Korte klinkers voor achter [-rond] [+rond] hoog I (bid) Y (put) midden E (bed) @ (rede) O (bos) laag A (bak)

Lange klinkers voor achter [-rond] [+rond] hoog i (bied) y (buut) u (boek) midden e (beet)| 2 (beuk) o (boot) laag a (baat)

Tweeklanken voor achter [-rond] [+rond] midden Ei (bijt) 9y (buit) Au (bout)

Gekleurde klinkers voor r achter [-rond] [+rond] midden I: (beer) Y: (deur) O: (door)

Franse klanken voor achter [-rond] [+rond] E~ (mannequin) Y~ (parfum) A~ (chanson) O~ (chanson) [Oe] uit freule