Spraaksynthese met MBROLA

Slides:



Advertisements
Verwante presentaties
Eigen vermogen bij N.V.( en B.V.)
Advertisements

‘onderscheidend of inconsistent?’
havo A Samenvatting Hoofdstuk 10
Een digitaal verhaal maken
havo A Samenvatting Hoofdstuk 9
Jaar- en diplomaresultaat
(heeft niet als doel om winst te maken = overheid)
Indexcijfers indexcijfers zijn geen percentages!
Havo5 WA Extra opgaven.
PRESENTATIETRAINING.
Grote getallen Getallen groter dan vier cijfers schrijf je meestal in groepjes van drie. Je schrijft niet maar Dit spreek je.
solidariteit en moreel wangedrag
De verschillende fasen in de elektronische noterings- procedure.
UITWERKINGEN TOEPASSINGEN
OV en Ruimte Effecten van beter OV,ruimtelijk beleid en flankerend beleid. Is het geheel meer dan de som der delen? Hans Hilbers, PBL.
Kats en coaching doe, leer, ontwikkel jezelf
Welvaartsverlies Pareto-efficiëntie.
De toets data 2kb juni 2kc juni 2kd 20 juni 2ke 17 juni   2ma 19 juni
Snelheidstoets Normaal verdeling 1 H5
Evenredigheden.
FOTODIGITAAL
Gezondheidsgerelateerde fitheid van sedentaire senioren in Nederland
REKENEN.
Elke 7 seconden een nieuw getal
Klinkerverstaanbaarheid
Vibrato. Wat is vibrato Regelmatige modulatie (verandering) van de toonhoogte en luidheid Ongeveer 6 cycli per seconde.
Taal met één hand Taal- en spraaktechnologie: groepsproject
Spraaksynthese.
Waarneming.
Zelfredzaamheid bij kinderen en jeugdigen met autisme en een ernstige verstandelijke beperking Nelchen Arijs.
Lineaire functies Lineaire functie
Differentieer regels De afgeleide van een functie f is volgens de limietdefinitie: Meestal bepaal je de afgeleide niet met deze limietdefinitie, maar.
Differentieer regels De afgeleide van een functie f is volgens de limietdefinitie: Meestal bepaal je de afgeleide niet met deze limietdefinitie, maar.
Logo : Stapsgewijze verfijning Les Wouter Rogiers.
Oefeningen F-toetsen ANOVA.
Natuur- en Scheikunde Pulsar leerjaar 1 hoofdstuk 3
Febelfin – Studiedag “De beurs vandaag” Leen Van Wambeke Retail Marketing Services Euronext Brussels.
Meten BMI Dat is in de veilige zone, want de BMI zit tussen 18,5 en 25
Inkomen les t/m 75 plus Zelftest Kennisvragen.
NVvW, Veenendaal, 3 november 2012 Willem Uittenbogaard samen delen…
Arbeid en kinetische energie
2.6 Het gebruik van formules en diagrammen
Van meting naar diagram
Plaats en tijd opgave 1 25 s 26 s 27 s a) Baan 4. b) (De zwemmer is weer bij het Startpunt) c) Na 76 s is afgelegd:
Een verandering = -Een afname -Een toename (nieuwe bedrag – oudste bedrag) : oudste bedrag X 100 =...%
Lesplanning – paragraaf 7 blz. 38 Binnenkomst Intro Vragen huiswerk Uitleg docent Zelfstandig werken, met radio?? Afsluiting van de les. Lokaal verlaten.
indicator op basis van niveau-indicaties
30 x 40 = 1200 m2 8.1 Omtrek en oppervlakte 40 m 30 m
Hoofdstuk 4 Vlakke figuren.
De gekoelde transistor
Individuele leerlijnen
Snelwegsystemen Jos Beukeveld Mei 2011.
S.M.A.K Gent.  Inleiding  Geschiedenis SMAK  Wat is actueel?  Praktische informatie  Adres  Bronnen.
Adviespresentatie Heineken
VERHOUDINGEN.
Inkoopprijs, verkoopprijs,winst, verlies
Investeringen Klik om verder te gaan. Hoe gebruik je deze uitleg? Je kunt in deze presentatie ‘bladeren’ door de pijltjestoetsen te gebruiken. Vooruit.
EMVI in de digitale praktijk
Vraagstuk: korting ( type 1)
Trillingstijd en frequentie bepalen uit een oscilloscoopbeeld
3FD na de vakantie !! Wiskunde deel B + Geodriehoek !!! + potlood !! + gum !! + rekenmachine !! Koop het als je het niet hebt !
‘NLP Basiscursus Je ongekende vermogens’
Geluid Hoofdstuk 4.
WAP 21 maart 2011.
Hallo.
PO Periodieke functies
Decubitusvoorlichting tijdens revalidatiebehandeling.
MNO’s = TNO’s = transnationale ondernemingen Productiebedrijven
Lat a t l.
Transcript van de presentatie:

Spraaksynthese met MBROLA difoonsynthese

Difoonsynthese Als ingrediënten opgeven: Fonemen Toonhoogte Duren

MBROLA procedure Nodig: MBROLA difoonset Stuurgegevens in .pho fil fonemen, toonhoogtes, duren MBROLA maakt .wav file $mbrola mbrola/nl2/nl2 woord.pho woord.wav

MBROLA difoonset Welke difonen precies? Een woordenreeks opnemen waarin alle difonen voorkomen Hoe bereik je stabiliteit in kwaliteit? Met of zonder klemtoon? Segmenteren van difonen

Difoonaansluitingen pa ka ta Dit zijn meestal zes verschillende opnamen, maar dat geeft spectrale verschillen bij de aansluiting: pa – ap, pa – ak, pa – at ka – ap, ka – ak, ka – at ta – ap, ta – ak, ta – at ap ak at

Manipulatie Difoonbouwstenen zijn opgenomen met bepaalde toonhoogten en duren. Hoe kun je die veranderen zonder het timbre van de fonemen te veranderen? Scheiden van stembron en stemfilter, met parametrisatie Golfvorm manipulatie

Scheiden van stembron en stemfilter Model van stemgeving stembron + 5 formantfilters Bereken elke 10 ms de beste benadering van stembron en van de 5 formantfilters Alles in parameters, ook toonhoogte en duur Pas toonhoogte en duur aan Resynthetiseer

Golfvorm manipulatie (PSOLA) Elke stemperiode markeren Per stemperiode een weging uitvoeren zodat aparte stukjes ontstaan die samen de totale golfvorm maken De stukjes in elkaar schuiven geeft een hogere toonhoogte, uit elkaar een lagere Stukjes verdubbelen vergroot de duur, stukjes weghalen verkort Pitch Synchronous OverLap Add method

PSOLA toonhoogtemanipulatie

MBROLA synthese – duur (ms) – toonhoogte (Hz) – % ; Utterance: "Hallo!“ _ 100 100 120 h 96 A 48 l 76 5 100 75 120 o 224 25 85 _ 100 40 70 percentages

MBROLA minivorm Startstilte (100 ms) en begintoonhoogte Fonemen met duren Eindstilte (100 ms) en eindtoonhoogte Alles met <cr> ertussen Met FSA macro!

Hoe kom je aan de waarden Duren: zie website (startwaarden) Toonhoogte: woordklemtoon monosyllabische woorden midden op klinker, bv F0-begin = 120 F0-klemtoon = 150 (50%) F0-einde = 70 Hz