Spraaksynthese.

Slides:

Advertisements

Verwante presentaties

De hoeden van Edward de Bono

Advertisements

College 7: Stemvorming en Geluid

KAREN SCHAUWERS Steven Gillis Paul Govaerts

Arbeidsfactor Arbeidsfactor.

Jan Mihl Jan Mihl 2 Inleiding Vooral informatief Bestaande modellen tunen Diverse aspecten De methode Het resultaat.

Bijeenkomst 3 Hoe bouw je een les op en hoe houd je hierbij rekening met het leren van leerlingen?

Grafeem-foneemomzetting voor spraaksynthese

Realisaties Industriële Sturingen

Probleem gestuurd onderwijs

Taal en cognitie: Optimaliteitstheorie Henriëtte de Swart.

Voortgezet technisch lezen

Aanvankelijk lezen Hoe lezen wij?

Starten van elektromotoren

WP1 Segmentatie in homogene delen Objectieven voor eerste 6 maanden –Analyse van literatuur Philips, LIMSI, BBN, HTK, IBM, Eurecom –Realisatie van basissysteem.

Computationele Taalkunde (taal- en spraaktechnologie)

Fonetiek de studie van spraak (en zang) Gerrit Bloothooft

Fonetiek de studie van spraak (hoofdstuk 4) Gerrit Bloothooft

Spraakakoestiek Gerrit Bloothooft.

Klinkerverstaanbaarheid

Vibrato. Wat is vibrato Regelmatige modulatie (verandering) van de toonhoogte en luidheid Ongeveer 6 cycli per seconde.

Taal met één hand Taal- en spraaktechnologie: groepsproject

Spraaksynthese met MBROLA

Gerrit Bloothooft Spraaktechnologie Gerrit Bloothooft

Natuurlijke Taalverwerking

BiO-M Wiskundig Modelleren BiO-M Wiskundig Modelleren Lineair Programmerings-modellen Hoorcollege 2.

Spraaksignaalverwerking

Logopedische aspecten

Hoofdstuk 2: Basisstructuur van het trainingsproces

2IO05: OGO 1.1 Informatiesystemen. OGO – ontwerpgericht onderwijs Hoe leer je ontwerpen? doen: stap voor stap + terugkijken Telkens: modelleren: probleem.

Les 5. Resultaat: In de akoestiek staat deze vergelijking bekend als de hoorn- vergelijking van Webster. In ons geval is σ(x) het plaatsafhankelijke doorsnede.

De balans methode Een goede methode om vergelijkingen mee op te lossen

WSNS 4 oktober 2007 “Als je doet wat je deed, krijg je wat je kreeg”.

Project Text To Speech Wat houdt het text-to-speech project in

Maak uw eigen film in drie gemakkelijke stappen

TOOLS FOR STRUGGLING WRITERS ASSISTIVE TECHNOLOGY FOR WRITING Evy Jansen.

H3. Communicatie Gesprekstechnieken.

Schrijven met een strategie

Ouderavond De Kameleon 15 april 2014

Marketing & Logistiek 6 atheneum.

Media en creativiteit Herfst les 3.

Presentatie methodeanalyse Zo leren kinderen lezen en spellen & Leeslijn De Hand-out.

Tijd van burgers en stoommachines,

Opdracht techniek Soorten Microfoons

Hoofdstuk 5 Vijfkaart hoog, eerste verkenning 1e9 NdF-h1 NdF-h5 1 1.

PSO. Praktisch school onderzoek.

Les: Presenteren LBB – Module Groen Ondernemen Coen van Wetering.

Hoe maak ik een PowerPoint presentatie?

Analyseren met de ROCspiegel.nl Analyseren Informatie Ordenen Sorteren Filteren.

Workshop ONL congres 2011OnderwijsAdvies Dorothé Kappenburg DYSLEXIE en fonologische problemen.

STAPPENPLAN VOOR HET MAKEN VAN EEN LEESTOETS LEESRONDE 1 - ORIENTEREND: -Lees titel, tussenkopjes etc. -Lees eerste en laatste alinea -Formuleer hoofdgedachte.

Gert Treurniet Christelijk Gymnasium Sorghvliet Docent wiskunde

Werkstuk nask In de week van 23 januari 2017 (week 04) voor vrijdag 27 januari 12:15, inleveren Daarna: elke werkdag te laat: 5 punten (van de 100) van.

Kennismaking met programmeren

4 De wetenschap & het vraagstuk van het ontstaan van leven

Opdracht Taakanalyse en stroomschema kopieermachine.

Presence & public speaking: effectief communiceren

Kennismaking met programmeren

Informatieavond Kurzweil (basis).

(week 045) voor vrijdag 02 januari 12:15, inleveren

Akoestiek en geluidshinder LES 1

WAAROM CO2? Uitfasering huidige koelmiddelen, R404a / R410a / R507 / R407C Prijsdruk en schaarste op de huidige chemische koelmiddelen Alternatieven zijn.

HET GEBRUIK VAN DEZE SJABLOON

Transcript van de presentatie:

Spraaksynthese

Fasen in tekst-naar-spraak Tekstbewerking morfologische analyse Grafeem-foneemomzetting Melodie en ritme parsing en semantische analyse Synthese akoestische realisatie

Spraaksynthese Het maken en aaneenrijgen van spraakklanken Klank(verloop) Toonhoogte(verloop) Intensiteit(verloop) Duur(verloop)

Methoden Mechanisch Elektro-akoestisch MODEL van de spraakproductie volledig volgens regels BOUWSTENEN kant en klare spraakelementen

Mechanisch/articulatorisch Historisch Stembron trilbron – toonhoogte en luidheid ruisbron Stemweg (aanzetstuk) Kaak, tong, lippen, neusholte

Von Kempelen

Faber’s Euphonia

Ontwikkeling van elektro-akoestiek Elektrisch analogon van akoestische processen Analoog Digitaal Klankbeschrijving Articulatorische basis niet noodzakelijk Bron + complex akoestisch filter

Vocoder Voice coder / decoder Codering van spraak, elke 10 ms Toonhoogte Luidheid Spectrumcodering Bandfilterenergie

Voder demonstratie

Voder

Formant synthese Codering van spraak, elke 10 ms Toonhoogte Luidheid Spectrumcodering Resonanties: formanten Uit vorm van aanzetstuk berekenen (articulatorische synthese) Maar hoe kom je aan de juiste waarden?

Formantsynthesiser (Fant) demonstratie

Klatt-synthesiser (DEC-talk, 1987) demonstratie Geheel digitaal Geheel modelmatig, alle parameters regelbaar (ca 30) Stembron Formanten Allerlei stemmen mogelijk Lange tijd succesvol

Articulatorische synthese demonstratie Geef vorm van aanzetstuk Bereken dwarsdoorsneden van strot tot lippen Bereken bijbehorende akoestische resonanties Synthetiseer met filtermodel

Nadelen regelsynthese Zeer bewerkelijk om goede regels te maken Vooral de overgang tussen spraakklanken is moeilijk te beregelen Contekstafhankelijkheden Door modelbeperkingen klinkt spraak minder natuurlijk

Oplossing Gebruik bouwstenen (spraakfragmenten) die aanelkaar worden geregen Flexibiliteit versus grootte bouwsteen

Eenvoudigste oplossing Woorden en zinnen als bouwstenen gebruiken Opnemen met direct de juiste intonatie NS informatiesystemen op stations Vliegveld informatiesystemen Alleen bij beperkte vocabulaire, en veel standaard zinnen Taalkundig en fonetisch weinig interessant

Kleinere bouwstenen Kant en klare stukjes vooraf opgenomen spraak die aan elkaar geregen worden Voordeel Klankovergangen zitten in bouwsteen Nadeel Beregelen toonhoogte blijft nodig Overgangen tussen bouwstenen Nieuwe stem: nieuwe bouwstenen

Populaire bouwstenen Difonen Hoeveel nodig? demonstratie Difonen Overgang tussen twee spraakklanken, van midden spraakklank tot midden volgende spraakklank Hoeveel nodig?

Difoonsynthese Als ingrediënten opgeven: Fonemen Toonhoogte Duren

Moeilijkheden Overgangen tussen difonen Voldoende difonen? Spectrale verschillen tussen einde ene difoon en begin van volgende difoon Voldoende difonen? Prosodie (Toonhoogte en luidheid) Bouwsteen heeft opgenomen toonhoogteverloop en duur, die moeten veranderbaar zijn Prosodieberegeling blijft lastig Elke nieuwe stem eist nieuwe difoonset

Unit-selection synthesis demonstratie Neem zeer veel spraak op van een spreker (vele uren) Segmenteer dat op foneem-, syllabe-, woordniveau Zoek precies die bouwstenen die passen voor de te synthetiseren zin

Unit-selection kenmerken Geen toonhoogte / duur manipulaties Zeer grote natuurlijkheid Lang niet altijd zijn precies de noodzakelijke segmenten beschikbaar Compromis: kies dan kleinere units maar wel steeds groter aansluitingsproblemen

Audiovisuele spraaksynthese demonstratie Modelleren van gezichtsuitdrukking tijdens het spreken -> talking agents Visuele versus auditieve informatie McGurk effect

Spraaksynthese tijdlijn

Opdracht Spraaksynthese verkenningen Maak verslag en voeg dat aan spraak-basis verslag toe Nog niet opsturen!

Volgende week Grafeem-foneemomzetting klaar Beregelen van difoonsynthese met het MBROLA systeem Uitleg over manipulatie van duur en toonhoogte