Project Text To Speech Wat houdt het text-to-speech project in Eerste opdeling in deeltaken Referenties Voorstudie
Text to Speech (1) Opdracht: programma ontwerpen en implementeren dat geschreven tekst omzet in zo natuurlijk mogelijke spraak voor de spraakgenerator maak je gebruik van een bestaand programma: MBROLA concreter: converteren van geschreven tekst in correcte invoer voor MBROLA
Text to Speech (2) Text-to-Speech: geschreven tekst is een relatief ‘arme’ representatie: geen notatie voor: echte klanken (letters klanken) nadruk intonatie deze informatie moet dus zo accuraat mogelijk gereconstrueerd worden, en in het formaat van mbrola gegoten worden. 175 25 R 165 35 ...
Text to Speech (3) Grote onderdelen: omzetting letters klanken database NL: Fonilex (zie website) echter Fonilex bevat niet alle woorden (o.a. namen); er moet dus ook een manier zijn om onbekende woorden om te zetten. reconstructie van intonatie/duur regelmatigheden: vraagzin stijgend naar het einde toe uitroepzin, mededelende zin,… “toonhoogtepatroon” mappen op de uit te spreken zin. algoritme moet configureerbaar zijn om gemakkelijk aanpassingen te kunnen maken.
Text to Speech (4) Grote onderdelen (2) user interface front-end voor de parameters van MBROLA output formaat/rechtstreekse output via speakers stem/taalbibliotheek aanpassen configuratie lokatie Fonilex,… aanpassen van toonhoogtepatronen
Referenties mbrola: http://tcts.fpms.ac.be/synthesis/ tts algemeen: http://tcts.fpms.ac.be/synthesis/introtts.html fonilex: http://arti.vub.ac.be/cursus/2002-2003/projecten-1lic/text-to-speech/Fonilex/ login: student paswoord: fonilex boeken website: in onze bibliotheek checklist project (belangrijk!)
Voorstudie Bepalen wat het programma juist allemaal gaat doen in het algemeen nadenken over het probleem, m.a.w. nog niet zo zeer over oplossingen, maar bv. welke taal? (-> Nederlands) ga je getallen omzetten in tekst of cijfer per cijfer uitspreken? welke leestekens ga je interpreteren/welk soort zinnen ga je onderscheiden? uitzoeken welke software-tools je gaat gebruiken (o.a. mbrola) hoe gaat je user interface er grofweg uitzien? … bestudeer mbrola en fonilex!
Praktisch afwezig tot 22/9 alias: texttospeech@arti.vub.ac.be