Natuurlijke Taalverwerking

Slides:



Advertisements
Verwante presentaties
Week 9: Probabilistische Grammatica's Jurafsky & Martin (ed. 1), Hoofdstuk 12: Lexicalized and Probabilistic Parsing) Taaltheorie en Taalverwerking Remko.
Advertisements

Grammatica hoofdstuk 2 blz 68-69
Web 3.0: van omgevallen boekenplank tot georganiseerde kennisbank Frank van Harmelen Vrije Universiteit Amsterdam Creative Commons License: allowed to.
Natuurlijke-Taalinterfaces
Zoeken in het Nederlands: toepassingen voor ontwikkeling en beheer van thesauri Dennis de Vries.
Taaltheorie en Taalverwerking Bachelor Kunstmatige Intelligentie.
Presentatietitel: aanpassen via Beeld, Koptekst en voettekst 1 Universiteit Twente meets SG Twickel Zoeken in grote tekstbestanden Mariëlle Stoelinga.
Taal- en spraaktechnologie voor mensen met een leesbeperking
Aanvankelijk lezen Hoe lezen wij?
Sociolinguïstiek Bijeenkomst 3.
S1S1 S2S2 S3S3 WP2 OOV woorden in herkenners WP2.2 Betrouwbaarheidsmaten Jacques Duchateau ESAT – PSI - Spraakgroep.
Prosodie.
Taal met één hand Taal- en spraaktechnologie: groepsproject
Spraaksynthese.
Gerrit Bloothooft Spraaktechnologie Gerrit Bloothooft
Definite Clause Grammar
Natuurlijke Taalverwerking 3e trimester 98/99 docent: Gosse Bouma.
1. Parsing (epsilon’s, tabellen) 2. Unificatie grammatica Natuurlijke taalverwerking week 7.
Natuurlijke-Taalinterfaces week 5 Lambda-termen en Lambda-conversie.
Hoofdzinnen, bijzinnen, en vraagzinnen in Unificatie Grammatica
Natuurlijke taalverwerking week 4
Natuurlijke Taalverwerking
Universiteit Twente meets SG Twickel Zoeken in grote tekstbestanden
Hoofdstuk 6 Steekproeven trekken Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian Thornhill, Marije Booij en Jan.
Wonen in Nederland § 2.2 Leven met water.
Natuurlijke-Taalinterfaces Week 1 -- Inleiding 2e trimester 2002/03 docent: Gosse Bouma
Parsing: Top-down en bottom-up
Orientatie Alfa-informatica Computer-taalkunde Gosse Bouma
Unificatie grammatica
Semantische Interpretatie Jurafsky & Martin (Ed. 1): Hoofdstuk 15
AMARANTIS EXAMEN Medewerker Marketing Communicatie.
Leerlijnen in relatie met de methode
Voorlezen Lees-Mediacoach Marloes Reuvers Jezelf voorstellen
WERKWOORDSPELLING Hoe doe je dat ?.
Werken in K.U.Loket Syllabi. 1 ZoekmogelijkhedenVolledige lijst opvragen is ook mogelijk, maar kan lang duren Start in K.U.Loket de toepassing “mijn syllabi”
Woordenschat en kijk op taal Hoofdstuk 2 en 3
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Hans BennisMeertens Instituut (KNAW)
AI Kaleidoscoop Werkcollege 1: AI Overzicht Radu Serban
Stappenplan Samenvatten
Communicatie en relatie
Begrijpend lezen VS.
Woordenschat Groep 5 Thema 4, les 3
SE-Seneca voorbereiding op CE 2013!
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Opgave Vertaling Filtering. Babelfish Webservice Context Werkwoorden Plaatsnamen & onbekende woorden Taaldetectie.
Woordraadstrategieën
Verkeerde verwijswoorden
Hoofdstuk 1 Grammatica zinsdelen
Presentatietitel: aanpassen via Beeld, Koptekst en voettekst 1 Universiteit Twente meets school Zoeken in grote tekstbestanden Mariëlle Stoelinga.
1 van 22 Hoofdstuk 5 Geletterdheid: lezen. 2 van 22 Achtergrondkennis Kennis over lezen: o kennis van de wereld o kennis van de taal:  orthografische.
Kennen en kunnen Wat je moet kennen en kunnen voor de SO Woordenschat H1 t/m H4 1. Woordraadstrategieën: -zoek een synoniem; -zoek een omschrijving of.
Basiscursus Onderzoekend en Ontwerpend Leren De rol van taal Carmen Damhuis & Heleen van Ravenswaaij.
SAMENGESTELDE ZINNEN Hoofdzin en bijzin. Wat gaan we deze les leren? Wat zijn samengestelde zinnen? Wat is een bijzin? Wat is hoofdzin?
Thema 4: Begeleiding van leerlingen met dyslexie Vakinhoudelijke begeleiding Nederlands.
Leesvaardigheid Lezen en leestoetsen. ▪ 1. Gouden tip voor leestoetsen ▪ 2. Hoe pak je leestoetsen aan? ▪ 3. Wat doe je bij onbekende woorden? ▪ 4. Hoe.
– examentraining schrijven & taalportfolio
1. Wat gaan we vandaag doen ?
Kennismaking met programmeren
Lezen H1 t/m H3 In deze PowerPoint: Op onderwerp: Op leesstrategie:
Omschrijvingen en definities
1 woorden met ui 2 woorden met oe 3 woorden met ou en nu 4.
Kennismaking met programmeren
Lezen samenvatten.
Syntactische Annotatie CHILDES
taal speelt een rol in alle vakken
Elke les is een taalles Welke taalsteun hebben mbo-studenten nodig?
Spraakherkenning.
Mens & Maatschappij D-Toets
Vergelijkingen oplossen
Mens & Maatschappij D-Toets
Transcript van de presentatie:

Natuurlijke Taalverwerking 3e trimester 98/99 docent: Gosse Bouma

Automaten en Transducers Week 2

Natuurlijke Taalverwerking Opdracht 1 Lees hoofdstuk 1, 2, en 3 van de syllabus. Doe de FSA tutorial, tot transducers. Maak opdracht 1 (zie www.let.rug.nl/~gosse/nlp1) Deadline: Dinsdag 6 april Natuurlijke Taalverwerking

Natuurlijke Taalverwerking Eindige Automaten De eenvoudigste machines om taal (reeksen symbolen) te verwerken zin eindige automaten. Een automaat bestaat uit een aantal toestanden transities een begintoestand één of meer eindtoestanden Natuurlijke Taalverwerking

Natuurlijke Taalverwerking Eindige Automaten B A 3 1 C 4 C 2 D Natuurlijke Taalverwerking

Epsilon-transities (jumps) macro(syll,[b,{r,l}^,o,k,{s,t}^]). o s t b l r k   Natuurlijke Taalverwerking

Deterministische automaten Een automaat is deterministisch wanneer je vanuit iedere toestand T voor ieder invoersymbool S hoogstens 1 transitie mogelijk is. Automaten met epsilons zijn (behalve in flauwe gevallen) non-deterministisch. Natuurlijke Taalverwerking

Woordenlijst als automaat Een lijst {aap,alp,aak,alm,...} kun je beschouwen als een taal bestaande uit de woorden in de lijst. [a,{[l,{p,m}],[a,{k,p}]}] Corresponderende automaat is een letter-trie Voordelen: snel zoeken, combinatie met FS-technieken : macro(woord,[prefix,stam,suffix]). Natuurlijke Taalverwerking

Wat je ook doet, de semantiek gooit roet Makkelijk ? Spellingcontrole, Afbreken, OCR, Tekst naar spraak, Information Retrieval, Voice Response, Part of Speech tagging, Samenvatten, Rapporten genereren. Moeilijk? Grammaticale controle (d/t fouten) Dicteersystemen (grote woordenschat) Volledige syntactische en semantische analyse Automatisch vertalen Natuurlijke Taalverwerking

Natuurlijke Taalverwerking Transducers Nut van herkenners (recognizers) is beperkt. Meeste finite state toepassingen gebruiken transducers. Een transducer vertaalt een invoerstring naar een uitvoerstring. apen -> a-pen 19 -> negentien KPN -> kapeEn Natuurlijke Taalverwerking

Natuurlijke Taalverwerking On-line Demo’s Woordsoorten toekennen Memory-based tagging (Tilburg) Finite State Morphology (Xerox, Grenoble) Grafeem-naar-foneem conversie (Tilburg) N.b. Deze toepassingen kun je met finite state technologie te lijf gaan, meestal (in combinatie met) statistische modellen. Natuurlijke Taalverwerking

Natuurlijke Taalverwerking Transducer lak+en -> lakken, loop+en -> lopen k:k a:a +:k l:l n:n e:e o:o +:  o: p:p Natuurlijke Taalverwerking

Natuurlijke Taalverwerking Non-deterministisch haar+en -> haren, haard+en -> haarden r:r h:h n:n d:d a:a e:e +:  a:a a: r:r Natuurlijke Taalverwerking