De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Natuurlijke Taalverwerking 3e trimester 98/99 docent: Gosse Bouma.

Verwante presentaties


Presentatie over: "Natuurlijke Taalverwerking 3e trimester 98/99 docent: Gosse Bouma."— Transcript van de presentatie:

1 Natuurlijke Taalverwerking 3e trimester 98/99 docent: Gosse Bouma

2 Automaten en Transducers Week 2

3 Natuurlijke Taalverwerking3 Opdracht 1 Lees hoofdstuk 1, 2, en 3 van de syllabus. Doe de FSA tutorial, tot transducers. Maak opdracht 1 (zie Deadline: Dinsdag 6 april

4 Natuurlijke Taalverwerking4 Eindige Automaten De eenvoudigste machines om taal (reeksen symbolen) te verwerken zin eindige automaten. Een automaat bestaat uit –een aantal toestanden –transities –een begintoestand –één of meer eindtoestanden

5 Natuurlijke Taalverwerking5 Eindige Automaten A B C C D

6 Natuurlijke Taalverwerking6 Epsilon-transities (jumps) macro(syll,[b,{r,l}^,o,k,{s,t}^]). bl r  o k s t 

7 Natuurlijke Taalverwerking7 Deterministische automaten Een automaat is deterministisch wanneer je vanuit iedere toestand T voor ieder invoersymbool S hoogstens 1 transitie mogelijk is. Automaten met epsilons zijn (behalve in flauwe gevallen) non-deterministisch.

8 Natuurlijke Taalverwerking8 Woordenlijst als automaat Een lijst {aap,alp,aak,alm,...} kun je beschouwen als een taal bestaande uit de woorden in de lijst. [a,{[l,{p,m}],[a,{k,p}]}] Corresponderende automaat is een letter-trie Voordelen: –snel zoeken, –combinatie met FS-technieken : –macro(woord,[prefix,stam,suffix]).

9 Natuurlijke Taalverwerking9 Wat je ook doet, de semantiek gooit roet Makkelijk ? –Spellingcontrole, –Afbreken, –OCR, –Tekst naar spraak, –Information Retrieval, –Voice Response, –Part of Speech tagging, –Samenvatten, –Rapporten genereren. Moeilijk? –Grammaticale controle (d/t fouten) –Dicteersystemen (grote woordenschat) –Volledige syntactische en semantische analyse –Automatisch vertalen

10 Natuurlijke Taalverwerking10 Transducers Nut van herkenners (recognizers) is beperkt. Meeste finite state toepassingen gebruiken transducers. Een transducer vertaalt een invoerstring naar een uitvoerstring. apen -> a-pen 19 -> negentien KPN -> kapeEn

11 Natuurlijke Taalverwerking11 On-line Demo’s Woordsoorten toekennen –Memory-based tagging (Tilburg)Memory-based tagging (Tilburg) –Finite State Morphology (Xerox, Grenoble)Finite State Morphology Grafeem-naar-foneem conversie (Tilburg)Grafeem-naar-foneem conversie N.b. Deze toepassingen kun je met finite state technologie te lijf gaan, meestal (in combinatie met) statistische modellen.

12 Natuurlijke Taalverwerking12 Transducer l:l a:a k:k o:o o:  p:p +:  +:k e:e n:n lak+en -> lakken, loop+en -> lopen

13 Natuurlijke Taalverwerking13 Non-deterministisch h:h a:a r:r a:a a:  r:r +:  d:d e:e n:n haar+en -> haren, haard+en -> haarden


Download ppt "Natuurlijke Taalverwerking 3e trimester 98/99 docent: Gosse Bouma."

Verwante presentaties


Ads door Google