De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Zinnen en Grammatica Natuurlijke taalverwerking week 4.

Verwante presentaties


Presentatie over: "Zinnen en Grammatica Natuurlijke taalverwerking week 4."— Transcript van de presentatie:

1 Zinnen en Grammatica Natuurlijke taalverwerking week 4

2 Natuurlijke Taalverwerking2 Automatisch zinsontleden Herkennen van zinsdelen –Onderwerp –Persoonsvorm –Lijdend voorwerp –Bijwoordelijke bepalingen Woorden benoemen op woordsoort

3 Natuurlijke Taalverwerking3 Toepassingen Correctie van grammaticale fouten –jan word ziek –dit kind is verwent Dialoogsystemen: –USER: wanneer gaat de volgende trein? –SYSTEM: over vijftien minuten Automatisch vertalen

4 Natuurlijke Taalverwerking4 Demonstraties NP-chunker –Vind NP’s (zelfstandige naamwoordgroep) in een tekst Alvey Tools Grammar –algemene grammatica voor het Engels (klein woordenboek) NWO-TST (OVIS) parser in Hdrug –Voor openbaar vervoer reisinformatie (gesproken taal, semantiek)

5 Natuurlijke Taalverwerking5 Wat is een grammatica Verzameling regels (en een woordenboek) die de grammaticale zinnen van een taal beschrijven –Doelstelling 1: (automatisch) bepalen of een zin grammaticaal is (d.w.z. voldoet aan de regels van de grammatica)) of niet. –Doelstelling 2: Structuur (constituenten, betekenis) toekennen aan zinnen van de taal.

6 Natuurlijke Taalverwerking6 Context-vrije grammatica Regels: S --> NP VP NP --> Det A N VP --> V VP --> V NP Woordenboek: Det --> een N --> voorbeeld A --> eenvoudig V --> is NP --> dit

7 Natuurlijke Taalverwerking7 Dit is een eenvoudig voorbeeld S NPVP VNP DetAN Ditiseen eenvoudig voorbeeld

8 Natuurlijke Taalverwerking8 FSA versus CFG: 1. recursieve regels Sommige talen of zinsconstructies zijn niet met een Finite state Grammatica (reguliere expressies) te beschrijven: A N B N : een aantal A’s, gevolgd door hetzelfde aantal B’s. S --> a S B S --> a b

9 Natuurlijke Taalverwerking9 FSA versus CFG: 1. Recursieve regels Recursieve regels zijn in grammatica’s heel gewoon: –een dun iel dom oud boompje –een huis met tuin in Haren in de dorpskern N --> A N N --> N PP Niet iedere recursie is echt nodig: macro(np, [det, a*, n, pp*]). –pas wel op dat pp niet een macro mag zijn waarin np voorkomt

10 Natuurlijke Taalverwerking10 FSA versus CFG: 1. Recursieve regels Problemen ontstaan bij `center- embedding’: recursie die in het midden van een regel optreedt: –de fotograaf die de vrouw fotografeerde NP --> Det N Pronoun NP V –(ik ken) de fotograaf die de vrouw die de man die de hond die de kat achtervolgde zag kust fotografeerde,…. (Probleem: zinnen met ‘center- embedding’ zijn zeer moeilijk te verwerken

11 Natuurlijke Taalverwerking11 FSA versus CFG: 2. Structuur NP --> Det N, N --> A N, N --> N PP macro(np,[det,a*,n,pp*]) Grammatica’s zijn equivalent in zwakzwakke generatieve kracht: ze accepteren dezelfde strings. Niet equivalent in sterke generatieve kracht: CFG levert constituent- structuur op (boompjes), FSA niet. (syntactische) ambiguiteit is onzichtbaar in FSA

12 Natuurlijke Taalverwerking12 FSA versus CFG: 2. Structuur VP --> V NP VP --> VP PP –An eet rijst met een vork NP --> NP PP –An eet rijst met kip macro(vp,[v,np,pp*])

13 Natuurlijke Taalverwerking13 FSA versus CFG: 2. Structuur VP PP VP V NP PP eet rijst met een vork eet rijst met kip

14 Natuurlijke Taalverwerking14 Voorbij CFG CFG met features (kenmerken, attributen) en unificatie voorbeelden: Definite Clause Grammar, Unificatie Grammatica. Transformationele grammatica is te lastig voor computationele doeleinden: –weinig formele precisie –lastig voor automatisch ontleden

15 Natuurlijke Taalverwerking15 Voorbij CFG De taal WW (een rij woorden gevolgd door dezelfde rij woorden) is niet context-vrij: –aabcccaabccc Nederlandse werkwoordsclusters vertonen vergelijkbare ‘cross-serial dependencies’: –dat Peter Hans Cecilia de kraanvogels zag helpen fotograferen


Download ppt "Zinnen en Grammatica Natuurlijke taalverwerking week 4."

Verwante presentaties


Ads door Google