Natuurlijke taalverwerking week 4

Slides:



Advertisements
Verwante presentaties
Redekundig ontleden Over waarom, wat en hoe....
Advertisements

Week 9: Probabilistische Grammatica's Jurafsky & Martin (ed. 1), Hoofdstuk 12: Lexicalized and Probabilistic Parsing) Taaltheorie en Taalverwerking Remko.
Herhaling van hoofdstuk
Zinsontleden Gemaakt door: B & G.
Communicatie & Presentatie
Natuurlijke-Taalinterfaces
Taaltheorie en Taalverwerking Week 4: Parseer-algoritmes.
Basisschool de Wester 9 mei 2014.
Fouten met verwijswoorden
TAALPROBLEMEN ODD ONE OUT.
Taaltheorie en Taalverwerking Week 3: Syntax van Natuurlijke Taal.
'Om mijn oud woonhuis peppels staan'
Taalkunde Grammatica A
Compositionaliteit, bereik en lambda’s
Grammatica’s en Ontleden
Betekenis 2: Compositionaliteit, bereik en lambda’s
Grammaticale modellen
Taalwetenschap in de CKI-bachelor
Definite Clause Grammar
Natuurlijke Taalverwerking 3e trimester 98/99 docent: Gosse Bouma.
1. Parsing (epsilon’s, tabellen) 2. Unificatie grammatica Natuurlijke taalverwerking week 7.
Natuurlijke Taalverwerking
Categoriale Grammatica
Natuurlijke-Taalinterfaces week 5 Lambda-termen en Lambda-conversie.
Hoofdzinnen, bijzinnen, en vraagzinnen in Unificatie Grammatica
Natuurlijke Taalverwerking
AI91  Het Probleem  Grammatica’s  Transitie netwerken Leeswijzer: Hoofdstuk AI Kaleidoscoop College 9: Natuurlijke taal.
Parsing: Top-down en bottom-up
Orientatie Alfa-informatica Computer-taalkunde Gosse Bouma
Implementing Cross-Language Text Retrieval Systems for Large-scale text Collections and the World Wide Web n Mark W. Davis and William C.Ogden n AAAI 1997.
Unificatie grammatica
TAALPROBLEMEN ODD ONE OUT. ODD ONE OUT PRINCIPE JE KRIJGT DRIE GRAMMATICALE PROBLEMEN VOORGESCHOTELD IEDER PROBLEEM BESTAAT UIT DRIE ZINNEN TELKENS HOORT.
Taaltheorie en Taalverwerking Week 5: – Natuurlijke Taal Syntax. (Uitbreiding op CFG: Features.) – Human Parsing: Center-Embedding.
Semantische Interpretatie Jurafsky & Martin (Ed. 1): Hoofdstuk 15
Three steps to success Foutloos zinnen vertalen in drie stappen
MET DANK AAN COLLEGA’S IN DEN LANDE ! vee 2012
Grammatica Nederlands
Woordenschat en kijk op taal Hoofdstuk 2 en 3
Tentamen vraag 1 Als L en M talen zijn, dan nL  M is gelijk aan { s  t | s  L, t  M } nL M is gelijk aan { s t | s  L, t  M } nL n is gelijk aan.
Stage: Basisschool de Klingerberg
Syntaxis 1. Inleiding: Combinaties Combinaties op verschillende niveaus: Lettergrepen als combinaties van fonemen. (College 3,4) Woorden als combinaties.
Zinnen 1 Henriëtte de Swart.
Hoofdstuk 1 Grammatica zinsdelen
Zoeken naar Constructies Jan Odijk DRONGO Taalfestival Utrecht,
Module Grammatica K3 zinsontleding.
Nederlands Woensdag 6 januari 2va.
De lidwoorden Kleine woorden met grote gevolgen!! Welke ken je? (ne en fa du)
Grammatica zinsdelen H1 t/m H6
Goed of Fout Jan Odijk & Gertjan van Noord CLARIAH-middag Amersfoort,
Goed of Fout Wat gebruikt men feitelijk? Gertjan van Noord & Jan Odijk Grote Taaldag (TIN-dag) Utrecht,
GRAMMATICA BLOK 1 T/M 4 Uitleg en voorbeelden Woordsoorten Basis leerjaar 4.
Hoofdstuk 5 Grammatica zinsdelen Meewerkend voorwerp.
Hoofdstuk 4 Grammatica zinsdelen
Meest voorkomende vragen bij examenteksten.
Foutieve samentrekking
Hoofdstuk 1 Grammatica zinsdelen
De samengestelde zin.
Bijwoordelijke bepaling
Verschil: redekundig en taalkundig ontleden
Grammatica Hoofdstuk 2.
Grammatica zinsdelen Redekundig ontleden.
Video and Radio NU Engels unit 5.1.
Samentrekking.
Hoe ontleed je een zin in zeven stappen?
Grammatica zinsdelen 2havo, periode 2a.
Zinsdelen Uitleg met voorbeelden
Het gezegde (vraagzin van maken, pv komt vooraan)
BINGO! Persoonsvorm, werkwoordelijk gezegde, naamwoordelijk gezegde, onderwerp, lijdend voorwerp, meewerkend voorwerp, bijwoordelijke bepaling en voorzetselvoorwerp.
Hoofdstuk 2 Taalverzorging
Grammatica: werkwoorden
Transcript van de presentatie:

Natuurlijke taalverwerking week 4 Zinnen en Grammatica Natuurlijke taalverwerking week 4

Automatisch zinsontleden Herkennen van zinsdelen Onderwerp Persoonsvorm Lijdend voorwerp Bijwoordelijke bepalingen Woorden benoemen op woordsoort Natuurlijke Taalverwerking

Natuurlijke Taalverwerking Toepassingen Correctie van grammaticale fouten jan word ziek dit kind is verwent Dialoogsystemen: USER: wanneer gaat de volgende trein? SYSTEM: over vijftien minuten Automatisch vertalen Natuurlijke Taalverwerking

Natuurlijke Taalverwerking Demonstraties NP-chunker Vind NP’s (zelfstandige naamwoordgroep) in een tekst Alvey Tools Grammar algemene grammatica voor het Engels (klein woordenboek) NWO-TST (OVIS) parser in Hdrug Voor openbaar vervoer reisinformatie (gesproken taal, semantiek) Natuurlijke Taalverwerking

Natuurlijke Taalverwerking Wat is een grammatica Verzameling regels (en een woordenboek) die de grammaticale zinnen van een taal beschrijven Doelstelling 1: (automatisch) bepalen of een zin grammaticaal is (d.w.z. voldoet aan de regels van de grammatica)) of niet. Doelstelling 2: Structuur (constituenten, betekenis) toekennen aan zinnen van de taal. Natuurlijke Taalverwerking

Context-vrije grammatica Regels: S --> NP VP NP --> Det A N VP --> V VP --> V NP Woordenboek: Det --> een N --> voorbeeld A --> eenvoudig V --> is NP --> dit Natuurlijke Taalverwerking

Dit is een eenvoudig voorbeeld NP VP V NP Det A N eenvoudig Dit is een voorbeeld Natuurlijke Taalverwerking

FSA versus CFG: 1. recursieve regels Sommige talen of zinsconstructies zijn niet met een Finite state Grammatica (reguliere expressies) te beschrijven: AN BN : een aantal A’s, gevolgd door hetzelfde aantal B’s. S --> a S B S --> a b Natuurlijke Taalverwerking

FSA versus CFG: 1. Recursieve regels Recursieve regels zijn in grammatica’s heel gewoon: een dun iel dom oud boompje een huis met tuin in Haren in de dorpskern N --> A N N --> N PP Niet iedere recursie is echt nodig: macro(np, [det, a*, n, pp*]). pas wel op dat pp niet een macro mag zijn waarin np voorkomt Natuurlijke Taalverwerking

FSA versus CFG: 1. Recursieve regels Problemen ontstaan bij `center-embedding’: recursie die in het midden van een regel optreedt: de fotograaf die de vrouw fotografeerde NP --> Det N Pronoun NP V (ik ken) de fotograaf die de vrouw die de man die de hond die de kat achtervolgde zag kust fotografeerde,…. (Probleem: zinnen met ‘center-embedding’ zijn zeer moeilijk te verwerken Natuurlijke Taalverwerking

FSA versus CFG: 2. Structuur NP --> Det N, N --> A N, N --> N PP macro(np,[det,a*,n,pp*]) Grammatica’s zijn equivalent in zwakzwakke generatieve kracht: ze accepteren dezelfde strings. Niet equivalent in sterke generatieve kracht: CFG levert constituent-structuur op (boompjes), FSA niet. (syntactische) ambiguiteit is onzichtbaar in FSA Natuurlijke Taalverwerking

FSA versus CFG: 2. Structuur VP --> V NP VP --> VP PP An eet rijst met een vork NP --> NP PP An eet rijst met kip macro(vp,[v,np,pp*]) Natuurlijke Taalverwerking

FSA versus CFG: 2. Structuur VP PP VP VP eet rijst met een vork NP V eet NP PP rijst met kip Natuurlijke Taalverwerking

Natuurlijke Taalverwerking Voorbij CFG CFG met features (kenmerken, attributen) en unificatie voorbeelden: Definite Clause Grammar, Unificatie Grammatica. Transformationele grammatica is te lastig voor computationele doeleinden: weinig formele precisie lastig voor automatisch ontleden Natuurlijke Taalverwerking

Natuurlijke Taalverwerking Voorbij CFG De taal WW (een rij woorden gevolgd door dezelfde rij woorden) is niet context-vrij: aabcccaabccc Nederlandse werkwoordsclusters vertonen vergelijkbare ‘cross-serial dependencies’: dat Peter Hans Cecilia de kraanvogels zag helpen fotograferen Natuurlijke Taalverwerking