1. Parsing (epsilon’s, tabellen) 2. Unificatie grammatica Natuurlijke taalverwerking week 7.

Slides:



Advertisements
Verwante presentaties
Redekundig ontleden Over waarom, wat en hoe....
Advertisements

Grammar Chapter 4 – G3 Aangeplakte vragen = Question tags.
Week 9: Probabilistische Grammatica's Jurafsky & Martin (ed. 1), Hoofdstuk 12: Lexicalized and Probabilistic Parsing) Taaltheorie en Taalverwerking Remko.
Communicatie & Presentatie
Instructie Programmeren Task 1 5JJ70. Task 1.1: Hello World •Klik naast de laatste accolade in de grijze kantlijn om een breakpoint neer te zetten, anders.
Natuurlijke-Taalinterfaces
Databases via internet
Taaltheorie en Taalverwerking Week 4: Parseer-algoritmes.
Instructie grammatica
OM EVEN OVER NA TE DENKEN.
Op een dag besloot een universiteitsprofessor zijn studenten uit te dagen.
HTML Les 1: Introductie HTML
Datastructuren Analyse van Algoritmen en O
Instructie Programmeren Task 1 5JJ70. Task 1.1: Hello World Klik naast de laatste accolade in de grijze kantlijn om een breakpoint neer te zetten, anders.
Taalkunde Grammatica A
Reductie van aantal OOV- woorden dmv lexiconuitbreiding Vincent Vandeghinste Centrum voor Computerlinguïstiek KULeuven.
Compositionaliteit, bereik en lambda’s
Taalwetenschap in de CKI-bachelor
Chapter 9. Understanding Multivariate Techniques
Definite Clause Grammar
Natuurlijke Taalverwerking 3e trimester 98/99 docent: Gosse Bouma.
Natuurlijke Taalverwerking
Categoriale Grammatica
College 3: Feature Geometry eerste uur: lineaire fonologie  non-lineaire fonologie probleem: verantwoording assimilatie tweede uur: procesbeschrijvingen.
Natuurlijke-Taalinterfaces week 5 Lambda-termen en Lambda-conversie.
Hoofdzinnen, bijzinnen, en vraagzinnen in Unificatie Grammatica
Natuurlijke taalverwerking week 4
Natuurlijke Taalverwerking
Dyabola Archäologische Bibliographie Realkatalog (DAI) Zoeken op onderwerp Bibliotheken Verder = klikken.
Inleidend probleem Data structuur (hiërarchie van classes)
AI91  Het Probleem  Grammatica’s  Transitie netwerken Leeswijzer: Hoofdstuk AI Kaleidoscoop College 9: Natuurlijke taal.
Functies als Getallen Jan Martin Jansen.
Logaritmen (heel eventjes)
Ontleden nNon-deterministisch m.b.v. Parser-combinators nDeterministisch m.b.v. Stack-machine type Parser a b = [a]  [ (b, [a]) ] type Parser a b = [a]
Idee Generatie Wit Papier, Warcraft 3, Thrall, Hoofdpijn, denken, rare les, Karel aan het ijsberen, Schrijven, Opdracht, Schaken, Stappen, Oplichten, Vooruit.
Parsing: Top-down en bottom-up
Orientatie Alfa-informatica Computer-taalkunde Gosse Bouma
Unificatie grammatica
Hogeschool HZ Zeeland 19 augustus 2003augustus 2003 Data Structuren & Algoritmen Week 3.
Hulpmiddelen bij presenteren. Controleer van tevoren altijd of de apparatuur die je wilt gebruiken aanwezig is, of je er gebruik van mag maken en of je.
ANother Tool for Language Recognition
T U Delft Parallel and Distributed Systems group PGS Fundamentele Informatica in345 Deel 2 College 3 Cees Witteveen.
Taaltheorie en Taalverwerking Week 5: – Natuurlijke Taal Syntax. (Uitbreiding op CFG: Features.) – Human Parsing: Center-Embedding.
Semantische Interpretatie Jurafsky & Martin (Ed. 1): Hoofdstuk 15
MET DANK AAN COLLEGA’S IN DEN LANDE ! vee 2012
Taaltheorie en Taalverwerking Parsing Continued. Totnutoe: Top-Down-Parser.
Kick de Wolff februari Door Kick de Wolff Kick de Wolff februari 2012.
Bezoekersgerichte teksten
Werken in K.U.Loket Syllabi. 1 ZoekmogelijkhedenVolledige lijst opvragen is ook mogelijk, maar kan lang duren Start in K.U.Loket de toepassing “mijn syllabi”
MIDI Wat is het? En wat kan je er mee?. Wat het is. MIDI staat voor Musical Instrument Digital Interface. Het is een bestandsformaat dat als het ware.
Samenvatting hst. 3 sec. 1-3 ( ) :: Parser a b  Parser a b  Parser a b ( ) :: Parser a (b  c)  Parser a b  Parser a c ( ) :: (b  c)  Parser a b.
Tentamen vraag 1 Als L en M talen zijn, dan nL  M is gelijk aan { s  t | s  L, t  M } nL M is gelijk aan { s t | s  L, t  M } nL n is gelijk aan.
Parsing 1. Situering Contextvrije grammatica’s Predictive (of recursive-descent) parsing LR-parsing Parser generator: Yacc Error recovery 2.
Spelling werkwoorden Denk – dacht schets - schetste Ontwerp – ontwierp
MBR AtT1 College 9 Diagnose met correctmodellen. Verdieping in de formalisatie. In reader: Characterizing diagnoses and Systems J. de Kleer, A.
Instructie Programmeren Task 7
Syntaxis 1. Inleiding: Combinaties Combinaties op verschillende niveaus: Lettergrepen als combinaties van fonemen. (College 3,4) Woorden als combinaties.
Les 0 Structured Query Language SQL. Programma Les 0 – Introductieopdracht Les 1 Les 2 Les 3 Schriftelijke toets.
Zoeken naar Constructies Jan Odijk DRONGO Taalfestival Utrecht,
Lezing ATU’s Tilburg 12 mei 2015
Recursie…. De Mandelbrot Fractal De werking… De verzameling natuurlijke getallen… 0 ∞-∞
Hoe maak ik een PowerPoint presentatie?
Efficiënt werken met Adlib voor eindgebruikers
Hoe maakt u de juiste keuze?. Drie populaire begrippen die bij elke demonstratie genoemd worden…
Wat is SQL (1)? SQL (Structured Query Language):  is een zeer krachtige taal met een beperkt vocabulaire (aantal ‘woorden’)  is declaratief (‘WAT’ niet.
Wilt u een embleem opdruk op uw kleding, bedrijfskleding of werkkleding? Met een bestaand plaatje of logo, of iets wat u zelf heeft gemaakt of samengesteld?
Een beschouwing schrijven
Natuurlijke-Taalinterfaces
Software Development fundamentals
HTML5 introductie.
Transcript van de presentatie:

1. Parsing (epsilon’s, tabellen) 2. Unificatie grammatica Natuurlijke taalverwerking week 7

Natuurlijke Taalverwerking2 Shift-reduce algoritme

Natuurlijke Taalverwerking3 shift-reduce algoritme Stapel/Stack: hierop staan tussenresultaten. Shift-actie : Verwijder het meest linkse woord uit de invoer, en plaats de categorie van het woord op de stapel Reduce-actie: Vervang C 1 …C n op de stapel door C 0 als er een regel C 0 --> C 1 …C n bestaat.

Natuurlijke Taalverwerking4 Bottom-up voordeel: links-recursie is geen probleem, omdat je vanuit de woorden begint. Het aantal woorden is altijd eindig… nadeel: epsilon-regels (det --> e) shift(Invoer,Invoer,det). Je kunt eindeloos categorieën aan de stapel toevoegen, zonder dat de invoer korter wordt…...

Natuurlijke Taalverwerking5 Epsilon’s leiden tot een eindeloze ’reduce’-actie.

Natuurlijke Taalverwerking6 Epsilon’s in bottom-up parsing det --> [] np --> det n np --> n het effect van epsilon’s kan ook bereikt worden door extra regels toe te voegen:

Natuurlijke Taalverwerking7 Wegwerken van epsilon’s Voor alle epsilon-regels C --> [] en alle regels M --> C 1 …C i,C,C j …C n, voeg toe M --> C 1 …C i,C j …C n, De epsilon-regels zijn nu overbodig. Een boomstruktuur met epsilon’s kan aan de afgeleide regels worden toegevoegd.

Natuurlijke Taalverwerking8 Nadelen van backtracking (dat) zij een student met een gsm, een mountainbike, en een PC met modem kent. zij is NP[mv] of NP[enk] Kiest een shift-actie voor NP[mv], dan wordt eerst de hele complexe NP correct ontleed, waarna via backtracking de juiste mogelijkheid NP[enk] gezocht moet worden, en de NP erna nogmaals ontleed moet worden.

Natuurlijke Taalverwerking9 Unificatie-grammatica Voordelen van definite clause grammar: –categorieen kunnen complexe structuren (features, bomen, semantiek) bevatten –unificatie Nadelen: –omslachtige notatie, –slechte leesbaarheid.

Natuurlijke Taalverwerking10 Taalkunde: Features sonorant - stemhebbend + nasaal - labiaal + alveolair - b = N + V - bar-level 2 NP = b = phon(-,+,-,+,-) np = cat(+,-,2)

Natuurlijke Taalverwerking11 Feature structuren bar 0 headcat v vform fin subj head cat n casenom agrper1 numpl bar 2 (wij) slapen = 1. recursie (feature structuur als waarde)

Natuurlijke Taalverwerking12 Feature structuren (wij) slapen = 2. reentrancy (Prolog-variabelen) subj sem1 sempredslapen arg11

Natuurlijke Taalverwerking13 Unificatie van feature structuren A subsumeert B wanneer B (minstens) alle informatie bevat die A bevat. A is ‘algemener’, B is ‘specifieker’. De unificatie van A en B is de meest algemene structuur C waarvoor geldt: –A subsumeert C en –B subsumeert C. (Unificatie faalt als zo’n C niet bestaat.)

Natuurlijke Taalverwerking14 Subsumptie van feature- structuren bar0 headcatv bar0 headcatv caseacc subsumeert

Natuurlijke Taalverwerking15 subsumptie van feature- structuren subj sem1 sempredslapen arg11 subj sem1 kim sempredslapen arg11 kim subsumeert

Natuurlijke Taalverwerking16 Subsumptie Feature-structuur A subsumeert B als –voor alle features F in A geldt: de waarde van F in A subsumeert de waarde van F in B. –voor alle reentracies in A geldt dat deze ook in B aanwezig is.

Natuurlijke Taalverwerking17 van Noord’s Hdrug een ontwikkelomgeving voor unificatie- grammatica, taal om feature-structuren mee te beschrijven, feature-unificatie (=Prolog term- unificatie) in combinatie met een parser zinnen testen, visualisatie van regels, parse-bomen, etc.