Taaltheorie en Taalverwerking Parsing Continued. Totnutoe: Top-Down-Parser.

Slides:



Advertisements
Verwante presentaties
SaH L5/L4 2 3 stap naar jury voor inspectie Stap en draf naar pion 2
Advertisements

Week 9: Probabilistische Grammatica's Jurafsky & Martin (ed. 1), Hoofdstuk 12: Lexicalized and Probabilistic Parsing) Taaltheorie en Taalverwerking Remko.
Gerund = WW. gebruikt als zelfstandig Nw.
Voorbeeld: I walk He walks You walk She walks
The stock market will go up De beurswaarden zullen stijgen YESNO JA NEEN Is Jefken a good person ? Is Jefken een goed mens ? YES NO JA NEEN Is Lonny a.
Vervolg C Hogeschool van Utrecht / Institute for Computer, Communication and Media Technology 1 Een programma opbouwen.
HM-ES-th1 Les 9 Hardware/Software Codesign with SystemC.
Order placed Should be Nederland Netherlands can be removed here, just Scancorner Instead of ‘undefined’ -> ‘geen’ New logo should be displayed here. COUNTS.
Natuurlijke-Taalinterfaces
Social Technographics Hoe ontwikkel je een succesvolle social media strategie? Reineke Reitsma Director, Consumer Technographics Forrester Research 11.
Les 1: Level wattes? RTS FPS TPS Stealth/adventure RPG MMORPG Puzzle Adventure Platform Race Sport Etc… Multiplayer Single Player FFA TDM CTF KOTH.
Conditional Clauses If-zinnen.
Taaltheorie en Taalverwerking Week 4: Parseer-algoritmes.
ETHOS PROJECT: PROGRESS Follow-up & feedback end of year 1.
Vervolg C Hogeschool van Utrecht / Institute for Computer, Communication and Media Technology 1 Onderwerpen voor vandaag Backtracking: –Permutaties –Koninginnen.
Vervolg C Hogeschool van Utrecht / Institute for Computer, Communication and Media Technology 1 Onderwerpen voor vandaag Gelinkte lijsten Finite State.
From: Julia larissa Ian and Maartje.. SCHOON WATER PROJECT Door Julia, larissa, Ian, en Maartje.
Taaltheorie en Taalverwerking Week 3: Syntax van Natuurlijke Taal.
GOVERNANCE & COMPLIANCE ADVISORY Onderzoek kwaliteit beleidsuitvoering vergunningverlening en -handhaving Gemeente Almelo Internal Audit, Risk and Compliance.
San Diego Gesynchroniseerde diapresentatie – Freddy Storm 02/2010 Working all day and the sun don't shine Trying to get by and I'm just killin' time.
Omgevingen zijn dan geïmplementeerd als Symbol Tables. Symbol Table mapt een symbool met een Binding Meerdere noties van binding –Meerdere manieren te.
Kennisacquisitie en - modellering Rogier van Eijk college 2 Modelleren van analysetaken.
en ‘If-zinnen’ (klik hier als je meteen naar If-zinnen wilt.)
1/1/ / faculty of Computer Science eindhoven university of technology 5B040:Computerarchitectuur 2M200:Inleiding Computersystemen Sessie 8(2): Multi-processing.
1/1/ / faculty of Computer Science eindhoven university of technology 5JJ20:Computerarchitectuur 2M200:Inleiding Computersystemen Sessie 7(2): Vertalen.
Neurale Netwerken Kunstmatige Intelligentie Rijksuniversiteit Groningen Mei 2005.
Definite Clause Grammar
Natuurlijke taalverwerking week 4
Probleem P 1 is reduceerbaar tot P 2 als  afbeelding  :P 1  P 2 zo dat: I yes-instantie van P 1   (I) yes-instantie van P 2 als ook:  polytime-algoritme,
AI91  Het Probleem  Grammatica’s  Transitie netwerken Leeswijzer: Hoofdstuk AI Kaleidoscoop College 9: Natuurlijke taal.
Algoritmen en Datastructuren (ALDAT) EVMINX4 Week 6.
GESPRG Les 8 Gestructureerd programmeren in C. 101 Array Meerdere variabelen van hetzelfde type kun je samennemen in één array variabele. Stel in een.
Netwerk Algorithms: Shortest paths1 Shortest paths II Network Algorithms 2004.
Present simple & continuous
HOM - COM Ledenvergadering 08 / 10 / Easeus-Partition-Master- Home-Edition Link software: Master-Home-Edition/ _4-
in de eerste 2 weken na een herseninfarct ?
Automation SolutionsMFG/Pro Dutch usergroup 8 februari 2007 ISA S88 & S95 Het gebruik van deze normen in de productie.
Parsing: Top-down en bottom-up
Tussentoets Digitale Techniek. 1 november 2001, 11:00 tot 13:00 uur. Opmerkingen: 1. Als u een gemiddeld huiswerkcijfer hebt gehaald van zes (6) of hoger,
From computer power and human reason. Joseph Weizenbaum.
Vervolg C Hogeschool van Utrecht / Institute for Computer, Communication and Media Technology 1 Onderwerpen voor vandaag GUI  command line redirection.
ANTWOORDEN DIAGNOSTISCHE TOETS MODELOMGEVING. Syntaxis = Syntaxis (van het Oudgriekse συν- syn-, "samen", en τάξις táxis, "regeling") is binnen de theoretische.
Derde blok. Februari - April
Deltion College Engels B2 Schrijven [Edu/004] thema: (No) skeleton in the cupboard can-do: kan een samenhangend verhaal schrijven © Anne Beeker Alle rechten.
Deltion College Engels C1 Luisteren [Edu/001] thema: It’s on tv can-do : kan zonder al te veel inspanning tv-programma’s begrijpen.
Deltion College Engels B2 Gesprekken voeren [Edu/006]/subvaardigheid schrijven notulen en kort voorstel thema: ‘What shall we do about non- active group.
Deltion College Engels C1 Gesprekken voeren [Edu/006] thema: ‘I was wondering what you think of…’ can-do : kan deelnemen aan de conversatie bij zeer formele.
Writing exercise This one goes into your language portfolio!!! You have until the end of the week to hand it in… (So you have a little longer than it says.
Taaltheorie en Taalverwerking Week 5: – Natuurlijke Taal Syntax. (Uitbreiding op CFG: Features.) – Human Parsing: Center-Embedding.
Semantische Interpretatie Jurafsky & Martin (Ed. 1): Hoofdstuk 15
MET DATA WERELDKAMPIOEN Tjerk Smeets – 13 juni 2013 – InfraTrends Congres.
Lesson 9.
Lesson 3 PPTs komen op: Extra English Lesson 3 PPTs komen op:
Extra English Lesson 9 - recap.
PROJECTMANAGEMENTPROJECTMANAGEMENT Assesment CMM RM:Requirements Management PP: Project Planning PTO: Project Tracking & Oversight SSM:Software Subcontract.
Klokkijken! Hele uren: It’s one o’clock. It’s four o’clock.
SaH L5 / L4 stap 3 meter, overgang naar jog, cirkel li, rond pion naar jury. Halverwege terug naar stap, stop en back up. stap naar jury voor inspectie.
HAN-University Inleiding tot VHDL, 2010 Bron: Fraunhofer for Integrated Circuits.
Nu maken en controleren, Alles inleveren
Photos do not lie. We are having a wonderful time. Foto’s liegen niet! Wij hebben het heel erg naar ons zin.
1/1/ / faculty of Computer Science eindhoven university of technology 5B040:Computerarchitectuur 2M200:Inleiding Computersystemen Sessie 9(2): Virtual.
Rotary Days Planned September Rotary Days can take any form, as long as they are fun and appealing to the non-Rotary public. Here are just a few.
EML en IMS Learning Design
TO INSERT OR REMOVE THE COBRANDING BOX 1.To do this you need to use the ‘slide master’ 2.Go to the ‘View’ tab on the toolbar 3.Select ‘Slide master’, this.
Plan Coordination by Revision in Collective Agent Based Systems Adriaan ter Mors en Gijsbert Deelder Plan Coordination by Revision in Collective.
Computertechniek Hogeschool van Utrecht / Institute for Computer, Communication and Media Technology 1 C programmeren voor niet-C programmeurs les 2 definitie.
Ant Systems for dynamic problems. Ants caught in a traffic jam Casper Joost Eyckelhof.
Rule-based tic-tac-toe Andreas van Cranenburgh,
Parsing 1. Situering Contextvrije grammatica’s Predictive (of recursive-descent) parsing LR-parsing Parser generator: Yacc Error recovery 2.
Deltion College Engels C1 Lezen [Edu/002]/ subvaardigheid schrijven thema: Hwaet! (Old) English literature can-do: kan snel belangrijke detailinformatie.
Transcript van de presentatie:

Taaltheorie en Taalverwerking Parsing Continued

Totnutoe: Top-Down-Parser

Waarom is de Top-Down-Parser niet goed genoeg?

Het probleem van Natuurlijke-Taal-Verwerking:

Waarom is de Left Corner Parser niet goed genoeg? Het probleem van Natuurlijke-Taal-Verwerking: Ambiguïteit

"Inhoudelijk" (syntactisch/semantisch/pragmatisch) probleem: Welke interpretatie te kiezen?

Ambiguïteit "Inhoudelijk" (syntactisch/semantisch/pragmatisch) probleem: Welke interpretatie te kiezen? Computationeel probleem: Hoe te zorgen dat alle analyses beschouwd worden?

Ambiguïteit als computationeel probleem: Hoe te zorgen dat alle analyses beschouwd worden? Hoe gaat dat bij de Left-Corner Parser? Back-tracking

Ambiguïteit als computationeel probleem: Hoe te zorgen dat alle analyses beschouwd worden? Hoe gaat dat bij de Top-Down-Parser? Back-tracking Voordeel: heel overzichtelijk. Nadeel: inefficiënt.

Duplication of effort in the Top-Down-Parser [J&M Fig ] als gevolg van locale ambiguïteit. Cf.: "KLM redirected a flight from Indianapolis to Houston."

Nu: Efficiënt parseren: de Earley parser.

Russell & Norvig, pp Martin & Jurafsky, pp De Earley parser. Nieuw idee: Alle tussenresultaten bewaren ("dynamic programming")

Chart-parsing: Alle tussenresultaten bewaren. Wellformed substring table. Put the students in section 2 of Computer Science 101 in room 6. V NP PP

Chart-parsing: Alle tussenresultaten bewaren. Put the students in section 2 of Computer Science 101 in room 6. V NP PP S SS

Earley Parser: Left-corner parsing met "active chart". Combinatie van top-down en bottom-up. Top-down proces: Predictor Bottom-up proces: Scanner Extender

Predictie-proces: Left-corner: S  NP VP NP  det N

Predictie-proces: Left-corner: S  NP VP NP  det N Stel: det herkend

Predictie-proces: Left-corner: S  NP VP NP  det N [det herkend]

Predictie-proces: Left-corner: S  NP VP NP  det N Stel: det herkend; N herkend.

Predictie-proces: Left-corner: S  NP VP NP  det N Stel: det herkend; N herkend.

Active chart. Niet alleen: alle tussenresultaten bewaren. Ook: alle partiële tussenresultaten bewaren. Boekhouding over wat er nog gedaan moet worden valt samen met het bewaren van de tussenresultaten.

Predictie Put the students in section 2 of Computer Science 101 in room 6. S  NP VP

Predictie Put the students in section 2 of Computer Science 101 in room 6. S  NP VP NP  det N

Predictie Put the students in section 2 of Computer Science 101 in room 6. S  NP VP NP  det N

Predictie Put the students in section 2 of Computer Science 101 in room 6. S  V NP PP

Predictie Put the students in section 2 of Computer Science 101 in room 6. S  V NP PP

Predictie Put the students in section 2 of Computer Science 101 in room 6. S  V NP PP NP  det N

Active Chart bevat: herkende constituenten, b.v.: NP  det N PP gedeeltelijk herkende constituenten, b.v.: NP  det N PP plannen, b.v.: NP  det N PP

Active Chart bevat: herkende constituenten, b.v.: [5, 10, NP  det N PP ] gedeeltelijk herkende constituenten, b.v.: [5, 7, NP  det N PP ] plannen, b.v.: [5, 5, NP  det N PP ]

Chart parsing Begintoestand: (Plan:) [0, 0, S'  S ] Doel: (S die de hele zin omvat:) [0, n, S'  S ]

Start Put the students in section 2 of Computer Science 101 in room 6. S'  S

Put the students in section 2 of Computer Science 101 in room 6. S'  S Doel

Earley Parser Acties: Top-down agenda-expansie: Predictor Woordsoort checken: Scanner Succes propageren (bottom-up): Completer (Extender)

Earley Parser Main: Chart:= leeg Add-edge(0,0, S'  S) For all words do: Scanner Return (chart)

Earley Parser Main: Chart:= leeg Add-edge(0,0, S'  S) For all words do: Scanner Return (chart) Add-Edge(e) If e nog niet in chart then voeg e toe If e heeft de dot helemaal rechts then Extender(e) else Predictor(e) ( e = i,j, A  BC )

Earley Parser Top-down expansie: Predictor (i, j, A ... B...) Voor alle regels B   : Add-edge(j,j, B  )

Earley Parser Scanner (j, word) [Zoekt de woordsoort (“part-of-speech”) van word op, en geeft dat door aan alle edges die dat kunnen gebruiken.] Voor alle woordsoorten B van word: Voor alle edges van de vorm [i,j, A ... B...]: Add-Edge(i, j+1, A ... B...)

Earley Parser Extender (j, k, B ... ) Propageer succes: ["Move the dot" voor edges die vragen om de non-terminal B.] Voor alle edges van de vorm [i,j, A ... B...]: Add-Edge(i, k, A ... B...)

Opdracht van deze week: Maak een Earley-parser in Prolog

Deeltentamen over blok a in de tussentoets-week