Betekenis 2: Compositionaliteit, bereik en lambda’s

Slides:



Advertisements
Verwante presentaties
Redekundig ontleden Over waarom, wat en hoe....
Advertisements

Voorstellen van en redeneren over kennis
Les 2 klassediagrammen II
Visual Knowledge Building
Schema en synthese van een zakelijke tekst
Natuurlijke-Taalinterfaces
Missie Omgeving Identiteit Waarden & Overtuigingen Vaardigheden
Practica Computerlinguistiek Tekst en uitleg:
Persoonlijk worden.
Toetsen en leerlijnen in nieuwe scheikunde
Taal en cognitie: Optimaliteitstheorie Henriëtte de Swart.
Inleiding taalwetenschap
Sociolinguïstiek Bijeenkomst 3.
Zakelijk lezen Nederlands.
24 juni 2003Johnson en Morrill in Israel Een studie naar de Johnson Morrill Hypothese in relatie tot de Hebreeuwse taal; implementatie van bewijsnetten.
Compositionaliteit, bereik en lambda’s
Meer over kwantoren.
De studie van betekenis
Taal en logica Over het gebruik van eerste orde propositie/predikatenlogica voor de analyse van natuurlijke taal.
Semantiek 1.
COMPUTATIONELE REPRESENTATIONELE THEORIE VAN HET DENKEN
Syntaxis 2.
Grammaticale modellen
Taalwetenschap in de CKI-bachelor
Opdracht 2. premisse: het Nederlandse over in contexten waarin het vertaald wordt door about is een instantiatie van de focus-of- attention sense incorrecte.
En wat doet taalkunde in het programma van CKI?
Natuurlijke-Taalinterfaces week 3 1. evaluatie van een formule in een model 2. vraag-antwoord dialogen 3. Modellen en applicaties.
Definite Clause Grammar
Categoriale Grammatica
Natuurlijke-Taalinterfaces week 5 Lambda-termen en Lambda-conversie.
Natuurlijke taalverwerking week 4
AI91  Het Probleem  Grammatica’s  Transitie netwerken Leeswijzer: Hoofdstuk AI Kaleidoscoop College 9: Natuurlijke taal.
Inleiding Kennistechnologie §Hoofdstuk 7: Kennisrepresentaties 1: Eigenschappen en representatievormen §Hoofdstuk 8: Kennisrepresentaties 2: Eenvoud en.
Natuurlijke-Taalinterfaces Week 7 Discourse Representation Theory.
Parsing: Top-down en bottom-up
Begrip B Een handeling uit vrije wil is een handeling waarin tot uitdrukking komt wat de handelende persoon zelf belangrijk vindt. Om een vrije wil te.
STOF PW hst. 3 Fictie vertelstandpunten
Inleiding CIW 2008 Analysecollege 1. Analysevraag 1 Bekijk de reclame van Bol.com waarbij mensen vragen naar een bepaalde film, maar vervolgens een product.
Semantische Interpretatie Jurafsky & Martin (Ed. 1): Hoofdstuk 15
MET DANK AAN COLLEGA’S IN DEN LANDE ! vee 2012
Conventies en protocol. Syntaxis en semantiek.
Programma Structuur Diagrammen (PSD’s)
Visie & Strategie.
ABC formule Algemeen Voorbeeld: Herleid naar: Nu volgorde veranderen:
Taal en logica Over het gebruik van eerste orde propositie/predikatenlogica voor de analyse van natuurlijke taal.
Semantische Complexiteiten van Natuurlijke Taal Cf. Jurafsky & Martin, Ed. 1: Sectie 14.4 (Ed. 2: Sectie 17.4)
Semantiek De studie van betekenis. Vragen Wat is betekenis? Betekenis van wat?
Instructie Programmeren Task 7
Syntaxis 1. Inleiding: Combinaties Combinaties op verschillende niveaus: Lettergrepen als combinaties van fonemen. (College 3,4) Woorden als combinaties.
Zinnen 1 Henriëtte de Swart.
Madagaskar is een eiland in de Indische Oceaan, 430 km van Mozambique. Zo’n 2000 jaar geleden zetten de eerste bewoners ‘voet aan wal’ op dit eiland.
Loopbaan oriëntatie en begeleiding
Leerstijlen KOLB SJM.
Loopbaan oriëntatie en begeleiding
Een methode voor het werken met ‘radicale’ opvattingen
Rapportagetechniek Wat moet er in een voorwoord?
Rapportagetechniek Wat moet er in een voorwoord?
Een onderdeel van neuro linguistic programming
Plancyclus, les 4  Actualiteit  Vragen naar aanleiding van vorige les  Vragen over hoofdstuk 4 en 5  Observeren met een plan; het verschil tussen observeren.
Didactiek rondom practicumverslagen: Inhouden, werkvormen en materialen voor de lerarenopleidingen Gerald van Dijk, Hogeschool Utrecht W. Kuiper, H. Eijkelhof,
Jan Engelen & Nicole Goossens 13 oktober 2010 Woordenschat en Tekstbegrip Onderzoek op de basisschool.
De lidwoorden Kleine woorden met grote gevolgen!! Welke ken je? (ne en fa du)
TAAL BIJ TOETSEN Extra uitleg bij een aantal lastige kwesties.
Les 1. Wat voor les krijgen we nu? Tijdens de lessen over hoofdstuk 9, 10 en 11 krijg je op een andere manier les. Het doel is om je zelfstandigheid te.
Berekening van de Orde Van een Algoritme
Modelleren en Programmeren voor KI Practicumopdracht 4: SAT Solver
Basics over communicatie
Natuurlijke-Taalinterfaces
College 7: Kennisrepresentatie (I)
Automatisch redeneren en stellingen bewijzen
Transcript van de presentatie:

Betekenis 2: Compositionaliteit, bereik en lambda’s Henriëtte de Swart

onderwerpen Vorige keer: predikaatlogica, vertaling van zinnen. Dit keer: uitbreiding van de predikaatlogica met lambda’s, interne structuur van zinnen, compositionaliteit, kwantoren en bereik, idiomen.

Stof van vandaag J&M hoofdstuk 18, maar niet 18.4 en 18.5 J&M Hoofdstuk 17, sectie 17.3.3

Meer dan woorden… Hoe wordt de betekenis van complexe gehelen (constituenten, zinnen) opgebouwd uit die van woorden? ‘Jan slaat Piet’  ‘Piet slaat Jan’ Woordvolgorde  Subject-Object relatie  Agens-Patiens relatie.

Compositionaliteit Principe van Compositionaliteit van betekenis (Frege): de betekenis van het geheel is een functie van de betekenis van de samenstellende delen en van de manier waarop ze zijn samengesteld. zinsbetekenis = woordbetekenis + structuur Dus: semantiek altijd afhankelijk van syntaxis.

Ambiguïteiten Ambiguë woorden: bank, baan. Structurele ambiguïteiten: Jan zag de man met de verrekijker. 2 betekenissen ~ 2 syntactische structuren. Bereiksambiguïteiten: Er hing een vlag bij iedere ambassade. 1 vlag of evenveel vlaggen als er ambassades zijn. Structurele ambiguïteit?

Semantische representaties Semantische representaties worden geformuleerd in logische talen (b.v. 1e orde propositie/predikatenlogica). Logische talen respecteren principe van compositionaliteit: regels voor interpretatie volgen regels voor wffs.

Probleem I Syntaxis natuurlijke taal  syntaxis 1e orde predikaatlogica. Eerste orde predikaatlogica is niet voldoende om alle natuurlijke taaluitdrukkingen te representeren. Concreet: modificatie, kwantificatie over predikaten, tweede orde kwantoren.

Modificatie Joost is een Nederlandse taalkundige T(j)  Nl(j) Pim is een grote muis/ een kleine olifant Niet: M(p)  Gr(p) Niet: O(p)  Kl(p)

Kwantificatie over eigenschappen Jan heeft alle eigenschappen van Sinterklaas. P [P(s)  P(j). Geen eerste orde logica! In eerste orde logica alleen predikaat constanten (geen predikaatvariabelen).

Tweede orde kwantoren Alle studenten houden van taalkunde. x [St(x)  Hvt(x)] De meeste studenten houden van taalkunde. Niet: Mx [St(x)  Hvt(x)] waarom niet? Niet: Mx [St(x)  Hvt(x)] waarom niet?

Probleem II Probleem: syntaxis van natuurlijke taal syntaxis van propositie/ predikatenlogica. Is het wel mogelijk om een compositionele interpretatie van natuurlijke taal te geven m.b.v. deze logica’s?

1e orde logic en compositionaliteit Zinnen met individuele constanten/ variabelen: compositionele vertaling . Hanna slaapt. Hanna slaapt (S) S(h) / \ / \ Hanna h Slaapt S h S (NP) (VP) functie applicatie

Kwantoren en compositionaliteit Zinnen met kwantoren: geen compositionele vertaling. B.v. Iedere student danst. Iedere student danst (S) xS(x)D(x) / \ Iedere student Danst D (NP) (VP) / \ Iedere ?? student S (Det) (N)

Kwantoren en compositionaliteit Zinnen met kwantoren: geen compositionele vertaling. B.v. Iedere student danst. Iedere student danst (S) xS(x)D(x) / \ Iedere student ?? Danst D (NP) (VP) / \ Hoe komen we Iedere ?? student S compositioneel (Det) (N) van hier naar daar?

Lambda abstractie Gebruik van lambda abstractie maakt het mogelijk semantische representaties te geven voor delen van een syntactische boom, zodat we een compositionele vertaling van de zin kunnen geven. Lambda abstractie ook met 2e orde logica.

Essentie 1-plaatsige predikaten (praten, dansen, student,…) denoteren verzamelingen. Vertaling als predikaat: hoofdletters (P, D,S,…). Vertaling als lambda abstract: xP(x).  bindt individuele variabele x.  pikt alle waarden van x eruit die de formule P(x) waar maken, en definieert daarmee de verzameling van P’s (karakteristieke functie).

Lambda’s: formeel Als  een formule is, en x een variabele (die normaliter voorkomt in ), dan is ||x||M, g die functie h van het universum U naar {0,1} zodanig dat voor alle individuen e in U, h(e) = 1 als ||x||M, g[x/e] = 1, en h(e) = 0 anders.

Lambda conversie Toepassing van lambda abstract op constante/variabele leidt tot lambda conversie: [x S(x)](h) = S(h) x S(x): 1-plaatsig predikaat. Functie applicatie: toepassen op individuele constante h. Lambda conversie: deletie van  en vervanging van x door h.

 conversie: formeel Voor  een open propositie, en x een individuele variabele die voorkomt in , en c een individuele constante, dan x (c)  [c/x], waar [c/x] is de formule  met vervanging van alle voorkomens van x door c.

Compositionaliteit met  Hanna slaapt Hanna slaapt (S) xS(x)(h) = S(h) / \ functie applicatie Hanna h Slaapt xS(x) (NP) (VP)

Abstractie over predikaten Een kleine olifant x (K(O))(x). een kleine olifant (NP) x(K(O))(x) / \ een ?? kleine olifant (A(N)) yK(O)(y) / \ functie applicatie kleine (A) olifant (N) PyK(P)(y) O

NPs als verzameling eigenschappen Hanna: h (individuele constante) Hanna: P P(h) (bundel eigenschappen Hanna slaapt: S(h) Slaapt(Hanna): x S(x)(h) = S(h) ‘Hanna is een slaper.’ Hanna(Slapen): P P(h)(Slapen) = S(h) ‘Slapen is een eigenschap van Hanna.’

Lambda’s met kwantoren Iedereen danst x D(x) Kwantoren verwijzen niet naar een vast individu, dus geen representatie als constante, maar: P x P(x) ‘Dansen is een eigenschap van iedereen.’ P x P(x)(Dansen) = x D(x)

Compositionaliteit met kwantoren Iedere student danst (S) xS(x)D(x) / \ Iedere student ?? Danst D (NP) (VP) / \ Iedere ?? student S (Det) (N)

Compositionaliteit met kwantoren Iedere student danst (S) xS(x)D(x) / \ Iedere student Danst Qx[S(x)Q(x)] yD(y) / \ Iedere student zS(z) PQx[P(x)Q(x)]

Tweede orde kwantoren De meeste studenten dansen De meeste: PQ[|PQ| > |P-Q|] Relatie tussen twee verzamelingen: abstractie over twee predikaten.

Reflexieven I Zichzelf: RxR(x,x), waarbij R een 2-plaatsige relatie. Hanna bewondert zichzelf. Zichzelf bewonderen: RxR(x,x)(Bewonderen) = xB(x,x) Hanna bewondert zichzelf: xB(x,x)(h) = B(h,h).

Reflexieven II Iedereen bewondert zichzelf. Zichzelf bewonderen: RxR(x,x)(Bewonderen) = xB(x,x) Iedereen: PyP(y). Iedereen bewondert zichzelf: PyP(y)(xB(x,x)) = yB(y,y)

Van buiten naar binnen Mo kust Peter  Peter kust Mo. yx Kussen(y)(x)(p) = x Kussen(p)(x) Eigenschap ‘Peter kussen’ x Kussen(p)(x)(m) = Kussen(p)(m) Kussen(p)(m) = Kussen(m,p) ‘Mo kust Peter’

Van buiten naar binnen Mo kust Peter  Peter kust Mo. xy Kussen(y)(x)(p) = y Kussen(y)(p) ‘gekust worden door Peter’ y Kussen(y)(p)(m) = Kussen(m)(p) Kussen(m)(p) = Kussen(p,m) ‘Peter kust Mo’ Recursieve toepassing van lambda conversie: Currying

Passief constructie Actieve vorm van het werkwoord: yx Kussen(y)(x) ‘kussen’ Passieve vorm van het werkwoord: xyKussen-(x)(y) ‘gekust worden door’ Lexicale operatie: vorm een passief uit een actief.

Semantische verrijking Herschrijfregels verrijken met semantische informatie. Hiermee bepalen hoe de betekenis van het complexe geheel wordt berekend uit de semantische representaties van zijn delen.

Voorbeeld 1 Hanna slaapt S  NP VP {VP.sem (NP.sem)} NP  Hanna {h} VP  slaapt {xS(x)} xS(x)(h) = S(h)

Voorbeeld 2 Iedere student danst S  NP VP {NP.sem (VP.sem)} NP  Det N {Det.sem (N.sem)} Det  iedere {PQx[Px Qx]} N  student {x S(x)} PQx[Px Qx] (x S(x)) = Qx[Sx Qx]

Bereiksambiguïteiten Er wappert een vlag bij iedere ambassade. yx (Vlag(y) & Amb(x)  Wapper(x,y)) xy (Amb(x)  Vlag(y) & Wapper(x,y)) Wat voor soort ambiguïteit is dit?

Direct bereik Iedere ambassade > een vlag. Combineer een vlag met predikaat wapperen, daarna iedere ambassade. Qx[Amb(x)Q(x)] z[y [Vlag(y) & Wap(z,y)]] x[Amb(x) y [Vlag(y) & Wap(x,y)]]

Omgekeerd bereik Een vlag > iedere ambassade. Combineer iedere ambassade met predikaat wapperen, daarna een vlag. Py [Vlag(y) & P(y)] zx [Amb(x)  Wapperen(x,z)] y [Vlag(y) & x [Amb(x)  Wap(x,y)]]

Bereiksambiguïteiten Syntactische aanpak: postuleer niveau van syntactische representatie (Logical Form) waarop kwantorbereik wordt gedisambigueerd (Q-raising). Semantische aanpak: Q-store ~ bewaar interpretatie van deel van de boom. Computationele aanpak: onderspecificatie.

voorbeeld e [Wapperen(e) & Agens(x,e) & Location(y,e)] x [Vlag(x) & Q(x)] y [Ambassade(y)  Q(y)]

Onderspecificatie Compleet over lexicale informatie, en koppeling NPs aan argumentposities (wat wappert waar), maar ondergespecificeerd over relatieve volgorde kwantoren in semantische representatie. Alle mogelijke lezingen kunnen worden gegenereerd.

Constraint-based aanpak Generalisatie van onderspecificatie kwantoren naar bredere set gevallen, b.v. negatie (‘iedere student is niet rijk’), intensionele werkwoorden (‘Jan wil een Spaanse taalkundige trouwen’). Toevoeging van beperkingen (constraints) op mogelijke interpretaties.

Hole-semantics Vervang lambda’s door ‘gaten’ (holes). Gebruik labels ipv lambda conversie. Gebruik dominance constraints om te bepalen welk label welke ‘hole’ mag vullen.

voorbeeld Er wappert een vlag bij iedere ambassade. l3: e [Wap(e) & Agens(x,e) & Loc(y,e)] l1: x [Vlag(x) & h1] l2: y [Amb(y)h2] l1  h0, l2  h0 l3  h1 l3 h2.

Labels inpluggen Plug in labels P(h0) = l1 of P(h0) = l2 om h0 te bereiken als gedisambigueerde representatie. Methode gebruikt in computationele semantiek (Blackburn & Bos 2005). Elk onderdeel van formule kan ‘hole’ worden, dus generalisatie over constructies.

Idiomen Voorbeelden: Nederlands: geen kaas gegeten hebben van iets ~ niet veel weten van iets Engels: kick the bucket ~ dood gaan

Meer idiomen Russisch: sobaku sjest' na chem-to = hond eten op iets ~ ervaring hebben in iets Frans: sucrer les fraises = de aarbeien suikeren ~ beven, kinds zijn. Russisch: sobaku sjest' na chem-to = hond eten op iets ~ ervaring hebben in iets Frans: sucrer les fraises = de aarbeien suikeren ~ beven, kinds zijn.

Idiomen in taalkundige theorie Probleem: geen letterlijke betekenis, geen compositionele interpretatie. Oplossing: toevoegen van specifieke semantische verrijking aan bepaalde constituenten. VP  kaas gegeten hebben van iets {yx [veel_weten(y)(x)]

Conclusies -abstractie en -conversie maken het mogelijk delen van de syntactische boom te interpreteren. Handhaving principe van compositionaliteit. Toepassing op andere verschijnselen: reflexiviteit, passiefvorming, bereik.

Conclusies Bereiksambiguïteiten vormen lastig probleem voor taalkundige theorie, omdat ze niet te herleiden zijn tot lexicale/structurele ambiguïteiten; onderspecificatie. Idiomen vormen probleem voor compositionele interpretatie.