Taaltheorie en Taalverwerking Week 3: Syntax van Natuurlijke Taal
Taaltheorie en Taalverwerking Vorige weken: Formele Talen & Formele Grammatica's
Taaltheorie en Taalverwerking Nu: Toepassing op Natuurlijke Taal
Natuurlijke Taal B.v.: Engels
Opmerking : – Niet alle talen lijken sprekend op 't Engels. – Sommige zijn “makkelijker”: Aboriginal-talen (b.v. Warlpiri), Papoea-talen, Amazone-gebied. – Sommige zijn “moeilijker” (b.v.: Nederlands, Züüritüütsch).
Engels Tamelijk unieke taal: nauwelijks morphologie (verbuigingen, vervoegingen, e.d.) vaste woordvolgorde
Woordvolgorde: Engels vs. Nederlands Jan gaf vanochtend Marie het geld. Jan gaf Marie vanochtend het geld. Jan gaf Marie het geld vanochtend. Vanochtend gaf Jan Marie het geld. * John gave Mary this morning the money. * John gave this morning Mary the money. John gave Mary the money this morning. This morning, John gave Mary the money.
Woordvolgorde: Engels vs. Nederlands Op het dak zag Jan een kat zitten. Jan zag op het dak een kat zitten. Jan zag een kat op het dak zitten. Jan zag een kat zitten op het dak. * On the roof, John saw a cat sitting. * John saw on the roof a cat sitting. * John saw a cat on the roof sitting. John saw a cat sitting on the roof.
Grammatica voor Engels Contextvrije grammatica's als verantwoording van intuïtieve ideeën over constituentenstructuur.
article the noun wumpus copula is S NPVP adjective dead S NP VP NP article noun VP copula adjective VP verb verb walks article the article a noun wumpus noun boy copula is copula was adjective dead adjective happy
article the noun wumpus copula is S NPVP adjective dead Hoe verzin je zoiets?
article the noun wumpus copula is S NPVP adjective dead Hoe verzin je zoiets? (1) Teken de intuïtief correcte hiërarchische structuur.
article the noun wumpus copula is S NPVP adjective dead Hoe verzin je zoiets? (1) Teken de intuïtief correcte hiërarchische structuur. (2) Labelling: Constituenten met dezelfde categorie moeten intersubstitueerbaar zijn.
article the noun wumpus copula is S NPVP adjective dead Hoe verzin je zoiets? (1) Teken de intuïtief correcte hiërarchische structuur. (2) Labelling: Constituenten met dezelfde categorie moeten intersubstitueerbaar zijn. Cognitie: Categorie = klasse van intersubstitueerbare woorden.
article the noun wumpus copula is S NPVP adjective dead Hoe verzin je zoiets? (1) Teken de intuïtief correcte hiërarchische structuur. (2) Labelling: Constituenten met dezelfde categorie moeten intersubstitueerbaar zijn. (3) Linguïstische conventies. [Bestudeer Jurafsky & Martin, Russell & Norvig, ppt-slides van het hoorcollege, uitwerkingen van het werkcollege.]
article de noun man verb ziet S NPVP proper-noun Marie Linguïstische conventies: NP: analogie tussen "de man" en "Marie" VP:analogie tussen "ziet Marie" en "loopt" NP
article de noun man verb ziet S NPVP proper-noun Marie Fout. NP adverb niet
article de noun man verb ziet S NPVP proper-noun Marie Fout. Constituenten met hetzelfde label moeten intersubstitueerbaar zijn. NP adverb niet
article de noun man verb ziet S NPVP proper-noun Marie Beter. NP adverb niet
article de noun man verb ziet S NP VP proper-noun Marie Nog beter. NP adverb niet VP
Martin & Jurafsky 9.4 The Noun Phrase Lexicale NP's: Eigennamen: NP ProperNoun Voornaamwoorden: NP Pronoun Complexe NP's: bestaat typisch uit een Lidwoord (Determiner) gevolgd door een zelfstandig naamwoord (Noun). Daartussen en daarachter kunnen nog allerlei optionele constituenten staan. NP DetP (Card) (Ord) (AP) Noun DetP the | all | all the | many of the | Card 1 | 2 | 3 Ord first | second | last AP Adj | Adv Adj Voorbeeld: "The 3 first very early flights"
M&J 9.4 The Noun Phrase Lexicale NP's: Eigennamen: NP ProperNoun Voornaamwoorden: NP Pronoun Complexe NP's: bestaat typisch uit een Lidwoord (Determiner) gevolgd door een zelfstandig naamwoord (Noun). Daartussen en daarachter kunnen nog allerlei optionele constituenten staan. NP DetP (Card) (Ord) (AP) Nominal Nominal Noun | Noun Nominal Voorbeeld: "The 3 first morning flights"
M&J 9.4 The Noun Phrase Lexicale NP's: Eigennamen: NP ProperNoun Voornaamwoorden: NP Pronoun Complexe NP's: bestaat typisch uit een Lidwoord (Determiner) gevolgd door een zelfstandig naamwoord (Noun). Daartussen en daarachter kunnen nog allerlei optionele constituenten staan. NP DetP (Card) (Ord) (AP) Nominal Nominal Noun | Noun Nominal | Nominal PP PP Prep NP Prep on | in | at | to | from Voorbeeld: "The 3 first morning flights to Dallas"
M&J 9.2 Context-Free Rules and Trees VP-regels: zie voorbeeldgrammatica L 0 : Lexicon:Structurele regels:
M&J 9.3 Sentence-Level Constructions declarative sentences S NP VP B.v.: "I prefer a morning flight" "They list all flights from Burbank to Denver" imperative sentences (bevelen, opdrachten, suggesties) S VP B.v.: "Show me the lowest fare" "List all flights from Burbank to Denver"
yes-no questions S Aux NP VP ? Voorbeelden: "Do these flights go to Denver?" "Can you give me the same information for KLM?" wh-questions S WhNP VP ? Voorbeelden: "What airlines fly from Burbank to Denver?" "Which flights serve breakfast?" S WhNP Aux NP VP ? Voorbeeld: "What flights to Denver do you have tomorrow?" M&J 9.3 Sentence-Level Constructions
yes-no questions S Aux NP VP ? Voorbeelden: "Do these flights go to Denver?" "Can you give me the same information for KLM?" wh-questions S WhNP VP ? Voorbeelden: "What airlines fly from Burbank to Denver?" "Which flights serve breakfast?" S WhNP Aux NP VP ? [Nog niet helemaal goed: incomplete VP!] Voorbeeld: "What flights to Denver do you have tomorrow?" M&J 9.3 Sentence-Level Constructions
Uitbreiding op CFG: Features.
S NP VP NP proper-noun NP article noun VP verb verb loopt | lopen noun hond | honden article alle | elke | vier Jan loopt de honden lopen
S NP VP NP proper-noun NP article noun VP verb verb loopt | lopen noun hond | honden article alle | elke | vier Jan loopt de honden lopen Jan lopen de honden loopt
S NP VP NP proper-noun NP article noun VP verb verb loopt | lopen noun hond | honden article alle | elke | vier Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond
S NP sing VP sing S NP plur VP plur NP sing proper-noun NP sing article sing noun sing NP plur article plur noun plur VP sing verb sing VP plur verb plur verb sing loopt verb plur lopen noun sing hond noun plur honden article sing elke article plur alle | vier Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond elke hond loopt alle honden lopen
S NP sing VP sing S NP plur VP plur NP sing proper-noun NP sing article sing noun sing NP plur article plur noun plur VP sing verb sing VP plur verb plur Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond elke hond loopt alle honden lopen Nadeel: Duplicatie van regels.
S NP sing VP sing S NP plur VP plur NP sing proper-noun NP sing article sing noun sing NP plur article plur noun plur VP sing verb sing VP plur verb plur Nadeel: Duplicatie van regels. Nog meer zulke syntactische attributen: 1 e, 2 e, 3 e persoon: "ik loop" vs. "Jan loopt" onzijdig vs. mannelijk/vrouwelijk: "elk kind" vs. "elke hond" telbaar vs. niet-telbaar: "veel wijn" vs. "veel hond"
S NP sing VP sing S NP plur VP plur NP sing proper-noun NP sing article sing noun sing NP plur article plur noun plur VP sing verb sing VP plur verb plur Nadeel: Duplicatie van regels. Nog meer zulke syntactische attributen: 1 e, 2 e, 3 e persoon: "ik loop" vs. "Jan loopt" onzijdig vs. mannelijk/vrouwelijk: "elk kind" vs. "elke hond" telbaar vs. niet-telbaar: "veel wijn" vs. "veel hond" Naarmate we meer zulke onderscheiden introduceren, neemt het aantal regels exponentieel toe.
S NP sing VP sing S NP plur VP plur NP sing proper-noun NP sing article sing noun sing NP plur article plur noun plur VP sing verb sing VP plur verb plur Daarom: feature-grammatica's (unification grammars, augmented CFG's, Definite Clause Grammars (DCG's)) S NP (x) VP (x) NP (sing) proper-noun NP (x) article (x) noun (x) VP (x) verb (x) Cf. Prolog-unificatie: Feature-agreement ("congruentie") & feature-percolation (inheritance)
S NP [nr:x, person:y] VP [nr: x, person: y] NP [nr: sing] proper-noun NP [nr: x] article [nr: x, count:y] noun [nr: x, count:y] VP [nr: x, person: y] V1 [nr: x, person: y] article [nr: sing, count: +] a | one | some article [nr: plural, count: +] 3 | many article [nr: x, count: +] some article [nr: sing, count: x] some article [nr: sing, count: -] much article [nr: plural, count: -] 3 liters of N [nr: sing, count: +] boy N [nr: plural, count: +] boys N [nr: x, count: -] wine
The Verb Phrase and Subcategorization Subcategorization frame: list of complements that the verb selects for. Voorbeelden: vp --> verb. disappear * want vp --> verb, np. prefer a morning flight * disappear a morning flight vp --> verb, np, pp. put a book on the table * disappear a book on the table vp --> verb, vp. want to fly to Orlando * find to fly to Orlando
Implementing subcategorization: just like the agreement feature –encode subcategorization form in non-terminal name (larger grammar) –encode subcategorization in extra argument (smaller grammar)
Slechts één "regel" voor VP: VP V[subcat: (X1,..., Xn)] X1... Xn N.B.: Regelschema!
S NP VP VP V1 V2 NP V3 NP PP NP DET N PP PREP N DET every | a N man | table PREP on | under V1 walks | talks V2 loves | sees V3 puts B.v.:
S NP VP VP V1 V2 NP V3 NP PP NP DET N PP PREP N DET every | a N man | table PREP on | under V1 walks | talks V2 loves | sees V3 puts S NP VP VP V[subcat: (X1,..., Xn)] X1... Xn NP DET N PP PREP N DET every | a N man | table PREP on | under V [subcat: ()] walks | talks V [subcat: (NP)] loves | sees V [subcat: (NP PP)] puts wordt:
Wh-Questions Revisited Transformationele Grammatica
Wh-Questions "Which boys does Mary see?"
yes-no questions S Aux NP VP ? Voorbeelden: "Do these flights go to Denver?" "Can you give me the same information for KLM?" wh-questions S WhNP VP ? Voorbeelden: "What airlines fly from Burbank to Denver?" "Which flights serve breakfast?" S WhNP Aux NP VP ? [Nog niet goed: VP moet incompleet zijn!] Voorbeeld: ”What flights do these flights go to Denver?" "What flights to Denver do you have some flights tomorrow?" M&J 9.3 Sentence-Level Constructions
Which boys does Mary see?
Which boys does Mary see [ ]? Does Mary see John?
Which boys does Mary see? Which boys does Mary see [ ]? Which boys does Peter think Mary sees [ ]? Does Peter think Mary sees John? Does Peter think Mary sees which boys?
Which boys does Mary see [ ]? Which boys does Peter think Mary sees [ ]? Noam Chomsky: Transformationele Grammatica. CFG genereert “diepte-structuur”: “Does Mary see which boys?” Transformatie-regel sleept “which boys” naar voren.
YNQ does NP VP; YNQ[–t] does NP VP[–t]; YNQ[+t] does NP VP[+t]; WHQ WHNP YNQ[+t]; VP[+t] V2 NP[+t]; NP[+t] e; Noam Chomsky: Transformationele Grammatica. Kun je nabouwen d.m.v. een contextvrije grammatica met features (Definite Clause Grammar).