Taaltheorie en Taalverwerking Week 5: – Natuurlijke Taal Syntax. (Uitbreiding op CFG: Features.) – Human Parsing: Center-Embedding.
S NP VP NP proper-noun NP article noun VP verb verb loopt | lopen noun hond | honden article alle | elke | vier Jan loopt de honden lopen
S NP VP NP proper-noun NP article noun VP verb verb loopt | lopen noun hond | honden article alle | elke | vier Jan loopt de honden lopen Jan lopen de honden loopt
S NP VP NP proper-noun NP article noun VP verb verb loopt | lopen noun hond | honden article alle | elke | vier Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond
S NP sing VP sing S NP plur VP plur NP sing proper-noun NP sing article sing noun sing NP plur article plur noun plur VP sing verb sing VP plur verb plur verb sing loopt verb plur lopen noun sing hond noun plur honden article sing elke article plur alle | vier Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond elke hond loopt alle honden lopen
S NP sing VP sing S NP plur VP plur NP sing proper-noun NP sing article sing noun sing NP plur article plur noun plur VP sing verb sing VP plur verb plur Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond elke hond loopt alle honden lopen Nadeel: Duplicatie van regels.
S NP sing VP sing S NP plur VP plur NP sing proper-noun NP sing article sing noun sing NP plur article plur noun plur VP sing verb sing VP plur verb plur Nadeel: Duplicatie van regels. Nog meer zulke syntactische attributen: 1 e, 2 e, 3 e persoon: "ik loop" vs. "Jan loopt" onzijdig vs. mannelijk/vrouwelijk: "elk kind" vs. "elke hond" telbaar vs. niet-telbaar: "veel wijn" vs. "veel hond"
S NP sing VP sing S NP plur VP plur NP sing proper-noun NP sing article sing noun sing NP plur article plur noun plur VP sing verb sing VP plur verb plur Nadeel: Duplicatie van regels. Nog meer zulke syntactische attributen: 1 e, 2 e, 3 e persoon: "ik loop" vs. "Jan loopt" onzijdig vs. mannelijk/vrouwelijk: "elk kind" vs. "elke hond" telbaar vs. niet-telbaar: "veel wijn" vs. "veel hond" Naarmate we meer zulke onderscheiden introduceren, neemt het aantal regels exponentieel toe.
S NP sing VP sing S NP plur VP plur NP sing proper-noun NP sing article sing noun sing NP plur article plur noun plur VP sing verb sing VP plur verb plur Daarom: feature-grammatica's (unification grammars, augmented CFG's, Definite Clause Grammars (DCG's)) S NP (x) VP (x) NP (sing) proper-noun NP (x) article (x) noun (x) VP (x) verb (x) Cf. Prolog-unificatie: Feature-agreement ("congruentie") & feature-percolation (inheritance)
S NP [nr:x, person:y] VP [nr: x, person: y] NP [nr: sing] proper-noun NP [nr: x] article [nr: x, count:y] noun [nr: x, count:y] VP [nr: x, person: y] V1 [nr: x, person: y] article [nr: sing, count: +] a | one | some article [nr: plural, count: +] 3 | many article [nr: x, count: +] some article [nr: sing, count: x] some article [nr: sing, count: -] much article [nr: plural, count: -] 3 liters of N [nr: sing, count: +] boy N [nr: plural, count: +] boys N [nr: x, count: -] wine
The Verb Phrase and Subcategorization Subcategorization frame: list of complements that the verb selects for. Voorbeelden: vp --> verb. disappear * want vp --> verb, np. prefer a morning flight * disappear a morning flight vp --> verb, np, pp. put a book on the table * disappear a book on the table vp --> verb, vp. want to fly to Orlando * find to fly to Orlando
Implementing subcategorization: just like the agreement feature –encode subcategorization form in non-terminal name (larger grammar) –encode subcategorization in extra argument (smaller grammar)
Slechts één "regel" voor VP: VP V[subcat: (X1,..., Xn)] X1... Xn N.B.: Regelschema!
S NP VP VP V1 V2 NP V3 NP PP NP DET N PP PREP N DET every | a N man | table PREP on | under V1 walks | talks V2 loves | sees V3 puts B.v.:
S NP VP VP V1 V2 NP V3 NP PP NP DET N PP PREP N DET every | a N man | table PREP on | under V1 walks | talks V2 loves | sees V3 puts S NP VP VP V[subcat: (X1,..., Xn)] X1... Xn NP DET N PP PREP N DET every | a N man | table PREP on | under V [subcat: ()] walks | talks V [subcat: (NP)] loves | sees V [subcat: (NP PP)] puts wordt:
Lijkt het menselijk parseer-proces op de top- down-parser?
(1) Nee. Nederlands kan niet met een CFG beschreven worden: Cross-serial dependencies.
Lijkt het menselijk parseer-proces op de top- down-parser? (2) Nee: parallelle activering van heel veel mogelijke deel-analyses van een input-zin. ("Priming"-experimenten: ook betekenissen waar je je niet van bewust bent zijn onbewust geactiveerd.)
Lijkt het menselijk parseer-proces op de top- down-parser? (3) Nee. Er zijn zinnen die voor een mens moeilijk zijn en voor een chart-parser niet: "center-embedding".
J&M § 13.4: Center-embedding. "The dog chased the cat that likes tuna fish" "The cat the dog chased likes tuna fish."
J&M § 13.4: Center-embedding. "The dog chased the cat that likes tuna fish" "The cat the dog chased likes tuna fish." "The elephant admired the rat that bit the dog that chased the cat that likes tuna fish."
J&M § 13.4: Center-embedding. "The dog chased the cat that likes tuna fish" "The cat the dog chased likes tuna fish." "The elephant admired the rat that bit the dog that chased the cat that likes tuna fish." "The cat the dog the rat the elephant admired bit chased likes tuna fish."
J&M § 13.4: Center-embedding. "The cat the dog the rat the elephant admired bit chased likes tuna fish." Regels van de vorm S' NP S' V2 kunnen de facto niet recursief toegepast worden. Verklaring: beperkte stack-diepte. Victor Yngve: Engels is wel een reguliere taal!
Huiswerk deze week: – Features Volgende week: – Chart Parser