De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Taaltheorie en Taalverwerking Week 5: – Natuurlijke Taal Syntax. (Uitbreiding op CFG: Features.) – Human Parsing: Center-Embedding.

Verwante presentaties


Presentatie over: "Taaltheorie en Taalverwerking Week 5: – Natuurlijke Taal Syntax. (Uitbreiding op CFG: Features.) – Human Parsing: Center-Embedding."— Transcript van de presentatie:

1 Taaltheorie en Taalverwerking Week 5: – Natuurlijke Taal Syntax. (Uitbreiding op CFG: Features.) – Human Parsing: Center-Embedding.

2 S  NP VP NP  proper-noun NP  article noun VP  verb verb  loopt | lopen noun  hond | honden article  alle | elke | vier Jan loopt de honden lopen

3 S  NP VP NP  proper-noun NP  article noun VP  verb verb  loopt | lopen noun  hond | honden article  alle | elke | vier Jan loopt de honden lopen Jan lopen de honden loopt

4 S  NP VP NP  proper-noun NP  article noun VP  verb verb  loopt | lopen noun  hond | honden article  alle | elke | vier Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond

5 S  NP sing VP sing S  NP plur VP plur NP sing  proper-noun NP sing  article sing noun sing NP plur  article plur noun plur VP sing  verb sing VP plur  verb plur verb sing  loopt verb plur  lopen noun sing  hond noun plur  honden article sing  elke article plur  alle | vier Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond elke hond loopt alle honden lopen

6 S  NP sing VP sing S  NP plur VP plur NP sing  proper-noun NP sing  article sing noun sing NP plur  article plur noun plur VP sing  verb sing VP plur  verb plur Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond elke hond loopt alle honden lopen Nadeel: Duplicatie van regels.

7 S  NP sing VP sing S  NP plur VP plur NP sing  proper-noun NP sing  article sing noun sing NP plur  article plur noun plur VP sing  verb sing VP plur  verb plur Nadeel: Duplicatie van regels. Nog meer zulke syntactische attributen: 1 e, 2 e, 3 e persoon: "ik loop" vs. "Jan loopt" onzijdig vs. mannelijk/vrouwelijk: "elk kind" vs. "elke hond" telbaar vs. niet-telbaar: "veel wijn" vs. "veel hond"

8 S  NP sing VP sing S  NP plur VP plur NP sing  proper-noun NP sing  article sing noun sing NP plur  article plur noun plur VP sing  verb sing VP plur  verb plur Nadeel: Duplicatie van regels. Nog meer zulke syntactische attributen: 1 e, 2 e, 3 e persoon: "ik loop" vs. "Jan loopt" onzijdig vs. mannelijk/vrouwelijk: "elk kind" vs. "elke hond" telbaar vs. niet-telbaar: "veel wijn" vs. "veel hond" Naarmate we meer zulke onderscheiden introduceren, neemt het aantal regels exponentieel toe.

9 S  NP sing VP sing S  NP plur VP plur NP sing  proper-noun NP sing  article sing noun sing NP plur  article plur noun plur VP sing  verb sing VP plur  verb plur Daarom: feature-grammatica's (unification grammars, augmented CFG's, Definite Clause Grammars (DCG's)) S  NP (x) VP (x) NP (sing)  proper-noun NP (x)  article (x) noun (x) VP (x)  verb (x)  Cf. Prolog-unificatie: Feature-agreement ("congruentie") & feature-percolation (inheritance)

10 S  NP [nr:x, person:y] VP [nr: x, person: y] NP [nr: sing]  proper-noun NP [nr: x]  article [nr: x, count:y] noun [nr: x, count:y] VP [nr: x, person: y]  V1 [nr: x, person: y] article [nr: sing, count: +]  a | one | some article [nr: plural, count: +]  3 | many article [nr: x, count: +]  some article [nr: sing, count: x]  some article [nr: sing, count: -]  much article [nr: plural, count: -]  3 liters of N [nr: sing, count: +]  boy N [nr: plural, count: +]  boys N [nr: x, count: -]  wine

11 The Verb Phrase and Subcategorization Subcategorization frame: list of complements that the verb selects for. Voorbeelden: vp --> verb. disappear * want vp --> verb, np. prefer a morning flight * disappear a morning flight vp --> verb, np, pp. put a book on the table * disappear a book on the table vp --> verb, vp. want to fly to Orlando * find to fly to Orlando

12 Implementing subcategorization: just like the agreement feature –encode subcategorization form in non-terminal name (larger grammar) –encode subcategorization in extra argument (smaller grammar)

13 Slechts één "regel" voor VP: VP  V[subcat: (X1,..., Xn)] X1... Xn N.B.: Regelschema!

14 S  NP VP VP  V1  V2 NP  V3 NP PP NP  DET N PP  PREP N DET  every | a N  man | table PREP  on | under V1  walks | talks V2  loves |  sees V3  puts B.v.:

15 S  NP VP VP  V1  V2 NP  V3 NP PP NP  DET N PP  PREP N DET  every | a N  man | table PREP  on | under V1  walks | talks V2  loves |  sees V3  puts S  NP VP VP  V[subcat: (X1,..., Xn)] X1... Xn NP  DET N PP  PREP N DET  every | a N  man | table PREP  on | under V [subcat: ()]  walks | talks V [subcat: (NP)]  loves |  sees V [subcat: (NP PP)]  puts wordt:

16

17 Lijkt het menselijk parseer-proces op de top- down-parser?

18 (1) Nee. Nederlands kan niet met een CFG beschreven worden: Cross-serial dependencies.

19 Lijkt het menselijk parseer-proces op de top- down-parser? (2) Nee: parallelle activering van heel veel mogelijke deel-analyses van een input-zin. ("Priming"-experimenten: ook betekenissen waar je je niet van bewust bent zijn onbewust geactiveerd.)

20 Lijkt het menselijk parseer-proces op de top- down-parser? (3) Nee. Er zijn zinnen die voor een mens moeilijk zijn en voor een chart-parser niet: "center-embedding".

21 J&M § 13.4: Center-embedding. "The dog chased the cat that likes tuna fish" "The cat the dog chased likes tuna fish."

22 J&M § 13.4: Center-embedding. "The dog chased the cat that likes tuna fish" "The cat the dog chased likes tuna fish." "The elephant admired the rat that bit the dog that chased the cat that likes tuna fish."

23 J&M § 13.4: Center-embedding. "The dog chased the cat that likes tuna fish" "The cat the dog chased likes tuna fish." "The elephant admired the rat that bit the dog that chased the cat that likes tuna fish." "The cat the dog the rat the elephant admired bit chased likes tuna fish."

24 J&M § 13.4: Center-embedding. "The cat the dog the rat the elephant admired bit chased likes tuna fish." Regels van de vorm S'  NP S' V2 kunnen de facto niet recursief toegepast worden. Verklaring: beperkte stack-diepte. Victor Yngve: Engels is wel een reguliere taal!

25 Huiswerk deze week: – Features Volgende week: – Chart Parser

26


Download ppt "Taaltheorie en Taalverwerking Week 5: – Natuurlijke Taal Syntax. (Uitbreiding op CFG: Features.) – Human Parsing: Center-Embedding."

Verwante presentaties


Ads door Google