Grammaticale modellen

Slides:



Advertisements
Verwante presentaties
Week 9: Probabilistische Grammatica's Jurafsky & Martin (ed. 1), Hoofdstuk 12: Lexicalized and Probabilistic Parsing) Taaltheorie en Taalverwerking Remko.
Advertisements

Les 2 klassediagrammen II
Verlichtingsdenker: vertrouwen in de rede
Laurens van der Maaten IKAT / ROB
Visual Knowledge Building
Natuurlijke-Taalinterfaces
Taaltheorie en Taalverwerking Week 4: Parseer-algoritmes.
Heb het goed hou het goed Corrie Blijdorp De Driehoek
Presentatie, deelpagina over mijn fantasie, mijn animatie liefde
Ik geloof… Dat onze achtergrond en omstandigheden misschien wel van invloed zijn geweest op wie we zijn, maar dat wìj verantwoorde- lijk zijn voor wie.
Taaltheorie en Taalverwerking Bachelor Kunstmatige Intelligentie.
Practica Computerlinguistiek Tekst en uitleg:
Fractalen zien en schilderen
Taal en cognitie: Optimaliteitstheorie Henriëtte de Swart.
Taalkunde Grammatica A
24 juni 2003Johnson en Morrill in Israel Een studie naar de Johnson Morrill Hypothese in relatie tot de Hebreeuwse taal; implementatie van bewijsnetten.
Compositionaliteit, bereik en lambda’s
En wat doet taalkunde in het programma van CKI?
Taalkennis, taalverwerving, en taalevolutie
Grammatica’s en Ontleden
Taal en cognitie: Optimaliteitstheorie Henriëtte de Swart.
Taalwetenschap in de CKI-bachelor
Taal en cognitie: Optimaliteitstheorie Henriëtte de Swart.
En wat doet taalkunde in het programma van CKI?
Definite Clause Grammar
Geest, brein en cognitie Filosofie van de geest en Grondslagen van de cognitiewetenschap Fred Keijzer.
Natuurlijke Taalverwerking
Categoriale Grammatica
Natuurlijke taalverwerking week 4
Van spellend lezen naar directe woordherkenning
AI91  Het Probleem  Grammatica’s  Transitie netwerken Leeswijzer: Hoofdstuk AI Kaleidoscoop College 9: Natuurlijke taal.
Meten bij marktonderzoek
Parsing: Top-down en bottom-up
Blok 7: netwerken Les 1 Christian Bokhove
Taalstoornissen bij Fronto-temporale dementie
Taaltheorie en Taalverwerking Week 5: – Natuurlijke Taal Syntax. (Uitbreiding op CFG: Features.) – Human Parsing: Center-Embedding.
Les 3 Deze les duurt 90 minuten
Meten van intelligentie bij kinderen met ADHD
Cognitieve linguïstiek
CanDo Coaching.
Ik geloof… Dat onze achtergrond en omstandigheden misschien wel van invloed zijn geweest op wie we zijn,maar dat wìj verantwoorde-lijk zijn voor wie we.
Modelleren van XML element content of Hoe doe je dat? Harrie Passier & Bastiaan Heeren TouW-dag 13 november 2010.
Reguliere talen nReguliere grammatica: versimpelde Contextvrije grammatica nFinite-state Automaton: andere manier om een taal te beschrijven nReguliere.
Stelles “Een eigen (ei)land”..
Tentamen vraag 1 Als L en M talen zijn, dan nL  M is gelijk aan { s  t | s  L, t  M } nL M is gelijk aan { s t | s  L, t  M } nL n is gelijk aan.
Animatie team Dio en Tjeerd.
In een reguliere taal… zin yxz S E A B vuwuwxzvuwxzvvuwxzvvvuwxzvvv lengte  n.
Stage: Basisschool de Klingerberg
Syntaxis 1. Inleiding: Combinaties Combinaties op verschillende niveaus: Lettergrepen als combinaties van fonemen. (College 3,4) Woorden als combinaties.
Zinnen 1 Henriëtte de Swart.
Tentamen vraag 1 nElke reguliere zin is ook contextvrij nElke reguliere taal is ook contextvrij nElke contextvrije grammatica is ook regulier nonsens “regulier”
MEDIATHEORIE Karlijn Goossen, 2015.
Moderne en klassieke schikstijlen
Stromingen in de psychologie Hoorcollege 1
Les 3 - Operators Workshop Php Basic. ICT Academy Php Basic Content Operators Wiskundig Toewijzing Vergelijking.
De Passive (Voice). De ‘Passive (Voice)’ is geen tijd. Maar hij komt wel in alle tijden voor. Je zult de ‘Passive (Voice)’ gemakkelijker begrijpen als.
Homcom Ledenvergadering 25/04/2016. Bots Doet ons denken aan robots Worden gebruikt om – Te spreken – Standaard conversaties te voeren Bv : al onze medewerkers.
De lidwoorden Kleine woorden met grote gevolgen!! Welke ken je? (ne en fa du)
Problemen in de interactie en communicatie bij kinderen met een aan autisme verwante stoornis. M. Serra & R.B. Minderaa.
Methoden om een vreemde taal te leren 1 Correctie op p. 66 van de reader, laatste alinea: “Zulke vragen als wij hierboven over doel en vorm hebben gesteld,
Grammatica zinsdelen H1 t/m H6
8 Samengestelde Redeneringen identificeren
Tool IE-3: Kenmerken van probleem-oplosopdrachten
Hoofdstuk 1 Taal en taalonderwijs
Semantisatieverhaal:
Taal en Theorie les 3.4 Wat kan er misgaan bij het spreken, verstaan en lezen? Het proces van spreken Het proces van verstaan Afasie Dyslexie.
TAAL & THEORIE 3.3 Het spreken en begrijpen van taal
Hoe is menselijke taal ontstaan?
Grammatica: werkwoorden
Transcript van de presentatie:

Grammaticale modellen Syntaxis 3 Grammaticale modellen

Inleiding Wat we gezien hebben: Eindige automaten: fonologie, morfologie Regels: fonologie (n  / Ə _ #) Herschrijfregels: syntaxis (S  NP VP) Verplaatsingen: syntaxis (V2)

Inleiding Wat is de kracht van deze formele mechanismen? Wat kunnen ze en wat kunnen ze niet? Wat voor mechanismen zijn nodig om bepaalde taalkundige fenomenen te karakteriseren? Wat zijn de computationele en psychologische aspecten van die mechanismen?

Inleiding Formele talen Complexiteit in natuurlijke talen Conclusie

Formele talen: Omschrijving Een formele taal is een verzameling van strings (symbolenrijtjes) gedefinieerd over een alfabet van symbolen. Bijvoorbeeld: de verzameling van strings a*b* (eerst nul of meer a’s, dan nul of meer b’s).

Formele talen: Grammatica, automaat Een taal kan op twee manieren gedefinieerd worden: Door een grammatica, die de strings van de taal genereert (bijv. een context-vrije herschrijfgrammatica). Door een automaat, die de strings van de taal herkent (bijv. een finite-state automaat).

Formele talen: Vier typen Vier typen formele talen worden onderscheiden, met bijbehorende typen grammatica’s en automaten. Deze vier typen vormen een hiërarchie van krachtig naar zwak, de Chomsky hiërarchie. Kracht betekent hier: meer talen omvattend (genererend, herkennend).

Formele talen: Basisbegrippen Noties bij een (formele) grammatica: Startsymbool: S Niet-terminaal symbool: categorie Terminaal symbool: ook element van het alfabet Nul:  (of iets dergelijks) Voorbeeld: S  NP VP N  man

Formele talen: Type 3 Type 3: Reguliere taal Kan herkend worden door eindige automaat. Kan gegenereerd worden door reguliere grammatica. Regels van de vorm A  xB of A  x. Voorbeeld: S  aS, S  b: a*b

Formele talen: Type 2 Type 2: context-vrije taal Herkennen: push-down automaat Genereren: context-vrije herschrijfgrammatica Regels van de vorm A  rijtje symbolen S  a S b, S   (anbn)

Formele talen: Vergelijking Elke type 3 taal is ook een type 2 taal. Een type 2 grammatica kan talen genereren die een type 3 grammatica niet kan genereren. De taal anbn is zo´n type 2 taal. Door de vorm van de regel S  a S b kunnen er evenveel a’s als b’s zijn.

Formele talen: Palindromen S  a S b, S   (anbn) Hoe ziet een grammatica eruit die palindromen genereert over {a,b}? { , a, b, aa, bb, aba, bab, aaa, bbb, …} S  a S a, S  b S b, S  , S  a, S  b Kan niet met eindige automaat!

Formele talen: Type 1 Type 1: context-gevoelige taal Genereren: context-gevoelige grammatica Regels van de vorm A  , waarbij  niet  is (dus geen verkorting). Herkennen: lineair gebonden automaat

Formele talen: Type 1 S  abc S  aSBc cB  Bc bB  bb anbncn met n  1 S  aSBc  aabcBc  aabBcc  aabbcc Kan niet context-vrij

Formele talen: Type 0 Herkennen: Turing machine Genereren: Onbeperkte grammatica Recursief opsombare talen Regels van de vorm   , met de enige beperking dat   Omvat alle andere typen talen.

Formele talen: Chomsky-hiërarchie type 0 type 1 type 2 type 3

Complexiteit: natuurlijk taal Wat voor type grammatica (automaat) hebben we nodig om bepaalde taalkundige fenomenen te beschrijven? Een mechanisme dat krachtig genoeg is om bepaalde patronen te genereren (herkennen). Maar niet te krachtig! Geen Turing-kracht!

Complexiteit: Niet te We willen een mechanisme gebruiken dat niet te krachtig is. Omdat te krachtige mechanismen ons minder leren over de eigenschappen van menselijke cognitie. Omdat te krachtige mechanismen computationeel ook lastiger zijn.

Complexiteit: Fonologie Generatieve fonologie: context-gevoelige herschrijfregels voor fonologische processen. VV  VjV Computationele fonologie: lastig soort regels, en het kan veel makkelijker: eindige automaat.

Complexiteit: Fonologie Fonologische (en ook morfologische) verschijnselen kunnen gemodelleerd worden met het ‘zwakste’, meest beperkte mechanisme. Reden: de afhankelijkheden tussen fonemen en morfemen in woorden zijn altijd heel locaal.

Complexiteit: Syntaxis Zijn misschien alle talige fenomenen te modelleren met eindige automaten (reguliere grammatica’s)? Of kunnen we verschijnselen vinden die de kracht van een context-vrije herschrijfgrammatica (CFG) vereisen?

Complexiteit: Palindromen CFG’s zijn nodig voor palindromen r e i n i e r | | |__| | | | |____| | |_______| We zien hier geneste afhankelijkheden. Ook in natuurlijke taal?

Complexiteit: Center embedding The cat likes tuna fish The cat the dog chased likes tuna fish The cat the dog the rat bit chased likes tuna fish The cat the dog the rat the elephant admired bit chased likes tuna fish

Complexiteit: Chomsky Chomsky maakt een belangrijk onderscheid Competence: taalkennis, los van geheugen, aandacht, … Performance: gebruik van taalkennis, beïnvloed door geheugen, aandacht, … Center-embedding: moeilijk (performance), maar grammaticaal (competence)

Complexiteit: Nesting The cat the dog chased likes tuna fish | |______| | |___________________| The cat the dog the rat bit chased likes tuna fish |____|

Complexiteit: Nesting Nog een zelfde soort voorbeeld Niet moeilijk te verwerken: This is the dog that worried the cat that killed the rat that ate the malt that lay in the house that Jack built. Geen nesting!

Complexiteit: Nesting Maar dan: Jack built the house that the malt that the rat that the cat that the dog worried killed ate lay in Nesting doet hier een te groot beroep op onze geheugencapaciteit.

Complexiteit: Pumping Er is een lemma (pumping lemma) dat het mogelijk maakt om te bewijzen dat deze patronen niet regulier zijn. Dus syntaxis natuurlijke taal vereist minstens een context-vrije grammatica. Maar is context-vrij voldoende voor andere fenomenen?

Complexiteit: Crossing Voorbeelden van niet-contextvrije talen: { xx | x  {a,b}* } anbmcndm Er is een kruisende afhankelijkheid: |__|_| | |___| Komen die ook in natuurlijke talen voor?

Complexiteit: Zürich Jan säit das … (Jan zei dat …) mer em Hans es huus hälfed aastriiche wij de Hans het huis hielpen verven mer d’chind em Hans es huus haend wij de kinderen de Hans het huis hebben wele laa hälfe aastriiche wille laten helpen verven

Complexiteit: Naamval Jan säit das … (Jan zei dat …) mer em Hans es huus hälfed aastriiche wij de Hans het huis hielpen verven DAT ACC | | |_________|_______| | |____________ | Relatie tussen werkwoorden en objecten is niet-CF in Zwitser-Duits

Complexiteit: Nederlands omdat ik Cecilia Henk de nijlpaarden zag helpen voeren |____|_____|______________| | | |_____|_________________ | | |________________________ | Ook in het Nederlands kunnen crossing dependencies gedemonstreerd worden.

Conclusie Er zijn verschijnselen in natuurlijke taal die krachtiger modellen vereisen dan eindige automaten of context-vrije grammatica’s. Maar er zijn twee kanttekeningen te maken.

Conclusie De taalkundige verschijnselen zijn beperkt, marginaal, speciaal. Ze zijn moeilijk te begrijpen voor mensen (center-embedding). Ze komen weinig voor in talen (crossing). Ze zijn beperkt tot de syntaxis.

Conclusie Voor computationele toepassingen volstaan vaak eindige of context-vrije mechanismen. Voor cognitieve doeleinden lijken dit soort mechanismen ook adequater.