Zinnen 1 Henriëtte de Swart.

Slides:



Advertisements
Verwante presentaties
Redekundig ontleden Over waarom, wat en hoe....
Advertisements

Week 9: Probabilistische Grammatica's Jurafsky & Martin (ed. 1), Hoofdstuk 12: Lexicalized and Probabilistic Parsing) Taaltheorie en Taalverwerking Remko.
De samengestelde zin.
Herhaling van hoofdstuk
Natuurlijke-Taalinterfaces
Grammatica hst. 1 t/m 3 Woordsoorten Zinsdelen PV H1 WG LW H. 1 NG BNW
Veelvoorkomende taalfouten 2
TAALPROBLEMEN ODD ONE OUT.
Taal en cognitie: Optimaliteitstheorie Henriëtte de Swart.
'Om mijn oud woonhuis peppels staan'
Lerarenopleiding Nederlands
Sociolinguïstiek Bijeenkomst 3.
Inleiding taalwetenschap
H2 Grammatica zinsdelen
Taalkunde Grammatica A
24 juni 2003Johnson en Morrill in Israel Een studie naar de Johnson Morrill Hypothese in relatie tot de Hebreeuwse taal; implementatie van bewijsnetten.
Compositionaliteit, bereik en lambda’s
En wat doet taalkunde in het programma van CKI?
Grammatica’s en Ontleden
Semantiek 1.
Syntaxis 2.
Betekenis 2: Compositionaliteit, bereik en lambda’s
Grammaticale modellen
Taalwetenschap in de CKI-bachelor
Prosodie.
En wat doet taalkunde in het programma van CKI?
Definite Clause Grammar
Categoriale Grammatica
Natuurlijke taalverwerking week 4
AI91  Het Probleem  Grammatica’s  Transitie netwerken Leeswijzer: Hoofdstuk AI Kaleidoscoop College 9: Natuurlijke taal.
WOORDLEER EEN OVERZICHT.
Parsing: Top-down en bottom-up
Unificatie grammatica
TAALPROBLEMEN ODD ONE OUT. ODD ONE OUT PRINCIPE JE KRIJGT DRIE GRAMMATICALE PROBLEMEN VOORGESCHOTELD IEDER PROBLEEM BESTAAT UIT DRIE ZINNEN TELKENS HOORT.
Taaltheorie en Taalverwerking Week 5: – Natuurlijke Taal Syntax. (Uitbreiding op CFG: Features.) – Human Parsing: Center-Embedding.
Semantische Interpretatie Jurafsky & Martin (Ed. 1): Hoofdstuk 15
Three steps to success Foutloos zinnen vertalen in drie stappen
MET DANK AAN COLLEGA’S IN DEN LANDE ! vee 2012
Grammatica Nederlands
Nederlands Woordsoorten.
Kennis verbreden en verdiepen
Taaloefeningen.
Taaloefeningen.
QUIZ hoofdstuk 1.
SE-Seneca voorbereiding op CE 2013!
Taal en logica Over het gebruik van eerste orde propositie/predikatenlogica voor de analyse van natuurlijke taal.
Syntaxis 1. Inleiding: Combinaties Combinaties op verschillende niveaus: Lettergrepen als combinaties van fonemen. (College 3,4) Woorden als combinaties.
Taaloefeningen.
Woordsoorten benoemen
Module Grammatica K3 zinsontleding.
Woordsoorten benoemen
Module Grammatica K3 zinsontleding.
VRIJDAG 4 MAART NEDERLANDS. PROGRAMMA 15 minuten lezen Herhalen hoofdstuk 4 Oefeningen maken (TEST of oefenen op de site NN)
1.7 Iedereen is bezig Samengestelde zinnen. Opa heeft alles wat zijn hartje begeert. Opa wil graag een hut hebben. Kun je hier één zin van maken?
TAAL BIJ TOETSEN Extra uitleg bij een aantal lastige kwesties.
Grammatica zinsdelen H1 t/m H6
Grammatica woordsoorten H1 t/m H6
GRAMMATICA BLOK 1 T/M 4 Uitleg en voorbeelden Woordsoorten Basis leerjaar 4.
Grammatica zinsdelen 2vwo, periode 2a.
Grammatica woordsoorten H1 t/m H6
Betrekkelijk voornaamwoord
Woordbenoemen Groep 6 en 7.
Verschil: redekundig en taalkundig ontleden
Grammatica Hoofdzin en bijzin.
Grammatica zinsdelen Redekundig ontleden.
Video and Radio NU Engels unit 5.1.
TAAL & THEORIE 3.3 Het spreken en begrijpen van taal
Woordbenoemen Zelfstandig naamwoord, eigennaam, lidwoord, bijvoeglijk naamwoord, voorzetsel, telwoord.
Grammatica: werkwoorden
WOORDSOORTEN HAVO-2.
Transcript van de presentatie:

Zinnen 1 Henriëtte de Swart

Combinaties Taal maakt combinaties op verschillende niveaus: Fonemen combineren tot morfemen (creëren van betekenis) Morfemen combineren tot woorden (complexe betekenissen) Woorden combineren tot woordgroepen, zinnen en teksten (meer complexe betekenissen).

Wat is syntaxis? Syntaxis bestudeert de combinaties van woorden tot woordgroepen en zinnen. Zinnen 1: structuur, bomen, herschrijfregels (de Swart) Zinnen 2: kenmerken, processen, transformaties, afhankelijkheden (Winter) Complexiteit (Chernilovskaya) Let op: colleges zinnen 1+2 horen bij tentamenstof toets 1. Complexiteit bij toets 2.

Stof bij dit college Uit het boek: hoofdstuk 12 (vanaf begin t/m 12.3, over structuur, herschrijfregels, woordgroepen en zinnen); Hoofdstuk 12 (sectie 12.5, sectie 12.6, sectie 12.7.2, over grammatica’s); Hoofdstuk 13 (sectie 13.2, over ambiguïteit).

Dit college Syntactische verschijnselen (waar kijken we naar?) Syntactische doelstellingen (generatie, parsing, theorie en toepassing) Syntactische categorieën (woordsoorten, parts of speech) Syntactische structuren (constituenten, zinnen) Syntactische regels (grammatica’s)

Syntactische verschijnselen Syntaxis is de moderne pendant van de traditionele grammatica: woordsoorten (werkwoord, lidwoord, …) zinsdelen (onderwerp, persoonsvorm, …) zinsbouw redekundig en taalkundig ontleden Maar er zijn belangrijke verschillen: theoretisch en toegepast.

Syntactische verschijnselen Patronen van (on)grammaticaliteit Jan at een boterham Jan at Jan verorberde een boterham *Jan verorberde Jan smulde *(van) een boterham Jan smulde Transitieve en intransitieve werkwoorden, voorzetsels: subcategorisatie

Syntactische verschijnselen Goed of fout? Hun doen maar wat Een aantal studenten zijn afgevallen http://dewerelddraaitdoor.vara.nl/Video-detail.628.0.html?&no_cache=1&tx_ttnews%5Btt_news%5D=14990&tx_ttnews%5BbackPid%5D=626&tx_ttnews%5Bcat%5D=148 Voor iedereen ongrammaticaal: *Hem doet maar wat *Een van de studenten zijn afgevallen Congruentie en naamval

Syntactische verschijnselen Wat betekent deze zin: Oude mannen en vrouwen eerst! Oude [mannen en vrouwen] [Oude mannen] en vrouwen Jan zag de man met de verrekijker zag [de man met de verrekijker] [zag [de man]] [met de verrekijker] Structurele ambiguïteit

Syntactische verschijnselen Jan zag de man met de verrekijker *Jan zag wie? *Jan zag de man hoe? *Wie Jan zag? *Hoe Jan zag de man met de verrekijker? Wie zag Jan? Hoe zag Jan de man met de verrekijker? Verplaatsing en afhankelijkheden: woordvolgorde, relaties tussen woordgroepen

Varianten op dezelfde zin Jan zag de man met de verrekijker (bewerende, declaratieve zin) Wie zag Jan? (vraagzin) Zie de man met de verrekijker! (imperatieve zin) Romeo kuste Julia (actieve vorm) Julia werd door Romeo gekust (lijdende vorm)

Recursie en oneindigheid Jan vond de sleutel. Jan vond de sleutel van de deur. Jan vond de sleutel van de deur van de garage. Jan vond de sleutel van de deur van de garage van de limousine. Jan vond …

Syntactische doelstellingen Onbewuste kennis van een modertaal-gebruiker (competence) karakteriseren. Het oneindige, grammaticale gebruik van eindige middelen (creativiteit van taal). Descriptief en niet prescriptief! Perspectief van taalproductie (generatie – hoe bouw je zinnen?) en taalverwerking (processing, parsing – hoe begrijpen mensen/computers zinsstructuur).

Formele grammatica Syntactische theorie wil een expliciete karakterisering geven van de taalkennis, door middel van precieze, formele regels. Generatieve grammatica (Chomsky): een definitie van de verzameling grammaticale zinnen en woordgroepen: generatie van alle grammaticale uitdrukkingen, en uitsluiting van alle ongrammaticale uitdrukkingen.

Processing/parsing Processing: verwerking in het brein, waarbij de onderliggende structuur van stroom woorden wordt herkend. Verwerkingsstap tussen auditieve perceptie (herkenning van klanken) en interpretatie. Parsing (computationele toepassingen): omzetten van strings van woorden in structurele representatie van structuur en afhankelijkheidsrelaties.

Taal in het brein Taal als kennissysteem: ‘software’. Opgeslagen in brein: ‘wetware’ Bij rechtshandige mensen vooral in linkerhersenhelft. Gebieden specifiek voor taal: Wernicke’s gebied (taalbegrip), Broca’s area (spraakproductie).

Garden path effect The horse raced past the barn fell. Heranalyse: raced is geen simple past, maar past participle. Vgl. The car driven past the barn crashed.

Meer ‘intuinzinnen’ The government plans to raise taxes were defeated. Time flies like an arrow; fruit flies like a banana. Ik sloeg meermaals de man met de wandelstok gade. Stowe et al (2004) tonen aan dat dit soort ambiguïteiten leiden tot activiteit in de rechter frontale kwab, waar ook humor een rol speelt.

Taalvariatie Verschillen en overeenkomsten tussen talen verantwoorden in één universeel regelsysteem. Wh-verplaatsing: verplicht in Nederlands, niet in Swahili: Wie zag Jan? - *Jan zag wie? - *Wie Jan zag? Jan aliona nani? - *Nani Jan aliona? - *Nani aliona Jan? (Swahili) Universele Grammatica: mogelijkheden en onmogelijkheden van taalvariatie.

Syntactische constituenten Een zin is nooit een platte rij woorden, maar heeft een bepaalde opbouw, structuur. Vgl. met de structuur van lettergrepen (fonologie) en woorden (morfologie). Woorden vormen met elkaar woordgroepen = constituenten = phrases Een constituent kan worden aangegeven met rechte haken: [oude [mannen en vrouwen]]

Motivatie voor constituentstructuur Een constituent gedraagt zich als een eenheid voor bepaalde syntactische verschijnselen (en zo kunnen we een constituent ook motiveren). Nederlands als V2 taal: bijna alles wat voor het werkwoord komt vormt één constituent: [Jan] lacht, [oude mannen en vrouwen] gaan eerst, [gisteren om half elf] vertrokken we, [op een oude fiets met handremmen] gaat het langzamer, [alle oude schoenen die ik in de afgelopen jaren heb verzameld] gooi ik nu weg,…

Disambigueren Jan zag de man met de verrekijker De man met de verrekijker werd gisteren nog gesignaleerd. De man die Jan zag met de verrekijker liep hard weg. Wie zag Jan? Wie zag Jan met de verrekijker?

Interne structuur Jan zag de man met de verrekijker De verrekijker

Boomstructuur 1 Jan zag de man met de verrekijker De constituenten van een zin kunnen worden aangegeven door middel van een boomstructuur

Boomstructuur 2 Jan zag de man met de verrekijker

Woordsoorten: nomina De woorden van een taal vormen niet één grote homogene verzameling, maar er zijn woordsoorten, categorieën, parts of speech. Noun, nomen, substantief, zelfstandig naamwoord: mannen, vrouwen, man, verrekijker, zand Afgekort als N

Mogelijke boomstructuren Chomskyaanse bomen: binaire vertakking Lastig: mannen en vrouwen Welke drie structuren zijn mogelijk? Welke argumenten kun je bedenken voor de structuur [mannen [en vrouwen]]? Let op bij het tekenen van bomen voor je taal in het groepsproject. Gebruik hiervoor binaire vertakkingen tenzij je goede redenen hebt om dat niet te doen..

Meer woordsoorten Verbum, verb, afgekort als V: ziet, at, verorberde, smulde, doen, zijn, zag, kust, gekust, doet, afgevallen, is.. Adjectief, adjective, bijvoeglijk naamwoord, afgekort als A: oude, vriendelijke, blauwe, … Ook adverbia: gisteren, wel, ..

Meer woordsoorten Preposities, voorzetsels, afgekort als P: met, in, op, door, van… Determiner, lidwoord, afgekort als D: de, het, een. Categorie D is ruimer dan alleen lidwoord, ook kwantoren (enkele, alle, geen,..) demonstratieven (deze, die, ..), wh-woorden (welke).

Verbindingswoorden Conjunction, conjunctie: nevenschikkend voegwoord (en, of, want), afgekort als Conj of C. Complementizer: speciale term voor onderschikkend voegwoord (dat, of), afgekort als Comp of C. Voorbeelden van twee soorten of: neem je soep of salade? Weet je of Jan komt?

Subcategorieën Proper name, eigennaam, afgekort als PN: Jan, Susanne, Sinterklaas,.. Pronoun, pronomen, persoonlijk voornaamwoord: ik, hij, hem, hun. Auxiliary of hulpwerkwoord, afgekort als Aux: hebben, zijn, worden, kunnen, willen, .. Ik heb geslapen, hij is gekomen, hij wordt gekust, ik kan komen, hij wil komen.

Benoemen van woordgroepen Categorie hoofd van constituent geeft naam aan woordgroep: Naamwoord – naamwoordelijke constituent NP: de man, Sinterklaas Determinator – determiner phrase DP: de man, iedere student Werkwoord – werkwoordelijke constituent VP: lachte, zag de man Voorzetsel – voorzetselgroep PP: met de verrekijker, in de tuin

Nieuwe categorieën Zin, sentence, clause: S (‘complete thought’). RelClause: relatieve bijzin: vluchten die vertrekken in de ochtend GerundVP: flights departing in the morning Wh-NP: Welke van deze vluchten zijn direct?

Taalvariatie Niet alle talen gebruiken dezelfde woordgroepen (b.v. Nederlands heeft geen gerund). Let op: wanneer je herschrijfregels formuleert voor de taal in je project, zorg dan dat ze alle grammaticale constructies genereren, en geen ongrammaticale. Met herschrijfregels formuleer je een grammatica die ‘blind’ moet worden toegepast.

Knopen benoemen [Nman] [Aoude] [Dde] [N’oude man] [NPde [N’oude man] [DPde [N’oude man]

Benoemen van knopen in boom S NP/DP VP Det N’ V PP alle liggen A N P NP blauwe boeken op D N de tafel

Herschrijfregels Herschrijfregels, productieregels Fonologie, morfologie: vaak finite state. Voor syntaxis meestal: context-vrije grammatica Phrase structure rules zijn formules om woordgroepen mee te maken. A  B C A bestaat uit B en C, C volgt op B bv. S  NP VP ‘Jan lachte’, ‘de man viel’

Algemene principes Algemene vorm van zo’n herschrijfregel: A  1 ... n Waarbij A is een non-terminaal symbool (een categorie), 1 is een (non-)terminaal symbool (een categorie of een woord) Er is een startsymbool S.

Contekstvrije grammatica Een context-vrije herschrijfgrammatica G (een CFG) is een verzameling van phrase structure regels met een startsymbool S. G genereert een taal: de verzameling strings die bestaat uit terminale symbolen afgeleid uit S. Derivatie: de stapsgewijze productie van een rijtje woorden (en tegelijk een boom) door een grammatica.

Derivatie: bouwen van een boom S startsymbool NP VP door S  NP VP Det Nom VP door NP  Det Nom de Nom VP door Det  de de Noun VP door Nom  Noun de vrouw VP door Noun  vrouw de vrouw Verb NP door VP  Verb NP de vrouw kust NP door Verb  kust de vrouw kust Det Nom door NP  Det Nom de vrouw kust de Nom door Det  de de vrouw kust de Noun door Nom  Noun de vrouw kust de man door Noun  man

Oefeningen 1) Maak oefening 12.1 uit het boek. 2) Check of je de structuren kunt afleiden door middel van de in het boek gegeven regels. Introduceer nieuwe herschrijfregels indien nodig.