Inleiding Taalkunde CKI, Blok 4, 2010/11 Docenten: Hanna de Vries Anna Chernilovskaya Yoad Winter SAs: Merlijn Boogerd Maaike de Boer Marc van Zee WELKOM!
Inleiding op vandaag Wat is taalkunde? Taal en communicatie. Geschiedenis van de taalkunde in vogelvlucht. Taal en cognitie/taalkunde in CKI. Indeling van het vakgebied.
En wat doet taalkunde in het programma van CKI? Wat is taalkunde? En wat doet taalkunde in het programma van CKI?
Wat is taalkunde? Taalkunde is de wetenschappelijke studie van de natuurlijke taal van mensen. Zie: The sci.lang FAQ: 1 - 7 Talen: Nederlands, Engels, Russisch, Zweeds, Chinees, Swahili, Endo, Sanskrit, Nederlandse gebarentaal,…
Dus niet: dieren Compositionaliteit Conventionaliteit Functionaliteit Verschillen Compositionaliteit Conventionaliteit Functionaliteit Zie: semiotiek, biologie
Dus niet: kunstmatige talen Esperanto 1e orde predikatenlogica Prolog, Java Zie: semiotiek, logica, informatica
Gesproken taal Nederlands, Russisch, Engels, etc. bestonden eerder als gesproken taal dan geschreven. Schrift: afgeleide van de primaire gesproken taal (Oud Hebreeuws/Grieks, Latijns). Niet altijd gesproken: doventaal, b.v. Nederlandse gebarentaal, American/British sign language. http://www.ru.nl/corpusngt/
Twee eigenschappen van taal - Complexe structuren - Complexe communicatie
Taal en taalstructuur Structurele aspecten: Hoe zitten woorden in elkaar? Zinnen? Teksten? Welke taalkennis zit in ons hoofd? Interactie met andere cognitive modules? Modellering van taal in kunstmatige systemen (taal- en spraaktechnologie).
Taal en communicatie Centrale functie van taal: communicatiesysteem. Intentioneel: informatie overdracht. Wat doen sprekers en hoorders met taal? Sociale aspecten: man/vrouw verschillen, jongerentaal
Formeel model van communicatie Shannon-Weaver: the mathematical theory of communication (1949)
Spreker en hoorder Spreker Hoorder Begrip boodschap Verstaan Horen boodschap Formulering Spreken spraakklanken
Soorten Taalwetenschap Traditionele Taalwetenschap: Descriptive Linguistics (Typologie); Historical Linguistics Vanaf 19e eeuw ook: Anthropological Linguistics Vanaf 20e eeuw ook: Theoretical and Mathematical Linguistics Neuro- and Psycho- Linguistics (o.a. taalverwerving) Computational Linguistics/ Natural Language Processing/ Taaltechnologie
Geschiedenis van de Taalkunde in vogelvlucht Taalkunde als wetenschapsgebied heeft een lange geschiedenis: Panini ( 500 B.C), Plato ( 400 B.C). Panini: taal als een systeem van regels en eenheden Plato: is taal natuurlijk of conventioneel?
Vroeg-moderne tijd Eerste grammatica’s van Frans, Engels, volgens klassieke grammatica’s van Grieks, Latijn. Arnauld & Lancelot (1660). Grammaire générale et raisonnée de Port-Royal. Verlies van Latijn/Grieks als enige talen voor wetenschap interesse in ‘volkstaal’. Universele, logische principes van alle natuurlijke talen
18e/19e eeuw (1786) Sir William Jones: “sprung from some common source” (1922) Grimm’s law, o.a. p > f (pater > father) (1827) Wilhelm von Humboldt: oneindig gebruik van eindige modellen.
19e eeuw Darwinistisch gedachtengoed: survival of the fittest. Speurtocht naar het begin van taal (taalgenese) Ontwikkeling van talen in de tijd; uitsterven van talen. genetische verwantschap: taalfamilies. Charles Darwin
Taalfamilies Talen binnen één familie: onderling verwant, ontwikkeld uit één voorouder. Vaak: voorouder gereconstrueerd aan de hand van overgeleverd materiaal. Talen die niet kunnen worden ondergebracht in een familie: geïsoleerde talen of isolaten. http://nl.wikipedia.org/wiki/Taalfamilies
Indo-Europese taalfamilie
Taalfamilies in Afrika
Begin 20e eeuw Studie van inheemse Indianentalen V.S. door Boas, Whorf en Sapir. Bewustzijn dat talen sterk verschillen. B.v. tijdssysteem Hopi vs. Engels. Sapir-Whorf hypothese: taal bepaalt hoe je de werkelijkheid ervaart. Taal is cultureel bepaald, dus cultuur van invloed op waarneming. http://en.wikipedia.org/wiki/Sapir-Whorf_hypothesis
Eskimo’s en sneeuw Boas (1911): Eskimo's hebben vier verschillende woorden voor sneeuw: aput ("sneeuw op de grond"), gana ("vallende sneeuw"), piqsirpoq ("opwaaiende sneeuw") en qimuqsuq ("sneeuwjacht"), vs. Engels. Whorf: minstens zeven woorden, sindsdien: tientallen, honderden.. Ondersteuning Sapir-Whorf hypothese?
Pullum: Geen wezenlijk verschil Inuit/Engels. Pullum: “C. W. Schultz-Lorentzen's Dictionary of the West Greenlandic Eskimo Language (1927) gives just two possibly relevant roots: qanik, meaning 'snow in the air' or 'snowflake', and aput, meaning 'snow on the ground'. Then ask whether the speaker can cite any more.” 1. apun: sneeuw 2. aput: uitgespreide sneeuw 3. nutagak: poedersneeuw 4. aniu: samengedrukte sneeuw 5. ersertok: bewegende sneeuw 6. akeirorak: nieuwe bewegende sneeuw 7. pukak: suikersneeuw 8. pokaktok: zoutachtige sneeuw 9. ayak: sneeuw op kleren 10. apun: sneeuw 11. aput: uitgespreide sneeuw 12. nutagak: poedersneeuw 13. aniu: samengedrukte sneeuw 14. ersertok: bewegende sneeuw 15. akeirorak: nieuwe bewegende sneeuw 16. pukak: suikersneeuw 17. pokaktok: zoutachtige sneeuw
20e eeuw Grondleggers van de moderne taalkunde: Ferdinand de Saussure, Noam Chomsky. Ferdinand de Saussure Noam Chomsky
Saussure ( 1920): Cours de linguistique générale. Onderscheid diachronie – synchronie. Diachronie: ontwikkeling van talen in de tijd (b.v. Latijn – Romaanse talen). Synchronie: structuur van een taal op een bepaald moment. Taal is meer dan een woordenlijst: taal als systeem. Conventionele relatie vorm-betekenis.
Noam Chomsky (1) 1956: Syntactic structures. Zinnen hebben een syntax gekarakteriseerd door een formele grammatika met een wiskundige structuur. Colorless green ideas sleep furiously Furiously sleep ideas green colorless Generatieve grammatica: met wiskundige mechanismen taal beschrijven.
Noam Chomsky (2) Taal is creatief: met een beperkte verzameling grammatika regels en een eindig aantal woorden kunnen mensen een oneindig aantal zinnen produceren, ook zinnen die nooit eerder zijn uitgesproken. Leerbaarheidsprobleem: hoe leren kinderen dit? Aanname: kinderen hebben aangeboren kennis van de grammatikale struktuur die alle talen gemeenschappelijk hebben: universele grammatika. Anti-behaviorisme: taalkunde is onderdeel van de pschologie.
Taalkunde anno nu Voortzetting van generatieve grammatika, maar ook andere grammatikamodellen. Niet alleen aandacht voor taalstructuur in nauwe zin, maar ook leren van taal door kinderen (taalontwikkeling), taal en cognitie, taalvariatie, taalevolutie, taal en logica, computationele linguistiek, taal- en spraaktechnologie.
Taalkunde binnen cki Cognitiewetenschap bestudeert natuurlijke intelligentie. KI bouwt systemen die intelligent gedrag vertonen.
Cognitie Cognitieve processen hebben te maken met kennis, denken en waarneming. Bewuste mentale processen: wiskunde, schaken. Onbewuste mentale processen: herkennen van een voorwerp, een gezicht, omgaan met taal.
Maar dat weten we toch? Kennis van taal is onbewust (1) Er werd op straat gedanst. (2) Op straat werd er gedanst. Mag het woordje er worden weggelaten? Representatie van taalkundige kennis in brein en computer (architecturen voor cognitie).
Taalkundige vragen Waarin bestaat onze kennis van taal? ‘Langue’ of competence Hoe wordt onze kennis van taal gebruikt? ‘Parole’ of performance Hoe wordt kennis van taal geleerd? taalverwerving of L1 acquisitie Verschillen en overeenkomsten tussen talen Taaltypologie, vergelijkende taalkunde, dialectologie
Competence Grammatica als mentale representatie van kennis van moedertaal (‘native speaker’) Onbewuste kennis: belang van intuïties (moedertaalsprekers) Relatie tussen taalvermogen en andere cognitieve vermogens? Is taal ‘anders’?
Performance Haspelen, onvolledige, ongrammaticale zinnen: ‘performance errors’. Menselijke taalverwerking: robuust (vgl: computers). Psycholinguïstiek: performance geeft inzicht in competence Relatie taal en taalgebruik: soorten teksten, rhetorica, coherentie: communicatiekunde.
Taal en talen Relatie tussen taal en talen (Nederlands, Engels, Chinees, Swahili, gebarentaal..) Universele grammatica en taaltypologie Taaltypologie: data! (‘bedreigde talen). Variatie tussen talen werpt licht op universele eigenschappen van taal (en menselijke cognitie).
Taal en maatschappij Relatie tussen taal en samenleving: man/vrouw verhouding, politiek discours, sociale klassen, murks Sociolinguistiek Taal en cultuur Antropologische taalkunde
Toegepaste taalkunde Taalonderwijs, vertalen Computationele taalkunde: representatie, verwerking, verwerving door computers (sprekende computers, automatisch vertalen, spelcheckers, kennisssytemen, corpora/databases, natuurlijke taal interfaces, etc). Klinische taalkunde (afasie, stotteren, sli)
Meer taalkunde in CKI programma Natuurlijke taalverwerking (taal en logica) Semantiek (formele betekenis) Variatie in betekenis (typologie, taal en cognitie) Taal- en spraaktechnologie
Inleiding Taalkunde Wat leer je in deze cursus? Basisprincipes, methodes en belangrijke vragen van het vakgebied Grondslagen van het bouwen van kunstmatige taalsystemen
Literatuur Juravsky & Martin (2008): Speech and language processing Een hoofdstuk uit Fromkin (2000)
Website en Mailing List http://www.phil.uu.nl/~achern/itk11/ Mailing list: studenten moeten zelf inschrijven (van webpagina)
Tijdschema Week 1 t/m 4: inleiding + taalstructuur (klanken, woorden, zinnen) Week 4 t/m 5: computationele linguistiek Week 6 t/m 8: betekenis + discourse Week 8 t/m 9: taalverwerving + taalevolutie (gast col.) + taaltypologie (gast col.) Week 10: vragenuurtje + eindtoets
Toetsing 20%: Vier WCs en vier HW opdrachten – weken 3,4,6,8 20%: Takehome toets – week 5 60%: Eindtoets – week 10