De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Intra-auteurvariatie in negatie: de brieven van P.C. Hooft

Verwante presentaties


Presentatie over: "Intra-auteurvariatie in negatie: de brieven van P.C. Hooft"— Transcript van de presentatie:

1 Intra-auteurvariatie in negatie: de brieven van P.C. Hooft
Feike Dietz, Marjo van Koppen, Irene Kramer & Marijn Schraagen Utrecht University/UiL-OTS/ICON

2 Onze pilot is ingebed in een groter onderzoeksproject (NWO, Vrije competitie, 2016-2019)

3 Inkadering binnen grotere project
In de Gouden Eeuw zien we heel veel taalvariatie, zowel tussen auteurs (=inter-author variation) als binnen auteurs (=intra-author variation). Onderzoek naar taal in de Gouden Eeuw richt zich tot nu toe vooral op (i) invloed van standaardisatie op taalverandering, (ii) variatie tussen (groepen) sprekers (hoog-/laagopgeleid, mannen/vrouwen). Wij richten ons vooral op een weinig onderzocht type variatie: variatie binnen het taalgebruik van auteurs. Vraag: Wat zijn de patronen van intra-auteurvariatie in de Nederlandse 17e eeuw, en hoe kunnen we die verklaren? Methode: Combinatie van theoretisch-taalkundige, letterkundig/retorische, sociolinguïstische en computationele methodiek.

4 Variatie in negatie: de brieven van Hooft
Wat we weten: Van der Wouden 2007: in Hoofts kringen geldt tweeledige negatie als ouderwets. Paardekooper 2006, p. 26: Hooft stopt met het gebruik van tweeledige negatie in 1638, daarvoor gebruikt hij een- en tweeledige negaties door elkaar. Onze vragen: Taalkundig: Wat zijn de taalkundige contexten waarin Hooft een- en tweeledige negatie gebruikt? Informatiestructuur, zinstype, werkwoordstype, etc. Letterkundig/cultuurhistorisch: Draagt het negatiegebruik bij aan lezerssturing: fungeert het bijvoorbeeld als stijlfiguur? Hangt negatievariatie samen met publiek, brieftype, etc.?

5 van Hooft aan Tesselschade (1633)
Voorbeeld: brief van Hooft aan Tesselschade (1633) Hooft prijst Tesselschades schrijfsels en hoopt meer te ontvangen. Hij looft in het bijzonder een brief die zij schreef aan gezamenlijke vriend Huygens. Het tegenovergestelde ontkennen via een tweeledige negatie om zo het compliment te versterken: hij kan niet anders dan het zo vatten. Tweeledige negatie in combinatie met topicalisatie in linkerperiferie en daarna inversie in de hoofdzin: zo ontstaat ruimte voor extra negatieclitic? Wat hij meent met het topswaer van lauwer, en kan ik niet anders vatten, dan 's prinssen triomfwaeghen. (606, 1633)

6 Variatie in negatie: de brieven van Hooft
Wat hebben we nodig? Mogelijkheid om systematisch te zoeken op enkele en tweeledige negatie in Hoofts brieven. Treden tweeledige negaties vaak op in litotes-zinnen? Gaan tweeledige negaties vaak samen met een uitgebreide linkerperiferie? En met inversie? Hoe lossen we dat op? Nederlabpilot

7 Nederlabpilot: ons team
Nederlabproject wordt met name uitgevoerd door: Marijn Schraagen, postdoc in ons project, computationeel taalkundige Negen studentassistenten, aangestuurd door Irene Kramer, RMA-student Kunnen we meteen even benadrukken: Dat Marijn er nu niet is vanwege bezoek aan Zweden in het kader van deze pilot, alleen maar mooi! - Het geld van Nederlab niet opgaat aan ons, maar puur aan ons studententeam  en we zien dit dus niet alleen as een pilot voor hoe we digitaal onderzoek kunnen doen, maar ook hoe we met studenten zulk onderzoek kunnen doen

8 Nederlabpilot: onze methode
Digitaal annoteren van de brieven van Hooft met grammaticale, sociolinguistische en letterkundige informatie. Via de volgende stappen: Stap 1: PoS-Tagging van brieven van Hooft door Adelheid (Rem 2007), beschikbaar gesteld door Hans van Halteren digitale editie brieven Hooft (Tricht 1976) beschikbaar gemaakt door de DBNL Stap 2: Ontwikkelen annotatietool, Gustave (Geautomatiseerde Sociolinguistische en Taalkundige Annotatie van Vroegmoderne Edities) Stap 3: Uitbreiden van de PoS-tagging met aanvullende grammaticale kenmerken en toevoegen van sociolinguistische/letterkundige informatie. Stap 4: Ontwikkelen annotatiehandleiding Stap 5: Handmatig corrigeren van deze PoS-tagging door student- assistenten Stap 6: Integreren van de verrijkte brieven in de Nederlab-interface

9 Stap 2: GuSTAVE: PoS-tagging
Geautomatiseerde Sociolinguistische en Taalkundige Annotatie van Vroegmoderne Edities

10 Stap 2: GuSTAVE: PoS-tagging

11 Stap 2: GuSTAVE: PoS-tagging

12 Stap 3: GuSTAVE: Extra grammaticale categorieën
Bijvoorbeeld: negatieclitic nom / non-nom

13 Stap 3: GuSTAVE: Sociolinguistische annotatie

14 Stap 3: GuSTAVE: Sociolinguïstische annotatie

15 Stap 4: Annotatiehandleiding
Geïnspireerd door bestaande handleidingen, verrijkt met voorbeelden, groeit gaandeweg.

16 Stap 5: Handmatige controle door studentassistenten
Aanpak: Werkplekken beschikbaar om samen te werken Afstemming en uitwisseling via tweewekelijkse bijeenkomst en Google Docs-bestand Irene Kramer als vast aanspreekpunt voor vragen Gestart met allemaal dezelfde testbrief Daarna kreeg iedereen een eigen set brieven toegewezen, geheel random (adressanten, periode etc. door elkaar). Per tien brieven wordt er één door twee assistenten gedaan. (Deze aanpak is afgestemd met een statisticus.)

17 Stap 5: Handmatige controle door studentassistenten
Waar staan we nu? Startperiode was tijdsintensiever dan gehoopt: technische problemen, studenten hadden tijd nodig het werk in de vingers te krijgen Het werk gaat nu steeds sneller! Totale woordenaantal Hoofts brieven tot 1638: Streven: woorden handmatig controleren. We zitten nu op de helft van die helft: woorden.

18 Stap 5: Handmatige controle door studentassistenten
Analyse van fouten en inconsequenties, op basis van een steekproef van drie brieven van verschillende annotatoren: 340 verschillen op 1422 woorden. Fouten en inconsequenties kennen vaak bepaalde patronen. In ongeveer 20%: verschil op het terrein van werkwoorden: Ongeveer de helft van de fouten komt doordat de ene annotator méér features invult dan de andere. In ongeveer 20% van de gevallen: verschil van mening over of het een conjunctivus is of niet. In ongeveer 20% van de gevallen: verschil van mening over of het verleden of tegenwoordige tijd is. In ongeveer 10% van de gevallen: verschil van mening over of het werkwoord lexicaal is of niet. In ongeveer 20%: verschil op het terrein van naamvallen: In een derde van de gevallen gaat het om verschil in ‘nom’ / ‘nonnom’   ‘UEd. [Verplichte] dienaer’? Uit verslag Irene: De werkwoorden worden in 79 gevallen verschillend geannoteerd In 30 gevallen komt dat doordat de ene annotator wel +form noteert en de andere niet. In 15 gevallen bestaat een verschil van mening over of een werkwoord in de conjunctivus staat of niet. In 11 gevallen verschilt de geannoteerde tijd (verl/tegw) Verder verschillen de annotatoren in 8 gevallen van mening over of een werkwoord lexicaal is of niet-lexicaal. 5 keer werd een werkwoord door de ene annotator geannoteerd als infinitivus, terwijl de andere annotator het geen infinitivus vond. Ik heb, zodra dit voorkwam, geen pers0, getal0 en tijd0 geturfd, maar alleen ‘inf’. In 4 gevallen is een van de annotatoren vergeten tijd, getal of lex aan te geven.

19 Stap 6: Integreren verrijkte brieven in Nederlabinterface
Doel: onze annotaties toevoegen aan de FoLiA-bestanden van Nederlab, zodat Hoofts brieven kunnen worden doorzocht op tags en annotaties. Marijn werkt nu aan de precieze alignment in de tokenisatie.

20


Download ppt "Intra-auteurvariatie in negatie: de brieven van P.C. Hooft"

Verwante presentaties


Ads door Google