Het bos van de Nederlandse zinsbouw? Ik dacht van ik weet de weg wel. Liesbeth Augustinus FWO-Vlaanderen / KU Leuven Dag van de Nederlanse Zinsbouw Gent, 21 december 2018
December 2017: “weg met dat woord” (jaarlijkse verkiezing van het INT) Ik heb zoiets van, naast genderneutraal Opvallend: constructie i.p.v. lexicaal element
December 2017: “weg met dat woord” (jaarlijkse verkiezing van het INT) Ik heb zoiets van, naast genderneutraal Opvallend: constructie i.p.v. lexicaal element
Overzicht Inleiding Literatuur & onderzoeksvragen Methodologie Resultaten Conclusies en verder onderzoek
Literatuur Quotative van-constructions involve the QUOTATIVE PREPOSITION van, which is followed by an optional hesitation marker like eh ‘er’, an intonation break, and a quote. (…) the quote can be declarative or interrogative in nature Broekhuis & Corver (2015)
Literatuur Hoekstra (2010) Fries (fan) versus Nederlands (van) ~ Engelse like, bv. I was like, “Ah I don’t want to go out.” Algemene kenmerken van van-constructies Informeel, spreektalig Complementen: zinnen (ik dacht van ik weet het wel) en frasen (ik dacht van het wel te weten) Citaat: directe rede (hij zei van ik kom niet) of indirecte rede (hij zei van ik kwam niet) citaat is eerder een parafrase dan een letterlijk citaat Corpusonderzoek voor het Fries Literatuur: oorsprong en ouderdom niet behandeld in dit praatje Woordsoort van van: voorwerp van discussie
Literatuur Hoekstra (2010) Syntactische functies van de van-zin Lijdend voorwerp bij werkwoorden als zeggen en denken Bijwoordelijke bepaling, bv. Hij praatte zo van ik bemoei me er niet mee weglaatbaar Predicatief gebruik, bv. * In het begin was iedereen van dan moeten we nu ook zuiver spreken (enkel in het Fries) Andere gevallen Zoiets (hebben) van lijkt op bijwoordelijke bepaling/bijzin, maar van-zin is niet weglaatbaar Zo hebben van (enkel in het Fries) Predicatief gebruik: cf Engelse be like
Literatuur Coppen (1994, 2010) Synchronie en diachronie van de heb-zoiets-van-constructie idiomatische constructie Constructiegrammaticaal perspectief: relatie met verwante constructies Functie van hebben, functie van zo (approximatief), functie van het citaat (innerlijke stem; geen letterlijk citaat)
Literatuur Coppen (1994, 2010) Continuum van constructies: Hij zei: “Geef die appelmoes eens door.” Hij zei van: “Geef die appelmoes eens door.” Hij zei zo van: “Geef die appelmoes eens door.” Hij zei zoiets van: “Geef die appelmoes eens door.” Hij had zoiets van: “Geef die appelmoes eens door.” Functie van hebben, functie van zo (approximatief), functie van het citaat (innerlijke stem; geen letterlijk citaat)
Doel van het onderzoek Netwerk van constructies in kaart brengen Vertrekpunt: constructies met een van-complement Doel: inzicht krijgen in het grotere netwerk van constructies gerelateerd aan de heb-zoiets-van-constructie Vergelijking tussen het gebruik van het quotatieve van en andere van-constructies Eerder aanpak van Hoekstra: verschillende van-constructies, kijken hoe ze zich tot elkaar verhouden
Doel van het onderzoek Netwerk van constructies in kaart brengen Ik heb zoiets van idiomatisch Ik dacht van ik zal dat morgen wel doen quotatieve van Ik dacht: “ik zal dat morgen wel doen” directe rede Ik vroeg nog van even te wachten van + beknopte bijzin De politie beweert van wel polaire van Constructies op basis van de literatuur Hoe verhouden de constructies zich ten opzichte van elkaar?
Onderzoeksvragen Welke (werk)woorden kunnen een van-complement selecteren? Welke functie heeft het van-complement in de zin? (direct object, adjunct…) Welke constructies kunnen we onderscheiden, naast het quotatieve van? In welke gevallen kan het van-complement (niet) beschouwd worden als een citaat in de directe rede? Wat is de positie van de heb-zoiets-van-constructie in het netwerk? Wat is de verhouding tussen de verschillende constructies?
Overzicht Inleiding Literatuur & onderzoeksvragen Methodologie Resultaten Conclusies en verder onderzoek
Methodologie Corpusonderzoek, aan de hand van syntactisch geannoteerde corpora (treebanks) nee want ik kreeg van uh uw gesprekspartner heeft opgehangen. [CGN]
nee want ik kreeg van uh uw gesprekspartner heeft opgehangen. [CGN] Syntactische annotatie (naast lemma en woordsoorten) Syntactische functie van woorden en constructies Bijkomend voordeel: gemakkelijk om ‘discontinue constructies’ te detecteren (NL middenveld, stopwoord in voorbeeldzin) Ideaal voor van-constructies: ik had gisteren nog zoiets van uhm ik zal dat morgen wel doen.
Methodologie Corpusonderzoek, aan de hand van syntactisch geannoteerde data (treebanks) Waarom boomstructuren? Data: CGN treebank en LASSY klein
Treebanks CGN treebank LASSY klein Gesproken Nederlands Geschreven Nederlands Stylistische en regionale verschillen conversaties vs voorgelezen tekst NL vs VL Stylistische verschillen Wikipedia vs wetsteksten ± 1M woorden 130k zinnen 65k zinnen Manueel gecorrigeerd Daarnaast: automatisch geannoteerde treebanks
Methodologie Corpusonderzoek, aan de hand van syntactisch geannoteerde data (treebanks) Waarom boomstructuren? Data: CGN en LASSY klein Zoeken in boomstructuren Met een voorbeeld Met XPath
Zoeken in bomen
Zoeken in bomen
Zoeken in bomen
Zoeken in bomen
Zoeken in bomen
GrETEL https://gretel.ccl.kuleuven.be Example-based: ik had zoiets van we zien dat morgen wel
Zoekopdracht XPath //node[@cat=“svan”] zoekt alle treffers met een SVAN-label Selector (hd): woordsoort en lemma Syntactische relatie tussen SVAN-knoop en selector (bv. obj1, vc, mod) Interne structuur van-complement: syntactische categorie (bv. smain, sv1, bw) Aanwezigheid van zo(iets) CGN: regio (NL, VL) register (bv. spontane gesprekken, voorgelezen tekst)
Annotatie resultaten (Semi-)automatische en manuele indeling in 5 constructietypes Op basis van de literatuur en de manuals: Quotatieve van Ik heb zoiets van ik zal dat morgen wel doen Ik dacht van ik zal dat morgen wel doen Infinitiefcomplement Ik vroeg nog van even te wachten Ik zei nog van morgen pas te komen Polaire van De politie beweert van wel Indeling: op basis van annotatiemanuals van CGN en LASSY en op basis van de literatuur op basis van het annotatieprocedé Quotatieve van: in principe directe rede; gemarkeerd indien het een indirecte rede of semi-directe rede is persoonsvorm aanwezig, of een duidelijke uitroep, een citaat Infinitiefcomplement: “Vlaamse van” toegevoegd (in het geval van zijn, of gebruikt in plaats van om) beknopte bijzin, geen persoonsvorm
Annotatie resultaten (Semi-)automatische en manuele indeling in 5 constructietypes Op basis van het annotatieproces: Nominaal complement Een kwestie van welbegrepen eigenbelang. [LASSY] Beschrijvende van maar 'k had zoiets van nou ik had er gewoon geen zin in om naar hem toe te gaan weet je. [CGN] dat ik 't zelf meer zoiets heb van uh dat je je toch wat zekerder voelt over jezelf. [CGN] dat is niks meer van als ik nou hard bezig ben geweest zoals vandaag of hard bezig is relatief… [CGN] Beschrijvende van: nauwelijks sprake van een citaat
Annotatie resultaten Vage grens tussen quotatieve van en beschrijvende van dus uh teksten die heel actueel zijn in de zin van ik kan die vandaag geven en misschien volgende maand niet meer doorgaans niet. [CGN] als ik door de stad liep dat ik echt zoiets dacht van 't is hier benauwd gewoon [CGN] ja niet zo van nou we komen effe bier halen en we gaan weer maar uh ... [CGN] Criteria?
Overzicht Inleiding Literatuur & onderzoeksvragen Methodologie Resultaten Conclusies en verder onderzoek
Resultaten: algemeen CGN: 1 397 SVAN-labels maar 't was heel stom want ik dacht net van uh ... [CGN] van dat uh bij hun uh g*a ... [CGN] van oh die ben ik vergeten. [CGN] CGN (gesproken) LASSY (geschreven) Totaal 1 163 16 1 179 CGN: 1397 SVAN-labels 200 uitgefilterd na manuele check
Resultaten: algemeen CGN (gesproken) LASSY (geschreven) Totaal 1 163 1 179 CGN (NL) CGN (VL) Totaal 890 273 1 163
Resultaten: algemeen Geobserveerd Significant verschil Verwacht CGN (gesproken) LASSY (geschreven) Totaal 1 163 16 1 179 Geobserveerd CGN (NL) CGN (VL) Totaal 890 273 1 163 Significant verschil χ2 =51,15 (p < 0,01) Verwacht: op basis van de verdeling NL – VL in het gehele corpus The Chi^2 value is 51.15. The p-value is < .00001. The result is significant at p < .01 https://www.socscistatistics.com/tests/goodnessoffit/Default2.aspx Goodness of fit Verwacht CGN (NL) CGN (VL) Totaal 775 388 1 163
Resultaten: LASSY Selector Constructie ADJ (bang) N (gevoel, kwestie) WW (besluiten, vinden) Totaal inf-comp 7 np-comp 2 polair 1 5 6 quotatief 10 16 Dan heb ik wel eens het gevoel van ‘Wat doé ik hier eigenlijk?’ Kwestie van het overzicht niet te verliezen. SVAN categorie = verbaal complemet (VC) Zin met gevoel enige voorbeeld van quotatieve van!!! Lijkt qua betekenis sterk op heb-zoiets-van-constructie Geen zo(iets) NP-comp: dat is een kwestie van dagen
Resultaten: CGN Constructies # hits % hits quotatief 1 113 95.70 polair 27 2.32 beschrijvend 12 1.03 inf-comp 7 0.60 np-comp 4 0.34 Totaal 1 163 100 Welke constructies kunnen we onderscheiden, naast het quotatieve van? In welke verhouding? Infinitief-complement bij van komt zeer weinig voor: te dialectisch? ja want anders is dat eigenlijk onnozel van nen theepot te kopen hè. (inf-comp) maar de politie beweert van wel. (polair)
Resultaten: CGN Selector woordsoort # types # hits voorbeelden adj 3 5 bang, bezig, verbaasd bw 1 29 zo n 58 116 idee, verhouding, vraag… vnw 4 11 iets, niks, veel, zoiets vz 2 over, voor ww 95 999 denken, hebben, horen, kijken… Totaal 163 1 163 Welke (werk)woorden kunnen een van-complement selecteren? Literatuur: voornamelijk ww van zeggen en denken verbs normally taking a direct quote in writing
Resultaten: CGN Selector: top 10 substantieven lemma # hits % n idee 17 14.66 gevoel 9 7.76 vraag zin verhaal 4 3.45 brief 3 2.59 discussie reactie beeld 2 1.72 houding en je krijgt dan ook een een handelingsplan van nou doe dat maar met die kinderen. ge moet zo een beetje de spanning inhouden van waar gaan we terechtkomen. je moet denken aan workshopachtige dingen van hoe schrijf ik nou een goed voorstel? Eindejaar = lijstjes Welke (werk)woorden kunnen een van-complement selecteren? Literatuur: voornamelijk ww van zeggen en denken verbs normally taking a direct quote in writing Kwestie: slechts 1 hit! Idee, gevoel: dichts bij heb-zoiets-van
Resultaten: CGN Selector: top 10 werkwoorden en begint ie op zijne stoel te wringen van ja van zo laat mij met rust hè jongen dat hij ja een beetje ons zat te pushen van ga dansen maar ja zelf was ie niet uit z'n dak aan 't gaan zeg maar. ja en ze zit echt te kankeren van shit man zegt ze. lemma # hits % ww zeggen 405 40.54 denken 222 22.22 hebben 100 10.01 zijn 53 5.31 kijken 21 2.10 vragen 19 1.90 zitten 16 1.60 horen 10 1.00 weten 9 0.90 bellen 7 0.70 Welke (werk)woorden kunnen een van-complement selecteren? Literatuur: voornamelijk ww van zeggen en denken verbs normally taking a direct quote in writing
Resultaten: CGN Functie van-complement SVAN-functie hits % voorbeelden direct object 838 72.06 dan denk ik van hoe haal je 't in je hoofd adjunct 274 23.56 daar zit je echt van man. predicatief complement 31 2.67 ah dat was echt zo van jij met die en jij met die? subject 14 1.20 ja want anders is dat eigenlijk onnozel van nen theepot te kopen hè. verbaal complement 4 0.34 dat hij van plan was van daarnaartoe te gaan prepositioneel complement 2 0.17 dat ze d'ruit gaan van nou ja als je dit doet dan d*a n*a dan als je maar lief bent krijg je dit. Totaal 1 163 100.00 Welke functie heeft het van-complement in de zin? (direct object, modificeerder…) Literatuur (Hoekstra): object, adjunct (bijwoordelijke bepaling), predicatief complement
Resultaten: CGN Interne structuur van-complement en ik had juist zoiets van dat die vakantie ook een beetje bedoeld was om juist niks te doen. Ruth belde dus net nog van of we dan kwamen. SVAN-type hits % zin 1 058 90.97 frase 17 1.46 woord 88 7.57 Totaal 1 163 100 Slechts 39 gevallen indirecte rede! In welke gevallen kan het van-complement (niet) beschouwd worden als een citaat in de directe rede? 32 hits indirecte rede
Resultaten: CGN Positie heb-zoiets-van-constructie we hadden zoiets van nou we kijken hier eerst hier in als dat niet lukt dan gaan we 'ns verder rustig aan kijken. lemma # hits % ww # zo(iets) % zo(iets) % ww + zoiets zeggen 405 40.54 10 5.38 2.47 denken 222 22.22 4 2.15 1.80 hebben 100 10.01 91 48.92 91.00 zijn 53 5.31 18 9.68 33.96 … Totaal 999 186 18.62 Wat is de positie van de heb-zoiets-van-constructie in het netwerk? 186 constructies met zo(iets) 29 gevallen zo als selector
Vergelijking literatuur Coppen (1994, 2010) Continuum van constructies: Hij zei: “Geef die appelmoes eens door.” Hij zei van: “Geef die appelmoes eens door.” Hij zei zo van: “Geef die appelmoes eens door.” Hij zei zoiets van: “Geef die appelmoes eens door.” Hij had zoiets van: “Geef die appelmoes eens door.” zo van: “Geef die appelmoes eens door.” Functie van hebben, functie van zo (approximatief), functie van het citaat (innerlijke stem; geen letterlijk citaat)
Overzicht Inleiding Literatuur & onderzoeksvragen Methodologie Resultaten Conclusies en verder onderzoek
Conclusies Corpusonderzoek naar het quotatieve van en gerelateerde constructies Distributie van verschillende patronen Lemma en woordsoort selector Functie van-complement Type van-complement Aanwezigheid van zo(iets) NL vs VL Zeggen van + directe rede: 35% van de constructies Heb-zoiets-van-constructie: 7,8 % van de constructies Lemma en woordsoort selector: meer dan in de literatuur worden vermeld (ww van zeggen en denken, maar ook van houding, manier van doen: doen, kijken) Zeggen: 40% ww Heb-zoiets-van 91% ww+ zoiets 10% ww
Conclusies Gebruik van syntactisch geannoteerde data Voordeel: handig om verschillende eigenschappen van de constructie in detail te bestuderen Nadeel: annotatieschema, annotatiefouten, verschillen tussen corpora Manuele verificatie van (een sample van) de resultaten vaak nodig
Verder onderzoek Beschrijvend van: subconstructie van quotatieve van of aparte constructie? criteria Vergelijking met gerelateerde constructies zonder van (gewone directe rede, partitieve constructies) Verhouding NL – VL in een recenter corpus Theoretische analyse
Vragen of suggesties? liesbeth.augustinus@kuleuven.be Bedankt!