Binnen of buiten de tang? Binnen of buiten de tang? Lengte als bepalende factor voor de plaatsing van voorzetselconstituenten in Nederlandse bijzinnen Annelore Willems Promotoren: Gert De Sutter & Johan De Caluwe Onderzoeksforum 13 februari 2012
Nagaan wat de invloed is van de factor lengte op de positie van VzC’s in de Nederlandse bijzin Taalgebruikers hebben vaak de keuze om voorzetselconstituenten voor [1] of achter [2] de werkwoordelijke eindgroep te plaatsen: 1. dat de bescherming van de privacy van de werknemers bij het beoordelen van geschillen tussen werkgevers en werknemers een kapitale rol || kan spelen ||. 2. dat de bescherming van de privacy van de werknemers een kapitale rol ||kan spelen|| bij het beoordelen van geschillen tussen werkgevers en werknemers. Doel
o.a. Behaghel (1909) & Hawkins (1994, 2000): lengte is een belangrijke factor om woordvolgordevariatie te verklaren Vroeger onderzoek naar de positie van VzC’s heeft beperkingen: Enkel gesproken taalgebruik Methodologische problemen: Jansen (1978, 1979): enkel lengte middenveld Braecke (1990): lengte ondergeschikt aan focus Want
Van Haeringen en schrijfadviseurs (o.a. Renkema): tangconstructies vermijden extra geheugenbelasting Gibson (1998, 2000): de begrijpelijkheid van een zin is afhankelijk van de afstand tussen twee zinsdelen die op elkaar betrokken moeten worden (hier subject en het werkwoord) Hypothese 1: voorkeur om het subject en het werkwoord zo dicht mogelijk bij elkaar te plaatsen VzC’s verschijnen in extrapositie Over lengte MV
Kooij 1978: Extrapositie betekent juist voor een lange VzC verlichting van de spanning In Jansen & Wijnands 2004: Hoe langer de constituent en hoe ingewikkelder zijn interne structuur, des te meer zal het achterin de zin te vinden zijn (Behaghel 1909) Hypothese 2: de lengte van de VzC beïnvloedt de variatie Lengte VzC is positief gecorreleerd met extrapositie Over lengte VzC
Dutch Parallel Corpus (DPC) 10 miljoen woorden Parallel en vergelijkbaar corpus: NL als brontaal (> FR, EN) en doeltaal (< FR, EN) Ingedeeld in teksttypes: ADMIN, JOURNAL, INSTR, NON-FIC, FIC Data
Selectiecriteria: Enkel Nederlandstalige data Enkel journalistieke teksten Enkel bijzinnen ingeleid door het grammaticaal onderschikkend voegwoord ‘dat’ Enkel VzC’s die zowel in het middenveld als in extrapositie kunnen staan Data
Resultaat: 1919 manueel gecontroleerde zinnen Voor deze presentatie 501 zinnen Data VzC in MVVzC in AV 501 zinnen 45%22755% zinnen 44%84556%1074
Lengte operationaliseren middenveld Aantal lettergrepen tussen kern subject en werkwoordelijke eindgroep dat de bescherming van de pri · va · cy van de werk · ne · mers een ka · pi · ta · le rol ||kan spelen|| bij het beoordelen van geschillen tussen werkgevers en werknemers. Aantal woorden tussen kern subject en werkwoordelijke eindgroep dat de bescherming van / de / privacy / van / de / werknemers / een / kapitale / rol Aantal constituenten tussen subject en werkwoordelijke eindgroep dat de bescherming van de privacy | van de werknemers | een kapitale rol Methode, analyse
Lengte operationaliseren VzC Aantal lettergrepen dat de bescherming van de privacy van de werknemers een kapitale rol ||kan spelen|| bij het be · oor · de · len van ge · schil · len tus · sen werk · ge · vers en werk · ne · mers. Aantal woorden dat de bescherming van de privacy van de werknemers een kapitale rol ||kan spelen|| bij / het / beoordelen / van / geschillen / tussen / werkgevers / en / werknemers /. Methode, analyse
Gepartitioneerde chi-kwadraatanalyse: Methode, analyse Interval 1Interval 2Interval 3Interval 4 MV lettergrepen 0 en 1 ≥ 2 MV woorden 0 en 12 ≥ 3 MV constituenten 01 tot 4 VzC lettergrepen 23 tot 78 tot 12 ≥ 13 VzC woorden 2 of 34 tot 67 tot 11≥ 12
Logistische regressieanalyse: Analyse van de individuele impact van de verschillende lengtes op de keuze tussen middenveld en extrapositie Analyse van verschillende operationaliseringen van de factor lengte Analyse van de globale impact van de lengte van het middenveld en de lengte van de VzC op de keuze tussen middenveld en extrapositie Methode, analyse
Logistische regressieanalyse met 1 predictor: Resultaten FactorO.R.P-value MV lettergrepen * MV woorden *** MV constituenten * VzC lettergrepen e-09 *** VzC woorden ***
Logistische regressieanalyse: Resultaten MV FactorO.R.P-value MV lettergrepen * MV woorden *** MV constituenten * VzC lettergrepen e-09 *** VzC woorden ***
Logistische regressieanalyse: Resultaten MV %AV Interval 1Interval 2Interval 3 Lettergrepen47%57% Woorden51%70%51% constituenten45%57%
Logistische regressieanalyse: De verschillende lengtes hebben een statistisch significante impact op de variatie Effect lettergrepen en constituenten vergelijkbaar Hypothese 1: voorkeur om het subject en het werkwoord zo dicht mogelijk bij elkaar te plaatsen kan niet worden bevestigd Interval 1 lettergrepen/constituenten: ± 50% VzC’s in het middenveld Interval 2 lettergrepen/constituenten: meer VzC’s in extrapositie maar nog altijd ± 40% middenveld Besluit MV
Logistische regressieanalyse: Resultaten VzC FactorO.R.P-value MV lettergrepen * MV woorden *** MV zinsdelen * VzC lettergrepen e-09 *** VzC woorden ***
Logistische regressieanalyse: Resultaten VzC %AV Interval 1Interval 2Interval 3Interval 4 Lettergrepen18%44%63%89% Woorden43%54%87%96%
Logistische regressieanalyse: De verschillende lengtes hebben een statistisch significante impact op de variatie Effect lettergrepen en woorden vergelijkbaar Hypothese 2: de lengte van de VzC beïnvloedt de variatie kan worden bevestigd Lengte VzC is positief gecorreleerd met extrapositie Besluit VzC
Logistische regressieanalyse: Analyse van de globale impact van de lengte van het middenveld en de lengte van de VzC op de keuze tussen middenveld en extrapositie Geen interactie-effect Geen multicollineariteit C = Resultaten MV en VzC FactorO.R.P-value MV lettergrepen * VzC lettergrepen e-09 ***
Lange VzC’s meer in extrapositie om middenveld te verlichten om zin makkelijker te verwerken Maar toch veel VzC’s in middenveld? Verklaring
Andere verklaringen: Chomsky (1975): “it is interesting to note that it is apparently not the length in words of the object that determines the naturalness of the transformation, but, rather, in some sense, its complexity.” Levy (2008) verrassingstheorie Hawkins (1994): “constituents occur in the orders they do so that syntactic groupings and their immediate constituents can be recognized and produced as rapidly and efficiently as possible in language performance” Verklaring
Complexiteit operationaliseren Het middenveld is complex als één van de volgende elementen aanwezig is: nabepaling: vb. dat de helft van de Belgen klaagt over stress samentrekking: vb. dat verkopers en marketeers deel uitmaakten van dezelfde afdeling bijzin: vb. dat zelfs jongeren die niet in het buitenland willen werken, aangetrokken worden door bedrijven die internationaal actief zijn tussenvoeging: vb. dat een verstrenging van de maatregelen, met eventuele veroordelingen, kan leiden tot een overbevolking van de gevangenissen Vooruitblik
Invloed vertaald/ niet-vertaald? Logistische regressieanlayse voor 501 zinnen: geen significant effect Vooruitblik FactorO.R.P-value Vertaald/niet-vertaald
Suggesties? Vragen?