Partiële r² Predictie van y gebaseerd op z alleen Bepaal az en bz zo dat minimaal is Predictie van y gebaseerd op x en z Bepaal azx b1 en b2 zo dat minimaal is In welke mate neemt de fout in de voorspelling van y af door naast z ook x te beschouwen
Toepassing Geboorte% Echtsch.% .347 1 Huwelijks% .507 .567 X = Geboorte % Y = Echtsch. % Z = Huwelijks % Verwoording van het resultaat: Bij het voorspellen van Echtscheidings% van een staat op basis van het Huwelijks% wordt het aantal fouten van die voorspelling nog met minder dan 1 % gereduceerd als we naast het Huwelijks% ook het Geboorte% kennen. Het Geboorte% en het Echtscheidings% van een staat zijn in essentie niet gerelateerd indien we controleren voor Huwelijks%. Voor constant gehouden Huwelijks% vinden we bijna geen verband tussen het Geboorte% en het Echtscheidings% van een staat.
Verband tussen een continue variabele en een dichotome variabele Aantal puzzles opgelost door Autocratische Teams Democratische Teams 8 10 12 7 9 11 13 Gem.= 9.6 11.0 y = 9.6 + 1.4x Regressierechte Dummy variabele Autocratisch = 0 Democratisch = 1
r² berekenen Als we de leiderschapsstijl van een team kennen kunnen we de productiviteit van het team 15% beter voorspellen dan zonder die informatie
r² hangt af van verschil tussen groepsgemiddelden en variantie binnen de groepen Hogere r² Hogere r²
Verband tussen r en t-test Bevinding in een steekproef veralgemenen naar de populatie H0 : er is geen verband tussen dichotome variabele x (groep) en continue variabele y H0 is onwaarschijnlijk indien r² hoog is. WAT IS HOOG? Statistiek indien in de populatie geen verband bestaat tussen x en y, dan volgt r voor steekproefdata een t-verdeling
Student t-verdeling versus Normaalverdeling .4 t(5) .3 .2 Type I fout .1 -3 -2 -1 1 2 3
Voorbeeld - Huwelijken / Echtscheidingen / Geboorten (per 1000 inw Voorbeeld - Huwelijken / Echtscheidingen / Geboorten (per 1000 inw.) in de VS Correlaties (N=48-1) Las Vegas! Huwelijks% Echtsch.% Geboorte% r = .504 r² = .254 r = .347 r² = .120 - r = .567 r² = .321 Is een correlatie van .347 hoog genoeg om te beluiten dat in de “populatie” een verband bestaat tussen geboorte% en echtscheidings%? Vuistregel! Beter: TABEL > 2 Besluit: het verband bestaat naar alle waarschijnlijkheid ook in de populatie
Voorbeeld – leiderschapsstijl en productiviteit r² tussen leiderschapsstijl en productiviteit bedraagt .15 (N=10 teams, r = .39) Besluit: het gevonden verband is niet sterk genoeg om de nulhypothese dat leiderschapsstijl en productiviteit niet gerelateerd zijn te weerleggen ... Dit betekent echter NIET noodzakelijk dat H0 WAAR is !!
Klassieke benadering t-toets Autocratische teams Democratische teams
Statistisch significant Theoretisch relevant Opgelet! Statistisch significant Theoretisch relevant Men kan ALTIJD N zodanig groot nemen dat de t-toets een significant verband oplevert … Voorbeeld: r=.04 r²=.0016 N=3000 levert t = 2,19
Evalueren van onderzoeksdesigns Zijn risico’s voor interne validiteit uitgesloten? (= in hoever effekt UITSLUITEND toe te schrijven aan onafhankelijke variabelen) Geschiedenis Maturatie Instrumentatie Statistische regressie Selectiefout Mortaliteit en non-participatie RANDOMISATIE - CONTROLE GROEP Beantwoordt design aan onderzoeksvraag? Externe validiteit
Random assignment (toewijzing) <> Pretest Redenen om toch een pretest uit te voeren Sensitiviteit van experiment verhogen door matching Plafond effekten (kan afhankelijke variabele nog stijgen/dalen?) Initiële positie (soms enkel effekt voor bepaalde initiële posities) Initiële vergelijkbaarheid (randomisatie niet onfeilbaar / haalbaar) Bewijs van verandering Nadelen Sensitisering voor experimentele conditie door bewustmaking (gevaar voor externe validiteit waar geen pretest is) Tijd en geld