Regressieanalyse Naomi Kamoen
Wat is regressieanalyse? Je gaat de score op de afhankelijke variabele voorspellen op basis van een aantal andere variabelen. De andere variabelen noem je predictoren
Wat is regressieanalyse? Kamoen, Holleman en van den Bergh. Uitgangspunt. Hoe hangt het door de respondent aangekruiste schaalpunt af van: 1. Onderwerp+ van de tekst 2. De vraagversie die de respondent kreeg (hoofdeffect van positieve likertschaal, negatieve likertschaal, sem differentiaal) 3. De interactie tussen versie en onderwerp (verschilt het effect van formulering van studie tot studie?).
Wat is regressieanalyse? Yijk = positieve likertschaal studie 4 + aj + bk + cjk + eijk Model 1a -> onderwerp+ Model 1b -> model 1a + hoofdeffect versie Model 1c -> model 1b +interactie versie * onderwerp+
Wat is regressieanalyse? Stu-die Versie Score (makkelijk) Uitgangspunt. Regressie gewicht Voorspelde Score r kwadraat 4 Pos. Lik 4.5 5 -0.5 (p<0.05) 0.12 = 12% Sem. Dif 0.18 = 18% Sem Dif Neg. Lik 1.0 5.5 6 Sem. Diff 0.1 (p>0.05) 0.20 = 20% Sem Diff Neg Lik 1.2 6.2
Wat is regressieanalyse? Model maken om de score (op een vraag) te voorspellen Meer of minder variabelen in je model Regressiegewichten geven aan wat een nieuwe variabele in het model doet Regressiegewichten kunnen significant zijn of niet Model is beter of minder goed -> r kwadraat
Hoe kunnen jullie regressieanalyse gebruiken? Je hebt mappingsvraag M En een formuleringseffect bij vraag X Dan kun je de score op de mappingvraag gaan voorspellen obv. vraag X De versie van de vraag die de score op M het beste voorspelt is de beste formulering
Hoe werkt regressieanalyse in SPSS? Stap 1: nieuwe variabelen maken 1 dummyvariabele ‘versie1’ versie1 = 1 als vrglversie=1, versie1=0 als vrglversie=2 2 nieuwe variabelen daadwerkelijke score op de vraag als versie 1 is, anders een 0 1e stukje syntax om in spss te ‘runnen’ (vervang eerst de variabele ‘vr14_interessant’ door de variabelenaam van de 7p-vrg uit je eigen file). COMPUTE v1_v14 = vr14_interessant * versie1 . EXECUTE.
Hoe werkt regressieanalyse in SPSS? Stap 2: Eerst ga je alleen kijken of je de score op de mappingvraag kan voorspellen obv. de score op de vraag met een formuleringseffect. REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT vr44_cij /METHOD=ENTER vr14_interessant /SAVE PRED . let op: output staat in file outputregressieI.rtf
Hoe werkt regressieanalyse in SPSS? Stap 3: Daarna ga je kijken wat er gebeurt als je meer variabelen aan het model toevoegt: REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT vr44_cijfer /METHOD=ENTER versie1 vr14_interessant v1_v14 /SAVE PRED . (zie output in file ouputregressieI.rtf)
Hoe werkt regressieanalyse in SPSS? Stap 4: Blijkbaar is er niets significant in dit model. Je haalt de meest oninteressante variabelen uit het model en kijkt opnieuw REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT vr44_cijfer /METHOD=ENTER vr14_interessant v1_v14 /SAVE PRED . (zie output in outputregressieI.rtf)
Hoe werkt regressieanalyse in SPSS? Stel je bekijkt nog een ander woordpaar waarvoor je een formuleringseffect hebt gevonden, namelijk bondig/omslachtig. Je hebt nieuwe variabelen aangemaakt in SPSS. Daarna heb je gezien dat een hogere score op de bondigvraag tot een hogere score op de mappingvraag leidt. Je hebt het hele uitgebreide model geprobeerd en je test nu het model met alleen de drie vraagversies en je krijgt de volgende output. (zie outputregressie2.rtf) Wat zijn je conclusies?
Hoe bepaal je welke vraag de beste is? Negatieve likertschaal Positieve likertschaal Semantisch differentiaal Gemanipuleerde 7punts-vraag r a p o t c i j f e v g
Hoe bepaal je welke vraag de beste is? In dit onderzoek had de mappingvraag 14 hokjes. We zagen dat de constante 5,23 was. 14 – 5,23 = 8,77/7 = 1,25 Positieve likertschaal = stapjes van 0,71 + 0,4 = 1,11 Negatieve likertschaal + semantische differentiaal = stapjes van 0,71 Positieve likertschaal is het beste
Hoe bepaal je welke vraag het beste is? De vraag met de kleinste hellingshoek is het beste (in dit geval dus de negatieve likertschaal) Want: bij die vraag komt een verschil in score op de 7p-schaal het meest overeen met ook een verschil in rapportcijfer (stel je voor: een horizontale lijn, dan komt een 1 op de 7p-schaal overeen met rapportcijfer 5, en een 7 op de 7p-schaal oók. Da’s dus geen goede 7p-vraag)
Hoe werkt regressieanalyse in SPSS? Stel je bekijkt nog een ander woordpaar waarvoor je een formuleringseffect hebt gevonden, namelijk persoonlijk/onpersoonlijk. Je hebt nieuwe variabelen aangemaakt in SPSS. Daarna heb je gezien dat een hogere score op de persoonlijkvraag tot een hogere score op de mappingvraag leidt. Je hebt het hele uitgebreide model geprobeerd en je test nu het model met alleen de drie vraag versies en je krijgt de volgende output. Wat zijn je conclusies?