De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Hoofdstuk 10 Inferentie voor regressie. Beschrijvende hulpmiddelen van H2 voorafgaand aan deze analyses In H2 : kleinste kwadraten regressielijn: –y =

Verwante presentaties


Presentatie over: "Hoofdstuk 10 Inferentie voor regressie. Beschrijvende hulpmiddelen van H2 voorafgaand aan deze analyses In H2 : kleinste kwadraten regressielijn: –y ="— Transcript van de presentatie:

1 Hoofdstuk 10 Inferentie voor regressie

2 Beschrijvende hulpmiddelen van H2 voorafgaand aan deze analyses In H2 : kleinste kwadraten regressielijn: –y = a + bxa constante b helling Nu weten we : op basis van steekproef schatting maken over populatie : –Bv. Op basis van x schatten we µ

3 Zelfde principe voor regressielijn : – a + bx –Wordt :b 0 + b 1 x –Schatter van :  0 +  1 x –Waarbij : Constante b 0 van de aangepaste lijn (data) een schatter is van de constante  0 van de populatielijn Helling b 1 van de aangepaste lijn een schatter is van de helling  1 van de populatielijn

4 Enkelvoudige lineaire regressie : –2 kwantitatieve variabelen : X is een verklarende variabele (OV) Y is een te verklaren variabele (AV) Meervoudige lineaire regressie : –Meer dan 2 kwantitatieve variabelen waarbij Y is een te verklaren variabele Meerdere verklarende variabelen  Volgend jaar

5 10.1. Enkelvoudige lineaire regressie A. Statistisch model voor lineaire regressie Bij t-testen hebben we gezien –x 1 (bv. experimentele gr.) en x 2 (bv. controlegr)  Voorspellers van µ 1 en µ 2

6 Bij lineaire regressie niet twee maar veel meer veranderingen in de vele verwachtingen µ y bij veranderingen in x Deze verwachtingen µ y liggen bij LINEAIRE regressie allen op een rechte lijn als we ze uitzetten tegenover x De regressielijn van de populatie is : µ y =  0 +  1 x

7 B. Gegevens voor enkelvoudige lineaire regressie Uit de data : –We hebben x en y –Voor elke waarde van x zal de te verklaren variabele y variëren volgens een normaalverdeling en een vaste standaardafwijking  op basis waarvan we µ y krijgen –Zodat µ y =  0 +  1 x

8 WAARNEMING = AANPASSING + RESIDU –AANPASSING is de theoretische regressielijn gedefinieerd door  0 +  1 x –RESIDU zijn de afwijkingen, de ruis, voorgesteld door Epsilon (  ) die maken dat de waargenomen x,y waarden niet op een rechte lijn liggen y i =  0 +  1 x i +  i De afwijkingen  i worden verondersteld onafhankelijk te zijn met verwachting 0 en st.dev. 

9 C. Schatting van de regressieparameters Niet rekenen, enkel met SPSS Regression : –dependent – independent –Unstandardized coëff : constant = b 0 verklarende = b 1

10 D. Betrouwbaarheidsintervallen en significantietoetsen Betrouwbaarheidsintervallen –Ook uit computeroutput –Bij Unstandardized coëff : constant = b 0 verklarende = b 1 steeds ook standaard error en 95% betrouwbaarheidsinterval voor b 0 en voor b 1

11 H 0 :  0 = 0 –Het is in µ y =  0 +  1 x de verwachte reactie van y als x gelijk is aan 0 –Dit is meestal NIET interessant, dus t-waarde die in de output hierbij hoort is meestal niet relevant H 0 :  1 = 0 –Dan houden we in µ y =  0 +  1 x enkel µ y =  0 over –µ y =  0 betekent dat de verwachting van y niet varieert met x, er is geen lineaire samenhang tussen x en y,  y kan niet voorspeld worden

12 H 0 :  1 = 0 –Wil zeggen : er is geen samenhang tussen x en y H a :  1  0 (dit is het tweezijdig alternatief) H a :  1 0 (dit is het eenzijdig alternatief) = negatief of positief verband

13 –Opnieuw toetsen met behulp van t-waarde met (n-2) vrijheidsgraden b 1 t = ___________ uit output halen en berekenen SE b1 Vervolgens kijken in Tabel E – SE : standaardfout – t-waarde in output aflezen + p waarde

14 Voorbeeld : gemiddelde lengte naar leeftijd leeftijd in maandenlengte in cm

15 Regression : Coefficients tSig. Model BStd. ErrorBeta 1(Constant)64,928,508127,709,000 LEEFTIJD,635,021,99429,665,000 aDependent Variable: LENGTE

16 E. Inferentie voor correlatie Correlatie : –sterkte en richting van lineaire samenhang –GEEN verklarende – te verklaren variabelen –Steekproefcorrelatie r en populatiecorrelatie  (rho) –x en y moeten gezamenlijk normaal zijn

17 H 0 :  = 0 H a :   0 tweezijdige toetsing H a :  < 0 (negatieve correlatie) of H a :  > 0 (positieve correlatie) eenzijdige toetsing

18 r n - 2 t = 1 – r 2 en in Tabel D met n – 2 vrijheidsgraden Via computeroutput bivariate correlatie : geeft de correlatiecoëfficiënt en p-waarde = tweezijdige toetsing

19 Verband tussen correlatie en regressie Het kwadraat van de correlatiecoëfficiënt, r 2 is de variatie in y waarden die verklaard worden door de kleinste-kwadratenregressie van y op x –bv. r = dus r 2 = 0.41 of 41% van de variatie van een van de variabelen wordt verklaard door de lineaire regressie op de andere variabele r 2 wordt veel gebruikt omdat het een directe maat is voor het succes van een regressie

20 s y b 1 = r s x => De correlatie is gelijk aan 0 als de helling 0 is en omgekeerd


Download ppt "Hoofdstuk 10 Inferentie voor regressie. Beschrijvende hulpmiddelen van H2 voorafgaand aan deze analyses In H2 : kleinste kwadraten regressielijn: –y ="

Verwante presentaties


Ads door Google