Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdBrigitta Van Laatst gewijzigd meer dan 9 jaar geleden
1
Inleiding in de statistiek voor de gedragswetenschappen
Inleiding in de statistiek voor de gedragswetenschappen. Met ondersteuning van SPSS
2
Hoofdstuk XI De regressieanalyse
3
Doelstellingen De student begrijpt de principes van enkelvoudige en meervoudige regressietechniek; De student kan uit een dataset de vergelijking van de regressielijn opstellen; De student kan deze berekeningen via SPSS doen; De student kan de output van SPSS lezen en interpreteren.
4
Samenhang tussen twee interval variabelen
Bestaat er een (lineair) verband? Gebruik de Pearson correlatiecoëfficiënt Hoe kunnen we de Y variabele voorspellen op grond van de X variabele? Gebruik de regressielijn van Y op X.
5
Lineaire regressie (enkelvoudige)
Welke rechte past het best bij een gevonden spreidingsdiagram? Welke rechte lijn biedt een zo goed mogelijke samenvatting van de trend in de puntenwolk? Zoeken de vergelijking van deze rechte, op basis waarvan we op grond van een X waarde de Y waarde kunnen voorspellen
7
Regressielijn Y = a + bX Waarbij:
X = de onafhankelijke (predictor) variabele (horizontale as) Y = de afhankelijke (criterium) variabele (verticale as) a = de constante, die het snijpunt (intercept) met de Y-as vormt b = de hellingscoëfficiënt (slope, of richtingscoëfficiënt)
8
De regressielijn een eenvoudig voorbeeld: het salaris
Maandelijks salaris Jaarlijks inkomen
9
SPSS input
10
SPSS output de correlatie
11
Teken een scatterplot via SPSS
12
SPSS aanmaken van een scatterplot
Afhankelijke variabele op Y-as Onafhankelijke variabele op X-as
13
SPSS output: de scatterplot
14
Een eenvoudig voorbeeld: het salaris
Maandelijks salaris Jaarlijks inkomen De regressielijn: Y= a + bX Y = 12*X Fouten bij de voorspelling?
15
Voorbeeld, nu met eindejaarspremie € 1000
Maandelijks salaris Jaarlijks inkomen Welk is de r? en de scatterplot? En de regressielijn? Fouten bij de voorspelling?
16
Enkelvoudige regressielijn
Twee vragen: Hoe vinden we de parameters van de regressielijn (Y = a + bX)? Hoe goed kunnen we de Y waarden voorspellen op basis van dit model?
17
Regressielijn Hoe vinden we deze a en b coëfficiënten?
a: dit is de uitslag van Y indien X nul bedraagt; a = Y – bX (intercept) b: dit is de richtingscoëfficiënt; deze is functie van de r en de verhouding tussen de beide SD. b = rYX. SDY/SDX (slope) Deze b geeft aan hoe de Y waarde verandert wanneer de X waarde met één eenheid toeneemt.
18
Regressielijn Op grond van deze vergelijking kunnen we voor elke score van X een verwachting voor Y formuleren Y = a + bX Y = 2,4 + 1,31X bv. X = 3, Y = ? Y = 2,4 + 1,31*3 Y = 6,31
19
Regressielijn De regressielijn voldoet aan het criterium van het kleinste kwadraat. D.w.z. dat de gekwadrateerde afwijking van de verwachte uitslag t.o.v. de feitelijke uitslag minimaal is.
20
Regressielijn Algemene werkformule van de regressielijn:
Y = Y + r XY (Xi – X)*SDY/SDX Vergelijking van de best passende lijn, waarbij de Y waarden zo goed mogelijk geschat kunnen worden op grond van de X waarden. De regressielijn is niet symmetrisch Hoe goed voldoet dit model om de werkelijkheid te voorspellen?
21
Waarde van de regressielijn I
Hoe goed verklaart het model de werkelijke gegevens? Proportie verklaarde variantie: r2XY Deze determinatiecoëfficiënt geeft de gemeenschappelijk variantie weer. Kan berekend worden via het kwadraat van de r. Voorstelling: r2 Proportie niet-verklaarde variantie: (1- r2XY)
22
Waarde van de regressielijn II
Het verschil tussen de verwachte en de feitelijke score van Y is de schattingsfout. De standaarddeviatie van deze fout is de standaardschattingsfout. Dit komt overeen met de standaarddeviatie van de verschillen tussen de verwachte en feitelijke uitslag.
23
Standaardschattingsfout
In SPSS wordt deze standaardfout aangeduid middels ‘std. error of the estimate’. Deze standaardschattingsfout geeft een indicatie van de (on)nauwkeurigheid van de voorspelling. (omgekeerde) relatie met rXY
24
Terug naar het voorbeeld van IQ en schoolvorderingen
25
Dialoogvenster Linear regression
26
Output regressieanalyse
27
Output regressieanalyse
Welk is de waarde van het model voor de populatie?
28
Output regressieanalyse
SV =16,46 + 0,52*IQ
29
Uitgaven restaurant en inkomen
Wat is het verband tussen het inkomen en de uitgaven aan restaurantbezoek? Hoe zal uitgaven voor restaurantbezoek toenemen in functie van inkomensverandering?
30
Restaurantuitgaven gegevens
Ppn uitg. rest inkomen Afhankelijke/onafhankelijke variabele?
31
Is er een lineair verband?
Eerste inzicht in de relatie tussen de twee variabelen via de puntenwolk (spreidingsdiagram) Bestaat er een rechtlijnig verband tussen beide variabelen?
32
Pearson correlatiecoëfficiënt
= Covariantie gestandardiseerd Geeft een aanduiding van de sterkte en de richting van het verband tussen twee variabelen. Significantietoets: zie verder inductieve statistiek
33
Output regressieanalyse
Restuit = -2,66 + 0,11*Inkomen
34
Output regressieanalyse
R square is de determinatiecoëfficiënt. Geeft de verhouding aan tussen de verklaarde variantie en de totale variantie.
35
De regressievergelijking
Restaurantuitgaven = -2,66 + 0,11 * Inkomen Bijvoorbeeld: inkomen is 200, welk is dan de restaurantuitgave? -2,66 + 0,11 * 200 = 19, En als X = 0 ?
36
De regressievergelijking
Wat is de waarde van deze vergelijking? Dekt het model de werkelijkheid? - 96% van de verschillen in de restaurantuitgaven kunnen verklaard worden door de verschillen in inkomen - De standaardfout van estimatie bedraagt: 0,70. Dwz dat in 2/3 van de gevallen de fout in de voorspelling kleiner zal zijn dan 0,70
37
Meervoudige regressie
In dit geval zijn er meerdere X variabelen, op grond waarvan de Y variabele geschat wordt. Veel gebruikte procedure om aan te geven hoe diverse onafhankelijke variabelen gezamenlijk een invloed uitoefenen op de afhankelijke variabele. Diverse onafhankelijke variabelen worden t.o.v. mekaar uitgespeeld. De afzonderlijke bètacoëfficiënten bieden een inzicht in het impact van elke onafhankelijke variabele, onder constant houding van de overige variabelen. Welk zijn de voorwaarden voor deze techniek?
38
Meervoudige regressie
Welk zijn de voorwaarden? - één afhankelijke variabelen en een reeks onafhankelijke variabelen; - alle variabelen zijn van interval niveau; (eventueel dummy variabelen); - samenhang tussen afhankelijke variabele en onafhankelijke variabelen is psychologisch zinvol en lineair; - geen multicollineariteit; - voldoende respondenten.
39
Een voorbeeld Valkeneers, G. (2012). Compulsief koopgedrag. Een verkennend onderzoek met een nieuwe vragenlijst. Verslaving. 8,2, 20-30
40
Opgaven van het handboek
41
Inleiding in de statistiek voor de gedragswetenschappen
Inleiding in de statistiek voor de gedragswetenschappen. Met ondersteuning van SPSS
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.