De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 7.

Verwante presentaties


Presentatie over: "Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 7."— Transcript van de presentatie:

1 Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 7

2 Zevende college: Trendlijnen aanbrengen in Excel-grafiek Trendlijnen aanbrengen in Excel-grafiek Voorbeeld Hudson pagina 133 Voorbeeld Hudson pagina 133 Associatie en correlatie Associatie en correlatie NB Volgende week géén college NB Volgende week géén college NB Powerpoints staan online bij ‘theorie’ NB Powerpoints staan online bij ‘theorie’

3 Voor doctoraalstudenten geldt: Hoofdstuk 7 vervalt Hoofdstuk 7 vervalt Eén tentamenvraag minder Eén tentamenvraag minderóf: 1,1 ects in de vrije keuzeruimte 1,1 ects in de vrije keuzeruimte Drs: 2,9 ects BA: 4 ects

4 Excel: trendlijnen Met de rechtermuisknop op de data-series in de grafiek gaan staan – ‘Add trendline’ Met de rechtermuisknop op de data-series in de grafiek gaan staan – ‘Add trendline’ Lineair, niet-lineair (exponentieel, logaritmisch, polynoom, moving average, etc) Lineair, niet-lineair (exponentieel, logaritmisch, polynoom, moving average, etc) Options: ‘display equation on chart’ Options: ‘display equation on chart’ Let op: moving average wordt niet juist geplot door Excel. Let op: moving average wordt niet juist geplot door Excel.

5 Associatie en correlatie Is er samenhang tussen twee reeksen variabelen? Beïnvloeden zij elkaar of staan zij allebei onder invloed van een derde variabele? Is er samenhang tussen twee reeksen variabelen? Beïnvloeden zij elkaar of staan zij allebei onder invloed van een derde variabele? De waarde van de ‘afhankelijke variabele’ wordt veroorzaakt door een ‘onafhankelijke variabele’ De waarde van de ‘afhankelijke variabele’ wordt veroorzaakt door een ‘onafhankelijke variabele’

6 Associatie en correlatie Het bestaan van het verband moet op kwalitatieve gronden worden beargumenteerd. Only if we can think of sound reasons why there might be a relationship between two or more variables should we indulge in the statistical identification and measurement of that relationship. (Hudson p. 138)

7

8 Associatie Bij nominale en ordinale data spreken wij van associatie (geeft aan óf er een causaal verband is). Hier gebruiken we Bij nominale en ordinale data spreken wij van associatie (geeft aan óf er een causaal verband is). Hier gebruiken we 1. Chi-kwadraat of de contingentie coëfficiënt 2. Rangorde-correlatie-coëfficiënt van Spearman

9 Correlatie Bij interval- en ratio-data kunnen we tevens onderzoeken hoe groot de samenhang is, dit noemen we correlatie. Bij interval- en ratio-data kunnen we tevens onderzoeken hoe groot de samenhang is, dit noemen we correlatie. Voor correlatie 1. correlatie-coëfficiënt (Pearson correlatie- coëfficiënt) 2. Het regressiemodel brengt het gevonden verband in kaart.

10 Associatie Chi-kwadraat (a) Berekenen: som van (O-E) 2 /E voor elke cel (b) Interpreteren: kans dat het verband niet toevallig is. - drempelwaarde hangt af van de dimensies van de tabel - staan de uitkomsten in 2 x 2 tabel (aantal vrijheidsgraden=1): drempelwaarde is 6,6 bij 99% betrouwbaarheid - dit kun je opzoeken in een tabel Excel: functie ChiInv(kans; df)

11 Kritische waarden Chi-kwadraat Degrees of Freedom (n-1)*(k-1) Betrouwbaarheid 99% (kans 0,01) Betrouwbaarheid 95% (kans 0,05) 1 6,6 [CHIINV(0,01;1)] 3,8 29,26,0 311,37,8 413,19,5

12 Associatie SPEARMAN rangorde correlatie coëff. SPEARMAN rangorde correlatie coëff. Waarde tussen –1 en 1 Waarde tussen –1 en 1 Geeft aan of de geobserveerde samenhang in de rangordes van twee variabelen statistisch significant is (dwz waarschijnlijk niet door het toeval komt) Geeft aan of de geobserveerde samenhang in de rangordes van twee variabelen statistisch significant is (dwz waarschijnlijk niet door het toeval komt) Excel: functies RANK (..) en PEARSON(..) Excel: functies RANK (..) en PEARSON(..)

13 Correlatie Pearson correlatie-coëfficiënt Pearson correlatie-coëfficiënt  0 ca. 0,7  -1 < R < 0 negatief verband bij R < ca. –0,7  NB afh/onafh niet te zien(!) PEARSON(array1; array2) PEARSON(array1; array2) PEARSON(B3:B13; A3:A13) PEARSON(B3:B13; A3:A13)

14 Correlatie Determinatie coëfficiënt = R 2 (Coëfficiënt of determination) geeft ‘percentage verklaard’ aan  grenswaarde 0,5 (0,7^2=0,49)  kwadraat van Pearson cor.coëff. RSQ(B3:B13;A3:A13)

15 Regressie De regressie-lijn is de best-passende lijn door een puntenwolk. (scatter diagram) De regressie-lijn is de best-passende lijn door een puntenwolk. (scatter diagram) Punten in beeld brengen in een X-Y grafiek Punten in beeld brengen in een X-Y grafiek

16 Regressielijn

17 Andere aandachtspunten: ‘Lagged results’ Autocorrelatie Multicollineariteit Non-random error

18 Excel functies Correl (..), Pearson (..), RSQ(..), RANK(..) Correl (..), Pearson (..), RSQ(..), RANK(..) Let op: voor het berekenen van trendlijnen (bij tijdreeksanalyse, een lineaire trendlijn wordt net zo berekend als een regressielijn): Trend(..) : levert trendwaarden op NB dit is een array-functie! Lineest (..), slope (..), intercept(..) leveren de parameters van de trendlijn op

19 Volgende week geen college


Download ppt "Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 7."

Verwante presentaties


Ads door Google