De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 8.

Verwante presentaties


Presentatie over: "Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 8."— Transcript van de presentatie:

1 Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 8

2 Achtste college: Chikwadraat en correlatie revisited Chikwadraat en correlatie revisited Steekproeven en kansberekening Steekproeven en kansberekening

3 Voor doctoraalstudenten geldt: Hoofdstuk 7 (steekproeven) vervalt Hoofdstuk 7 (steekproeven) vervalt Eén tentamenvraag minder Eén tentamenvraag minderóf: 1,1 ects in de vrije keuzeruimte 1,1 ects in de vrije keuzeruimte Drs: 2,9 ects BA: 4 ects

4 Chi-kwadraat Ken de formule (observed minus expected in het kwadraat gedeeld door expected, de som daarvan) Ken de formule (observed minus expected in het kwadraat gedeeld door expected, de som daarvan) Begrijp het systeem van de drempelwaarde (afhankelijk van de vrijheidsgraden: DF=(kolommen – 1)*(rijen – 1) Begrijp het systeem van de drempelwaarde (afhankelijk van de vrijheidsgraden: DF=(kolommen – 1)*(rijen – 1)

5 Correlatie coëfficiënt Berekent de mate van (beredeneerde) samenhang tussen twee variabelen Berekent de mate van (beredeneerde) samenhang tussen twee variabelen Tussen 0 en 1 (of tussen 0 en –1) Tussen 0 en 1 (of tussen 0 en –1) Zie voorbeelden in boek Hudson Zie voorbeelden in boek Hudson

6 Rangcorrelatie Instrument om bij ordinale variabelen een associatie of correlatie te ontdekken Spearman’s rangcorrelatiecoëfficiënt berekent een correlatiecoëfficiënt op basis van de rangordes (te berekenen met de functie RANK) Voorbeeld in Excel

7 Regressiemodel Regressielijn door puntenwolk Regressielijn door puntenwolk Verschil met trendlijn: een trend is een aspect van de tijdreeksanalyse, geen causaal verband Verschil met trendlijn: een trend is een aspect van de tijdreeksanalyse, geen causaal verband Methodologie is overeenkomstig Methodologie is overeenkomstig

8 Excel functies Correl (..), Pearson (..), RSQ(..), RANK(..) Correl (..), Pearson (..), RSQ(..), RANK(..) Let op: voor het berekenen van trendlijnen (bij tijdreeksanalyse)(een lineaire trendlijn wordt net zo berekend als een regressielijn): Trend(..): levert trendwaarden op Lineest (..) levert de parameters van de trendlijn op NB zijn een array-functies! Slope (..), intercept(..) leveren de parameters van de regressielijn op.

9 Steekproeven Het gaat om een representatief en groot genoeg deel van de populatie Het gaat om een representatief en groot genoeg deel van de populatie Te gebruiken wanneer de populatie te groot is om in zijn geheel te bestuderen Te gebruiken wanneer de populatie te groot is om in zijn geheel te bestuderen

10 Steekproeven Chapter 7: vooral aandacht voor het trekken van goede steekproeven Chapter 7: vooral aandacht voor het trekken van goede steekproeven § 7.10 hoeft niet te worden bestudeerd! § 7.10 hoeft niet te worden bestudeerd!

11 Steekproeven Een steekproef moet a-select worden getrokken (random sample=aselecte trekking) Een steekproef moet a-select worden getrokken (random sample=aselecte trekking) Er zijn twee maten om het succes van de steekproef te meten: Er zijn twee maten om het succes van de steekproef te meten: - Betrouwbaarheid - Nauwkeurigheid

12 Steekproeven Voorbeelden: - de analyse van vijftig inwoners van Amsterdam in 1800 (om iets te zeggen over de hele bevolking van de stad) - telefonische interviews over het voorgenomen stemgedrag van bijv Nederlanders aan de vooravond van de verkiezingen - Zie ook alle voorbeelden in het boek

13 Steekproeven Voor betrouwbaarheid (confidence) van voorspellingen over de populatie en de nauwkeurigheid (accuracy) waarmee deze worden gedaan, geldt: Voor betrouwbaarheid (confidence) van voorspellingen over de populatie en de nauwkeurigheid (accuracy) waarmee deze worden gedaan, geldt: ‘Vage uitspraken zijn eerder waar!’ m.a.w. ‘Hoe preciezer je prognose, hoe groter de kans dat je naast het waarde voor de gehele populatie zit!’ Onderzocht aan de hand van de normaalverdeling. Onderzocht aan de hand van de normaalverdeling.

14

15

16 Centrale limietstelling: “sampling distribution is a normal distribution”

17 Steekproeven Betrouwbaarheid= Hoe goed (representatief) is onze steekproef als we hem vergelijken met andere (mogelijke) steekproeven? Betrouwbaarheid= Hoe goed (representatief) is onze steekproef als we hem vergelijken met andere (mogelijke) steekproeven? Nauwkeurigheid= hoe precies benaderen de uitspraken die we op basis van onze steekproef doen de werkelijke populatiekenmerken? Nauwkeurigheid= hoe precies benaderen de uitspraken die we op basis van onze steekproef doen de werkelijke populatiekenmerken?

18 Steekproeven Bij een betrouwbaarheidsniveau van [bijvoorbeeld] 95 % of 99 %: De kans is 95 % of 99 % dat het gemiddelde dat we berekenen op basis van onze steekproef, binnen een redelijke marge in de buurt van het populatiegemiddelde ligt.

19 Steekproeven Wat is een redelijke marge ? Bij 95% hoort een z-waarde, die het interval bepaalt: z=1,96 (komt uit een tabel).

20 Steekproeven Bij een nauwkeurigheid met een maximale fout van [bijvoorbeeld] 5 % of 10%: We accepteren een foutmarge van 5% of 10 % bij de berekening van een gemiddelde op basis van onze steekproef, ten op zichte van het (werkelijke) populatiegemiddelde.

21 “The historical sample”

22 Volgend week Bekijk de inleveropdrachten: gelegenheid tot het stellen van vragen. Bekijk de inleveropdrachten: gelegenheid tot het stellen van vragen. Chapter 8: Cliometrics Chapter 8: Cliometrics


Download ppt "Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 8."

Verwante presentaties


Ads door Google