Statistiek voor Historici

Slides:



Advertisements
Verwante presentaties
Beschrijvende en inferentiële statistiek
Advertisements

Statistische uitspraken over onbekende populatiegemiddelden
Vierde bijeenkomst Kleinste kwadraten methode Lineaire regressie
HC2MFE Meten van verschillen
Beschrijvende en inferentiële statistiek
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW Guido Valkeneers.
Statistiek voor Historici
Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 1.
Hoofdstuk 10 Onderzoeken met SPSS en MS Excel
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
variabelen vaststellen
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Statistiek voor Historici
Beschrijvende en inferentiële statistiek
SPSS 17 en Onderzoek met SPSS en Excel (2nd edition)
Statistiek voor Historici
Correlatietoetsen Toetsen op afhankelijkheid tussen variabelen waarvan minimaal een van de twee niet ordinaal is: afhankelijkheidstabellen. Vb. afhankelijkheid.
N = geschatte aantal M = eerste gemerkte vangst C = totaal tweede vangst R = aantal gemerkte exemplaren in tweede vangst.
Beschrijvende en inferentiële statistiek
Beschrijvende en inferentiële statistiek
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Statistiek II Hoofdstuk 4: Toetsen voor één populatie
toetsen voor het verband tussen variabelen met gelijk meetniveau
Hoofdstuk 8: Variantieanalyse met herhaalde metingen hoofdstuk 8
Statistiek ?! … Ronald Buyl - BISI.
Herleiden (= Haakjes uitwerken)
vwo A Samenvatting Hoofdstuk 14
Gegevensverwerving en verwerking
Gegevensverwerving en verwerking
Non-parametrische technieken
Meervoudige lineaire regressie
Inferentie voor regressie
Schatter voor covariantie
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Hoofdstuk 9 Verbanden, correlatie en regressie
Voorspellende analyse
variabelen vaststellen
Populatiegemiddelden: recap
Statistiek voor Historici
Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 3.
Statistiek voor Historici
Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 4.
Methodologie & Statistiek I Verband tussen twee variabelen 3.2
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
Statistiek voor Dataverwerking
Grafieken, organigrammen
Hoofdstuk 4 – Gegevens analyseren
Hoofdstuk 5 – Verzameling en functie
WOT statistiek Inleiding
Hoorcollege 3 Samenhang tussen variabelen
Hoofdstuk X Het correlatievraagstuk & SPSS toepassing
Inleiding in de statistiek voor de gedragswetenschappen
Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.
Baarde en de goede Hoofdstuk 11: Data-analyse
Rechte lijnen: lineair verband. Een lijn is een verzameling van punten.
Criteria voor een goed “onderzoek”
FOKKE en SUKKE helpen bij het veldwerk. Gebruik van een statistisch pakket SPSS Opslaan en bewerken data –selecteren –wegen –hercoderen –Ontwerpen van.
Tot nu toe. Geschiedenis Uitzonderingen, verschil in incidenties.
Metrics.
Grafische vergelijking meetmethoden
Grafiek van lineaire formule
Een frequent attender is meer dan de som van zijn morbiditeiten
Keuzevoorlichting havo wiskunde AB.
variabelen vaststellen
Voorspellende analyse
Hoofdstuk 10 Onderzoeken met SPSS en MS Excel
Voorkennis Wiskunde Les 7 Hoofdstuk 2/3: §2.5, 3.1 en 3.2.
Transcript van de presentatie:

Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 7

Zevende college: Trendlijnen aanbrengen in Excel-grafiek Voorbeeld Hudson pagina 133 Associatie en correlatie NB Volgende week géén college NB Powerpoints staan online bij ‘theorie’

Voor doctoraalstudenten geldt: Drs: 2,9 ects BA: 4 ects Voor doctoraalstudenten geldt: Hoofdstuk 7 vervalt Eén tentamenvraag minder óf: 1,1 ects in de vrije keuzeruimte

Excel: trendlijnen Met de rechtermuisknop op de data-series in de grafiek gaan staan – ‘Add trendline’ Lineair, niet-lineair (exponentieel, logaritmisch, polynoom, moving average, etc) Options: ‘display equation on chart’ Let op: moving average wordt niet juist geplot door Excel.

Associatie en correlatie Is er samenhang tussen twee reeksen variabelen? Beïnvloeden zij elkaar of staan zij allebei onder invloed van een derde variabele? De waarde van de ‘afhankelijke variabele’ wordt veroorzaakt door een ‘onafhankelijke variabele’

Associatie en correlatie Het bestaan van het verband moet op kwalitatieve gronden worden beargumenteerd. Only if we can think of sound reasons why there might be a relationship between two or more variables should we indulge in the statistical identification and measurement of that relationship. (Hudson p. 138)

Associatie Bij nominale en ordinale data spreken wij van associatie (geeft aan óf er een causaal verband is). Hier gebruiken we Chi-kwadraat of de contingentie coëfficiënt Rangorde-correlatie-coëfficiënt van Spearman

Correlatie Bij interval- en ratio-data kunnen we tevens onderzoeken hoe groot de samenhang is, dit noemen we correlatie. Voor correlatie correlatie-coëfficiënt (Pearson correlatie-coëfficiënt) Het regressiemodel brengt het gevonden verband in kaart.

Associatie Chi-kwadraat (a) Berekenen: som van (O-E)2/E voor elke cel (b) Interpreteren: kans dat het verband niet toevallig is. - drempelwaarde hangt af van de dimensies van de tabel - staan de uitkomsten in 2 x 2 tabel (aantal vrijheidsgraden=1): drempelwaarde is 6,6 bij 99% betrouwbaarheid - dit kun je opzoeken in een tabel Excel: functie ChiInv(kans; df)

Kritische waarden Chi-kwadraat Degrees of Freedom (n-1)*(k-1) Betrouwbaarheid 99% (kans 0,01) Betrouwbaarheid 95% (kans 0,05) 1 6,6 [CHIINV(0,01;1)] 3,8 2 9,2 6,0 3 11,3 7,8 4 13,1 9,5

Associatie SPEARMAN rangorde correlatie coëff. Waarde tussen –1 en 1 Geeft aan of de geobserveerde samenhang in de rangordes van twee variabelen statistisch significant is (dwz waarschijnlijk niet door het toeval komt) Excel: functies RANK (..) en PEARSON(..)

Correlatie Pearson correlatie-coëfficiënt 0 < R < 1 positief verband bij R > ca. 0,7 -1 < R < 0 negatief verband bij R < ca. –0,7 NB afh/onafh niet te zien(!) PEARSON(array1; array2) PEARSON(B3:B13; A3:A13)

Correlatie Determinatie coëfficiënt = R2 (Coëfficiënt of determination) geeft ‘percentage verklaard’ aan  grenswaarde 0,5 (0,7^2=0,49)  kwadraat van Pearson cor.coëff. RSQ(B3:B13;A3:A13)

Regressie De regressie-lijn is de best-passende lijn door een puntenwolk. (scatter diagram) Punten in beeld brengen in een X-Y grafiek

Regressielijn

Andere aandachtspunten: ‘Lagged results’ Autocorrelatie Multicollineariteit Non-random error

Excel functies Correl (..), Pearson (..), RSQ(..), RANK(..) Let op: voor het berekenen van trendlijnen (bij tijdreeksanalyse, een lineaire trendlijn wordt net zo berekend als een regressielijn): Trend(..) : levert trendwaarden op NB dit is een array-functie! Lineest (..), slope (..), intercept(..) leveren de parameters van de trendlijn op

Volgende week geen college