Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdRudolf Christiaens Laatst gewijzigd meer dan 10 jaar geleden
1
SPSS-cursus inleiding statistiek
september 1999 SPSS-cursus Statistiek
2
SPSS-cursus inleiding statistiek
september 1999 SPSS-cursus Statistiek
3
SPSS-cursus Statistiek
Waarschijnlijkheidsrekening Statistiek september 1999 SPSS-cursus Statistiek
4
Waarschijnlijkheidsrekening
uit het bekende kansen op uitkomsten berekenen kans op munt kans op 3* munt bij 10 worpen bekende: de werkelijkheid: populatie of universum een hypothese (veronderstelling over werkelijkheid) september 1999 SPSS-cursus Statistiek
5
SPSS-cursus Statistiek
Populatie Eindige populatie alle nederlandse vrouwen alle studenten Geneeskunde in Groningen Oneindige populatie alle mogelijke worpen met een munt september 1999 SPSS-cursus Statistiek
6
SPSS-cursus Statistiek
Populatie (verdeling) is bekend hoeveel nederlandse vrouwen en hun kenmerken bijv. leeftijdsverdeling hoeveel studenten Geneeskunde en hun kenmerken bijv. verhouding vrouw/ man mits munt eerlijk: evenveel kans op kruis of munt september 1999 SPSS-cursus Statistiek
7
SPSS-cursus Statistiek
Steekproef een willekeurige trekking uit de populatie (aselect) 100 nederlandse vrouwen 20 studenten Geneeskunde 10 worpen met een munt september 1999 SPSS-cursus Statistiek
8
Waarschijnlijkheidsrekening
kans dat 12 (van de 100) vrouwen ouder 60 zijn kans dat er minstens 15 (van 20) vrouwelijke studenten zijn kans op minstens 8 (van 10) keer munt september 1999 SPSS-cursus Statistiek
9
SPSS-cursus Statistiek
beschrijvende/ inferentiële statistiek (schatten en toetsen) beschrijvende statistiek wat vind je in de steekproef?: tellen (aantallen, gemiddelden, grafieken, ...) aantal vrouwen gemiddelde leeftijd staafdiagram kruis/ munt bij 10 worpen scatterplot leeftijd/ waardering september 1999 SPSS-cursus Statistiek
10
SPSS-cursus Statistiek
inferentiële statistiek (schatten en toetsen) op grond van uitkomsten in de steekproef parameters in de populatie schatten en conclusies trekken 12% van nederlandse vrouwen is ouder dan 60 er studeren in Groningen meer vrouwen Geneeskunde dan mannen de munt is eerlijk september 1999 SPSS-cursus Statistiek
11
SPSS-cursus Statistiek
Schatten uit uitkomsten van een steekproef schatting maken van de werkelijkheid (populatie) september 1999 SPSS-cursus Statistiek
12
SPSS-cursus Statistiek
gevonden 12 vrouwen ouder dan 60, hoeveel vrouwen zullen in de populatie ouder 60 zijn? (puntschatting: P(v>60) =0,12) gevonden 15 vrouwelijke studenten, wat is verhouding man/ vrouw in de populatie? (P(v)=0,75) gevonden 8 keer munt, kans op munt ? (P(munt)=0.80) september 1999 SPSS-cursus Statistiek
13
SPSS-cursus Statistiek
bij ander steekproef (toevallig bepaald!) andere uitkomst: 20 van de 100 ouder dan 60 P(v>60)=0,20 10 vrouwelijke studenten P(v)=0, keer munt P(munt)=0,40 september 1999 SPSS-cursus Statistiek
14
SPSS-cursus Statistiek
Puntschatting met onzekerheid (standaarddeviatie (SD), spreiding, interval) P(v>60) =0,12 SD=0,03 P(v)=0,75 SD=0,10 P(munt)=0,8 SD=0,13 september 1999 SPSS-cursus Statistiek
15
SPSS-cursus Statistiek
Schatting Conclusie “Ik denk dat de fractie vrouwen > 60 jaar in de populatie 0,12 is (puntschatting), maar deze fractie ‘kan best’ (met 95% waarschijnlijkheid) liggen tussen 0,06 en 0,18 (puntschatting 2* SD)” september 1999 SPSS-cursus Statistiek
16
Toetsen van hypothesen
Hypothese: veronderstelling over werkelijkheid (populatie) munt is eerlijk P(munt) = P(kruis) minder mannelijke dan vrouwelijke studenten Geneeskunde september 1999 SPSS-cursus Statistiek
17
SPSS-cursus Statistiek
Stel hypothese Stel Nulhypothese (H0) op P(munt) = P(kruis) = 0,5 P(vrouw) = P(man) =0,5 P(vrouw>60)= 0,2 Stel Alternatieve hypothese vast (Ha) (situatie als H0 niet waar is) P(munt) > 0,5 P(vrouw) 0,5 P(vrouw>60) > 0,2 september 1999 SPSS-cursus Statistiek
18
Bepaal kansverdeling onder H0
waarschijnlijkheidsrekening bij steekproefgrootte: P(0 * munt), P(1 * munt), …, P(10 * munt) als P(munt) = 0,5 P(0 * vrouw), P(1 * vrouw), … , P(20 * vrouw) als P(vrouw) = 0,5 september 1999 SPSS-cursus Statistiek
19
SPSS-cursus Statistiek
Trek steekproef Trek een aselecte steekproef uit de populatie Doe de waarnemingen (tellen, meten, …) september 1999 SPSS-cursus Statistiek
20
Bepaal kans op gevonden uitkomst
Dit heet Overschrijdingskans Gevonden 8 keer munt P( 8 * munt) = 0,055 berekening? Let op: 8, 9, 10 * alle bij Ha (P(munt)>0,5) Zou dit kunnen als H0 waar is? Ja, de kans is 0,055 ! september 1999 SPSS-cursus Statistiek
21
Wat vind je van de uitkomst?
Acht je uitkomst ‘redelijk’ als H0 waar is? Of past uitkomst beter bij Ha? september 1999 SPSS-cursus Statistiek
22
SPSS-cursus Statistiek
werkelijkheid H0 Ha uitkomst H0 Ha Fout I en fout II OK Fout II Fout I OK september 1999 SPSS-cursus Statistiek
23
SPSS-cursus Statistiek
Significantieniveau Geef vooraf aan welke kans je redelijk vindt dit is een keus van de onderzoeker! 0,05 gebruikelijke significantieniveau 0,01 kleinere kans om H0 ten onrechte te verwerpen, grotere om hem ten onrechte niet te verwerpen september 1999 SPSS-cursus Statistiek
24
SPSS-cursus Statistiek
Verwerpen van H0 als P(uitkomst) < significantieniveau: verwerp H0, neem Ha aan anders: neem H0 aan september 1999 SPSS-cursus Statistiek
25
SPSS-cursus Statistiek
Conclusie P(gevonden # vrouw) = 0,03 bij H0: P(vrouw)=0,5 Significantieniveau is 0,05 Resultaat is significant Er zijn niet evenveel vrouwen als mannen september 1999 SPSS-cursus Statistiek
26
1-zijdig / 2-zijdig toetsen
Ho is ’is gelijk aan’ Ha kan zijn: is ongelijk aan zijdig is groter dan (of kleiner dan) 1-zijdig september 1999 SPSS-cursus Statistiek
27
1-zijdig / 2-zijdig toetsen
1-zijdig als je tevoren een verwachting hebt over het alternatief als H0 wordt verworpen Bijvoorbeeld het toedienen van een medicatie om de bloeddruk te verlagen. Het is slechts interessant als dit tot verlaging leidt (mits er iets verandert). Hiervoor moet je een ‘theorie’ hebben. september 1999 SPSS-cursus Statistiek
28
1-zijdig / 2-zijdig toetsen
2-zijdig als de richting bij verwerpen van H0 niet is te voorspellen. Bijvoorbeeld of vrouwen beter op een trainingsprogramma reageren dan mannen. september 1999 SPSS-cursus Statistiek
29
1-zijdig / 2-zijdig toetsen
SD Overschr. Overschr Gem. september 1999 SPSS-cursus Statistiek
30
1-zijdig / 2-zijdig toetsen
De verdeling van een toetsingsgrootheid, bijv. het verschil in gemiddelde leeftijd Bij 2-zijdig moet je kijken of de waarde van de toetsingsgrootheid valt in het linker of rechter staartje, samen een kans van 0,05 (als dat significantieniveau is) Bij een normale verdeling zijn de grenzen > 1,96 en < -1,96 september 1999 SPSS-cursus Statistiek
31
1-zijdig / 2-zijdig toetsen
Bij 1-zijdig kijk je in 1 staartje (bijv. rechts); het gebied omvat dat aan die ene kant een kans 0,05 Bij een normale verdeling is de grens > 1,645 september 1999 SPSS-cursus Statistiek
32
SPSS-cursus Statistiek
Keus methode kansverdeling variabelen meetniveau variabelen verschil of verband steekproef opzet september 1999 SPSS-cursus Statistiek
33
SPSS-cursus Statistiek
Kansverdeling De kansverdeling beschrijft de kansen op uitkomsten De totale kans, alle uitkomsten samen, = 1 Je hebt continue en discrete kansverdelingen september 1999 SPSS-cursus Statistiek
34
SPSS-cursus Statistiek
Kansverdeling Discreet slechts bepaalde uitkomsten mogelijk man of vrouw blauwe, bruine, grijze, groene ogen aantal mensen elke uitkomst heeft bepaalde kans, andere uitkomsten onmogelijk, kans = 0 september 1999 SPSS-cursus Statistiek
35
SPSS-cursus Statistiek
Kansverdeling Continu alle uikomsten zijn mogelijk de getallenrechte, van - oneindig tot + oneindig snelheid afstand tijd september 1999 SPSS-cursus Statistiek
36
SPSS-cursus Statistiek
Kansen continu Bij continue verdeling kans op uitkomst in interval Kans uitkomst < a = 0,05 Kans op uitkomst > b = 0,20 Kans op uitkomst tussen a en b = 0,75 september 1999 SPSS-cursus Statistiek
37
SPSS-cursus Statistiek
Normale verdeling SD Overschr. Overschr Gem. september 1999 SPSS-cursus Statistiek
38
SPSS-cursus Statistiek
Kansverdeling Bijv. (continue) Normale verdeling (oppervlak = 1) Hoe hoger, hoe groter kans, kans bij gemiddelde groot, staart klein De ‘vorm’ is bepaald Plaats en breedte wordt bepaald door Parameters gemiddelde en SD * september 1999 SPSS-cursus Statistiek
39
SPSS-cursus Statistiek
Kansverdeling * Populatie: griekse letters, steekproef ‘gewone’ letters Gemiddelde resp. m SD resp. s Corr. Coëff. resp. R Er zijn ook verdelingen die niet door parameters worden bepaald: parametervrij (non parametric) september 1999 SPSS-cursus Statistiek
40
SPSS-cursus Statistiek
Meetniveau Nominaal discrete uitkomsten zonder volgorde man, vrouw oogkleur typologie ziekten september 1999 SPSS-cursus Statistiek
41
SPSS-cursus Statistiek
Meetniveau Ordinaal discrete uitkomsten met volgorde verschil uitkomsten onbepaald: slecht/ matig versus matig/ voldoende slecht/ matig/ voldoende/ goed leeftijdsklassen: <20, 20-40, >40 september 1999 SPSS-cursus Statistiek
42
SPSS-cursus Statistiek
Meetniveau Interval representatie van continue verdeling verschil uitkomsten bepaald: 5-4 = 6-5 tijd in seconden afstand in mm score op IQ-test september 1999 SPSS-cursus Statistiek
43
SPSS-cursus Statistiek
Meetniveau Ratio als interval met absoluut nulpunt temperatuur Celsius Interval afstand in meters Ratio september 1999 SPSS-cursus Statistiek
44
SPSS-cursus Statistiek
Centrale tendentie Interval (Ratio) gemiddelde Ordinaal mediaan (middelste waarde, 50%) Nominaal (PM: frequenties, modus) september 1999 SPSS-cursus Statistiek
45
SPSS-cursus Statistiek
Spreiding Interval (ratio) standaarddeviatie (SD) Ordinaal interkwartielenrange (25% - 75%) Nominaal (PM: frequenties, modus) september 1999 SPSS-cursus Statistiek
46
SPSS-cursus Statistiek
Toetsen op verschil 2 onafhankelijke steekproeven interval niveau Normale verdeling Student t-toets september 1999 SPSS-cursus Statistiek
47
SPSS-cursus Statistiek
Normale verdeling SD SD gem 1. gem 2. september 1999 SPSS-cursus Statistiek
48
Student t-toets onafh. steekpr.
zijn gemiddelden gelijk (H0) ? twee varianten: varianties gelijk (equal) varianties ongelijk (unequal) september 1999 SPSS-cursus Statistiek
49
SPSS-cursus Statistiek
Toetsen op verschil 2 onafhankelijke steekproeven interval niveau, geen Normale verdeling of ordinaal niveau september 1999 SPSS-cursus Statistiek
50
SPSS-cursus Statistiek
Mann-Whitney U-toets zijn medianen gelijk (H0) ? gemiddelde rangnummers U statistic standaardnormale benadering U september 1999 SPSS-cursus Statistiek
51
Gepaarde waarnemingen
aan een individu zijn 2 waarnemingen bijv. test voor en na training is er verschil? per individu voor en na vergelijken, verschil per individu ‘middelen’ over de steekproef september 1999 SPSS-cursus Statistiek
52
SPSS-cursus Statistiek
Toetsing Ho: geen verschil Ha: 1 of 2-zijdige verandering interval: Student t-toets match ordinaal: Wilcoxon symm. toets september 1999 SPSS-cursus Statistiek
53
SPSS-cursus Statistiek
Samenhang variabelen (relatie, verband, correlatie) H0: geen samenhang Ha: wel samenhang positief: groot met groot negatief: groot met klein september 1999 SPSS-cursus Statistiek
54
SPSS-cursus Statistiek
Samenhang interval * * * * * * * * * * * * * ** * ** * ** * * * * * * * waardeer positieve samenhang leeftijd september 1999 SPSS-cursus Statistiek
55
SPSS-cursus Statistiek
Samenhang interval * * * * * * * * * * * * * * * * ** * * ** * ** * * * * * * * * * * * waardeer geen samenhang leeftijd september 1999 SPSS-cursus Statistiek
56
SPSS-cursus Statistiek
Samenhang Bij geen samenhang: correlatie = 0 Perfect positief = + 1 Perfect negatief = - 1 Significantie bepalen, H0: = 0 R ook ‘sterktemaat’ september 1999 SPSS-cursus Statistiek
57
SPSS-cursus Statistiek
Samenhang interval - interval Pearson (‘product-moment’) interval - ordinaal Spearman * (rangorde) ordinaal - ordinaal Spearman * nominaal - nominaal Chi2 * of Kendall tau september 1999 SPSS-cursus Statistiek
58
SPSS-cursus Statistiek
Samenhang als variabele verschillend niveau is laagste bepalend september 1999 SPSS-cursus Statistiek
59
SPSS-cursus Statistiek
Start SPSS september 1999 SPSS-cursus Statistiek
60
SPSS-cursus Statistiek
Chi2 GESLACHT by OPLEID OPLEID Row Total GESLACHT 66,7 29,6 3,7 58,7 36,8 47,4 15,8 41,3 Column Total 54,3 37,0 8,7 100,0 september 1999 SPSS-cursus Statistiek
61
SPSS-cursus Statistiek
Chi2 Chi-Square Value DF Sign. Pearson , ,09788 Likelihood Ratio , ,09458 Mantel-Haenszel test for 4, ,03310 linear association Minimum Expected Frequency ,652 Cells with Expected Frequency <5- 2 OF 6(33,3%) Number of Missing Observations: 0 september 1999 SPSS-cursus Statistiek
62
SPSS-cursus Statistiek
Chi2 Ho: geen relatie geslacht - opleid dan verdeling opleid man = vrouw= totaal = 54,3 - 37,0 - 8,7 (verwachting) vergelijk gevonden verdelingen 66,7 - 29,6 - 3,7 resp. 36,8 - 47,4 - 15,8 hiermee september 1999 SPSS-cursus Statistiek
63
SPSS-cursus Statistiek
Chi2 (grote) verschillen leiden tot verwerpen H0 Maat: Pearson Sign NS op niveau 0,05 ‘Eis’ omdat uitkomsten (aantallen) discreet en Chi2 continu, is voor goede benadering nodig: max. 20% cellen verwachting <5 september 1999 SPSS-cursus Statistiek
64
SPSS-cursus Statistiek
Chi2 In dit geval 33,3 % cellen te klein. Dan codes samenvoegen, bijv. opleid laag / midden+hoog september 1999 SPSS-cursus Statistiek
65
SPSS-cursus Statistiek
Staafdiagram: aantallen van categorieën hoogte = aantal Histogram: aantallen in klassen oppervlakte = aantal Kans aantal munt, N=10 Leeftijdsverdeling september 1999 SPSS-cursus Statistiek
66
SPSS-cursus Statistiek
Scatterplot leeftijd - waardering september 1999 SPSS-cursus Statistiek
67
SPSS-cursus Statistiek
Binomiale verdeling Uitkomst is Succes (vrouw > 60) of niet Binomiale verdeling N pogingen N = 100 X Successen X = 12 Succeskans p = X/N = 0,12 SD = (p*(1-p)/N) ½ = (0,12*0,88/100) ½ = 0,0325 september 1999 SPSS-cursus Statistiek
68
SPSS-cursus Statistiek
Kans op x successen Uitkomst is Succes of niet Binomiale verdeling Succeskans = p N pogingen Kans dat x van N succes zijn september 1999 SPSS-cursus Statistiek
69
SPSS-cursus Statistiek
Kansverdeling H0 Ha september 1999 SPSS-cursus Statistiek
70
SPSS-cursus Statistiek
Kansverdeling < H >< Ha > september 1999 SPSS-cursus Statistiek
71
SPSS-cursus Statistiek
Formule P(x=X; p; N) = pX (1-p)N-X p=0.5 N=10 X=8 N X september 1999 SPSS-cursus Statistiek
72
SPSS-cursus Statistiek
Berekening = = = 45 = = 0.25 45 * * 0.25 = 10 8 10 2 10*9 2* 1 september 1999 SPSS-cursus Statistiek
73
SPSS-cursus Statistiek
Berekening = = = 10 = = 0.5 10 * * 0.5 = 10 9 10 1 10 1 september 1999 SPSS-cursus Statistiek
74
SPSS-cursus Statistiek
Berekening = = 1 = = 1 1 * * 1 = 10 10 september 1999 SPSS-cursus Statistiek
75
SPSS-cursus Statistiek
Berekening * * * + september 1999 SPSS-cursus Statistiek
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.