Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdKaren Cools Laatst gewijzigd meer dan 9 jaar geleden
1
M ARIO F. T RIOLA 2 nd E DITION E LEMENTARY S TATISTICS
2
Boek Literatuur: Mario Triola: Essentials of Statistics, 2 nd edition Addison-Wesley Higher Education, 2005
3
Organisatie Geen hoorcolleges: –vragenuur op basis van ingediende vragen –heel veel oefenmateriaal Verplichte werkcolleges: –Het maken van opgaven is essentieel en daarom verplicht. –Steeds de uitwerkingen van de aangegeven ‘exercises’ voorafgaand aan het werkcollege inleveren. –In 2004 drie stromen: snel, normaal, langzaam. Geen succes. –Werkgroepen & begeleiding: groep 1: woensdag 9-12, B341: W. Beek groep 2: donderdag 11-14, B341: F. de Vries. groep 3: ?? –practicumgroepen
4
Organisatie-vervolg Onderwijslast: 5 ECTS (140 uur, 17,5 uur/week) –minimaal 8 uren sommen maken! –lezen+studie ca. 6 uur –werkcollege ca. 3 uur Volgorde boek wordt aangehouden
5
website http://staff.science.uva.nl/~fdevries/stat/sta t0607/index.htmhttp://staff.science.uva.nl/~fdevries/stat/sta t0607/index.htm Op blackboard evt. de Triola sheets.
6
Waarom statistiek? 1. Beschrijvende statistiek 2. Inductieve statistiek 3. Kansberekening
7
1. Beschrijvende statistiek Informatie met behulp van enkele parameters (en visualisaties) compact beschrijven. –centrummaten –spreidingsmaten –proporties –maten voor samenhang
9
Figure 2-9 Deaths in British Military Hospitals During the Crimean War
10
Verdubbeling van lengte, breedte en hoogte vergroot het volume met een factor 8… Pas op voor misleiding …
11
Bachelor High School Degree Diploma $40,000 30,000 25,000 20,000 $40,500 $24,400 35,000 $40,000 20,000 10,000 0 $40,500 $24,400 30,000 Bachelor High School Degree Diploma Zo moet het niet …
12
2. Inductieve statistiek Met zo weinig mogelijke inspanning (kleine steekproef), zo precies mogelijke uitspraken doen (over populatie). –generalisatie van steekproef naar populatie. –alleen mogelijk onder een aantal strikte aannames!
13
Steekproeven Aselecte steekproef! Graag zo klein mogelijk
14
Saunders-hfst 6
15
Steekproevenverdeling Paragraaf 5.5: Centrale Limiet Theorema This section is extremely important…
16
Central Limit Theorem 1. The distribution of sample x will, as the sample size increases, approach a normal distribution. Conclusions:
17
Central Limit Theorem 1. The distribution of sample x will, as the sample size increases, approach a normal distribution. 2. The mean of the sample means will be the population mean µ. Conclusions:
18
Central Limit Theorem 1. The distribution of sample x will, as the sample size increases, approach a normal distribution. 2. The mean of the sample means will be the population mean µ. 3. The standard deviation of the sample means will approach n Conclusions:
19
Centrale limiet stelling Figure 7.10 Uniform population µ = = 100 = = 28.87 a + b 2 b - a 12 12 a = 50 µ = 100 b = 150 X (n = 2) X (n = 5) X (n = 30) X µxµxµxµx By the CLT,µ x = µ = 100 x = = = 5.27 n 28.87 30 30
20
Centrale limiet stelling Figure 7.11 µ = 100 = X Exponential population (n = 2) X (n = 5) X (n = 30) X µxµxµxµx By the CLT,µ x = µ = 100 x = = = 18.26 n 100 30 30
21
Figure 7.12 |µµ|µµµ X U-shaped population (n = 2) X | (n = 5) X | (n = 30) X | Centrale limiet stelling
22
“Lies, damned lies” Google (31 aug 06): resultaten 1 - 10 van circa 2.730.000 voor lies, damned lies and statistics (0,41 seconden) –slechte steekproeven –te kleine steekproeven –slecht onderzoek (suggestieve vragen) –suggestieve weergave van gegevens –(te) precieze getallen –gegevens buiten de context –selectieve weergave van gegevens
23
Fouten… Systematische fouten: –niet representatieve steekproef –slecht meetinstrument Toevallige fouten: –steekproeffouten –“ruis” in de meting Statistiek is alleen bestand tegen toevallige fouten!
24
Kansberekening Kansberekening: bijv. de kans dat gevonden informatie de juiste is gegeven enkele kenmerken van die informatie. –mensen zijn hier slecht in!!
25
Intuitie is moeilijk Quiz: hoofdprijs U mag kiezen uit 3 deuren U kiest een deur … … Welke kans heeft U op de hoofdprijs? 1/3 1/3
26
Maar … Stel de quizmaster opent NA UW KEUZE een van de twee overgebleven deuren en laat zien dat daar niets in zit. U mag nu nog van deur wisselen. Doet U dit? Ja !! want dit vergroot Uw kans !!!
27
Analyse Stel de hoofdprijs zit achter deur 1: 1.U koos deur 1 (auto). De quizmaster opent een andere deur waarachter niets staat. Ruilen levert verlies op… 2.U koos deur 2 (leeg). De quizmaster opent deur 3 waarachter niets staat. Ruilen levert hoofdprijs! 3.U koos deur 3 (leeg). De quizmaster opent deur 2 waarachter niets staat. Ruilen levert hoofdprijs! 123
28
Stel: 3% van de sporters is doping-gebruiker. We hebben een test die een ‘gevoeligheid’ heeft van 99% (als gebruikt, dan positief), … en een specificiteit van 95% (als niet gebruikt dan negatieve test). We testen en de uitkomst is positief. Is er sprake van doping? P(doping + | test + ) Mensen zijn slechte schatters …
29
Intuitie is moeilijk - cntd doping doping test + 297485782 test - 392159218 300970010000 Stel: 3% van de sporters is doping-gebruiker. We hebben een test die een ‘gevoeligheid’ heeft van 99% (als gebruikt, dan positief), … en een specificiteit van 95% (als niet gebruikt dan negatieve test). Er is bijna 2 keer zo vaak géén sprake van doping bij een positieve test als dat de uitslag terecht is …
30
P(test + | doping + ) = 297/300 =.99 P(doping + | test + ) = 297/782 =.38 P(doping - | test + ) = 485/782 =.62 Intuitie is moeilijk - cntd Stel: 3% van de sporters is doping-gebruiker. We hebben een test die een ‘gevoeligheid’ heeft van 99% (als gebruikt, dan positief), … en een specificiteit van 95% (als niet gebruikt dan negatieve test). doping doping test + 297485782 test - 392159218 300970010000 Theorema van Bayes
31
P(A|B) = P(A). P(B|A) P(A).P(B|A) + P(Ã).P(B|Ã) A = doping B = test P(doping|test) = P(doping). P(test|doping) P(doping).P(test|doping) + P(doping-).P(test|doping-).03 x.99.03 x.99 +.97 x.05 =.38
32
Kans op voldoende eindcijfer
33
Onderwerpen Frequentie verdelingen, beschrijvende statistiek, visualisaties, verhouding steekproef/populatie, sampling methodes, onderzoeksmethodes, meetschalen, centrummaten, spreidingsmaten, z-scores, exploreren van gegevensverzamelingen (boxplots, quartielen, etc). Lineaire correlatie, regressie. Kansen, kansverdelingen, de binomiale kansverdeling en eigenschappen daarvan, waarschijnlijke/onwaarschijnlijke uitkomsten. Normaalverdeling, central limit theorema, normaalverdeling als benadering voor binomiaal verdeling, schatten van populatie parameters en betrouwbaarheidsintervallen (voor proportie, gemiddelde en variantie) in gevallen waarin σ bekend is en als σ onbekend is. Schattingen voor benodigde steekproefgroottes.
34
Onderwerpen-2 Hypothese toetsing, null-hypothese, alternatieve hypothese, fout van 1e en 2e soort, power, toetsingsgrootheid, claims over proporties, gemiddelden (met bekende en onbekende σ), standaarddeviaties en varianties. Claims over (verschillend zijn van) twee gemiddelden of twee proporties op basis van afhankelijke en onafhankelijke steekproeven. Regressie nogmaals, verklaarde en onverklaarde variantie, predictie intervallen. Rangorde correlatie. Non-parametrische toetsen: Chi-kwadraat (goodness-of-fit, homogeniteit, onafhankelijkheid). Eenwegs- variantie analyse.
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.