De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

M ARIO F. T RIOLA 2 nd E DITION E LEMENTARY S TATISTICS.

Verwante presentaties


Presentatie over: "M ARIO F. T RIOLA 2 nd E DITION E LEMENTARY S TATISTICS."— Transcript van de presentatie:

1 M ARIO F. T RIOLA 2 nd E DITION E LEMENTARY S TATISTICS

2 Boek Literatuur: Mario Triola: Essentials of Statistics, 2 nd edition Addison-Wesley Higher Education, 2005

3 Organisatie Geen hoorcolleges: –vragenuur op basis van ingediende vragen –heel veel oefenmateriaal Verplichte werkcolleges: –Het maken van opgaven is essentieel en daarom verplicht. –Steeds de uitwerkingen van de aangegeven ‘exercises’ voorafgaand aan het werkcollege inleveren. –In 2004 drie stromen: snel, normaal, langzaam. Geen succes. –Werkgroepen & begeleiding: groep 1: woensdag 9-12, B341: W. Beek groep 2: donderdag 11-14, B341: F. de Vries. groep 3: ?? –practicumgroepen

4 Organisatie-vervolg Onderwijslast: 5 ECTS (140 uur, 17,5 uur/week) –minimaal 8 uren sommen maken! –lezen+studie ca. 6 uur –werkcollege ca. 3 uur Volgorde boek wordt aangehouden

5 website http://staff.science.uva.nl/~fdevries/stat/sta t0607/index.htmhttp://staff.science.uva.nl/~fdevries/stat/sta t0607/index.htm Op blackboard evt. de Triola sheets.

6 Waarom statistiek? 1. Beschrijvende statistiek 2. Inductieve statistiek 3. Kansberekening

7 1. Beschrijvende statistiek Informatie met behulp van enkele parameters (en visualisaties) compact beschrijven. –centrummaten –spreidingsmaten –proporties –maten voor samenhang

8

9 Figure 2-9 Deaths in British Military Hospitals During the Crimean War

10 Verdubbeling van lengte, breedte en hoogte vergroot het volume met een factor 8… Pas op voor misleiding …

11 Bachelor High School Degree Diploma $40,000 30,000 25,000 20,000 $40,500 $24,400 35,000 $40,000 20,000 10,000 0 $40,500 $24,400 30,000 Bachelor High School Degree Diploma Zo moet het niet …

12 2. Inductieve statistiek Met zo weinig mogelijke inspanning (kleine steekproef), zo precies mogelijke uitspraken doen (over populatie). –generalisatie van steekproef naar populatie. –alleen mogelijk onder een aantal strikte aannames!

13 Steekproeven Aselecte steekproef! Graag zo klein mogelijk

14 Saunders-hfst 6

15 Steekproevenverdeling Paragraaf 5.5: Centrale Limiet Theorema This section is extremely important…

16 Central Limit Theorem 1. The distribution of sample x will, as the sample size increases, approach a normal distribution. Conclusions:

17 Central Limit Theorem 1. The distribution of sample x will, as the sample size increases, approach a normal distribution. 2. The mean of the sample means will be the population mean µ. Conclusions:

18 Central Limit Theorem 1. The distribution of sample x will, as the sample size increases, approach a normal distribution. 2. The mean of the sample means will be the population mean µ. 3. The standard deviation of the sample means will approach  n Conclusions:

19 Centrale limiet stelling Figure 7.10 Uniform population µ = = 100  = = 28.87 a + b 2 b - a 12 12 a = 50 µ = 100 b = 150 X (n = 2) X (n = 5) X (n = 30) X µxµxµxµx By the CLT,µ x = µ = 100  x = = = 5.27  n 28.87 30 30

20 Centrale limiet stelling Figure 7.11 µ = 100 =  X Exponential population (n = 2) X (n = 5) X (n = 30) X µxµxµxµx By the CLT,µ x = µ = 100  x = = = 18.26  n 100 30 30

21 Figure 7.12 |µµ|µµµ X U-shaped population (n = 2) X | (n = 5) X | (n = 30) X | Centrale limiet stelling

22 “Lies, damned lies” Google (31 aug 06): resultaten 1 - 10 van circa 2.730.000 voor lies, damned lies and statistics (0,41 seconden) –slechte steekproeven –te kleine steekproeven –slecht onderzoek (suggestieve vragen) –suggestieve weergave van gegevens –(te) precieze getallen –gegevens buiten de context –selectieve weergave van gegevens

23 Fouten… Systematische fouten: –niet representatieve steekproef –slecht meetinstrument Toevallige fouten: –steekproeffouten –“ruis” in de meting Statistiek is alleen bestand tegen toevallige fouten!

24 Kansberekening Kansberekening: bijv. de kans dat gevonden informatie de juiste is gegeven enkele kenmerken van die informatie. –mensen zijn hier slecht in!!

25 Intuitie is moeilijk Quiz: hoofdprijs U mag kiezen uit 3 deuren U kiest een deur … … Welke kans heeft U op de hoofdprijs? 1/3 1/3

26 Maar … Stel de quizmaster opent NA UW KEUZE een van de twee overgebleven deuren en laat zien dat daar niets in zit. U mag nu nog van deur wisselen. Doet U dit? Ja !! want dit vergroot Uw kans !!!

27 Analyse Stel de hoofdprijs zit achter deur 1: 1.U koos deur 1 (auto). De quizmaster opent een andere deur waarachter niets staat. Ruilen levert verlies op… 2.U koos deur 2 (leeg). De quizmaster opent deur 3 waarachter niets staat. Ruilen levert hoofdprijs! 3.U koos deur 3 (leeg). De quizmaster opent deur 2 waarachter niets staat. Ruilen levert hoofdprijs! 123

28 Stel: 3% van de sporters is doping-gebruiker. We hebben een test die een ‘gevoeligheid’ heeft van 99% (als gebruikt, dan positief), … en een specificiteit van 95% (als niet gebruikt dan negatieve test). We testen en de uitkomst is positief. Is er sprake van doping? P(doping + | test + ) Mensen zijn slechte schatters …

29 Intuitie is moeilijk - cntd doping  doping test + 297485782 test - 392159218 300970010000 Stel: 3% van de sporters is doping-gebruiker. We hebben een test die een ‘gevoeligheid’ heeft van 99% (als gebruikt, dan positief), … en een specificiteit van 95% (als niet gebruikt dan negatieve test). Er is bijna 2 keer zo vaak géén sprake van doping bij een positieve test als dat de uitslag terecht is …

30 P(test + | doping + ) = 297/300 =.99 P(doping + | test + ) = 297/782 =.38 P(doping - | test + ) = 485/782 =.62 Intuitie is moeilijk - cntd Stel: 3% van de sporters is doping-gebruiker. We hebben een test die een ‘gevoeligheid’ heeft van 99% (als gebruikt, dan positief), … en een specificiteit van 95% (als niet gebruikt dan negatieve test). doping  doping test + 297485782 test - 392159218 300970010000 Theorema van Bayes

31 P(A|B) = P(A). P(B|A) P(A).P(B|A) + P(Ã).P(B|Ã) A = doping B = test P(doping|test) = P(doping). P(test|doping) P(doping).P(test|doping) + P(doping-).P(test|doping-).03 x.99.03 x.99 +.97 x.05 =.38

32 Kans op voldoende eindcijfer

33 Onderwerpen Frequentie verdelingen, beschrijvende statistiek, visualisaties, verhouding steekproef/populatie, sampling methodes, onderzoeksmethodes, meetschalen, centrummaten, spreidingsmaten, z-scores, exploreren van gegevensverzamelingen (boxplots, quartielen, etc). Lineaire correlatie, regressie. Kansen, kansverdelingen, de binomiale kansverdeling en eigenschappen daarvan, waarschijnlijke/onwaarschijnlijke uitkomsten. Normaalverdeling, central limit theorema, normaalverdeling als benadering voor binomiaal verdeling, schatten van populatie parameters en betrouwbaarheidsintervallen (voor proportie, gemiddelde en variantie) in gevallen waarin σ bekend is en als σ onbekend is. Schattingen voor benodigde steekproefgroottes.

34 Onderwerpen-2 Hypothese toetsing, null-hypothese, alternatieve hypothese, fout van 1e en 2e soort, power, toetsingsgrootheid, claims over proporties, gemiddelden (met bekende en onbekende σ), standaarddeviaties en varianties. Claims over (verschillend zijn van) twee gemiddelden of twee proporties op basis van afhankelijke en onafhankelijke steekproeven. Regressie nogmaals, verklaarde en onverklaarde variantie, predictie intervallen. Rangorde correlatie. Non-parametrische toetsen: Chi-kwadraat (goodness-of-fit, homogeniteit, onafhankelijkheid). Eenwegs- variantie analyse.


Download ppt "M ARIO F. T RIOLA 2 nd E DITION E LEMENTARY S TATISTICS."

Verwante presentaties


Ads door Google