M ARIO F. T RIOLA 2 nd E DITION E LEMENTARY S TATISTICS.

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Introductie V2 en V3 Maandag 2 september – 15.00
M3F-MATEN - Tijd en Snelheid
NEDERLANDS WOORD BEELD IN & IN Klik met de muis
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Grote getallen Getallen groter dan vier cijfers schrijf je meestal in groepjes van drie. Je schrijft niet maar Dit spreek je.
Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 1.
Vraag 1: Welk onderwijstype volgt uw kind? Vraag 2: In welk jaar zit uw kind?
M3F-MATEN - Tijd en Snelheid
Sint Jorisschool Examenvoorlichting Studie & Voorbereiding Examen Uitslag Diploma.
Sint Jorisschool Examenvoorlichting
Fasen van onderzoek Onderzoeksplan bureauwerk Dataverzameling
Ronde (Sport & Spel) Quiz Night !
Natuurlijke Werkloosheid en de Phillipscurve
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Voorbereiding Clubbridge
© BeSite B.V www.besite.nl Feit: In 2007 is 58% van de organisaties goed vindbaar op internet, terwijl in 2006 slechts 32% goed vindbaar.
Examen Vmbo Coornhert Lyceum
havo A Samenvatting Hoofdstuk 11
havo A Samenvatting Hoofdstuk 8
Beschrijvende en inferentiële statistiek
Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere
P-waarde versus betrouwbaarheidsinterval
BZ voor de Klas 3 juni 2010.
Statistiek II Hoofdstuk 4: Toetsen voor één populatie
toetsen voor het verband tussen variabelen met gelijk meetniveau
Statistiek Verzamelen Voorstellen Beschrijven Interpreteren
vwo A Samenvatting Hoofdstuk 13
vwo A Samenvatting Hoofdstuk 15
vwo C Samenvatting Hoofdstuk 14
Regels bij kansrekeningen SomregelHebben de gebeurtenissen G 1 en G 2 geen gemeenschappelijke uitkomsten, dan is P(G 1 of G 2 ) = P(G 1 ) + P(G 2 ). ComplementregelP(gebeurtenis)
Centrummaten gemiddelde
Gegevensverwerving en verwerking
Inferentie voor regressie
P-waarde Wat is een p-waarde? De kans dat de toetsings-grootheid een extremere uitkomst (overeenkomstig met de alternatieve hypothese) geeft dan de waar-genomen.
Schatter voor covariantie
Eenzijdige Betrouwbaarheidsgrens
Continue kansverdelingen
Deze les wordt verzorgd door de Kansrekening en statistiekgroep Faculteit W&I TU/e.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Een fundamentele inleiding in de inductieve statistiek
Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
Populatiegemiddelden: recap
Logistische regressie
Statistiek voor Historici
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
Methodologie & Statistiek I Toetsen van twee gemiddelden 6.1.
Methodologie & Statistiek I Toetsen van proporties 7.1.
Methodologie & Statistiek I Principes van statistisch toetsen 5.1.
Meetonzekerheden In de natuurkunde moet je vaak een grootheid meten
Statistiek voor Dataverwerking
havo/vwo D Samenvatting Hoofdstuk 4
1. Levensbeschouwing en communicatie
INFORMATIE AVOND VWO 6 MAANDAG 9 SEPTEMBER. WELKOM INFORMATIE EXAMENJAAR INFORMATIE VERVOLGONDERWIJS.
ECHT ONGELOOFLIJK. Lees alle getallen. langzaam en rij voor rij
Steekproefonderzoek -- methodologie
Basisvaardigheden: Metingen en diagrammen
Centrummaten en Boxplot
Toets 1 Examen Reinder Reen.
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
Baarde en de goede Hoofdstuk 11: Data-analyse
Gegevens verzamelen Statistiek gaat over het verzamelen en verwerken van data (gegevens ) Data zijn vaak gespreid: -mensen hebben verschillende lengtes.
Wat zegt een steekproef?
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
Transcript van de presentatie:

M ARIO F. T RIOLA 2 nd E DITION E LEMENTARY S TATISTICS

Boek Literatuur: Mario Triola: Essentials of Statistics, 2 nd edition Addison-Wesley Higher Education, 2005

Organisatie Geen hoorcolleges: –vragenuur op basis van ingediende vragen –heel veel oefenmateriaal Verplichte werkcolleges: –Het maken van opgaven is essentieel en daarom verplicht. –Steeds de uitwerkingen van de aangegeven ‘exercises’ voorafgaand aan het werkcollege inleveren. –In 2004 drie stromen: snel, normaal, langzaam. Geen succes. –Werkgroepen & begeleiding: groep 1: woensdag 9-12, B341: W. Beek groep 2: donderdag 11-14, B341: F. de Vries. groep 3: ?? –practicumgroepen

Organisatie-vervolg Onderwijslast: 5 ECTS (140 uur, 17,5 uur/week) –minimaal 8 uren sommen maken! –lezen+studie ca. 6 uur –werkcollege ca. 3 uur Volgorde boek wordt aangehouden

website t0607/index.htmhttp://staff.science.uva.nl/~fdevries/stat/sta t0607/index.htm Op blackboard evt. de Triola sheets.

Waarom statistiek? 1. Beschrijvende statistiek 2. Inductieve statistiek 3. Kansberekening

1. Beschrijvende statistiek Informatie met behulp van enkele parameters (en visualisaties) compact beschrijven. –centrummaten –spreidingsmaten –proporties –maten voor samenhang

Figure 2-9 Deaths in British Military Hospitals During the Crimean War

Verdubbeling van lengte, breedte en hoogte vergroot het volume met een factor 8… Pas op voor misleiding …

Bachelor High School Degree Diploma $40,000 30,000 25,000 20,000 $40,500 $24,400 35,000 $40,000 20,000 10,000 0 $40,500 $24,400 30,000 Bachelor High School Degree Diploma Zo moet het niet …

2. Inductieve statistiek Met zo weinig mogelijke inspanning (kleine steekproef), zo precies mogelijke uitspraken doen (over populatie). –generalisatie van steekproef naar populatie. –alleen mogelijk onder een aantal strikte aannames!

Steekproeven Aselecte steekproef! Graag zo klein mogelijk

Saunders-hfst 6

Steekproevenverdeling Paragraaf 5.5: Centrale Limiet Theorema This section is extremely important…

Central Limit Theorem 1. The distribution of sample x will, as the sample size increases, approach a normal distribution. Conclusions:

Central Limit Theorem 1. The distribution of sample x will, as the sample size increases, approach a normal distribution. 2. The mean of the sample means will be the population mean µ. Conclusions:

Central Limit Theorem 1. The distribution of sample x will, as the sample size increases, approach a normal distribution. 2. The mean of the sample means will be the population mean µ. 3. The standard deviation of the sample means will approach  n Conclusions:

Centrale limiet stelling Figure 7.10 Uniform population µ = = 100  = = a + b 2 b - a a = 50 µ = 100 b = 150 X (n = 2) X (n = 5) X (n = 30) X µxµxµxµx By the CLT,µ x = µ = 100  x = = = 5.27  n

Centrale limiet stelling Figure 7.11 µ = 100 =  X Exponential population (n = 2) X (n = 5) X (n = 30) X µxµxµxµx By the CLT,µ x = µ = 100  x = = =  n

Figure 7.12 |µµ|µµµ X U-shaped population (n = 2) X | (n = 5) X | (n = 30) X | Centrale limiet stelling

“Lies, damned lies” Google (31 aug 06): resultaten van circa voor lies, damned lies and statistics (0,41 seconden) –slechte steekproeven –te kleine steekproeven –slecht onderzoek (suggestieve vragen) –suggestieve weergave van gegevens –(te) precieze getallen –gegevens buiten de context –selectieve weergave van gegevens

Fouten… Systematische fouten: –niet representatieve steekproef –slecht meetinstrument Toevallige fouten: –steekproeffouten –“ruis” in de meting Statistiek is alleen bestand tegen toevallige fouten!

Kansberekening Kansberekening: bijv. de kans dat gevonden informatie de juiste is gegeven enkele kenmerken van die informatie. –mensen zijn hier slecht in!!

Intuitie is moeilijk Quiz: hoofdprijs U mag kiezen uit 3 deuren U kiest een deur … … Welke kans heeft U op de hoofdprijs? 1/3 1/3

Maar … Stel de quizmaster opent NA UW KEUZE een van de twee overgebleven deuren en laat zien dat daar niets in zit. U mag nu nog van deur wisselen. Doet U dit? Ja !! want dit vergroot Uw kans !!!

Analyse Stel de hoofdprijs zit achter deur 1: 1.U koos deur 1 (auto). De quizmaster opent een andere deur waarachter niets staat. Ruilen levert verlies op… 2.U koos deur 2 (leeg). De quizmaster opent deur 3 waarachter niets staat. Ruilen levert hoofdprijs! 3.U koos deur 3 (leeg). De quizmaster opent deur 2 waarachter niets staat. Ruilen levert hoofdprijs! 123

Stel: 3% van de sporters is doping-gebruiker. We hebben een test die een ‘gevoeligheid’ heeft van 99% (als gebruikt, dan positief), … en een specificiteit van 95% (als niet gebruikt dan negatieve test). We testen en de uitkomst is positief. Is er sprake van doping? P(doping + | test + ) Mensen zijn slechte schatters …

Intuitie is moeilijk - cntd doping  doping test test Stel: 3% van de sporters is doping-gebruiker. We hebben een test die een ‘gevoeligheid’ heeft van 99% (als gebruikt, dan positief), … en een specificiteit van 95% (als niet gebruikt dan negatieve test). Er is bijna 2 keer zo vaak géén sprake van doping bij een positieve test als dat de uitslag terecht is …

P(test + | doping + ) = 297/300 =.99 P(doping + | test + ) = 297/782 =.38 P(doping - | test + ) = 485/782 =.62 Intuitie is moeilijk - cntd Stel: 3% van de sporters is doping-gebruiker. We hebben een test die een ‘gevoeligheid’ heeft van 99% (als gebruikt, dan positief), … en een specificiteit van 95% (als niet gebruikt dan negatieve test). doping  doping test test Theorema van Bayes

P(A|B) = P(A). P(B|A) P(A).P(B|A) + P(Ã).P(B|Ã) A = doping B = test P(doping|test) = P(doping). P(test|doping) P(doping).P(test|doping) + P(doping-).P(test|doping-).03 x x x.05 =.38

Kans op voldoende eindcijfer

Onderwerpen Frequentie verdelingen, beschrijvende statistiek, visualisaties, verhouding steekproef/populatie, sampling methodes, onderzoeksmethodes, meetschalen, centrummaten, spreidingsmaten, z-scores, exploreren van gegevensverzamelingen (boxplots, quartielen, etc). Lineaire correlatie, regressie. Kansen, kansverdelingen, de binomiale kansverdeling en eigenschappen daarvan, waarschijnlijke/onwaarschijnlijke uitkomsten. Normaalverdeling, central limit theorema, normaalverdeling als benadering voor binomiaal verdeling, schatten van populatie parameters en betrouwbaarheidsintervallen (voor proportie, gemiddelde en variantie) in gevallen waarin σ bekend is en als σ onbekend is. Schattingen voor benodigde steekproefgroottes.

Onderwerpen-2 Hypothese toetsing, null-hypothese, alternatieve hypothese, fout van 1e en 2e soort, power, toetsingsgrootheid, claims over proporties, gemiddelden (met bekende en onbekende σ), standaarddeviaties en varianties. Claims over (verschillend zijn van) twee gemiddelden of twee proporties op basis van afhankelijke en onafhankelijke steekproeven. Regressie nogmaals, verklaarde en onverklaarde variantie, predictie intervallen. Rangorde correlatie. Non-parametrische toetsen: Chi-kwadraat (goodness-of-fit, homogeniteit, onafhankelijkheid). Eenwegs- variantie analyse.