Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.

Slides:



Advertisements
Verwante presentaties
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Advertisements

Statistische uitspraken over onbekende populatiegemiddelden
HC2MFE Meten van verschillen
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Toetsen van verschillen tussen twee of meer groepen
Math Candel Universiteit Maastricht. •Achtergrond: –Diagnose probleem –Meetinstrumenten –Conceptueel model •Presentaties van eigen analyses •Voorbeeld.
Inleiding tot inferentie
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Math Candel Universiteit Maastricht. 1.Heldere en haalbare probleemstelling 2.Keuze van het design 3.Keuze van onderzoeks/analyse-eenheid 4.Operationalisatie.
Fasen van onderzoek Onderzoeksplan bureauwerk Dataverzameling
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Beschrijvende en inferentiële statistiek
Haal meer uit je Hersenen masterclass wiskunde
Beschrijvende en inferentiële statistiek
Beschrijvende en inferentiële statistiek
Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere
P-waarde versus betrouwbaarheidsinterval
Statistiek II Hoofdstuk 5: Toetsen voor twee populaties
Statistiek II Hoofdstuk 4: Toetsen voor één populatie
toetsen voor het verband tussen variabelen met gelijk meetniveau
Hoofdstuk 8: Variantieanalyse met herhaalde metingen hoofdstuk 8
1 Datastructuren Sorteren: alleen of niet alleen vergelijkingen College 5.
vwo A Samenvatting Hoofdstuk 15
Hypothese toetsen We hebben de volgende situatie.
Thesisseminarie 4 Resultaten Correlatie en multiple regressie
Chapter 9. Understanding Multivariate Techniques
Gegevensverwerving en verwerking
Non-parametrische technieken
Meervoudige lineaire regressie
Twee-factor Variantie-analyse
Inferentie voor regressie
Afhankelijkheidstabellen
Eenzijdige Betrouwbaarheidsgrens
Deze les wordt verzorgd door de Kansrekening en statistiekgroep Faculteit W&I TU/e.
Multifactoriële designs
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, uur 16 april : Hoe interpreteren we toetsresultaten?
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk, Doel: Informeren over statistiek in klinisch onderzoek, Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Voorspellende analyse
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
Methodologie & Statistiek I Verband tussen twee variabelen 3.2
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
Methodologie & Statistiek I Toetsen van proporties 7.1.
Methodologie & Statistiek I Principes van statistisch toetsen 5.1.
Welkom Voorlichtingsbijeenkomst ESF-EQUAL Tweede tranche Pieter Stroink.
Illustratie mogelijke redenen lage ICC’s in multilevel modellen bij de CQI Peter Moorer ARGO Rijksuniversiteit Groningen BV © ARGO – april 2009.
H4 Differentiëren.
De steekproefuitkomsten generaliseren naar de populatie
Management Accounting Management Control
Hoorcollege 3 Samenhang tussen variabelen
Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)
Baarde en de goede Hoofdstuk 11: Data-analyse
Cursus Regressie-analyse Rijkswaterstaat, 13 februari
Echtscheiding en sociaal kapitaal in Vlaanderen Belinda Wijckmans, Maaike Jappens & Jan Van Bavel Interface Demography Vlaanderen Gepeild 2009 Brussel,
Latent class growth analysis als succesvolle methode om subgroepen te identificeren binnen een gewichtsreductie interventie. Bastiaan C. de Vos¹, MD,
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Het doel en de grondbeginselen van statistiek in klinische onderzoeken
Illustratie mogelijke redenen lage ICC’s in multilevel modellen bij de CQI Peter Moorer ARGO Rijksuniversiteit Groningen BV © ARGO – april 2009.
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
Toetsen van verschillen tussen twee of meer groepen
Voorspellende analyse
Transcript van de presentatie:

Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde woensdag in de maand, 12-13 uur 21 mei multiple testing 18 juni statistische aspecten van de probiotica studie 17 sept … Sprekers: Vaclav Fidler, Hans Burgerhof, Wendy Post DG Epidemiologie www.EpidemiologyGroningen.nl

Multiple testing Wat is het (klassieke) probleem? “klassieke” oplossingen Recenter probleem Nieuwe oplossingen

Fouten van eerste en tweede soort bij het uitvoeren van een statistische toets Hebben mannen en vrouwen gemiddeld dezelfde bloeddruk (BD)? H0: gemiddelde BD mannen = gemiddelde BD vrouwen Beslissing H0 waar H0 niet waar Werkelijkheid OK Fout van de eerste soort, kans hierop: α Fout van de tweede soort, kans hierop: β

Het klassieke probleem van de multiple testing Bij een statistische toets hanteren we significantieniveau α (in de regel 0,05). Dat wil zeggen dat we een kans ter grootte van α accepteren om ten onrechte de nulhypothese te verwerpen Dit wordt ook wel de Comparison-wise error rate (CWER) genoemd Wat betekent het uitvoeren van meerdere onafhankelijke toetsen voor de totale kans om minstens één nulhypothese ten onrechte te verwerpen (als alle nulhypothesen waar zijn)? “Overall alpha” Family-wise error rate (FWER) Kanskapitalisatie!

FWER en CWER Als we n onafhankelijke toetsen uitvoeren, elk met een CWER = 0,05, geldt Aantal toetsen overall alpha n FWER 3 0,143 10 0,401 100 0,994

Klassieke oplossingen In een ANOVA worden k groepen met elkaar vergeleken met betrekking tot een normaal verdeelde responsievariabele Y. Als de ANOVA significant is, willen we weten welke groepen verschillen. Als we alle paarsgewijze vergelijkingen willen doen, moeten we toetsen uitvoeren. Bijvoorbeeld: 4 groepen 4*3/2 = 6 toetsen

Post-hoc toetsen Zorg dat je de FWER (overall-alpha) beheerst na een ANOVA Er zijn vele Post-hoc toetsen, optimaal onder verschillende omstandigheden, o.a. - LSD: paarsgewijze t-toetsen met SD op basis van alle groepen - Bonferroni: als LSD met aangepaste α per toets CWER = α / (aantal uitgevoerde toetsen) (in SPSS aangepaste P-waarde) - Bonferroni-Holm: step-down procedure op geordende P-waarden (verschillende α per toets) - Tukey: gebaseerd op kritieke waarden uit de “studentized range statistic” - Scheffé: voor lineaire combinaties van gemiddelden

Post-hoc toetsen in SPSS

Multiple testing is niet alleen een ANOVA probleem Bij meervoudige lineaire regressie speelt eveneens het probleem van kanskapitalisatie Vergelijk ANOVA met lineaire regressie met een nominale verklarende variabele Toetsen van diverse lineaire modellen geeft ook kanskapitalisatie

Parametervrije toetsen Wat te doen na een significante Kruskal-Wallis? Paarsgewijze Mann-Whitney toetsen met Bonferroni gecorrigeerde P-waarden? Conover (Practical nonparametric statistics, 1999):

Recenter probleem: Micro-array analyse Bij toetsen op duizenden genen is de klassieke manier (beheersen van FWER) te conservatief Voorselectie van interessante genen: een vals positief resultaat is niet zo’n ramp terwijl een vals negatief resultaat als meer vervelend wordt ervaren Hedenfalk e.a. (2001); 3226 genen bij vrouwen met borstkanker (BRCA1-gen versus BRCA2-gen) We zoeken een ander criterium: de FDR (false discovery rate)

Sequentiële FDR (Benjamini en Hochberg, 1995) FDR = de verwachte proportie van de verworpen nulhypotheses die ten onrechte verworpen is niet significant totaal significant Ware nulhypothesen U V m0 Niet ware nulhypothesen T S m1 m – R R m Alleen m bekend Alleen R wordt waargenomen! FDR = E(V/R)

De FDR niet significant totaal significant Ware nulhypothesen U V m0 Niet ware nulhypothesen T S m1 m – R R m Benjamini en Hochberg (1995): als alle nulhypothesen waar zijn, dus T = S = m1 = 0, heeft het controleren van de FDR tot gevolg dat de FWER gecontroleerd wordt (dus de overall-alpha blijft binnen de gedefinieerde grens)

Over de FDR Als er in werkelijkheid wel nulhypothesen onwaar zijn, is FDR kleiner of gelijk aan FWER. Controle van FDR betekent niet langer controle van FWER, maar geeft meer power. Hoe meer nulhypotheses onwaar zijn, hoe groter de winst in power

Multiple testing volgens Benjamini en Hochberg: Sequentiële FDR procedure m nulhypothesen: H1, H2, … , Hm m P-waarden: P1, P2, … , Pm Geordend: P(1) ≤ P(2) ≤ … ≤ P(m) Zoek de grootste i waarvoor geldt q = gekozen niveau van controle (bv 0,05) En verwerp alle H(i) i = 1, 2, … , k Vergelijk Bonferroni (Holm)

Voorbeeld (Benjamini en Hochberg) 15 toetsen Geordende P-waarden: P(1) P(2) P(3) P(4) P(5) P(6) P(14) P(15) 0,0001 0,0004 0,0019 0,0095 0,0201 0,0278 … 0,7590 1,00 Vergelijk iedere P(i) met (i/15)*0,05, te beginnen met P(15) (stepup) 1 > (15/15)*0,05 0,7590 > (14/15)*0,05 = 0,047 … 0,0201 > (5/15)*0,05 = 0,017 0,0095 < (4/15)*0,05 = 0,013 Bonferroni: α = 0,05/15 = 0,0033 Verwerp H(1) t/m H(4)

FDR nader bekeken Sequentiële FDR conservatief, met name als het aantal onware nulhypothesen relatief groot is Benjamini e.a. (2001): tweestapsprocedure waarbij na de eerste stap de proportie ware nulhypothesen (π0) wordt geschat en in de tweede wordt gebruikt om de grens q aan te passen Storey (2002): directe wijze om π0 te schatten

Het schatten van π0 We willen π0 = m0/m schatten niet significant totaal significant Ware nulhypothesen U V m0 Niet ware nulhypothesen T S m1 m – R R m

H0: µ = 100 steekproef Wat verwacht je van de P-waarde? Als H0 waar is

is de P-waarde uniform verdeeld op [0,1] H0: µ = 100 Gebieden met gelijke oppervlaktes Als H0 waar is … is de P-waarde uniform verdeeld op [0,1]

Als de nulhypothese niet waar is Is de P-waarde niet uniform verdeeld op het interval [0 ; 1], maar zul je relatief vaker een kleine P-waarde vinden Aantal P-waarden P-waarden uit m1 P-waarden uit m0 1

3226 genen (BRCA data) Verwacht aantal P-waarden >  is (1 - )*m0 + klein deel m1, dus m0 ≈ #{P>} / (1-) 

π0 als functie van 

Concreet voorbeeld (Hedenfalk) 3226 toetsen P < 0,001: 51 significant P < 0,0001: 10 significant Bonferroni: α = 0,05/3226 = 0,000015 FDR (Storey): q = 0,05 geeft 160 significante genen (waarvan er vermoedelijk 8 ten onrechte)

Gebruik FDR FDR wordt gebruikt voor Correctie multiple testing (sequentiële FDR, Benjamini en Hochberg) Variabele selectie (Ghosh) Vergelijken van (nieuwe) statistische methoden. Bij gelijk aantal verworpen nulhypothesen is de methode met de kleinste FDR de beste methode

literatuur Conover, Practical nonparametric statistics (Wiley 1999) Benjamini en Hochberg, Controlling the False Discovery Rate: a practical and powerful approach to multiple testing (Journal Royal Stat. Soc. B, 1995) Benjamini, Krieger, Yekutieli: Two staged linear step up FDR controlling procedure (Technical report 2001) Nguyen, On estimating the proportion of true null hypotheses for false discovery rate controlling procedures in exploratory DNA microarray studies (Computational statistics and data analysis, 2004) Storey, A direct approach to false discovery rates (Journal Royal Stat. Soc. B, 2002) Ghosh e.a., the false discovery rate: a variable selection perspective (J. Stat. Plan. Infer., 2004)

Volgende lezing 18 juni statistische aspecten van de probiotica studie