Multifactoriële designs

Slides:



Advertisements
Verwante presentaties
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Advertisements

Statistische uitspraken over onbekende populatiegemiddelden
HC2MFE Meten van verschillen
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Beschrijvende en inferentiële statistiek
Onderscheidingsvermogen van hypothesetoetsen toegepast op de z-toets
Toetsen van verschillen tussen twee of meer groepen
Math Candel Universiteit Maastricht. •Achtergrond: –Diagnose probleem –Meetinstrumenten –Conceptueel model •Presentaties van eigen analyses •Voorbeeld.
Statistiek II Deel 1.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Beschrijvende en inferentiële statistiek
De Weibull verdeling Waloddi Weibull ( ) Weibull:
Leiden University. The university to discover. ICLON, Interfacultair Centrum voor Lerarenopleiding, Onderwijsontwikkeling en Nascholing Denkgereedschap.
Beschrijvende en inferentiële statistiek
Beschrijvende en inferentiële statistiek
Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere
P-waarde versus betrouwbaarheidsinterval
Statistiek II Hoofdstuk 5: Toetsen voor twee populaties
Statistiek II Hoofdstuk 4: Toetsen voor één populatie
Hoofdstuk 7: Variantieanalyse hoofdstuk 7
toetsen voor het verband tussen variabelen met gelijk meetniveau
Hoofdstuk 8: Variantieanalyse met herhaalde metingen hoofdstuk 8
Experimenteel Design Prof. Dr. S. Van Dongen
vwo A Samenvatting Hoofdstuk 15
vwo C Samenvatting Hoofdstuk 14
De grafiek van een lineair verband is ALTIJD een rechte lijn.
Chapter 9. Understanding Multivariate Techniques
Gegevensverwerving en verwerking
Chapter 9. Understanding Multivariate Techniques
Non-parametrische technieken
Meervoudige lineaire regressie
Twee-factor Variantie-analyse
Inferentie voor regressie
Afhankelijkheidstabellen
Schatter voor covariantie
Eenzijdige Betrouwbaarheidsgrens
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, uur 16 april : Hoe interpreteren we toetsresultaten?
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk, Doel: Informeren over statistiek in klinisch onderzoek, Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Hoofdstuk 9 Verbanden, correlatie en regressie
Voorspellende analyse
Toetsen als Leerinterventie. Samenvatten in het Testing Effect Paradigma. Kim J. H. Dirkx, Liesbeth Kester, Paul A. Kirschner CELSTEC, Open Universiteit.
Populatiegemiddelden: recap
Methodologie & Statistiek I Verband tussen twee variabelen 3.2
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
Methodologie & Statistiek I Toetsen van twee gemiddelden 6.1.
Methodologie & Statistiek I Principes van statistisch toetsen 5.1.
ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B
Illustratie mogelijke redenen lage ICC’s in multilevel modellen bij de CQI Peter Moorer ARGO Rijksuniversiteit Groningen BV © ARGO – april 2009.
Inhoud presentatie Statistische betrouwbaarheid: belangrijk?
Partiële r² Predictie van y gebaseerd op z alleen
Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)
Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.
Baarde en de goede Hoofdstuk 11: Data-analyse
Cursus Regressie-analyse Rijkswaterstaat, 13 februari
Latent class growth analysis als succesvolle methode om subgroepen te identificeren binnen een gewichtsreductie interventie. Bastiaan C. de Vos¹, MD,
College 9 zHoe gaat het met de afname? zData-invoer zEerste analyses.
Nut en noodzaak van het ruismodel  NHV Tijdreeksanalyse discussiemiddag  Koen van der Hauw  1 oktober 2015 Enkele praktische ervaringen.
DOELEN VAN W&T ONDERWIJS
Het doel en de grondbeginselen van statistiek in klinische onderzoeken
Toetsen van verschillen tussen twee of meer groepen
Voorspellende analyse
Transcript van de presentatie:

Multifactoriële designs Kindergeneeskunde 7 december 2006

programma DEC: formule van Mead Enkele statistische begrippen Toelichting multifactorieel design Relatie aantallen “volgens Mead” met huidige situatie Simulaties Conclusies

Formule van Mead (resource equation) Formule: E = N – B – T Waarin N = het aantal vrijheidsgraden behorende bij het totaal aantal proefdieren (dus bij n proefdieren is N = n – 1) B = het aantal vrijheidsgraden behorende bij het aantal “blokken” of strata T = het aantal vrijheidsgraden behorende bij het aantal “treatments” (of totaal te testen nulhypothesen, inclusief interacties) E is dan het aantal resterende vrijheidsgraden voor de error (of residuen). Advies van Mead: 10 ≤ E ≤ 20

Statistische begrippen Df = Degrees of Freedom = vrijheidsgraden T-test Significantieniveau Power (onderscheidingsvermogen) ANOVA (lineair model) interactie

Fouten van eerste en tweede soort Beslissing H0 waar H0 niet waar Werkelijkheid OK Fout van de eerste soort, kans hierop: α Fout van de tweede soort, kans hierop: β Power

Relatie steekproefgrootte en power Als α = 0,05 is zα = 1,96, als β = 0,2 is zβ = 0,84, Om n te kunnen bepalen heb je een schatting van de standaarddeviatie (s) nodig en het aan te tonen verschil (d). Waaruit volgt dat n ongeveer 16 (dus 8 per groep) moet zijn om een verschil van een sd te kunnen aantonen met een power van 80%.

ANalysis Of VAriance Oneway; uitbreiding van de t-test tot meer dan twee groepen. Getoetst wordt de H0: Dit gebeurt door de variantie tussen de groepen te vergelijken met de variantie binnen de groepen

Scatterplot

Lineair model In plaats van H0: kun je ook schrijven: waarin de α’s de afwijkingen zijn van de groepsgemiddelden ten opzichte van het overall gemiddelde en toetsen dat alle α’s gelijk zijn aan 0 Een willekeurige waarneming uit groep i wordt dan geschreven als:

Voorwaarden ANOVA Onafhankelijke waarnemingen Varianties in de groepen zijn gelijk Normale verdeling per groep of voor het lineair model: Residuen normaal verdeeld Homogene spreiding van de residuen

Voorbeeld state glucose 1.00 4.00 1.00 4.10 1.00 4.40 1.00 4.10 1.00 4.00 1.00 4.10 1.00 4.40 1.00 4.10 2.00 2.20 2.00 2.60 2.00 3.20 2.00 2.60 3.00 5.20 3.00 5.00 3.00 4.70

SPSS uitvoer van Oneway ANOVA

Relatie statistische technieken ANOVA op twee groepen = t-test Resultaten van lineaire regressie met dummy-codering is equivalent aan de resulaten van ANOVA Oneway ANOVA uit te breiden naar meerdere verklarende factoren: multifactoriële analyse of “meerweg” ANOVA (two-way, three-way, …)

Mead: E = N – B – T (E was df of de error) Advies van Mead: 10 ≤ E ≤ 20.

SPSS uitvoer Oneway ANOVA Dit is de T (df van treatments) van Mead N = n-1 Dit is E van Mead

De formule van Mead toegepast op twee groepen E = N – B – T B = 0, T = 1 dus als moet gelden dat 10 ≤ E ≤ 20, geldt dat 11 ≤ N ≤ 21 en daarmee voor de steekproefgrootte n: 12 ≤ n ≤ 22, dus de groepen moeten tussen 6 en 11 groot zijn. Bij n = 12 is bij een power van 80 % een verschil van 1,8 sd aan te tonen Bij n = 22 een verschil van 1,3 sd

Multifactorieel design Kijken naar het effect van verschillende variabelen (factoren) tegelijk (bijvoorbeeld type muis / dieet / state) Mogelijkheid om interacties tussen deze variabelen te toetsen Efficienter dan meerdere kleinere studies

Voorbeeld Vergelijking power van t-toets voor één factor (interventie) met two-way ANOVA (interventie / dieet) voor verschillende effectgroottes Zonder interactie / met interactie

Twee afzonderlijke experimenten Twee onafhankelijke experimenten betreffende factor A (effect 1,5 sd) en factor B (geen effect) Simulatie van data: er worden voor experiment A 6 waarnemingen getrokken uit N(20,2) en 6 uit N(23,2) Voor experiment B 2 maal 6 waarnemingen uit N(20,2) Dit wordt 10.000 maal uitgevoerd, bij ieder experiment toetsen we met de t-toets

Resultaten t-testen van de 10.000 simulaties met steeds12 dieren voor experiment A en 12 voor B: 6543 significant voor A, 510 voor B Dit komt goed overeen met de theorie: de power is ± 65 % bij een verschil van anderhalve sd en een α = 0,05 (factor A) en als er geen effect is (factor B) verwacht je in 5 % van de gevallen ten onrechte de nulhypothese te verwerpen

Simulaties met twee factoren in één proefopzet (zonder interactie) Data gesimuleerd volgens een additief model (effecten van factor A en B zijn geheel onafhankelijk van elkaar) Gesimuleerd worden data uit een normale verdeling met gemiddelden: Factor B = 0 Factor B = 1 Factor A = 0 µ µ + b Factor A = 1 µ + a µ + a + b en dezelfde standaarddeviatie

ANOVA zonder toets op interactie, 10.000 toetsen Aantal per cel: Aantal significante tests voor factor A (1,5 sd) Aantal significante tests voor factor B (geen effect) n=4 (totaal 16) 7908 498 n=5 (totaal 20) 8880 502 n=6 (totaal 24) 9398 495 Bij een t-toets met 2x8 is de power 80% Vergelijk power t-toets: 65 % (n=2x6)

Idem, effect A is 1,5 sd, effect B is 1 sd Aantal per cel: Aantal significante tests voor factor A Aantal significante tests voor factor B n=4 (totaal 16) 7878 4532 n=5 (totaal 20) 8849 5556 n=6 (totaal 24) 9402 6463 Power t-test bij n = 2*6 = 12 factor A: 65 % (dus totaal 24) factor B: 35 %

Testen met interactie Eerst kijken naar de test van de interactie: als deze significant is zijn de hoofdeffecten niet meer los te interpreteren. (Het verschil tussen de diëten is anders voor mannetjes dan voor vrouwtjes). Als er in werkelijkheid geen interactie is, zul je in ongeveer 5 % van de gevallen ten onrechte toch een interactie constateren Als er wel een interactie is, zul je dat in twee gescheiden onderzoeken nooit constateren!

Effect A = 1,5 sd, effect B = 1 sd, geen interactie (10.000 maal) Aantal significante tests A Aantal significante tests B Aantal significante interacties n = 4 (totaal 16) 4903 2509 503 n = 5 (totaal 20) 6007 3126 516 n = 6 (totaal 24) 7060 3773 513 Power t-test bij n = 2*6 = 12 factor A: 65 % factor B: 35 %

Vergelijking met de onafhankelijke toetsen Er lijkt slechts een geringe winst in power, maar op het moment dat de interactie niet significant is, toets dan opnieuw, zonder de interactieterm in het model

Minder power voor het toetsen van de interactieterm 10.000 experimenten met effect A = 1,5 sd, effect b = 0, interactie-effect = 2 sd Aantal significante tests voor A Aantal significante tests voor B Aantal significante tests voor AB n = 4 (totaal 16) 4900 510 4573 n = 5 (totaal 20) 6071 501 5542 n = 6 (totaal 24) 6989 523 6437 Minder power voor het toetsen van de interactieterm

Multifactoriële toets in SPSS Analyze General linear model Univariate (bedoeld wordt één responsievariabele) Vul in: Dependent Variable (Y) Fixed Factor(s) Options (descriptives + homogeniteitstest) Plots (en eventueel Model voor de modelspecificatie)

R. Mead, The design of experiments R. Mead, The design of experiments. Statistical principles for practical application Blz 587 / 588 The resource equation … It is of course possible to keep the value of E in the region of 10 to 20 by doing several small experiments, rather than one rather larger experiment in which the total number of experimental units is much less than the sum of the units in the separate small experiments. This is inefficient because of the need to estimate σ² for each experiment. The experimenter should identify clearly the questions he wishes the experiment to cover, and he should also consider carefully if he is asking enough questions to use the experimental resources efficiently.

Conclusies Een gecombineerde studie kan inderdaad efficienter zijn dan meerdere kleinere studies De meeste winst valt te behalen als er geen sprake is van interactie tussen de factoren Indien er een interactie verwacht wordt zullen de aantallen per cel groter moeten zijn dan de formule van Mead voorschrijft