Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met herhaalde metingen? 19 maart : ROC curve en diagnostische nauwkeurigheid 16 april : Hoe moeten we toetsresultaten interpreteren? Sprekers: Vaclav Fidler, Hans Burgerhof, Wendy Post DG Epidemiologie
Herhaalde metingen Wat zijn herhaalde metingen? Waarom zijn de gebruikelijke methoden niet geschikt? Mogelijke benaderingen De random effects modellen Random interceptmodel Waarom moeten we random effects modellen gebruiken?
Herhaalde metingen Subjecten (personen, patiënten, dieren) van één of meer groepen hebben meerdere metingen op één of meer variabelen. Wanneer interessant? Verschillen binnen personen Verschillen tussen personen Probleem: Waarnemingen zijn niet onafhankelijk
Voorbeelden algemeen Voor- en nameting voor 1 groep personen: within design Herhaalde metingen voor 2 verschillende behandelgroepen: within en between design Uitbreiding naar meerdere within-factoren en meerdere between factoren: zoals geslacht en leeftijd en behandeling (between factoren) meerdere momenten door verschillende observers (within factoren)
Voorbeelden algemeen Longitudinale studie: groei-curves Cross-over designs In duplo of meer uitgevoerde lab-bepalingen
Voorbeelden algemeen Multi-level benadering: multicenter clinical trials Patiënten kunnen opgevat worden als herhaalde metingen binnen 1 centrum In meta-analyses: de waarnemingen binnen elke studie zijn de herhaalde waarnemingen Kortom: Geclusterde data kunnen opgevat worden als herhaalde metingen data en andersom.
Voorbeeld 5 subjecten 4 herhaalde metingen Stofwisseling- parameter Subject Dieet voor na maaltijd 1 N 1.47 1.78 O 1.72 2.49 2 N 1.42 1.68 O 1.44 1.87 N 1.10 1.26 O 1.11 1.36 N 0.84 1.11 O 0.90 1.29 N 0.91 1.09 O 1.00 1.25 5 subjecten 4 herhaalde metingen Stofwisseling- parameter 2 factoren: Dieet: N en O Tijd: voor en na
Voorbeeld Drie vragen Is er een dieet effect? Is er een tijdseffect Subject Dieet voor na maaltijd 1 N 1.47 1.78 O 1.72 2.49 2 N 1.42 1.68 O 1.44 1.87 N 1.10 1.26 O 1.11 1.36 N 0.84 1.11 O 0.90 1.29 N 0.91 1.09 O 1.00 1.25 Drie vragen Is er een dieet effect? Is er een tijdseffect Is er een interactie effect?
Voorbeeld
Voorbeeld Is er een dieet effect? Subject Dieet voor na maaltijd 1 N 1.47 1.78 O 1.72 2.49 2 N 1.42 1.68 O 1.44 1.87 N 1.10 1.26 O 1.11 1.36 N 0.84 1.11 O 0.90 1.29 N 0.91 1.09 O 1.00 1.25 Is er een dieet effect? Gepaarde t-test per tijdmoment (of gemiddelde) 5 observaties
Voorbeeld Is er een tijds effect? Gepaarde t-test per dieet Subject Dieet voor na maaltijd 1 N 1.47 1.78 O 1.72 2.49 2 N 1.42 1.68 O 1.44 1.87 N 1.10 1.26 O 1.11 1.36 N 0.84 1.11 O 0.90 1.29 N 0.91 1.09 O 1.00 1.25 Is er een tijds effect? Gepaarde t-test per dieet (of gemiddelde) 5 observaties
Voorbeeld Subject dieet voor achter maaltijd delta 1 N 1.47 1.78 0.31 Is er een interactie effect? Is de verandering over tijd verschillend voor de beide diëten? Varieert het verschil tussen de diëten over de tijd? Gepaarde t-test op delta (verandering)
Voorbeeld Als er slechts 2 herhaalde metingen zijn per factor: gepaarde t-test is een oplossing Maar wat als er meer herhaalde metingen zijn? De afhankelijkheden tussen metingen binnen elk persoon zijn de oorzaak van het feit dat we de technieken moeten gebruiken die rekening houden met deze correlaties!
Mogelijke benaderingen 1. Gebruiken van 1 samengevatte variabele: Verschilscore van na- en voormeting Maximum of minimum Gemiddelde Voordeel simpel: we hebben weer onafhankelijke waarnemingen Nadelen: Informatie wordt weggegooid Bij missende data is er geen goede samenvatting
Mogelijke benaderingen 2. Per herhaalde meting de analyse uitvoeren Voordeel 1. simpel: alleen onafhankelijke waarnemingen Nadelen 1. multiple testing 2. houdt geen rekening met de afhankelijkheidsstructuur
Mogelijke benaderingen RM-ANOVA Uitbreiding van ANOVA/MANOVA met zelfde terminologie Voordelen: Voor mensen die ANOVA-technieken kennen is het een natuurlijke uitbreiding Bekend bij velen als enige manier, omdat tot voor een paar jaar geleden dit de enige manier was om herhaalde metingen in SPSS te analyseren Nadelen Alleen continue responsematen Zeer strenge eisen t.a.v. afhankelijkheidsstructuur van de data (compound symmetry) Kan geen missende gegevens aan
Mogelijke benaderingen 4. Random-effectsmodellen Regressiemodelbenadering met zelfde terminologie Ook wel multilevelmodellen, random parameter modellen of mixed models genoemd Voordelen Standaard in pakketten als SAS, MLwin, S-plus en R, en SPSS (sinds versie 12 werkt mixed models redelijk) Kan missing data aan (MAR) Flexibiliteit in modelleren van afhankelijkheidsstructuur Nadeel: Complexe modellen! Vraagt veel van onderzoeker
Nieuw voorbeeld met 2 factoren: factor tijd (within) factor dieet (between) Onderzoeksprobleem: Vergelijken van 2 verschillende diëten t.a.v. effect op gewicht Experiment: Gerandomiseerde trial 2 diëten A and B; 20 personen Elk persoon wordt elke 3 maanden gewogen Baseline: voor start dieet; laatste meting: 12 maanden na start dieet: in totaal 5 metingen per persoon Na randomisatie: 8 personen krijgen dieet A ; 12 personen dieet B
Nieuw voorbeeld (vervolg): factor tijd en factor dieet Onderzoeksvraag: Welk dieet heeft meer effect op het gewicht? Eigenlijk: Zijn er verschillen tussen de 2 diëten voor wat betreft de veranderingen in gewicht over tijd? Vraag betreft interactie tussen tijd en dieet.
Random effects model Twee niveaus: Niveau 1: (within) Metingen binnen een persoon: veranderingen over de tijd Niveau 2: (between) Metingen tussen personen: verschillen als gevolg van dieet
Nieuw voorbeeld (vervolg): factor tijd en factor dieet
Random effects model: niveau 1 Model voor verandering over tijd gewichtij = 0i + 1itijdj + (eij) i = 1,…, 20 personen; j = 1,…5 tijdmomenten 0i = intercept voor persoon i 1i = helling voor persoon i Elk persoon heeft z’n eigen regressielijn
Random effects model: niveau 1 Model voor verandering over tijd gewichtij = 0i + 1itijdj + (eij) eij = niveau 1 residu: within person fout, meetfout eij ~ N(0,2e)
Random effects model: niveau 2 Model voor verschillen tussen personen Elk persoon heeft eigen intercept en eigen helling We brengen dus de herhaalde metingen terug tot intercept en helling! Zijn er verschillen in intercept en helling? Welke predictoren verklaren die verschillen?
Random effects model: niveau 2 Model voor verschillen tussen personen: Welke predictoren verklaren verschillen in intercept en helling ? 0i = γ00 + γ01*dieeti + u0i 1i = γ10 + γ11*dieeti +u1i γ00 , γ01, γ10 en γ11 : fixed effects 0i , 0i : random effects u0i en u1i : niveau 2 residuen; tussen-persoons fouten
Random effects model samengesteld: beide niveaus samengestelde model gewichtij = γ00 + γ01*dieeti+ γ10*tijdj + γ11*dieeti*tijdj + u0i + u1i*tijdj + eij Resultaat: regressie model met complex residu
Random effects model samengesteld: beide niveaus Residu van samengesteld model u0i + u1i*tijdj + eij Heteroscedasticiteit: ongelijke variantie per tijdsmoment Autocorrelatie: residuen zijn gecorreleerd
Random intercept model niveau 1 en niveau 2 Niveau 1: voor verandering over de tijd gewichtij = 0i + 1itijdj + (eij) (zelfde als hiervoor) Niveau 2: 0i = γ00 + γ01*dieeti + u0i 1i = γ10 + γ11*dieeti helling heeft geen fout Dus alleen random intercept
Random intercept model: het samengestelde model gewichtij = γ00 + γ01*dieeti+ γ10*tijdj + γ11*dieeti*tijdj + u0i + eij Resultaat: regressie model met simpeler residu eij ~ N(0,2e) , u0i ~ N(0,20) Splitst variantie componenten op in variantie tussen personen en variantie binnen personen Intraclass correlatie: = 20/(2e+ 20)
Random intercept model: Constante variantie en covariantie: Met: Intraclass correlatie: = 20/(2e+ 20) Dit komt neer op de aanname van compound symmetrie: Is de aanname van RM-ANOVA
Waarom randomeffects modellen gebruiken? De correlatie binnen subjecten kan expliciet worden gemodelleerd. Ingewikkelde designs kunnen worden gemodelleerd Ook voor categoriele responsematen Missende data leveren geen problemen op voor random effects modellen, mits de data Missing At Random zijn (MAR).