Math Candel Universiteit Maastricht
1.Heldere en haalbare probleemstelling 2.Keuze van het design 3.Keuze van onderzoeks/analyse-eenheid 4.Operationalisatie van variabelen 5.Keuze van statistische technieken 6.Afbakening van populatie 7.Steekproefmethode, steekproefomvang en “power” 8.Tijdschema en procedures Dit is ook de volgorde van het verslag !!
Als rode draad een voorbeeld -Wel of geen interventie ? - Wel of niet longitudinaal ? Leidt langdurige blootstelling aan harde muziek in disco’s tot gehoorbeschadiging ?
L O N G I T U D I N A A L I____________________________________________ N ja nee T____________________________________________ E jaExperiment R Quasi-experiment V E neeCohort studieDwarsdoorsnede N (Steekproef uit basispopulatie) T Patiënt-controle I (Selectie van zieken) E ____________________________________________
Voorbeeld •Interventie: Onmogelijk, expositie aan harde muziek niet ethisch •Longitudinaal: meer zicht op causatie •Geen individuele informatie omtrent blootstelling aan muziek prospectieve cohort studie
Vaak geneste structuur (voorbeeld)
Niveau 3 Niveau 2 Niveau 1
Vaak geneste structuur (voorbeeld) Niveau 3 Niveau 2 Niveau 1
Vaak geneste structuur (voorbeeld) Niveau 3 Niveau 2 Niveau 1
Vragen: Keuze analysetechniek: •Zijn de niveau’s fixed of random ? •Op welk niveau speelt de vraagstelling zich af ? •Is het design gebalanceerd ? •Bij random niveaus: Random-effects of Multilevel Analyse •Uitzondering: Hoogste niveau + gebalanceerd design: Aggregeer metingen tot op hoogste niveau
Hoe zet ik begrippen als “blootstelling aan harde muziek” en “gehoorschade” om in meetbare grootheden ? •Afhankelijke variabele slechts op 1 manier operationaliseren multiple testing •Metingen dienen betrouwbaar te zijn (doe hermetingen en neem gemiddelde) •Metingen dienen valide te zijn (voorkom bijv. antwoordtendenties bij vragenlijsten)
Multiple testing •Dubbelzinnige resultaten: Sommige operationalisaties laten wel een effect zien, andere niet •Veel type I fouten Oplossing: Bonferroni correctie Bij K toetsen, neem dan als significantieniveau: * = /K
Illustratie Bonferroni correctie Aantal toetsen (K) Aantal toetsen
Voorbeeld •Effectmaat:Gehoorverlies in dB, gemiddeld over een reeks toonhoogten •Onafhankelijke variabelen: –Duur van blootstelling: Via een vragenlijst het aantal uren in 5 jaar (gemiddelde per week x aantal weken) – Intensiteit: Aantal dB via audiometer (meerdere metingen over 5 jaar in gefrequenteerde disco’s) •Confounders / Effectmodificatoren: Geslacht, leeftijd, expositie aan ander lawaai (via vragenlijst)
•Aantal variabelen: –Onafhankelijke variabelen –Afhankelijke variabelen •Type variabele: –Binair –Polytoom –Continu •Type design: –Tussen-subject design –Binnen-subject design
Y continuY binair 1 X binairT-toets Mann-Whitney 2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test 2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X’en Lineaire regressie ANOVA Logistische regressie
Y continuY binair 1 X binairT-toets Mann-Whitney 2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test 2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X-en Lineaire regressie ANOVA Logistische regressie
Y continuY binair 1 X binairT-toets Mann-Whitney 2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test 2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X-en Lineaire regressie ANOVA Logistische regressie
Y continuY binair 1 X binairT-toets Mann-Whitney 2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test 2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X-en Lineaire regressie ANOVA Logistische regressie
Y continuY binair 1 X binairT-toets Mann-Whitney 2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test 2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X-en Lineaire regressie ANOVA Logistische regressie
Y continuY binair 1 X binairT-toets Mann-Whitney 2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test 2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X-en Lineaire regressie ANOVA Logistische regressie
Voorbeeld •Afhankelijke variabele: Gehoorbeschadiging (GB) •Blootstellingsduur (DUUR) is een effectmodificator van de muziekintensiteit (INT) •Potentiële confounders: Overig lawaai (LAWAAI), geslacht (GESL) en leeftijd (LEEFT) Meervoudige lineaire regressie: GB = B 0 + B 1 *INT + B 2 *DUUR + B 3 *INT*DUUR + B 4 *LAWAAI + B 5 *GESL + B 6 *LEEFT +
•Ethische redenen (bijv. geen ernstig zieken) •Praktische redenen (beperkte hoeveelheid tijd en geld) •Methodologische redenen: –Minder onverklaarde variantie –Minder storende factoren (“confounders”) –Voldoende variatie op risicofactor
Voorbeeld •Praktische reden: Alleen Zuid-Nederland •Methodologische redenen: Alleen jongeren tussen de 14 en 20 jaar Minder variatie wat betreft gehoorsbeschadiging t.g.v. andere factoren (bijv. werk)
Tast afbakening de generaliseerbaarheid aan ? Vraag: De generaliseerbaarheid van wat ? Het gemiddelde ?
GB Randstad Parkstad Muziekintensiteit
Relatie tussen gehoorbeschadiging en intensiteit ? GB Randstad Parkstad Muziekintensiteit
Conclusies: •Gemiddelde is niet generaliseerbaar; Dit is anders voor Randstad en Parkstad •Bestudeerde effect is wel generaliseerbaar; Gemiddelde toename in gehoorbeschadiging t.g.v. een bepaalde toename in muziekintensiteit is hetzelfde voor Randstad als voor Parkstad •Dus: Een effect kan wel generaliseerbaar zijn naar andere populaties, ook als het gemiddelde dat niet is !
•Eenvoudige toetsende statistiek gaat uit van: –Een aselecte/willekeurige steekproef –Een populatie die veel groter is dan de steekproef •In de praktijk: –Steekproef > 10% van de populatie –Gestratificeerde steekproef: Bijv. prestratificatie op geslacht of sociaal-economische status Deze variabelen als covariaat in de analyse opnemen
Voorbeeld: Reden voor stratificatie ? •Effectmodificatie: Het effect van muziekintensiteit is anders voor lange dan voor korte blootstellingsduren •Confouding: Vrouwen en mannen verschillen wat betreft de mate van blootstelling aan harde muziek In beide gevallen: Stratificatie-factor als extra covariaat in de analyse opnemen
–Tweestaps- of clustersteekproef: Men trekt een groot aantal eenheden (bedrijven, scholen, ziekenhuizen, gezondheidscentra, steden), en daarbinnen weer: een aantal individuen:tweestapssteekproef alle individuen:clustersteekproef Geschikte analyse:Multilevel of Random-effects analyse
Hoe krijgen we de gewenste power ? • : Moet klein zijn om type I fouten te vermijden (vaak 0.05 of 0.01) •Signaal: Contrast op interventie of risico-factor verhogen •Ruis: –Invloed van variatie op andere factoren minimaliseren middels design of statistische correctie –Minimaliseren van meetfout
1- :gewenste power, zeg 0.90 Z :waarde uit standaardnormale verdeling; Z 0.90 = 1.28 •Steekproefomvang voldoende groot laten zijn. Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)
:kans op het type I fout, zeg 0.05 Z :waarde uit standaardnormale verdeling; Z = 1.96 •Steekproefomvang voldoende groot laten zijn. Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)
:kleinste correlatie die ontdekt moet worden, zeg 0.30 •Steekproefomvang voldoende groot laten zijn. Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)
•Steekproefomvang voldoende groot laten zijn. Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)
Nog aanpassingen van deze N : A.Er zijn covariabelen: N A = N x VIF = x 2 (naar schatting) = B.Er is uitval te verwachten: Bij k % uitval:N AA = 100/(100-k) x N A Bij 10 % uitval:N AA = 100/90 x = 241
Relatie power, steekproefomvang en signaal
•Overzicht van stappen en tijdsplanning Voorbereiden van onderzoek (testen vragenlijsten, werven proefpersonen,….) Dataverzameling Tussentijdse analyses Eindrapportage en/of presentatie
Hoe om te gaan met: 1.Non-response: niet deelnemen 2.Uitval: voortijdig uit the onderzoek stappen 3.Non-compliance: niet naleven van instructies •Procedures Waarborgen anonimiteit, werven van proefpersonen, “informed consent”, blindering e.d.
Effecten van uitval/nonresponse:
Intensiteit muziek (kernvariabele) Gehoorbeschadiging
Effecten van uitval/nonresponse: Intensiteit muziek (kernvariabele) Gehoorbeschadiging Leeftijd (covariaat)
Leeftijd is geen confounder
Effecten van uitval/nonresponse: Intensiteit muziek (kernvariabele) Gehoorbeschadiging Uitval Leeftijd (covariaat)
Uitval houdt verband met kernvariabele : Intensiteit muziek (kernvariabele) Gehoorbeschadiging Uitval Leeftijd (covariaat)
Uitval houdt verband met kernvariabele en covariaat: Intensiteit muziek (kernvariabele) Gehoorbeschadiging Uitval Leeftijd (covariaat)
Uitval houdt verband met kernvariabele en covariaat: Intensiteit muziek (kernvariabele) Gehoorbeschadiging Uitval Leeftijd (covariaat) Confouding door covariaat; betrek covariaat in de analyse
Vooral uitval bij hoge muziekintensiteiten Uitval treedt met name op onder ouderen
Vooral uitval bij hoge muziekintensiteiten Uitval treedt met name op onder ouderen
Uitval houdt verband met afhankelijke variabele en kernvariabele : Intensiteit muziek (kernvariabele) Gehoorbeschadiging Uitval Leeftijd (covariaat)
Uitval zelf is confounder: uitval als extra covariaat in de analyse betrekken Gevolg: Relatie tussen uitval en afhankelijke variabele kan niet geschat worden Probleem: Voor uitvallers kennen we de waarden niet op de afhankelijke variabele
Hoe om te gaan met non-compliance ? •Intention-to-treat: Non-compliers betrekken in de analyse Adequaat beeld van de effectiviteit van een behandeling in de praktijk •Statistische correctie: Effect van interventie kan weggepoetst worden