Bronnen van ‘fout’ Validiteit (en precisie) Vertekening door inadequate selectie Vertekening door inadequate informatieverzameling Verstoring Effectmodificatie
Bronnen van ‘fout’ Validiteit en precisie Precisie: toevalsfouten, toevalsvariatie statistiek Validiteit: systematische fouten vertekening (bias) in onderzoeksresultaat opzet onderzoek analyse (statistiek) CAVE: validiteit belangrijker dan precisie !!
Validiteit Interne en externe validiteit Externe validiteit: veralgemeenbaarheid Interne validiteit: validiteit van de studiebevindingen voor de beoogde studiepopulatie onder invloed van: selectie informatieverzameling verstoring (confounding)
Validiteit Vertekening (bias) door selectie Afwijking van het gemeten effect door selectieprocedures Voorbeelden : zelfselectie diagnostische bias ‘healthy worker effect’
Validiteit Zelfselectie : Regio A Regio B 5000 inwoners 5000 inwoners 250 ziek 250 ziek Enquête: respons 90% regio A: 90% van de zieken regio B: 70% van de zieken STUDIEBEVINDINGEN: 4500 participanten 4500 participanten 225 ziek 175 ziek
Validiteit Vertekening (bias) door informatieverzameling Te vergelijken groepen bepaald verzamelen van relevante informatie Misclassificatie: differentieel als in functie van 2de as niet differentieel als onafhankelijk van 2de as
Validiteit Vertekening (bias) door informatieverzameling Voorbeeld: emfyseem bij rokers veronderstel rokers consulteren frequenter emfyseem vaak subklinisch vaker ‘toevallige’ diagnose bij rokers onderschatting emfyseem bij niet rokers
Validiteit Vertekening (bias) door informatieverzameling Voorbeeld: congenitale malformaties veronderstel moeders met misvormde baby’s herinneren zich beter infecties, traumata, medicatie onderschatting blootstelling bij moeders met niet-misvormde baby’s
Verstoring (‘confounding’) Algemeen principe: Als (in afwezigheid van toeval) een associatie niet veroorzaakt wordt door bias (selectie bias of informatie bias), dan is ze het gevolg van causaliteit of van verstoring In termen van voorkomens functies: Y = f(X1,X2,X3,...Xi) Y = variabele voor voorkomen (afh. variabele) X1 = Centrale onafhankelijke variabele X2-i = Andere onafhankelijke variabelen (‘confounders, effectmodificatoren’)
Verstoring Voorbeeld ? ? ! Het bij zich hebben van lucifers of een aansteker Longkanker op latere leeftijd ? ! roken
Verstoring Verstoring Als in een quasi experimenteel onderzoek (cohort studie) een blootstelling E geassocieerd is met ziekte, dan varieert de incidentie van ziekte over de strata gedefinieerd door de verschillende niveaus van E. Als deze verschillen nu (ten dele) veroorzaakt worden door een andere factor C, dan zeggen we dat C (partieel) de associatie tussen E en de ziekte heeft verstoord. Als C niet causaal gerelateerd is aan ziekte kunnen de verschillen in incidentie niet veroorzaakt zijn door C, dus verstoort C in dat geval de ziekte / blootstelling associatie NIET. Er kan slechts verstoring optreden wanneer de effecten van de blootstellingsfactor en die van de verstorende factor vermengd zijn.
Verstoring Voorbeeld zwaar ? niet Hoog risico voor longkanker Hoge prevalentie van een beroepsmatige blootstelling Roken Laag risico voor long kanker niet Lage prevalentie van een beroepsmatige
Verstoring Veronderstel dat we de volgende tabel bekomen uit de gepoolde gegevens van een cohort studie. + - Blootgesteld a b niet-blootgesteld c d Ziekte status CIRp = [a:(a+b)] /[c:(c+d)] We vragen ons af of een factor C de associatie tussen de blootstelling E en de ziekte heeft verstoord
Verstoring Als er verstoring is, dan willen we weten wat de associatie is tussen E en de ziekte voor vaste waarden van C i.e. conditioneel op C + - blootgesteld a1 b1 niet-blootgesteld c1 d1 Ziekte status Factor C+ a2 b2 c2 d2 Factor C- CIR1 = [a1:(a1+ b1)] / [c1::(c1 + d1 )] CIR2 = [a2:(a2+ b2)] / [c2::(c2 + d2 )]
Verstoring Als we aannemen dat CIR1 = CIR2 , dan reflecteert deze gemeenschappelijke waarde de echte associatie tussen de blootstelling E en de ziekte. We noemen dit de CIR. Verstoring treedt op als, en alleen als, de beide volgende condities vervuld zijn: C en E zijn met mekaar geassocieerd in de studie populatie C is geassocieerd met ziekte, na stratificatie voor E
Verstoring Voorbeeld. Veronderstel dat we volgende tabel bekomen uit de gepoolde gegevens van een cohort studie. + - blootgesteld 24 1476 1500 niet-blootgesteld 8 2492 2500 Ziekte status RORp = ad / bc = 5.06 CIRp = [a:(a+b)] / [c:(c+d)] = 5.00
Verstoring Leeftijd is een potentiele confounder, onze zorg is de associatie tussen E en de ziekte voor vaste waarden van de leeftijd i.e. conditioneel op C + - blootgesteld 16 484 500 niet-blootgesteld 4 496 500 Ziekte status Oud 8 992 1000 4 1996 2000 Jong OR1 = 4.01 OR2 = 4.02 CIR1 = 4.00 CIR2 = 4.00
Verstoring Bepaling van de aanwezigheid van verstoring: 1. Welke variabele zou geassocieerd zijn met ziekte ? Potentiele verstoring 2. Is deze variabele geassocieerd met de blootstelling ? Actuele verstoring Cave: Verstoring is geen probleem van precisie; daarom is de vaststelling ervan niet gebaseerd op testen van significantie !! Een variabele die een stap is in het ziekteproces kan geen confounder zijn !
Verstoring Cave: Meerdere verstorende variabelen + - Exposure E + - Case 12 30 Control 4 22 Exposure E Odds ratio = 2.2
Verstoring Cave: Meerdere verstorende variabelen + - 6 15 Exposure E + - Case 6 15 Control 2 11 Exposure E Factor C1+ 6 15 2 11 Factor C1- OR1 = 2.2 OR2 = 2.2 Factor C2+ Factor C2-
Verstoring Cave: Meerdere verstorende variabelen + - 5 5 1 10 + - Case 1 10 Control 1 10 Exposure E Factor C1+C2+ 5 5 1 1 Factor C1+C2- OR = 1 1 10 Factor C1-C2+ Factor C1-C2-
Verstoring Verschillende (polytomome) verstorende factoren: stratifieer voor alle tegelijkertijd. + - Case Control Exposure E 1 2 3 4 Factor C2 Factor C1
Verstoring Controle van verstoring: Studie ontwerp: randomisatie blocking (restrictie) matching Analyse: stratificatie multiple regressie (voorkomens functies) Tolerantie voor verstoring !!