Toepassingen van de overlevingsanalyse (survival analysis) in (klinisch) medisch onderzoek
Introductie tot de overlevings analyse Frequentie van voorkomen (Overlevings) tijd als afhankelijke variabele Gecensureerde gegevens Overlevings functie, hazard (risico) functie Objectieven van de overlevings analyse Kaplan-Maier Log-rank, Peto Cox multiple regressie
Introductie tot de overlevings analyse Frequentie van voorkomen Altijd het aantal gebeurtenissen relateren aan een maat voor de grootte van de bevolking waarin ze plaats vinden ‘EPIDEMIOLOGISCHE FRACTIE’: RATIO VORM:
Introductie tot de overlevings analyse Prevalentie Prevalentie : = proportie zieken in een populatie op een gegeven moment Y = f(X1,X2,...) prevalentie als een functie van ... totale populatie ziek niet ziek
Introductie tot de overlevings analyse Prevalentie is een maat voor de ziekte toestand hangt af van het risiko om ziek te worden hangt af van het risiko om ziek te blijven m.a.w. van genezing of sterfte (meestal) niet geschikt om de oorzaken van ziekte te bestuderen ongeveer gelijk aan het product van de incidentie en de (gemiddelde) duur van de ziekte
Introductie tot de overlevings analyse Incidence Cumulatieve incidentie (CI) proportie nieuwe gebeurtenissen in een populatie onder studie gedurende een specifieke tijdsperiode uitdrukbaar als odds :
Introductie tot de overlevings analyse Prevalentie, cumulatieve incidentie Y = f(X1,X2,...) multiple regressie Y = dichotoom (0/1) multiple logistische regressie Tijd ?
Introductie tot de overlevings analyse Incidentie Incidentie dichtheid (ID) teller : aantal nieuwe (eerste) gebeurtenissen die plaatsvinden bij personen die gedurende de studieperiode tot de geobserveerde populatie horen d.w.z. niet een aantal personen ! noemer : sum van de tijdsperiodes ‘at risk’ (voor het voorkomen van de bestudeerde gebeurtenis) bij de leden van die populatie gedurende de studieperiode. (te) vaak een benadering.
Introductie tot de overlevings analyse Voorbeeld Incidentie dichtheid (ID) 234 rokers die wensen te stoppen met roken, follow-up: 1 jaar Cumulatieve incidentie recidivisme ? Schatting incidentiedichtheidsratio?
Introductie tot de overlevings analyse Schatting incidentiedichtheidsratio? Eerste 90 dagen Veronderstel herval op het middenpunt van elke periode (gelijke verdeling over periode) Teller: 180 hervallen Noemer: (180x45)+(54x90)=12.960 dagen ID: 0,014 gebeurtenissen per personendag
Introductie tot de overlevings analyse Schatting incidentiedichtheidsratio? Dag 91-180 ID: 11 hervallen op (11x45)+(43x90) dagen = 0,0025 geb. per personendag Dag 181-270 ID: 7 hervallen op (7x45)+(36x90) dagen = 0,0020 geb. per personendag Dag 271-365 ID: 3 hervallen op (3x47)+(33x95) dagen = 0,00092 geb. per personendag
Introductie tot de overlevings analyse Hazard rate (per 1000 personendagen) in functie van leeftijd Hazard rate (per 1000 personendagen)
Introductie tot de overlevings analyse Alternatief: Cumulatieve incidentie Probabiliteit gebeurtenis niet te ondergaan (= 1-CI) = overlevingsprobabiliteit In functie van de tijd: overlevingsfunctie
Introductie tot de overlevings analyse Tijd: belangrijk element bij het weergeven van gebeurtenissen Overlevingsanalyse: focus op (gemiddelde, mediane) overlevingstijd (‘wachttijd’ tot sterfte) Occurrence research (Epidemiologie): past deze methode toe voor de voorstelling van gelijk welke gebeurtenis relevant voor ziekte/gezondheid v.b. ziekte herval werkhervatting … Uitbreiding: Dosis tot effect v.b. acetylcholine: PD-20
Introductie tot de overlevings analyse Typisch probleem Gecensureerde gegevens We kennen de volledige overlevingstijd niet Redenen: Een persoon ondergaat de gebeurtenis niet voor het einde van de studie Een persoon wordt uit het oog verloren (lost to follow-up) Een persoon moet uit de studie populatie gesloten worden (omwille van sterfte, neveneffecten,...)
Introductie tot de overlevings analyse Voorbeeld T=5 X T=12 Einde van de studie T=3,5 Uitgesloten uit de studie T=8 Einde van de studie T=6 Uit het oog verloren T=3,5 X
Introductie tot de overlevings analyse Voorbeeld, vervolg
Introductie tot de overlevings analyse Overlevingsfunctie S(t) = P(T>t) grafische voorstelling: curve stijgt nooit Op t = 0, S(t) = S(0) = 1 Op t = oneindig, S(t) = 0 (theoretisch)
Introductie tot de overlevings analyse Overlevingsfunctie, grafische voorstelling
Introductie tot de overlevings analyse Risico- (hazard)functie rate; range van nul tot oneindig Voorbeeld: ‘Hazard’ om in slaap te vallen gedurende een les stats/epid grafische voorstelling: de curve is altijd non-negatief er is geen bovengrens
Introductie tot de overlevings analyse Risico- (hazard)functie (Rosner)
Introductie tot de overlevings analyse Risico- (hazard)functie, grafische voorstelling
Introductie tot de overlevings analyse Risicofunctie, overlevingsfunctie Als h(t) constant is, dan is het onderliggende model exponentieel constantheid vaak verondersteld proportionaliteit vaak verondersteld (Cox proportional hazards) niet altijd terecht: v.b. perioperatieve mortaliteit CHECK ! h(t) = µ als en alleen als S(t) = e-µt S(t) h(t)
Introductie tot de overlevings analyse Objectieven 1. Het schatten en interpreteren van overlevings- en risicofuncties gebaseerd op (incomplete, gecensureerde) overlevingsgegevens 2. Het vergelijken van overlevings- en/of risicofuncties 3. Het bestuderen van de functionele relatie tussen de overlevingstijd (afhankelijke variabele) en één of meer verklarende variabelen (onafhankelijke variabelen) Y = f(X1,X2,X3,...Xk)
Introductie tot de overlevings analyse Voorbeeld: Freireich study Studie: waarde van 6-mercaptopurine bij de behandeling van acute leukemie (Freireich 1963) GROEP 1 (behandeld) n = 21 overlevingstijden: 6,6,6,7,10,13,16,22,23,6*,9*,10*,11*,17*,19*,20*,25*,32*,32*,34*,35* GROEP 2 (placebo) n = 21 1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15,17,22,23 * : gecensureerd
Introductie tot de overlevings analyse Voorbeeld, vervolg groep 1
Introductie tot de overlevings analyse Voorbeeld: vervolg, beschrijvende maten gemiddelde overlevingstijden (17,1 en 8,7) gemiddelde hazard rate ( = ID ) (9/359 w-1 en 21/182 w-1) onvoldoende rekening gehouden met de tijd ! KAPLAN - MEIER analyse
Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen groep 1
Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen groep 1 Aantal gebeurtenissen op die overlevingstijd Relevante overlevingstijd Aantal censureringen tussen deze overlevingstijd en de volgende Risico set
Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen groep 2
Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen Kaplan-Meier
Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen Kaplan-Meier, grafische voorstelling
Introductie tot de overlevings analyse Voorbeeld: vervolg, twee groepen
Introductie tot de overlevings analyse Voorbeeld: vervolg, twee groepen
Introductie tot de overlevings analyse Testen van hypothese (voor twee groepen) Vraag: Hoe waarschijnlijk is het geobserveerde (of een nog groter) verschil onder de nul-hypothese ? Nul-hypothese: beide curven zijn afkomstig van twee steekproeven uit dezelfde theoretische populatie. Bereken de probabiliteit van het geobserveerde (of een nog groter) verschil (p-waarde) Kunnen we de de nul-hypothese verwerpen? (indien niet, moeten we ze dan aanvaarden?) overlevingstijden zijn niet normaal verdeeld, niet parametrisch Log-rank
Introductie tot de overlevings analyse Testen van hypothese Log-rank (voor twee groepen) Chi-kwadraat test Globale vergelijking van de KM curven Geobserveerde vs. verwachte aantallen Categorieën gedefinieerd door georderende ‘failure times’
Introductie tot de overlevings analyse Testen van hypothese Log-rank (voor twee groepen) Procedure: Tabel met gecombineerde geordende failure times Toon het aantal subjecten die de gebeurtenis ondergaan bij elk tijdstip voor beide groepen en de aantallen in de risikosets Breidt de tabel uit met de verwachte celfrequenties Breidt de tabel uit met de geobserveerde min de verwachte
Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen groep 1
Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen groep 2
Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor twee groepen)
Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor twee groepen) Procedure: Tabel met gecombineerde geordende failure times Toon het aantal subjecten die de gebeurtenis ondergaanfailing bij elk tijdstip voor beide groepen en de aantallen in de risikosets Breidt de tabel uit met de verwachte celfrequenties Breidt de tabel uit met de geobserveerde min de verwachte Log-rank statistiek: som van de geobserveerde min de verwachte frequenties voor één groep, gekwadrateerd; gedeeld door de variantie van de aantallen geobserveerde min de verwachte frequenties Continuïteitscorrectie Chi-kwadraat statistiek met één vrijheidsgraad
Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor twee groepen) Variantie: O1-E1 = -10,26 Variantie (O1-E1) = 6,2685 Log-rank statistiek = 16.793 p = 0,00009 Approximatieve formule: = 15,276 conservatiever
Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor twee groepen) Rosner: continuïteitscorrectie
Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor twee groepen) Log-rank test: p= 0.00009
Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor verschillende groepen) Nul-hypothese: alle curven komen van G steekproeven uit dezelfde theoretische populatie. Test statistiek: meer gecompliceerd, op basis van varianties en covarianties voor elke groep Matrix formule Chi-kwadraat statistiek met (G-1) vrijheidsgraden Approximatieve formule:
Introductie tot de overlevings analyse Testen van de hypothese Peto test Log-rank test: gebruikt de som van (O-E) Dus zelfde gewicht voor elke failure tijd Peto: weegt (O-E) bij tj door het aantal ‘at risk’ nj in alle groepen op tj Gewogen gemiddelde Peto statistiek: Chi-kwadraat statistiek met (G-1) vrijheidsgraden Peto statistiek: Beklemtoont het begin van de overlevingscurve: vroege gebeurtenissen krijgen meer gewicht
Introductie tot de overlevings analyse Testen van de hypothese Log-rank versus Peto test Log-rank test: p= 0.00009 Peto & Peto Wilcoxon p= 0.00019
Introductie tot de overlevings analyse Multicausaal probleem: Multicausaliteit: ? Overlevingsanalyse: Y = tijd tot de gebeurtenis (failure) = overlevingstijd continu gecensureerd
Introductie tot de overlevings analyse Multicausaliteit: Analyse: Maak gebruik van een mathematisch model multiple regressie Als Y: ‘time to event’ gebruik dan een Cox-regressie model geadjusteerde hazard ratio:
Introductie tot de overlevings analyse Cox ‘proportional hazards’ model: Vorm Waarom populair ML schatting Hazard ratio Geadjusteerde overlevingscurven PH-aanname
Introductie tot de overlevings analyse Voorbeeld: analyse van remissietijden (Freireich) Twee groepen leucemie patienten in remissie groep 1: 6-mercaptopurine groep 2: placebo Andere gekende prognostische indicator: log WBC Vraag: vergelijk ‘overleving’ in beide groepen rekening houdend mogelijke verstoring en/of interactie door log WBC T = weken in remissie X1 = groep status (E) X2 = log WBC (verstoring?) Interactie? X3 = X1 x X2 = groep status x log WBC
Introductie tot de overlevings analyse SURVTIME STATUS LOGWBC TREATMENT 1 35,000 0,000 1,450 0,000 2 34,000 0,000 1,470 0,000 3 32,000 0,000 2,200 0,000 4 32,000 0,000 2,530 0,000 5 25,000 0,000 1,780 0,000 6 23,000 1,000 2,570 0,000 7 22,000 1,000 2,320 0,000 8 20,000 0,000 2,010 0,000 9 19,000 0,000 2,050 0,000 10 17,000 0,000 2,160 0,000 etc… (Freireich.sta)
Introductie tot de overlevings analyse Log WBC
Introductie tot de overlevings analyse Log WBC Gemiddelde groep in remissie: 2,246 Gemiddelde group uit of remissie: 3,204 t= -3,43699 p= 0,001386 noodzakelijk?
Introductie tot de overlevings analyse Log WBC Gemiddelde behandelde groep: 3,224 Gemiddelde placebo groep: 2,636 t= -2,16872 p= 0,036107 noodzakelijk?
Introductie tot de overlevings analyse Drie modellen T = tijd in remissie Model 1: alleen behandeling Model 2: behandeling én log WBC Model 3: behandeling, log WBC én behandeling x log WBC
Introductie tot de overlevings analyse SPSS-output: -2 Log Likelihood = 172,759; Chi-square = 15,931; p < 0,001 -2 Log Likelihood = 144,559; Chi-square = 42,938; p < 0,001 -2 Log Likelihood = 144,131; Chi-square = 45,902; p < 0,001
Introductie tot de overlevings analyse Model 3 p = 0.510: Wald-statistiek LR-statistiek: maakt gebruik van -2 Log Likelihood LR-interactie = -2 Log Likelihoodmodel 2 -(-2 Log Likelihoodmodel 3) = 144,559 - 144,131 = 0,428 (chi-square, 1d.f.) Wanneer twijfel: gebruik de LR-statistiek -2 Log Likelihood = 144,131; Chi-square = 45,902; p < 0,001
Introductie tot de overlevings analyse Hazard ratio Model 2 Punt-schatter voor het effect van behandeling, geadjusteerd voor log WBC Coëfficiënt Exp. Coëfficiënt = Hazard ratio (HR) Test voor significantie Wald-statistiek LR-statistiek 95% betrouwbaarheids interval (confidence-interval, CI) Gebaseerd op beta +/- 1.96 SE Gebaseerd op programma output -2 Log Likelihood = 144,559; Chi-square = 42,938; p < 0,001
Introductie tot de overlevings analyse Model 1 Ruw model: houdt geen rekening met covariaten (verstorende variabelen, effectmodificatoren) Laat toe de verstoring door log WBC te evalueren model 1: HR = 4,523 model 2: HR = 3,648 Verstoring: ruwe en geadjusteerde HR’s zijn betekenisvol verschillend # significant Indien geen verstoring: voorkeur voor het meest precieze model -2 Log Likelihood = 172,759; Chi-square = 15,931; p < 0,001
Introductie tot de overlevings analyse Geadjusteerde overlevingscurven op basis van het gefitte Cox-model zijn vergelijkbaar met K-M curven
Introductie tot de overlevings analyse Populariteit COX Cox-model: ‘robuust’ benadering van het correcte parametrisch model (Weibull, exponentieel) veilige keuze Hazard functie is het product van de ‘baseline’ hazard waarbij t en een exponentiele uitdrukking met de X’en zonder t in voorkomen Hazards zijn altijd non-negatief Zelfs wanneer h0(t) niet gespecifieerd is, kunnen we de beta’s schatten (cfr. alfa in case-control studies) h(t,X) en S(t,X) kunnen voor een Cox model geschat worden met een minimum aantal aannames
Introductie tot de overlevings analyse Toepassingen Overlevingstijd Tijd tot herval Tijd tot werkhervatting Dosis respons