Introductie tot de overlevings analyse

Slides:



Advertisements
Verwante presentaties
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Advertisements

Statistische uitspraken over onbekende populatiegemiddelden
H3 Tweedegraads Verbanden
HC2MFE Meten van verschillen
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Introductie tot de lineaire regressie
Toetsen van verschillen tussen twee of meer groepen
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW Guido Valkeneers.
Statistiek II Deel 1.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
H 14: Enkelvoudige interest
Icastat - AMO Icastat - AMO 1 NHV - dinsdag 6 maart 2012 drs. Paul K. Baggelaar Icastat ir. Eit C.J. van der Meulen AMO Trendanalyse op maat voor een meetnet.
Vergelijkbaarheid historische studies
Ronde (Sport & Spel) Quiz Night !
Natuurlijke Werkloosheid en de Phillipscurve
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
DIAGNOSE Typisch probleem:
De Weibull verdeling Waloddi Weibull ( ) Weibull:
Hok Kwan Kan Primary supervisor: dr. Katrien Antonio
Beschrijvende en inferentiële statistiek
Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere
P-waarde versus betrouwbaarheidsinterval
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Statistiek II Hoofdstuk 4: Toetsen voor één populatie
toetsen voor het verband tussen variabelen met gelijk meetniveau
Hoofdstuk 8: Variantieanalyse met herhaalde metingen hoofdstuk 8
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
vwo C Samenvatting Hoofdstuk 14
De grafiek van een lineair verband is ALTIJD een rechte lijn.
Gegevensverwerving en verwerking
Gegevensverwerving en verwerking
Non-parametrische technieken
Meervoudige lineaire regressie
Inferentie voor regressie
Continue kansverdelingen
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Hoofdstuk 9 Verbanden, correlatie en regressie
Populatiegemiddelden: recap
Logistische regressie
Effect modificatie Algemeen principe Bepalen van effect modificatie
Bronnen van ‘fout’ Validiteit (en precisie)
Vormen van studie (ontwerp)
Statistiek voor Historici
Sparen, Kapitaalaccumulatie, en Productie - De Lange Termijn
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
Construeren van een Tennishal Vergeet-mij-nietjes. Week 13
ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B
ribwis1 Toegepaste wiskunde – Differentieren Lesweek 7
havo A Samenvatting Hoofdstuk 3
Tweedegraadsfuncties
Obesitas & Schouderdystocie
HC2 – Statistiek in vogelvlucht
Vereisten voor een screeningsprogramma
Bayes Voor psychologen. Pierre Simon Laplace Recap Bayes’ Rule.
Partiële r² Predictie van y gebaseerd op z alleen
Test- retest methode -- voorbeeld r = 0, Test Hertest r = 0, Test Hertest r = 1,00.
De financiële functie: Integrale bedrijfsanalyse©
Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)
Inleiding in de statistiek voor de gedragswetenschappen
Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.
Baarde en de goede Hoofdstuk 11: Data-analyse
Cursus Regressie-analyse Rijkswaterstaat, 13 februari
Wesley van Hout, aiotho VUmc
Testen met een klein aantal testmonsters Rob Ross.
Toetsen van verschillen tussen twee of meer groepen
Transcript van de presentatie:

Toepassingen van de overlevingsanalyse (survival analysis) in (klinisch) medisch onderzoek

Introductie tot de overlevings analyse Frequentie van voorkomen (Overlevings) tijd als afhankelijke variabele Gecensureerde gegevens Overlevings functie, hazard (risico) functie Objectieven van de overlevings analyse Kaplan-Maier Log-rank, Peto Cox multiple regressie

Introductie tot de overlevings analyse Frequentie van voorkomen Altijd het aantal gebeurtenissen relateren aan een maat voor de grootte van de bevolking waarin ze plaats vinden ‘EPIDEMIOLOGISCHE FRACTIE’: RATIO VORM:

Introductie tot de overlevings analyse Prevalentie Prevalentie : = proportie zieken in een populatie op een gegeven moment Y = f(X1,X2,...) prevalentie als een functie van ... totale populatie ziek niet ziek

Introductie tot de overlevings analyse Prevalentie is een maat voor de ziekte toestand hangt af van het risiko om ziek te worden hangt af van het risiko om ziek te blijven m.a.w. van genezing of sterfte (meestal) niet geschikt om de oorzaken van ziekte te bestuderen ongeveer gelijk aan het product van de incidentie en de (gemiddelde) duur van de ziekte

Introductie tot de overlevings analyse Incidence Cumulatieve incidentie (CI) proportie nieuwe gebeurtenissen in een populatie onder studie gedurende een specifieke tijdsperiode uitdrukbaar als odds :

Introductie tot de overlevings analyse Prevalentie, cumulatieve incidentie Y = f(X1,X2,...) multiple regressie Y = dichotoom (0/1) multiple logistische regressie Tijd ?

Introductie tot de overlevings analyse Incidentie Incidentie dichtheid (ID) teller : aantal nieuwe (eerste) gebeurtenissen die plaatsvinden bij personen die gedurende de studieperiode tot de geobserveerde populatie horen d.w.z. niet een aantal personen ! noemer : sum van de tijdsperiodes ‘at risk’ (voor het voorkomen van de bestudeerde gebeurtenis) bij de leden van die populatie gedurende de studieperiode. (te) vaak een benadering.

Introductie tot de overlevings analyse Voorbeeld Incidentie dichtheid (ID) 234 rokers die wensen te stoppen met roken, follow-up: 1 jaar Cumulatieve incidentie recidivisme ? Schatting incidentiedichtheidsratio?

Introductie tot de overlevings analyse Schatting incidentiedichtheidsratio? Eerste 90 dagen Veronderstel herval op het middenpunt van elke periode (gelijke verdeling over periode) Teller: 180 hervallen Noemer: (180x45)+(54x90)=12.960 dagen ID: 0,014 gebeurtenissen per personendag

Introductie tot de overlevings analyse Schatting incidentiedichtheidsratio? Dag 91-180 ID: 11 hervallen op (11x45)+(43x90) dagen = 0,0025 geb. per personendag Dag 181-270 ID: 7 hervallen op (7x45)+(36x90) dagen = 0,0020 geb. per personendag Dag 271-365 ID: 3 hervallen op (3x47)+(33x95) dagen = 0,00092 geb. per personendag

Introductie tot de overlevings analyse Hazard rate (per 1000 personendagen) in functie van leeftijd Hazard rate (per 1000 personendagen)

Introductie tot de overlevings analyse Alternatief: Cumulatieve incidentie Probabiliteit gebeurtenis niet te ondergaan (= 1-CI) = overlevingsprobabiliteit In functie van de tijd: overlevingsfunctie

Introductie tot de overlevings analyse Tijd: belangrijk element bij het weergeven van gebeurtenissen Overlevingsanalyse: focus op (gemiddelde, mediane) overlevingstijd (‘wachttijd’ tot sterfte) Occurrence research (Epidemiologie): past deze methode toe voor de voorstelling van gelijk welke gebeurtenis relevant voor ziekte/gezondheid v.b. ziekte herval werkhervatting … Uitbreiding: Dosis tot effect v.b. acetylcholine: PD-20

Introductie tot de overlevings analyse Typisch probleem Gecensureerde gegevens We kennen de volledige overlevingstijd niet Redenen: Een persoon ondergaat de gebeurtenis niet voor het einde van de studie Een persoon wordt uit het oog verloren (lost to follow-up) Een persoon moet uit de studie populatie gesloten worden (omwille van sterfte, neveneffecten,...)

Introductie tot de overlevings analyse Voorbeeld T=5 X T=12 Einde van de studie T=3,5 Uitgesloten uit de studie T=8 Einde van de studie T=6 Uit het oog verloren T=3,5 X

Introductie tot de overlevings analyse Voorbeeld, vervolg

Introductie tot de overlevings analyse Overlevingsfunctie S(t) = P(T>t) grafische voorstelling: curve stijgt nooit Op t = 0, S(t) = S(0) = 1 Op t = oneindig, S(t) = 0 (theoretisch)

Introductie tot de overlevings analyse Overlevingsfunctie, grafische voorstelling

Introductie tot de overlevings analyse Risico- (hazard)functie rate; range van nul tot oneindig Voorbeeld: ‘Hazard’ om in slaap te vallen gedurende een les stats/epid grafische voorstelling: de curve is altijd non-negatief er is geen bovengrens

Introductie tot de overlevings analyse Risico- (hazard)functie (Rosner)

Introductie tot de overlevings analyse Risico- (hazard)functie, grafische voorstelling

Introductie tot de overlevings analyse Risicofunctie, overlevingsfunctie Als h(t) constant is, dan is het onderliggende model exponentieel constantheid vaak verondersteld proportionaliteit vaak verondersteld (Cox proportional hazards) niet altijd terecht: v.b. perioperatieve mortaliteit CHECK ! h(t) = µ als en alleen als S(t) = e-µt S(t) h(t)

Introductie tot de overlevings analyse Objectieven 1. Het schatten en interpreteren van overlevings- en risicofuncties gebaseerd op (incomplete, gecensureerde) overlevingsgegevens 2. Het vergelijken van overlevings- en/of risicofuncties 3. Het bestuderen van de functionele relatie tussen de overlevingstijd (afhankelijke variabele) en één of meer verklarende variabelen (onafhankelijke variabelen) Y = f(X1,X2,X3,...Xk)

Introductie tot de overlevings analyse Voorbeeld: Freireich study Studie: waarde van 6-mercaptopurine bij de behandeling van acute leukemie (Freireich 1963) GROEP 1 (behandeld) n = 21 overlevingstijden: 6,6,6,7,10,13,16,22,23,6*,9*,10*,11*,17*,19*,20*,25*,32*,32*,34*,35* GROEP 2 (placebo) n = 21 1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15,17,22,23 * : gecensureerd

Introductie tot de overlevings analyse Voorbeeld, vervolg groep 1

Introductie tot de overlevings analyse Voorbeeld: vervolg, beschrijvende maten gemiddelde overlevingstijden (17,1 en 8,7) gemiddelde hazard rate ( = ID ) (9/359 w-1 en 21/182 w-1) onvoldoende rekening gehouden met de tijd ! KAPLAN - MEIER analyse

Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen groep 1

Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen groep 1 Aantal gebeurtenissen op die overlevingstijd Relevante overlevingstijd Aantal censureringen tussen deze overlevingstijd en de volgende Risico set

Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen groep 2

Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen Kaplan-Meier

Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen Kaplan-Meier, grafische voorstelling

Introductie tot de overlevings analyse Voorbeeld: vervolg, twee groepen

Introductie tot de overlevings analyse Voorbeeld: vervolg, twee groepen

Introductie tot de overlevings analyse Testen van hypothese (voor twee groepen) Vraag: Hoe waarschijnlijk is het geobserveerde (of een nog groter) verschil onder de nul-hypothese ? Nul-hypothese: beide curven zijn afkomstig van twee steekproeven uit dezelfde theoretische populatie. Bereken de probabiliteit van het geobserveerde (of een nog groter) verschil (p-waarde) Kunnen we de de nul-hypothese verwerpen? (indien niet, moeten we ze dan aanvaarden?) overlevingstijden zijn niet normaal verdeeld, niet parametrisch Log-rank

Introductie tot de overlevings analyse Testen van hypothese Log-rank (voor twee groepen) Chi-kwadraat test Globale vergelijking van de KM curven Geobserveerde vs. verwachte aantallen Categorieën gedefinieerd door georderende ‘failure times’

Introductie tot de overlevings analyse Testen van hypothese Log-rank (voor twee groepen) Procedure: Tabel met gecombineerde geordende failure times Toon het aantal subjecten die de gebeurtenis ondergaan bij elk tijdstip voor beide groepen en de aantallen in de risikosets Breidt de tabel uit met de verwachte celfrequenties Breidt de tabel uit met de geobserveerde min de verwachte

Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen groep 1

Introductie tot de overlevings analyse Voorbeeld: vervolg, resumerende tabellen groep 2

Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor twee groepen)

Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor twee groepen) Procedure: Tabel met gecombineerde geordende failure times Toon het aantal subjecten die de gebeurtenis ondergaanfailing bij elk tijdstip voor beide groepen en de aantallen in de risikosets Breidt de tabel uit met de verwachte celfrequenties Breidt de tabel uit met de geobserveerde min de verwachte Log-rank statistiek: som van de geobserveerde min de verwachte frequenties voor één groep, gekwadrateerd; gedeeld door de variantie van de aantallen geobserveerde min de verwachte frequenties Continuïteitscorrectie Chi-kwadraat statistiek met één vrijheidsgraad

Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor twee groepen) Variantie: O1-E1 = -10,26 Variantie (O1-E1) = 6,2685 Log-rank statistiek = 16.793 p = 0,00009 Approximatieve formule: = 15,276 conservatiever

Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor twee groepen) Rosner: continuïteitscorrectie

Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor twee groepen) Log-rank test: p= 0.00009

Introductie tot de overlevings analyse Testen van de hypothese Log-rank (voor verschillende groepen) Nul-hypothese: alle curven komen van G steekproeven uit dezelfde theoretische populatie. Test statistiek: meer gecompliceerd, op basis van varianties en covarianties voor elke groep Matrix formule Chi-kwadraat statistiek met (G-1) vrijheidsgraden Approximatieve formule:

Introductie tot de overlevings analyse Testen van de hypothese Peto test Log-rank test: gebruikt de som van (O-E) Dus zelfde gewicht voor elke failure tijd Peto: weegt (O-E) bij tj door het aantal ‘at risk’ nj in alle groepen op tj Gewogen gemiddelde Peto statistiek: Chi-kwadraat statistiek met (G-1) vrijheidsgraden Peto statistiek: Beklemtoont het begin van de overlevingscurve: vroege gebeurtenissen krijgen meer gewicht

Introductie tot de overlevings analyse Testen van de hypothese Log-rank versus Peto test Log-rank test: p= 0.00009 Peto & Peto Wilcoxon p= 0.00019

Introductie tot de overlevings analyse Multicausaal probleem: Multicausaliteit: ? Overlevingsanalyse: Y = tijd tot de gebeurtenis (failure) = overlevingstijd continu gecensureerd

Introductie tot de overlevings analyse Multicausaliteit: Analyse: Maak gebruik van een mathematisch model multiple regressie Als Y: ‘time to event’ gebruik dan een Cox-regressie model geadjusteerde hazard ratio:

Introductie tot de overlevings analyse Cox ‘proportional hazards’ model: Vorm Waarom populair ML schatting Hazard ratio Geadjusteerde overlevingscurven PH-aanname

Introductie tot de overlevings analyse Voorbeeld: analyse van remissietijden (Freireich) Twee groepen leucemie patienten in remissie groep 1: 6-mercaptopurine groep 2: placebo Andere gekende prognostische indicator: log WBC Vraag: vergelijk ‘overleving’ in beide groepen rekening houdend mogelijke verstoring en/of interactie door log WBC T = weken in remissie X1 = groep status (E) X2 = log WBC (verstoring?) Interactie? X3 = X1 x X2 = groep status x log WBC

Introductie tot de overlevings analyse SURVTIME STATUS LOGWBC TREATMENT 1 35,000 0,000 1,450 0,000 2 34,000 0,000 1,470 0,000 3 32,000 0,000 2,200 0,000 4 32,000 0,000 2,530 0,000 5 25,000 0,000 1,780 0,000 6 23,000 1,000 2,570 0,000 7 22,000 1,000 2,320 0,000 8 20,000 0,000 2,010 0,000 9 19,000 0,000 2,050 0,000 10 17,000 0,000 2,160 0,000 etc… (Freireich.sta)

Introductie tot de overlevings analyse Log WBC

Introductie tot de overlevings analyse Log WBC Gemiddelde groep in remissie: 2,246 Gemiddelde group uit of remissie: 3,204 t= -3,43699 p= 0,001386 noodzakelijk?

Introductie tot de overlevings analyse Log WBC Gemiddelde behandelde groep: 3,224 Gemiddelde placebo groep: 2,636 t= -2,16872 p= 0,036107 noodzakelijk?

Introductie tot de overlevings analyse Drie modellen T = tijd in remissie Model 1: alleen behandeling Model 2: behandeling én log WBC Model 3: behandeling, log WBC én behandeling x log WBC

Introductie tot de overlevings analyse SPSS-output: -2 Log Likelihood = 172,759; Chi-square = 15,931; p < 0,001 -2 Log Likelihood = 144,559; Chi-square = 42,938; p < 0,001 -2 Log Likelihood = 144,131; Chi-square = 45,902; p < 0,001

Introductie tot de overlevings analyse Model 3 p = 0.510: Wald-statistiek LR-statistiek: maakt gebruik van -2 Log Likelihood LR-interactie = -2 Log Likelihoodmodel 2 -(-2 Log Likelihoodmodel 3) = 144,559 - 144,131 = 0,428 (chi-square, 1d.f.) Wanneer twijfel: gebruik de LR-statistiek -2 Log Likelihood = 144,131; Chi-square = 45,902; p < 0,001

Introductie tot de overlevings analyse Hazard ratio Model 2 Punt-schatter voor het effect van behandeling, geadjusteerd voor log WBC Coëfficiënt Exp. Coëfficiënt = Hazard ratio (HR) Test voor significantie Wald-statistiek LR-statistiek 95% betrouwbaarheids interval (confidence-interval, CI) Gebaseerd op beta +/- 1.96 SE Gebaseerd op programma output -2 Log Likelihood = 144,559; Chi-square = 42,938; p < 0,001

Introductie tot de overlevings analyse Model 1 Ruw model: houdt geen rekening met covariaten (verstorende variabelen, effectmodificatoren) Laat toe de verstoring door log WBC te evalueren model 1: HR = 4,523 model 2: HR = 3,648 Verstoring: ruwe en geadjusteerde HR’s zijn betekenisvol verschillend # significant Indien geen verstoring: voorkeur voor het meest precieze model -2 Log Likelihood = 172,759; Chi-square = 15,931; p < 0,001

Introductie tot de overlevings analyse Geadjusteerde overlevingscurven op basis van het gefitte Cox-model zijn vergelijkbaar met K-M curven

Introductie tot de overlevings analyse Populariteit COX Cox-model: ‘robuust’ benadering van het correcte parametrisch model (Weibull, exponentieel) veilige keuze Hazard functie is het product van de ‘baseline’ hazard waarbij t en een exponentiele uitdrukking met de X’en zonder t in voorkomen Hazards zijn altijd non-negatief Zelfs wanneer h0(t) niet gespecifieerd is, kunnen we de beta’s schatten (cfr. alfa in case-control studies) h(t,X) en S(t,X) kunnen voor een Cox model geschat worden met een minimum aantal aannames

Introductie tot de overlevings analyse Toepassingen Overlevingstijd Tijd tot herval Tijd tot werkhervatting Dosis respons