De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 21 januari: Poisson regressie 18 februari:

Verwante presentaties


Presentatie over: "Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 21 januari: Poisson regressie 18 februari:"— Transcript van de presentatie:

1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, uur 21 januari: Poisson regressie 18 februari: Graven naar causaliteit 18 maart: Betrouwbaarheidsintervallen Sprekers: Vaclav Fidler, Hans Burgerhof, Wendy Post, Sacha la Bastide DG Epidemiologie Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk.

2 Overzicht - W elke soort onderzoeksvragen -Introductie van voorbeeld - Waarom geen gewone lineaire regressie? - Wat is het Poisson regressiemodel -De Poisson verdeling -Specificatie van het regressiemodel -Interpretatie van parameters - Schatten en toetsen - Model fit - Hoe in SPSS - Referenties

3 Onderzoeksvragen Mogelijke vragen: 1.Zijn er in Nederland economische determinanten die het aantal kinderen voorspellen? 2.Welke variabelen voorspellen het aantal blessures in een bepaald sport seizoen? 3.Welke variabelen bepalen het aantal nieuwe tumorgevallen in een bepaald gebied in een jaar? Algemeen: Men is geïnteresseerd in relatie tussen Y: aantal events (afhankelijke variabele); niet negatieve gehele getallen!!!! X 1 tm X k : k continue en/of categoriale variabelen

4 Onderzoeksvragen Regressie modellen Altijd relatie tussen afhankelijke variabele Y en onafhankelijke variabelen -Lineaire regressie: Y is continu -Logistische regressie: Y is dichotoom -Poisson regressie: Y is een aantal niet negatief gehele getallen Schat gemiddelde van Y als functie van predictoren

5 data Gegevens (gemanipuleerde data van Michel Brink): 50 topsporters in leeftijd jaar Afhankelijke variabele: aantal blessures in een seizoen Achtergrond variabelen: Geslacht: 23 vrouwen (“0”), 27 mannen (“1”) Vetpercentage: gemiddeld 8; sd = 2; range 4-13 Onderzoeksvraag: Wordt het aantal blessures bepaald door geslacht en vetpercentage?

6 data

7 Poisson verdeling Bij niet vaak voorkomende gebeurtenissen is de Poisson verdeling geschikt vanwege 1. geen negatieve getallen 2. Positief verwachte waarde (gemiddelde) e -µ  µ y Pr(Y= y) = , voor µ > 0 y! Gemiddelde (verwachting) = µ Speciale eigenschap: gemiddeld aantal, µ = variantie van aantal = var(Y)

8 Poisson verdeling Simulatie van 100 waarnemingen Uit Poisson verdeling met verschillende verwachtingen mu

9 Poisson verdeling Poisson verdeling: Gerelateerd aan binomiale verdeling bin(n,p) Voor n heel groot, en p heel klein: Verwachting = np, variantie np(1-p)  np Wanneer voldoet de Poissonverdeling? 1.De kans op het optreden van tenminste één gebeurtenis in een zeker tijdsinterval is proportioneel aan de lengte van dat tijdsinterval 2.De kans op meer dan 1 gebeurtenis in een heel klein tijdsinterval is verwaarloosbaar klein 3.De aantallen gebeurtenissen in verschillende tijdsintervallen zijn onderling onafhankelijk

10 Poisson regressie model Onze data over blessures: steekproef 50 personen Het aantal blessures voor persoon i, Y i heeft een Poisson verdeling met parameter µ i Notatie: Y i ~ Poisson(µ i ), Let op µ i = verwachting (gemiddelde) = var(Y i ) > 0

11 Poisson regressie model Regressiemodel: Schat gemiddelde als functie van predictoren Lineaire model: µ i = β 0 + β 1 *geslacht i + β 2 *vetpercentage i Probleem: negatieve schattingen zijn mogelijk Mogelijke oplossing: Schat log µ i als functie van predictoren: Dus, Log(µ i )= β 0 + β 1 *geslacht i + β 2 *vetpercentage i

12 Vergelijking logistisch model Modelleren van gemiddelde in logistisch model: Een proportie  dat ligt tussen 0 en 1 Vandaar: log(  /1-  ) = β 0 + β 1 *x 1 + β 2 *x 2 Zowel logistische regressie als Poisson regressie behoren tot de klasse van generalized linear models Gebruik van verschillende linkfuncties Logistisch model: log(  /1-  ) Poisson model: log(µ i )

13 Poisson regressie model Poisson regressiemodel: Y i ~ Poisson(µ i ), waarbij µ i = exp(β 0 + β 1 *geslacht i + β 2 *vetpercentage i ) Dus, Y i ~ Poisson(exp(β 0 + β 1 *geslacht i + β 2 *vetpercentage i )) Interpretatie??

14 Poisson regressie model: voorbeeld Onze data van 50 sporters met de vraag : Zijn geslacht en vetpercentage van invloed op aantal blessures? Resultaten van Poisson analyse in R (maximum likelihood) predictorCoefficient (se) Intercept Geslacht (man=1) Vetpercentage (0.38) 0.42 (0.18) 0.11 (0.04)

15 Poisson regressie model: voorbeeld Resultaten van Poisson analyse in R: µ = exp(β 0 + β 1 *geslacht + β 2 *vetpercentage) µdak= exp( *man *vet) = exp(-0.17) * exp(0.42*man) * exp(0.11*vet) = 0.84 * 1.52 man * 1.12 vet Vrouw: 0.84 * 1.12 vet Man: 0.84 * 1.52* 1.12 vet predictorCoefficient (se) Intercept Geslacht Vet (0.38) 0.42 (0.18) 0.11 (0.04)

16 Poisson regressie model scatterplot + schattingen

17 Poisson regressie model In de niet gemanipuleerde data: Elke sporter heeft een verschillende follow-up periode Oplossing voor dat probleem: t i = lengte follow-up voor persoon i: Schat log (µ i /t i ) als functie van predictoren. log(µ i /t i )= β 0 + β 1 *geslacht i + β 2 *vetpercentage i log(µ i ) – log(t i )= β 0 + β 1 *geslacht i + β 2 *vetpercentage i log(µ i ) = log(t i ) + β 0 + β 1 *geslacht i + β 2 *vetpercentage i log(t i ) = offset gemiddelde proportioneel met follow-up Verdubbeling van follow-up betekent verdubbeling van aantal (mits andere predictoren zelfde blijven)

18 Poisson regressie model toetsen predictorCoefficient se wald pvalue Intercept Geslacht Vet Wald test voor elke predictor De interactieterm was niet significant: p-value 0.08

19 Poisson regressie model toetsen Likelihood ratio test: gebaseerd op likelihood Vergelijken van geneste modellen: Verschil ~  2 verdeeld modellen-2*loglikelihood verschil (vrijheidsgraden) nulmodel (intercept) nul +geslacht Nul +geslacht+vet Nul+geslacht+vet+interactie 80.6 (49) 74.9 (48) 5.7 (1) 68.2 (47) 6.7 (1) (1)

20 Poisson regressie model goodness of fit Goodness of fit: Voorspelde waarden (ydak) vergelijken met geobserveerde waarnemingen (y): (y i – ydak i ) e i = residu(gestandaardiseerd) i = ,  (ydak i ) Onder Poisson model: Gemiddeld 0 en variantie 1:

21 Poisson regressie model modelfit

22 Overdispersion Bij Poisson verdeling: Gemiddelde = variantie! In veel gevallen: variantie > gemiddelde (bijvoorbeeld bij veel nullen) Dit heet overdispersion: Kan je checken en toetsen gestandaardiseerd residu is basis voor toetsing Bij overdispersion: in R: met optie quasipoisson werken

23 R-syntax model1 = glm(formula = n_blessures ~ geslacht + vet, family =poisson) summary(model1) model2 = glm(formula = n_blessures ~ geslacht + vet, family = quasipoisson) summary(model3) In onze data: geen overdispersion.

24 Poisson regressie model in SPSS

25 Poisson regressie model SPSS

26

27

28

29 Referenties Matthews D.E. & Farewell V.T. Using and Understanding Medical Statistics (hoofdstuk 12) Gelman A. & Hill J. Data analysis Using Regression and multilevel/hierarchical Models (hoofdstuk 6) Mc Cullagh P. & Nelder J.A. Generalized linear models (hoofdstuk 6)

30 Volgende keer 18 februari: Graven naar causaliteit Zaal: 16


Download ppt "Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 21 januari: Poisson regressie 18 februari:"

Verwante presentaties


Ads door Google