De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

Verwante presentaties


Presentatie over: "1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek."— Transcript van de presentatie:

1 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek

2 2 Programma Confounding, standaardisatie, Mantel Haenszel Enkelvoudige logistische reg. Dummy variabelen Log.reg. Met covariaten en interactie Bespreking opdrachten Vergelijking met Ancova Bespreking opdrachten

3 3 Voorkennis Toetsingstheorie Multipele regressie Onderwerpen Confounding Confounding Standaardisatie/stratificatie/Mantel-Haenszel Standaardisatie/stratificatie/Mantel-Haenszel Logistische regressie Logistische regressie

4 4 Onderzoekskader: valideringsproblemen Effect van een bepaalde behandeling op objects (bijv. Personen) Ook algemener: (causaal) effect van een grootheid X op een grootheid Y

5 5 Onderzoekskader: valideringsproblemen Groep behandeling Geen behandeling discrepantie Ideale situatie niet haalbaar. Werken met proxy-controle groep

6 6 Onderzoekskader: valideringsproblemen De groepen kunnen van elkaar verschillen door andere factoren (welke op zichzelf gerelateerd zijn aan de afhankelijke variabele) dan de behandeling zelf Associatie impliceert niet causale relatie tussen X en Y Voldoende voor geen confounding is - een gebalanceerd design - een gerandomiseerde toewijzing in groepen Confounding (adequacy of the control group)

7 7 Onderzoekskader: valideringsproblemen Definitie volgens adequaatheid van de controle groep vaak verward met collapsibility principe Collapsibility: er is sprake van confounding als de ruwe (marginale) associatie ongelijk is aan de stratumspecifieke associatie

8 8 Illustratie 1. De (fictieve) resultaten van een onderzoek naar de effectiviteit van veiligheidsgordels Overleven gecombineerdLage snelheidHoge snelheid neejaNeejaneeja nee Gordel ja RR (OR)2 ( 2.67)1 ( 1) Snelheid een confounder ?

9 9 Illustratie 2. Effect leeftijd moeder op sterfte bij geboorte kind Kindersterfte gecombineerdondergewichtNormaal gew. janeejaneejanee oud Lft. moeder jong RR (OR)2.65 ( 2.83)1 ( 1) Geboortegewicht een confounder ?

10 10 Illustratie 3. Effect medicijn op genezing een gebalanceerd design genezen gecombineerdlichtziekenzwaarzieken janeejaneejanee Int medicijn Contr RR (OR)1.35 ( 1.83)1.19 ( 4.75)4.0 (4.75) Ernst van de ziekte een confounder ?

11 11 Confounding 1.C is geen causaal gevolg van R (mediator) 2.Geen gerandomiseerd design 3.Geen balanced design 4.Ruwe RR(OR) ongelijk aan de stratum specifieke RR (OR) Als een factor C een confounder is, dan

12 12 Confounding Het negeren van een confounder leidt tot vertekende resultaten (bias) Een maat voor de invloed van een confounder is bias Stel  de werkelijke (populatie) waarde van een behandelingseffect en ô een schatter voor  bias (ô) = verwachte waarde (ô) -  waarbij de verwachte waarde gelijk is aan de gemiddelde waarde van alle mogelijke ô ‘s na een groot aantal herhalingen van het onderzoek

13 13 Methoden voor bias controle Standaardisatie -directe -indirecte Stratificatie volgens Mantel Haenszel Correlationele methoden

14 14 Directe standaardisatie confounderFractie groep 1 Fractie groep 2 Standaard verdeling 1p 11 p 21 f s1 2p 12 p 22 f s2.... Jp 1J p 2J f sJ Verdeling van de confounder standaardiseren door een verdeling van een standaard populatie Relatief risico groep 1 t.o.v groep 2

15 15 Indirecte standaardisatie confounderFractie groep 1 Standaard verdeling f s1 p c1 f s2 p c2.. f sJ p c2 Overall 1pvpv pcpc Verdeling van de specifieke fracties standaardiseren en vervolgens correctie toepassen m.b.v. SMR Als standaard populatie de controle groep is, dan is Rr adj = SMR

16 16 Enkele opmerkingen Compacte samenvatting van wat gaande is Als steekproefaantal per stratum klein of zelfs nul Als RR constant over strata van de confounder, dan levert de directe methode veelal een schatting op zonder vertekening Indirecte standaardisatie alleen onvertekend als standaard populatie een van de groepen is Geen toets voorhanden Variatie over strata door standaardisatie gemaskeerd

17 17 Stratificatie volgens Mantel Haenszel Is de associatie consistent over strata, d.w.z. zijn de waargenomen verschillen toe te schrijven aan toeval? Stel associatie consistent over strata. Is de overall associatie gecorrigeerd voor confounder statistisch significant? Stel overall associatie is statistisch significant. Hoe groot is de standaardfout van de overall schatting?

18 18 Stratificatie volgens Mantel Haenszel Als associatie niet consistent, dan Mantel Haenszel niet geschikt Mogelijk betrouwbaarheidsintervallen te contrueren Onder consistentie is de Mantel-Haenszel schatter onvertekend

19 19 Logistisch regressiemodel sgewijze logistische regressie lll

20 20 Logistisch regressiemodel Beperking lineaire regressiemodelBeperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie

21 21 Logistisch regressiemodel Beperking lineaire regressiemodelBeperking lineaire regressiemodel Specificatie van het modelSpecificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie

22 22 Logistisch regressiemodel Beperking lineaire regressiemodelBeperking lineaire regressiemodel Specificatie van het modelSpecificatie van het model Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie

23 23 Logistisch regressiemodel Beperking lineaire regressiemodelBeperking lineaire regressiemodel Specificatie van het modelSpecificatie van het model Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse Model met covariaat/interactieModel met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie

24 24 Logistisch regressiemodel Beperking lineaire regressiemodelBeperking lineaire regressiemodel Specificatie van het modelSpecificatie van het model Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse Model met covariaat/interactieModel met covariaat/interactie Toetsen voor het vergelijken tussen modellenToetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie

25 25 Logistisch regressiemodel Beperking lineaire regressiemodelBeperking lineaire regressiemodel Specificatie van het modelSpecificatie van het model Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse Model met covariaat/interactieModel met covariaat/interactie Toetsen voor het vergelijken tussen modellenToetsen voor het vergelijken tussen modellen

26 26 Logistisch regressiemodel CIJFER STUDIETIJD model: y is continu en x mag discreet zijn

27 27 Logistisch regressiemodel UITSLAG STUDIETIJD wat als y dichotoom is ? 1 0

28 28 Logistisch regressiemodel UITSLAG STUDIETIJD bepaal het percentage geslaagden per studie- tijdsinterval 1 0

29 29 Logistisch regressiemodel UITSLAG STUDIETIJD bepaal het percentage geslaagden per studie- tijdsinterval 1 0

30 30 Logistisch regressiemodel SLAGINGSPERCENTAGE X = STUDIETIJD 1 0 EEN MODEL DAT IN VEEL GEVALLEN ZO’N S-VORMIG VERBAND GOED BESCHRIJFT IS IN PLAATS VAN NOTEREN WE

31 31 Logistisch regressiemodel SLAGINGSPERCENTAGE X = STUDIETIJD 1 0 een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is IN PLAATS VAN NOTEREN WE

32 32 Logistisch regressiemodel SLAGINGSPERCENTAGE X = STUDIETIJD 1 0 een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is In plaats van Noteren we

33 33 Logistisch regressiemodel Beperking lineaire regressiemodelBeperking lineaire regressiemodel Specificatie van het modelSpecificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie

34 34 Specificatie van het model logistisch regressiemodel Het logistische model Kan herschreven worden als In plaats van noteren we ook Logit(p) of ln(odds)

35 35 Specificatie van het model logistisch regressiemodel P X = STUDIETIJD 1 0

36 36 Specificatie van het model logistisch regressiemodel X = STUDIETIJD 1 0

37 37 Specificatie van het model Y = Dropout (wel =1, niet =0) X = jaarcohort

38 38 Specificatie van het model Als logistische regressiemodel: logit (p) =  0 +  1 Cohort

39 39 Specificatie van het model groot steekproefaantal Als benadering van logistische regressiemodel: logit (f) =  0 +  1 Cohort + 

40 40 Specificatie van het model groot steekproefaantal Als benadering van logistische regressiemodel: logit (f) =  0 +  1 Cohort +  Problem: als p=0, dan logit (f) bestaat niet Oplossing: logit(f + c) met c een klein positief getal bijvoorbeeld 0.01 R-square = 0.504

41 41 Specificatie van het model groot steekproefaantal Als lineair kansmodel: f =  0 +  1 Cohort + 

42 42 Specificatie van het model groot steekproefaantal Als lineair kansmodel: f =  0 +  1 Cohort +  R-square = 0.502

43 43 Logistisch regressiemodel Beperking lineaire regressiemodelBeperking lineaire regressiemodel Specificatie van het modelSpecificatie van het model Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie

44 44 Vergelijking met een kruistabelanalyse logistisch regressiemodel Voorbeeld: effect van geslacht op toelating tot de universiteit berkeley. STUDIE 1 AANGENOMEN NIET NIETWEL VROUW VROUW1989 MAN MAN STUDIE 2 AANGENOMEN NIET NIETWEL VROUW VROUW817 MAN MAN STUDIE 3 AANGENOMEN NIET NIETWEL VROUW VROUW MAN MAN205120

45 45 Vergelijking met een kruistabelanalyse logistisch regressiemodel IN TERMEN VAN KANSEN SAMENGEVOEGDAANGENOMEN NIET NIETWEL VROUW VROUW MAN MAN vraag: hebben mannen meer kans toegelaten te worden tot de universiteit RELATIEVE SUCCESKANS (IN LITERATUUR: RELATIEF RISICO (RR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

46 46 Vergelijking met een kruistabelanalyse logistisch regressiemodel in termen van kansen SAMENGEVOEGDAANGENOMEN NIET NIETWEL VROUW VROUW MAN MAN vraag: hebben mannen meer kans toegelaten te worden tot de universiteit

47 47 Vergelijking met een kruistabelanalyse logistisch regressiemodel in termen van kansen SAMENGEVOEGDAANGENOMEN NIET NIETWEL VROUW VROUW MAN MAN vraag: hebben mannen meer kans toegelaten te worden tot de universiteit relatieve succeskans (in literatuur: relatief risico (rr)) mannen worden eerder toegelaten tot de universiteit

48 48 Vergelijking met een kruistabelanalyse logistisch regressiemodel in termen van odds SAMENGEVOEGDAANGENOMEN NIET NIETWEL VROUW VROUW MAN MAN RELATIEVE ODDS (IN LITERATUUR: ODDSRATIO(OR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

49 49 Vergelijking met een kruistabelanalyse logistisch regressiemodel in termen van odds SAMENGEVOEGDAANGENOMEN NIET NIETWEL VROUW VROUW MAN MAN relatieve odds (in literatuur: oddsratio(or)) mannen worden eerder toegelaten tot de universiteit

50 50 Vergelijking met een kruistabelanalyse logistisch regressiemodel Het verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schalingHet verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schaling Belangrijk voor interpretatie: als rr > (of (of (of (of <) 1

51 51 Vergelijking met een kruistabelanalyse logistisch regressiemodel 1.Model specificeren en let op de codering van de variabelen 2.Schat de regressieparameters met spss 3.Bereken de oddsratio(s) met behulp van rekenregels Dezelfde analyse met logistische regressie Te volgen stappen:

52 52 Vergelijking met een kruistabelanalyse logistisch regressiemodel Model: let op! Wat geeft p aan 1 als manModel: let op! Wat geeft p aan 1 als man Hoe is gesl. Gecodeerd. Hier: gesl = 0 als vrouwHoe is gesl. Gecodeerd. Hier: gesl = 0 als vrouw Stap 1.Model specificeren en let op de codering van de variabelen

53 53 Vergelijking met een kruistabelanalyse logistisch regressiemodel Het geschatte model: Merk op : odds = i.h.b. Ln(odds(man)) = * 1 =.307 Ln(odds(vrouw)) = * 0 = Stap 2. Schat de regressieparameters met spss

54 54 Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 3.Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: Dus: regel 1. = =.612 Regel 2. Ln (or) =.612. Dus or = exp (.612) = 1.84

55 55 Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 3.Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: Dus: regel 1. = =.612 = =.612 Regel 2. Ln (or) =.612. Dus or = exp (.612) = 1.84

56 56 Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 3.Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: Dus: regel 1. = =.612 = =.612 regel 2. Ln (OR) =.612. Dus OR= exp (.612) = 1.84

57 57 Vergelijking met een kruistabelanalyse logistisch regressiemodel Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting), dan = * ln (or) Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas Enkele opmerkingen:

58 58 Vergelijking met een kruistabelanalyse logistisch regressiemodel Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1.Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting), dan = * ln (or) Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas Enkele opmerkingen:

59 59 Vergelijking met een kruistabelanalyse logistisch regressiemodel X 1 0 de helling is een monotone functie van de oddsratio or

60 60 Vergelijking met een kruistabelanalyse logistisch regressiemodel Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1.Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting), dan = * ln (or)Als verschil in codes van x gelijk is aan 7 (in dezelfde richting), dan = * ln (or) rschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas Enkele opmerkingen:

61 61 Vergelijking met een kruistabelanalyse logistisch regressiemodel Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1.Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting), dan = * ln (or)Als verschil in codes van x gelijk is aan 7 (in dezelfde richting), dan = * ln (or) veverschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas Enkele opmerkingen:

62 62 Logistisch regressiemodel Beperking lineaire regressiemodelBeperking lineaire regressiemodel Specificatie van het modelSpecificatie van het model Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse Model met covariaat/interactieModel met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie

63 63 Model met covariaat/interactie logistisch regressiemodel Net als bij ancova kan er sprake zijn van een storende variabele Ontstaat bijvoorbeeld doordat Er studierichtingen zijn met strenge eisen en overwegend vrouwen Er studierichtingen zijn met minder strenge eisen en overwegend mannen

64 64 Model met covariaat/interactie logistisch regressiemodel STUDIE 1 AANGENOMEN NIET NIETWEL VROUW VROUW1989 MAN MAN STUDIE 2 AANGENOMEN NIET NIETWEL VROUW VROUW817 MAN MAN STUDIE 3 AANGENOMEN NIET NIETWEL VROUW VROUW MAN MAN strenge eisen en overwegend vrouwen Minder strenge eisen en overwegend mannen

65 65 Model met covariaat/interactie logistisch regressiemodel GESLACHT 1 0 VROUWMAN STUDIERICHTING 3 STUDIERICHTING 1 GECOMBINEERD dit fenomeen heet confounding (vergelijk ancova) in model studierichting opnemen als covariaat

66 66 Model met covariaat/interactie logistisch regressiemodel GESLACHT 1 0 VROUWMAN STUDIERICHTING 3 STUDIERICHTING 1 GECOMBINEERD dit fenomeen heet interactie(vergelijk ancova). in model geslacht * studierichting opnemen als interactie

67 67 Model met covariaat/interactie logistisch regressiemodel GESLACHT 1 0 VROUWMAN STUDIERICHTING 3 STUDIERICHTING 1 GECOMBINEERD nb. interactie ook mogelijk indien verdeling mannen en vrouwen over studierichtingen gelijk

68 68 Model met covariaat/interactie logistisch regressiemodel STUDIE 1 AANGENOMEN NIET NIETWEL VROUW VROUW1989 MAN MAN STUDIE 2 AANGENOMEN NIET NIETWEL VROUW VROUW817 MAN MAN STUDIE 3 AANGENOMEN NIET NIETWEL VROUW VROUW MAN MAN205120

69 69 Model met covariaat/interactie logistisch regressiemodel Verschillen tussen oddsratios kunnen toegeschreven worden aan toeval (hierover later) Eerst consequentie voor model en interpretatie als 1.Studierichting een covariaat is 2.Er sprake is van interactie tussen studierichting en geslacht

70 70 Model met covariaat/interactie logistisch regressiemodel Daar studierichting discreet is, dienen we dummy variabelen aan te maken 1als studierichting 2 1als studierichting 2 Studie (2) = 0anders 0anders 1als studierichting 3 1als studierichting 3 Studie (3) = 0anders 0anders Studierichting 1 fungeert als referentiegroep

71 71 Model met covariaat/interactie logistisch regressiemodel ad1. studierichting is een covariaat LN (ODDS) GESLACHT VROUW MAN GECOMBINEERD alle regressielijnen zijn evenwijdig aan elkaar. dus maar ongelijk aan model is:

72 72 Model met covariaat/interactie logistisch regressiemodel uitvoer logistich regressiemodel met covariaat Variables in the Equation -,197,1172,8291,093, ,2462,000 -,037,110,1101,740,964 -1,315,117126,9611,000,268,768,12537,9301,0002,156 GESLACHT STUDIE STUDIE(2) STUDIE(3) Constant BS.E.WalddfSig.Exp(B) dus model is geschat door: ln (odds) = geslacht studie (2) – studie (3) en = exp (-.197) =.821 nb! denk aan stappenplan

73 73 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ad2.ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT LN (ODDS) GESLACHT VROUW MAN GECOMBINEERD REGRESSIELIJNEN ZIJN NIET EVENWIJDIG. DUS ER GELDT NIET = MODEL IS: STUDIE 1 STUDIE 2 STUDIE 3

74 74 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL UITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIE Variables in the Equation -1,052,26316,0361,000,349 75,4302,000 -,790,4982,5221,112,454 -2,205,26768,0941,000,110 15,4622,000,832,5102,6571,1032,298 1,177,30015,4361,0003,244 1,544,25337,3331,0004,684 GESLACHT STUDIE STUDIE(2) STUDIE(3) GESLACHT * STUDIE GESLACHT by STUDIE(2) GESLACHT by STUDIE(3) Constant Step 1 a BS.E.WalddfSig.Exp(B). DUS MODEL IS GESCHAT DOOR: LN (ODDS) = GESLACHT -.79 STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3)

75 75 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = GESLACHT -.79 STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER

76 76 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = GESLACHT -.79 STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER

77 77 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = GESLACHT -.79 STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER

78 78 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = GESLACHT -.79 STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER

79 79 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

80 80 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

81 81 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

82 82 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

83 83 LOGISTISCH REGRESSIEMODEL BEPERKING LINEAIRE REGRESSIEMODELBEPERKING LINEAIRE REGRESSIEMODEL SPECIFICATIE VAN HET MODELSPECIFICATIE VAN HET MODEL VERGELIJKING MET EEN KRUISTABELANALYSEVERGELIJKING MET EEN KRUISTABELANALYSE MODEL MET COVARIAAT/INTERACTIEMODEL MET COVARIAAT/INTERACTIE TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLENTOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN STAPSGEWIJZE LOGISTISCHE REGRESSIE

84 84 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL DRIE MODELLEN

85 85 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL

86 86 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL Block 0: Beginning Block MODEL IS

87 87 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL Block 1: Method = Enter MODEL

88 88 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL Block 2: Method = Enter MODEL Variables in the Equation -,197,1172,8291,093, ,2462,000 -,037,110 1,740,964 -1,315,117126,9611,000,268,768,12537,9301,0002,156 GESLACHT STUDIE STUDIE(2) STUDIE(3) Constant Step 1 a BS.E.WalddfSig.Exp(B) Variable(s) entered on step 1: GESLACHT, STUDIE. a. -2LL = – =

89 89 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL Block 3: Method = Enter MODEL -2LL = – = STEP = DF = 2P-WAARDE =.0002

90 90 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL WELK MODEL: OP GROND VAN TOP-DOWN PROCEDURE KEUZE MODEL MET INTERACTIE DUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOS

91 91 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL LN (ODDS) = GESLACHT -.79 STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1} = LN(ODDS{V,ST1} = OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2} = LN(ODDS{V,ST2} = OP DEZELFDE MANIER

92 92 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT LN (ODDS) GESLACHT VROUW MAN STUDIE 1 STUDIE 2 STUDIE 3 CONCLUSIE

93 93 Ancova covariantieanalyse groepen met elkaar te vergelijken in aanwezigheid van covariaten covariaat een onafhankelijke variabele in het model waarvan het effect niet interessant is voor de onderzoeksvraag

94 94 Ancova covariantieanalyse VoorbeeldVoorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

95 95 Ancova covariantieanalyse VoorbeeldVoorbeeld T-toets versus lineaire regressieT-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

96 96 Ancova covariantieanalyse VoorbeeldVoorbeeld T-toets versus lineaire regressieT-toets versus lineaire regressie Model met storende variabeleModel met storende variabele Welk model verdient de voorkeur

97 97 Ancova covariantieanalyse VoorbeeldVoorbeeld T-toets versus lineaire regressieT-toets versus lineaire regressie Model met storende variabeleModel met storende variabele Welk model verdient de voorkeurWelk model verdient de voorkeur

98 98 Voorbeeld covariantieanalyse Vergelijken tussen rokers en niet rokers met Betrekking tot verandering in polsslag na een Loopoefening POLS GEWICHT ROKER NIET ROKER

99 99 Ancova covariantieanalyse VoorbeeldVoorbeeld T-toets versus lineaire regressieT-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

100 100 T-toets versus lineaire regressie covariantieanalyse Twee formuleringen: 1.Vergelijken tussen twee onafhankelijke steekproeven. Leidt tot t-toets. 2.Effect van roken op verandering in polsslag. Leidt tot lineaire regressie.

101 101 T-toets versus lineaire regressie covariantieanalyse Group Statistics SMOKEN Mean Std. Deviation Std. Error SMOKEN Mean Std. Deviation Std. Error no 23 21,347816,1516 3,3678 no 23 21,347816,1516 3,3678POLS yes 12 14,250011,9250 3,4424 yes 12 14,250011,9250 3,4424 ad 1.t-toets voor onafhankelijke steekproeven Independent Samples Test t-test for Equality of Means tdf Sig. (2-tailed)Mean Difference Equal variances assumed1,34033,189 7,0978

102 102 T-toets versus lineaire regressie covariantieanalyse Group Statistics SMOKEN Mean Std. Deviation Std. Error SMOKEN Mean Std. Deviation Std. Error no 23 21,347816,1516 3,3678 no 23 21,347816,1516 3,3678POLS yes 12 14,250011,9250 3,4424 yes 12 14,250011,9250 3,4424 ad 1.t-toets voor onafhankelijke steekproeven Independent Samples Test t-test for Equality of Means t-test for Equality of Means tdf Sig. (2-tailed)Mean Difference tdf Sig. (2-tailed)Mean Difference Equal variances assumed1,34033,189 7,0978

103 103 T-toets versus lineaire regressie covariantieanalyse ad 2.lineaire regressie POLS ROKEN ROKER NIET ROKER Model NIET (CODE 0) WEL (CODE 1) Dus een negatieve helling

104 104 T-toets versus lineaire regressie covariantieanalyse Unstandardized Coefficients Model BStd. Error tSig. Model BStd. Error tSig. (Constant) 21,348 3,102 6,882,000 (Constant) 21,348 3,102 6,882,000 SMOKE -7,098 5,298 -1,340,189 SMOKE -7,098 5,298 -1,340,189 uitvoer enkelvoudige regressieanalyse dus model is Y = 21.4 – 7.1 ROKEN + e = -7.1

105 105 Ancova covariantieanalyse VoorbeeldVoorbeeld T-toets versus lineaire regressieT-toets versus lineaire regressie Model met storende variabeleModel met storende variabele Welk model verdient de voorkeur

106 106 Model met storende variabele COVARIANTIEANALYSE lichaamsgewicht is potentiele storende variabele er zijn drie mogelijkheden POLS GEWICHT ROKER NIET ROKER

107 107 Model met storende variabele covariantieanalyse a. gewicht is geen storende variabele POLS ROKEN ROKER NIET ROKER

108 108 Model met storende variabele covariantieanalyse b. gewicht is een covariaat(confounder) twee evenwijdige regressielijnen POLS GEWICHT ROKER NIET ROKER

109 109 Model met storende variabele covariantieanalyse c. er is een interactie tussen gewicht en roken twee niet evenwijdige regressielijnen POLS GEWICHT ROKER NIET ROKER

110 110 Model met storende variabele covariantieanalyse ad b.als gewicht een covariaat is, dan model model POLS GEWICHT zonder gewicht: met gewicht als covariaat:

111 111 Model met storende variabele covariantieanalyse POLS GEWICHT

112 112 Model met storende variabele covariantieanalyse Unstandardized Coefficients Model BStd. Error tSig. Model BStd. Error tSig. (Constant)69,791 15,299 4,562,000 SMOKE -4,398 4,751 -,926,362 weight in pounds-,325,101-3,218,003 uitvoer regressiemodel met covariaat dus model is: Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e = - 4.4

113 113 Model met storende variabele covariantieanalyse ad c.als er een interactie is tussen gewicht en roken, dan model: POLS GEWICHT MET INTERACTIETERM: R_G

114 114 Model met storende variabele covariantieanalyse POLS GEWICHT R_G

115 115 Model met storende variabele covariantieanalyse Unstandardized Coefficients Model BStd. Error t Sig. (Constant) 83,324 19,855 4,197,000 SMOKE -37,933 31,812 -1,192,242 SMOKE -37,933 31,812 -1,192,242 weight in pounds -,416,132 -3,152,004 R_G,218,205 1,066,295 uitvoer regressiemodel met interactie dus model is : Y = 83.3 – 37.9 ROKEN -.4 GEWICHT +.2 R_G + e

116 116 Ancova covariantieanalyse VoorbeeldVoorbeeld T-toets versus lineaire regressieT-toets versus lineaire regressie Model met storende variabeleModel met storende variabele Welk model verdient de voorkeurWelk model verdient de voorkeur

117 117 Welk model verdient de voorkeur covariantieanalyse Toetsing volgens de top-down principe Het meest algemene model: 1. 1.Toets op interactie als dan geen interactie 2. 2.Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele

118 118 Welk model verdient de voorkeur covariantieanalyse Toetsing volgens de top-down principe Het meest algemene model: 1.Toets op interactie als dan geen interactie 1. 1.Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele

119 119 Welk model verdient de voorkeur covariantieanalyse Toetsing volgens de top-down principe Het meest algemene model: 1.Toets op interactie als dan geen interactie 2.Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele

120 120 Ancova covariantieanalyse Unstandardized Coefficients Model BStd. Error tSig. 1 (Constant)21,348 3,102 6,882,000 SMOKE-7,098 5,298-1,340,189 SMOKE-7,098 5,298-1,340,189 2 (Constant)69,79115,299 4,562,000 SMOKE -4,398 4,751 -,926,362 SMOKE -4,398 4,751 -,926,362 weight in pounds -,325,101 -3,218,003 weight in pounds -,325,101 -3,218,003 3 (Constant)83,32419,855 4,197,000 SMOKE -37,93331,812 -1,192,242 SMOKE -37,93331,812 -1,192,242 weight in pounds -,416,132 -3,152,004 weight in pounds -,416,132 -3,152,004 R_G,218,205 1,066,295 R_G,218,205 1,066,295

121 121 Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën 1 als IQ hoog IQ = 0 als IQ laag Indicator voor mensen met een hoog IQ CIJFER IQ 01

122 122 Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer IQ 01 Model: E(Y|X=1) E(Y|X=0) UIT FIGUUR: a b

123 123 Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer IQ 01 Model: E(Y|X=1) E(Y|X=0) Uit figuur: a b

124 124 Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer IQ 01 E(Y|X=1) E(Y|X=0) a b Door berekening: E(Y|X=1)= E(Y|X=0)= DUS

125 125 Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer IQ 01 E(Y|X=1) E(Y|X=0) a b Door berekening: E(Y|X=1)= E(Y|X=0)= DUS

126 126 Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met drie categorieën Y Y XX Model specificatie is fout want lineairiteit alleen voldaan onder speciale codering

127 127 Regressie met dummy variabelen meervoudig lineair regressiemodel Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatoren D_HOOG HoogNiet zo D_GEM Gemid.Niet zo D_LAAG LaagNiet zo

128 128 Regressie met dummy variabelen meervoudig lineair regressiemodel Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatoren D_HOOG HoogNiet zo D_GEM Gemid.Niet zo D_LAAG LaagNiet zo Twee van de drie indicatoren voldoende om de drie groepen te onderscheiden

129 129 Regressie met dummy variabelen meervoudig lineair regressiemodel IQD_HOOGD_GEM HOOG10 HOOG10 HOOG10 GEMID01 GEMID01 GEMID01 GEMID01 LAAG00 LAAG00 LAAG00 LAAG00 LAAG00 Voorbeeld

130 130 Regressie met dummy variabelen meervoudig lineair regressiemodel Model specificatie: nu is wel aan de lineairiteitseis voldaan


Download ppt "1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek."

Verwante presentaties


Ads door Google