Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek COLLEGE 3: VOOR PAUZE
Programma 06-5 13-5 27-5 03-6 10-6 17-6 Confounding, standaardisatie, Mantel Haenszel Enkelvoudige logistische reg. Dummy variabelen Log.reg. Met covariaten en interactie Bespreking opdrachten Vergelijking met Ancova
Toetsingstheorie Multipele regressie Voorkennis Onderwerpen Confounding Standaardisatie/stratificatie/Mantel-Haenszel Logistische regressie COLLEGE 3: VOOR PAUZE
Onderzoekskader: valideringsproblemen Effect van een bepaalde behandeling op objects (bijv. Personen) Ook algemener: (causaal) effect van een grootheid X op een grootheid Y COLLEGE 3: VOOR PAUZE
Onderzoekskader: valideringsproblemen behandeling Groep discrepantie COLLEGE 3: VOOR PAUZE Geen behandeling Ideale situatie niet haalbaar. Werken met proxy-controle groep
Onderzoekskader: valideringsproblemen Confounding (adequacy of the control group) De groepen kunnen van elkaar verschillen door andere factoren (welke op zichzelf gerelateerd zijn aan de afhankelijke variabele) dan de behandeling zelf Associatie impliceert niet causale relatie tussen X en Y Voldoende voor geen confounding is - een gebalanceerd design - een gerandomiseerde toewijzing in groepen COLLEGE 3: VOOR PAUZE
Onderzoekskader: valideringsproblemen Definitie volgens adequaatheid van de controle groep vaak verward met collapsibility principe Collapsibility: er is sprake van confounding als de ruwe (marginale) associatie ongelijk is aan de stratumspecifieke associatie
Illustratie 1. De (fictieve) resultaten van een onderzoek naar de effectiviteit van veiligheidsgordels Overleven gecombineerd Lage snelheid Hoge snelheid nee ja Nee 20 30 2 18 12 Gordel 10 40 4 36 6 RR (OR) 2 ( 2.67) 1 ( 1) 1 (1) Snelheid een confounder ?
Illustratie 2. Effect leeftijd moeder op sterfte bij geboorte kind Kindersterfte gecombineerd ondergewicht Normaal gew. ja nee oud 100 900 90 540 10 450 Lft. moeder jong 255 5 30 225 RR (OR) 2.65 ( 2.83) 1 ( 1) 1 (1) Geboortegewicht een confounder ?
Illustratie 3. Effect medicijn op genezing een gebalanceerd design genezen gecombineerd lichtzieken zwaarzieken ja nee Int. 115 85 95 5 20 80 medicijn Contr. RR (OR) 1.35 ( 1.83) 1.19 ( 4.75) 4.0 (4.75) Ernst van de ziekte een confounder ?
Confounding Als een factor C een confounder is, dan C is geen causaal gevolg van R (mediator) Geen gerandomiseerd design Geen balanced design Ruwe RR(OR) ongelijk aan de stratum specifieke RR (OR)
Confounding Het negeren van een confounder leidt tot vertekende resultaten (bias) Een maat voor de invloed van een confounder is bias Stel de werkelijke (populatie) waarde van een behandelingseffect en ô een schatter voor bias (ô) = verwachte waarde (ô) - waarbij de verwachte waarde gelijk is aan de gemiddelde waarde van alle mogelijke ô ‘s na een groot aantal herhalingen van het onderzoek
Methoden voor bias controle Standaardisatie - directe - indirecte Stratificatie volgens Mantel Haenszel Correlationele methoden
Directe standaardisatie Verdeling van de confounder standaardiseren door een verdeling van een standaard populatie confounder Fractie groep 1 Fractie groep 2 Standaard verdeling 1 p11 p21 fs1 2 p12 p22 fs2 . J p1J p2J fsJ Relatief risico groep 1 t.o.v groep 2
Indirecte standaardisatie Verdeling van de specifieke fracties standaardiseren en vervolgens correctie toepassen m.b.v. SMR confounder Fractie groep 1 Standaard verdeling fs1 pc1 fs2 pc2 . fsJ Overall 1 pv pc Als standaard populatie de controle groep is, dan is Rradj = SMR
Enkele opmerkingen Compacte samenvatting van wat gaande is Als steekproefaantal per stratum klein of zelfs nul Als RR constant over strata van de confounder, dan levert de directe methode veelal een schatting op zonder vertekening Indirecte standaardisatie alleen onvertekend als standaard populatie een van de groepen is Geen toets voorhanden Variatie over strata door standaardisatie gemaskeerd
Stratificatie volgens Mantel Haenszel Is de associatie consistent over strata, d.w.z. zijn de waargenomen verschillen toe te schrijven aan toeval? Stel associatie consistent over strata. Is de overall associatie gecorrigeerd voor confounder statistisch significant? Stel overall associatie is statistisch significant. Hoe groot is de standaardfout van de overall schatting?
Stratificatie volgens Mantel Haenszel Als associatie niet consistent, dan Mantel Haenszel niet geschikt Mogelijk betrouwbaarheidsintervallen te contrueren Onder consistentie is de Mantel-Haenszel schatter onvertekend
Logistisch regressiemodel sgewijze logistische regressie lll COLLEGE 3: VOOR PAUZE
Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen COLLEGE 3: VOOR PAUZE
Logistisch regressiemodel CIJFER STUDIETIJD model: y is continu en x mag discreet zijn
Logistisch regressiemodel 1 UITSLAG STUDIETIJD wat als y dichotoom is ?
Logistisch regressiemodel 1 UITSLAG STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval
Logistisch regressiemodel 1 UITSLAG STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval
Logistisch regressiemodel 1 EEN MODEL DAT IN VEEL GEVALLEN ZO’N S-VORMIG VERBAND GOED BESCHRIJFT IS PERCENTAGE SLAGINGS X = STUDIETIJD IN PLAATS VAN NOTEREN WE
Logistisch regressiemodel 1 een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is PERCENTAGE SLAGINGS X = STUDIETIJD IN PLAATS VAN NOTEREN WE
Logistisch regressiemodel 1 een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is PERCENTAGE SLAGINGS X = STUDIETIJD In plaats van Noteren we
Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
Specificatie van het model logistisch regressiemodel Het logistische model Kan herschreven worden als In plaats van noteren we ook Logit(p) of ln(odds)
Specificatie van het model logistisch regressiemodel 1 X = STUDIETIJD
Specificatie van het model logistisch regressiemodel 1 X = STUDIETIJD
Specificatie van het model Y = Dropout (wel =1, niet =0) X = jaarcohort
Specificatie van het model Als logistische regressiemodel: logit (p) = 0 + 1 Cohort
Specificatie van het model groot steekproefaantal Als benadering van logistische regressiemodel: logit (f) = 0 + 1 Cohort +
Specificatie van het model groot steekproefaantal Als benadering van logistische regressiemodel: logit (f) = 0 + 1 Cohort + Problem: als p=0, dan logit (f) bestaat niet Oplossing: logit(f + c) met c een klein positief getal bijvoorbeeld 0.01 R-square = 0.504
Specificatie van het model groot steekproefaantal Als lineair kansmodel: f = 0 + 1 Cohort +
Specificatie van het model groot steekproefaantal Als lineair kansmodel: f = 0 + 1 Cohort + R-square = 0.502
Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
Vergelijking met een kruistabelanalyse logistisch regressiemodel STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 Voorbeeld: effect van geslacht op toelating tot de universiteit berkeley. STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120
Vergelijking met een kruistabelanalyse logistisch regressiemodel SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit IN TERMEN VAN KANSEN RELATIEVE SUCCESKANS (IN LITERATUUR: RELATIEF RISICO (RR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT
Vergelijking met een kruistabelanalyse logistisch regressiemodel SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen
Vergelijking met een kruistabelanalyse logistisch regressiemodel SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen relatieve succeskans (in literatuur: relatief risico (rr)) mannen worden eerder toegelaten tot de universiteit
Vergelijking met een kruistabelanalyse logistisch regressiemodel SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 in termen van odds RELATIEVE ODDS (IN LITERATUUR: ODDSRATIO(OR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT
Vergelijking met een kruistabelanalyse logistisch regressiemodel SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 in termen van odds relatieve odds (in literatuur: oddsratio(or)) mannen worden eerder toegelaten tot de universiteit
Vergelijking met een kruistabelanalyse logistisch regressiemodel Het verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schaling Belangrijk voor interpretatie: als rr > (of <) 1, dan or > (of <) 1
Vergelijking met een kruistabelanalyse logistisch regressiemodel Dezelfde analyse met logistische regressie Te volgen stappen: Model specificeren en let op de codering van de variabelen Schat de regressieparameters met spss Bereken de oddsratio(s) met behulp van rekenregels
Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 1. Model specificeren en let op de codering van de variabelen Model: let op! Wat geeft p aan 1 als man Hoe is gesl. Gecodeerd. Hier: gesl = 0 als vrouw
Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 2. Schat de regressieparameters met spss Het geschatte model: Merk op : odds = i.h.b. Ln(odds(man)) = -.305 + .612 * 1 = .307 Ln(odds(vrouw)) = -.305 + .612 * 0 = -.305
Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: 1. 2. Dus: regel 1. = .307 - -.305 = .612 Regel 2. Ln (or) = .612. Dus or = exp (.612) = 1.84
Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: 1. 2. Dus: regel 1. = .307 - -.305 = .612 Regel 2. Ln (or) = .612. Dus or = exp (.612) = 1.84
Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: 1. 2. Dus: regel 1. = .307 - -.305 = .612 regel 2. Ln (OR) = .612. Dus OR= exp (.612) = 1.84
Vergelijking met een kruistabelanalyse logistisch regressiemodel Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
Vergelijking met een kruistabelanalyse logistisch regressiemodel Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
Vergelijking met een kruistabelanalyse logistisch regressiemodel 1 COLLEGE 3: LAATSTE SHEET VOOR PAUZE X de helling is een monotone functie van de oddsratio or
Vergelijking met een kruistabelanalyse logistisch regressiemodel Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) rschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
Vergelijking met een kruistabelanalyse logistisch regressiemodel Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
Model met covariaat/interactie logistisch regressiemodel Net als bij ancova kan er sprake zijn van een storende variabele Ontstaat bijvoorbeeld doordat Er studierichtingen zijn met strenge eisen en overwegend vrouwen Er studierichtingen zijn met minder strenge eisen en overwegend mannen COLLEGE 3: NA PAUZE
Model met covariaat/interactie logistisch regressiemodel STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 Minder strenge eisen en overwegend mannen STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120 strenge eisen en overwegend vrouwen
Model met covariaat/interactie logistisch regressiemodel STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN dit fenomeen heet confounding (vergelijk ancova) in model studierichting opnemen als covariaat
Model met covariaat/interactie logistisch regressiemodel STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN dit fenomeen heet interactie(vergelijk ancova). in model geslacht * studierichting opnemen als interactie
Model met covariaat/interactie logistisch regressiemodel STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN nb. interactie ook mogelijk indien verdeling mannen en vrouwen over studierichtingen gelijk
Model met covariaat/interactie logistisch regressiemodel STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120
Model met covariaat/interactie logistisch regressiemodel Verschillen tussen oddsratios kunnen toegeschreven worden aan toeval (hierover later) Eerst consequentie voor model en interpretatie als Studierichting een covariaat is Er sprake is van interactie tussen studierichting en geslacht
Model met covariaat/interactie logistisch regressiemodel Daar studierichting discreet is, dienen we dummy variabelen aan te maken 1 als studierichting 2 Studie (2) = 0 anders 1 als studierichting 3 Studie (3) = Studierichting 1 fungeert als referentiegroep
Model met covariaat/interactie logistisch regressiemodel ad1. studierichting is een covariaat LN (ODDS) GECOMBINEERD GESLACHT VROUW MAN alle regressielijnen zijn evenwijdig aan elkaar. dus maar ongelijk aan model is:
Model met covariaat/interactie logistisch regressiemodel uitvoer logistich regressiemodel met covariaat Variables in the Equation B S.E. Wald df Sig. Exp(B) GESLACHT -,197 ,117 2,829 1 ,093 ,821 STUDIE 139,246 2 ,000 STUDIE(2) -,037 ,110 ,110 1 ,740 ,964 STUDIE(3) -1,315 ,117 126,961 1 ,000 ,268 Constant ,768 ,125 37,930 1 ,000 2,156 dus model is geschat door: ln (odds) = .768 - .197 geslacht - .037 studie (2) – 1.315 studie (3) en = exp (-.197) = .821 nb! denk aan stappenplan
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ad2. ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT STUDIE 3 LN (ODDS) STUDIE 2 GECOMBINEERD STUDIE 1 GESLACHT VROUW MAN REGRESSIELIJNEN ZIJN NIET EVENWIJDIG. DUS ER GELDT NIET = MODEL IS:
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL UITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIE Variables in the Equation B S.E. Wald df Sig. Exp(B) Step GESLACHT -1,052 ,263 16,036 1 ,000 ,349 a 1 STUDIE 75,430 2 ,000 STUDIE(2) -,790 ,498 2,522 1 ,112 ,454 STUDIE(3) -2,205 ,267 68,094 1 ,000 ,110 GESLACHT * STUDIE 15,462 2 ,000 GESLACHT by STUDIE(2) ,832 ,510 2,657 1 ,103 2,298 GESLACHT by STUDIE(3) 1,177 ,300 15,436 1 ,000 3,244 Constant 1,544 ,253 37,333 1 ,000 4,684 . DUS MODEL IS GESCHAT DOOR: LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = 1.544-1.052 LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832 LN(ODDS{V,ST2}) = 1.544 - .79 OP DEZELFDE MANIER
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = 1.544-1.052 LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832 LN(ODDS{V,ST2}) = 1.544 - .79 OP DEZELFDE MANIER
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = 1.544-1.052 LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832 LN(ODDS{V,ST2}) = 1.544 - .79 OP DEZELFDE MANIER
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = 1.544-1.052 LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832 LN(ODDS{V,ST2}) = 1.544 - .79 OP DEZELFDE MANIER
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE
LOGISTISCH REGRESSIEMODEL BEPERKING LINEAIRE REGRESSIEMODEL SPECIFICATIE VAN HET MODEL VERGELIJKING MET EEN KRUISTABELANALYSE MODEL MET COVARIAAT/INTERACTIE TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN STAPSGEWIJZE LOGISTISCHE REGRESSIE COLLEGE 3: VOOR PAUZE
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL DRIE MODELLEN 1. 2. 3. COLLEGE 4: VOOR PAUZE
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL MODEL IS Block 0: Beginning Block
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL Block 1: Method = Enter MODEL
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL Block 2: Method = Enter MODEL -2LL = 3320.596 – 149.724 = 3170.872 Variables in the Equation B S.E. Wald df Sig. Exp(B) Step GESLACHT -,197 ,117 2,829 1 ,093 ,821 a 1 STUDIE 139,246 2 ,000 STUDIE(2) -,037 ,110 ,110 1 ,740 ,964 STUDIE(3) -1,315 ,117 126,961 1 ,000 ,268 Constant ,768 ,125 37,930 1 ,000 2,156 a. Variable(s) entered on step 1: GESLACHT, STUDIE.
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL Block 3: Method = Enter MODEL STEP = 17.197 DF = 2 P-WAARDE = .0002 -2LL = 3170.872 – 17.197 = 3153.675
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL WELK MODEL: OP GROND VAN TOP-DOWN PROCEDURE KEUZE MODEL MET INTERACTIE DUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOS
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1} = 1.544-1.052 LN(ODDS{V,ST1} = 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2} = 1.544-1.052 - .79 + .832 LN(ODDS{V,ST2} = 1.544 - .79 OP DEZELFDE MANIER
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL CONCLUSIE STUDIE 3 LN (ODDS) STUDIE 2 STUDIE 1 GESLACHT VROUW MAN COLLEGE 4: LAATSTE SHEET VOOR PAUZE ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT
Ancova covariantieanalyse groepen met elkaar te vergelijken in aanwezigheid van covariaten covariaat een onafhankelijke variabele in het model waarvan het effect niet interessant is voor de onderzoeksvraag COLLEGE 2: VOOR PAUZE
Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
Voorbeeld covariantieanalyse Vergelijken tussen rokers en niet rokers met Betrekking tot verandering in polsslag na een Loopoefening POLS ROKER NIET ROKER GEWICHT
Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
T-toets versus lineaire regressie covariantieanalyse Twee formuleringen: Vergelijken tussen twee onafhankelijke steekproeven. Leidt tot t-toets. Effect van roken op verandering in polsslag. Leidt tot lineaire regressie.
T-toets versus lineaire regressie covariantieanalyse ad 1. t-toets voor onafhankelijke steekproeven Group Statistics SMOKE N Mean Std. Deviation Std. Error no 23 21,3478 16,1516 3,3678 POLS yes 12 14,2500 11,9250 3,4424 Independent Samples Test t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Equal variances assumed 1,340 33 ,189 7,0978
T-toets versus lineaire regressie covariantieanalyse ad 1. t-toets voor onafhankelijke steekproeven Group Statistics SMOKE N Mean Std. Deviation Std. Error no 23 21,3478 16,1516 3,3678 POLS yes 12 14,2500 11,9250 3,4424 Independent Samples Test t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Equal variances assumed 1,340 33 ,189 7,0978
T-toets versus lineaire regressie covariantieanalyse ad 2. lineaire regressie Model Dus een negatieve helling POLS ROKER NIET ROKER 21.4 14.3 ROKEN NIET (CODE 0) WEL (CODE 1)
T-toets versus lineaire regressie covariantieanalyse uitvoer enkelvoudige regressieanalyse Unstandardized Coefficients Model B Std. Error t Sig. (Constant) 21,348 3,102 6,882 ,000 SMOKE -7,098 5,298 -1,340 ,189 dus model is Y = 21.4 – 7.1 ROKEN + e = -7.1
Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
Model met storende variabele COVARIANTIEANALYSE lichaamsgewicht is potentiele storende variabele er zijn drie mogelijkheden POLS ROKER NIET ROKER GEWICHT
Model met storende variabele covariantieanalyse a. gewicht is geen storende variabele POLS ROKER NIET ROKER 21.4 14.3 ROKEN
Model met storende variabele covariantieanalyse b. gewicht is een covariaat(confounder) twee evenwijdige regressielijnen POLS ROKER NIET ROKER GEWICHT
Model met storende variabele covariantieanalyse c. er is een interactie tussen gewicht en roken twee niet evenwijdige regressielijnen POLS ROKER NIET ROKER COLLEGE 2: LAATSTE SHEET VOOR PAUZE GEWICHT
Model met storende variabele covariantieanalyse ad b. als gewicht een covariaat is, dan model POLS 21.4 14.3 COLLEGE 2: NA PAUZE GEWICHT zonder gewicht: met gewicht als covariaat:
Model met storende variabele covariantieanalyse POLS 21.4 14.3 GEWICHT
Model met storende variabele covariantieanalyse uitvoer regressiemodel met covariaat Unstandardized Coefficients Model B Std. Error t Sig. (Constant) 69,791 15,299 4,562 ,000 SMOKE -4,398 4,751 -,926 ,362 weight in pounds -,325 ,101 -3,218 ,003 dus model is: Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e = - 4.4
Model met storende variabele covariantieanalyse ad c. als er een interactie is tussen gewicht en roken , dan model: POLS 21.4 R_G 14.3 GEWICHT MET INTERACTIETERM:
Model met storende variabele covariantieanalyse R_G POLS 21.4 14.3 GEWICHT
Model met storende variabele covariantieanalyse uitvoer regressiemodel met interactie Unstandardized Coefficients Model B Std. Error t Sig. (Constant) 83,324 19,855 4,197 ,000 SMOKE -37,933 31,812 -1,192 ,242 weight in pounds -,416 ,132 -3,152 ,004 R_G ,218 ,205 1,066 ,295 dus model is: Y = 83.3 – 37.9 ROKEN - .4 GEWICHT + .2 R_G + e
Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
Welk model verdient de voorkeur covariantieanalyse Toetsing volgens de top-down principe Het meest algemene model: Toets op interactie als dan geen interactie Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele
Welk model verdient de voorkeur covariantieanalyse Toetsing volgens de top-down principe Het meest algemene model: 1. Toets op interactie als dan geen interactie Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele
Welk model verdient de voorkeur covariantieanalyse Toetsing volgens de top-down principe Het meest algemene model: 1. Toets op interactie als dan geen interactie 2. Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele
Ancova covariantieanalyse Unstandardized Coefficients Model B Std. Error t Sig. 1 (Constant) 21,348 3,102 6,882 ,000 SMOKE -7,098 5,298 -1,340 ,189 2 (Constant) 69,791 15,299 4,562 ,000 SMOKE -4,398 4,751 -,926 ,362 weight in pounds -,325 ,101 -3,218 ,003 3 (Constant) 83,324 19,855 4,197 ,000 SMOKE -37,933 31,812 -1,192 ,242 weight in pounds -,416 ,132 -3,152 ,004 R_G ,218 ,205 1,066 ,295 COLLEGE 2: LAATSTE SHEET NA PAUZE
Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën 1 als IQ hoog IQ = 0 als IQ laag Indicator voor mensen met een hoog IQ CIJFER COLLEGE 1: NA PAUZE IQ 1
Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer Model: E(Y|X=1) a E(Y|X=0) b UIT FIGUUR: IQ 1
Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer Model: E(Y|X=1) a E(Y|X=0) b Uit figuur: IQ 1
Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer Door berekening: E(Y|X=1)= E(Y|X=0)= DUS E(Y|X=1) a E(Y|X=0) b IQ 1
Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer Door berekening: E(Y|X=1)= E(Y|X=0)= DUS E(Y|X=1) a E(Y|X=0) b IQ 1
Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met drie categorieën Model specificatie is fout want lineairiteit alleen voldaan onder speciale codering Y Y X X 1 2 3 1 5
Regressie met dummy variabelen meervoudig lineair regressiemodel Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatoren D_LAAG 1 0 Laag Niet zo D_HOOG 1 0 Hoog Niet zo D_GEM 1 0 Gemid. Niet zo
Regressie met dummy variabelen meervoudig lineair regressiemodel Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatoren Twee van de drie indicatoren voldoende om de drie groepen te onderscheiden D_LAAG 1 0 Laag Niet zo D_HOOG 1 0 Hoog Niet zo D_GEM 1 0 Gemid. Niet zo
Regressie met dummy variabelen meervoudig lineair regressiemodel Voorbeeld IQ D_HOOG D_GEM HOOG 1 GEMID LAAG
Regressie met dummy variabelen meervoudig lineair regressiemodel Model specificatie: nu is wel aan de lineairiteitseis voldaan