Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdGuus Wouters Laatst gewijzigd meer dan 10 jaar geleden
1
Cursus Mei – Juni Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek COLLEGE 3: VOOR PAUZE
2
Programma 06-5 13-5 27-5 03-6 10-6 17-6 Confounding, standaardisatie, Mantel Haenszel Enkelvoudige logistische reg. Dummy variabelen Log.reg. Met covariaten en interactie Bespreking opdrachten Vergelijking met Ancova
3
Toetsingstheorie Multipele regressie Voorkennis Onderwerpen
Confounding Standaardisatie/stratificatie/Mantel-Haenszel Logistische regressie COLLEGE 3: VOOR PAUZE
4
Onderzoekskader: valideringsproblemen
Effect van een bepaalde behandeling op objects (bijv. Personen) Ook algemener: (causaal) effect van een grootheid X op een grootheid Y COLLEGE 3: VOOR PAUZE
5
Onderzoekskader: valideringsproblemen
behandeling Groep discrepantie COLLEGE 3: VOOR PAUZE Geen behandeling Ideale situatie niet haalbaar. Werken met proxy-controle groep
6
Onderzoekskader: valideringsproblemen
Confounding (adequacy of the control group) De groepen kunnen van elkaar verschillen door andere factoren (welke op zichzelf gerelateerd zijn aan de afhankelijke variabele) dan de behandeling zelf Associatie impliceert niet causale relatie tussen X en Y Voldoende voor geen confounding is - een gebalanceerd design - een gerandomiseerde toewijzing in groepen COLLEGE 3: VOOR PAUZE
7
Onderzoekskader: valideringsproblemen
Definitie volgens adequaatheid van de controle groep vaak verward met collapsibility principe Collapsibility: er is sprake van confounding als de ruwe (marginale) associatie ongelijk is aan de stratumspecifieke associatie
8
Illustratie 1. De (fictieve) resultaten van een onderzoek naar de effectiviteit van veiligheidsgordels Overleven gecombineerd Lage snelheid Hoge snelheid nee ja Nee 20 30 2 18 12 Gordel 10 40 4 36 6 RR (OR) 2 ( 2.67) 1 ( 1) 1 (1) Snelheid een confounder ?
9
Illustratie 2. Effect leeftijd moeder op sterfte bij geboorte kind
Kindersterfte gecombineerd ondergewicht Normaal gew. ja nee oud 100 900 90 540 10 450 Lft. moeder jong 255 5 30 225 RR (OR) 2.65 ( 2.83) 1 ( 1) 1 (1) Geboortegewicht een confounder ?
10
Illustratie 3. Effect medicijn op genezing een gebalanceerd design
genezen gecombineerd lichtzieken zwaarzieken ja nee Int. 115 85 95 5 20 80 medicijn Contr. RR (OR) 1.35 ( 1.83) 1.19 ( 4.75) 4.0 (4.75) Ernst van de ziekte een confounder ?
11
Confounding Als een factor C een confounder is, dan
C is geen causaal gevolg van R (mediator) Geen gerandomiseerd design Geen balanced design Ruwe RR(OR) ongelijk aan de stratum specifieke RR (OR)
12
Confounding Het negeren van een confounder leidt tot vertekende resultaten (bias) Een maat voor de invloed van een confounder is bias Stel de werkelijke (populatie) waarde van een behandelingseffect en ô een schatter voor bias (ô) = verwachte waarde (ô) - waarbij de verwachte waarde gelijk is aan de gemiddelde waarde van alle mogelijke ô ‘s na een groot aantal herhalingen van het onderzoek
13
Methoden voor bias controle
Standaardisatie - directe - indirecte Stratificatie volgens Mantel Haenszel Correlationele methoden
14
Directe standaardisatie
Verdeling van de confounder standaardiseren door een verdeling van een standaard populatie confounder Fractie groep 1 Fractie groep 2 Standaard verdeling 1 p11 p21 fs1 2 p12 p22 fs2 . J p1J p2J fsJ Relatief risico groep 1 t.o.v groep 2
15
Indirecte standaardisatie
Verdeling van de specifieke fracties standaardiseren en vervolgens correctie toepassen m.b.v. SMR confounder Fractie groep 1 Standaard verdeling fs1 pc1 fs2 pc2 . fsJ Overall 1 pv pc Als standaard populatie de controle groep is, dan is Rradj = SMR
16
Enkele opmerkingen Compacte samenvatting van wat gaande is
Als steekproefaantal per stratum klein of zelfs nul Als RR constant over strata van de confounder, dan levert de directe methode veelal een schatting op zonder vertekening Indirecte standaardisatie alleen onvertekend als standaard populatie een van de groepen is Geen toets voorhanden Variatie over strata door standaardisatie gemaskeerd
17
Stratificatie volgens Mantel Haenszel
Is de associatie consistent over strata, d.w.z. zijn de waargenomen verschillen toe te schrijven aan toeval? Stel associatie consistent over strata. Is de overall associatie gecorrigeerd voor confounder statistisch significant? Stel overall associatie is statistisch significant. Hoe groot is de standaardfout van de overall schatting?
18
Stratificatie volgens Mantel Haenszel
Als associatie niet consistent, dan Mantel Haenszel niet geschikt Mogelijk betrouwbaarheidsintervallen te contrueren Onder consistentie is de Mantel-Haenszel schatter onvertekend
19
Logistisch regressiemodel
sgewijze logistische regressie lll COLLEGE 3: VOOR PAUZE
20
Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
21
Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
22
Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
23
Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
24
Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
25
Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen COLLEGE 3: VOOR PAUZE
26
Logistisch regressiemodel
CIJFER STUDIETIJD model: y is continu en x mag discreet zijn
27
Logistisch regressiemodel
1 UITSLAG STUDIETIJD wat als y dichotoom is ?
28
Logistisch regressiemodel
1 UITSLAG STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval
29
Logistisch regressiemodel
1 UITSLAG STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval
30
Logistisch regressiemodel
1 EEN MODEL DAT IN VEEL GEVALLEN ZO’N S-VORMIG VERBAND GOED BESCHRIJFT IS PERCENTAGE SLAGINGS X = STUDIETIJD IN PLAATS VAN NOTEREN WE
31
Logistisch regressiemodel
1 een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is PERCENTAGE SLAGINGS X = STUDIETIJD IN PLAATS VAN NOTEREN WE
32
Logistisch regressiemodel
1 een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is PERCENTAGE SLAGINGS X = STUDIETIJD In plaats van Noteren we
33
Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
34
Specificatie van het model logistisch regressiemodel
Het logistische model Kan herschreven worden als In plaats van noteren we ook Logit(p) of ln(odds)
35
Specificatie van het model logistisch regressiemodel
1 X = STUDIETIJD
36
Specificatie van het model logistisch regressiemodel
1 X = STUDIETIJD
37
Specificatie van het model
Y = Dropout (wel =1, niet =0) X = jaarcohort
38
Specificatie van het model
Als logistische regressiemodel: logit (p) = 0 + 1 Cohort
39
Specificatie van het model groot steekproefaantal
Als benadering van logistische regressiemodel: logit (f) = 0 + 1 Cohort +
40
Specificatie van het model groot steekproefaantal
Als benadering van logistische regressiemodel: logit (f) = 0 + 1 Cohort + Problem: als p=0, dan logit (f) bestaat niet Oplossing: logit(f + c) met c een klein positief getal bijvoorbeeld 0.01 R-square = 0.504
41
Specificatie van het model groot steekproefaantal
Als lineair kansmodel: f = 0 + 1 Cohort +
42
Specificatie van het model groot steekproefaantal
Als lineair kansmodel: f = 0 + 1 Cohort + R-square = 0.502
43
Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
44
Vergelijking met een kruistabelanalyse logistisch regressiemodel
STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 Voorbeeld: effect van geslacht op toelating tot de universiteit berkeley. STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120
45
Vergelijking met een kruistabelanalyse logistisch regressiemodel
SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit IN TERMEN VAN KANSEN RELATIEVE SUCCESKANS (IN LITERATUUR: RELATIEF RISICO (RR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT
46
Vergelijking met een kruistabelanalyse logistisch regressiemodel
SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen
47
Vergelijking met een kruistabelanalyse logistisch regressiemodel
SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen relatieve succeskans (in literatuur: relatief risico (rr)) mannen worden eerder toegelaten tot de universiteit
48
Vergelijking met een kruistabelanalyse logistisch regressiemodel
SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 in termen van odds RELATIEVE ODDS (IN LITERATUUR: ODDSRATIO(OR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT
49
Vergelijking met een kruistabelanalyse logistisch regressiemodel
SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 in termen van odds relatieve odds (in literatuur: oddsratio(or)) mannen worden eerder toegelaten tot de universiteit
50
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Het verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schaling Belangrijk voor interpretatie: als rr > (of <) 1, dan or > (of <) 1
51
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Dezelfde analyse met logistische regressie Te volgen stappen: Model specificeren en let op de codering van de variabelen Schat de regressieparameters met spss Bereken de oddsratio(s) met behulp van rekenregels
52
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Stap 1. Model specificeren en let op de codering van de variabelen Model: let op! Wat geeft p aan als man Hoe is gesl. Gecodeerd. Hier: gesl = als vrouw
53
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Stap 2. Schat de regressieparameters met spss Het geschatte model: Merk op : odds = i.h.b. Ln(odds(man)) = * 1 = .307 Ln(odds(vrouw)) = * 0 = -.305
54
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: Dus: regel 1. = = Regel 2. Ln (or) = Dus or = exp (.612) = 1.84
55
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: Dus: regel 1. = = Regel 2. Ln (or) = Dus or = exp (.612) = 1.84
56
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: Dus: regel 1. = = regel 2. Ln (OR) = Dus OR= exp (.612) = 1.84
57
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
58
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
59
Vergelijking met een kruistabelanalyse logistisch regressiemodel
1 COLLEGE 3: LAATSTE SHEET VOOR PAUZE X de helling is een monotone functie van de oddsratio or
60
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) rschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
61
Vergelijking met een kruistabelanalyse logistisch regressiemodel
Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas
62
Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE
63
Model met covariaat/interactie logistisch regressiemodel
Net als bij ancova kan er sprake zijn van een storende variabele Ontstaat bijvoorbeeld doordat Er studierichtingen zijn met strenge eisen en overwegend vrouwen Er studierichtingen zijn met minder strenge eisen en overwegend mannen COLLEGE 3: NA PAUZE
64
Model met covariaat/interactie logistisch regressiemodel
STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 Minder strenge eisen en overwegend mannen STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120 strenge eisen en overwegend vrouwen
65
Model met covariaat/interactie logistisch regressiemodel
STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN dit fenomeen heet confounding (vergelijk ancova) in model studierichting opnemen als covariaat
66
Model met covariaat/interactie logistisch regressiemodel
STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN dit fenomeen heet interactie(vergelijk ancova). in model geslacht * studierichting opnemen als interactie
67
Model met covariaat/interactie logistisch regressiemodel
STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN nb. interactie ook mogelijk indien verdeling mannen en vrouwen over studierichtingen gelijk
68
Model met covariaat/interactie logistisch regressiemodel
STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120
69
Model met covariaat/interactie logistisch regressiemodel
Verschillen tussen oddsratios kunnen toegeschreven worden aan toeval (hierover later) Eerst consequentie voor model en interpretatie als Studierichting een covariaat is Er sprake is van interactie tussen studierichting en geslacht
70
Model met covariaat/interactie logistisch regressiemodel
Daar studierichting discreet is, dienen we dummy variabelen aan te maken 1 als studierichting 2 Studie (2) = 0 anders 1 als studierichting 3 Studie (3) = Studierichting 1 fungeert als referentiegroep
71
Model met covariaat/interactie logistisch regressiemodel
ad1. studierichting is een covariaat LN (ODDS) GECOMBINEERD GESLACHT VROUW MAN alle regressielijnen zijn evenwijdig aan elkaar. dus maar ongelijk aan model is:
72
Model met covariaat/interactie logistisch regressiemodel
uitvoer logistich regressiemodel met covariaat Variables in the Equation B S.E. Wald df Sig. Exp(B) GESLACHT -,197 ,117 2,829 1 ,093 ,821 STUDIE 139,246 2 ,000 STUDIE(2) -,037 ,110 ,110 1 ,740 ,964 STUDIE(3) -1,315 ,117 126,961 1 ,000 ,268 Constant ,768 ,125 37,930 1 ,000 2,156 dus model is geschat door: ln (odds) = geslacht studie (2) – studie (3) en = exp (-.197) = .821 nb! denk aan stappenplan
73
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
ad2. ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT STUDIE 3 LN (ODDS) STUDIE 2 GECOMBINEERD STUDIE 1 GESLACHT VROUW MAN REGRESSIELIJNEN ZIJN NIET EVENWIJDIG. DUS ER GELDT NIET = MODEL IS:
74
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
UITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIE Variables in the Equation B S.E. Wald df Sig. Exp(B) Step GESLACHT -1,052 ,263 16,036 1 ,000 ,349 a 1 STUDIE 75,430 2 ,000 STUDIE(2) -,790 ,498 2,522 1 ,112 ,454 STUDIE(3) -2,205 ,267 68,094 1 ,000 ,110 GESLACHT * STUDIE 15,462 2 ,000 GESLACHT by STUDIE(2) ,832 ,510 2,657 1 ,103 2,298 GESLACHT by STUDIE(3) 1,177 ,300 15,436 1 ,000 3,244 Constant 1,544 ,253 37,333 1 ,000 4,684 . DUS MODEL IS GESCHAT DOOR: LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3)
75
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER
76
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER
77
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER
78
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER
79
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE
80
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE
81
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE
82
MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE
83
LOGISTISCH REGRESSIEMODEL
BEPERKING LINEAIRE REGRESSIEMODEL SPECIFICATIE VAN HET MODEL VERGELIJKING MET EEN KRUISTABELANALYSE MODEL MET COVARIAAT/INTERACTIE TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN STAPSGEWIJZE LOGISTISCHE REGRESSIE COLLEGE 3: VOOR PAUZE
84
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
DRIE MODELLEN 1. 2. 3. COLLEGE 4: VOOR PAUZE
85
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
86
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
MODEL IS Block 0: Beginning Block
87
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
Block 1: Method = Enter MODEL
88
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
Block 2: Method = Enter MODEL -2LL = – = Variables in the Equation B S.E. Wald df Sig. Exp(B) Step GESLACHT -,197 ,117 2,829 1 ,093 ,821 a 1 STUDIE 139,246 2 ,000 STUDIE(2) -,037 ,110 ,110 1 ,740 ,964 STUDIE(3) -1,315 ,117 126,961 1 ,000 ,268 Constant ,768 ,125 37,930 1 ,000 2,156 a. Variable(s) entered on step 1: GESLACHT, STUDIE.
89
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
Block 3: Method = Enter MODEL STEP = DF = 2 P-WAARDE = .0002 -2LL = – =
90
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
WELK MODEL: OP GROND VAN TOP-DOWN PROCEDURE KEUZE MODEL MET INTERACTIE DUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOS
91
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1} = LN(ODDS{V,ST1} = 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2} = LN(ODDS{V,ST2} = OP DEZELFDE MANIER
92
TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
CONCLUSIE STUDIE 3 LN (ODDS) STUDIE 2 STUDIE 1 GESLACHT VROUW MAN COLLEGE 4: LAATSTE SHEET VOOR PAUZE ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT
93
Ancova covariantieanalyse
groepen met elkaar te vergelijken in aanwezigheid van covariaten covariaat een onafhankelijke variabele in het model waarvan het effect niet interessant is voor de onderzoeksvraag COLLEGE 2: VOOR PAUZE
94
Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
95
Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
96
Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
97
Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
98
Voorbeeld covariantieanalyse
Vergelijken tussen rokers en niet rokers met Betrekking tot verandering in polsslag na een Loopoefening POLS ROKER NIET ROKER GEWICHT
99
Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
100
T-toets versus lineaire regressie covariantieanalyse
Twee formuleringen: Vergelijken tussen twee onafhankelijke steekproeven. Leidt tot t-toets. Effect van roken op verandering in polsslag. Leidt tot lineaire regressie.
101
T-toets versus lineaire regressie covariantieanalyse
ad 1. t-toets voor onafhankelijke steekproeven Group Statistics SMOKE N Mean Std. Deviation Std. Error no , , ,3678 POLS yes , , ,4424 Independent Samples Test t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Equal variances assumed 1, , ,0978
102
T-toets versus lineaire regressie covariantieanalyse
ad 1. t-toets voor onafhankelijke steekproeven Group Statistics SMOKE N Mean Std. Deviation Std. Error no , , ,3678 POLS yes , , ,4424 Independent Samples Test t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Equal variances assumed 1, , ,0978
103
T-toets versus lineaire regressie covariantieanalyse
ad 2. lineaire regressie Model Dus een negatieve helling POLS ROKER NIET ROKER 21.4 14.3 ROKEN NIET (CODE 0) WEL (CODE 1)
104
T-toets versus lineaire regressie covariantieanalyse
uitvoer enkelvoudige regressieanalyse Unstandardized Coefficients Model B Std. Error t Sig. (Constant) , , ,882 ,000 SMOKE , , ,340 ,189 dus model is Y = 21.4 – 7.1 ROKEN + e = -7.1
105
Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
106
Model met storende variabele COVARIANTIEANALYSE
lichaamsgewicht is potentiele storende variabele er zijn drie mogelijkheden POLS ROKER NIET ROKER GEWICHT
107
Model met storende variabele covariantieanalyse
a. gewicht is geen storende variabele POLS ROKER NIET ROKER 21.4 14.3 ROKEN
108
Model met storende variabele covariantieanalyse
b. gewicht is een covariaat(confounder) twee evenwijdige regressielijnen POLS ROKER NIET ROKER GEWICHT
109
Model met storende variabele covariantieanalyse
c. er is een interactie tussen gewicht en roken twee niet evenwijdige regressielijnen POLS ROKER NIET ROKER COLLEGE 2: LAATSTE SHEET VOOR PAUZE GEWICHT
110
Model met storende variabele covariantieanalyse
ad b. als gewicht een covariaat is, dan model POLS 21.4 14.3 COLLEGE 2: NA PAUZE GEWICHT zonder gewicht: met gewicht als covariaat:
111
Model met storende variabele covariantieanalyse
POLS 21.4 14.3 GEWICHT
112
Model met storende variabele covariantieanalyse
uitvoer regressiemodel met covariaat Unstandardized Coefficients Model B Std. Error t Sig. (Constant) 69, , ,562 ,000 SMOKE , , ,926 ,362 weight in pounds -, , ,218 ,003 dus model is: Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e = - 4.4
113
Model met storende variabele covariantieanalyse
ad c. als er een interactie is tussen gewicht en roken , dan model: POLS 21.4 R_G 14.3 GEWICHT MET INTERACTIETERM:
114
Model met storende variabele covariantieanalyse
R_G POLS 21.4 14.3 GEWICHT
115
Model met storende variabele covariantieanalyse
uitvoer regressiemodel met interactie Unstandardized Coefficients Model B Std. Error t Sig. (Constant) , , , ,000 SMOKE , , , ,242 weight in pounds -, , , ,004 R_G , , , ,295 dus model is: Y = 83.3 – 37.9 ROKEN - .4 GEWICHT + .2 R_G + e
116
Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur
117
Welk model verdient de voorkeur covariantieanalyse
Toetsing volgens de top-down principe Het meest algemene model: Toets op interactie als dan geen interactie Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele
118
Welk model verdient de voorkeur covariantieanalyse
Toetsing volgens de top-down principe Het meest algemene model: 1. Toets op interactie als dan geen interactie Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele
119
Welk model verdient de voorkeur covariantieanalyse
Toetsing volgens de top-down principe Het meest algemene model: 1. Toets op interactie als dan geen interactie 2. Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele
120
Ancova covariantieanalyse
Unstandardized Coefficients Model B Std. Error t Sig. 1 (Constant) 21, ,102 6,882 ,000 SMOKE -7, ,298 -1,340 ,189 2 (Constant) 69,791 15, ,562 ,000 SMOKE -4, , ,926 ,362 weight in pounds -, , ,218 ,003 3 (Constant) 83,324 19, ,197 ,000 SMOKE ,933 31, ,192 ,242 weight in pounds -, , ,152 ,004 R_G , , ,066 ,295 COLLEGE 2: LAATSTE SHEET NA PAUZE
121
Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met twee categorieën 1 als IQ hoog IQ = 0 als IQ laag Indicator voor mensen met een hoog IQ CIJFER COLLEGE 1: NA PAUZE IQ 1
122
Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met twee categorieën Cijfer Model: E(Y|X=1) a E(Y|X=0) b UIT FIGUUR: IQ 1
123
Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met twee categorieën Cijfer Model: E(Y|X=1) a E(Y|X=0) b Uit figuur: IQ 1
124
Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met twee categorieën Cijfer Door berekening: E(Y|X=1)= E(Y|X=0)= DUS E(Y|X=1) a E(Y|X=0) b IQ 1
125
Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met twee categorieën Cijfer Door berekening: E(Y|X=1)= E(Y|X=0)= DUS E(Y|X=1) a E(Y|X=0) b IQ 1
126
Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met drie categorieën Model specificatie is fout want lineairiteit alleen voldaan onder speciale codering Y Y X X 1 2 3 1 5
127
Regressie met dummy variabelen meervoudig lineair regressiemodel
Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatoren D_LAAG Laag Niet zo D_HOOG Hoog Niet zo D_GEM Gemid. Niet zo
128
Regressie met dummy variabelen meervoudig lineair regressiemodel
Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatoren Twee van de drie indicatoren voldoende om de drie groepen te onderscheiden D_LAAG Laag Niet zo D_HOOG Hoog Niet zo D_GEM Gemid. Niet zo
129
Regressie met dummy variabelen meervoudig lineair regressiemodel
Voorbeeld IQ D_HOOG D_GEM HOOG 1 GEMID LAAG
130
Regressie met dummy variabelen meervoudig lineair regressiemodel
Model specificatie: nu is wel aan de lineairiteitseis voldaan
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.