De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek COLLEGE 3: VOOR PAUZE.

Verwante presentaties


Presentatie over: "Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek COLLEGE 3: VOOR PAUZE."— Transcript van de presentatie:

1 Cursus Mei – Juni Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek COLLEGE 3: VOOR PAUZE

2 Programma 06-5 13-5 27-5 03-6 10-6 17-6 Confounding, standaardisatie, Mantel Haenszel Enkelvoudige logistische reg. Dummy variabelen Log.reg. Met covariaten en interactie Bespreking opdrachten Vergelijking met Ancova

3 Toetsingstheorie Multipele regressie Voorkennis Onderwerpen
Confounding Standaardisatie/stratificatie/Mantel-Haenszel Logistische regressie COLLEGE 3: VOOR PAUZE

4 Onderzoekskader: valideringsproblemen
Effect van een bepaalde behandeling op objects (bijv. Personen) Ook algemener: (causaal) effect van een grootheid X op een grootheid Y COLLEGE 3: VOOR PAUZE

5 Onderzoekskader: valideringsproblemen
behandeling Groep discrepantie COLLEGE 3: VOOR PAUZE Geen behandeling Ideale situatie niet haalbaar. Werken met proxy-controle groep

6 Onderzoekskader: valideringsproblemen
Confounding (adequacy of the control group) De groepen kunnen van elkaar verschillen door andere factoren (welke op zichzelf gerelateerd zijn aan de afhankelijke variabele) dan de behandeling zelf Associatie impliceert niet causale relatie tussen X en Y Voldoende voor geen confounding is - een gebalanceerd design - een gerandomiseerde toewijzing in groepen COLLEGE 3: VOOR PAUZE

7 Onderzoekskader: valideringsproblemen
Definitie volgens adequaatheid van de controle groep vaak verward met collapsibility principe Collapsibility: er is sprake van confounding als de ruwe (marginale) associatie ongelijk is aan de stratumspecifieke associatie

8 Illustratie 1. De (fictieve) resultaten van een onderzoek naar de effectiviteit van veiligheidsgordels Overleven gecombineerd Lage snelheid Hoge snelheid nee ja Nee 20 30 2 18 12 Gordel 10 40 4 36 6 RR (OR) 2 ( 2.67) 1 ( 1) 1 (1) Snelheid een confounder ?

9 Illustratie 2. Effect leeftijd moeder op sterfte bij geboorte kind
Kindersterfte gecombineerd ondergewicht Normaal gew. ja nee oud 100 900 90 540 10 450 Lft. moeder jong 255 5 30 225 RR (OR) 2.65 ( 2.83) 1 ( 1) 1 (1) Geboortegewicht een confounder ?

10 Illustratie 3. Effect medicijn op genezing een gebalanceerd design
genezen gecombineerd lichtzieken zwaarzieken ja nee Int. 115 85 95 5 20 80 medicijn Contr. RR (OR) 1.35 ( 1.83) 1.19 ( 4.75) 4.0 (4.75) Ernst van de ziekte een confounder ?

11 Confounding Als een factor C een confounder is, dan
C is geen causaal gevolg van R (mediator) Geen gerandomiseerd design Geen balanced design Ruwe RR(OR) ongelijk aan de stratum specifieke RR (OR)

12 Confounding Het negeren van een confounder leidt tot vertekende resultaten (bias) Een maat voor de invloed van een confounder is bias Stel  de werkelijke (populatie) waarde van een behandelingseffect en ô een schatter voor  bias (ô) = verwachte waarde (ô) -  waarbij de verwachte waarde gelijk is aan de gemiddelde waarde van alle mogelijke ô ‘s na een groot aantal herhalingen van het onderzoek

13 Methoden voor bias controle
Standaardisatie - directe - indirecte Stratificatie volgens Mantel Haenszel Correlationele methoden

14 Directe standaardisatie
Verdeling van de confounder standaardiseren door een verdeling van een standaard populatie confounder Fractie groep 1 Fractie groep 2 Standaard verdeling 1 p11 p21 fs1 2 p12 p22 fs2 . J p1J p2J fsJ Relatief risico groep 1 t.o.v groep 2

15 Indirecte standaardisatie
Verdeling van de specifieke fracties standaardiseren en vervolgens correctie toepassen m.b.v. SMR confounder Fractie groep 1 Standaard verdeling fs1 pc1 fs2 pc2 . fsJ Overall 1 pv pc Als standaard populatie de controle groep is, dan is Rradj = SMR

16 Enkele opmerkingen Compacte samenvatting van wat gaande is
Als steekproefaantal per stratum klein of zelfs nul Als RR constant over strata van de confounder, dan levert de directe methode veelal een schatting op zonder vertekening Indirecte standaardisatie alleen onvertekend als standaard populatie een van de groepen is Geen toets voorhanden Variatie over strata door standaardisatie gemaskeerd

17 Stratificatie volgens Mantel Haenszel
Is de associatie consistent over strata, d.w.z. zijn de waargenomen verschillen toe te schrijven aan toeval? Stel associatie consistent over strata. Is de overall associatie gecorrigeerd voor confounder statistisch significant? Stel overall associatie is statistisch significant. Hoe groot is de standaardfout van de overall schatting?

18 Stratificatie volgens Mantel Haenszel
Als associatie niet consistent, dan Mantel Haenszel niet geschikt Mogelijk betrouwbaarheidsintervallen te contrueren Onder consistentie is de Mantel-Haenszel schatter onvertekend

19 Logistisch regressiemodel
sgewijze logistische regressie lll COLLEGE 3: VOOR PAUZE

20 Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

21 Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

22 Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

23 Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

24 Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

25 Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen COLLEGE 3: VOOR PAUZE

26 Logistisch regressiemodel
CIJFER STUDIETIJD model: y is continu en x mag discreet zijn

27 Logistisch regressiemodel
1 UITSLAG STUDIETIJD wat als y dichotoom is ?

28 Logistisch regressiemodel
1 UITSLAG STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval

29 Logistisch regressiemodel
1 UITSLAG STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval

30 Logistisch regressiemodel
1 EEN MODEL DAT IN VEEL GEVALLEN ZO’N S-VORMIG VERBAND GOED BESCHRIJFT IS PERCENTAGE SLAGINGS X = STUDIETIJD IN PLAATS VAN NOTEREN WE

31 Logistisch regressiemodel
1 een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is PERCENTAGE SLAGINGS X = STUDIETIJD IN PLAATS VAN NOTEREN WE

32 Logistisch regressiemodel
1 een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is PERCENTAGE SLAGINGS X = STUDIETIJD In plaats van Noteren we

33 Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

34 Specificatie van het model logistisch regressiemodel
Het logistische model Kan herschreven worden als In plaats van noteren we ook Logit(p) of ln(odds)

35 Specificatie van het model logistisch regressiemodel
1 X = STUDIETIJD

36 Specificatie van het model logistisch regressiemodel
1 X = STUDIETIJD

37 Specificatie van het model
Y = Dropout (wel =1, niet =0) X = jaarcohort

38 Specificatie van het model
Als logistische regressiemodel: logit (p) = 0 + 1 Cohort

39 Specificatie van het model groot steekproefaantal
Als benadering van logistische regressiemodel: logit (f) = 0 + 1 Cohort + 

40 Specificatie van het model groot steekproefaantal
Als benadering van logistische regressiemodel: logit (f) = 0 + 1 Cohort +  Problem: als p=0, dan logit (f) bestaat niet Oplossing: logit(f + c) met c een klein positief getal bijvoorbeeld 0.01 R-square = 0.504

41 Specificatie van het model groot steekproefaantal
Als lineair kansmodel: f = 0 + 1 Cohort + 

42 Specificatie van het model groot steekproefaantal
Als lineair kansmodel: f = 0 + 1 Cohort +  R-square = 0.502

43 Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

44 Vergelijking met een kruistabelanalyse logistisch regressiemodel
STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 Voorbeeld: effect van geslacht op toelating tot de universiteit berkeley. STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120

45 Vergelijking met een kruistabelanalyse logistisch regressiemodel
SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit IN TERMEN VAN KANSEN RELATIEVE SUCCESKANS (IN LITERATUUR: RELATIEF RISICO (RR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

46 Vergelijking met een kruistabelanalyse logistisch regressiemodel
SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen

47 Vergelijking met een kruistabelanalyse logistisch regressiemodel
SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen relatieve succeskans (in literatuur: relatief risico (rr)) mannen worden eerder toegelaten tot de universiteit

48 Vergelijking met een kruistabelanalyse logistisch regressiemodel
SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 in termen van odds RELATIEVE ODDS (IN LITERATUUR: ODDSRATIO(OR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

49 Vergelijking met een kruistabelanalyse logistisch regressiemodel
SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 in termen van odds relatieve odds (in literatuur: oddsratio(or)) mannen worden eerder toegelaten tot de universiteit

50 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Het verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schaling Belangrijk voor interpretatie: als rr > (of <) 1, dan or > (of <) 1

51 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Dezelfde analyse met logistische regressie Te volgen stappen: Model specificeren en let op de codering van de variabelen Schat de regressieparameters met spss Bereken de oddsratio(s) met behulp van rekenregels

52 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Stap 1. Model specificeren en let op de codering van de variabelen Model: let op! Wat geeft p aan als man Hoe is gesl. Gecodeerd. Hier: gesl = als vrouw

53 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Stap 2. Schat de regressieparameters met spss Het geschatte model: Merk op : odds = i.h.b. Ln(odds(man)) = * 1 = .307 Ln(odds(vrouw)) = * 0 = -.305

54 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: Dus: regel 1. = = Regel 2. Ln (or) = Dus or = exp (.612) = 1.84

55 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: Dus: regel 1. = = Regel 2. Ln (or) = Dus or = exp (.612) = 1.84

56 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: Dus: regel 1. = = regel 2. Ln (OR) = Dus OR= exp (.612) = 1.84

57 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

58 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

59 Vergelijking met een kruistabelanalyse logistisch regressiemodel
1 COLLEGE 3: LAATSTE SHEET VOOR PAUZE X de helling is een monotone functie van de oddsratio or

60 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) rschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

61 Vergelijking met een kruistabelanalyse logistisch regressiemodel
Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

62 Logistisch regressiemodel
Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

63 Model met covariaat/interactie logistisch regressiemodel
Net als bij ancova kan er sprake zijn van een storende variabele Ontstaat bijvoorbeeld doordat Er studierichtingen zijn met strenge eisen en overwegend vrouwen Er studierichtingen zijn met minder strenge eisen en overwegend mannen COLLEGE 3: NA PAUZE

64 Model met covariaat/interactie logistisch regressiemodel
STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 Minder strenge eisen en overwegend mannen STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120 strenge eisen en overwegend vrouwen

65 Model met covariaat/interactie logistisch regressiemodel
STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN dit fenomeen heet confounding (vergelijk ancova) in model studierichting opnemen als covariaat

66 Model met covariaat/interactie logistisch regressiemodel
STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN dit fenomeen heet interactie(vergelijk ancova). in model geslacht * studierichting opnemen als interactie

67 Model met covariaat/interactie logistisch regressiemodel
STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN nb. interactie ook mogelijk indien verdeling mannen en vrouwen over studierichtingen gelijk

68 Model met covariaat/interactie logistisch regressiemodel
STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120

69 Model met covariaat/interactie logistisch regressiemodel
Verschillen tussen oddsratios kunnen toegeschreven worden aan toeval (hierover later) Eerst consequentie voor model en interpretatie als Studierichting een covariaat is Er sprake is van interactie tussen studierichting en geslacht

70 Model met covariaat/interactie logistisch regressiemodel
Daar studierichting discreet is, dienen we dummy variabelen aan te maken 1 als studierichting 2 Studie (2) = 0 anders 1 als studierichting 3 Studie (3) = Studierichting 1 fungeert als referentiegroep

71 Model met covariaat/interactie logistisch regressiemodel
ad1. studierichting is een covariaat LN (ODDS) GECOMBINEERD GESLACHT VROUW MAN alle regressielijnen zijn evenwijdig aan elkaar. dus maar ongelijk aan model is:

72 Model met covariaat/interactie logistisch regressiemodel
uitvoer logistich regressiemodel met covariaat Variables in the Equation B S.E. Wald df Sig. Exp(B) GESLACHT -,197 ,117 2,829 1 ,093 ,821 STUDIE 139,246 2 ,000 STUDIE(2) -,037 ,110 ,110 1 ,740 ,964 STUDIE(3) -1,315 ,117 126,961 1 ,000 ,268 Constant ,768 ,125 37,930 1 ,000 2,156 dus model is geschat door: ln (odds) = geslacht studie (2) – studie (3) en = exp (-.197) = .821 nb! denk aan stappenplan

73 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
ad2. ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT STUDIE 3 LN (ODDS) STUDIE 2 GECOMBINEERD STUDIE 1 GESLACHT VROUW MAN REGRESSIELIJNEN ZIJN NIET EVENWIJDIG. DUS ER GELDT NIET = MODEL IS:

74 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
UITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIE Variables in the Equation B S.E. Wald df Sig. Exp(B) Step GESLACHT -1,052 ,263 16,036 1 ,000 ,349 a 1 STUDIE 75,430 2 ,000 STUDIE(2) -,790 ,498 2,522 1 ,112 ,454 STUDIE(3) -2,205 ,267 68,094 1 ,000 ,110 GESLACHT * STUDIE 15,462 2 ,000 GESLACHT by STUDIE(2) ,832 ,510 2,657 1 ,103 2,298 GESLACHT by STUDIE(3) 1,177 ,300 15,436 1 ,000 3,244 Constant 1,544 ,253 37,333 1 ,000 4,684 . DUS MODEL IS GESCHAT DOOR: LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3)

75 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER

76 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER

77 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER

78 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = LN(ODDS{V,ST2}) = OP DEZELFDE MANIER

79 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE

80 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE

81 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE

82 MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL
ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE

83 LOGISTISCH REGRESSIEMODEL
BEPERKING LINEAIRE REGRESSIEMODEL SPECIFICATIE VAN HET MODEL VERGELIJKING MET EEN KRUISTABELANALYSE MODEL MET COVARIAAT/INTERACTIE TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN STAPSGEWIJZE LOGISTISCHE REGRESSIE COLLEGE 3: VOOR PAUZE

84 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
DRIE MODELLEN 1. 2. 3. COLLEGE 4: VOOR PAUZE

85 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL

86 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
MODEL IS Block 0: Beginning Block

87 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
Block 1: Method = Enter MODEL

88 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
Block 2: Method = Enter MODEL -2LL = – = Variables in the Equation B S.E. Wald df Sig. Exp(B) Step GESLACHT -,197 ,117 2,829 1 ,093 ,821 a 1 STUDIE 139,246 2 ,000 STUDIE(2) -,037 ,110 ,110 1 ,740 ,964 STUDIE(3) -1,315 ,117 126,961 1 ,000 ,268 Constant ,768 ,125 37,930 1 ,000 2,156 a. Variable(s) entered on step 1: GESLACHT, STUDIE.

89 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
Block 3: Method = Enter MODEL STEP = DF = 2 P-WAARDE = .0002 -2LL = – =

90 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
WELK MODEL: OP GROND VAN TOP-DOWN PROCEDURE KEUZE MODEL MET INTERACTIE DUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOS

91 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
LN (ODDS) = GESLACHT STUDIE (2) STUDIE (3) GESLACHT * STUDIE (2) GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1} = LN(ODDS{V,ST1} = 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2} = LN(ODDS{V,ST2} = OP DEZELFDE MANIER

92 TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL
CONCLUSIE STUDIE 3 LN (ODDS) STUDIE 2 STUDIE 1 GESLACHT VROUW MAN COLLEGE 4: LAATSTE SHEET VOOR PAUZE ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT

93 Ancova covariantieanalyse
groepen met elkaar te vergelijken in aanwezigheid van covariaten covariaat een onafhankelijke variabele in het model waarvan het effect niet interessant is voor de onderzoeksvraag COLLEGE 2: VOOR PAUZE

94 Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

95 Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

96 Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

97 Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

98 Voorbeeld covariantieanalyse
Vergelijken tussen rokers en niet rokers met Betrekking tot verandering in polsslag na een Loopoefening POLS ROKER NIET ROKER GEWICHT

99 Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

100 T-toets versus lineaire regressie covariantieanalyse
Twee formuleringen: Vergelijken tussen twee onafhankelijke steekproeven. Leidt tot t-toets. Effect van roken op verandering in polsslag. Leidt tot lineaire regressie.

101 T-toets versus lineaire regressie covariantieanalyse
ad 1. t-toets voor onafhankelijke steekproeven Group Statistics SMOKE N Mean Std. Deviation Std. Error no , , ,3678 POLS yes , , ,4424 Independent Samples Test t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Equal variances assumed 1, , ,0978

102 T-toets versus lineaire regressie covariantieanalyse
ad 1. t-toets voor onafhankelijke steekproeven Group Statistics SMOKE N Mean Std. Deviation Std. Error no , , ,3678 POLS yes , , ,4424 Independent Samples Test t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Equal variances assumed 1, , ,0978

103 T-toets versus lineaire regressie covariantieanalyse
ad 2. lineaire regressie Model Dus een negatieve helling POLS ROKER NIET ROKER 21.4 14.3 ROKEN NIET (CODE 0) WEL (CODE 1)

104 T-toets versus lineaire regressie covariantieanalyse
uitvoer enkelvoudige regressieanalyse Unstandardized Coefficients Model B Std. Error t Sig. (Constant) , , ,882 ,000 SMOKE , , ,340 ,189 dus model is Y = 21.4 – 7.1 ROKEN + e = -7.1

105 Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

106 Model met storende variabele COVARIANTIEANALYSE
lichaamsgewicht is potentiele storende variabele er zijn drie mogelijkheden POLS ROKER NIET ROKER GEWICHT

107 Model met storende variabele covariantieanalyse
a. gewicht is geen storende variabele POLS ROKER NIET ROKER 21.4 14.3 ROKEN

108 Model met storende variabele covariantieanalyse
b. gewicht is een covariaat(confounder) twee evenwijdige regressielijnen POLS ROKER NIET ROKER GEWICHT

109 Model met storende variabele covariantieanalyse
c. er is een interactie tussen gewicht en roken twee niet evenwijdige regressielijnen POLS ROKER NIET ROKER COLLEGE 2: LAATSTE SHEET VOOR PAUZE GEWICHT

110 Model met storende variabele covariantieanalyse
ad b. als gewicht een covariaat is, dan model POLS 21.4 14.3 COLLEGE 2: NA PAUZE GEWICHT zonder gewicht: met gewicht als covariaat:

111 Model met storende variabele covariantieanalyse
POLS 21.4 14.3 GEWICHT

112 Model met storende variabele covariantieanalyse
uitvoer regressiemodel met covariaat Unstandardized Coefficients Model B Std. Error t Sig. (Constant) 69, , ,562 ,000 SMOKE , , ,926 ,362 weight in pounds -, , ,218 ,003 dus model is: Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e = - 4.4

113 Model met storende variabele covariantieanalyse
ad c. als er een interactie is tussen gewicht en roken , dan model: POLS 21.4 R_G 14.3 GEWICHT MET INTERACTIETERM:

114 Model met storende variabele covariantieanalyse
R_G POLS 21.4 14.3 GEWICHT

115 Model met storende variabele covariantieanalyse
uitvoer regressiemodel met interactie Unstandardized Coefficients Model B Std. Error t Sig. (Constant) , , , ,000 SMOKE , , , ,242 weight in pounds -, , , ,004 R_G , , , ,295 dus model is: Y = 83.3 – 37.9 ROKEN - .4 GEWICHT + .2 R_G + e

116 Ancova covariantieanalyse
Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

117 Welk model verdient de voorkeur covariantieanalyse
Toetsing volgens de top-down principe Het meest algemene model: Toets op interactie als dan geen interactie Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele

118 Welk model verdient de voorkeur covariantieanalyse
Toetsing volgens de top-down principe Het meest algemene model: 1. Toets op interactie als dan geen interactie Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele

119 Welk model verdient de voorkeur covariantieanalyse
Toetsing volgens de top-down principe Het meest algemene model: 1. Toets op interactie als dan geen interactie 2. Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele

120 Ancova covariantieanalyse
Unstandardized Coefficients Model B Std. Error t Sig. 1 (Constant) 21, ,102 6,882 ,000 SMOKE -7, ,298 -1,340 ,189 2 (Constant) 69,791 15, ,562 ,000 SMOKE -4, , ,926 ,362 weight in pounds -, , ,218 ,003 3 (Constant) 83,324 19, ,197 ,000 SMOKE ,933 31, ,192 ,242 weight in pounds -, , ,152 ,004 R_G , , ,066 ,295 COLLEGE 2: LAATSTE SHEET NA PAUZE

121 Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met twee categorieën 1 als IQ hoog IQ = 0 als IQ laag Indicator voor mensen met een hoog IQ CIJFER COLLEGE 1: NA PAUZE IQ 1

122 Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met twee categorieën Cijfer Model: E(Y|X=1) a E(Y|X=0) b UIT FIGUUR: IQ 1

123 Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met twee categorieën Cijfer Model: E(Y|X=1) a E(Y|X=0) b Uit figuur: IQ 1

124 Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met twee categorieën Cijfer Door berekening: E(Y|X=1)= E(Y|X=0)= DUS E(Y|X=1) a E(Y|X=0) b IQ 1

125 Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met twee categorieën Cijfer Door berekening: E(Y|X=1)= E(Y|X=0)= DUS E(Y|X=1) a E(Y|X=0) b IQ 1

126 Regressie met dummy variabelen meervoudig lineair regressiemodel
Één discrete variabele met drie categorieën Model specificatie is fout want lineairiteit alleen voldaan onder speciale codering Y Y X X 1 2 3 1 5

127 Regressie met dummy variabelen meervoudig lineair regressiemodel
Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatoren D_LAAG Laag Niet zo D_HOOG Hoog Niet zo D_GEM Gemid. Niet zo

128 Regressie met dummy variabelen meervoudig lineair regressiemodel
Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatoren Twee van de drie indicatoren voldoende om de drie groepen te onderscheiden D_LAAG Laag Niet zo D_HOOG Hoog Niet zo D_GEM Gemid. Niet zo

129 Regressie met dummy variabelen meervoudig lineair regressiemodel
Voorbeeld IQ D_HOOG D_GEM HOOG 1 GEMID LAAG

130 Regressie met dummy variabelen meervoudig lineair regressiemodel
Model specificatie: nu is wel aan de lineairiteitseis voldaan


Download ppt "Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek COLLEGE 3: VOOR PAUZE."

Verwante presentaties


Ads door Google