Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek COLLEGE 3: VOOR PAUZE.

Slides:

Advertisements

Verwante presentaties

KWALITEITSZORG november 2012

Advertisements

Stilstaan bij parkeren Dat houdt ons in beweging

‘SMS’ Studeren met Succes deel 1

Paulus' eerste brief aan Korinthe (20) 23 januari 2013 Bodegraven.

28 juni 2009 Paëllanamiddag 1 Paëllanamiddag 28 juni 2009 Voorbereiding vrijdagavond (Loopt automatisch - 7 seconden)

NEDERLANDS WOORD BEELD IN & IN Klik met de muis

WAAROM? Onderzoek naar het meest geschikte traject voor de verlenging tot in Sint-Niklaas van het bestaande fietspad naast de Stekense Vaart en de Molenbeek.

BRIDGE Vervolgcursus Vervolg op starterscursus Bridgeclub Schiedam ‘59 info: Maandagavond: 19: – of

1 Resultaten marktonderzoek RPM Zeist, 16 januari 2002 Door: Olga van Veenendaal, medew. Rothkrans Projectmanagement.

November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.

Uitgaven aan zorg per financieringsbron / /Hoofdstuk 2 Zorg in perspectief /pagina 1.

Personalisatie van de Archis website Naam: Sing Hsu Student nr: Datum: 24 Juni 2004.

Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.

7 april 2013 Zoetermeer 1. 1Korinthe Maar, zal iemand zeggen, hoe worden de doden opgewekt? En met wat voor lichaam komen zij? 2.

 Deel 1: Introductie / presentatie  DVD  Presentatie enquête  Ervaringen gemeente  Pauze  Deel 2 Discussie in kleinere groepen  Discussies in lokalen.

STAPPENPLAN GRAMMATICUS.

Ronde (Sport & Spel) Quiz Night !

Natuurlijke Werkloosheid en de Phillipscurve

Een Concert van het Nederlands Philharmonisch Orkest LES 4 1.

prNBN D addendum 1 Deel 2: PLT

Help! Statistiek! Doorlopende serie laagdrempelige lezingen,

Kb.1 Ik leer op een goede manier optellen en aftrekken

9 januari 2013 Bodegraven 1. 1Korinthe 11 1 Wordt mijn navolgers, gelijk ook ik Christus navolg. 2.

© GfK 2012 | Title of presentation | DD. Month

Nooit meer onnodig groen? Luuk Misdom, IT&T

BZ voor de Klas 3 juni 2010.

Passie - Verrijzenis Arcabas

FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.

Elke 7 seconden een nieuw getal

Regelmaat in getallen … … …

Regelmaat in getallen (1).

1 introductie 3'46” …………… normaal hart hond 1'41” ……..

Oefeningen F-toetsen ANOVA.

Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.

Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.

Wie het kleine niet eert ... (quarks, leptonen,….)

Logistische regressie

Effect modificatie Algemeen principe Bepalen van effect modificatie

1 7 nov Rijnsburg 7 nov Rijnsburg. 2 Hebreeën 7 15 En nog veel duidelijker wordt het, als naar het evenbeeld van Melchisedek een andere priester.

13 maart 2014 Bodegraven 1. 1Korinthe Want gelijk het lichaam één is en vele leden heeft, en al de leden van het lichaam, hoe vele ook, een lichaam.

ENKELVOUDIG LINEAIR REGRESSIEMODEL

Afrika: Topo nakijken en leren.

2009 Tevredenheidsenquête Resultaten Opleidingsinstellingen.

PLAYBOY Kalender 2006 Dit is wat mannen boeit!.

ribwis1 Toegepaste wiskunde Lesweek 2

ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B

Voorspellende factoren van post-CVA depressie

ribwis1 Toegepaste wiskunde, ribPWI Lesweek 01

ribwis1 Toegepaste wiskunde – Differentieren Lesweek 7

ribWBK11t Toegepaste wiskunde Lesweek 02

Obesitas & Schouderdystocie

ECHT ONGELOOFLIJK. Lees alle getallen. langzaam en rij voor rij

Hartelijk welkom bij de Nederlandse Bridge Academie Hoofdstuk 7 De 2 ♦ /2 ♥ /2 ♠ en de 2 ♣ -opening 1Contract 2, hst 7.

Hartelijk welkom bij de Nederlandse Bridge Academie Hoofdstuk 9 Het eerste bijbod 1Contract 1, hoofdstuk 9.

17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 5.

17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 3.

Fractale en Wavelet Beeldcompressie

Fractale en Wavelet Beeldcompressie

HOSTA 2010, Vastgoedcongres 29 september september Horwath HTL.

De financiële functie: Integrale bedrijfsanalyse©

1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.

12 sept 2013 Bodegraven 1. 2  vooraf lezen: 1Kor.7:12 t/m 24  indeling 1Korinthe 7  1 t/m 9: over het huwelijk  10 t/m 16: over echtscheiding  16.

13 november 2014 Bodegraven 1. 2 de vorige keer: 1Kor.15:29-34 indien er geen doden opgewekt worden...  vs 29: waarom dopen?  vs.30-32: waarom doodsgevaren.

1 Week /03/ is gestart in mineur De voorspellingen van alle groten der aarden dat de beurzen zouden stijgen is omgekeerd uitgedraaid.

ZijActief Koningslust

1 DE ADVIEZEN VAN BEURSMAKELAAR BERNARD BUSSCHAERT Week

Transcript van de presentatie:

Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek COLLEGE 3: VOOR PAUZE

Programma 06-5 13-5 27-5 03-6 10-6 17-6 Confounding, standaardisatie, Mantel Haenszel Enkelvoudige logistische reg. Dummy variabelen Log.reg. Met covariaten en interactie Bespreking opdrachten Vergelijking met Ancova

Toetsingstheorie Multipele regressie Voorkennis Onderwerpen Confounding Standaardisatie/stratificatie/Mantel-Haenszel Logistische regressie COLLEGE 3: VOOR PAUZE

Onderzoekskader: valideringsproblemen Effect van een bepaalde behandeling op objects (bijv. Personen) Ook algemener: (causaal) effect van een grootheid X op een grootheid Y COLLEGE 3: VOOR PAUZE

Onderzoekskader: valideringsproblemen behandeling Groep discrepantie COLLEGE 3: VOOR PAUZE Geen behandeling Ideale situatie niet haalbaar. Werken met proxy-controle groep

Onderzoekskader: valideringsproblemen Confounding (adequacy of the control group) De groepen kunnen van elkaar verschillen door andere factoren (welke op zichzelf gerelateerd zijn aan de afhankelijke variabele) dan de behandeling zelf Associatie impliceert niet causale relatie tussen X en Y Voldoende voor geen confounding is - een gebalanceerd design - een gerandomiseerde toewijzing in groepen COLLEGE 3: VOOR PAUZE

Onderzoekskader: valideringsproblemen Definitie volgens adequaatheid van de controle groep vaak verward met collapsibility principe Collapsibility: er is sprake van confounding als de ruwe (marginale) associatie ongelijk is aan de stratumspecifieke associatie

Illustratie 1. De (fictieve) resultaten van een onderzoek naar de effectiviteit van veiligheidsgordels Overleven gecombineerd Lage snelheid Hoge snelheid nee ja Nee 20 30 2 18 12 Gordel 10 40 4 36 6 RR (OR) 2 ( 2.67) 1 ( 1) 1 (1) Snelheid een confounder ?

Illustratie 2. Effect leeftijd moeder op sterfte bij geboorte kind Kindersterfte gecombineerd ondergewicht Normaal gew. ja nee oud 100 900 90 540 10 450 Lft. moeder jong 255 5 30 225 RR (OR) 2.65 ( 2.83) 1 ( 1) 1 (1) Geboortegewicht een confounder ?

Illustratie 3. Effect medicijn op genezing een gebalanceerd design genezen gecombineerd lichtzieken zwaarzieken ja nee Int. 115 85 95 5 20 80 medicijn Contr. RR (OR) 1.35 ( 1.83) 1.19 ( 4.75) 4.0 (4.75) Ernst van de ziekte een confounder ?

Confounding Als een factor C een confounder is, dan C is geen causaal gevolg van R (mediator) Geen gerandomiseerd design Geen balanced design Ruwe RR(OR) ongelijk aan de stratum specifieke RR (OR)

Confounding Het negeren van een confounder leidt tot vertekende resultaten (bias) Een maat voor de invloed van een confounder is bias Stel  de werkelijke (populatie) waarde van een behandelingseffect en ô een schatter voor  bias (ô) = verwachte waarde (ô) -  waarbij de verwachte waarde gelijk is aan de gemiddelde waarde van alle mogelijke ô ‘s na een groot aantal herhalingen van het onderzoek

Methoden voor bias controle Standaardisatie - directe - indirecte Stratificatie volgens Mantel Haenszel Correlationele methoden

Directe standaardisatie Verdeling van de confounder standaardiseren door een verdeling van een standaard populatie confounder Fractie groep 1 Fractie groep 2 Standaard verdeling 1 p11 p21 fs1 2 p12 p22 fs2 . J p1J p2J fsJ Relatief risico groep 1 t.o.v groep 2

Indirecte standaardisatie Verdeling van de specifieke fracties standaardiseren en vervolgens correctie toepassen m.b.v. SMR confounder Fractie groep 1 Standaard verdeling fs1 pc1 fs2 pc2 . fsJ Overall 1 pv pc Als standaard populatie de controle groep is, dan is Rradj = SMR

Enkele opmerkingen Compacte samenvatting van wat gaande is Als steekproefaantal per stratum klein of zelfs nul Als RR constant over strata van de confounder, dan levert de directe methode veelal een schatting op zonder vertekening Indirecte standaardisatie alleen onvertekend als standaard populatie een van de groepen is Geen toets voorhanden Variatie over strata door standaardisatie gemaskeerd

Stratificatie volgens Mantel Haenszel Is de associatie consistent over strata, d.w.z. zijn de waargenomen verschillen toe te schrijven aan toeval? Stel associatie consistent over strata. Is de overall associatie gecorrigeerd voor confounder statistisch significant? Stel overall associatie is statistisch significant. Hoe groot is de standaardfout van de overall schatting?

Stratificatie volgens Mantel Haenszel Als associatie niet consistent, dan Mantel Haenszel niet geschikt Mogelijk betrouwbaarheidsintervallen te contrueren Onder consistentie is de Mantel-Haenszel schatter onvertekend

Logistisch regressiemodel sgewijze logistische regressie lll COLLEGE 3: VOOR PAUZE

Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen COLLEGE 3: VOOR PAUZE

Logistisch regressiemodel CIJFER STUDIETIJD model: y is continu en x mag discreet zijn

Logistisch regressiemodel 1 UITSLAG STUDIETIJD wat als y dichotoom is ?

Logistisch regressiemodel 1 UITSLAG STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval

Logistisch regressiemodel 1 UITSLAG STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval

Logistisch regressiemodel 1 EEN MODEL DAT IN VEEL GEVALLEN ZO’N S-VORMIG VERBAND GOED BESCHRIJFT IS PERCENTAGE SLAGINGS X = STUDIETIJD IN PLAATS VAN NOTEREN WE

Logistisch regressiemodel 1 een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is PERCENTAGE SLAGINGS X = STUDIETIJD IN PLAATS VAN NOTEREN WE

Logistisch regressiemodel 1 een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is PERCENTAGE SLAGINGS X = STUDIETIJD In plaats van Noteren we

Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

Specificatie van het model logistisch regressiemodel Het logistische model Kan herschreven worden als In plaats van noteren we ook Logit(p) of ln(odds)

Specificatie van het model logistisch regressiemodel 1 X = STUDIETIJD

Specificatie van het model logistisch regressiemodel 1 X = STUDIETIJD

Specificatie van het model Y = Dropout (wel =1, niet =0) X = jaarcohort

Specificatie van het model Als logistische regressiemodel: logit (p) = 0 + 1 Cohort

Specificatie van het model groot steekproefaantal Als benadering van logistische regressiemodel: logit (f) = 0 + 1 Cohort + 

Specificatie van het model groot steekproefaantal Als benadering van logistische regressiemodel: logit (f) = 0 + 1 Cohort +  Problem: als p=0, dan logit (f) bestaat niet Oplossing: logit(f + c) met c een klein positief getal bijvoorbeeld 0.01 R-square = 0.504

Specificatie van het model groot steekproefaantal Als lineair kansmodel: f = 0 + 1 Cohort + 

Specificatie van het model groot steekproefaantal Als lineair kansmodel: f = 0 + 1 Cohort +  R-square = 0.502

Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

Vergelijking met een kruistabelanalyse logistisch regressiemodel STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 Voorbeeld: effect van geslacht op toelating tot de universiteit berkeley. STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120

Vergelijking met een kruistabelanalyse logistisch regressiemodel SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit IN TERMEN VAN KANSEN RELATIEVE SUCCESKANS (IN LITERATUUR: RELATIEF RISICO (RR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

Vergelijking met een kruistabelanalyse logistisch regressiemodel SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen

Vergelijking met een kruistabelanalyse logistisch regressiemodel SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen relatieve succeskans (in literatuur: relatief risico (rr)) mannen worden eerder toegelaten tot de universiteit

Vergelijking met een kruistabelanalyse logistisch regressiemodel SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 in termen van odds RELATIEVE ODDS (IN LITERATUUR: ODDSRATIO(OR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

Vergelijking met een kruistabelanalyse logistisch regressiemodel SAMENGEVOEGD AANGENOMEN NIET WEL VROUW 418 308 MAN 725 985 in termen van odds relatieve odds (in literatuur: oddsratio(or)) mannen worden eerder toegelaten tot de universiteit

Vergelijking met een kruistabelanalyse logistisch regressiemodel Het verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schaling Belangrijk voor interpretatie: als rr > (of <) 1, dan or > (of <) 1

Vergelijking met een kruistabelanalyse logistisch regressiemodel Dezelfde analyse met logistische regressie Te volgen stappen: Model specificeren en let op de codering van de variabelen Schat de regressieparameters met spss Bereken de oddsratio(s) met behulp van rekenregels

Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 1. Model specificeren en let op de codering van de variabelen Model: let op! Wat geeft p aan 1 als man Hoe is gesl. Gecodeerd. Hier: gesl = 0 als vrouw

Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 2. Schat de regressieparameters met spss Het geschatte model: Merk op : odds = i.h.b. Ln(odds(man)) = -.305 + .612 * 1 = .307 Ln(odds(vrouw)) = -.305 + .612 * 0 = -.305

Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: 1. 2. Dus: regel 1. = .307 - -.305 = .612 Regel 2. Ln (or) = .612. Dus or = exp (.612) = 1.84

Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: 1. 2. Dus: regel 1. = .307 - -.305 = .612 Regel 2. Ln (or) = .612. Dus or = exp (.612) = 1.84

Vergelijking met een kruistabelanalyse logistisch regressiemodel Stap 3. Bereken de oddsratio(s) met behulp van rekenregels Rekenregels: 1. 2. Dus: regel 1. = .307 - -.305 = .612 regel 2. Ln (OR) = .612. Dus OR= exp (.612) = 1.84

Vergelijking met een kruistabelanalyse logistisch regressiemodel Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Vergelijking met een kruistabelanalyse logistisch regressiemodel Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Vergelijking met een kruistabelanalyse logistisch regressiemodel 1 COLLEGE 3: LAATSTE SHEET VOOR PAUZE X de helling is een monotone functie van de oddsratio or

Vergelijking met een kruistabelanalyse logistisch regressiemodel Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) rschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Vergelijking met een kruistabelanalyse logistisch regressiemodel Enkele opmerkingen: Model: = ln (or), mits verschil in codes van variabele x gelijk is aan 1. Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or) verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Logistisch regressiemodel Beperking lineaire regressiemodel Specificatie van het model Vergelijking met een kruistabelanalyse Model met covariaat/interactie Toetsen voor het vergelijken tussen modellen Stapsgewijze logistische regressie COLLEGE 3: VOOR PAUZE

Model met covariaat/interactie logistisch regressiemodel Net als bij ancova kan er sprake zijn van een storende variabele Ontstaat bijvoorbeeld doordat Er studierichtingen zijn met strenge eisen en overwegend vrouwen Er studierichtingen zijn met minder strenge eisen en overwegend mannen COLLEGE 3: NA PAUZE

Model met covariaat/interactie logistisch regressiemodel STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 Minder strenge eisen en overwegend mannen STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120 strenge eisen en overwegend vrouwen

Model met covariaat/interactie logistisch regressiemodel STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN dit fenomeen heet confounding (vergelijk ancova) in model studierichting opnemen als covariaat

Model met covariaat/interactie logistisch regressiemodel STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN dit fenomeen heet interactie(vergelijk ancova). in model geslacht * studierichting opnemen als interactie

Model met covariaat/interactie logistisch regressiemodel STUDIERICHTING 1 1 GECOMBINEERD STUDIERICHTING 3 GESLACHT VROUW MAN nb. interactie ook mogelijk indien verdeling mannen en vrouwen over studierichtingen gelijk

Model met covariaat/interactie logistisch regressiemodel STUDIE 1 AANGENOMEN NIET WEL VROUW 19 89 MAN 313 512 STUDIE 2 AANGENOMEN NIET WEL VROUW 8 17 MAN 207 353 STUDIE 3 AANGENOMEN NIET WEL VROUW 391 202 MAN 205 120

Model met covariaat/interactie logistisch regressiemodel Verschillen tussen oddsratios kunnen toegeschreven worden aan toeval (hierover later) Eerst consequentie voor model en interpretatie als Studierichting een covariaat is Er sprake is van interactie tussen studierichting en geslacht

Model met covariaat/interactie logistisch regressiemodel Daar studierichting discreet is, dienen we dummy variabelen aan te maken 1 als studierichting 2 Studie (2) = 0 anders 1 als studierichting 3 Studie (3) = Studierichting 1 fungeert als referentiegroep

Model met covariaat/interactie logistisch regressiemodel ad1. studierichting is een covariaat LN (ODDS) GECOMBINEERD GESLACHT VROUW MAN alle regressielijnen zijn evenwijdig aan elkaar. dus maar ongelijk aan model is:

Model met covariaat/interactie logistisch regressiemodel uitvoer logistich regressiemodel met covariaat Variables in the Equation B S.E. Wald df Sig. Exp(B) GESLACHT -,197 ,117 2,829 1 ,093 ,821 STUDIE 139,246 2 ,000 STUDIE(2) -,037 ,110 ,110 1 ,740 ,964 STUDIE(3) -1,315 ,117 126,961 1 ,000 ,268 Constant ,768 ,125 37,930 1 ,000 2,156 dus model is geschat door: ln (odds) = .768 - .197 geslacht - .037 studie (2) – 1.315 studie (3) en = exp (-.197) = .821 nb! denk aan stappenplan

MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ad2. ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT STUDIE 3 LN (ODDS) STUDIE 2 GECOMBINEERD STUDIE 1 GESLACHT VROUW MAN REGRESSIELIJNEN ZIJN NIET EVENWIJDIG. DUS ER GELDT NIET = MODEL IS:

MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL UITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIE Variables in the Equation B S.E. Wald df Sig. Exp(B) Step GESLACHT -1,052 ,263 16,036 1 ,000 ,349 a 1 STUDIE 75,430 2 ,000 STUDIE(2) -,790 ,498 2,522 1 ,112 ,454 STUDIE(3) -2,205 ,267 68,094 1 ,000 ,110 GESLACHT * STUDIE 15,462 2 ,000 GESLACHT by STUDIE(2) ,832 ,510 2,657 1 ,103 2,298 GESLACHT by STUDIE(3) 1,177 ,300 15,436 1 ,000 3,244 Constant 1,544 ,253 37,333 1 ,000 4,684 . DUS MODEL IS GESCHAT DOOR: LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = 1.544-1.052 LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832 LN(ODDS{V,ST2}) = 1.544 - .79 OP DEZELFDE MANIER

MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = 1.544-1.052 LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832 LN(ODDS{V,ST2}) = 1.544 - .79 OP DEZELFDE MANIER

MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = 1.544-1.052 LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832 LN(ODDS{V,ST2}) = 1.544 - .79 OP DEZELFDE MANIER

MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1}) = 1.544-1.052 LN(ODDS{V,ST1})= 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832 LN(ODDS{V,ST2}) = 1.544 - .79 OP DEZELFDE MANIER

MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE

MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE

MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE

MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODEL ENKELE OPMERKINGEN: OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODEL IS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN COLLEGE 3: LAATSTE SHEET NA PAUZE

LOGISTISCH REGRESSIEMODEL BEPERKING LINEAIRE REGRESSIEMODEL SPECIFICATIE VAN HET MODEL VERGELIJKING MET EEN KRUISTABELANALYSE MODEL MET COVARIAAT/INTERACTIE TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN STAPSGEWIJZE LOGISTISCHE REGRESSIE COLLEGE 3: VOOR PAUZE

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL DRIE MODELLEN 1. 2. 3. COLLEGE 4: VOOR PAUZE

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL MODEL IS Block 0: Beginning Block

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL Block 1: Method = Enter MODEL

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL Block 2: Method = Enter MODEL -2LL = 3320.596 – 149.724 = 3170.872 Variables in the Equation B S.E. Wald df Sig. Exp(B) Step GESLACHT -,197 ,117 2,829 1 ,093 ,821 a 1 STUDIE 139,246 2 ,000 STUDIE(2) -,037 ,110 ,110 1 ,740 ,964 STUDIE(3) -1,315 ,117 126,961 1 ,000 ,268 Constant ,768 ,125 37,930 1 ,000 2,156 a. Variable(s) entered on step 1: GESLACHT, STUDIE.

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL Block 3: Method = Enter MODEL STEP = 17.197 DF = 2 P-WAARDE = .0002 -2LL = 3170.872 – 17.197 = 3153.675

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL WELK MODEL: OP GROND VAN TOP-DOWN PROCEDURE KEUZE MODEL MET INTERACTIE DUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOS

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3) OR VOOR STUDIERICHTING 1: LN(ODDS{M,ST1} = 1.544-1.052 LN(ODDS{V,ST1} = 1.544 OR VOOR STUDIERICHTING 2: LN(ODDS{M,ST2} = 1.544-1.052 - .79 + .832 LN(ODDS{V,ST2} = 1.544 - .79 OP DEZELFDE MANIER

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL CONCLUSIE STUDIE 3 LN (ODDS) STUDIE 2 STUDIE 1 GESLACHT VROUW MAN COLLEGE 4: LAATSTE SHEET VOOR PAUZE ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT

Ancova covariantieanalyse groepen met elkaar te vergelijken in aanwezigheid van covariaten covariaat een onafhankelijke variabele in het model waarvan het effect niet interessant is voor de onderzoeksvraag COLLEGE 2: VOOR PAUZE

Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

Voorbeeld covariantieanalyse Vergelijken tussen rokers en niet rokers met Betrekking tot verandering in polsslag na een Loopoefening POLS ROKER NIET ROKER GEWICHT

Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

T-toets versus lineaire regressie covariantieanalyse Twee formuleringen: Vergelijken tussen twee onafhankelijke steekproeven. Leidt tot t-toets. Effect van roken op verandering in polsslag. Leidt tot lineaire regressie.

T-toets versus lineaire regressie covariantieanalyse ad 1. t-toets voor onafhankelijke steekproeven Group Statistics SMOKE N Mean Std. Deviation Std. Error no 23 21,3478 16,1516 3,3678 POLS yes 12 14,2500 11,9250 3,4424 Independent Samples Test t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Equal variances assumed 1,340 33 ,189 7,0978

T-toets versus lineaire regressie covariantieanalyse ad 1. t-toets voor onafhankelijke steekproeven Group Statistics SMOKE N Mean Std. Deviation Std. Error no 23 21,3478 16,1516 3,3678 POLS yes 12 14,2500 11,9250 3,4424 Independent Samples Test t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Equal variances assumed 1,340 33 ,189 7,0978

T-toets versus lineaire regressie covariantieanalyse ad 2. lineaire regressie Model Dus een negatieve helling POLS ROKER NIET ROKER 21.4 14.3 ROKEN NIET (CODE 0) WEL (CODE 1)

T-toets versus lineaire regressie covariantieanalyse uitvoer enkelvoudige regressieanalyse Unstandardized Coefficients Model B Std. Error t Sig. (Constant) 21,348 3,102 6,882 ,000 SMOKE -7,098 5,298 -1,340 ,189 dus model is Y = 21.4 – 7.1 ROKEN + e = -7.1

Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

Model met storende variabele COVARIANTIEANALYSE lichaamsgewicht is potentiele storende variabele er zijn drie mogelijkheden POLS ROKER NIET ROKER GEWICHT

Model met storende variabele covariantieanalyse a. gewicht is geen storende variabele POLS ROKER NIET ROKER 21.4 14.3 ROKEN

Model met storende variabele covariantieanalyse b. gewicht is een covariaat(confounder) twee evenwijdige regressielijnen POLS ROKER NIET ROKER GEWICHT

Model met storende variabele covariantieanalyse c. er is een interactie tussen gewicht en roken twee niet evenwijdige regressielijnen POLS ROKER NIET ROKER COLLEGE 2: LAATSTE SHEET VOOR PAUZE GEWICHT

Model met storende variabele covariantieanalyse ad b. als gewicht een covariaat is, dan model POLS 21.4 14.3 COLLEGE 2: NA PAUZE GEWICHT zonder gewicht: met gewicht als covariaat:

Model met storende variabele covariantieanalyse POLS 21.4 14.3 GEWICHT

Model met storende variabele covariantieanalyse uitvoer regressiemodel met covariaat Unstandardized Coefficients Model B Std. Error t Sig. (Constant) 69,791 15,299 4,562 ,000 SMOKE -4,398 4,751 -,926 ,362 weight in pounds -,325 ,101 -3,218 ,003 dus model is: Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e = - 4.4

Model met storende variabele covariantieanalyse ad c. als er een interactie is tussen gewicht en roken , dan model: POLS 21.4 R_G 14.3 GEWICHT MET INTERACTIETERM:

Model met storende variabele covariantieanalyse R_G POLS 21.4 14.3 GEWICHT

Model met storende variabele covariantieanalyse uitvoer regressiemodel met interactie Unstandardized Coefficients Model B Std. Error t Sig. (Constant) 83,324 19,855 4,197 ,000 SMOKE -37,933 31,812 -1,192 ,242 weight in pounds -,416 ,132 -3,152 ,004 R_G ,218 ,205 1,066 ,295 dus model is: Y = 83.3 – 37.9 ROKEN - .4 GEWICHT + .2 R_G + e

Ancova covariantieanalyse Voorbeeld T-toets versus lineaire regressie Model met storende variabele Welk model verdient de voorkeur

Welk model verdient de voorkeur covariantieanalyse Toetsing volgens de top-down principe Het meest algemene model: Toets op interactie als dan geen interactie Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele

Welk model verdient de voorkeur covariantieanalyse Toetsing volgens de top-down principe Het meest algemene model: 1. Toets op interactie als dan geen interactie Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele

Welk model verdient de voorkeur covariantieanalyse Toetsing volgens de top-down principe Het meest algemene model: 1. Toets op interactie als dan geen interactie 2. Bij een niet significant resultaat toets op de covariaat Als dan is gewicht geen storende variabele

Ancova covariantieanalyse Unstandardized Coefficients Model B Std. Error t Sig. 1 (Constant) 21,348 3,102 6,882 ,000 SMOKE -7,098 5,298 -1,340 ,189 2 (Constant) 69,791 15,299 4,562 ,000 SMOKE -4,398 4,751 -,926 ,362 weight in pounds -,325 ,101 -3,218 ,003 3 (Constant) 83,324 19,855 4,197 ,000 SMOKE -37,933 31,812 -1,192 ,242 weight in pounds -,416 ,132 -3,152 ,004 R_G ,218 ,205 1,066 ,295 COLLEGE 2: LAATSTE SHEET NA PAUZE

Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën 1 als IQ hoog IQ = 0 als IQ laag Indicator voor mensen met een hoog IQ CIJFER COLLEGE 1: NA PAUZE IQ 1

Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer Model: E(Y|X=1) a E(Y|X=0) b UIT FIGUUR: IQ 1

Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer Model: E(Y|X=1) a E(Y|X=0) b Uit figuur: IQ 1

Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer Door berekening: E(Y|X=1)= E(Y|X=0)= DUS E(Y|X=1) a E(Y|X=0) b IQ 1

Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met twee categorieën Cijfer Door berekening: E(Y|X=1)= E(Y|X=0)= DUS E(Y|X=1) a E(Y|X=0) b IQ 1

Regressie met dummy variabelen meervoudig lineair regressiemodel Één discrete variabele met drie categorieën Model specificatie is fout want lineairiteit alleen voldaan onder speciale codering Y Y X X 1 2 3 1 5

Regressie met dummy variabelen meervoudig lineair regressiemodel Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatoren D_LAAG 1 0 Laag Niet zo D_HOOG 1 0 Hoog Niet zo D_GEM 1 0 Gemid. Niet zo

Regressie met dummy variabelen meervoudig lineair regressiemodel Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatoren Twee van de drie indicatoren voldoende om de drie groepen te onderscheiden D_LAAG 1 0 Laag Niet zo D_HOOG 1 0 Hoog Niet zo D_GEM 1 0 Gemid. Niet zo

Regressie met dummy variabelen meervoudig lineair regressiemodel Voorbeeld IQ D_HOOG D_GEM HOOG 1 GEMID LAAG

Regressie met dummy variabelen meervoudig lineair regressiemodel Model specificatie: nu is wel aan de lineairiteitseis voldaan