Cursus Regressie-analyse Rijkswaterstaat, 13 februari Nominale en ordinale variabelen Transparanten beschikbaar gesteld door Dr. B. Pelzer
Regressie-analyse, kwalitatieve variabelen nominale predictor: hoe opnemen in model? interpretatie van de b-eetjes twee nominale predictoren nominale en interval predictor ordinale predictor relatieve sterkte van 'n nominale predictor
Opnemen nominale predictor “Krant die men ‘t meest leest” salaris model: Yi = b0 + b1 krant i + ei = flauwekul! 1 2 3 volk tel nrc 1 2 3 nrc volk tel Om zinvol model te krijgen maken we drie hulpvariabelen: volk, tel, nrc volk tel nrc “dummies” of “dummy variables” Volkskrant lezers 1 0 0 Telegraaf lezers 0 1 0 Nrc lezers 0 0 1 scores op 2 dummies volstaan om te weten welke krant iemand leest!
Dummies als predictoren Kies variant A, B of C A B C volk tel volk nrc tel nrc 1 0 1 0 0 0 0 1 0 0 1 0 0 0 0 1 0 1 Volkskrant lezers Telegraaf lezers NRC lezers variant B: Voorspelde Salaris voor Volkskrant lezers: Telegraaf is ‘referentie categorie’ Telegraaf lezers: NRC lezers:
Interpretatie van regressie effecten b van dummies voorspelde salarissen salaris 4.5 nrc 3 volkskrant 2 telegraaf volkskrant telegraaf nrc voorspelde Y waarde van de referentie groep verschil in voorspelde Y waarde met referentie groep verschil in voorspelde Y waarde met referentiegroep
Dummies maken met spss, voorafgaand aan Regression frequencies krant. recode krant (1=1) (2, 3 = 0) (else=sysmis) into volk. recode krant (2=1) (1, 3 = 0) (else=sysmis) into tel. recode krant (3=1) (1, 2 = 0) (else=sysmis) into nrc. frequencies volk tel nrc.
Dummies als predictoren in Regression regression /dependent salaris /enter volk nrc. ter verificatie: mean salaris by krant. Volkskrant lezers: = 2 + 1 = 3 = gem. salaris Volks.lezers Telegraaf lezers: = 2 = gem. salaris Tel. lezers NRC lezers: = 2 + 2.5 = 4.5 = gem. salaris NRC lezers
Hypothesen over de regressie effecten b van de dummies variant B dia 3: Volksk.lezers: Telegr.lezers: NRC lezers: H0 : b1=0 "salaris Volkskrant lezers = salaris Telegraaf lezers" H0 : b2=0 "salaris NRC lezers = salaris Telegraaf lezers" variant C dia 3: H0 : b2=0 "salaris NRC lezers = salaris Volkskrant lezers"
Twee nominale predictoren krant (telegraaf, volkskrant, nrc) geslacht onveiligheid kies referentie categorieën: telegraaf , vrouw overige categorieën vormen de predictor-dummies: interpretatie: voorsp. onveiligheid van telegraaf lezende vrouwen verschil in voorsp. onveiligheid van volkskrant en telegraaf lezers gecontroleerd voor invloed geslacht verschil in voorsp. onveiligheid van nrc en telegraaf lezers gecontroleerd voor invloed geslacht verschil in voorsp. onveiligheid van mannen en vrouwen gecontroleerd voor invloed krant
Voordeel van “controleren voor” bij twee nominale predictoren Y = onveiligheid vrouwen n=90 n=50 n=10 mannen nrc volkskrant telegraaf = voorsp onveiligh met model: = voorsp onveiligh met model: = voorsp onveiligh met model:
Nominale en interval predictor krant (telegraaf, volkskrant, nrc) leeftijd onveiligheid onveilig telegraaf volkskrant nrc leeftijd
Ordinale predictor: die behandel je als nominaal òf als interval econ.tv 0 1 2 3 4 lo vmbo vwo uni R2 nominaal R2 interval R2 interval <= R2 nominaal Je kunt toetsen of R2 interval significant kleiner is dan R2 nominaal H0 : R2 interval = R2 nominaal Hoe toets verloopt: zie volgende dia.
Truuk om te toetsen H0 : R2 interval = R2 nominaal Nominale model heeft zelfde R2 als model: zie dia 7 les 2! Interval model Als H0 waar is volgt een F verdeling; Sig F < 0.05 H0 verwerpen!
Dia 7 Les 2 : Gezamenlijke invloed van 2 of meer predictoren X1 = leeftijd X2 = opleiding X3 = urentv X4 = urenkrant Y = onveilig (A) (B) Gezamenlijke invloed van urentv + urenkrant toetsen: H0 : b3 = b4=0 ofwel H0 : R2model (A) = R2model(B) Als H0 waar is volgt een F verdeling, df1 = aantal 0 gestelde b’s df2 = n – aantal X in model (A) - 1 Als Significantie van F < 0.05 dan H0 verwerpen!
Dia 8 les 2 : Gezamenlijk invloed X3 en X4 toetsen via F en R Square Change regression /dependent y /enter x1 x2 /test (x3 x4). F en Significantie van F !
Relatieve sterkte van 'n nominale predictor Bereken één beta voor krant: SHEAF coëfficiënt
Bepaling Sheaf coëfficiënt met spss regression dep onveilig /enter volk nrc leeftijd. (resultaat: dia 13) compute sheaf = -20.236 * volk + - 36.596 * nrc. regression dep onveilig /enter sheaf leeftijd.