De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Analyse van kategorische gegevens. tot nu toe: respons variables continu –grootte –aantal nakomelingen,.. maar: ecologische gegevens vaak kategorisch.

Verwante presentaties


Presentatie over: "Analyse van kategorische gegevens. tot nu toe: respons variables continu –grootte –aantal nakomelingen,.. maar: ecologische gegevens vaak kategorisch."— Transcript van de presentatie:

1 Analyse van kategorische gegevens

2 tot nu toe: respons variables continu –grootte –aantal nakomelingen,.. maar: ecologische gegevens vaak kategorisch –overleven –aan/afwezigheid  andere methodes om continue en kategorische gegevens statistisch te verwerken

3 predictor responsrespons continukategorischmixed continuregressieANOVAANCOVA kategorischlogistische regressie logit modellogistische regressie of logit model

4 Als respons variablen continu..

5 predictor Responscontinukategorischmixed continuregressieANOVAANCOVA kategorischlogistische regressie logit modellogistische regressie of logit model begingrootte  groei grootte  aantal nakomelingen Nutrientengehalte  vegatatiedichtheid

6 proc glm data=work.statistik; model groei=begingrootte; run; Regressie parameterEstimateSEt-waardePr > t intercept begingrootte groeibegingrootte

7 predictor Responscontinukategorischmixed continuregressieANOVAANCOVA kategorischlogistische regressie logit modellogistische regressie of logit model Behandelingen  groei Bloemkleur  reproduktie

8 lichtnutrientengroei yy100 yy91 yy105 yy110 yy95 yn yn91 yn85 yn70 yn75 ny65 ny80 ny55 ny62 ny58 nn20 nn25 nn18 nn28 nn g r o e i nyny nnyy proc glm data=work.statistik; class licht nutrienten; model groei=licht|nutrienten; run; ANOVA sourceDFType I SS Mean square F- value Pr > F Licht <0.001 Nutrienten <0.001 L*N

9 predictor Responscontinukategorischmixed continuregressieANOVAANCOVA katerorischlogistische regressie logit modellogistische regressie of logit model Behandeling, grootte  groei Behandelingen, natuurlijke waterbeschikbaarheid  overleven

10 lichtnutrientengroeibegingrootte yy10050 yy9140 yy10549 yy11053 yy9545 yn9555 yn9152 yn8545 yn7039 yn7541 ny6550 ny8056 ny5541 ny6245 ny5851 nn20 nn2540 nn1839 nn2850 nn3054 proc glm data=work.statistik; class licht nutrienten; modelgroei=licht|nutrienten begingrootte; run; Covariantie analyse sourceDFTI SSMSFvaluePr > F Licht <0.001 Nutrienten <0.001 L*N <0.001 Begingr <0.001

11 Als respons variablen niet continu… Vergelijkbare toetsen, maar werken met andere verdelingen  Binominale verdeling predicted verdelingGemeten verdeling

12 Voorwaarden van regressie- modellen Geen restrikties op predictor variable (kontinu: regressie, niet kontinu: ANOVA) Respons variable mag niet beperkt zijn (moet alle mogelijke waarden aan kunnen nemen) Kategorische response variable: Respons variable sterk beperkt (kan alleen 0 of 1 zijn) probability p zeer beperkt  0 < p < 1

13 Logit transformatie verminderd de beperking van de probability p –Upper bound: delen van p door 1-p –Lower bound: logaritmeren  ln[p/(1-p)] =  k X ik + u i Door logit transformatie worden gegenvens: –Continu –Niet beperkt (-  < p < +  ) –Symmetrisch verdeeld om 0  Assumpties van regressie model heersteld Toetsen van hypotheses: H 0 : ß 1 =0 (geen relatie tussen binaire response variable en de voorspelde variable)

14 Gebruikte toets: afhankelijk van aantal herhalingen Groote aantal herhalingen: Wald statistics vergelijkbaar t-toets Weinig herhalingen:  2 statistics G 2 = -2ln (  )  = gereduceerd (g(x) = ß 0 ) /full model (g(x) = ß 0 + ß 1 X 1 ) b 1 (parameter estimate) sb 1 (SE van parameter estimate) = Wald t

15 Assumpties Binominale verdeling van de waarden Als er meerdere voorspellende waarde zijn: geen colinearitiet Het model (de causaliteit) moet kloppen

16 Voorbeeld causaliteit Geen onderling verband tussen voorspellende variablen: Phenole, predatoren  herbivoren “Bottom up” verband Phenole  predatoren  herbivoren “Top down” verband Predator  phenole  herbivoren Toetsen van causaliteit met b.v. padanalyse

17 Als geen onderscheid tussen predictor en respons Log-linear model (vergelijkbaar met correlatie – analyse)

18 predictor Responscontinukategorischmixed continuregressieANOVAANCOVA kategorischlogistische regressie logit modellogistische regressie of logit model Grootte  overleven Lengte van de seizoen  reproduktie

19 overlevenbegingrootte y50 n40 y49 y53 y45 y55 y52 y45 n39 y41 y50 y56 n41 n45 n51 n20 n40 n39 n50 y54 proc logist; model overleven = begingrootte; run; logistische regressie parameterDFestimateSEChi 2 Pr > chi 2 intercept begingrootte begingrootte n y o v e r l e v e n

20 predictor Responscontinukategorischmixed continuregressieANOVAANCOVA kategorischlogistische regressie logit modellogistische regressie of logit model Behandelingen  overleven Reproduktie  overleven Behandelingen  reproduktie

21 lichtnutrientenoverleven yyy yyn yyy yyy yyy yny yny yny ynn yny nyy nyy nyn nyn nyn nnn nnn nnn nnn nny proc logist; class licht nutrienten; modeloverleven=licht|nutrienten; run; Logit model EffectDFWald Chi- Square Pr>Chisq Licht Nutrienten LxN

22 predictor Responscontinukategorischmixed continuregressieANOVAANCOVA katerorischlogistische regressie logit modellogistische regressie of logit model Behandelingen, grootte  overleven Lengte van de seizoen, geslacht  overleven Bloemkleur, plantgrootte  reproduktie

23 lichtnutrientenoverlevenbegingroo tte yyy50 yyn40 yyy49 yyy53 yyy45 yny55 yny52 yny45 ynn39 yny41 nyy50 nyy56 nyn41 nyn45 nyn51 nnn20 nnn40 nnn39 nnn50 nny54 proc logist; class licht nutrienten; model overleven = licht|nutrienten begingrootte; run; logistische regressie met continue covariable EffectDFWald Chi- Square Pr>Chisq Licht Nutrienten LxN begingr


Download ppt "Analyse van kategorische gegevens. tot nu toe: respons variables continu –grootte –aantal nakomelingen,.. maar: ecologische gegevens vaak kategorisch."

Verwante presentaties


Ads door Google