De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Analyse van kategorische gegevens

Verwante presentaties


Presentatie over: "Analyse van kategorische gegevens"— Transcript van de presentatie:

1 Analyse van kategorische gegevens

2 tot nu toe: respons variables continu
grootte aantal nakomelingen,.. maar: ecologische gegevens vaak kategorisch overleven aan/afwezigheid  andere methodes om continue en kategorische gegevens statistisch te verwerken

3 predictor r e s p o n continu kategorisch mixed regressie ANOVA ANCOVA
logistische regressie logit model logistische regressie of logit model

4 Als respons variablen continu..

5 grootte  aantal nakomelingen Nutrientengehalte  vegatatiedichtheid
predictor Respons continu kategorisch mixed regressie ANOVA ANCOVA logistische regressie logit model logistische regressie of logit model begingrootte  groei grootte  aantal nakomelingen Nutrientengehalte  vegatatiedichtheid

6 Regressie proc glm data=work.statistik; model groei=begingrootte; run;
100 50 91 40 105 49 110 53 95 45 55 52 85 70 39 75 41 65 80 56 62 58 51 20 25 18 28 30 54 proc glm data=work.statistik; model groei=begingrootte; run; parameter Estimate SE t-waarde Pr > t intercept 1.5 57.1 0.03 0.97 begingrootte 1.4 1.2 1.17 0.25

7 Bloemkleur  reproduktie
predictor Respons continu kategorisch mixed regressie ANOVA ANCOVA logistische regressie logit model logistische regressie of logit model Behandelingen  groei Bloemkleur  reproduktie

8 ANOVA licht nutrienten groei y 100 91 105 110 95 n 85 70 75 65 80 55 62 58 20 25 18 28 30 20 40 60 80 100 g r o e i n y proc glm data=work.statistik; class licht nutrienten; model groei=licht|nutrienten; run; source DF Type I SS Mean square F-value Pr > F Licht 1 11328 156 <0.001 Nutrienten 4032 55 L*N 649 9 0.009

9 Behandeling, grootte  groei
predictor Respons continu kategorisch mixed regressie ANOVA ANCOVA katerorisch logistische regressie logit model logistische regressie of logit model Behandeling, grootte  groei Behandelingen, natuurlijke waterbeschikbaarheid  overleven

10 Covariantie analyse licht nutrienten groei begingrootte y 100 50 91 40 105 49 110 53 95 45 n 55 52 85 70 39 75 41 65 80 56 62 58 51 20 25 18 28 30 54 40 45 50 55 begingrootte 20 60 80 100 g r o e i proc glm data=work.statistik; class licht nutrienten; model groei=licht|nutrienten begingrootte; run; source DF TI SS MS Fvalue Pr > F Licht 1 11328 508 <0.001 Nutrienten 4032 181 L*N 649 29 Begingr 824 37

11 Als respons variablen niet continu…
Vergelijkbare toetsen, maar werken met andere verdelingen Binominale verdeling Gemeten verdeling predicted verdeling

12 Voorwaarden van regressie-modellen
Geen restrikties op predictor variable (kontinu: regressie, niet kontinu: ANOVA) Respons variable mag niet beperkt zijn (moet alle mogelijke waarden aan kunnen nemen) Kategorische response variable: Respons variable sterk beperkt (kan alleen 0 of 1 zijn) probability p zeer beperkt  0 < p < 1

13 Logit transformatie verminderd de beperking van de probability p
Upper bound: delen van p door 1-p Lower bound: logaritmeren  ln[p/(1-p)] = kXik + ui Door logit transformatie worden gegenvens: Continu Niet beperkt (- < p < +) Symmetrisch verdeeld om 0  Assumpties van regressie model heersteld Toetsen van hypotheses: H0: ß1=0 (geen relatie tussen binaire response variable en de voorspelde variable)

14 Gebruikte toets: afhankelijk van aantal herhalingen
Groote aantal herhalingen: Wald statistics vergelijkbaar t-toets Weinig herhalingen: 2 statistics G2 = -2ln ()  = gereduceerd (g(x) = ß0) /full model (g(x) = ß0 + ß1X1) b1 (parameter estimate) = Wald t sb1 (SE van parameter estimate)

15 Assumpties Binominale verdeling van de waarden
Als er meerdere voorspellende waarde zijn: geen colinearitiet Het model (de causaliteit) moet kloppen

16 Voorbeeld causaliteit
Geen onderling verband tussen voorspellende variablen: Phenole, predatoren  herbivoren “Bottom up” verband Phenole  predatoren  herbivoren “Top down” verband Predator  phenole  herbivoren Toetsen van causaliteit met b.v. padanalyse

17 Als geen onderscheid tussen predictor en respons
Log-linear model (vergelijkbaar met correlatie – analyse)

18 Lengte van de seizoen  reproduktie
predictor Respons continu kategorisch mixed regressie ANOVA ANCOVA logistische regressie logit model logistische regressie of logit model Grootte  overleven Lengte van de seizoen  reproduktie

19 logistische regressie
overleven begingrootte y 50 n 40 49 53 45 55 52 39 41 56 51 20 54 logistische regressie 40 45 50 55 begingrootte n y o v e r l proc logist; model overleven = begingrootte; run; parameter DF estimate SE Chi2 Pr > chi2 intercept 1 11.9 5.3 4.9 0.026 begingrootte -0.3 0.1 5.1 0.024

20 Behandelingen  overleven Reproduktie  overleven
predictor Respons continu kategorisch mixed regressie ANOVA ANCOVA logistische regressie logit model logistische regressie of logit model Behandelingen  overleven Reproduktie  overleven Behandelingen  reproduktie

21 Logit model licht nutrienten overleven y n proc logist; class licht nutrienten; modeloverleven=licht|nutrienten; run; Effect DF Wald Chi-Square Pr>Chisq Licht 1 4.054 0.033 Nutrienten 0.201 0.647 LxN

22 Behandelingen, grootte  overleven
predictor Respons continu kategorisch mixed regressie ANOVA ANCOVA katerorisch logistische regressie logit model logistische regressie of logit model Behandelingen, grootte  overleven Lengte van de seizoen, geslacht  overleven Bloemkleur, plantgrootte  reproduktie

23 logistische regressie met continue covariable
licht nutrienten overleven begingrootte y 50 n 40 49 53 45 55 52 39 41 56 51 20 54 logistische regressie met continue covariable proc logist; class licht nutrienten; model overleven = licht|nutrienten begingrootte; run; Effect DF Wald Chi-Square Pr>Chisq Licht 1 2.289 0.113 Nutrienten 0.055 0.815 LxN 0.689 0.406 begingr 2.516


Download ppt "Analyse van kategorische gegevens"

Verwante presentaties


Ads door Google