HC2 – Statistiek in vogelvlucht PAOG - SPSS cursus 26 augustus & 2 september 2013 HC2 – Statistiek in vogelvlucht PAOG SPSS cursus – afdeling epidemiologie, biostatistiek en HTA
Menubalk <Analyze> (Analyseren) <Descriptive statistics>: beschrijvende statistiek Kruistabellen <Compare means>: Gemiddelden vergelijken T-testen Enkelvoudige variantieanalyse <General Linear Models> Algemene Lineaire Modellen (Meervoudige) variantieanalyse (Meervoudige) regressieanalyse Covariantie analyse <Correlate>: correlatiecoefficienten <Regression > (Multiple) lineaire regressie Logistische regressie <Non parametric tests> <Survival> Weight cases: in kruistabel (2*2), 4 situaties: iedere cel stelt een situatie voor. Je kunt dan 4 rijen maken in SPSS en deze rijen het gewicht geven van hoe vaak dit voorkomt. Later vanmiddag gaan jullie dit nog uitvoeren. Nu zal ik vooral verder ingaan op het samenvoegen van bestanden waarbij je cases uit 2 verschillende bestanden haalt. PAOG-SPSS HC2
T-test voor twee onafhankelijke groepen Vergelijkt gemiddelde in twee groepen met elkaar Aanname: afhankelijke variabele normaal verdeeld in beide groepen Gepaarde t-test Bekijkt of verschil tussen twee gepaarde waarnemingen afwijkt van 0 Aanname: verschil is normaal verdeeld. PAOG-SPSS HC2
T-test (output t-test twee onafh. steekproeven) PAOG-SPSS HC2
T-test (output gepaarde t-test) PAOG-SPSS HC2
Kruistabellen Relatie tussen twee nominale variabelen Toets: Chi-kwadraat Indien 2x2 tabel: Odds ratio of relatief risico Case-control design – OR (benadering OR) Cohort design - RR PAOG-SPSS HC2
Kruistabellen (vervolg 1) PAOG-SPSS HC2
Kruistabellen (vervolg 2) PAOG-SPSS HC2
Enkelvoudige variantieanalyse Afhankelijke variabele: continu; normaal verdeeld Onafhankelijke variabele: nominaal Eenvoudigste geval: t-test (twee groepen) Begrippen: Percentage verklaarde variantie (R2) <analyze><compare means><one-way anova> of <analyze><general linear models><univariate> PAOG-SPSS HC2
Meervoudige variantieanalyse Afhankelijke variabele (continu) wordt verklaard uit meerdere onafhankelijke (nominale) variabele. Onafhankelijke variabele: nominaal Effect onafhankelijke variabelen voor elkaar gecorrigeerd Voorwaarden (zie regressieanalyse): Y normaal verdeeld voor alle subgroepen Homogeniteit variantie Y (per subgroep) Onafhankelijkheid Geen perfecte multicollineariteit <analyze><general linear models><univariate> PAOG-SPSS HC2
Meervoudige variantieanalyse V2 = geslacht; v11 = rookgedrag PAOG-SPSS HC2
Meervoudige variantieanalyse V2 = geslacht; V11 = rookgedrag PAOG-SPSS HC2
Enkelvoudige Regressieanalyse <analyze><regression><linear> Vergelijking (model): Y = aX + b Y: Afhankelijke variabele: wordt voorspeld (continue variabele: normaal verdeeld) X: Onafhankelijke (continue) variabele: voorspelt Y a: richtingscoëfficiënt; b: constante Belangrijke begrippen: Residuele spreiding (fout in voorspelling) Percentage verklaarde variantie (R2) PAOG-SPSS HC2
Enkelvoudige regressieanalyse PAOG-SPSS HC2
Meervoudige regressieanalyse Model: Y = a1x1 + a2x2 + … + anxn + b Afhankelijke variabele (continu) wordt verklaard uit meerdere onafhankelijke continue variabelen Effect onafhankelijke variabelen voor elkaar gecorrigeerd Voorwaarden: Y normaal verdeeld voor alle subgroepen Homogene variantie Y per subgroep Geen perfecte multicollineariteit PAOG-SPSS HC2
Meervoudige regressieanalyse PAOG-SPSS HC2
Algemene lineaire modellen (General Linear Models) Omvatten: (Meervoudige) regressie-analyse (Meervoudige) variantie-analyse Covariantie-analyse Onafhankelijke variabelen nominaal én/of continu Welke procedures in SPSS -General Linear Models, -univariate voor: Regressie- variantie- en covariantie-analyse -Regression, -linear voor: Regressie analyse (Ook andere: oa logistische regressie via -binary logistic) PAOG-SPSS HC2
Logistische regressieanalyse Afhankelijke variabele: binair of dichotoom (2 uitkomstmogelijkheden) Onafhankelijke variabele(n): kan van alles zijn indien discrete onafhankelijke variabele(n) = analyse kruistabel (OR) Veel (verschillende type) variabelen in model mogelijk (vb confounder correctie) Voordelen Geen voorwaarde t.a.v. de onafhankelijke variabelen Regressiecoëfficiënten kunnen geïnterpreteerd worden als OR PAOG-SPSS HC2
Logistische regressieanalyse (voorbeeld - 1) Vraag: wordt kans op uitval in vierdaagse bepaald door: Gelopen aantal km (30, 40 of 50) (cat) Geslacht (cat) Aanwezigheid metabool syndroom (cat) Leeftijd (continu) PAOG-SPSS HC2
Logistische regressieanalyse (voorbeeld - 2) Dependent variable: Completed Four Days Marsches Dependent Variable Encoding Original Value Internal Value Yes No 1 Categorical Variables Codings Parameter coding Frequency (1) (2) Distance walked (30, 40 or 50 kilometers) 30 369 .000 40 1622 1.000 50 662 Gender Male 1441 Female 1212 Metabolic syndrome present No 2570 Yes 83 PAOG-SPSS HC2
Logistische regressieanalyse (voorbeeld - 3) Block 1: Method = Enter Omnibus Tests of Model Coefficients Chi-square df Sig. Step 1 Step 11.604 5 .041 Block Model Variables in the Equation B S.E. Wald df Sig. Exp(B) Step 1a metabolic(1) .425 .409 1.076 1 .300 1.529 Distance 5.119 2 .077 Distance(1) .473 .281 2.836 .092 1.605 Distance(2) .672 .298 5.104 .024 1.959 Gender(1) .333 .180 3.419 .064 1.395 age .000 .001 .040 .842 1.000 Constant -3.373 .293 132.616 .034 a. Variable(s) entered on step 1: metabolic, Distance, Gender, age. PAOG-SPSS HC2
Overlevingskans en overlevingscurve Verschillende methoden om overlevingscurve te schatten: Kaplan-Meier methode <analyze><survival><kaplan-meier> Actuariële of “life-tables” methode <analyze><survival><life tables> PAOG-SPSS HC2
Belangrijke termen / karakteristieken “Overleving” kan van alles zijn Sterfte (mortaliteit) Optreden ziekte (morbiditeit) Afstoting donororgaan Optreden allergische reactie tegen medicijn Overleving wordt berekend tot optreden “event” of “censurering” Censurering: incomplete follow-up ten gevolge van: bereiken afsluitdatum onderzoek sterfte tgv andere oorzaak verhuizing verwijdering uit oz op verzoek patiënt … wat dan ook… dan wordt de tijd “at-risk” meegenomen Verlies donororgaan niet ten gevolge van afstoting maar ten gevolge van een auto ongeluk (2e punt censurering) PAOG-SPSS HC2
Actuariële of life table analyse Benodigd voor berekeningen per tijdsinterval: Tijdsinterval Aantal “levend” start interval Aantal “dood” eind interval (event) Aantal “withdrawn alive” of “lost to follow-up” (uitval) Aannames: optreden event/uitval gebeurt random tijdens tijdsinterval Berekeningen: Kans op “dood”, rekening houdend met uitval 1- (kans op “dood”) Cumulatieve kans op ”niet-dood” Cumulatieve kans op “niet-dood” = 1-(kans op “dood”) in tijdsinterval 1 In tijdsinterval 2: de cumulatieve kans op “niet-dood” = de cumulatieve kans op “niet-dood” van tijdsinterval 1 * 1-(kans op “dood”) van tijdsinterval 2. PAOG-SPSS HC2
Actuariele methode versus Kaplan Meier Verschil Kaplan Meier & actuariële of “life tables”: Moment van beoordeling overleving bij optreden “event” (kaplan Meier) of per tijdseenheid (life table) Gebruik Kaplan Meier indien tijdstippen van event of censurering bekend zijn (zal nagenoeg altijd het geval zijn) Gebruik Life Tables alleen wanneer er enkel tijdsintervallen bekend zijn waarin event of censurering heeft plaatsgevonden PAOG-SPSS HC2
Benodigd voor berekeningen: Kaplan-Meier analyse Benodigd voor berekeningen: Tijdstip (dag, week) van “failure ( = event)” of censurering voor elke patiënt Berekeningen: Kans op “dood” (aantal events/aantal patiënten) 1- (kans op “dood”) Cumulatieve kans op ”niet-dood” Gekleurde tekst: anders dan in actuariële methode PAOG-SPSS HC2