Logistische regressie

Slides:



Advertisements
Verwante presentaties
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Advertisements

Statistische uitspraken over onbekende populatiegemiddelden
H3 Tweedegraads Verbanden
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Introductie tot de lineaire regressie
Math Candel Universiteit Maastricht. •Achtergrond: –Diagnose probleem –Meetinstrumenten –Conceptueel model •Presentaties van eigen analyses •Voorbeeld.
Projecties van zorgkosten voor astma, COPD en respiratoire allergie
Werkwoorden d t dt.
Math Candel Universiteit Maastricht. 1.Heldere en haalbare probleemstelling 2.Keuze van het design 3.Keuze van onderzoeks/analyse-eenheid 4.Operationalisatie.
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Obesitas De obesitasepidemie en de evolutie van het aantal bariatrische ingrepen bij MLOZ-leden Dr. Katrien Van Rie Dr. Jan Van Emelen.
Sociale relaties op school en geestelijke gezondheid
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
Vergelijkbaarheid historische studies
STAPPENPLAN GRAMMATICUS.
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek COLLEGE 3: VOOR PAUZE.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Vitamine D bij volwassen niet-westerse Nederlanders
Hoofdstuk 3: Vraag en Aanbod
DIAGNOSE Typisch probleem:
Kb.1 Ik leer op een goede manier optellen en aftrekken
Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere
Nooit meer onnodig groen? Luuk Misdom, IT&T
toetsen voor het verband tussen variabelen met gelijk meetniveau
Hoofdstuk 6: Controle structuren
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
Jong geleerd, fout gedaan?
Lineaire functies Lineaire functie
1 introductie 3'46” …………… normaal hart hond 1'41” ……..
Gegevensverwerving en verwerking
Meervoudige lineaire regressie
Inferentie voor regressie
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
Hoofdstuk 2 Samenvatting
Voorspellende analyse
Eenvoudige data-analyse: beschrijvende statistische
Populatiegemiddelden: recap
Introductie tot de overlevings analyse
Effect modificatie Algemeen principe Bepalen van effect modificatie
Bronnen van ‘fout’ Validiteit (en precisie)
Vormen van studie (ontwerp)
13 maart 2014 Bodegraven 1. 1Korinthe Want gelijk het lichaam één is en vele leden heeft, en al de leden van het lichaam, hoe vele ook, een lichaam.
1. 33 GERECHTIGHEID GODS 21 Thans is echter buiten de wet om GERECHTIGHEID GODS openbaar geworden, waarvan de wet en de profeten getuigen, 34.
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
User management voor ondernemingen en organisaties
ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B
ribwis1 Toegepaste wiskunde – Differentieren Lesweek 7
Statistiek voor Dataverwerking
havo/vwo D Samenvatting Hoofdstuk 4
Tweedegraadsfuncties
Statistiekbegrippen en hoe je ze berekent!!
H2 Lineaire Verbanden.
10/02/2008Sem Vandekerckhove1 WAGEGAP De loonkloof analyseren aan de hand van decompositietechnieken: methodologie.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 5.
Partiële r² Predictie van y gebaseerd op z alleen
Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)
Inleiding in de statistiek voor de gedragswetenschappen
13 november 2014 Bodegraven 1. 2 de vorige keer: 1Kor.15:29-34 indien er geen doden opgewekt worden...  vs 29: waarom dopen?  vs.30-32: waarom doodsgevaren.
Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.
Openbaar je talent Service public, talent particulier.
Leydi Johana Breuls “In hoeverre speelt de sociale samenstelling van een sportclub een rol in de beslissing van leden om te stoppen?“ 01 Waarom?
Diagnostische waarde van de anamnese om lumbosacrale wortelcompressie vast te stellen
ir. Luc GOLVERS Voorzitter van de Belgische Club
Eenvoudige data-analyse: beschrijvende statistische
Voorspellende analyse
Transcript van de presentatie:

Logistische regressie Recap lineaire regressie: Voorwaarden: Lineariteit: de relatie tussen Y en X is lineair (som residuen 0) Gelijke varianties: de standaardafwijking van Y is voor alle waarden van X gelijk (variantie van e constant) Normaliteit: voor elke waarde van X volgt Y een normale verdeling (e normaal) Beperkte toepasbaarheid

Logistische regressie Inleiding tot de logistische regressie: Vorm Karakteristieken Toepasbaarheid Voorbeelden

Logistische regressie Het multicausaal probleem: Multicausaliteit: ? Voorbeeld: Ziekte (Y) = coronaire hartziekte (CHD) Dichotoom: 0 = niet ziek 1 = ziek Blootstelling (X) = roken (ROK) Dichotoom: 0 = neen 1 = ja Onderzoeksvraag: Is roken geassocieerd met het optreden van coronaire hartziekte ?

Logistische regressie Het multicausaal probleem: Voor de analyse: gebruik een mathematisch model multiple regressie bij dichotome Y: gebruik een logistisch model

Logistische regressie Voorbeeld: ? Controle voor: X2 = leeftijd X3 = ras X4 = geslacht ? Onafhankelijk Afhankelijk

Logistische regressie Algemene notatie voor de onafhankelijke variabelen: Waarbij de X-en E’s, C’s of combinaties kunnen zijn. Voorbeelden:

Logistische regressie Waarom is de logistische regressie zo populair? Logistische functie:

Logistische regressie Logistisch model: Bij uitstek geschikt voor het modelleren van een probabiliteit Probabiliteit is de gemiddelde waarde van een dichotome variabele in de populatie (= individueel risico) Z = index van de combinatie van risicofactoren. drempel

Logistische regressie Het logistisch model: Om uit de logistische functie tot een logistisch model te komen wordt: We substitueren deze uitdrukking in de logistische functie:

Logistische regressie Epidemiologisch kader: We observeren op T0 bij een groep individuen de onafhankelijke variabelen X1, X2,…, Xk Voor deze individuen hebben we ook de ziektestatus bepaald (0/1) op T1 . We willen deze informatie gebruiken om de probabiliteit te schatten waarmee de ziekte in de loop van een periode (T0 - T1) voorkomt. T0 T1

Logistische regressie Definitie van het logistisch model: Korter: Ongekende parameters

Logistische regressie Toepassing van de formule aan de hand van een voorbeeld: Onderzoek naar de rol van catecholaminespiegel in het ontstaan van coronaire hartziekte, rekening houdend met leeftijd en EKG-status Y = CHD0-1 X1 = CAT0-1 X2 = LFTcontinu X3 = EKG0-1 n = 609 blanke mannen Bepaling van X1, X2, X3 op T0; Follow-up periode 9 jaar, waarin bepaling van Y

Logistische regressie logistisch model: ‘FIT’: op basis van de beschikbare gegevens worden de onbekende parameters geschat.

Logistische regressie Hoe P(X) berekenen? Stel: CAT = 1 LFT = 40 EKG = 0 Of : 11% risico (CI)

Logistische regressie Vergelijking met: CAT = 0 LFT = 40 EKG = 0 Bereken CI CIR:

Logistische regressie Logit transformatie: Hoe kunnen we de odds ratio (OR) modelleren? LOGIT vorm: waarbij en dus

Logistische regressie lineaire som Dus: waarbij

Logistische regressie Afleiding van de odds ratio (OR) formule: Algemene formule:

Logistische regressie Voorbeeld van een OR berekening: 1) CAT = 1; LFT = 40; EKG = 0 2) CAT = 0; LFT = 40; EKG = 0 X1 = (CAT = 1; LFT = 40; EKG = 0) X0 = (CAT = 0; LFT = 40; EKG = 0) Waarbij beta1 de coëfficiënt van CAT is in

Logistische regressie Algemeen: Gecorrigeerde odds ratio (OR) waarbij beta de coëfficiënt is van een dichotome (0/1) variabele Standard error en betrouwbaarheidsintervallen: cfr. statistische software

Logistische regressie Strategie bij modelbouw: Specifiëring van de variabelen Bepalen van de aanwezigheid van interactie Objectivering van verstoring Zoeken naar precisie Onderscheid modelbouw predictie Y (bvb diagnose) valide beta (bvb etiognose)

Logistische regressie Voorbeeld: astma-studie Specifiëring van de variabelen Op basis van literatuur Op basis van de eigen data Geslacht Q.38.1 Open kolen-, cokes- of houtvuur Leeftijd Q.38.2 Open gasvuur Roken nu Q.38.5 Gasboiler Roken gecumuleerde dosis Q.41.1 Voltapijt kamer Q.19 Roken moeder Q.41.2 Tapijt kamer Q.25 Moeder astma Q.42.2 Tapijt slappkamer Q.26 Moeder andere allergie Q.43 Slapen met open ramen Q.27 Vader astma Q.44 Ooit waterschade woning Q.31 Ernstige LWI < 5 jaar Q.44.1 Laatste 12 maanden waterschade Q.32.1 Leeftijd schoolbeëindiging Q.45.1 Water op de keldervloer Q.32.7 Blootstelling werk Q.46 Schimmelplekken woning Q.35 Ouderdom woning Q.47 Luchtbevochtiger Q.36 Beschrijving woning Q.37.1 Centrale verwarming Q.37.2 Warme luchtverwarming Q.37.3 Air conditioning