De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Introductie tot de lineaire regressie l Twee gemiddelden l Meer gemiddelden l Nog meer gemiddelden: l Enkelvoudige regressie en correlatie l Multiple lineaire.

Verwante presentaties


Presentatie over: "Introductie tot de lineaire regressie l Twee gemiddelden l Meer gemiddelden l Nog meer gemiddelden: l Enkelvoudige regressie en correlatie l Multiple lineaire."— Transcript van de presentatie:

1 Introductie tot de lineaire regressie l Twee gemiddelden l Meer gemiddelden l Nog meer gemiddelden: l Enkelvoudige regressie en correlatie l Multiple lineaire regressie

2 RECAP: twee gemiddelden: t-test

3

4

5 RECAP: meerdere gemiddelden: variantie analyse (AN O VA)

6

7

8 l Inleiding Doel: bestuderen van de relatie tussen twee continue variabelen X en Y statistisch verband: associatie (# causaal verband); positief vs negatief wanneer het doel is te weten of twee variabelen geassocieerd zijn: correlatie onderzoek wanneer het doel is de ene variabele uit de andere te voorspellen: regressie onderzoek Introductie tot de lineaire regressie

9 l Correlatie-onderzoek Introductie tot de lineaire regressie Stap 1: spreidingsdiagramma (scatterplot) Zijn DNA-index en proliferatieindex geassocieerd?

10 l Correlatie-onderzoek Introductie tot de lineaire regressie nummersystolische bloeddrukdiastolische bloeddruklichaamsgewicht Gemiddelde Stand. Dev

11 l Correlatie-onderzoek Introductie tot de lineaire regressie

12 l Correlatie-onderzoek Introductie tot de lineaire regressie

13 l Correlatie-onderzoek Introductie tot de lineaire regressie Stap 2: berekenen van een correlatiecoëfficiënt Pearson Spearman Kendall Waarde: -1 tot en +1 geven perfect verband aan Meest gebruikt: Pearson (productmoment-correlatiecoëfficiënt), r Toets en betrouwbaarheidsinterval Populatie correlatiecoëfficiënt:

14 l Pearson productmoment-correlatiecoëfficiënt Introductie tot de lineaire regressie

15 l Correlatie-onderzoek Introductie tot de lineaire regressie

16 l Pearson productmoment-correlatiecoëfficiënt Introductie tot de lineaire regressie

17 l Pearson productmoment-correlatiecoëfficiënt Introductie tot de lineaire regressie Deel teller en noemer door n-1, dan is waarin S X en S Y de steekproefstandaardafwijkingen zijn van X en Y en S XY is de zgn steekproefcovariantie van X en Y

18 l Covariantie: gevoelig voor mate van associatie Introductie tot de lineaire regressie Gemiddelde pols Gemiddelde leeftijd

19 Introductie tot de lineaire regressie l Covariantie: gevoelig voor mate van associatie

20 l Pearson productmoment-correlatiecoëfficiënt Introductie tot de lineaire regressie Test: Nul hypothese: correlatiecoëfficiënt is 0 Betrouwbaarheidsinterval

21 l Correlatiematrix Introductie tot de lineaire regressie

22 l Correlatiematrix Introductie tot de lineaire regressie

23 l Drie-dimensioneel: Introductie tot de lineaire regressie

24 l Correlatie-onderzoek Introductie tot de lineaire regressie

25 l Correlatie-onderzoek Introductie tot de lineaire regressie

26 l Correlatie-onderzoek Introductie tot de lineaire regressie

27 l Correlatie-onderzoek Introductie tot de lineaire regressie Contraindicaties, voorwaarden X en Y: bivariate normaalverdeling Lineariteit Uitbijters

28 l Correlatie-onderzoek Introductie tot de lineaire regressie Voorwaarden niet voldaan Niet parametrische equivalent: SPEARMAN Correlatiecoëfficiënt

29 l Enkelvoudige lineaire regressie (simple linear regression) Introductie tot de lineaire regressie X en Y: spelen verschillende rol Y (afhankelijke variabele) wordt verklaard door X (onafhankelijke variabele) X-en moeten geen aselecte steekproef zijn Er mag evenwel niet geselecteerd worden voor Y. Eerste stap: spreidingsdiagramma Y heeft voor elke waarde van X een kansverdeling met als gemiddelde µ(x) Doel regressie-analyse: het maken van een schatting van µ(x) voor elke waarde van x µ(x) = alfa + beta.x alfa en beta worden geschat (a en b).

30 l Enkelvoudige lineaire regressie Introductie tot de lineaire regressie Stap 1: spreidingsdiagramma (scatterplot)

31 l Enkelvoudige lineaire regressie Introductie tot de lineaire regressie

32 l Enkelvoudige lineaire regressie Introductie tot de lineaire regressie Voor elke observatie is Y e (het residu) verwijderd van de verwachte waarde eiei

33 l Enkelvoudige lineaire regressie Introductie tot de lineaire regressie Verwachte waarde van residu (e) = 0 Criterium: ‘kleinste kwadratencriterium’ (least squares) d.w.z. dat de som van de gekwadrateerde geschatte residuen minimaal is: Berekening van de richtingscoëfficient wordt dan: (de covariantie tussen X en Y gedeelt door de steekproefvariantie van X)

34 l Enkelvoudige lineaire regressie Introductie tot de lineaire regressie

35 l Enkelvoudige lineaire regressie Introductie tot de lineaire regressie

36 l Enkelvoudige lineaire regressie Introductie tot de lineaire regressie

37 l Relatie correlatie & lineaire regressie Introductie tot de lineaire regressie Als r nul is, is ook b nul

38 l Verklaarde variantie Introductie tot de lineaire regressie Hoe goed men Y kan voorspellen op basis van gemiddelde: hangt af van variabiliteit Bij gebruik X hangt de variabiliteit af van de variabiliteit van Y voor een gegeven waarde van X r² kan geïnterpreteerd worden als de relatieve reductie van de variabiliteit van Y door gebruik te maken van de regressie van Y op X r² x 100% is het percentage door X ‘verklaarde variantie’

39 l Enkelvoudige lineaire regressie Introductie tot de lineaire regressie

40 l Enkelvoudige lineaire regressie Introductie tot de lineaire regressie Voorwaarden: Lineariteit: de relatie tussen Y en X is lineair (som residuen 0) Gelijke varianties: de standaardafwijking van Y is voor alle waarden van X gelijk (variantie van e constant) Normaliteit: voor elke waarde van X volgt Y een normale verdeling (e normaal) Evaluatie: op basis van spreidingsdiagramma op basis van residuenplot

41 Multiple lineaire regressie l Inleiding: multiple regressie Meerdere onafhankelijke variabelen: Multiple of multivariate regressie ? Voorspellen Y of wegwerken verstoring ? Typeverdeling YRegressiemodel normaalmultiple lineaire regressie dichotoommultiple logistische regressie PoissonPoisson regressie overlevingsduurgegevensCox proportionele hazard regressie

42 Multiple lineaire regressie l Multiple lineaire regressie Veronderstelling: Y normaal verdeeld met gemiddelde: Verdeling X-en: geen eisen aselect, select, gestratificeerd… Y is wel aselect getrokken gegeven de waarden van de verschillende X-en Regressiecoëfficiënten: gemiddelde toename van Y bij de toename van één eenheid X. geeft de invloed van X weer, gecorrigeerd voor de andere X-en.

43 Multiple lineaire regressie l Multiple lineaire regressie Alternatieve formulering: waarbij e een normaal verdeling volgt met als gemiddelde 0 en onbekende standaardafwijking sigma, die niet van de X i ’s afhangt. De regressiecoëfficiënten worden opnieuw geschat door gebruik te maken van het kleinste kwadratencriterium moet minimaal zijn. Schattingen (+ se (p-waarde) en betrouwbaarheidsintervallen): computerprogramma nodig

44 Multiple lineaire regressie l Voorbeeld Medisch onderzoeker heeft in een ontwikkelingsland uit enkele plattelandsdorpen 31 mensen willekeurig geselecteerd. Bij hen werd de systolische bloeddruk, het lichaamsgewicht, de leeftijd en de polsfrequentie gemeten. Aan de hand van een multiple regrssie wordt nagegaan hoe de systolische bloeddruk afhangt van gewicht, leeftijd en polsslag. afhankelijke variabele : Y (systolische bloeddruk in mm Hg) onafhankelijke variabelen :X 1 (gewicht in kg) X 2 (leeftijd in jaren) X 3 (polsfrequentie in slagen/minuut)

45 Multiple lineaire regressie l Analyse: –Eerst enkelvoudige regressies –Onderlinge correlaties tussen X-en? –Multiple lineaire regressie »Schatten van de intercept en van de regressiecoëfficiënten l kleinste kwadratencriterium l computerprogramma nodig l standaardfouten voor de coëfficiënten en p-waarde voor toetsing nul- hypothese (regressiecoëfficiënt = 0) »Interpretatie l cave: causaliteit?

46 Multiple lineaire regressie l Voorbeeld

47 Multiple lineaire regressie l Voorbeeld

48 Multiple lineaire regressie l Voorbeeld

49 Multiple lineaire regressie l Voorbeeld

50 Multiple lineaire regressie l Voorbeeld

51 Multiple lineaire regressie l Voorbeeld

52 Multiple lineaire regressie l Analyse: –Variantieanalyse tabel »afwijking y i t.o.v. gemiddelde y is de regressiecomponent + de residuele component »kwadratensommen »F-toets »R²

53 Multiple lineaire regressie l Voorbeeld

54 Prevalentie als een functie van het diagnostisch profiel Prev= (koorts) (inspectie) multiple lineaire regressie Voorbeeld: diagnose van streptococcen keelontsteking gebaseerd op klinische bevindingen Multiple lineaire regressie

55 Prevalentie als een functie van het diagnostisch profiel Prev= (koorts) (inspectie) (inspectie)(koorts) Voorbeeld: diagnose van streptococcen keelontsteking gebaseerd op klinische bevindingen interactieterm Multiple lineaire regressie

56 l Voorbeeld

57 Multiple lineaire regressie l Voorbeeld


Download ppt "Introductie tot de lineaire regressie l Twee gemiddelden l Meer gemiddelden l Nog meer gemiddelden: l Enkelvoudige regressie en correlatie l Multiple lineaire."

Verwante presentaties


Ads door Google