Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (2) Transparanten beschikbaar gesteld door Dr. B. Pelzer.

Slides:



Advertisements
Verwante presentaties
Beschrijvende en inferentiële statistiek
Advertisements

Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Beschrijvende en inferentiële statistiek
Toetsen van verschillen tussen twee of meer groepen
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
LEES DIT VOOR JE AAN JE PRESENTATIE BEGINT ALGEMEEN
Algoritmische problemen Onbeslisbaar / niet-berekenbaar Geen algoritme mogelijk Tegel- of domino-problemen Woordcorrespondentie-probleem Syntactisch equivalentie.
Hoofdstuk 10 Onderzoeken met SPSS en MS Excel
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Cyclische elementen in vragenlijsten
PROF. DR. F. KEUPPENS DIENSTHOOFD UROLOGIE
Datastructuren Analyse van Algoritmen en O
Presteren ijverige studenten beter? De complexe relatie tussen
Constructief ontwerpen BOUCOW1dt
Oppervlakten berekenen
Beschrijvende en inferentiële statistiek
Gezond bewegen in het groen: Teek Control!
Connector C Certificatie
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Statistiek ?! … Ronald Buyl - BISI.
Recap Tom Wenseleeers, 22 oktober 2009
Oppervlakten berekenen een mogelijke ontstaansgeschiedenis voor integralen... 6de jaar – 3 & 4u wiskunde Pedro Tytgat: Aanpassing Ronny Vrijsen.
vwo A Samenvatting Hoofdstuk 13
vwo C Samenvatting Hoofdstuk 14
Thesisseminarie 4 Resultaten Correlatie en multiple regressie
Gegevensverwerving en verwerking
Gegevensverwerving en verwerking
Chapter 9. Understanding Multivariate Techniques
Meervoudige lineaire regressie
Twee-factor Variantie-analyse
Inferentie voor regressie
Discrete stochasten Onderwerpen Stochasten (random variables)
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Hoofdstuk 9 Verbanden, correlatie en regressie
Methodologie & Statistiek I Verband tussen twee variabelen 3.2
Deze diapresentatie werd vervaardigd door de Capaciteitsgroep Methodologie en Statistiek. De presentatie mag alleen worden gecopieerd voor eigen gebruik.
ribwis1 Toegepaste wiskunde Lesweek 3
Opgave blok 3 les 9 opg 2 opdrachtenboek.  Regel 1: Hoeveel heb ik te verdelen?  Trek de twee bekende getallen van elkaar af.  Vind je het lastig om.
toetsen van waterkwaliteit
Economische impact sluiting Ford Genk Ludo Peeters en Mark Vancauteren (Universiteit Hasselt)
PAOG - SPSS cursus 26 augustus & 2 september 2013
HC2 – Statistiek in vogelvlucht
Hulp bij vertrek van werknemers
LEES DIT VOOR JE AAN JE PRESENTATIE BEGINT ALGEMEEN
10/02/2008Sem Vandekerckhove1 WAGEGAP De loonkloof analyseren aan de hand van decompositietechnieken: methodologie.
Begrippen hoofdstuk 3.
WOT statistiek Inleiding
De financiële functie: Integrale bedrijfsanalyse©
Inleiding in de statistiek voor de gedragswetenschappen
Inleiding in de statistiek. met ondersteuning van SPSS
Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)
Inleiding in de statistiek voor de gedragswetenschappen
Inleiding in de statistiek voor de gedragswetenschappen
Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.
Cursus Regressie-analyse Rijkswaterstaat, 13 februari
Inleiding in de statistiek voor de gedragswetenschappen
1 Cursus Regressie-analyse Rijkswaterstaat, 13 februari Interacties Transparanten beschikbaar gesteld door Dr. B. Pelzer.
Cursus Regressie-analyse Rijkswaterstaat, 13 februari
Overzicht Beeldverbetering 1 met histogrammen
© imec 2000 © imec 2001 MAX+PLUS II Installatieprocedure.
Regressieanalyse Naomi Kamoen.
College 9 zHoe gaat het met de afname? zData-invoer zEerste analyses.
FOKKE en SUKKE helpen bij het veldwerk. Gebruik van een statistisch pakket SPSS Opslaan en bewerken data –selecteren –wegen –hercoderen –Ontwerpen van.
Mart H. Mojet Workshop 2.2 Docentendag Netwerk Noord, 24 juni 2016 NLT Statistiek, Big Data, en MS Excel.
Prepare for analysis: 2 planfiles maken, 1 per weegfactor
Hoofdstuk 10 Onderzoeken met SPSS en MS Excel
Beschrijvende Statistiek met Grafische rekenmachine 101
Transcript van de presentatie:

Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (2) Transparanten beschikbaar gesteld door Dr. B. Pelzer

Regressie-analyse Residuen analyse, deel 2 Controleren van de 4 assumpties via Spss 1) E(e|X)=0 2) var (e|X) = σ 2 3) e ~ N (0, σ 2 ) 4) corr(e i, e j ) = 0 Durbin-Watson

Vorige les vergeleken met deze les Vorige les: residuen / afgeleide maten van AFZONDERLIJKE cases Bij N < 500 controleer outliers en influential cases via via sdresid cook's distance sresid lever Deze les: residuen van ALLE cases samen - nonlineariteit - ontbreken van belangrijke predictoren - heteroscedasticiteit 3

Mogelijke medicijnen voor zieke modellen Bij nonlineariteit: inkomen = b 0 +b 1 leeftijd + b 2 leeftijd 2 +e log(inkomen) = b 0 +b 1 leeftijd + e Bij ontbreken van belangrijke predictoren: inkomen = b 0 +b 1 leeftijd + b 2 leeftijd 2 + b 3 man +e Bij heteroscedasticiteit: i.p.v. ordinary least squares "weighted least squares" toepassen 4

Schending van "E(e|X) = 0" vaak moeilijk te zien 5 Voorbeeld 1, model Y = b 0 +b 1 X +e Schending "E(e|X)=0" makkelijk te zien X Y Voorbeeld 2, model Y = b 0 +b 1 X 1 +b 2 X 2 +e Schending "E(e|X)=0" moeilijk te zien

Controle van "E(e|X) = 0" en "var(e|X) = σ 2 " met Spss, 1 6 regression /dep y /enter x1 x2 /save sresid(sresid). compute x1klas = rnd (x1 / 0.5) * 0.5. compute x2klas = rnd (x2 / 0.5) * 0.5. means sresid by x1klas x2klas. Predictoren met veel verschillende scores eerst klassificeren! klassebreedte=0.5 x1klas mean N stddev x2klas mean N stddev output bij vb 2 dia 4

Controle van "E(e|X) = 0" en "var(e|X) = σ 2 " met Spss, 2 graph line mean (sresid) by x1klas. graph line stdev (sresid) by x1klas. graph line mean (sresid) by x2klas. graph line stdev (sresid) by x2klas. 7

regression /dep y /enter x1 x2 /save sresid(sresid) pred(pred). compute predklas = rnd (pred / 1) * 1. Controle van "E(e|X) = 0" en "var(e|X) = σ 2 " met Spss, 3 graph line mean (predklas) by x2klas. Voorspelde scores "pred" eerst klassificeren! klassebreedte=1 meanssresid by predklas. predklas mean N stdev

Controle "E(e|X) = 0" en "var(e|X) = σ 2" met Spss, samengevat Vier recepten voor berekenen gemiddelden / std.afwijkingen van SRESID 1) voor combinaties van waarden van x1, x2, x3, … means sresid by x1 by x2 by x3. - heeft geen zin bij kleine N! 2)voor alle afzonderlijke waarden van x1, x2, x3,... means sresid by x1 x2 x3. 3)voor geklassificeerde predictoren recode leeftijd (18 thru 25=1)(26 thru… of via: compute x1klas = rnd (x1 / 3) * 3.klassebreedte 3 compute x2klas = rnd (x2 / 0.5) * 0.5klassebreedte 0.5 means sresid by x1klas x2klas. 4)voor klassen van PRED (= ) compute predklas = rnd (pred /10) *10.klassebreedte 10 means sresid by predklas. 9

Vijf recepten voor maken van histogrammen van SRESID 1) voor alle combinaties van waarden van x1, x2, x3, … 2) voor alle afzonderlijke waarden van x1, x2, x3,... 3) voor klassen van x1, x2, … 4) voor klassen van PRED (= ) 5) voor alle cases samen Spss via menubalk: graphs, interactive, histogram, sresid - bij "panel variables" opgeven: x1, x1klasse, predklas - geen "panel variable" noemen: histogram voor alle cases 10 Controle van " e|X ~ N (0, σ 2 )" met Spss, samengevat

Controle van "cor (e i,e j ) = 0" met Spss Na sorteren op PRED is hier de Durbin-Watson statistic = Voeg = PRED toe aan spss-bestand regr /dep y /enter x1 x2... /save pred(pred). 2Sorteer bestand volgens PRED sort cases by pred. 3Opnieuw regr. analyse en Durbin-Watson maat opvragen regr /dep y /enter x1 x2... /residuals durbin. 0 < Durbin-Watson < 4, als 2: OK, als <1.5: NIET OK 11