Methodologie & Statistiek I Verband tussen twee variabelen 3.2

Slides:



Advertisements
Verwante presentaties
Beschrijvende en inferentiële statistiek
Advertisements

Statistische uitspraken over onbekende populatiegemiddelden
Innoveren voor gezondheid
Beschrijvende en inferentiële statistiek
Toetsen van verschillen tussen twee of meer groepen
H 29: Kostprijs bij heterogene producten
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Uitgaven aan zorg per financieringsbron / /Hoofdstuk 2 Zorg in perspectief /pagina 1.
H 27: Kostprijs bij homogene productie.
Betrouwbaarheid en validiteit: Alleen een kwestie van goed meten ?
Hoeveel weet jij over de voetbalclub
Natuurlijke Werkloosheid en de Phillipscurve
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Beschrijvende en inferentiële statistiek
Haal meer uit je Hersenen masterclass wiskunde
Demografie, human capital, en de vraag naar woningen
Nooit meer onnodig groen? Luuk Misdom, IT&T
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
toetsen voor het verband tussen variabelen met gelijk meetniveau
Hoofdstuk 8: Variantieanalyse met herhaalde metingen hoofdstuk 8
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
KINDERBIJSLAG- REGLEMENTERING praktische aspecten Jean-Paul Dauw en Geert Cnudde Informatiesessie over kinderbijslag RKW – 30 oktober 2012 De federale.
Gegevensverwerving en verwerking
Gegevensverwerving en verwerking
Meervoudige lineaire regressie
Twee-factor Variantie-analyse
Inferentie voor regressie
Inferentie voor kruistabellen
Oefeningen F-toetsen ANOVA.
Een fundamentele inleiding in de inductieve statistiek
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
Les 10 : MODULE 1 Snedekrachten
Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Hoofdstuk 9 Verbanden, correlatie en regressie
Statistiek voor Historici
Statistiek voor Historici
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
Methodologie & Statistiek I Toetsen van twee gemiddelden 6.1.
Methodologie & Statistiek I
Methodologie & Statistiek I Toetsen van proporties 7.1.
Methodologie & Statistiek I Principes van statistisch toetsen 5.1.
U kunt deze presentatie ook op uw eigen PC afspelen! Gebruikmaken van internet:  Education  Health sciences  Presentations.
Deze diapresentatie werd vervaardigd door de Capaciteitsgroep Methodologie en Statistiek. De presentatie mag alleen worden gecopieerd voor eigen gebruik.
Ministerie van de Vlaamse Gemeenschap Afdeling HRM BUE Middenkader 2005 Een eerste verkenning van de resultaten.
Inkomen les t/m 75 plus Zelftest Kennisvragen.
1 © GfK 2012 | Supermarktkengetallen | GFK SUPERMARKTKENGETALLEN ‘Hoe ontwikkelt het aantal kassabonnen zich?’ ‘Wat is de omzet van de supermarkten.
Vrouwen zijn veel meer waard !!! Sorry mannen, maar het is nu echt bewezen…
constante kosten, variabele kosten en marginale kosten
Vandaag Nabespreking toets Crediteuren/debiteuren
Standaard-bewerkingen
EFS Seminar Discriminatie van pensioen- en beleggingsfondsen
Statistiekbegrippen en hoe je ze berekent!!
H2 Lineaire Verbanden.
Hoeveelheidsaanpassing II
Hoorcollege 3 Samenhang tussen variabelen
Hoofdstuk X Het correlatievraagstuk & SPSS toepassing
Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)
Inleiding in de statistiek voor de gedragswetenschappen
Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.
Baarde en de goede Hoofdstuk 11: Data-analyse
Cursus Regressie-analyse Rijkswaterstaat, 13 februari
Statistische Valkuilen in Solvency II
Schakelstudenten begeleiden nog voor de start Lynn Van den Broeck - Doctoraatsstudent Should I stay or should I go - 26 maart 2015.
Transcript van de presentatie:

Methodologie & Statistiek I Verband tussen twee variabelen 3.2 miscellaneous

U kunt deze presentatie ook op uw eigen PC afspelen! Gebruikmaken van internet: http://www.unimaas.nl/~stat Education Health sciences Presentations of lectures “op dit moment ……. beschikbaar Opening --- Hoofdstuk 3 (Verband tussen …) Powerpointviewer downloaden”

Deze diapresentatie werd vervaardigd door Michel Janssen van de Capaciteitsgroep Methodologie en Statistiek. De presentatie mag alleen worden gecopieerd voor eigen gebruik door studenten en medewerkers van de Universiteit Limburg in Maastricht. Met eventuele op- en aanmerkingen kunt u terecht bij: Universiteit Maastricht Capaciteitsgroep M&S Michel Janssen Postbus 616 6200 MD Maastricht michel.janssen@stat.unimaas.nl

Methodologie & Statistiek I Verband tussen twee variabelen 3.2 miscellaneous 22 januari 2001

schijncorrelatie spurieuze correlatie

CIJFERS WEZEN OP EEN SIGNIFICANT POSITIEF VERBAND TUSSEN: Aantal ooievaarsnesten en aantal geboorten in een bepaalde streek over een aantal jaren Aantal jonge politie-agenten en aantal ongehuwde moeders in Londen over een aantal jaren Aantal brandweerlieden en de totale waarde van de gefikte objecten in een regio over een aantal jaren Kwaliteit handschrift en maat schoenen van 50 kinderen

gevaar van extrapolatie

In 51 regio’s werd gekeken naar het aantal ziekenhuisbedden per 1000 inwoners (=BED) en het aantal Ziekenfonds-opnamen per 1000 Inwoners (ZF_OPN). Er wordt een puntenwolk gemaakt van BED tegen ZF_OPN

De regressie-lijn wordt berekend: ZF_OPN = 37.9 + 13.1BED Hoeveel ZF_OPN mogen worden verwacht in een regio met BED = 5 ????? 103.40

De regressie-lijn wordt berekend: ZF_OPN = 37.9 + 13.1BED Hoeveel ZF_OPN mogen worden verwacht in een regio met BED = 0 ????? COMMENTAAR??? 37.9

invloed van uitbijters invloedrijke punten

steekproef & populatie

Populatie A (X en Y) steekproeven van n stuks: r, b0 en b1 ……… Kijken naar de verdeling van r (schatter van r) b0 (schatter van b0) b1 (schatter van b1)

rA > rB ? Populatie A (X en Y) steekproef: rA= 0.80 Populatie B (X en Y) steekproef: rB= 0.50 Samenhang X en Y in populatie: rA en rB ? rA > rB

rA > rB ? ? Populatie A (X en Y) steekproef: rA= 0.80 Populatie B (X en Y) steekproef: rB= 0.50 Samenhang X en Y in populatie: rA en rB ? rA > rB ? Zelfde antwoord als na= 10 en nb=10000

correlatiecoefficient hellingshoek & correlatiecoefficient

teken van b1 en r

sd(x) is altijd positief sd(y) is altijd positief Dus: ri-coeff sd-lijn is altijd POSITIEF?????

richtings-coefficient sd-lijn is positief correlatiecoefficient is negatief ri-coeff regressielijn= r * ri-coeff sd-lijn Dus: ri-coeff regressielijn is NEGATIEF ??????

Bereken r uit r2 r is positief of negatief ????

teken van correlatiecoefficient is teken van b1 !!!!! regressielijn Y= b0 + b1X teken van correlatiecoefficient is teken van b1 !!!!! bekijk altijd plaatje van de puntenwolk!

Amerikaanse verkiezingen

Scatterplot van uitgebrachte stemmen 67 kiesdistricten van Florida op Gore en Buchanan in de 67 kiesdistricten van Florida

Palmbeach…………

lezen van SPSS-uitvoer

Model Model R R Square Adjusted Std Error of the Estimate 1 0.913 0.833 0.830 23.5341 Predictors: (Constant), Gore_TH

ANOVA Model Sum of Squares df Mean Square F Sig. RegressionResidual Total 179620.0 36000.6 215620.6 1 65 66 553.9 324.31 0.000 Predictors: (Constant), Gore_TH Dependent Variable: Bush_TH

Coefficients Dependent Variable: Bush_TH Model Unstandardized Std. Error Beta t Sig. Constant Gore_TH 13.220 0.696 3.329 0.039 0.913 3.971 18.01 0.000 Dependent Variable: Bush_TH

samenhangen SPSS-uitvoer

ANOVA r2 var(y) Model Sum of Squares df Mean Square F Sig. RegressionResidual Total 179620.0 36000.6 215620.6 1 65 66 553.9 324.31 0.000 r2 var(y)

ANOVA r2 = 179620.0/215620.6= 0.83 var(y) = 215620.6/66= 3266.98 Model Sum of Squares df Mean Square F Sig. RegressionResidual Total 179620.0 36000.6 215620.6 1 65 66 553.9 324.31 0.000 r2 = 179620.0/215620.6= 0.83 var(y) = 215620.6/66= 3266.98

Voor de echte puzzelaars: Bereken uit de totale regressie-uitvoer de variantie van X

Voor de echte puzzelaars: Bereken uit de totale regressie-uitvoer de variantie van X b1= r * sd(y) / sd(x)

zie en huiver... Het leek ons interessant de scores van de eerste toets (januari) te vergelijken met de scores van de tweede toets (mei) alle eerste jaars (jaargang 1999) zie en huiver...

(listwise deletion) 6 154 139 14 Commentaar?

Eerste toets Tweede toets lager dan 5.0 groter/gelijk 5.0 gemiddelde 34 313 7.49 163 171 5.00 Correlatie-coefficient 0.30 Regressie-lijn: MS12= 2.91 + 0.27*MS11 Commentaar?