Methodologie & Statistiek I Verband tussen twee variabelen 3.1.

Slides:



Advertisements
Verwante presentaties
Beschrijvende en inferentiële statistiek
Advertisements

Statistische uitspraken over onbekende populatiegemiddelden
H3 Tweedegraads Verbanden
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Gelijkmatige toename en afname
havo B Samenvatting Hoofdstuk 6
dy dx De afgeleide is de snelheid waarmee y verandert voor x = xA
vwo B Samenvatting Hoofdstuk 3
Natuurlijke Werkloosheid en de Phillipscurve
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Beschrijvende en inferentiële statistiek
Tabellen Metingen schrijf je meestal op in een tabel
Kenmerken Veel aanbieders Vrije toe- en uitreding Homogene goederen
Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere
vwo A/C Samenvatting Hoofdstuk 2
Project D2: Kempenland Sander Verkerk Christian Vleugels
vwo C Samenvatting Hoofdstuk 13
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
toetsen voor het verband tussen variabelen met gelijk meetniveau
Statistiek ?! … Ronald Buyl - BISI.
vwo B Samenvatting Hoofdstuk 1
vwo A Samenvatting Hoofdstuk 12
vwo A Samenvatting Hoofdstuk 16
vwo A Samenvatting Hoofdstuk 14
De grafiek van een lineair verband is ALTIJD een rechte lijn.
Lineaire vergelijkingen
Gegevensverwerving en verwerking
Meervoudige lineaire regressie
Inferentie voor regressie
1212 /n Metingen aan de hoogte van een toren  D  wordt gemeten met onzekerheid S  =0.1 o. Vraag 1: Op welke afstand D moet je gaan staan om H zo nauwkeurig.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Haal meer uit je Hersenen masterclass wiskunde
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Hoofdstuk 9 Verbanden, correlatie en regressie
Voorspellende analyse
variabelen vaststellen
Statistiek voor Historici
Aanvullende vragen Collegesheets M&S3
Methodologie & Statistiek I Verband tussen twee variabelen 3.2
Methodologie & Statistiek I Toetsen van twee gemiddelden 6.1.
Methodologie & Statistiek I
Methodologie & Statistiek I Toetsen van proporties 7.1.
Methodologie & Statistiek I Principes van statistisch toetsen 5.1.
U kunt deze presentatie ook op uw eigen PC afspelen! Gebruikmaken van internet:  Education  Health sciences  Presentations.
Deze diapresentatie werd vervaardigd door de Capaciteitsgroep Methodologie en Statistiek. De presentatie mag alleen worden gecopieerd voor eigen gebruik.
havo A Samenvatting Hoofdstuk 3
Tweedegraadsfuncties
havo B 5.1 Stelsels vergelijkingen
Lineaire formules Voorbeelden “non”-voorbeelden.
H2 Lineaire Verbanden.
havo B Samenvatting Hoofdstuk 1
Hoorcollege 3 Samenhang tussen variabelen
Hoofdstuk X Het correlatievraagstuk & SPSS toepassing
Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)
Verbanden JTC’07.
Inleiding in de statistiek voor de gedragswetenschappen
Regels voor het vermenigvuldigen
Baarde en de goede Hoofdstuk 11: Data-analyse
Regressie-analyse Casus:
De richtingscoëfficient. X neemt toe met 4.
Grafische vergelijking meetmethoden
Hoofdstuk 3 Lineaire formules en vergelijkingen
Wat zegt een steekproef?
Grafiek van lineaire formule
3 vmbo-KGT Samenvatting Hoofdstuk 6
De grafiek van een lineair verband is ALTIJD een rechte lijn.
havo B Samenvatting Hoofdstuk 1
Voorspellende analyse
Transcript van de presentatie:

Methodologie & Statistiek I Verband tussen twee variabelen 3.1

U kunt deze presentatie ook op uw eigen PC afspelen! Gebruikmaken van internet: http://www.stat.unimaas.nl Education Health sciences Presentations of lectures “op dit moment ……. beschikbaar Opening --- Hoofdstuk 3 (Verband tussen …) Powerpointviewer downloaden”

Deze diapresentatie werd vervaardigd door Michel Janssen van de Capaciteitsgroep Methodologie en Statistiek. De presentatie mag alleen worden gecopieerd voor eigen gebruik door studenten en medewerkers van de Universiteit Limburg in Maastricht. Met eventuele op- en aanmerkingen kunt u terecht bij: Universiteit Maastricht Capaciteitsgroep M&S Michel Janssen Postbus 616 6200 MD Maastricht michel.janssen@stat.unimaas.nl

Methodologie & Statistiek I Verband tussen twee variabelen 3.1 22 oktober 2001

Aan elk element van de steekproef nog steeds beschrijvende statistiek……. Tot nu toe: Telkens EEN variabele bekeken en beschreven Nu: Twee variabelen tegelijk beschrijven Aan elk element van de steekproef TWEE grootheden meten Niet alleen gemiddelde, standaarddeviatie, etc van elke variabele apart, maar……..

correlatie: sterkte van de samenhang Kijken naar een interessant nieuw aspect: de samenhang tussen de twee variabelen correlatie: sterkte van de samenhang (rechtlijnig) verband beschrijven

sterker verband zwakker

sterkte van de samenhang covariantie correlatiecoefficient

covariantie 2 variabelen X en Y ? Iets bekends aan deze formule

covariantie 2 variabelen X en Y zie formule voor variantie

4 punten dragen positief bij aan de covariantie

2 punten dragen positief bij; negatief bij

covariantie 2 variabelen X en Y ? nadeel van deze maat

covariantie 2 variabelen X en Y covariantie is gevoelig voor de schaal

correlatiecoefficient nadeel wegwerken……. correlatiecoefficient covariantie van de gestandaardiseerde grootheden

correlatiecoefficient perfecte samenhang als Y=X: waarde van r? perfecte samenhang als Y=-X: waarde van r?

correlatiecoefficient perfecte samenhang als Y=X: waarde van r? perfecte samenhang als Y=-X: waarde van r? dus: r tussen –1 en +1 (inclusief)

Samengevat: correlatiecoefficient …… + is dimensieloos + verandert niet bij lineaire transformatie van X en/of Y + ligt tussen –1 en +1 (inclusief) + is een maat voor LINEAIRE samenhang

zoeken naar rechte lijn die het beste past bij de puntenwolk rechte lijn: Y= aX + b

zoeken naar rechte lijn die het beste past bij de puntenwolk rechte lijn: Y= aX + b

twee lijnen komen in aanmerking…… sd-lijn regressielijn beide rechte lijnen gaan door het zwaartepunt van de puntenwolk. dus door

een rechte lijn is bepaald als……. twee punten bekend zijn of een punt plus de richtingscoefficient bekend zijn

de sd-lijn als de x-waarde k*sd(X) boven X-gemiddeld dan de y-waarde k*sd(Y) boven Y-gemiddeld een punt plus de richtingscoefficient zijn bekend punt: richtingscoefficient: sd(Y)/sd(X)

?

? !

sX en sY zijn ongeveer gelijk

de regressie-lijn een lijn die, in tegenstelling tot de sd-lijn, wel rekening houdt met de sterkte van de samenhang tussen de variabelen richtingscoefficient: r*sd(Y)/sd(X) een punt plus de richtingscoefficient zijn bekend punt:

?

?

? !

SPSS-uitvoer (deel)

Gegeven: Puntenwolk en de gemiddelden van X en Y Vraag: Wat is de beste schatter van de waarde van Y die behoort bij X= 35??

Gegeven: Puntenwolk en de gemiddelden van X en Y Vraag: Wat is de beste schatter van de waarde van Y die behoort bij X= 35?? nu: Gegeven: Puntenwolk, de gemiddelden van X en Y en de regressielijn Y= 5+0.5X Vraag: Wat is nu de beste schatter van de waarde van Y die behoort bij X= 35??

Blijkbaar wordt een deel van de waarde van Y bepaald door de waarde van X Een deel van de variaties in Y wordt bepaald door de variaties in X Een deel van de variantie van Y wordt bepaald door variaties in X i.p.v. variantie praten over KWADRAATSOM

Kwadraatsom van Y = SS(Y) = SS(Totaal) Kwadraatsom residuen= SS(residu)= SS(error) SS(Y)= SS(residu) + SS(????) SS(Y)= SS(residu) + SS(regressie)

SS(Y)= SS(residu) + SS(regressie) SS(regressie) : SS(totaal) = het deel van SS(totaal) dat wordt toegeschreven aan de samenhang. maximaal 1, minimaal 0 sterkte van de samenhang vergelijk r

SPSS-uitvoer (deel)

SPSS-uitvoer (ander deel)

Met de volgende opdracht kunt u de behandelde stof nog eens herhalen: Gegeven zijn 3 puntenparen (X,Y): 1,2 3,1 en 5,3 Teken de puntenwolk Is sprake van positief of negatief verband? Bereken de gemiddelden van X en Y Bereken de standaarddeviaties van X en Y Bereken de covariantie (X,Y) Bereken de correlatiecoefficient (X,Y) Sd-lijn: Bereken de richtingscoefficient Bereken de formule van de lijn Teken de lijn Regressielijn: Dezelfde opdrachten als bij 7. Bereken SS(Y) m.b.v. de variantie(Y) Completeer nevenstaande tabel Bereken SS(Yhat)= SS(Regressie) Bereken SS(residu)= SS(error) Bereken r m.b.v. SS(Totaal) en SS(regressie) Vergelijk de uitkomsten van 6. en 13. Gebruik waar mogelijk SPSS om de resultaten te controleren X Y Yhat Residu 1 2 3 1 5 3

succes !