Correlatietoetsen Toetsen op afhankelijkheid tussen variabelen waarvan minimaal een van de twee niet ordinaal is: afhankelijkheidstabellen. Vb. afhankelijkheid.

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Bij een herhaald experiment, met telkens dezelfde kans op succes gebruiken we de binomiale kansverdeling Een binomiale kansverdeling wordt gekenmerkt door.
HC2MFE Meten van verschillen
Gelijkmatige toename en afname
Inleiding tot inferentie
vwo A/C Samenvatting Hoofdstuk 6
Een manier om problemen aan te pakken
Statistiek HC1MBR Statistiek.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
havo A Samenvatting Hoofdstuk 11
Beschrijvende en inferentiële statistiek
Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere
P-waarde versus betrouwbaarheidsinterval
vwo A/C Samenvatting Hoofdstuk 2
Verslaglegging Wat hebben we geleerd.
toetsen voor het verband tussen variabelen met gelijk meetniveau
vwo A Samenvatting Hoofdstuk11
vwo A Samenvatting Hoofdstuk 13
vwo A Samenvatting Hoofdstuk 15
vwo C Samenvatting Hoofdstuk 14
De grafiek van een lineair verband is ALTIJD een rechte lijn.
Gegevensverwerving en verwerking
Non-parametrische technieken
Meervoudige lineaire regressie
Inferentie voor regressie
Inferentie voor kruistabellen
P-waarde Wat is een p-waarde? De kans dat de toetsings-grootheid een extremere uitkomst (overeenkomstig met de alternatieve hypothese) geeft dan de waar-genomen.
Afhankelijkheidstabellen
Schatter voor covariantie
Eenzijdige Betrouwbaarheidsgrens
Discrete stochasten Onderwerpen Stochasten (random variables)
Continue kansverdelingen
Exponentiële Verdeling
Deze les wordt verzorgd door de Kansrekening en statistiekgroep Faculteit W&I TU/e.
Beslisbomen Robert de Hoog College Beslissingsondersteuning 26 september 2002.
Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Hoofdstuk 9 Verbanden, correlatie en regressie
Voorspellende analyse
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
variabelen vaststellen
Populatiegemiddelden: recap
Statistiek voor Historici
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
Methodologie & Statistiek I Toetsen van twee gemiddelden 6.1.
Methodologie & Statistiek I Toetsen van proporties 7.1.
Methodologie & Statistiek I Principes van statistisch toetsen 5.1.
Statistiek voor Dataverwerking
havo A Samenvatting Hoofdstuk 3
havo/vwo D Samenvatting Hoofdstuk 4
Tweedegraadsfuncties
havo B 5.1 Stelsels vergelijkingen
1 van 8 Bernoulli-stochasten & Binomiale stochasten © CI 2003.
Hoofdstuk 5 – Verzameling en functie
De steekproefuitkomsten generaliseren naar de populatie
havo B Samenvatting Hoofdstuk 1
Vergelijkingen oplossen
Hoorcollege 3 Samenhang tussen variabelen
Verbanden JTC’07.
Baarde en de goede Hoofdstuk 11: Data-analyse
Wat zegt een steekproef?
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
De grafiek van een lineair verband is ALTIJD een rechte lijn.
3 vmbo-KGT Samenvatting Hoofdstuk 10
havo B Samenvatting Hoofdstuk 1
De omvang van een steekproef bepalen
Toetsen van verschillen tussen twee of meer groepen
Voorspellende analyse
Transcript van de presentatie:

Correlatietoetsen Toetsen op afhankelijkheid tussen variabelen waarvan minimaal een van de twee niet ordinaal is: afhankelijkheidstabellen. Vb. afhankelijkheid tussen ‘succeskans ope-ratie’ en ‘chirurg’. Toetsen op correlatie tussen ordinale variabelen: toets mbv steekproefcorrelatieco-efficiënt of Spearman correlatietoets. Vb.1 Verband tussen leeftijd (niet stochas-tisch!) en bloeddruk. Vb.2 Verband tussen levensduur van familieleden (gem. kinderen vs gem. ouders)

Lineaire correlatie Twee stochasten: X en Y (bijv. lengte en gewicht). Aanname: Y en X zijn bivariaat normaal verdeeld met correlatiecoëfficiënt  H0:  = 0 vs. H1:   0. De steekproefcorrelatiecoëfficiënt is een schatter voor  (zie week 4): Deze vormt de basis van de toetsingsgroot-heid (Stat. Comp., pag. 29):

Lineaire correlatie Verwerp H0 als de realisatie van genaamd tn-2, groter is dan t/2,n-2 of kleiner dan - t/2,n-2. De toets kan ook gebruikt worden als een van de variabelen niet stochastisch is (bijv. ‘tijd’). Dan aanname: Y = ax + b + , met : een normaal verdeelde fout. Lineair model. Hypotheses: H0: a = 0 en H1: a  0. De steekproefcorrelatiecoëfficiënt R wordt dan berekend met dezelfde formule en de tgh is ook hetzelfde.

Rangcorrelatie Wat als verband nirt-lineair is? Of geen normaliteit? We willen in meer algemene zin kunnen toetsen op correlatie. Ook nu biedt een verdelingsvrije toets een uitweg: de Spearman rangcorrelatie toets. Vb. Verband tussen sterkte en microscopi-sche eigenschap van materiaal: # verontrei-nigingen per mm3.

Rangcorrelatie Verband in ieder geval niet lineair. Stap 1: toekennen van rangen per variabele.

Rangcorrelatie Stap 2: som van kwadraten van verschil tussen rangen: Stap 3: bereken de Spearman correlatie-coëfficiënt: Hier rS = 0.66. Stap 4: Vergelijk rS met kritieke waarde uit tabel 10.22 Stat. Compendium.

Rangcorrelatie Hier rS = 0.66. Stap 4: Vergelijk rS met kritieke waarde uit tabel 10.22 Stat. Compendium. Hier toetsen we tweezijdig bij  = 0.05. Rechterkritieke waarde is gelijk aan 0.56. Linkerkritieke waarde is gelijk aan –0.56. rS = 0.66 > 0.56 dus H0: ‘geen rangcorrelatie’ verwerpen. Er geldt: -1  rS  1. Dus, rS ook een schatter van de correlatiecoëfficiënt. Kritieke waarden alleen in tabel voor n  15. Voor grotere steekproeven: bij benadering tn –2 verdeeld is.

Samenvatting Biostatistiek Week 1 t/m 4: Kansrekening Week 5 t/m 9: Statistiek Nadruk op begrip, niet op het kennen van formules. In principe zullen alle formules, behalve de zeer basale, gegeven worden of in het Stat. Comp. staan. Belangrijkste van alles: wanneer heb ik wat nodig en hoe werkt het?

Week 1 Begrippen als gebeurtenis, uitkomsten-ruimte, stochast, kans Basis kansrekening: rekenen met doorsnede (‘A  B’) en vereniging (‘A B’, en/of) Disjunct (‘mutually exclusive’) en onafhankelijk ‘1-’ regel mbv complement. Totale kansregel Voorwaardelijke kans Stelling van Bayes

Week 2 Discrete stochasten Begrippen: kansdichtheidsfunctie f, cumualtieve verdelingsfunctie, F, verwach-ting en variantie Kansverdelingen: Poisson, Bernoulli, Binomiaal, Uniform Wat betekenen deze verdelingen en wanneer gebruik je ze? Combineren stof week 1 en 2.

Week 3 Continue kansverdelingen Rekenen met varianties en verwachtings-waarden Verschillende verdelingen ihb Normale Verdeling Belang van normale verdeling: centrale limiet stelling Normaal als benadering voor binomiaal en Poisson Exponentiële verdeling en verband met de Poisson verdeling

Week 4 Simultane kansdichtheden Marginale kansdichtheid Wat betekent onafhankelijkheid? Associatie tussen kwantitatieve variabelen (covariantie, correlatie) Bivariaat normaal Plotjes van data: normal probability plot, Box-and-Whisker plot, Histogram Schatters, eigenschappen: (on)zuiverheid, variantie van een schatter. Verschillende schatters

Week 5 Betrouwbaarheidsintervallen: wat betekenen ze? Eenzijdige betrouwbaarheidsgrens: wat betekenen het? Geldt altijd voor een populatieparameter zoals ,, p. Wanneer gebruik je welk interval? Wat gebeurt er met de breedte van het b.i. als  afneemt? steekproefomvang n toeneemt?

Week 6 Eenzijdige betrouwbaarheidsgrens berekenen mbv formule tweezijdige. Steekproefgroottebepaling om nauwkeurig-heid (breedte b.i.) te garanderen Toetsen: stappenplan. Wanneer welke toets? Hypothese opstellen: eenzijdig / tweezijdig Wat betekent verwerpen / niet-verwerpen H0 Connectie b.i.-en toetsen

Week 7 Interpretatie computeroutput kan getentamineerd worden. Begrijp p-waarden. Van tweezijdig naar eenzijdig. Type I fout:  en type II fout . Onderscheidingsvermogen: 1- . Power-curves: Statgraphics uitvoer. Steekproefgroottebepaling: OC-curves. Variantie bekend of niet? Specificatie is vaak: 1-  moet gelijk zijn aan 0.9 (o.i.d.), curves werken juist met  langs de Y-as, dus zoek op bij 0.10. Formules voor ‘d’ (OC-curves) hoef je niet te kennen. Aanpassingstoets: parameter schatten, verwachte frequenties berekenen, < 3: klas-ses samenvoegen, vrijheidsgraden

Week 8 Afhankelijkheidstabellen: verband tussen twee variabelen waarvan er minimaal één nominaal (dwz geen logische ordening) is. Belangrijkste: begrijp hoe je verwachte frequenties kunt berekenen uit de rij- en kolomtotalen. Verdelingsvrije toetsen: Wilcoxon rangsom toets (ongepaarde data) en Wilcoxon rangtekentoets (gepaard of één steekproef) Rangsom: som van rangen kleinste steekproef Rangtekentoets: som van rangen behorend bij positieve (verschil)waarnemingen Tabellen geven tweezijdige kritieke waarden

Week 9 Toetsen op correlatie tussen ordinale variabelen Lineair verband en normale verdelingen: toets mbv steekproefcorrelatiecoëfficiënt Normale verdeling kan niet worden aangenomen of lineair verband is niet te verwachten (maar verband is wel monotoon): Spearman rangcorrelatie toets. Controle: maak een plaatje waarbij je de variabelen tegen elkaar uitzet. Hieraan kun je vaak al redelijk zien of een lineair verband redelijk is of niet.

Tentamentips Maak veel opgaven. Extra opgaven en oude tentamenopgaven zijn van het juiste niveau. Maak de opgaven mbv het Stat. Comp. Laat het boek links liggen. Grijp niet te snel naar de uitwerkingen Zorg ervoor dat je ook de tabellen uit het Stat. Comp. goed begrijpt. Structureer je aanpak. Geef duidelijk aan welke stochast behoort bij de omschrijving in de opgave. Bijv. X = lengte, Y = gemiddelde hartslag, T = t-toetsingsgrootheid. De waarde van zo’n stochast geef je weer met een kleine letter.

Tentamentips Formuleer kort en bondig. Geen lange verhalen. Rekenmachine: schrijf op welke formule je hebt gebruikt. Zo kun je bij verkeerd ‘invoeren’ toch punten krijgen. Geef geen dubbele antwoorden op het tentamen. Zeer belangrijk: controleer je eigen ant-woord! Kans altijd tussen 0 en 1, variantie/sd moet altijd positief zijn, etc. Schrijf het er evt. bij wanneer je beseft dat je antwoord niet (kan) kloppen, bijv. door rekenfout.