Methodologie & Statistiek I Toetsen van twee gemiddelden 6.1.

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

KWALITEITSZORG november 2012
Stilstaan bij parkeren Dat houdt ons in beweging
‘SMS’ Studeren met Succes deel 1
HC2MFE Meten van verschillen
Toetsen van verschillen tussen twee of meer groepen
Paulus' eerste brief aan Korinthe (20) 23 januari 2013 Bodegraven.
NEDERLANDS WOORD BEELD IN & IN Klik met de muis
WAAROM? Onderzoek naar het meest geschikte traject voor de verlenging tot in Sint-Niklaas van het bestaande fietspad naast de Stekense Vaart en de Molenbeek.
1 Resultaten marktonderzoek RPM Zeist, 16 januari 2002 Door: Olga van Veenendaal, medew. Rothkrans Projectmanagement.
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Uitgaven aan zorg per financieringsbron / /Hoofdstuk 2 Zorg in perspectief /pagina 1.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
7 april 2013 Zoetermeer 1. 1Korinthe Maar, zal iemand zeggen, hoe worden de doden opgewekt? En met wat voor lichaam komen zij? 2.
STAPPENPLAN GRAMMATICUS.
Ronde (Sport & Spel) Quiz Night !
Een Concert van het Nederlands Philharmonisch Orkest LES 4 1.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Kb.1 Ik leer op een goede manier optellen en aftrekken
9 januari 2013 Bodegraven 1. 1Korinthe 11 1 Wordt mijn navolgers, gelijk ook ik Christus navolg. 2.
Nooit meer onnodig groen? Luuk Misdom, IT&T
BZ voor de Klas 3 juni 2010.
toetsen voor het verband tussen variabelen met gelijk meetniveau
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
Elke 7 seconden een nieuw getal
vwo A Samenvatting Hoofdstuk 15
Regelmaat in getallen … … …
Hypothese toetsen We hebben de volgende situatie.
Regelmaat in getallen (1).
1 het type x² = getal 2 ontbinden in factoren 3 de abc-formule
1 introductie 3'46” …………… normaal hart hond 1'41” ……..
Oefeningen F-toetsen ANOVA.
Afhankelijkheidstabellen
Schatter voor covariantie
Eenzijdige Betrouwbaarheidsgrens
1. 2 De ontwikkeling van creatieve concepten t.b.v. mediacampagnes. Peter van Kessel Creatief Directeur, Headland Interactive.
Een fundamentele inleiding in de inductieve statistiek
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
Populatiegemiddelden: recap
13 maart 2014 Bodegraven 1. 1Korinthe Want gelijk het lichaam één is en vele leden heeft, en al de leden van het lichaam, hoe vele ook, een lichaam.
Pasen & Pinksteren op één dag!
1. 33 GERECHTIGHEID GODS 21 Thans is echter buiten de wet om GERECHTIGHEID GODS openbaar geworden, waarvan de wet en de profeten getuigen, 34.
Methodologie & Statistiek I Verband tussen twee variabelen 3.2
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
Methodologie & Statistiek I
Methodologie & Statistiek I Toetsen van proporties 7.1.
Methodologie & Statistiek I Principes van statistisch toetsen 5.1.
Deze diapresentatie werd vervaardigd door de Capaciteitsgroep Methodologie en Statistiek. De presentatie mag alleen worden gecopieerd voor eigen gebruik.
Seminarie 1: Pythagoreïsche drietallen
Afrika: Topo nakijken en leren.
Construeren van een Tennishal Vergeet-mij-nietjes. Week 13
ribwis1 Toegepaste wiskunde Lesweek 2
ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B
ribwis1 Toegepaste wiskunde – Differentieren Lesweek 7
ribWBK11t Toegepaste wiskunde Lesweek 02
Statistiekbegrippen en hoe je ze berekent!!
Hartelijk welkom bij de Nederlandse Bridge Academie Hoofdstuk 9 Het eerste bijbod 1Contract 1, hoofdstuk 9.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 5.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 3.
De financiële functie: Integrale bedrijfsanalyse©
Waar gaat het nou toch om?!
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
12 sept 2013 Bodegraven 1. 2  vooraf lezen: 1Kor.7:12 t/m 24  indeling 1Korinthe 7  1 t/m 9: over het huwelijk  10 t/m 16: over echtscheiding  16.
13 november 2014 Bodegraven 1. 2 de vorige keer: 1Kor.15:29-34 indien er geen doden opgewekt worden...  vs 29: waarom dopen?  vs.30-32: waarom doodsgevaren.
Baarde en de goede Hoofdstuk 11: Data-analyse
23 mei 2013 Bodegraven vanaf hoofdstuk 6: hoofdst.1: de wijsheid van de wereld hoofdst.2: de wijsheid van God hoofdst.3: Gods akker en Gods bouwwerk.
Transcript van de presentatie:

Methodologie & Statistiek I Toetsen van twee gemiddelden 6.1

U kunt deze presentatie ook op uw eigen PC afspelen! Gebruikmaken van internet: http://www.stateduc.unimaas.nl Education Health sciences Presentations of lectures “op dit moment ……. beschikbaar Opening --- Hoofdstuk 5 (Principes van …) Powerpointviewer downloaden”

Deze diapresentatie werd vervaardigd door Tjaart Imbos & Michel Janssen van de Capaciteitsgroep Methodologie en Statistiek. De presentatie mag alleen worden gecopieerd voor eigen gebruik door studenten en medewerkers van de Universiteit Limburg in Maastricht. Met eventuele op- en aanmerkingen kunt u terecht bij: Universiteit Maastricht Capaciteitsgroep M&S Tjaart Imbos Postbus 616 6200 MD Maastricht tjaart.imbos@stat.unimaas.nl

Methodologie & Statistiek I Toetsen van twee gemiddelden 6.1 27 februari 2002

vorige hoofdstuk . . . Toetsen van één gemiddelde Kijken of de steekproef met dat bepaalde gemiddelde redelijkerwijs afkomstig kan zijn uit een populatie met een m waarvan in de hypothesen werd uitgegaan. De vraag was te beantwoorden omdat de verdeling van x-gemiddelden uit de veronderstelde populatie (H0) bekend is. s bekend: z-toets s niet bekend: t-toets

kern van statistisch toetsen Hoe extreem is de gevonden steekproefwaarde binnen de verdeling van de toetsingsgrootheid

hoofdstuk 6 Toetsen van twee gemiddelden Toetsen van gemiddelden van twee steekproeven

Er worden twee situaties onderscheiden afhankelijke of gepaarde steekproeven onafhankelijke of niet gepaarde steekproeven Keuze wordt bepaald door de opzet van het onderzoek voorbeeld……..

afhankelijke of gepaarde steekproeven Onderzoek naar het rendement van twee soorten benzines. Men wil een aantal auto’s op de ene soort en een aantal auto’s op de andere soort laten rijden en de afstand (mijlen) meten die wordt gereden op 1 gallon van de betreffende benzine.

afhankelijke of gepaarde steekproeven Onderzoek naar het rendement van twee soorten benzines. Men wil een aantal auto’s op de ene soort en een aantal auto’s op de andere soort laten rijden en de afstand (mijlen) meten die wordt gereden op 1 gallon van de betreffende benzine. Men realiseert zich op tijd dat het rendement van de auto’s mede afhankelijk is van merk/model en zelfs binnen merk/model kan variëren oplossing ???

afhankelijke of gepaarde steekproeven oplossing: Laat tien verschillende auto’s achtereenvolgens op de twee soorten benzine rijden en ga na of er per auto verschil is in de gereden afstand. Aan elk element in de steekproef worden twee metingen verricht Model wordt gebruikt in situaties waar sprake is van een voor- en nameting

  Aantal mijlen dat 10 auto’s afleggen op 1 gallon soort benzine Auto A B 1 25.7 24.9 2 20.0 18.8 3 28.4 27.7 4 13.7 13.0 5 18.8 17.8 6 12.5 11.3 7 28.4 27.8 8 8.1 8.2 9 23.1 23.1 10 10.4 9.9  afstand in mijlen, gereden op 1 gallon van de betreffende benzine 

Aantal mijlen dat 10 auto’s afleggen op 1 gallon soort benzine Auto A B 1 25.7 24.9 2 20.0 18.8 3 28.4 27.7 4 13.7 13.0 5 18.8 17.8 6 12.5 11.3 7 28.4 27.8 8 8.1 8.2 9 23.1 23.1 10 10.4 9.9 Redenering: Als er geen verschil zou zijn tussen de twee soorten benzines, zou het verschil in gereden mijlen ongeveer gelijk moeten zijn aan 0. H0: het verschil = 0 HA: het verschil > 0

Aantal mijlen dat 10 auto’s afleggen op 1 gallon soort benzine Auto A B 1 25.7 24.9 2 20.0 18.8 3 28.4 27.7 4 13.7 13.0 5 18.8 17.8 6 12.5 11.3 7 28.4 27.8 8 8.1 8.2 9 23.1 23.1 10 10.4 9.9 verschil A-B 0.8 1.2 0.7 1.0 0.6 -0.1 0.0 0.5

? Het twee-steekproevenprobleem is daarmee teruggebracht tot een probleem met een steekproef: Kan de steekproef (van verschillen) redelijkerwijs afkomstig zijn uit een populatie met m= 0 en onbekende s ?

De gemiddelden van alle steekproeven (n=10) uit de populatie met m= 0 zijn normaal verdeeld met verwachtingswaarde=0 en variantie= s2/n Omdat s2 niet bekend is, wordt de s2 van de steekproef als schatter gebruikt. De beste schatter van de variantie van de verdeling van steekproefgemiddelden is dan s2/n.

DE TOETS: maak gebruik van het kritieke gebied Formuleer de nul-hypothese Stel onbetrouwbaarheid (a) vast Kies de toetsingsgrootheid Bepaal de verdeling van de toetsingsgrootheid Bepaal kritieke gebied Bereken toetsingsgrootheid t* Trek conclusie: t* ligt in kritieke gebied: H0 verwerpen t* ligt niet in kritieke gebied: H0 niet verwerpen

Formuleer de H0 Stel onbetrouwbaarheid (a) vast Kies de toetsingsgrootheid Bepaal de verdeling van de toetsingsgrootheid Bepaal kritieke gebied Bereken toetsingsgrootheid t* Trek conclusie: t* in kritieke gebied: H0 verwerpen t* niet in kritieke gebied: H0 niet verwerpen Verwachtingswaarde verschillen = 0 HA: benzine A levert meer mijlen/gallon Kies a is gelijk aan 0.05 (=eenzijdig) 3. Toetsingsgrootheid: t* heeft een t-verdeling met 9 vrijheidsgraden t(9,0.95)= 1.833 Kritieke gebied: alle waarden rechts van 1.833 6.

conclusie ? Formuleer de H0 Stel onbetrouwbaarheid (a) vast Kies de toetsingsgrootheid Bepaal de verdeling van de toetsingsgrootheid Bepaal kritieke gebied Bereken toetsingsgrootheid t* Trek conclusie: t* in kritieke gebied: H0 verwerpen t* niet in kritieke gebied: H0 niet verwerpen Verwachtingswaarde verschillen = 0 HA: benzine A levert meer mijlen/gallon Kies a is gelijk aan 0.05 (=eenzijdig) 3. Toetsingsgrootheid: conclusie ? t* heeft een t-verdeling met 9 vrijheidsgraden t(9,0.95)= 1.833 Kritieke gebied: alle waarden rechts van 1.833 6.

Er werden twee situaties onderscheiden afhankelijke of gepaarde steekproeven onafhankelijke of niet gepaarde steekproeven Keuze wordt bepaald door de opzet van het onderzoek voorbeeld……..

niet gepaarde steekproeven onafhankelijke of niet gepaarde steekproeven Men doet onderzoek naar salarisverschillen tussen enerzijds docenten aan openbare scholen en anderzijds docenten aan privé-scholen. Men neemt een steekproef van de docenten aan de ene schoolsoort en een steekproef van de docenten aan de andere schoolsoort. De elementen in de ene steekproef hebben niets van doen met de elementen uit de andere steekproef.

Men doet onderzoek naar salarisverschillen tussen enerzijds docenten aan openbare scholen en anderzijds docenten aan privé-scholen. Men neemt een steekproef van de docenten aan de ene schoolsoort en een steekproef van de docenten aan de andere schoolsoort. De elementen in de ene steekproef hebben niets van doen met de elementen uit de andere steekproef. Er is sprake van twee populaties, met uit elk daarvan een steekproef.

? steekproef-1 uit populatie-1: n= 30 Is het verschil ($ 2223.77) toevallig of niet ?

Om die vraag te kunnen beantwoorden moet je kennis hebben van het gedrag van het verschil tussen twee gemiddelden Net als , is ook een random-variabele

? Trek uit populatie-1 met m1 en s1 ‘alle’ mogelijke steekproeven van n1 stuks en bepaal de gemiddelden Wat valt er te zeggen over de verdeling van de steekproefgemiddelden? ?

? Trek uit populatie-1 met m1 en s21 ‘alle’ mogelijke steekproeven van n1 stuks en bepaal de gemiddelden ? Wat valt er te zeggen over de verdeling van de steekproefgemiddelden? De steekproefgemiddelden zijn, bij benadering, normaal verdeeld met verwachtingswaarde = m1 en variantie = s21/n1

? Trek uit populatie-2 met m2 en s22 ‘alle’ mogelijke steekproeven van n2 stuks en bepaal de gemiddelden ? Wat valt er te zeggen over de verdeling van de steekproefgemiddelden?

? Trek uit populatie-2 met m2 en s22 ‘alle’ mogelijke steekproeven van n2 stuks en bepaal de gemiddelden ? Wat valt er te zeggen over de verdeling van de steekproefgemiddelden? De steekproefgemiddelden zijn, bij benadering, normaal verdeeld met verwachtingswaarde = m2 en variantie = s22/n2

Geprojecteerd op het voorbeeld: Het gemiddelde van de steekproef met salarissen van leraren aan openbare scholen is een exemplaar uit de verdeling van de gemiddelden van alle steekproeven met leraarsalarissen aan openbare scholen. Het gemiddelde van de steekproef met salarissen van leraren aan prive scholen is een exemplaar uit de verdeling van de gemiddelden van alle steekproeven met leraarsalarissen aan prive scholen.

Zijn exemplaren uit twee verdelingen van x-gemiddelden Het verschil ($ 2223.77) is een exemplaar uit de verdeling van alle verschillen Als meer bekend is omtrent de verdeling van die verschillen is ook aan te geven hoe waarschijnlijk een bepaald verschil is.

Het verschil van twee verdelingen Verdeling A: normale verdeling met verwachtingswaarde: mA variantie: s2A Verdeling B: normale verdeling met verwachtingswaarde: mB variantie: s2B Verdeling A-B: normale verdeling met verwachtingswaarde: mA- mB variantie: s2A+ s2B

? 3 6 9 1 2 3 2 5 8 1 4 7 3 6 A gemiddelde A gemiddelde B 3 6 gemiddelde A gemiddelde B gemiddelde (A-B) variantie A variantie B variantie (A-B) B

Deze theorie toegepast op het voorbeeld Vaak stelt men in de H0 dat

Deze theorie toegepast op het voorbeeld

Het voorbeeld van de leraren-salarissen steekproef-1 uit populatie-1: n= 30 steekproef-2 uit populatie-2: n= 35 Ga er van uit dat: s1= $ 12925 en s2= $ 14850

DE TOETS: maak gebruik van het kritieke gebied Formuleer de nul-hypothese Stel onbetrouwbaarheid (a) vast Kies de toetsingsgrootheid Bepaal de verdeling van de toetsingsgrootheid Bepaal kritieke gebied Bereken toetsingsgrootheid t* Trek conclusie: t* ligt in kritieke gebied: H0 verwerpen t* ligt niet in kritieke gebied: H0 niet verwerpen stap voor stap……………..

1. Formuleer de Nulhypothese m1 = m2 dus m1 – m2= 0 Formuleer de alternatieve hypothese m1 m2 2. Stel onbetrouwbaarheid (a) vast Onbetrouwbaarheid a= 5%

3. Kies de toetsingsgrootheid 4. Verdeling toetsingsgrootheid

Bepaal kritieke gebied (in termen van z) tweezijdige toets a= 5% 2.5% 2.5% 1.96 -1.96

6. Bereken toetsingsgrootheid conclusie ?

De zojuist beschreven situatie, waarbij de varianties van beide populaties bekend zijn, zal in de praktijk niet zo vaak voorkomen. Als de populatie-varianties niet bekend zijn vormen de steekproefvarianties de best beschikbare schatters van de populatie-parameters.

Daarbij kunnen twee situaties worden onderscheiden: De onbekende populatie-varianties zijn (ongeveer) gelijk aan elkaar. De onbekende populaties-varianties zijn niet gelijk aan elkaar. Wanneer op basis van de beschikbare steekproeven moet worden gekozen tussen de twee mogelijkheden, staat een toets ter beschikking: F-toets

De onbekende populatie-varianties zijn (ongeveer) gelijk aan elkaar. Het voorbeeld van de leraren-salarissen wordt gebruikt. Omdat de populatie-varianties gelijk zijn aan elkaar zijn zowel s1 als s2 schatters van die populatie-variantie.

De gecombineerde schatter van de variantie (Eng. pooled variance) wordt als volgt berekend.

Bij bekende varianties was de toetsingsgrootheid deze was normaal verdeeld s1 en s2 worden vervangen door sp. De toetsingsgrootheid deze is t-verdeeld met n1+n2-2 vrijheidsgraden zie formule 6.7

Conclusie bij a=5% tweezijdig? Toegepast op het salarissen-voorbeeld: Het tabellenboek geeft geen informatie omtrent een t-verdeling met 63 vrijheidgraden: gebruik de z-verdeling: Conclusie bij a=5% tweezijdig?

Als niet mag worden verondersteld dat s1 gelijk is aan s2 (omdat bijvoorbeeld de F-toets die veronderstelling verwerpt) wordt de zaak aanzienlijk moeilijker. Er zijn diverse oplossingen. Een daarvan wordt in het boek besproken (par. 6.5) Voor het bepalen van het aantal vrijheidsgraden: zie formule 6.13

Ook als er sprake is van twee onafhankelijke steekproeven kan op basis van een BETROUWBAARHEIDSINTERVAL worden berekend. Uitgangspunt voorbeeld met bekende varianties.

De toetsingsgrootheid was: Het (100-a) betrouwbaarheidsinterval:

Samenvatting toetsen voor gemiddelden van twee steekproeven Twee gepaarde steekproeven herleiden tot een-steekproefprobleem Twee onafhankelijke steekproeven a. populatie-varianties bekend b. populatie-varianties onbekend, maar gelijk c. populatie-varianties onbekend en ongelijk

F-toets voor het vergelijken van 2 varianties De toetsingsgrootheid is De grootste variantie komt in de teller!

Onder H0 is het quotient van de varianties F-verdeeld Met df(teller) n-1 die hoort bij steekproef met de grootste variantie Met df(noemer) n-1 die hoort bij steekproef met de kleinste variantie voorbeeld…………..

Steekproef-1: s2= 17 en n=5 Steekproef-2: s2= 48 en n=8 Onder H0 is F-verdeeld met (7 en 4) df Uit de F-tabel (7,4) blijkt dat de berekende waarde (= 2.8235) tussen het 75ste (=2.079) en 90ste (=3.979) percentiel ligt. SPSS: CDF.F(2.8235,7,4) 0.83369 Op grond van deze waarden wordt H0 dus NIET verworpen!

succes !