MEDISCHE STATISTIEK OEFENINGEN

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

KWALITEITSZORG november 2012
Rekenen met procenten Rekenen met procenten.
HC2MFE Meten van verschillen
M3F-MATEN - Tijd en Snelheid
NEDERLANDS WOORD BEELD IN & IN Klik met de muis
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Geestelijke Gezondheid in Vlaanderen
Uitgaven aan zorg per financieringsbron / /Hoofdstuk 2 Zorg in perspectief /pagina 1.
December 2007 Dimarso N.V., opererend onder de commerciële naam TNS Dimarso en hierna TNS Dimarso genoemd, beschikt exclusief over het auteursrecht van.
Duurzaamheid en kosten
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
M3F-MATEN - Tijd en Snelheid
Ronde (Sport & Spel) Quiz Night !
y is evenredig met x voorbeeld a N x 5 x 3
Rekenen met procenten Rekenen met procenten.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
VERDUNNINGSFACTOR - ALGEMEEN
Kb.1 Ik leer op een goede manier optellen en aftrekken
Beschrijvende en inferentiële statistiek
Nooit meer onnodig groen? Luuk Misdom, IT&T
P-waarde versus betrouwbaarheidsinterval
REKENEN.
toetsen voor het verband tussen variabelen met gelijk meetniveau
Als de som en het verschil gegeven zijn.
Hoofdstuk 6: Controle structuren
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
Elke 7 seconden een nieuw getal
vwo A Samenvatting Hoofdstuk 15
Extra vragen voor Havo 3 WB
Lineaire functies Lineaire functie
Regelmaat in getallen … … …
Hypothese toetsen We hebben de volgende situatie.
Differentieer regels De afgeleide van een functie f is volgens de limietdefinitie: Meestal bepaal je de afgeleide niet met deze limietdefinitie, maar.
Regelmaat in getallen (1).
MEDISCHE STATISTIEK OEFENINGEN
Inferentie voor kruistabellen
Oefeningen F-toetsen ANOVA.
Een fundamentele inleiding in de inductieve statistiek
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.
Populatiegemiddelden: recap
13 maart 2014 Bodegraven 1. 1Korinthe Want gelijk het lichaam één is en vele leden heeft, en al de leden van het lichaam, hoe vele ook, een lichaam.
Methodologie & Statistiek I Principes van statistisch toetsen 5.1.
Seminarie 1: Pythagoreïsche drietallen
Meten BMI Dat is in de veilige zone, want de BMI zit tussen 18,5 en 25
ribwis1 Toegepaste wiskunde – Differentieren Lesweek 7
Inger Plaisier Marjolein Broese van Groenou Saskia Keuzenkamp
havo/vwo D Samenvatting Hoofdstuk 4
Een bakje kwark kost € 1,27. Hoeveel kosten vijf bakjes? 5 x € 1,27 = 5 x € 1,00 = € 5,00 5 x € 0,20 = € 1,00 5 x € 0,07 = € 0, € 6,35 Een.
Obesitas & Schouderdystocie
Cijfers Zorg en Gezondheid
Aanleiding onderzoek Ondervoeding sinds 2010 prestatie indicator (PI) voor revalidatiecentra Advies in PI: gebruik de SNAQ om te screenen Vragen van de.
EFS Seminar Discriminatie van pensioen- en beleggingsfondsen
Statistiekbegrippen en hoe je ze berekent!!
Eerst even wat uitleg. Klik op het juiste antwoord als je het weet.
Op reis naar een dierentuin
STIMULANS KWALITEITSZORG juni 2014.
In opdracht van NOC*NSF
1 Algemene Ondernemersvaardigheden (AOV)
Vergelijkingen oplossen
Centrummaten en Boxplot
Algemene Ondernemersvaardigheden
Culturele Atlas 2004 Gelderland en Overijssel. Culturele Atlas, Enschede ( 76)Apeldoorn ( 92) Zwolle (121)Nijmegen
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
Gezondheid oudere migranten in Utrecht (selectie)
Openbaar je talent Service public, talent particulier.
Transcript van de presentatie:

MEDISCHE STATISTIEK OEFENINGEN 12. SIGNIFICANTIETEST IN HET GEVAL VAN ÉÉN STEEKPROEF

HYPOTHESE TESTEN voorbeelden formulering van de nulhypothese aangewende methode uitvoering van de test interpretatie en besluit grafische voorstelling bijzondere voorwaarden

TEST VOOR EEN POPULATIEPROPORTIE H0 :  = 0 H1 : eenzijdig :  < 0 of  > 0 tweezijdig :   0 Steekproef : Bereken : Overschrijdingskans ( P-waarde) P = P(Z  |z|) eenzijdig : P = P(Z  |z|) = 1 - P(Z < |z|) tweezijdig : P = 2 P(Z  |z|) Is P <  ? H0 verwerpen

TEST VOOR EEN POPULATIEGEMIDDELDE H0 :  = 0 H1 : eenzijdig :  < 0 of  > 0 tweezijdig :   0 Steekproef : X en S Bereken : Overschrijdingskans ( P-waarde) P = P(T  |t|) eenzijdig : P = P(T  |t|) = 1 - P(T < |t|) tweezijdig : P = 2 P(T  |t|) Is P <  ? H0 verwerpen (voor n voldoende groot z-distributie)

Oefening 12.1 In een studie over de werking van een nieuw soort vermageringsmiddel bleken 28 van de 40 proefpersonen op het einde van de studieperiode inderdaad een lager gewicht te hebben. Als men aanneemt dat het menselijk gewicht op een willekeurige wijze fluctueert, kan men dan uit de resultaten van deze studie besluiten dat het middel niet werkt ? (significantiedrempel  = 0.05)

H0 :  = 0 ;  = 0.50 (0 = 0.50) H1 : tweezijdig :   0 :   0.50  = 0.05 Steekproef : Bereken : Tweezijdige overschrijdingskans ( P-waarde) P = P(Z  |z|) = 0.0114 Is P <  ? Besluit : H0 verwerpen

Oefening 12.2 Uit grote populatiestudies blijkt dat 15% van de Belgische mannen ouder dan 30 jaar een verhoogde bloeddruk heeft. Een onderzoeker wil nagaan of door de aanwezigheid van een chemisch bedrijf in de buurt van een grote stad, het drinkwater besmet is met bepaalde bloeddrukverhogende componenten. In een steekproef van 250 mannen uit de stad bleken er 60 inderdaad hypertensief. Kan de onderzoeker besluiten dat het resultaat van zijn studie binnen de lijn van de toevalsverwachting ligt en er dus niet echt sprake is van een besmetting ? Kans op type I fout is gelijk aan  = 0.05.

H1 : eenzijdig :  > 0 :  > 0.15  = 0.05 Steekproef : Bereken : Eenzijdige overschrijdingskans ( P-waarde) P = P(Z  |z|) < 0.001 Is P <  ? Besluit : H0 verwerpen (zie ook hoofdstuk 10)

Oefening 12.3 Aan een beoordelingscommissie wordt advies gevraagd m.b.t het verlenen van een licentie voor een nieuw medicijn tegen astma-aanvallen. De commissie hanteert hierbij twee stelregels : (1) het medicijn moet in minstens 99 % van de gevallen werkzaam zijn; (2) bij hoogstens één op vijfhonderd patiënten kunnen er ernstige bijwerkingen getolereerd worden. Als controle wordt het medicijn getest bij een steekproef van 200 patiënten. Bij vijf patiënten heeft het middel geen effect, bij één patiënt noteert men ernstige bijwerkingen. De werkzaamheid wordt getest met een -drempel van 0.01, de bijwerkingen met  = 0.10. Wat zal de commissie besluiten ?

H0 :  = 0 :  = 0.01 (1) WERKZAAMHEID H1 : eenzijdig :  > 0 :  > 0.01  = 0.01 Steekproef : Bereken : Eenzijdige overschrijdingskans ( P-waarde) P = P(Z  |z|) = 0.017 Is P <  ? Besluit : H0 NIET verwerpen

H0 :  = 0 :  = 0.002 (2) BIJWERKINGEN H1 : eenzijdig :  > 0 :  > 0.002  = 0.10 Steekproef : Bereken : Eenzijdige overschrijdingskans ( P-waarde) P = P(Z  |z|) = 0.17 Is P <  ? Besluit : H0 NIET verwerpen licentie verlenen

Oefening 12.4 Bloedgroep bepalingen bij een aselecte steekproef van 200 West-Europese zigeuners geeft aan dat 60 onder hen tot de in West-Europa eerder zeldzame bloedgroep B (ca. 10%) behoren. Kan men aannemen dat de frequentie van bloedgroep B bij West-Europese zigeuners het voorkomen van die bloedgroep volgt bij Hindoes in Rajastan (N. Indië), waar een omvangrijke studie uitkwam op een percentage gelijk aan 35% (A.E. Mourant, 1958). Toets eenzijdig met kans op type I-fout  = 0.05.

H1 : eenzijdig :  < 0 :  < 0.35  = 0.05 Steekproef : Bereken : Eenzijdige overschrijdingskans ( P-waarde) P = P(Z  |z|) = 0.069 Is P <  ? Besluit : H0 NIET verwerpen

Oefening 12.5 Een onderzoeker wil nagaan of personen die op grote hoogte leven (boven 2000 meter) een gewijzigde serum hemoglobine concentratie vertonen. In een steekproef van 20 gezonde mannen uit een dorp uit de Alpen vindt men een gemiddelde hemoglobine waarde van 15.3 g/dl met een standaarddeviatie van 1.17 g/dl. Is het gemiddelde van deze groep mannen inderdaad significant (op 5% niveau) verschillend van de referentiewaarde van 14.7 g/dl voor mannen die leven ter hoogte van de zeespiegel ?

H1 : tweezijdig :   0 :   14.7 g/dl  = 0.05 Steekproef : X = 15.3 S = 1.17 n = 20 Bereken : Aantal vrijheidsgraden :  = n - 1 = 19 Tweezijdige overschrijdingskans ( P-waarde) P = P(T  |t|) < 0.05 Is P <  ? Besluit : H0 verwerpen

Benadering d.m.v. betrouwbaarheidsinterval. Steekproef : X = 15.3 S = 1.17 n = 20 95% BI : [15.3 - 2.093*0.262; 15.3 + 2.093*0.262] = [14.75; 15.85] (g/dl)

Oefening 12.6 In een bepaalde leeftijdsklasse hebben gezonde jongeren een gemiddeld lichaamsgewicht van 52 kg. Een epidemioloog wil het vermoeden verifiëren dat in een bepaalde buurt van een grote stad, kinderen van die leeftijd ondervoed zijn. In zijn studie van 25 dergelijke kinderen uit deze buurt vindt hij een gemiddeld gewicht van 47.2 kg met een standaarddeviatie van 6.5 kg. Is er voldoende evidentie om het vermoeden te ontkrachten ? (5% significantiedrempel).

H1 : éénzijdig :  < 0 :  < 52 tweezijdig :   0 :   52  = 0.05 Steekproef : X = 47.2 S = 6.5 n = 25 Bereken : Aantal vrijheidsgraden :  = n - 1 = 24 Eénzijdige overschrijdingskans ( P-waarde) 2-zijdig P = P(T  |t|) < 0.001 P < 0.01 Is P <  ? Besluit : H0 verwerpen

Oefening 12.7 Uit de literatuur is gekend dat de gemiddelde slaapduur van de verkwikkende droomslaap (REM-fase) bij volwassenen gelijk is aan twee uren. Bij een steekproef van 20 personen die slaapmiddelen innemen, is de gemiddelde duur 105 minuten met een standaardafwijking van een halfuur. Wijkt dit gemiddelde significant af van de vooropgestelde waarde bij een links-éénzijdige toets ? Neem  = 0.05.

H1 : eenzijdig :  < 0 :  < 120 H0 :  = 0 ;  = 2 u ( = 120 min) H1 : eenzijdig :  < 0 :  < 120  = 0.05 Steekproef : X = 105 S = 30 n = 20 Bereken : Aantal vrijheidsgraden :  = n - 1 = 19 Eenzijdige overschrijdingskans ( P-waarde) P = P(T  |t|) < 0.025 Is P <  ? Besluit : H0 verwerpen

Oefening 12.8 De levensverwachting bij mannen in een bepaald land is gekend als zijnde 71.9 jaar. Onderzoekers willen nu nagaan of voor een bepaalde regio in dit land, waarvan gekend is dat er sterke milieuvervuiling is door zware nijverheid, de gemiddelde levensverwachting lager ligt. In de steekproef van 10000 mannen uit deze regio bleek de gemiddelde levensverwachting 71.7 jaar te zijn met een standaardafwijking van 7.0 jaar. Test eenzijdig bij een 5% significantiedrempel of het vermoeden van de onderzoekers gegrond is.

H1 : eenzijdig :  < 0 :  < 71.9 H0 :  = 0 ;  = 71.9 j (0 = 71.9 j) H1 : eenzijdig :  < 0 :  < 71.9  = 0.05 Steekproef : X = 71.7 S = 7.0 n = 10000 Bereken : Aantal vrijheidsgraden : overgang naar z-distributie Eenzijdige overschrijdingskans ( P-waarde) P = P(Z  |z|) = 0.0021 Is P <  ? Besluit : H0 verwerpen

Oefening 12.9 Veronderstel een jaarlijkse incidentie van de Creutzfeldt-Jacob ziekte (CJ, tegenhanger van BSE bij de mens) gelijk aan 1/15 miljoen bij de bevolking onder de 45 jaar. In 1995 werden in de U.K., onder de 30 miljoen inwoners jonger dan 45 jaar, tien personen getroffen door CJ. Is hier sprake van een alarmerende stijging van de ziekte ? Toets éénzijdig bij  = 0.01.

H0 :  = 0 ;  = 2 ( / 30 miljoen) H1 : eenzijdig :  > 2  = 0.01 r = 10 Steekproevenverdeling : Poisson Overschrijdingskans : P( r  10) = 1 - P( r < 10) P ( r < 10) = P(r  9) = = 0.135*7.389 = 0.998 P( r  10) = 1 - P( r < 10) = 0.002 Besluit : H0 verwerpen

Voorbeeld 1 Stel dat na een bepaalde chirurgische ingreep 10% van de patiënten overlijden. Gedurende de laatste maand echter telde men 16 sterfgevallen bij een totaal van 75 dergelijke operaties. Kan dit nog beschouwd worden als een toevallige fluctuatie of duidt dit eerder of een reële stijging van het aantal sterfgevallen. Onder de nulhypothese zou men 10% sterfgevallen verwachten wat overeenstemt met 7.5 gevallen. Uiteraard is de verwachte waarde in tegenstelling met de waargenomen aantallen geen geheel getal.

Tabel : waargenomen verwacht levend 59 67.5 overleden 16 7.5 totaal 75 75 z- test : H0 :  = 0 (0 = 10%) P (overlijden) = 16/75 = 0.21

Voorbeeld 2 Verwijzend naar het voorbeeld van een uniforme verdeling uit hoofdstuk 3.1.7 heeft men dat de verdeling van het aantal geboortes voor het jaar 1995 in een Gentse kraaminrichting is als volgt : Jan Feb Mrt Apr Mei Jun Jul Aug Sep Okt Nov Dec 92 86 85 95 98 82 85 86 91 83 85 84 Nulhypothese : het aantal bevallingen is uniform verdeeld is over alle maanden van het jaar. Houdt men zelfs rekening met het aantal dagen in elke maand dan is het verwachte aantal bevalling voor de maand februari gelijk aan het totaal aantal bevallingen voor 1995 vermenigvuldigd met 28/365. Het totaal aantal bevallingen is gelijk aan 1052.

De verwachte aantallen per maand zijn dan : Jan Feb Mrt Apr Mei Jun Jul Aug Sep Okt Nov Dec 89.4 80.7 89.4 86.5 89.4 86.5 89.4 89.4 86.5 89.4 86.5 89.4 Noot : de tabellen van bovenstaand voorbeelden zijn geen contingentie tabellen. Berekening van de chi-kwadraat waarde Waargenomen en verwachte aantallen kunnen worden gecombineerd in één enkele formule :

Voorbeeld 1  = 1 Voorbeeld 2 maand waargenomen verwacht 2 termen 1 92 89.35 0.08 2 86 80.71 0.35 3 85 89.35 0.21 4 95 86.46 0.84 5 98 89.35 0.84 6 82 86.46 0.23 7 85 89.35 0.21 8 86 89.35 0.13 9 91 86.46 0.24 10 83 89.35 0.45 11 85 86.46 0.02 12 84 89.35 0.32 2 som 3.92  = 12 - 1

2 test Om een 2 test geldig te kunnen uitvoeren moet voldaan zijn aan de voorwaarde dat niet meer dan 20% van de verwachte aantallen in de categorieën (frequentie tabel) of in de cellen (contingentie tabel) kleiner zijn dan 5 en dat er geen enkele categorie of cel een verwachte waarde heeft die kleiner is dan 1. Opgemerkt kan worden dat de kritische waarden van de 2 verdeling allemaal positief zijn; de 2 distributie heeft uitsluitend positieve waarden omwille van de kwadraat term in de formule. De 2 test zal significant zijn indien de berekende 2 waarde de kritische waarde (2 tabel : zie F.4) voor een vooropgesteld  niveau (bv.  = 0.05) overschrijdt (2  2tabel ).

Voor de 2 test toegepast op gewone frequentietabellen (zie voorbeelden 1 en 2) zal men steeds tweezijdig toetsen aangezien een alternatieve hypothese in een bepaalde richting niet zinvol is. Deze categorie van testen wordt vaak omschreven als goodness-of-fit testen, waarbij de nulhypothese vooropstelt dat een bepaalde steekproef aan een welbepaalde distributie beantwoordt (bv. normaliteits-toets). Voorbeeld 1 : 2 = 10.70, ndf = 1; kritische waarde ( = 0.05) = 3.841 nulhypothese wordt verworpen (P < 0.01) Voorbeeld 2 :2 = 3.92, ndf = 11; kritische waarde ( = 0.05) = 19.675 nulhypothese kan niet verworpen worden

Oefening 12.10 Het aantal nieuwe gevallen van HIV geïnfecteer-den tijdens de voorbije jaren is volgt : (bron : Tropisch Instituut / UIA) n 1990 1991 1992 1993 1994 1995 mannen 251 235 207 178 173 170 vrouwen 66 63 56 37 37 49 Ga na of de verdeling van deze frequenties beantwoordt aan een uniforme distributie. Toets tweezijdig ( = 0.05).

Staafdiagram

Mannen Obs Exp (O-E) (O-E)2 2 term 251 202.3 48.7 2371.69 11.72 235 202.3 32.7 1069.29 5.29 207 202.3 4.7 22.09 0.11 178 202.3 -24.3 590.49 2.92 173 202.3 -29.3 858.49 4.24 170 202.3 -32.3 1043.29 5.16 1214 (som) 2 = 29.44 202.3 (gemiddelde)  = 6 - 1 = 5 2tab = 11.070 H0 verwerpen (P < 0.001)

Vrouwen Obs Exp (O-E) (O-E)2 2 term 66 51.3 14.7 216.09 4.21 63 51.3 11.7 136.89 2.67 56 51.3 4.7 22.09 0.43 37 51.3 -14.3 204.49 3.99 49 51.3 -2.3 5.29 0.10 308 (som) 2 = 15.39 51.3 (gemiddelde)  = 6 - 1 = 5 2tab = 11.070 H0 verwerpen (P < 0.01)

Oefening 12.11 Volgende tabel is het resultaat van het genereren van 2000 normaalverdeelde toevalsgetallen met gemiddelde 50 en standaarddeviatie 5 : N(50,5). Ga na of deze aantallen na indeling in 12 klassen aan de verwachtingen voldoen. n Klassemidden 3 33.5 14 36.5 46 39.5 149 42.5 311 45.5 451 48.5 457 51.5 321 54.5 181 57.5 49 60.5 14 63.5 4 66.5

Histogram n = 2000 X = 50.2 S = 4.95

 = 12 - 1 = 11 2tab = 19.675 H0 niet verwerpen Klasse- Exp. n midden z P(Z<z) Opp. = opp*n 2 term 3 33.5 -3.0 0.0013 0.0013 2.6 0.062 14 36.5 -2.4 0.0082 0.0069 13.8 0.003 46 39.5 -1.8 0.0359 0.0277 55.4 1.595 149 42.5 -1.2 0.1151 0.0792 158.4 0.558 311 45.5 -0.6 0.2743 0.1592 318.4 0.172 451 48.5 0.0 0.5000 0.2257 451.4 0.000 457 51.5 0.6 0.2257 451.4 0.069 321 54.5 1.2 symm 0.1592 318.4 0.021 181 57.5 1.8 0.0792 158.4 3.224 49 60.5 2.4 0.0277 55.4 0.739 14 63.5 3.0 0.0069 13.8 0.003 4 66.5 3.3 0.0013 2.6 0.754 2000 1.0 2000.0 7.201 (2)  = 12 - 1 = 11 2tab = 19.675 H0 niet verwerpen