MEDISCHE STATISTIEK OEFENINGEN 12. SIGNIFICANTIETEST IN HET GEVAL VAN ÉÉN STEEKPROEF
HYPOTHESE TESTEN voorbeelden formulering van de nulhypothese aangewende methode uitvoering van de test interpretatie en besluit grafische voorstelling bijzondere voorwaarden
TEST VOOR EEN POPULATIEPROPORTIE H0 : = 0 H1 : eenzijdig : < 0 of > 0 tweezijdig : 0 Steekproef : Bereken : Overschrijdingskans ( P-waarde) P = P(Z |z|) eenzijdig : P = P(Z |z|) = 1 - P(Z < |z|) tweezijdig : P = 2 P(Z |z|) Is P < ? H0 verwerpen
TEST VOOR EEN POPULATIEGEMIDDELDE H0 : = 0 H1 : eenzijdig : < 0 of > 0 tweezijdig : 0 Steekproef : X en S Bereken : Overschrijdingskans ( P-waarde) P = P(T |t|) eenzijdig : P = P(T |t|) = 1 - P(T < |t|) tweezijdig : P = 2 P(T |t|) Is P < ? H0 verwerpen (voor n voldoende groot z-distributie)
Oefening 12.1 In een studie over de werking van een nieuw soort vermageringsmiddel bleken 28 van de 40 proefpersonen op het einde van de studieperiode inderdaad een lager gewicht te hebben. Als men aanneemt dat het menselijk gewicht op een willekeurige wijze fluctueert, kan men dan uit de resultaten van deze studie besluiten dat het middel niet werkt ? (significantiedrempel = 0.05)
H0 : = 0 ; = 0.50 (0 = 0.50) H1 : tweezijdig : 0 : 0.50 = 0.05 Steekproef : Bereken : Tweezijdige overschrijdingskans ( P-waarde) P = P(Z |z|) = 0.0114 Is P < ? Besluit : H0 verwerpen
Oefening 12.2 Uit grote populatiestudies blijkt dat 15% van de Belgische mannen ouder dan 30 jaar een verhoogde bloeddruk heeft. Een onderzoeker wil nagaan of door de aanwezigheid van een chemisch bedrijf in de buurt van een grote stad, het drinkwater besmet is met bepaalde bloeddrukverhogende componenten. In een steekproef van 250 mannen uit de stad bleken er 60 inderdaad hypertensief. Kan de onderzoeker besluiten dat het resultaat van zijn studie binnen de lijn van de toevalsverwachting ligt en er dus niet echt sprake is van een besmetting ? Kans op type I fout is gelijk aan = 0.05.
H1 : eenzijdig : > 0 : > 0.15 = 0.05 Steekproef : Bereken : Eenzijdige overschrijdingskans ( P-waarde) P = P(Z |z|) < 0.001 Is P < ? Besluit : H0 verwerpen (zie ook hoofdstuk 10)
Oefening 12.3 Aan een beoordelingscommissie wordt advies gevraagd m.b.t het verlenen van een licentie voor een nieuw medicijn tegen astma-aanvallen. De commissie hanteert hierbij twee stelregels : (1) het medicijn moet in minstens 99 % van de gevallen werkzaam zijn; (2) bij hoogstens één op vijfhonderd patiënten kunnen er ernstige bijwerkingen getolereerd worden. Als controle wordt het medicijn getest bij een steekproef van 200 patiënten. Bij vijf patiënten heeft het middel geen effect, bij één patiënt noteert men ernstige bijwerkingen. De werkzaamheid wordt getest met een -drempel van 0.01, de bijwerkingen met = 0.10. Wat zal de commissie besluiten ?
H0 : = 0 : = 0.01 (1) WERKZAAMHEID H1 : eenzijdig : > 0 : > 0.01 = 0.01 Steekproef : Bereken : Eenzijdige overschrijdingskans ( P-waarde) P = P(Z |z|) = 0.017 Is P < ? Besluit : H0 NIET verwerpen
H0 : = 0 : = 0.002 (2) BIJWERKINGEN H1 : eenzijdig : > 0 : > 0.002 = 0.10 Steekproef : Bereken : Eenzijdige overschrijdingskans ( P-waarde) P = P(Z |z|) = 0.17 Is P < ? Besluit : H0 NIET verwerpen licentie verlenen
Oefening 12.4 Bloedgroep bepalingen bij een aselecte steekproef van 200 West-Europese zigeuners geeft aan dat 60 onder hen tot de in West-Europa eerder zeldzame bloedgroep B (ca. 10%) behoren. Kan men aannemen dat de frequentie van bloedgroep B bij West-Europese zigeuners het voorkomen van die bloedgroep volgt bij Hindoes in Rajastan (N. Indië), waar een omvangrijke studie uitkwam op een percentage gelijk aan 35% (A.E. Mourant, 1958). Toets eenzijdig met kans op type I-fout = 0.05.
H1 : eenzijdig : < 0 : < 0.35 = 0.05 Steekproef : Bereken : Eenzijdige overschrijdingskans ( P-waarde) P = P(Z |z|) = 0.069 Is P < ? Besluit : H0 NIET verwerpen
Oefening 12.5 Een onderzoeker wil nagaan of personen die op grote hoogte leven (boven 2000 meter) een gewijzigde serum hemoglobine concentratie vertonen. In een steekproef van 20 gezonde mannen uit een dorp uit de Alpen vindt men een gemiddelde hemoglobine waarde van 15.3 g/dl met een standaarddeviatie van 1.17 g/dl. Is het gemiddelde van deze groep mannen inderdaad significant (op 5% niveau) verschillend van de referentiewaarde van 14.7 g/dl voor mannen die leven ter hoogte van de zeespiegel ?
H1 : tweezijdig : 0 : 14.7 g/dl = 0.05 Steekproef : X = 15.3 S = 1.17 n = 20 Bereken : Aantal vrijheidsgraden : = n - 1 = 19 Tweezijdige overschrijdingskans ( P-waarde) P = P(T |t|) < 0.05 Is P < ? Besluit : H0 verwerpen
Benadering d.m.v. betrouwbaarheidsinterval. Steekproef : X = 15.3 S = 1.17 n = 20 95% BI : [15.3 - 2.093*0.262; 15.3 + 2.093*0.262] = [14.75; 15.85] (g/dl)
Oefening 12.6 In een bepaalde leeftijdsklasse hebben gezonde jongeren een gemiddeld lichaamsgewicht van 52 kg. Een epidemioloog wil het vermoeden verifiëren dat in een bepaalde buurt van een grote stad, kinderen van die leeftijd ondervoed zijn. In zijn studie van 25 dergelijke kinderen uit deze buurt vindt hij een gemiddeld gewicht van 47.2 kg met een standaarddeviatie van 6.5 kg. Is er voldoende evidentie om het vermoeden te ontkrachten ? (5% significantiedrempel).
H1 : éénzijdig : < 0 : < 52 tweezijdig : 0 : 52 = 0.05 Steekproef : X = 47.2 S = 6.5 n = 25 Bereken : Aantal vrijheidsgraden : = n - 1 = 24 Eénzijdige overschrijdingskans ( P-waarde) 2-zijdig P = P(T |t|) < 0.001 P < 0.01 Is P < ? Besluit : H0 verwerpen
Oefening 12.7 Uit de literatuur is gekend dat de gemiddelde slaapduur van de verkwikkende droomslaap (REM-fase) bij volwassenen gelijk is aan twee uren. Bij een steekproef van 20 personen die slaapmiddelen innemen, is de gemiddelde duur 105 minuten met een standaardafwijking van een halfuur. Wijkt dit gemiddelde significant af van de vooropgestelde waarde bij een links-éénzijdige toets ? Neem = 0.05.
H1 : eenzijdig : < 0 : < 120 H0 : = 0 ; = 2 u ( = 120 min) H1 : eenzijdig : < 0 : < 120 = 0.05 Steekproef : X = 105 S = 30 n = 20 Bereken : Aantal vrijheidsgraden : = n - 1 = 19 Eenzijdige overschrijdingskans ( P-waarde) P = P(T |t|) < 0.025 Is P < ? Besluit : H0 verwerpen
Oefening 12.8 De levensverwachting bij mannen in een bepaald land is gekend als zijnde 71.9 jaar. Onderzoekers willen nu nagaan of voor een bepaalde regio in dit land, waarvan gekend is dat er sterke milieuvervuiling is door zware nijverheid, de gemiddelde levensverwachting lager ligt. In de steekproef van 10000 mannen uit deze regio bleek de gemiddelde levensverwachting 71.7 jaar te zijn met een standaardafwijking van 7.0 jaar. Test eenzijdig bij een 5% significantiedrempel of het vermoeden van de onderzoekers gegrond is.
H1 : eenzijdig : < 0 : < 71.9 H0 : = 0 ; = 71.9 j (0 = 71.9 j) H1 : eenzijdig : < 0 : < 71.9 = 0.05 Steekproef : X = 71.7 S = 7.0 n = 10000 Bereken : Aantal vrijheidsgraden : overgang naar z-distributie Eenzijdige overschrijdingskans ( P-waarde) P = P(Z |z|) = 0.0021 Is P < ? Besluit : H0 verwerpen
Oefening 12.9 Veronderstel een jaarlijkse incidentie van de Creutzfeldt-Jacob ziekte (CJ, tegenhanger van BSE bij de mens) gelijk aan 1/15 miljoen bij de bevolking onder de 45 jaar. In 1995 werden in de U.K., onder de 30 miljoen inwoners jonger dan 45 jaar, tien personen getroffen door CJ. Is hier sprake van een alarmerende stijging van de ziekte ? Toets éénzijdig bij = 0.01.
H0 : = 0 ; = 2 ( / 30 miljoen) H1 : eenzijdig : > 2 = 0.01 r = 10 Steekproevenverdeling : Poisson Overschrijdingskans : P( r 10) = 1 - P( r < 10) P ( r < 10) = P(r 9) = = 0.135*7.389 = 0.998 P( r 10) = 1 - P( r < 10) = 0.002 Besluit : H0 verwerpen
Voorbeeld 1 Stel dat na een bepaalde chirurgische ingreep 10% van de patiënten overlijden. Gedurende de laatste maand echter telde men 16 sterfgevallen bij een totaal van 75 dergelijke operaties. Kan dit nog beschouwd worden als een toevallige fluctuatie of duidt dit eerder of een reële stijging van het aantal sterfgevallen. Onder de nulhypothese zou men 10% sterfgevallen verwachten wat overeenstemt met 7.5 gevallen. Uiteraard is de verwachte waarde in tegenstelling met de waargenomen aantallen geen geheel getal.
Tabel : waargenomen verwacht levend 59 67.5 overleden 16 7.5 totaal 75 75 z- test : H0 : = 0 (0 = 10%) P (overlijden) = 16/75 = 0.21
Voorbeeld 2 Verwijzend naar het voorbeeld van een uniforme verdeling uit hoofdstuk 3.1.7 heeft men dat de verdeling van het aantal geboortes voor het jaar 1995 in een Gentse kraaminrichting is als volgt : Jan Feb Mrt Apr Mei Jun Jul Aug Sep Okt Nov Dec 92 86 85 95 98 82 85 86 91 83 85 84 Nulhypothese : het aantal bevallingen is uniform verdeeld is over alle maanden van het jaar. Houdt men zelfs rekening met het aantal dagen in elke maand dan is het verwachte aantal bevalling voor de maand februari gelijk aan het totaal aantal bevallingen voor 1995 vermenigvuldigd met 28/365. Het totaal aantal bevallingen is gelijk aan 1052.
De verwachte aantallen per maand zijn dan : Jan Feb Mrt Apr Mei Jun Jul Aug Sep Okt Nov Dec 89.4 80.7 89.4 86.5 89.4 86.5 89.4 89.4 86.5 89.4 86.5 89.4 Noot : de tabellen van bovenstaand voorbeelden zijn geen contingentie tabellen. Berekening van de chi-kwadraat waarde Waargenomen en verwachte aantallen kunnen worden gecombineerd in één enkele formule :
Voorbeeld 1 = 1 Voorbeeld 2 maand waargenomen verwacht 2 termen 1 92 89.35 0.08 2 86 80.71 0.35 3 85 89.35 0.21 4 95 86.46 0.84 5 98 89.35 0.84 6 82 86.46 0.23 7 85 89.35 0.21 8 86 89.35 0.13 9 91 86.46 0.24 10 83 89.35 0.45 11 85 86.46 0.02 12 84 89.35 0.32 2 som 3.92 = 12 - 1
2 test Om een 2 test geldig te kunnen uitvoeren moet voldaan zijn aan de voorwaarde dat niet meer dan 20% van de verwachte aantallen in de categorieën (frequentie tabel) of in de cellen (contingentie tabel) kleiner zijn dan 5 en dat er geen enkele categorie of cel een verwachte waarde heeft die kleiner is dan 1. Opgemerkt kan worden dat de kritische waarden van de 2 verdeling allemaal positief zijn; de 2 distributie heeft uitsluitend positieve waarden omwille van de kwadraat term in de formule. De 2 test zal significant zijn indien de berekende 2 waarde de kritische waarde (2 tabel : zie F.4) voor een vooropgesteld niveau (bv. = 0.05) overschrijdt (2 2tabel ).
Voor de 2 test toegepast op gewone frequentietabellen (zie voorbeelden 1 en 2) zal men steeds tweezijdig toetsen aangezien een alternatieve hypothese in een bepaalde richting niet zinvol is. Deze categorie van testen wordt vaak omschreven als goodness-of-fit testen, waarbij de nulhypothese vooropstelt dat een bepaalde steekproef aan een welbepaalde distributie beantwoordt (bv. normaliteits-toets). Voorbeeld 1 : 2 = 10.70, ndf = 1; kritische waarde ( = 0.05) = 3.841 nulhypothese wordt verworpen (P < 0.01) Voorbeeld 2 :2 = 3.92, ndf = 11; kritische waarde ( = 0.05) = 19.675 nulhypothese kan niet verworpen worden
Oefening 12.10 Het aantal nieuwe gevallen van HIV geïnfecteer-den tijdens de voorbije jaren is volgt : (bron : Tropisch Instituut / UIA) n 1990 1991 1992 1993 1994 1995 mannen 251 235 207 178 173 170 vrouwen 66 63 56 37 37 49 Ga na of de verdeling van deze frequenties beantwoordt aan een uniforme distributie. Toets tweezijdig ( = 0.05).
Staafdiagram
Mannen Obs Exp (O-E) (O-E)2 2 term 251 202.3 48.7 2371.69 11.72 235 202.3 32.7 1069.29 5.29 207 202.3 4.7 22.09 0.11 178 202.3 -24.3 590.49 2.92 173 202.3 -29.3 858.49 4.24 170 202.3 -32.3 1043.29 5.16 1214 (som) 2 = 29.44 202.3 (gemiddelde) = 6 - 1 = 5 2tab = 11.070 H0 verwerpen (P < 0.001)
Vrouwen Obs Exp (O-E) (O-E)2 2 term 66 51.3 14.7 216.09 4.21 63 51.3 11.7 136.89 2.67 56 51.3 4.7 22.09 0.43 37 51.3 -14.3 204.49 3.99 49 51.3 -2.3 5.29 0.10 308 (som) 2 = 15.39 51.3 (gemiddelde) = 6 - 1 = 5 2tab = 11.070 H0 verwerpen (P < 0.01)
Oefening 12.11 Volgende tabel is het resultaat van het genereren van 2000 normaalverdeelde toevalsgetallen met gemiddelde 50 en standaarddeviatie 5 : N(50,5). Ga na of deze aantallen na indeling in 12 klassen aan de verwachtingen voldoen. n Klassemidden 3 33.5 14 36.5 46 39.5 149 42.5 311 45.5 451 48.5 457 51.5 321 54.5 181 57.5 49 60.5 14 63.5 4 66.5
Histogram n = 2000 X = 50.2 S = 4.95
= 12 - 1 = 11 2tab = 19.675 H0 niet verwerpen Klasse- Exp. n midden z P(Z<z) Opp. = opp*n 2 term 3 33.5 -3.0 0.0013 0.0013 2.6 0.062 14 36.5 -2.4 0.0082 0.0069 13.8 0.003 46 39.5 -1.8 0.0359 0.0277 55.4 1.595 149 42.5 -1.2 0.1151 0.0792 158.4 0.558 311 45.5 -0.6 0.2743 0.1592 318.4 0.172 451 48.5 0.0 0.5000 0.2257 451.4 0.000 457 51.5 0.6 0.2257 451.4 0.069 321 54.5 1.2 symm 0.1592 318.4 0.021 181 57.5 1.8 0.0792 158.4 3.224 49 60.5 2.4 0.0277 55.4 0.739 14 63.5 3.0 0.0069 13.8 0.003 4 66.5 3.3 0.0013 2.6 0.754 2000 1.0 2000.0 7.201 (2) = 12 - 1 = 11 2tab = 19.675 H0 niet verwerpen