De normale verdeling
Gebaseerd op… Uitwiskeling 18/1 Johan Deprez Jan Roels Hilde Eggermont Onder de loep van Uitwiskeling 18/1 Auteurs: Johan Deprez Jan Roels Hilde Eggermont Uitwiskeling live! 20 november 2004
Inspiratiebronnen David S. Moore, George P. McCabe, Statistiek in de Praktijk, Academic Service, 2001 Uitwiskeling live! 20 november 2004
Inspiratiebronnen Martin Kindt, Jan de Lange (Hewet-team), De normale verdeling, Educaboek, 1986 Uitwiskeling live! 20 november 2004
Waarom normale verdeling? eindtermen/leerplannen derde graad (5de jaar vanaf 04-05, 6de jaar vanaf 05-06): voor alle leerlingen ASO en TSO/KSO (beperkt) een verdeling die veel voorkomt en die iedereen wel eens ontmoet (‘algemene cultuur’) Uitwiskeling live! 20 november 2004
Doelpubliek Leerlingen: in de eerste plaats: ASO – minimum aantal lesuren ASO studierichtingen wiskunde-… : normale verdeling ook als kansverdeling TSO : niet alles wat hier aan bod komt, moet gezien worden Leerkrachten: geen voorkennis nodig over normale verdeling Handige voorkennis TI83: histogrammen tekenen en kentallen van gegevens berekenen Uitwiskeling live! 20 november 2004
Werkmoment (20 min.) Vooraf: lijsten op rekentoestellen zetten Group WS7NV De start: histogrammen beschrijven met een dichtheidsfunctie Relatieve frequenties m.b.v. dichtheidsfunctie Uitwiskeling live! 20 november 2004
Werkblad 1 N.V. Magazijn ‘De Bijenkorf’, Nederland, 1947: 15 lichaamsafmetingen (o.a. lichaamslengte) van 5000 willekeurig gekozen volwassen vrouwen lengte (in cm) frequentie relatieve 139 [138,5; 139,5[ 1 0,0002 140 [139,5; 140,5[ 141 [140,5; 141,5[ 4 0,0008 142 [141,5; 142,5[ 3 0,0006 143 [142,5; 143,5[ 2 0,0004 ... … Uitwiskeling live! 20 november 2004
Werkblad 1 verdeling van 5000 lengtes beschreven door één functie ! relatieve frequentie = hoogte staaf ≈ functiewaarde functie vervangt histogram en tabel Uitwiskeling live! 20 november 2004
Werkblad 1 Uitwiskeling live! 20 november 2004
Werkblad 2 Dezelfde gegevens (lengte van 5000 vrouwen), maar nu ingedeeld in bredere klassen (5 cm). Lengte (in cm) Freq. [134.5,139.5[ 1 [159.5,164.5[ 1520 [139.5,144.5[ 18 [164.5,169.5[ 1115 [144.5,149.5[ 122 [169.5,174.5[ 489 [149.5,154.5[ 467 [174.5,179.5[ 128 [154.5,159.5[ 1118 [179.5,184.5[ 22 Uitwiskeling live! 20 november 2004
Werkblad 2 PROBLEEM ! Uitwiskeling live! 20 november 2004
Werkblad 2 Oplossing voorgesteld door de leerlingen: Als je een functie zoekt die het histogram benadert, is dit de perfecte oplossing. Maar ... wij willen meer. Wij willen het model loskoppelen van het histogram. Uitwiskeling live! 20 november 2004
Werkblad 2 relatieve frequenties frequenties relatieve frequentiedichtheden delen door klassenbreedte Uitwiskeling live! 20 november 2004
Werkblad 2 Uitwiskeling live! 20 november 2004
Werkblad 2 5 0.2236 = 0.04472 x 5 Uitwiskeling live! 20 november 2004
Relatieve frequenties m.b.v. de normale dichtheidsfunctie Hoeveel procent van de vrouwen is tussen 164,5 cm en 179,5 cm lang? Histogram relatieve frequentiedichtheden tekenen Relatieve frequentie = som oppervlakten rechthoekjes Oppervlakte onder normalpdf Uitwiskeling live! 20 november 2004
Relatieve frequenties m.b.v. de normale dichtheidsfunctie Met de rekenmachine: Uitwiskeling live! 20 november 2004
Relatieve frequenties m.b.v. de normale dichtheidsfunctie We onthouden: Relatieve frequentie van een klasse van normaal verdeelde data = oppervlakte van het gebied onder de normale dichtheidsfunctie tussen de grenzen van de klasse Uitwiskeling live! 20 november 2004
Lengtes vergelijken (1/12) In 2000 Jeroen (18-jaar): 1m89 In 1950 opa van Jeroen (18 jaar): 1m80 Jeroen is groter dan zijn grootvader. Maar hoe zit dat in vergelijking met de rest van de bevolking? Uitwiskeling live! 20 november 2004
Lengtes vergelijken (2/12) Gegevens: Lengte van 18-jarigen is normaal verdeeld In 1950: Gemiddelde: 170,0 Standaardafwijking: 5,6 In 2000: Gemiddelde: 176,1 Standaardafwijking: 7,7 Uitwiskeling live! 20 november 2004
Lengtes vergelijken (3/12) Schets beide normale verdelingen en duid er de lengte van de kleinzoon en van de grootvader op aan. Uitwiskeling live! 20 november 2004
Lengtes vergelijken (4/12) Om te vergelijken kun je kijken naar de afwijking van het gemiddelde. Wie is volgens dit criterium het grootst? Jeroen: 189 176,1 = 12,9 (cm) opa: 180 170,0 = 10 (cm) Dus: Jeroen het grootst? Uitwiskeling live! 20 november 2004
Lengtes vergelijken (5/12) Is dit een goede manier van vergelijken? Je houdt geen rekening met de spreiding. Uitwiskeling live! 20 november 2004
Lengtes vergelijken (6/12) Afwijking van het gemiddelde vergelijken met de standaard-afwijking. Wie van beiden is volgens dit criterium het grootst? Jeroen: opa: Dus: opa is het grootst! Uitwiskeling live! 20 november 2004
Lengtes vergelijken (7/12) De verhouding van de afwijking van het gemiddelde tot de standaardafwijking = de z-score Formule: Uitwiskeling live! 20 november 2004
Lengtes vergelijken (8/12) 168,4 176,1 183,8 189 z-score: 1 0 1 1,675 Uitwiskeling live! 20 november 2004
Lengtes vergelijken (9/12) Je kunt ook voor beide personen hun plaats in de totale populatie bekijken. Je berekent daartoe het percentage 18-jarigen dat kleiner is dan Jeroen (resp. zijn grootvader). Wie is volgens dit criterium het grootst? Uitwiskeling live! 20 november 2004
Lengtes vergelijken (10/12) Op een figuur: Uitwiskeling live! 20 november 2004
Lengtes vergelijken (11/12) Berekening: 95,3 % van de leeftijdsgenoten van Jeroen is kleiner dan Jeroen 96,3 % van de toenmalige leeftijdsgenoten van de grootvader waren kleiner dan de grootvader Uitwiskeling live! 20 november 2004
Lengtes vergelijken (12/12) Besluit: de grootvader is groter dan zijn kleinzoon. Uitwiskeling live! 20 november 2004
Normale verdeling als wiskundig model Tweede graad: beschrijvende statistiek = grafisch en numeriek gereedschap om gegevens te beschrijven Derde graad: algemeen patroon van een groot aantal waarnemingen beschrijven d.m.v. een gladde kromme Uitwiskeling live! 20 november 2004