Overzicht Sessie 1 Inleiding De start: histogrammen beschrijven met een dichtheidsfunctie Voorbeeld Werksessie Commentaar Oppervlakte onder de normale dichtheidsfunctie, vuistregels Terugrekenen (?)
Oefening 1.a (Schotse soldaten)
Oefening 1.b (Schotse soldaten)
Oefening 1.c (Schotse soldaten)
Oefening 1.d (Schotse soldaten) tabel: 0.1888
Oefening 2.a (vissen) RELATIEVE frequenties !
Oefening 2.a (vissen)
Oefening 2.b (vissen) tabel: 111
Oefening 3 (dobbelstenen)
Oefening 4 (18-jarige mannen) geen tabel, slechts vier gegevens normaal verdeeld gemiddelde = 176.1 standaardafwijking = 7.7 aantal = 60 000 Ongeveer 1788 18-jarige mannen zijn afgerond 168 cm.
Oefening 5 (IQ)
Oefening 6 (vrouwen) PROBLEEM ! reden: klassenbreedte ≠1
Oefening 6 (klassenbreedte ≠ 1) Oplossing voorgesteld door de leerlingen: Als je een functie zoekt die het histogram benadert, is dit de perfecte oplossing. Maar ... wij willen meer. Wij willen het model loskoppelen van het histogram.
Oefening 6 (klassenbreedte ≠ 1) relatieve frequenties frequenties relatieve frequentiedichtheden delen door klassenbreedte
Oefening 6 (klassenbreedte ≠ 1)
Oefening 6 (klassenbreedte ≠ 1) De normale dichtheidsfunctie is een continu model voor (sommige) histogrammen op basis van relatieve frequentiedichtheid.
Oefening 6 (klassenbreedte ≠ 1) 5 0.2236 = 0.04472 x 5 relatieve frequentie ≠ HOOGTE van het rechthoekje = OPPERVLAKTE van het rechthoekje
Oefening 6 (klassenbreedte ≠ 1) 5 HOOGTE van het rechthoekje = relatieve frequentiedichtheid OPPERVLAKTE van het rechthoekje = relatieve frequentie
Relatieve frequentiedichtheid ? relatieve frequentiedichtheid is haalbaar voor leerlingen uit ASO – 3 uur relatieve frequentiedichtheid omzeilen (blijft wiskundig correct !) altijd klassenbreedte = 1 (cfr. oorspronkelijke versie in Uitwiskeling) OF normale dichtheidsfunctie en histogram niet op dezelfde figuur maken (cfr. HEWET-boekje) voor een andere aanpak, zie http://www.uhasselt.be/scholennetwerk, volg statistiek, lesmateriaal
Normale verdeling als wiskundig model Tweede graad: beschrijvende statistiek = grafisch en numeriek gereedschap om gegevens te beschrijven Derde graad: algemeen patroon van een groot aantal waarnemingen beschrijven d.m.v. een gladde kromme
Normale verdeling als wiskundig model “De gladde kromme die door het histogram is getekend geeft een compacte beschrijving van het algemeen patroon. Omdat deze kromme de volledige verdeling beschrijft in één enkele formule, is het in feite gemakkelijker hiermee te werken dan met de vertrouwde grafieken en numerieke samenvattingen. De kromme is een wiskundig model – een geïdealiseerde beschrijving – van de verdeling.”
Normale verdeling als wiskundig model “Het gebruik van geïdealiseerde wiskundige beschrijvingen van gecompliceerde objecten is een gangbaar en krachtig middel in de wetenschap, niet in het minst in de statistiek.” (D.S. Moore en G.P. McCabe, Statistiek in de praktijk, tweede druk p. 46)
Overzicht Sessie 1 Inleiding De start: histogrammen beschrijven met een dichtheidsfunctie Oppervlakte onder de normale dichtheidsfunctie, vuistregels Voorbeeld Werksessie Commentaar Terugrekenen (?)
Oppervlakte onder de normale dichtheidsfunctie Hoeveel procent van de vrouwen is tussen 164,5 cm en 179,5 cm lang? Via histogram: gezamenlijke oppervlakte van de drie rechthoeken (0,3464) Via dichtheidsfunctie: (ongeveer gelijk aan) oppervlakte onder de grafiek tussen 164,5 en 179,5 (0,3538)
Relatieve frequenties m.b.v. de normale dichtheidsfunctie We onthouden: Relatieve frequentie van een klasse van normaal verdeelde data = oppervlakte van het gebied onder de normale dichtheidsfunctie tussen de grenzen van de klasse
Relatieve frequenties m.b.v. de normale dichtheidsfunctie ([2nd] [DISTR] DISTR) ([2nd] [DISTR] DRAW) of of
Relatieve frequenties m.b.v. de normale dichtheidsfunctie Let op: ClrDraw (in [2nd] [DRAW] DRAW) uitvoeren (om voorgaande tekening te verwijderen) Functies en plots afzetten (want die worden ook getekend) Tekenvenster goed instellen
pdf en cdf pdf cdf = probability density function = (kans)dichtheidsfunctie cdf = cumulative distribution function = verdelingsfunctie
Relatieve frequenties m.b.v. de normale dichtheidsfunctie Besluit (cfr. eindterm 36) Bij een normale verdeling is de relatieve frequentie van een verzameling gegevens met waarden tussen twee gegeven grenzen, met waarden groter dan een gegeven grens of met waarden kleiner dan een gegeven grens te interpreteren als de oppervlakte van een gepast gebied.
Overzicht Sessie 1 Inleiding De start: histogrammen beschrijven met een dichtheidsfunctie Oppervlakte onder de normale dichtheidsfunctie, vuistregels Voorbeeld Werksessie Commentaar Terugrekenen (?)
Overzicht Sessie 1 Inleiding De start: histogrammen beschrijven met een dichtheidsfunctie Oppervlakte onder de normale dichtheidsfunctie, vuistregels Voorbeeld Werksessie Commentaar Terugrekenen (?)
Oefening 1 Bij het eerste schermpje iets vertellen over het instellen van het venster: gemiddelde +/- 3 keer de standaardafwijking geeft goed resultaat; grenzen voor y zijn minder gemakkelijk in te stellen
Oefening 2 1 ! Totale relatieve frequentie? = 1 (evident!) controle met het rekentoestel: 1 ! TOTALE relatieve frequentie: van tot +
Oefening 3
Oefening 4 (vuistregels) het -gebied: gegevens die hoogstens 1 s.a. van het gemiddelde afwijken analoog voor 2-gebied en 3-gebied
Vuistregels het -gebied 68%
Vuistregels het 2-gebied 95%
Vuistregels het 3-gebied 99,7%
Normale verdeling: beschrijvende statistiek of kansrekenen functie die een histogram benaderend beschrijft alleen uitspraken over de onderzochte groep bv. hoeveel procent van de 5000 onderzochte vrouwen hebben een lengte tussen 165,5 cm en 171,5 cm? relatieve frequenties KANSREKENEN dichtheidsfunctie van een stochastische veranderlijke uitspraken over de populatie (eigenlijk: een lukrake trekking uit de populatie) bv. we trekken lukraak een vrouw uit volledige populatie Nederlandse vrouwen uit 1947; hoe groot is de kans dat deze vrouw een lengte heeft tussen 165,5 cm en 171,5 cm? kansen