Gegevens verzamelen Statistiek gaat over het verzamelen en verwerken van data (gegevens ) Data zijn vaak gespreid: -mensen hebben verschillende lengtes , of IQ, of ….. Een levend histogram -flesjes bier uit eenzelfde partij hebben een verschillende inhoud -analyses van eenzelfde monster geven verschillende uitslagen monster 1 2 3 gehalte (g/mL) 12,4 11,9 12,0
Spreidingsmaten De mate van spreiding varieert afhankelijk van de oorzaak van de spreiding: -verschillen in lengtes (en IQ en….) van mensen worden veroorzaakt door ……. verschillende en veranderende genen -de inhoud van flesjes bier varieert doordat ……… de vulmachine niet steeds precies hetzelfde volume doseert -analyse uitslagen verschillen door ……… een groot aantal invloeden waaronder aflees- en instrumentonnauwkeurigheid populatie Hoe bepaal je de mate van spreiding zonder alles te willen onderzoeken? Door een steekproef te nemen uit de totale populatie steekproef
Steekproeven Steekproef nemen uit de totale populatie Eisen aan steekproef: -aselect -representatief Aselect = niet uitgezocht (random) Representatief = steekproef en populatie hebben dezelfde samenstelling Is dit een goede steekproef? Een leerling van de middelbare school wil voor zijn profielwerkstuk onderzoeken hoeveel er gerookt wordt door medeleerlingen. Hij gaat daarom aan het begin van de pauze buiten staan en vraagt aan de eerste 10 leerlingen die naar buiten komen of ze roken of niet.
Steekproeven Steekproef nemen uit de totale populatie Eisen aan steekproef: -aselect -representatief Aselect = niet uitgezocht (random) Representatief = steekproef en populatie hebben dezelfde samenstelling Is dit een goede steekproef? Bij een opiniepeiling moet je bellen om je mening te kunnen geven.
Spreidingsmaten Steekproef nemen uit de totale populatie Nieuwe reeks data (voorbeeld): 23, 21, 25, 24, 27, 23, 23, 19, 21, 18, 27 Wat gaan we doen? -ordenen -getallen bepalen -grafisch weergeven Ordenen 18, 19, 21, 21, 23, 23, 23, 24, 25, 27, 27 min Middelste = mediaan Meest voorkomende = modus Gemiddelde = 22,8 max
Boxplot Gesorteerde data grafisch weergeven 18, 19, 21, 21, 23, 23, 23, 24, 25, 27, 27 min max mediaan onderste helft = eerste kwartiel mediaan mediaan bovenste helft = derde kwartiel Geeft een beeld van de verdeling van de meetwaarden boxplot Waar ligt het gemiddelde? 25 % 25 % 25 % 25 % Had je dat kunnen voorspellen?
Een rolmodel voor de analist