“Verschillen” een statistiek hoofdstuk

Slides:



Advertisements
Verwante presentaties
BRIDGE Vervolgcursus Vervolg op starterscursus Bridgeclub Schiedam ‘59 info: Maandagavond: 19: – of
Advertisements

Bij een herhaald experiment, met telkens dezelfde kans op succes gebruiken we de binomiale kansverdeling Een binomiale kansverdeling wordt gekenmerkt door.
Overzicht Sessie 1 Inleiding
Aflezen van analoge en digitale meetinstrumenten
Lees- en Taalproblemen
Les 4 Hoofdstuk 6: Speeltechnieken Hoofdstuk 7: Speeltechnieken troef.
Beter afspelen.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Tabellen & diagrammen Centrummaten & Spreiding
H1 Basis Rekenvaardigheden
dy dx De afgeleide is de snelheid waarmee y verandert voor x = xA
vwo A/C Samenvatting Hoofdstuk 3
dia's bij lessenserie Pythagoras ± v Chr.
Les 8 Hoofdstuk 12: Communicatie.
vwo A/C Samenvatting Hoofdstuk 6
Les 2 De antwoorden na een opening van 1 in een kleur
Statistiek HC1MBR Statistiek.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Statistiek Niveua 3 Kerntaak 5 Blz. 81.
Kb.1 Ik leer op een goede manier optellen en aftrekken
havo A Samenvatting Hoofdstuk 11
havo A Samenvatting Hoofdstuk 8
Kenmerken Veel aanbieders Vrije toe- en uitreding Homogene goederen
De normale verdeling.
vwo A Samenvatting Hoofdstuk11
vwo A Samenvatting Hoofdstuk 13
vwo C Samenvatting Hoofdstuk 14
vwo C Samenvatting Hoofdstuk 12
Centrummaten gemiddelde
Continue kansverdelingen
Eekhoutcentrum – oktober 2005 Johan Deprez – Hilde Eggermont
Δ x vgem = Δ t Eenparige beweging
ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B
Statistiek voor Dataverwerking
havo/vwo D Samenvatting Hoofdstuk 4
Basisstof 9: Variatie in lengte en gewicht
Statistiekbegrippen en hoe je ze berekent!!
1 van 8 Bernoulli-stochasten & Binomiale stochasten © CI 2003.
H4 Differentiëren.
Begrippen hoofdstuk 3.
Hoofdstuk 9 havo KWADRATEN EN LETTERS
Inleiding in de statistiek voor de gedragswetenschappen
Vergelijkingen oplossen
Boxplot en steelbladdiagram
Centrummaten en Boxplot
Inleiding in de statistiek voor de gedragswetenschappen
Baarde en de goede Hoofdstuk 11: Data-analyse
Hoogbegaafdheid van leerlingen in het primair onderwijs Ontwikkelingen en samenhangen met kenmerken van thuis, de groep en de school     Uitgegeven.
Kansrekening Herhaling H1 , H4 &H6
Gecijferdheid les 1.4 Grootst gemene deler Kleinst gemene veelvoud
Workshop C verhouding van inhoud, lengte en oppervlakte &
H4 Statistiek Beelddiagram
Kansverdelingen Kansverdelingen Inleiding In deze presentatie gaan we kijken naar hoe kansen zijn verdeeld. We gaan in op verschillende.
Meten en meetkunde in het verkeer
Herhalen schaal Schaal is een verhouding.
Deze les nieuwe opzet Instructietafel links in de klas
Absolute aantallen en relatieve aantallen
Deze les hfdst 1 verbanden gegevens verwerken
Les 8 meten en meetkunde in huis
Statistiek met grote datasets op de TI 84 Peter Vaandrager
Minimodules voor de 3e klas
Les 4: Rekenen met verhoudingen in dagelijkse situaties
Zeeslag Bron: csunplugged.org / csunplugged.nl.
3 vmbo-KGT Samenvatting Hoofdstuk 10
Rekenen periode 4: Verbanden
De normale verdeling Eigenschappen en vuistregels
Kwantitatieve kenmerken
Hoofdstuk 20 Grafieken en tabellen. Hoofdstuk 20 Grafieken en tabellen.
Transcript van de presentatie:

“Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO “Verschillen” een statistiek hoofdstuk

De politiechef van Amsterdam zegt dat de criminaliteit hoog is onder Marokkanen. Waarom is statistisch onderzoek hierbij belangrijk? Hoe zou je dit statistisch onderzoeken?

Het gaat steeds om verschillen tussen twee groepen. We gaan bekijken: Vertikaal vergelijken, horizontaal percenteren Odds-ratio Maximaal cummulatief percentage verschil via tabel, reepdiagram en cum.freq. polygoon Overlap Effectgrootte

geslacht wisgroep totaal A/C B man 13 56 69 vrouw 30 55 85 43 111 154 Bereken het percentageverschil tussen mannen en vrouwen in de A/C groep. 13 en 30 t.o.v. 43 berekenen heeft geen zin, omdat je dan geen rekening houdt met het feit dat er meer vrouwen dan mannen zijn . Je berekent eerst hoeveel procent van de vrouwen in de A/Cgroep zitten. Ook hoeveel procent van de mannen. Dan is het percentageverschil 30/85x100% - 13/69x100% = 16%

De regel is bij vertikaal vergelijken moet je eerst horizontaal percenteren. Als bij mannen en vrouwen een derde deel voor A/C had gekozen, was dit percentage -verschil nul geweest.

deel nu de grootste door de kleinste -> 2,34.. geslacht wisgroep totaal A/C B man 13 56 69 vrouw 30 55 85 43 111 154 Een andere manier van vergelijken is de Odds-ratio Bereken twee delingen: bijvoorbeeld 13/56 = 0,23.. en 30/55=0,54… deel nu de grootste door de kleinste -> 2,34.. We noemen tussen 2 en 3 het verschil middelmatig ( <2 is gering >3 is groot )

De Odds-ratio kan alleen berekend worden bij een tabel met 2 maal 2 variabelen. Wat te doen bij meer variabelen?

Ook is het mogelijk om een tabel met cum. kunstbelangstelling A/C B niet 8 11 gering 27 middelmatig 43 vrij groot 9 17 groot 2 10 zeer groot 3   111 Het is mogelijk om de bovenste 3 variabelen en de onderste 3 samen te nemen. Zo is toch met 2 maal 2 variabelen te werken en de odds-ratio te berekenen. Ook is het mogelijk om een tabel met cum. frequentie in procenten te maken.

Bij een maximaal Vcp van minder dan 15% noemen we het verschil gering kunstbel cum. A/C B Vcp niet 19% 10% 9% gering 44% 34% middelmatig 70% 73% 3% vrij groot 80% 88% 8% groot 95% 97% 2% zeer groot 100% 0%  Bij een maximaal Vcp van minder dan 15% noemen we het verschil gering (15%-30% ->middelmatig, meer dan -> 30% groot)

Reepdiagram van de kunstbelangstelling Het maximale Vcp is bij een reepdiagram te zien als de steilste verbindingslijn

Dit zijn nieuwe gegevens Bij twee cum. freq. polygonen is het maximale Vcp te zien als de langste vertikale verbindingslijn. (natuurlijk komt een boxplot hieronder ook ter sprake)

Hieronder zijn de scores 7, 10 en 16 op een getallenlijn door balletjes weergegeven en de plaats van het gemiddelde met een wigje . De drie scores wijken respectievelijk -4, -1 en +5 af van het gemiddelde. Dat is in het plaatje met pijlen aangegeven. De afwijkingen noemt men deviaties; daarvoor gebruikt men de letter d (van deviatie = afwijking). De drie d-waarden zijn hier respectievelijk −4, −1 en +5. d = −4 d = −1 d = +5 5 6 7 8 9 10 11 12 13 14 15 16

Met de deviaties wordt eerst de variantie en daarna de standaard afwijking uitgerekend.   Voor veel verdelingen geldt de volgende vuistregels: Tussen het gemiddelde-min-sd en het gemiddelde-plus-sd ligt ongeveer 68% van de gehele verdeling. Tussen het gemiddelde-min-2-keer-sd en het gemiddelde-plus-2-keer-sd ligt ongeveer 95% van de gehele verdeling.

Overlap   Bij een onderwijskundig onderzoek wordt in twee vergelijkbare klassen een wiskundig begrip op twee verschillende manieren uitgelegd: een traditionele manier en een nieuwe manier. In de twee klassen werd de uitleg afgesloten met dezelfde toets.

27 leerlingen, in de overlap 4 + 8 + 6 = 18 Niet in de overlap 9 van de 27 is ongeveer 33% Dit is een maat voor het effect van de nieuwe uitleg. Maar de groepen moeten even groot zijn.

Een laatste methode van vergelijken is de effectgrootte De effectgrootte is de waarde van de breuk: verschil tussen de gemiddeldes . gemiddelde van de standaardafwijkingen Als waardering van D is vrij gangbaar: D  0,4 gering 0,4 < D ≤ 0,8 middelmatig 0,8 < D  1,5 groot D > 1,5 erg groot

Onderzoek 2 Presteerden A/C-leerlingen in klas 3 even goed in wiskunde als B-leerlingen? Bereken - om deze vraag te beantwoorden - het maximale cumulatieve percentageverschil van cijfwis voor de A/C - en de B-groep. Hoe interpreteer je het gevonden verschil? (gebruik bij de Digfimap freq.tabel en splitsen)

Kansrekening Op dit moment beschikbaar: In de maak: Verdelingen Discrete verdelingen Normale verdeling In de maak: Toepassingen Toetsen

Inhoudsopgave Verdelingen Frequentieverdelingen Kans Op den duur … Simulaties Rekenen met kansen De som van de kansen is 1 Voorwaardelijke kansen

Voorbeeld De minilotto is een spel waarbij je twee nummers moet omcirkelen op een formulier:

Inhoudsopgave Discrete kansverdelingen Verwachtingswaarde en standaardafwijking Zonder terugleggen Wel/Niet De variantie

Voorbeeld Bij het kaartspel toepen worden alleen de kaarten B, V, H, A, 7, 8, 9, 10 gebruikt van elk van de kleuren schoppen, harten, ruiten en klaveren. De 10'en zijn de hoogste kaarten; het is gunstig als je veel 10'en hebt. Jan speelt het spel en krijgt vier willekeurige kaarten uit de 32 kaarten. Bereken de kans dat Jan precies twee 10'en krijgt.

Manier 1 Er zijn zes verschillende volgordes om twee 10’en te krijgen Manier 1 Er zijn zes verschillende volgordes om twee 10’en te krijgen. De kansen op elk van deze zes manieren blijken hetzelfde te zijn, namelijk De gevraagde kans is dus

Manier 2 Je moet twee van de vier 10’en krijgen en twee van de achtentwintig niet zijn viertallen waarbij dat het geval is. In totaal zijn er viertallen viertallen waarbij dat het geval is. In totaal zijn er viertallen De gevraagde kans is

Inhoudsopgave Normale verdeling Extreem weer Vele kleintjes middelen uit Wat is normaal? Standaardiseren Over continue verdelingen

Voorbeeld We bekijken de lengte van een groep 16-jarige jongens en van een groep 16-jarige meisjes. Bij de jongens is de gemiddelde lengte 178 cm en de sd 7 cm. Bij de meisjes is de gemiddelde lengte 168 cm en de sd 6 cm. Een jongen en een meisjes uit deze groepen krijgen verkering. Ze zijn beiden erg lang: de jongen 196 cm en het meisje 186 cm. Berekende z-waarde van de lengte van de jongen en van de lengte van het meisje om te bepalen wie van de twee de grootste uitschieter is qua lengte binnen zijn/haar groep .

Arie en Gré werken ’s nachts Arie en Gré werken ’s nachts. Na hun werk komen ze, onafhankelijk van elkaar, tussen middernacht en 1:00 uur aan bij een bushalte. Er vertrekken in het eerste uur van de dag drie bussen: om 0:15 uur, om 0:30 uur en om 1:00 uur. a. Hoe groot is de kans dat Arie en Gré allebei de bus van 0:30 uur hebben? b. Hoe groot is de kans dat Arie en Gré dezelfde bus hebben. Tip: teken zo nodig een passend plaatje in een eenheidsvierkant. c. Hoe groot is de kans dat Arie en Gré niet meer dan 10 minuten na elkaar bij de bushalte arriveren?

Gemengd normaal De lengte van 18-jarige jongens is normaal verdeeld met gemiddelde 180 en standaardafwijking 7 cm; de lengte van 18-jarige meisjes is normaal verdeeld met gemiddelde 170 en standaardafwijking 6 cm. Teken de twee verdelingskrommen in één figuur. We bekijken nu een grote groep van 18-jarigen, evenveel jongens als meisjes. De lengte in cm in die groep noemen we L. b. Teken met een andere kleur de verdelingskromme van L. c. Is L normaal verdeeld, denk je? Waarom? d. Bereken P(L < 175) als de gekozen persoon een jongen is en ook als de gekozen persoon een meisje is. Wat is dus P(L < 175) in de gemengde groep? e. Is L normaal verdeeld? Het is mogelijk de verdelingskromme van L op de GR te tekenen. Dan kun je zien dat L niet normaal verdeeld is. In het algemeen is “gemengd normaal” dus niet normaal.

Afsluiting Vragen? Bedankt voor jullie aandacht