Hoofdstuk 2: Frequentieverdelingen

Slides:



Advertisements
Verwante presentaties
havo A Samenvatting Hoofdstuk 2
Advertisements

Overzicht Sessie 1 Inleiding
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Klas 2 Hoofdstuk 7 Moderne Wiskunde HAVO/VWO
vwo A/C Samenvatting Hoofdstuk 3
Staafdiagram Strookdiagram
Dynamische tijdbalk Een dynamische tijdbalk geeft een uitvergroot deel van de algemene tijdbalk weer. Hij heet dynamisch omdat hij er voor elke periode.
Een manier om problemen aan te pakken
Statistiek HC1MBR Statistiek.
Staaf- en cirkeldiagram
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW Guido Valkeneers.
Experimenteel onderzoek
Tabellen Metingen schrijf je meestal op in een tabel
Statistiek Niveua 3 Kerntaak 5 Blz. 81.
Kan je zelf een geschikte schaalverdeling maken
vwo A/C Samenvatting Hoofdstuk 2
De normale verdeling.
Niet-rechtlijnige beweging Vr.1
Hoofdstuk 3 Maatstaven voor ligging en spreiding
De normale verdeling (1)
vwo A/C Samenvatting Hoofdstuk 5
vwo C Samenvatting Hoofdstuk 14
De grafiek van een lineair verband is ALTIJD een rechte lijn.
Presentatie Inhouden en vergrotingen.
Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.
Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Hoofdstuk 9 Verbanden, correlatie en regressie
Hoofdstuk 7 – Frequentieverdeling
Meten bij marktonderzoek
Hoofdstuk 6 – Tabellen en grafieken
variabelen vaststellen
Eekhoutcentrum – oktober 2005 Johan Deprez – Hilde Eggermont
Hoofdstuk 1 Basisvaardigheden.
Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 4.
AARDRIJKSKUNDE.
Hogere wiskunde Limieten college week 4
havo A Samenvatting Hoofdstuk 4
havo/vwo D Samenvatting Hoofdstuk 4
HULPMIDDELEN IN DE AARDRIJKSKUNDE
Experimenteel onderzoek
Hoofdstuk 4 Vlakke figuren.
Procenten 3 havo.
HISPARCWOUDSCHOTEN 2006NAHSA Tellen van Random gebeurtenissen Hoe nauwkeurig is een meting?
Basisvaardigheden: Metingen en diagrammen
havo B Samenvatting Hoofdstuk 1
Vergelijkingen oplossen
Centrummaten en Boxplot
Inleiding in de statistiek voor de gedragswetenschappen
Baarde en de goede Hoofdstuk 11: Data-analyse
6 Vaardigheden 6.1 Rekenvaardigheden Rekenen in verhouding
Samenvatting.
H4 Statistiek Beelddiagram
Grafieken in de natuurkunde Ga verder Dia’s worden stap voor stap automatisch ingevuld Ga verder Pas als rechtsonder verschijnt, klik dan voor de volgende.
Absolute aantallen en relatieve aantallen
Deze les hfdst 1 verbanden gegevens verwerken
Hoofdstuk 6 Rapportage en presentatie verkoopcijfers
Kwantitatieve onderzoeksresultaten
Hoe maak je een grafiek? Tabellen & Diagrammen.
Kan je zelf een geschikte schaalverdeling maken
Onderzoek Basisstof 6.
De grafiek van een lineair verband is ALTIJD een rechte lijn.
Kan je zelf een geschikte schaalverdeling maken
3 vmbo-KGT Samenvatting Hoofdstuk 10
Rekenen periode 4: Verbanden
Rekenen Verbanden les 1: gegevens verwerken Verbanden les 2: gegeven in tabellen.
Kwantitatieve kenmerken
De gehele getallen op een getallenas en in een assenstelsel
Hoofdstuk 20 Grafieken en tabellen. Hoofdstuk 20 Grafieken en tabellen.
Beschrijvende Statistiek met Grafische rekenmachine 101
Transcript van de presentatie:

Hoofdstuk 2: Frequentieverdelingen Absolute, relatieve en cumulatieve frequentie Tabellen en grafieken 1. Frequentietabellen 2. Classificeren van waarnemingen 3. Grafieken

Absolute, relatieve en cumulatieve frequentie Gegevens, data = ongeordend aanschouwelijk voorstellen: in tabelvorm grafisch Classificeren datareductie informatieverlies

De absolute frequentie Totaal aantal waarnemingen: populatiegrootte: N steekproefgrootte: n Absolute frequentie f = het aantal keren dat een kenmerk Xi wordt waargenomen (geteld) 3 stappen: selecteren, sorteren, tellen

De relatieve frequentie Relatieve frequentie rel.fi = absolute frequentie gedeeld door de totale frequentie in decimalen (fractie van 1) in procenten Som relatieve frequenties = 1 of 100%

De cumulatieve frequentie Ndz. een bepaalde volgorde in de uitkomsten (b.v. van klein naar groot): hoeveel waarnemingen zijn groter/kleiner dan een bepaalde waarde?

De cumulatieve frequentie (2) de cumulatieve frequentie vanaf de grootste waarde Fg = het aantal waarnemingen dat groter dan of gelijk is aan een bepaalde grenswaarde of hoeveel waarden zijn in het schaalpunt of erboven gelegen

De cumulatieve frequentie (3) de cumulatieve frequentie vanaf de kleinste waarde Fk = het aantal waarnemingen dat kleiner dan of gelijk is aan een bepaalde grenswaarde of hoeveel waarden zijn in het schaalpunt of eronder gelegen

De cumulatieve frequentie (4)  F = Fk + Fg = n + f n bij niet-geclassificeerde waarnemingen  F = Fk + Fg = n (of N) bij geclassificeerde waarnemingen ook: relatief cumulatieve frequenties

Hoofdstuk 2: Tabellen en grafieken Frequentietabellen rijen, kolommen, velden/cellen Richtlijnen: een tabel moet overzichtelijker zijn dan de lijst aparte waarnemingen bij voorkeur indelen naar maximum drie gezichtsvelden getallen met meer dan 3 cijfers worden afgerond internationale afspraken voor gebruik van tekens

Classificeren van waarnemingen (1) samennemen van naburige schaalpunten van een variabele in een beperkt aantal klassen Doel: data-reductie

Classificeren van waarnemingen (2) 3 manieren: zoals het de onderzoeker uitkomt zó dat elke klasse evenveel van de oorspronkelijke schaalpunten bevat (elke klasse is even breed) zó dat iedere klasse een bepaald aantal –gelijk of ongelijk- waarnemingen bevat

Classificeren van waarnemingen (3) Aanbevelingen voor het classificeren van waarnemingen: het aantal klassen ligt bij voorkeur tussen 5 en 20; vuistregel is ongeveer √n klassen te nemen men streeft naar een gelijk klasse-interval (gelijke klassebreedte) vermijdt lege klassen of klassen met weinig waarnemingen (frequentieverdelingen « met een staart »)

Classificeren van waarnemingen (4) vermijdt open klassen aan het begin of einde (soms echter noodzakelijk) klassegrenzen mogen elkaar niet overlappen en moeten aaneensluiten (categorisch systeem!) voor klassegrenzen en –middens kiest men best ronde getallen bepaalt men de klassegrenzen op één rang meer dan de waarnemingen, dan kan er nooit twijfel bestaan in welke klasse een waarneming valt.

Keuze klassegrenzen en –middens (mi) [161 cm – 171 cm[ mi = 166 cm [171 cm – 181 cm[ 176 cm ]160 cm – 170 cm] mi = 165 cm ]170 cm – 180 cm] 175 cm 160,5 cm – 170,5 cm mi = 165,5 cm 170,5 cm – 180,5 cm 175,5 cm

Waarnemingsresultaten Stap voor stap (1) Waarnemingsresultaten hoogste: Xmax. turven: frequenties laagste: Xmin. Uitbijters? Ja  schrappen aan beide uiteinden Range: R = Xmax. – Xmin.

Kleinste waarneming moet in de laagste klasse liggen Stap voor stap (2) Bepaling klassebreedte: i = R / √ n als n<40: R/6 als n>400: R/20 Kleinste waarneming moet in de laagste klasse liggen Bepaling klassemiddens: mi = (bi + Bi ) / 2

Frequentietabel: voorbeeld Lichaamslengte 35 studenten van een klas Klasse (cm) mi fi rel.fi (%) Fk Fg  F rel.Fk rel.Fg ]150-158] 154 4 11,4 35 0,0 100 ]158-166] 162 9 25,7 31 88,6 ]166-174] 170 12 34,3 13 22 37,1 62,9 ]174-182] 178 7 20,0 25 10 71,4 28,6 ]182-190] 186 3 8,6 32 91,4 totaal Cumulatieve frequenties bepaald op de benedengrens!

Frequentiedichtheid Wat? Frequentiedichtheid = frequentie/klassebreedte fd = fi / i Nut? Om klassen te vergelijken met ongelijke klassebreedte Belangrijkste klasse is deze met de hoogste frequentiedichtheid (dichtste bezetting)

Stem and leaf-diagram Wat? Combinatie van een tabel en een grafiek 90° Voorbeeld: afstand huis-school van 43 studenten 90° stam loof fi 5 7 0 1 2 8 7 3 0 8 6 3 12 1 5 8 2 2 4 9 0 3 5 4 8 0 5 6 14 2 3 1 5 6 8 6 0 4 8 3 9 2 4 4 8 3 9 1 0 5 6

Hoofdstuk 2: Grafieken Indeling: frequentiediagrammen tijdreeksgrafieken spreidings- of correlatiediagrammen specifieke voorstellingswijzen

Grafieken (1): frequentiediagrammen 3 soorten: histogrammen en kolommendiagrammen frequentieveelhoeken (-polygonen) frequentiecurven (waarschijnlijkheidsverdelingen)

Frequentiediagrammen Algemeen kenmerk: vertikale as = frequentieas absolute frequentie (fi ) relatieve frequentie (rel.fi ) cumulatieve frequentie vanaf de kleinste waarde (Fk ) vanaf de grootste waarde (Fg ) relatief cumulatieve frequenties (rel.Fk en rel.Fg ) horizontale as = meetschaal

Histogrammen en kolommendiagrammen continue kenmerken reeks rechthoeken opp. evenredig met frequentie kenmerk sluiten aan elkaar absoluut, relatief, cumulatief, relatief cumulatief twee- en driedimensionaal Kolommendiagram discontinue kenmerken los van elkaar getekend grotere vrijheid in de vorm (b.v. cilinders, objecten …)

Cumulatieve frequenties bepaald op de benedengrens! Frequentiediagrammen: voorbeeld (1) Lichaamslengte 35 studenten van een klas Klasse (cm) mi fi rel.fi (%) Fk Fg  F rel.Fk rel.Fg ]150-158] 154 4 11,4 35 0,0 100 ]158-166] 162 9 25,7 31 88,6 ]166-174] 170 12 34,3 13 22 37,1 62,9 ]174-182] 178 7 20,0 25 10 71,4 28,6 ]182-190] 186 3 8,6 32 91,4 totaal Cumulatieve frequenties bepaald op de benedengrens!

Frequentiediagrammen: voorbeelden (2) 1. Absoluut histogram

Frequentiediagrammen: voorbeelden (3) 2. Staafdiagram 3. Frequentieveelhoek/-polygoon

Frequentiediagrammen: voorbeelden (4) 4. Relatief cumulatief frequentiehistogram vanaf de kleinste waarde 5. Relatief cumulatief frequentiepolygoon vanaf de kleinste waarde De (relatief) cumulatieve frequentie- veelhoeken worden geconstrueerd op de benedengrens (of bovengrens)

Histogrammen: varianten puntendiagram klassemiddens staafdiagram loodrechte projectie van de klassemiddens frequentieveelhoek (-polygoon) klassemiddens verbinden; uiterste klassen verbinden met klassemiddens fictieve aanliggende klassen met nulfrequentie frequentiecurve klassemiddens verbinden door vloeiende lijn

Gestapelde frequentiediagrammen Mogelijkheid om histogrammen en kolommendiagrammen te stapelen - absoluut - relatief - voordeel: evolutie van het totaal is gemakke-lijker af te lezen - nadeel: evolutie van de aparte kenmerken is moeilijk of niet af te lezen

« Een grafiekje om bestwil »: misleiding met grafieken nulpunt/nullijn houdt geen verband met de resultaten en er wordt geen scheurlijn/breuklijn gebruikt de verhouding op de assen klopt niet met de realiteit de kolommen worden uitgezet op een stijgende lijn (dus niet op dezelfde hoogte) de afstanden op de X-as zijn niet evenredig (bepaalde periodes worden weggelaten) bepaalde resultaten worden extra in de verf gezet, b.v. op een cirkeldiagram « Kans op onjuiste diagrammen in een jaarverslag is 47% »

Aanbevelingen voor grafieken bij niet rangschikbare kenmerken: volgorde staven/kolommen speelt geen rol; aanbeveling: rangschikken van klein naar groot of van groot naar klein ondelinge afstand tussen de kolommen is willekeurig klassen samenvoegen: de totale frequentie delen door het aantal samengenomen klassen soms is het nuttig de oorsprong van het assenstelsel te verleggen: gebruik een scheurlijn of breuklijn op de assen: schaalpunten en meeteenheid vermelden, niet de exacte waarnemingen.

Waarschijnlijkheidsverdelingen homogene verdelingen normale verdelingen: - spits, normaal en vlak scheve verdelingen: scheef naar links scheef naar rechts eentoppige, tweetoppige en meertoppige verdelingen U-vormige verdelingen J-vormige en omgekeerd J-vormige verdelingen

Hoofdstuk 2: Grafieken Indeling: frequentiediagrammen tijdreeksgrafieken spreidings- of correlatiediagrammen specifieke voorstellingswijzen

Tijdreeksgrafieken horizontale as = tijdsas Algemeen kenmerk: vertikale as = meetschaal Soorten: lijn(en)diagram stralendiagram sterdiagram, poolcurve of radardiagram

Tijdreeksgrafieken (1): lijn(en)diagram b.v. verloop beurskoersen temperatuurverloop in een maand evolutie elektriciteitsverbruik in 24u

Tijdreeksgrafieken (2): stralendiagram (1) Het resultaat in de basisperiode wordt gelijkgesteld aan 100 en alle volgende uitslagen worden omgerekend naar die basis 2000 2001 2002 Product A 40.000 36.000 58.000 100 90 145 Product B 150.000 157.500 180.000 105 120 Product C 20.000 50.000 250 200

Stralendiagram (2):

- relatieve groei onmiddellijk af te lezen Stralendiagram (3) Voordelen: - relatieve groei onmiddellijk af te lezen - resultaten gemakkelijk te vergelijken Nadelen: - geen absolute resultaten - onmogelijk af te lezen welke reeks de hoogste scores heeft

Tijdreeksgrafieken (3): radardiagram/poolcurve/sterdiagram Concentrisch opgebouwde grafiek, af te lezen in wijzerszin toepassingen: - samenstellen homogene teams (complementaire vaardigheden) - bezettingsgraden infrastructuren in bepaalde periode - kwaliteitsvergelijking reeks producten - illustreren van het seizoenkarakter van verschijnselen

Radardiagram/poolcurve/sterdiagram (2)

Radardiagram/poolcurve/sterdiagram (3) Voordelen: - moderne vorm van grafische voorstelling - mogelijk veel info op één grafiek - bij goed gebruik zeer praktisch Nadelen: - zeer specifiek - moeilijk af te lezen door de leek - als de volgorde van de uitslagen wordt gewijzigd, dan verandert de vorm/het uitzicht van de grafiek

Hoofdstuk 2: Grafieken Indeling: frequentiediagrammen tijdreeksgrafieken spreidings- of correlatiediagrammen specifieke voorstellingswijzen

Spreidings-, correlatie- of scatterdiagrammen (1) Gebruik: om grafisch de samenhang tussen twee kenmerken na te gaan Opbouw: horizontale as: kenmerk 1 = oorzaak vertikale as: kenmerk 2 = gevolg de bekomen combinaties liggen meestal in het eerste kwadrant van de grafiek

Spreidingsdiagrammen (2) Soorten: correlatiediagrammen laddergrafieken grafiek van Claparède

Correlatiediagrammen

Laddergrafieken Wat? Visuele methode om samenhang tussen twee kenmerken te illustreren Hoe? 2 reeksen uitslagen rangschikken (van klein naar groot of omgekeerd)  corresponderende rangorden verbinden - geen snijpunten: volmaakte ladder: 100% positieve correlatie - 1 snijpunt: volmaakte negatieve correlatie: 100% neg. corr. - veel snijpunten: geen correlatie Opm. 1 afwijkende uitslag kan zorgen voor heel wat snijpunten

- 1 snijpunt: grote negatieve correlatie Grafiek van Claparède Wat? 2 tijdreeksgrafieken boven elkaar geplakt Aflezing? - grafieken evenwijdig: grote positieve correlatie - 1 snijpunt: grote negatieve correlatie - veel snijpunten: weinig/geen correlatie

Hoofdstuk 2: Grafieken Indeling: frequentiediagrammen tijdreeksgrafieken spreidings- of correlatiediagrammen specifieke voorstellingswijzen

Grafieken: specifieke voorstellingswijzen Overzicht: cirkeldiagrammen en taartpuntdiagrammen stroomdiagrammen (flow-charts) beeldstatistieken cartogrammen driehoeksdiagrammen bevolkingspiramiden

Grafieken: specifieke voorstellingswijzen Overzicht: cirkeldiagrammen en taartpuntdiagrammen stroomdiagrammen (flow-charts) beeldstatistieken cartogrammen driehoeksdiagrammen bevolkingspiramiden

Cirkeldiagrammen (1) Wellicht de meest gebruikte soort grafieken Wat? - de cirkel wordt verdeeld in sectoren recht evenredig met de waarde van het voorgestelde verschijnsel - zowel de oppervlakte van het segment als de middelpuntshoek zijn een maat voor de resultaten - afspraken: maximum 6 à 10 sectoren aflezing starten op 12 uur aflezing in wijzerzin volgorde van de sectoren respecteren kleurlegende/arcering: een duidelijk onderscheid is noodzakelijk

Cirkeldiagrammen (2) Mogelijkheden: - twee- en driedimensionaal - taartpunten uit de taart geschoven De oppervlakte van de cirkel is evenredig met het totale resultaat: S2 / S 1=  R22 /  R12  R2 = R1 *  T2 / T1  T2 = T1 * R22 / R12 __

Cirkeldiagrammen (3)

Stroomdiagrammen / flow charts met pijlen wordt de richting aangegeven waarin grootheden zich bewegen de breedte van de pijlen geeft de omvang van de verschijnselen weer mogelijkheid om complexe systemen overzichtelijk voor te stellen in één diagram b.v. energieverbruik in een regio klantenbewegingen in een winkelcomplex

Beeldstatistieken meest bekend bij het publiek zeer toegankelijk want extreem suggestief beeldjes illustratief voor verschijnselen aantal beeldjes zijn maat voor omvang kenmerken eerder illustratief dan nauwkeurig

Cartogrammen Combinatie van een kaart en een grafiek: geven de ruimtelijke verspreiding van kenmerken weer veelal gebruik van conventionele symbolen kennis van ruimtelijke entiteiten is noodzakelijk

Driehoeksdiagrammen Gebruik? relatieve frequentieverdelingen van 3 kenmerken in een categorisch systeem Vorm? gelijkzijdige driehoek, elke zijde wordt verdeeld in 100% Aflezing? - geografen: in tegenwijzerzin - economisten: in wijzerzin Toepassingen: - bevolkingsopbouw - verdeling actieve bevolking over de economische sectoren - textuurdriehoek (bodemkunde)

Bevolkingspiramiden (1) Wat? de grafische voorstelling van de samenstelling van een bevolking naar geslacht en leeftijd Opbouw? twee histogrammen, basis tegen basis: - vertikale as: leeftijdsklassen (1 of 5 jaar) - horizontale as: mannen (links) of vrouwen (rechts) in procent of promille

Bevolkingspiramiden (2) Soorten bevolkingspiramiden: basiszwaar theoretisch (gelijkbenig) topzwaar b.v. bevolkingspiramiden N.I.S. : het rijk, de gewesten, provincies, gemeenten