Hoofdstuk 3 Maatstaven voor ligging en spreiding

Slides:



Advertisements
Verwante presentaties
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Advertisements

Statistische uitspraken over onbekende populatiegemiddelden
Overzicht Sessie 1 Inleiding
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Het belang van een goede steekproef
Tabellen & diagrammen Centrummaten & Spreiding
Dynamische tijdbalk Een dynamische tijdbalk geeft een uitvergroot deel van de algemene tijdbalk weer. Hij heet dynamisch omdat hij er voor elke periode.
Statistiek HC1MBR Statistiek.
havo A 4.4 Centrum- en spreidingsmaten
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW Guido Valkeneers.
Statistiek Niveua 3 Kerntaak 5 Blz. 81.
havo A Samenvatting Hoofdstuk 8
Beschrijvende en inferentiële statistiek
vwo A/C Samenvatting Hoofdstuk 2
Inleiding in de statistiek voor de gedragwetenschappen
Niet-rechtlijnige beweging Vr.1
De normale verdeling (1)
vwo B Samenvatting Hoofdstuk 1
vwo A/C Samenvatting Hoofdstuk 8
Centrummaten gemiddelde
Centrummaten gemiddelde
Beginselen van de Statistiek in de Kinesiologie
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Een fundamentele inleiding in de inductieve statistiek
Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Hoofdstuk 8 Centrale tendentie en spreiding
Hoofdstuk 7 – Frequentieverdeling
Eenvoudige data-analyse: beschrijvende statistische
Eenvoudige data-analyse: beschrijvende statistische
Eekhoutcentrum – oktober 2005 Johan Deprez – Hilde Eggermont
Populatiegemiddelden: recap
Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 4.
Methodologie & Statistiek I
Hoe ontstaat bevolkingsontwikkeling?
Inleiding in de statistiek voor de gedragwetenschappen
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW Guido Valkeneers.
Hogere wiskunde Limieten college week 4
ribwis1 Toegepaste wiskunde, ribPWI Lesweek 01
Statistiek voor Dataverwerking
havo/vwo D Samenvatting Hoofdstuk 4
Statistiekbegrippen en hoe je ze berekent!!
Begrippen hoofdstuk 3.
Inleiding in de statistiek voor de gedragswetenschappen
Inleiding in de statistiek voor de gedragswetenschappen
Inleiding in de statistiek in de gedragswetenschappen
Hoofdstuk 4: Statistiek
Boxplot … en andere diagrammen
Centrummaten en Boxplot
Inleiding in de statistiek voor de gedragswetenschappen
Baarde en de goede Hoofdstuk 11: Data-analyse
1 CCC & CCM Module Statistiek voor CM Drs. J.H. Gieskens AC CCM QT.
1 CCP Module 1: Theorie Statistiek voor Credit Managers Introductie Basisbegrippen Drs. J.H. Gieskens AC CCM QT.
Absolute aantallen en relatieve aantallen
Deze les hfdst 1 verbanden gegevens verwerken
IMATerials: audiomat  .
Gegevens verzamelen Statistiek gaat over het verzamelen en verwerken van data (gegevens ) Data zijn vaak gespreid: -mensen hebben verschillende lengtes.
6.4 Gemiddelde, mediaan en modus Centrummaten
Excel Statistiek en Excel.
Uitschieters Zijn alle gegevens wel bruikbaar?
Statistiek met grote datasets op de TI 84 Peter Vaandrager
Kwantitatieve onderzoeksresultaten
Eenvoudige data-analyse: beschrijvende statistische
Wetenschappelijk en significantie
3 vmbo-KGT Samenvatting Hoofdstuk 10
Kwantitatieve kenmerken
De natuurlijke getallen op een getallenas en in een assenstelsel
Beschrijvende Statistiek met Grafische rekenmachine 101
Transcript van de presentatie:

Hoofdstuk 3 Maatstaven voor ligging en spreiding 3.1. Centrummaten – Gemiddelden 3.2. Kwantielen 3.3. De spreidingsmaten

Centrummaten het rekenkundig gemiddelde de mediaan de modus bij niet-gegroepeerde waarnemingen bij gegroepeerde waarnemingen of frequentieverdelingen

Eigenschappen van kengetallen voor frequentieverdelingen a. eenduidig gedefinieerd zijn (ondubbelzinnig) b. alle waarnemingen spelen een rol bij de bepaling van het kengetal c. de interpretatie moet eenvoudig en inzichtelijk zijn d. de kengetallen moeten niet al te gevoelig zijn voor steekproeftoevalligheden, maar een grote steekproefstabiliteit bezitten e. met de kengetallen moeten algebraïsche bewerkingen mogelijk zijn

Het rekenkundig gemiddelde Wat? Het rekenkundig gemiddelde van een reeks waarnemingsresutaten is gelijk aan de som van alle resultaten gedeeld door het aantal waarnemingen (dit is de steekproef- of popultieomvang) Symbool: Formule:

Het rekenkundig gemiddelde: eigenschappen (1) 1. Vermindert men alle waarnemingen met een zelfde getal, dan wordt ook het rekenkundig gemiddelde verminderd met dat getal  men mag op de meetschaal een nieuwe oorsprong invoeren 2. Vermenigvuldigt men alle resultaten met een zelfde getal, dan wordt ook het rekenkundig gemiddelde met dit getal vermenigvuldigd (idem delen)  men mag alle resultaten vereenvoudigen

Het rekenkundig gemiddelde: eigenschappen (2) 3. De som van de afwijking van alle waarnemingsresultaten ten opzichte van hun rekenkundig gemiddelde is nul Opm. : het rekenkundig gemiddelde wordt in de statistiek altijd berekend op één rang meer dan de waarnemingsresultaten.

Het gewogen rekenkundig gemiddelde (1) Wat? Als niet aan alle waarnemingen een zelfde belang mag gehecht worden, vermenigvuldigt men elke waarde met een wegingsfactor en bepaalt men pas dan het rekenkundig gemiddelde

Het gewogen rekenkundig gemiddelde (2) Voorbeeld: examenuitslagen student D.V. Rekenkundig gemiddelde: Gewogen rek.gemiddelde: Vakken Resultaat op 10 studiepunten Economie 5 6 Statistiek 7 3 Recht 9 4

Het rekenkundig gemiddelde van gegroepeerde gegevens Formule: De klassemiddens worden representatief voor elke klasse: alle frequenties worden vermenigvuldigd met de overeenkomende klassemiddens

Centrummaten het rekenkundig gemiddelde de mediaan de modus bij niet-gegroepeerde waarnemingen bij gegroepeerde waarnemingen of frequentieverdelingen

aantal waarden < Me = aantal waarden > Me De mediaan (1) Wat? De mediaan van een reeks waarnemings-resultaten is de middelste van de naar grootte gerangschikte resultaten. De mediaan verdeelt een reeks resultaten in twee gelijke groepen: aantal waarden < Me = aantal waarden > Me Symbool: Me Synoniem: midscore

De mediaan (2) bij oneven aantal waarnemingen: Me = middelste van naar grootte gerangschikte bij even aantal waarnemingen: Me = rek. gemiddelde van middelste twee Bij gegroepeerde frequentieverdelingen: Me = tweede kwartiel (Q2) mediaanklasse: zie cumulatief frequentiehistogram

De modus Wat? De modus van een reeks waarnemingsresultaten is de waarneming die het meest voorkomt (= de uitslag met de hoogste frequentie) Symbool: Mo Opmerkingen: hebben alle resultaten in een reeks dezelfde frequentie, dan is er geen modus de modus is de enige centrummaat ook te gebruiken voor kwalitatieve kenmerken unimodale, bimodale, multimodale verdelingen

De modus bij gegroepeerde waarnemingen (1) de modale klasse is de klasse met de hoogste frequentie nauwkeuriger: f = frequentie modale klasse fl = frequentie (lagere) voorgaande klasse fh= frequentie (hogere) volgende klasse b = benedengrens modale klasse i = klasse-interval

De modus bij gegroepeerde waarnemingen (2) Grafische bepaling van de modus bij frequentieverdelingen: modale klasse Mo

Eigenschappen van kengetallen voor frequentieverdelingen a. eenduidig gedefinieerd zijn (ondubbelzinnig) b. alle waarnemingen spelen een rol bij de bepaling van het kengetal c. de interpretatie moet eenvoudig en inzichtelijk zijn d. de kengetallen moeten niet al te gevoelig zijn voor steekproeftoevalligheden, maar een grote steekproefstabiliteit bezitten e. met de kengetallen moeten algebraïsche bewerkingen mogelijk zijn

Keuze van de centrummaten (1) + - Rekenkundig gemiddelde voldoet in alle opzichten als centrummaat eign: a,b,c,d,e gevoelig voor uitbijters Mediaan ongevoelig voor uitbijters eign: a,b,c kleine steekproef-stabiliteit algebraïsch weinig mogelijkheden Modus snel te bepalen eign: a,c nagenoeg geen positieve eigen-schappen

Keuze van de centrummaten (2) De keuze hangt af van: het meetniveau de scheefheid van de verdeling extreme waarden

Keuze centrummaat in functie van het meetniveau ratio interval ordinaal nominaal Rek. gemidd.  Mediaan Modus

Keuze van de centrummaten (3) De keuze hangt af van: het meetniveau de scheefheid mogelijke extreme waarden

Keuze centrummaat in functie van de scheefheid (1a) Symmetrische verdelingen  normale verdelingen b.v. IQ-scores, de meeste natuurlijke verschijnselen

Keuze centrummaat in functie van de scheefheid (1b) Bimodale symmetrische verdelingen Mo1 Mo2

Keuze centrummaat in functie van de scheefheid (2) Scheef naar links (negatief scheef) b.v. lichaamsgewicht mannelijke 40-plussers in België Mo staart

Keuze centrummaat in functie van de scheefheid (3) Scheef naar rechts (positief scheef) b.v. belastbaar inkomen Belgische bevolking in € Mo staart

Keuze van de centrummaten (4) De keuze hangt af van: het meetniveau de scheefheid mogelijke extreme waarden

Keuze centrummaat in functie van mogelijke extreme waarden Extreme waarden (= uitbijters): beïnvloeden het gemiddelde  de mediaan is hier beter geschikt dan het rekenkundig gemiddelde Voorbeeld: 1 2 2 3 4 5 5 7 9 118 = 15,6 Me= 4,5

Hoofdstuk 3 Maatstaven voor ligging en spreiding 3.1. Centrummaten – Gemiddelden 3.2. Kwantielen 3.3. De spreidingsmaten

Kwantielen Wat? Kwantielen verdelen een frequentieverdeling in een aantal gelijke stukken (= stukken met gelijke frequentie) Doel? Kwantielen dienen om een uitkomst te situeren ten opzichte van andere uitkomsten

Kwantielen (2) Soorten kwantielen: Kwartielen: Q1, Q2 , Q3 verdelen de frequentieverdeling in 4 gelijke intervallen, elk met 25% van de uitkomsten Decielen: D1, D2 , … , D9 verdelen de frequentieverdeling in 10 gelijke intervallen, elk met 10% van de uitkomsten Percentielen: P01, P02 , … , P99 verdelen de frequentieverdeling in 100 gelijke intervallen, elk met 1% van de uitkomsten

Kwantielen (3) De interkwartielafstand (IKA) geeft de range aan van de middelste helft van de resultaten. De IKA is ongevoelig voor uitbijters.

Percentiel  percentiele rang b.v. P57 = 173,5 cm 57% van de resultaten zijn kleiner of gelijk aan 173,5 cm percentiele rang (p) b.v. p168cm = 48,3% een lengte van 168cm komt overeen met de 48,3% kleinste resultaten

5-getallen-résumé Een frequentieverdeling kan omschreven worden met 5 kengetallen:

Boxplot (boxdiagram) Een boxplot is de grafische voorstelling van het 5-getallen-résumé: de randen van de box: Q1 (bodem) Q3 (deksel) het tussenschot in de box: Me twee « bakkebaarden »: van de box tot aan Xmin en Xmax Doel: een snelle vergelijking van verschillende frequentieverdelingen

Boxplot (5-getallen-résumé) Xmax Q3 Me Q1 Xmin

Vergelijking boxplots

Grafische bepaling van kwantielen 96 percentiel: P27 = 133 percentiele rang: P528 = 96% 27 133 528

Hoofdstuk 3 Maatstaven voor ligging en spreiding 3.1. Centrummaten – Gemiddelden 3.2. Kwantielen 3.3. De spreidingsmaten

Spreiding, dispersie, variatie 3 invalshoeken: de verschillen tussen de uitkomsten onderling de range op de meetschaal, waarbinnen een bepaald percentage van het totaal aantal waarnemingen ligt de verschillen tussen de uitkomsten en de centrummaten

De variatiebreedte of de range (1) Wat? het verschil tussen de uiterste resultaten Voordelen: zeer snel en eenvoudig te bepalen Nadeel: maximaal beïnvloed door uitbijters

De variatiebreedte of de range (2) Bij gegroepeerde gegevens is de range:

De interkwartielafsand (IKA) Beter dan de range: Voordeel: totaal ongevoelig voor uitbijters! Ook: IDA = interdecielafstand (D9 – D1)

Spreiding, dispersie, variatie 3 invalshoeken: de verschillen tussen de uitkomsten onderling de range op de meetschaal, waarbinnen een bepaald percentage van het totaal aantal waarnemingen ligt de verschillen tussen de uitkomsten en de centrummaten

Spreiding Algemeen: Spreiding: waarin de afstand tussen een centrummaat C en de waarnemingsresultaten Xi Spreiding: waarin

De gemiddelde absolute afwijking Wat? het gemiddeld verschil tussen elke uitslag en het rekenkundig gemiddelde van alle uitslagen Symbool: Formule: voor gegroepeerde gegevens: Xi mi

De variantie en de standaardafwijking Wat? de variantie van een reeks uitslagen geeft aan in hoeverre deze afwijken van het gemiddelde Symbool: Formule: mi

De standaardafwijking (1) Variantie: wordt uitgedrukt in de tweede macht van de meeteenheid de standaardafwijking is de vierkantswortel uit de variantie de standaardafwijking is de belangrijkste spreidingsmaat in de statistiek

De standaardafwijking (2) Formule: of fi . mi² voor gegroepeerde gegevens: Xi  fi .mi

De standaardafwijking (3) De standaardafwijking is de meest gebruikte spreidingsmaat: normale verdelingen worden gekarakteriseerd door het rekenkundig gemiddelde en de standaardafwijking in een Gauss-curve is de afstand van de buigpunten tot de symmetrieas steeds gelijk aan de standaardafwijking in een normale verdeling ligt steeds een zelfde percentage van de waarnemingen tussen het gemiddelde vermeerderd/verminderd met 1, 2 of 3 keer de standaardafwijking

Normale verdelingen (1) b.v. N(63;12,7) 16%

Normale verdelingen (2) vlakke normale verdeling spitse normale verdeling

Normale verdelingen (3) 156 164 172 180 188 196 204 cm NL 150 157 164 171 178 185 192 cm B

De variatiecoëfficiënt Wat? Een relatieve spreidingsmaat, onafhankelijk van de meeteenheid, om de spreiding van verschillende steekproeven te vergelijken Symbool: Formule: De standaardafwijking wordt uitgedrukt in verhouding tot het rekenkundig gemiddelde