Een overzicht van de Beschrijvende Statistiek Inhoud: Beschrijvende Statistiek Frequentieverdelingen Maatstaven voor ligging en spreiding (m.i.v. de normale verdeling) Indexcijfers
Hoofdstuk 1: Beschrijvende Statistiek Begripsomschrijving en taak Het verzamelen van gegevens Samenstelling van de steekproef Primair en secundair statistisch onderzoek Enquêtes
Begripsomschrijving en taak Statistiek leer en methode om d.m.v. cijfers inzicht te krijgen in massale verschijnselen meetresultaten aantallen rangnummers
Begripsomschrijving en taak Beschrijvende statistiek De meeste statistische informatie in de media bestaat uit gegevens die zó zijn samengevat en gepresenteerd, dat de lezer/kijker ze eenvoudig kan begrijpen. Dergelijke samenvattingen van gegevens, zowel in tabellen, grafieken als getallen, vallen onder de beschrijvende statistiek Wiskundige statistiek Levert middelen om aan de hand van steekproef-gegevens uitspraken te doen over de ganse populatie (met een bepaalde foutenmarge)
Hoofdstuk 1: Beschrijvende Statistiek Begripsomschrijving en taak Het verzamelen van gegevens Samenstelling van de steekproef Primair en secundair statistisch onderzoek Enquêtes
Het verzamelen van gegevens Bronnen Definities en begrippen verzamelen: wat? waar? wanneer? hoe tellen? criteria voor het rangschikken? kenmerken: - continu - discontinu, discreet - alternatief, dichotoom kwalitatief vs. kwantitatief
definities en begrippen (1) 4 types meetschalen indeling in functie van hun eigenschappen: ondubbelzinnige rangschikbaarheid een meeteenheid bezitten een nulpunt bezitten met reële betekenis (een absoluut nulpunt)
definities en begrippen (2.a) 4 types meetschalen: verhoudingschaal intervalschaal ordinale schaal nominale schaal eigenschappen: 1,2 en 3 1 en 2 1 geen
definities en begrippen (2.b) 4 types meetschalen: verhoudingschaal intervalschaal ordinale schaal nominale schaal eigenschappen: 1,2 en 3 1 en 2 1 geen kwantitatief niveau kwalitatief niveau
definities en begrippen (3) populatie verzameling van alle dingen waarvan we een eigenschap willen bestuderen (N) steekproef deelverzameling van alle elementen uit de populatie waarvoor waarnemingen zijn uitgevoerd (n) categorsich systeem elk element van de populatie of steekproef heeft voor het beschouwde kenmerk één en slechts één uitkomst
definities en begrippen (4) afronden - afgeronde waarden 84,3 kg: 84,25 kg < X ≤ 84,35 kg - afrondingsinterval 0,01 kg - categorisch systeem!
Hoofdstuk 1: Beschrijvende Statistiek Begripsomschrijving en taak Het verzamelen van gegevens Samenstelling van de steekproef Primair en secundair statistisch onderzoek Enquêtes
Samenstelling van de steekproef volledig vs. gedeeltelijk verzamelen populatie-onderzoek steekproef verzameltechnieken (samplingtechnieken) ndz. aselect: elk element van de populatie heeft dezelfde kans om te worden opgenomen in de steekproef aselect zuiver representatief
samplingtechnieken 4 speciale lotingstechnieken om de representativiteit te bevorderen: de systematische keuze de volkomen toevallige keuze de Monte Carlo-methode de gestratificeerde steekproef
samplingtechnieken 1. de systematische keuze 4 stappen: elementen rangschikken en nummeren bepalen van het skipinterval: i=N/n volkomen willekeurige keuze van het eerste element volgende elementen telkens een skipinterval verder nemen
samplingtechnieken 1. de systematische keuze voorbeeld: Hogeschool Gent, departement BMER N = 1864 n = 50 skipinterval: 1864/50 = 37,28 37 willekeurig eerste element: 612 volgende elementen: 649, 686, 723, …
samplingtechnieken 1. de systematische keuze voordelen: - snel en eenvoudig - willekeurig - de ganse populatie wordt doorlopen nadelen: - niet te gebruiken als er systematiek zit in de populatie
samplingtechnieken 4 speciale lotingstechnieken om de representativiteit te bevorderen: de systematische keuze de volkomen toevallige keuze de Monte Carlo-methode de gestratificeerde steekproef
samplingtechnieken 2. de volkomen toevallige keuze = het loterijsysteem met teruglegging b.v. het Jokergetal: 2 3 6 1 3 0 6 zonder teruglegging b.v. Lotto: 12 40 35 37 6 13 (4)
samplingtechnieken 2. de volkomen toevallige keuze voordelen: - snel en eenvoudig - kansberekening: regels van de combinatieleer nadelen: - menselijke factor (beredeneerde keuze)
samplingtechnieken 4 speciale lotingstechnieken om de representativiteit te bevorderen: de systematische keuze de volkomen toevallige keuze de Monte Carlo-methode de gestratificeerde steekproef
samplingtechnieken 3. de Monte Carlo-methode methode met random digits: tabellen met willekeurig gegenereerde cijfers (0-9) - worden gegroepeerd om de leesbaarheid te bevorderen - je mag om het even waar in de tabel beginnen - je mag lezen in om het even welke richting en met om het even welk systeem (b.v. paardensprong van rechts naar links)
samplingtechnieken 3. de Monte Carlo-methode voordelen: - menselijke factor (beredeneerde keuze) wordt volledig uitgeschakeld - 100% aselect, zuiver en representatief want totaal willekeurig nadelen: - omslachtig
samplingtechnieken 3. de Monte Carlo-methode Voorbeeld: 236 556 842 298 036 004 875 695 325 259 115 557 236 667 718 198 117 156 948 230 058 903 567 305 189 969 221 573 648 268 114 600 248 248 855 246 924 770 305 049 066 842 128 … N= 867: getal met 3 cijfers (XYZ) n = 40 elementen van de steekproef: 715, 694, 823,005,(890),356,730,…
samplingtechnieken 4 speciale lotingstechnieken om de representativiteit te bevorderen: de systematische keuze de volkomen toevallige keuze de Monte Carlo-methode de gestratificeerde steekproef
samplingtechnieken 4. De gestratificeerde keuze gestratificeerd = gelaagd wordt gebruikt als de populatie kan opgedeeld worden in een aantal deelpopulaties met een zelfde kenmerk (b.v. mannen en vrouwen) elke deelpopulatie wordt evenredig vertegenwoordigd in de steekproef
samplingtechnieken 4. de gestratificeerde keuze Voorbeeld: Belgische bevolking (01.2000) 58,3% Vlamingen 32,5% Walen 9,2% Brusselaars een representatieve steekproef van 1000 inwoners zal 583 Vlamingen, 325 Walen en 92 Brusselaars tellen binnen elke deelpopulatie worden de elementen getrokken met één van de drie vorige samplingtechnieken
samplingtechnieken 4. de gestratificeerde keuze voordelen: - representatieve groepen nadelen: - deelpopulaties niet altijd te onderscheiden
vergelijkbaarheid van resultaten aanbevelingen IIS Internationaal Instituut voor de Statistiek: - resultaten moeten kunnen gecontroleerd en nagerekend worden - mogelijke onnauwkeurigheid mee publiceren - samplingtechniek nauwkeurig beschrijven vergelijkbaarheid van resultaten
mogelijke fouten (1) toevallige fouten - eenmalig - oorzaak: verkeerde aflezing, schrijffout, verkeerd antwoord of meten van een verkeerd object - weinig invloed op de resultaten (de fout wordt verdeeld over alle elementen) - enkel te corrigeren door te hermeten
mogelijke fouten (2) systematische fouten - treffen alle elementen - kunnen leiden tot totaal verkeerde conclusies - oorzaak: verkeerde ijking meetinstrument, verborgen defect meettoestel, subjectieve interpretatie antwoorden, verschillende methodiek van het onderzoek - kunnen soms achteraf gecorrigeerd worden
Hoofdstuk 1: Beschrijvende Statistiek Begripsomschrijving en taak Het verzamelen van gegevens Samenstelling van de steekproef Primair en secundair statistisch onderzoek Enquêtes
Primair en secundair statistisch onderzoek primair statistisch onderzoek: onderzoeker verzamelt zelf de gegevens secundair statistisch onderzoek: gebruik van gegevens verzameld voor een ander doel (en door andere personen/instanties)
Hoofdstuk 1: Beschrijvende Statistiek Begripsomschrijving en taak Het verzamelen van gegevens Samenstelling van de steekproef Primair en secundair statistisch onderzoek Enquêtes
Enquêtes Specifieke methodes voor ondervraging personen uitersten: vragenformulier met type-anwoorden vrije interview
Kwalificerende en kwantificerende enquêtes Kwalificerende enquêtes doel: inzicht verkrijgen in motieven die leiden tot bepaalde handelingen open vraagstelling antwoorden veelal moeilijk te rubriceren (weinig, soms, regelmatig, af en toe; fantastisch, goed, matig, nogal slecht, zwak, …) Kwantificerende enquêtes beperkt aantal antwoord-mogelijkheden gesloten vraagstelling antwoorden zijn: - óf categorisch - een getal of antwoord uit een reeks grotere respons
Vraagstelling bij enquêtes Formulering van de vragen is zeer belangrijk duidelijk beknopt eenvoudig geen antwoord suggereren niet indiscreet niet van die aard dat de ondervraagde verwacht voor- of nadeel te ondervinden bij het beantwoorden
Uitval of non-response bij enquêtes Wat? Een deel van de ondervraagden antwoordt niet of onvolledig. Oorzaken? weigering van deelname aan de enquête het niet kunnen bereiken van de personen die men wil ondervragen onvolledige, onjuiste of ontbrekende antwoorden scheeftrekking van de resultaten
Enquêtes Praktijk: gespecialiseerde bureaus schriftelijke enquêtes goedkoper dan mondelinge telefonische enquêtes veel gebruikt voor marktonderzoek proefenquêtes om vraagstelling te toetsen Praktijk: gespecialiseerde bureaus met eigen opgeleide enquêteurs