Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Jongeren over politiek
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
HC2MFE Meten van verschillen
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
havo A Samenvatting Hoofdstuk 10
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
dia's bij lessenserie Pythagoras ± v Chr.
Ronde (Sport & Spel) Quiz Night !
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW Guido Valkeneers.
Statistiek HC1MBR Statistiek.
havo A 4.4 Centrum- en spreidingsmaten
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW Guido Valkeneers.
Kb.1 Ik leer op een goede manier optellen en aftrekken
Eigenschappen van het vermenigvuldigen van gehele getallen
Beschrijvende en inferentiële statistiek
Inleiding in de statistiek voor de gedragwetenschappen
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
toetsen voor het verband tussen variabelen met gelijk meetniveau
Hoofdstuk 3 Maatstaven voor ligging en spreiding
vwo A/C Samenvatting Hoofdstuk 8
Centrummaten gemiddelde
Regelmaat in getallen … … …
Centrummaten gemiddelde
Regelmaat in getallen (1).
Meervoudige lineaire regressie
Inferentie voor regressie
Een fundamentele inleiding in de inductieve statistiek
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
Hoofdstuk 8 Centrale tendentie en spreiding
Meten bij marktonderzoek
Eenvoudige data-analyse: beschrijvende statistische
Meten bij marktonderzoek
Eenvoudige data-analyse: beschrijvende statistische
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
Inleiding in de statistiek voor de gedragwetenschappen
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW Guido Valkeneers.
De FFT spectrumanalyzer
Inkomen les t/m 75 plus Zelftest Kennisvragen.
Inkomen les 14 Begrippen & 65 t/m Begrippen Primaire sector Bedrijven die zaken aan de natuur onttrekken (landbouw, jacht, bosbouw, visserij)
ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B
indicator op basis van niveau-indicaties
Statistiekbegrippen en hoe je ze berekent!!
Onderzoeksmethoden Blok 2, les 6/7 Mieke de Waal1 Collegeweek 7  Hoofdstuk 12: boek en vragen  Dr Stat  Observatieopdracht.
Begrippen hoofdstuk 3.
WOT statistiek Inleiding
Inleiding in de statistiek voor de gedragswetenschappen
Inleiding in de statistiek voor de gedragswetenschappen
Inleiding in de statistiek. met ondersteuning van SPSS
Inleiding in de statistiek in de gedragswetenschappen
Hoofdstuk 4: Statistiek
Boxplot … en andere diagrammen
Boxplot en steelbladdiagram
Centrummaten en Boxplot
Hoofdstuk X Het correlatievraagstuk & SPSS toepassing
Inleiding in de statistiek voor de gedragswetenschappen
Baarde en de goede Hoofdstuk 11: Data-analyse
Inleiding in de statistiek voor de gedragswetenschappen
1 CCC & CCM Module Statistiek voor CM Drs. J.H. Gieskens AC CCM QT.
1 CCP Module 1: Theorie Statistiek voor Credit Managers Introductie Basisbegrippen Drs. J.H. Gieskens AC CCM QT.
Absolute aantallen en relatieve aantallen
Gegevens verzamelen Statistiek gaat over het verzamelen en verwerken van data (gegevens ) Data zijn vaak gespreid: -mensen hebben verschillende lengtes.
6.4 Gemiddelde, mediaan en modus Centrummaten
Deze les Even herhalen: hoofdrekensommen Grafieken aflezen waar moet je ook alweer op letten? Stapeldiagram sportdag bespreken Voorbeeldexamenvragen Uitleg.
Excel Statistiek en Excel.
Eenvoudige data-analyse: beschrijvende statistische
Transcript van de presentatie:

Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers

Inleiding in de statistiek voor de gedragswetenschappen Hoofdstuk V Centrummaten & SPSS Descriptives guido.valkeneers@lessius.eu

Doelstellingen hoofdstuk V De student kent de diverse begrippen over de centrummaten; De student kent de impact van de aard van de schaal op de bepaling van de centrale tendens; De student kan – handmatig - de centrale tendens berekenen voor een (beperkte) verdeling van uitslagen; Via SPSS kan de student de centrale tendens van een reeks gegevens bepalen.

De modus Is de waarde met de hoogste frequentie Bijvoorbeeld scores op een Likertschaal (1-5) Ik vind de opwarming van de aarde een groot probleem (helemaal akk….. helemaal niet akk) score frequentie 1 helemaal akk 13 2 akkoord 12 3 weet niet 3 5 helemaal niet akk 1 Welk is de modus? Score 1 ‘helemaal akkoord’

Voorbeeld van nominale gegevens Modus = ‘GEHUWD’

De modus Zal vooral gebruikt worden voor nominale waarden; maar kan in principe altijd bepaald worden. Is meteen duidelijk in de frequentietabel Meer dan één modus is mogelijk, bij een bimodale verdeling zijn er twee modi. Gebruikt weinig informatie uit de gegevens.

De mediaan De mediaan is de middelste waarde wanneer de observaties in volgorde van laag naar hoog zijn gezet. (niet mogelijk voor nominale waarden) Bij een oneven aantal observaties precies de middelste, en bij een even aantal observaties het midden tussen de twee middelste scores; Komt dus overeen met percentiel 50.

De mediaan Welk is de mediaanwaarde van 2, 4, 6, 8, 10? De mediaanwaarde is 6, als middelste waarde Welk is de mediaanwaarde van 2, 4, 6, 7, 8, 10? De mediaan is 6,5 zijnde het midden tussen 6 en7. Welk is de impact van een wijzing van de laatste observatie 10 in 20? Verandert hierdoor de mediaan?

Voorbeeld van ordinaal meetniveau Mediaan = ‘HOGER SECUNDAIR ONDERWIJS’

Voorbeeld van ordinaal meetniveau Oordeel Absolute frequentie Zeer slecht 15 Slecht 20 Neutraal 18 Goed 10 Zeer goed 07 TOTAAL 70 Mediaan = ‘Grens van slecht en neutraal’

Voorbeeld voor interval niveau 18 13 17 16 10 09 15 18 13 17 16 10 09 15 12 09 10 13 15 16 17 18 09 10 12 13 15 16 17 18

Bepaal de mediaan uit een tabel Score f 12 1 13 3 14 15 2 16 17 is hetzelfde als : 12 13 13 13 14 15 15 16 16 17

De mediaan Kan niet gebruikt worden bij nominale waarden; Is niet afhankelijk van extreem hoge of lage uitslagen. Gebruikt weinig info uit de gegevens; Kan gezien worden in vergelijking met het rekenkundig gemiddelde; Is gemakkelijk te begrijpen/uit te leggen/grafisch voor te stellen.

De mediaan Kan grafisch voorgesteld worden via een boxplot. SPSS kan een verdeling van uitslagen voorstellen middels een boxplot. In dergelijke boxplot worden PC25, PC50 en PC75 grafisch voorgesteld middels een ‘doos’

Opdracht Maak uitgaande van het bestand busters.sav een boxplot voor de levensstijl variabelen gezondheidsbesef, internetgebruik, materialisme, modebesef waaruit de verschillen kunnen blijken tussen de groepen met verschillend diploma. Wat blijkt?

Het gemiddelde Zeer belangrijk Het gemiddelde is de som van alle scores gedeeld door het aantal scores. Is enkel mogelijk voor interval en ratio meetniveaus, bv. IQ, schooluitslagen, testuitslagen, leeftijd,…

Het gemiddelde Voorstelling van gemiddelde: _ in de steekproef: X in de populatie: µ

Het gemiddelde: een voorbeeld I Score Frequentie 4 9 6 15 8 21 gemiddelde: (9*4 + 15*6 + 21*8)/45 = 6,53

Het gemiddelde bij een samengestelde steekproef Veronderstel je beschikt over twee steekproeven n1 en n2 met een respectievelijk gemiddelde X1 en X2, welk is dan het zgn. gewogen gemiddelde?

Het gemiddelde bij een samengestelde steekproef, een voorbeeld Tien jongens kijken gemiddeld 3 uur per dag tv en vijf meisjes kijken gemiddeld 2 uur per dag tv. Wat is dan het gemiddelde van de gezamenlijke proefgroep? Oplossing de jongens kijken 30 uur tv de meisjes kijken 10 uur tv totaal: 40 uur; dit is gemiddeld 40/15 = 2,67 (=gewogen gemiddelde)

Het gemiddelde bij een samengestelde steekproef Een analoge eigenschap voor de mediaan bestaat niet. Om de mediaan van de samengestelde steekproef te kennen, moet je alle metingen kennen

Het getrimde gemiddelde Het rekenkundig gemiddelde van het deel van de waarnemingsgetallen dat overblijft na weglating van de P% kleinste en P% grootste.

Voorbeeld 1 3 6 7 8 9 10 14 15 16 17 19 21 23 25 28 30 33 39 40 1 3 6 7 8 9 10 14 15 16 17 19 21 23 25 28 30 33 39 40

Eigenschappen van het rekenkundig gemiddelde Som van de afwijkingen van de waarnemingsgetal-len tot het rekenkundig gemiddelde is gelijk aan 0. Xi 18 18-14=4 13 13-14=-1 17 17-14=3 16 16-14=2 10 10-14=-4 09 9-14=-5 15 15-14=1 SOM=0

Eigenschappen van het rekenkundig gemiddelde Bij een lineaire transformatie van de scores, wordt het rekenkundig gemiddelde op dezelfde wijze getransformeerd, d.w.z. als je alle waarnemingsgetallen met b vermenigvuldigt en daar een constante a bijtelt, dan wordt het rekenkundig gemiddelde op dezelfde manier getransformeerd.

Voorbeeld Eigenschappen van het rekenkundig gemiddelde Je meet de volgende temperaturen met de schaal van Celsius: 18°C 13°C 17°C 16°C 10°C 09°C 15°C Via een eenvoudige transformatie kan je de waarden overbrengen naar de schaal van Fahrenheit: 64,4F 55,4F 62,6F 60,8F 50F 48,2F 59F

Eigenschappen van het rekenkundig gemiddelde Het rekenkundig gemiddelde van een aselecte steekproef is een zuivere schatter van het populatiegemiddelde (µ). D.w.z. dat wanneer we van een oneindig aantal steekproeven (met hetzelfde aantal n) steeds het steekproefgemiddelde berekenen, het rekenkundig gemiddelde van alle steekproefgemiddelden gelijk is aan het populatiegemiddelde. d.i.Centrale limietstelling

Het rekenkundig gemiddelde Snel te berekenen en eenvoudig te begrijpen In dezelfde meeteenheid als de waarden Alle waarden worden bij de berekening betrokken Gevoelig voor extreme waarden Steeds berekenen bij interval en ratio waarden Eventueel vergelijken met mediaan

Gebruik van centrummaten Modus: bij nominale, ordinale, interval en ratio waarden; Mediaan: bij ordinale, interval en ratio waarden; Gemiddelde: bij interval en ratio waarden.

Gebruik van centrummaten Modus vooral bij nominale waarden Gemiddelde versus mediaan? - Gemiddelde gebruikt meer informatie dan de mediaan; de mediaan gebruikt enkel de rangorde van de getallen, dus bij interval waarden…. - Invloed van ‘uitbijters’/’’outliers’? Uitbijters hebben geen invloed op de mediaan, wel op het gemiddelde. Bij de mogelijkheid van extreme waarden kan getrimde gemiddelde een oplossing bieden. Getrimde gemiddelden worden berekend zonder rekening te houden met bv. de 5% hoogste en 5% laagste waarden.

Gebruik van centrummaten Gemiddelde versus mediaan: Het gemiddelde varieert minder van steekproef tot steekproef t.o.v. de mediaan. Dus het gemiddelde wordt meer gebruikt in de toetsende statistiek om het centrum van de populatie te schatten. Gemiddelde is algebraïsch aardiger. We kunnen gegevens van subgroepen samenvoegen om gewogen gemiddelde te berekenen, … dit kan niet bij een mediaan. Het gemiddelde verdient de voorkeur bij interval/ratio schalen. Onderlinge positie van gemiddelde en mediaan zegt iets over de mate van scheefheid van de verdeling.

Vergelijking van centrummaten Voor symmetrische verdelingen Bij een normaalachtige verdeling is MO=Me=Gem. bv. verdeling van de IQ’s

Vergelijking van centrummaten Voor symmetrische verdelingen bij een uniforme verdeling Me=gemid. Modus? Bv. verdeling van leeftijd, van 20 t/m 50 jaar

Vergelijking van centrummaten Bij asymmetrische verdelingen voor een rechts scheve verdeling (scheefheid pos.) Mo<Me<gemid bv. verdeling van inkomens

Vergelijking van centrummaten Bij asymmetrische verdelingen voor een links scheve verdeling (neg. scheefheid) Mo>Me>gemid bv. een gemakkelijke toets

Vergelijking van centrummaten Besluit: 1. De vorm van de verdeling heeft invloed op de onderlinge positie van de centrummaten. 2. Indien mogelijk maak gebruik van het rekenkundig gemiddelde als maat van centrale tendens.

SPSS en de centrummaten

SPSS en de centrummaten

SPSS en de centrummaten

SPSS output van de centrummaten

SPSS en het rekenkundig gemiddelden Om subgroepen te vergelijken maken we vaak gebruik van het rekenkundig gemiddelde. Maak uitgaande van het bestand busters.sav een vergelijking tussen de beide leeftijdsgroepen voor wat betreft de levensstijl variabelen (op grond van de gemiddelden)

SPSS Maak een vergelijking tussen subgroepen

SPSS vergelijking van subgroepen

Output compare means Kan dit verschil toevallig zijn? Verwijst het naar een verschil tussen de populaties? Zie inductieve statistiek: jaar II

Opgaven

Bijkomende opgave Bereken alle zinvolle centrummaten op de volgende tabel

Statistiek deel I Inleiding in de statistiek Met ondersteuning van SPSS Guido Valkeneers