Uitschieters Zijn alle gegevens wel bruikbaar?

Slides:



Advertisements
Verwante presentaties
Vierde bijeenkomst Kleinste kwadraten methode Lineaire regressie
Advertisements

Het belang van een goede steekproef
Tabellen & diagrammen Centrummaten & Spreiding
Periode 8 Instructiefilm maken.
Staafdiagram Strookdiagram
Rekenen met snelheid Een probleem oplossen
Tabellen Metingen schrijf je meestal op in een tabel
Statistiek Niveua 3 Kerntaak 5 Blz. 81.
Op zoek naar verbetering
Hoofdstuk 6: Controle structuren
Hoofdstuk 3 Maatstaven voor ligging en spreiding
Centrummaten gemiddelde
Metingen met spreiding
Eenvoudige data-analyse: beschrijvende statistische
Hoofdstuk 11 Kwantitatieve gegevens analyseren Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian Thornhill, Marije.
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW Guido Valkeneers.
Les 9 Gelijkstroomschakelingen
Hoofdstuk 3 Databaseontwikkeling 4 Access.  Uitgangspunt is altijd de informatiebehoefte van de klant  Deze wordt vaak bepaald door rapporten, formulieren.
Tweedegraadsfuncties
Statistiekbegrippen en hoe je ze berekent!!
Sorteeralgoritmen. Sorteren: aanpak 1 Hoe ga je een rij getallen sorteren met PC? Sorteren door selectie (= selection sort): Zoek de kleinste waarde Sorteer.
Kwadratische vergelijkingen
Inleiding in de statistiek voor de gedragswetenschappen
Boxplot … en andere diagrammen
Boxplot en steelbladdiagram
Centrummaten en Boxplot
Laat software voor je werken
Baarde en de goede Hoofdstuk 11: Data-analyse
No show protocol Ja Nee Ja Nee Nee Ja Patiënt komt voor afspraak
GRAFIEK v/e TWEEDEGRAADSFUNCTIE Voorbeeld 1). xf(x) T(0,0) Dalparabool.
De presentatie knop Door: Johnny heesterbeek Please visit:
Parallelsessie 2.1a Werken met Metis voor schatten achteraf Koen Vangeel, K.H.Kempen Jan Annaert, KHLim.
Theresialyceum. OriëntatieTheorievormingOntwerpplanExperimentVerwerkingRapportagePresentatie Onderzoekscyclus Experiment.
1 CCC & CCM Module Statistiek voor CM Drs. J.H. Gieskens AC CCM QT.
Toepassingen 5L week 22: ‘Herhaling’ 5L week 22: ‘Herhaling’
Onderzoeksvaardigheden 3
Snijpunt bepalen. Lijn p en lijn q snijden elkaar. Wat zijn de coördinaten van het snijpunt ?
Hoorcollege 1: efficiëntie en complexiteitsontwikkeling.
Hoorcollege 1: efficiëntie en complexiteitsontwikkeling.
Codetuts Academy Les 6 Module 2a Php Fundamentals 1.
PLANNING MAKEN Stap één bij projecten. HOE MAAK JE EEN ANALYSE? Wat is het verschil tussen een planning en een plan?
Absolute aantallen en relatieve aantallen
IMATerials: audiomat  .
Gegevens verzamelen Statistiek gaat over het verzamelen en verwerken van data (gegevens ) Data zijn vaak gespreid: -mensen hebben verschillende lengtes.
Wat doe je met twee onnauwkeurigheden?
Deze les Even herhalen: hoofdrekensommen Grafieken aflezen waar moet je ook alweer op letten? Stapeldiagram sportdag bespreken Voorbeeldexamenvragen Uitleg.
Grafische vergelijking
Betrouwbaarheidsinterval
Door Laura, Alicia, Ben en Brooklyn
3.5 Vergelijkingen oplossen Vergelijkingen met haakjes
Statistiek met grote datasets op de TI 84 Peter Vaandrager
2. Tweedegraadsfuncties en vergelijking cirkel
G9 2 Formules omvormen is vergelijkingen oplossen M A R T X I
Youden Analyse.
Eenvoudige data-analyse: beschrijvende statistische
Examentraining.
Les 5: rekenen met grafieken, diagrammen en tabellen
Startopdracht! Ga direct voor jezelf aan de slag met de volgende twee opgaven: Los op: x2 - 4x = 5 Los op: x(x + 3) + 2 = 0.
SQL Les 3 23 February 2019.
Evaluatieonderzoek.
Voorspelling van criminele carrières door 2-dimensionale extrapolatie
SQL Les 4 12 May 2019.
Voorkennis Wiskunde Les 12 Hoofdstuk 5: §5.5 en §5.8.
G14 2 Vraagstukken met recht en omgekeerd evenredige grootheden M A R
Vergelijkingen van de vorm ax + b = c oplossen
Vergelijkingen van de vorm x + a = b oplossen
Vergelijkingen van de vorm ax = b oplossen
Vergelijkingen van de vorm ax = b oplossen
Beschrijvende Statistiek met Grafische rekenmachine 101
Transcript van de presentatie:

Uitschieters Zijn alle gegevens wel bruikbaar? In deze gevallen lijkt het wel duidelijk!

Uitschieters Maar het is niet altijd zo duidelijk Uitschieter?

Uitschieters Hoe bepaal je of een verdachte waarde een uitschieter is? Twee methoden Q-test of Dixon’s test Boxplot een losse verdachte waarde ook voor meerdere verdachte waarden 1 verdachte waarde 2 verdachte waarden

Q-test of Dixon’s test Qtest = Voor een enkele verdachte waarde A – B waar hangt het van af of een verdachte waarde een uitschieter is? spreidingsbreedte w de afstand tot de naastliggende waarde MIN A B MAX in verhouding tot de spreidingsbreedte het aantal meetwaarden w A – B verdachte waarde naastliggende waarde verdachte waarde waarschijnlijk geen uitschieter Qtest = w A – B MIN MAX vergelijken met afgesproken waarde die afhangt van het aantal n waarschijnlijk wel uitschieter

Q-test of Dixon’s test Qtest = Qkritisch = 0,64 Qtest > Qkritisch ? Voorbeeld 1 A B 11,3 22,1 17,2 spreidingsbreedte w Qtest = w A – B = 22,1 – 17,2 22,1 – 11,3 = 0,45 kritische waarde opzoeken in tabel voor n = 5: Qkritisch = 0,64 Qtest > Qkritisch ? 0,45 < 0,64 nee, dus 22,1 is geen uitschieter

Q-test of Dixon’s test Qtest = Qkritisch = 0,39 Qtest > Qkritisch ? Voorbeeld 2 A B 11,3 22,1 17,2 spreidingsbreedte w Qtest = w A – B = 22,1 – 17,2 22,1 – 11,3 0,45 kritische waarde opzoeken in tabel voor n = 11 Qkritisch = 0,39 0,45 > 0,39 Qtest > Qkritisch ? ja, dus 22,1 is nu wel een uitschieter 22,1 laten we weg, maar dan is 11,3 ook weer verdacht! oplossing nog een keer de Q-test op 11,3

Boxplot data 18, 19, 21, 21, 22, 23, 23, 24, 25, 32, 33 K1 mediaan K3 waarom geeft de Q-test hier geen uitschieter? data 18, 19, 21, 21, 22, 23, 23, 24, 25, 32, 33 K1 mediaan K3 min max deze afstand is belangrijk: de interkwartielafstand IKA 32 en 33 zijn uitschieters 18 33 21 23 25 geen uitschieters 1,5 x IKA geeft nu de uitschietersgrens IKA = K3 – K1 = 25 – 21 = 4 1,5 x IKA = 1,5 x 4 = 6 De boxplot haalt dus alle uitschieters eruit!

Een rolmodel voor de analist