Het belang van een goede steekproef Populatie: de volledige groep mensen, dieren, voorwerpen, waarover we informatie willen. Eenheid: elk individueel element van de populatie (persoon, gezin, land, sigaret, liter, broccolitak, …) dat onderzocht wordt = de elementen of onderzoekseenheden. Steekproef (sample): het deel van de populatie dat daadwerkelijk onderzocht wordt, met als doel betrouwbare info te krijgen over de hele populatie. steekproefgrootte (n) Variabele: het kenmerk van de populatie dat men wil meten of bepalen. kwantitatief of kwalitatief Inferentie: veralgemenen van steekproefresultaten tot kenmerken van de populatie
Bv: enquête in winkelstraat, keuren kist sinaasappels, … Vertekende steekproef (bias): indien bepaalde eenheden uit de onderzochte populatie systematisch bevoordeeld worden ten opzichte van andere / niet elke eenheid heeft dezelfde kans om geselecteerd te worden. Opportunistische steekproef (convenience sample): de onderzoeker kiest eenheden uit een deel van de populatie die makkelijker, snel of goedkoop zijn te bereiken. Bv: enquête in winkelstraat, keuren kist sinaasappels, … Vrijwillige respons (voluntary response sample): eenheden uit de populatie kiezen zelf of ze deelnemen aan het onderzoek. Enkelvoudig aselecte steekproef (EAS) (simple random sample): in 1 trekking + lukraak gekozen uit populatie
Voorbeelden vertekende steekproeven: Ann Landers was jarenlang bezielster van dagelijkse adviesrubriek in Amerikaanse krant. Naar aanleiding van een verhaal over probleemkinderen, lanceerde ze volgende vraag: “Mocht u opnieuw mogen beginnen, zou u dan opnieuw kinderen willen?” Ze kreeg 10000 antwoorden toegestuurd. Enige tijd later werd een professioneel onderzoek gedaan met dezelfde vraag, waarbij slechts 1373 mensen werden ondervraagd. Resultaat 1: 70% van de ouders hebben spijt kinderen te hebben Resultaat 2: 9% van de ouders hebben spijt kinderen te hebben In 1987 verscheen ophefmakende boek “Women and Love”. Uit onderzoek bij vrouwen door de auteur bleek dat van de respondenten: 84% zich emotioneel niet goed voelde in hun relatie; 95% psychisch of lichamelijke mishandeling door hun partner hadden ondergaan; Slechts 13% na 2 jaar huwelijk nog aangaf van hun man te houden; 70% van de vrouwen die langer dan 5 jaar gehuwd waren, buitenechtelijke relaties hadden gehad. De auteur had 100.000 vragenlijsten rondgestuurd via vrouwenorganisaties en andere kanalen. Zo’n 4.500 vrouwen vulden de vragenlijst in (respons).
Steekproefvariabiliteit: Steekproefvariabiliteit: verschillende steekproeven van eenzelfde populatie geven onvermijdelijk aanleiding tot verschillende steekproefresultaten Steekproefverdeling: patroon van steekproefresultaten dat men bekomt bij verschillende steekproeven van een populatie. Betrouwbaarheid: Afwezigheid van vertekening: gemiddelde van alle steekproefresultaten ongeveer gelijk aan populatiewaarde. Dit is zo als de steekproefresultaten symmetrisch verdeeld zijn rond de gezochte populatiewaarde. 2. Beperkte variabiliteit: verschillende steekproefresultaten wijken niet zo sterk af van elkaar.
Beschrijven van steekproefverdelingen Vorm van de verdeling: symmetrisch of scheef (asymetrisch), 1 piek, meerdere pieken, alle gegevens komen even vaak voor (uniforme verdeling). Scheefheid naar links / rechts Uitschieters: waarden die sterk afwijken van het gros van de meetwaarden. Centrummaten Gemiddelde niet-resistent t.o.v. uitschieters 2. Mediaan resistent t.o.v. uitschieters 3. Modus
Spreidingsmaten Variatiebreedte: verschil grootste en kleinste meetwaarde Standaardafwijking: maat voor gemiddelde afwijking t.o.v. Gemiddelde (niet-resistent) Variantie: kwadraat van de standaardafwijking Interkwartielafstand (IKA): verschil tussen eerste en derde kwartiel Boxplot mediaan, Q1, Q3, minimum en maximum