– Hoe pak ik een kwantitatief onderzoek aan? Marktonderzoek – Hoe pak ik een kwantitatief onderzoek aan?
Steekproeven Basisprincipes Kleinere groep uit groter geheel Door extrapolatie oordeel over universum Schatting Geen zekerheid Normale verdeling Statistische theorie Besparing van tijd en geld 2
Steekproeven Basiskennis Representatief Grootte steekproef Betrouwbaarheid Nauwkeurigheid Toevalligheid/Significante verschillen Chi-kwadraat test 3
Steekproeven Basiskennis Representatief Grootte steekproef Betrouwbaarheid Nauwkeurigheid Toevalligheid/Significante verschillen Chi-kwadraat test 4
1. Representatief
Representatief? Eerste mogelijkheid : U legt deze vraag voor aan een aantal voorbijgangers in de Antwerpse winkelstraten. Tweede mogelijkheid : Er wordt gevraagd op de website van de GVA om deze vraag te beantwoorden. Derde mogelijkheid ; Enquête afnemen door marktonderzoekbureau
Steekproeven Representatief Onderzoeksbureau iVox ondervroeg op vraag van Gazet van Antwerpen duizend inwoners van de stad over al deze thema’s. Belangrijk om te weten: de enquête werd afgenomen tussen 12 december en 15 januari en dateert dus van vóór de aanslagen in Frankrijk. Er werd zorgvuldig geselecteerd naar geslacht, leeftijd, opleidingsniveau, districtsniveau en politiek stemgedrag. 7
Representatief Inwoners België Studenten Thomas More Hogeschool? Vlaanderen 6.000.000 Wallonië 4.000.000 Brussel 1.500.000 Studenten Thomas More Hogeschool?
2. Grootte steekproef Vraag : 200?300?1000?......? Probleem : tijd, geld, verwerking Doelstelling van de enquête : hoe betrouwbaar moet ze zijn? hoe nauwkeurig moet ze zijn?
Enkele begrippen verduidelijken Standaarddeviatie of standaardafwijking Afwijking van het gemiddelde Normaalverdeling of Gausscurve
Steekproeven Normaalverdeling/Gauss-verdeling 11
Toepassing bij steekproeven Standaarddeviatie wordt standaardfout bij steekproeven : Meerdere keren een steekproef trekken en ondervragen waardoor men verschillende uitkomsten van het gemiddelde bekomt: Standaardfout van het gemiddelde of s X
Steekproeven Betrouwbaarheid - 3 Sx -2Sx -1Sx X + Sx +2Sx +3Sx Betrouwbaarheid van 95% dat het gemiddelde ligt tussen X plus 2 maal standaardfout en min tweemaal standaardfout, 13
Steekproeven Nauwkeurigheid of foutenmarge - 3 Sx -2Sx -1Sx X + Sx +2Sx +3Sx De grootte van de standaardfout of Sx ; hoe kleiner de foutenmarge hoe groter de steekproef moet zijn 14
Bepalen grootte steekproef In marktonderzoek wordt geopteerd voor een betrouwbaarheid van 95% De nauwkeurigheid wordt bepaald door de marktonderzoeker/marketeer Formule zie handboek Calculator : http://www.steekproefcalculator.com/steekproefcalculator.htm http://www.journalinks.be/steekproef/
Standaardfout van proporties Bij enquêtes wordt gepeild naar bv Kent u product “Y” waarop ja of neen wordt geantwoord Bent u akkoord of niet met een bepaalde stelling waarop ja of niet wordt geantwoord = proportie bv 60% ja en 40 % neen Hier kan opnieuw een standaardfout worden berekend : standaardfout proportie of Sp
Steekproeven Bepalen steekproefgrootte bij het schatten van proporties Nauwkeurigheid/foutenmarge bij 95 % betrouwbaarheid (afgerond) Steek- proef- grootte 1% of 99% 5% of 95% 10% of 90% 15% of 85% 20% of 80% 25% of 75% 30% of 70% 35% of 65% 40% of 60% 45% of 55% 50% 50 2,76 6,04 8,32 9,90 11,09 12,00 12,70 13,22 13,58 13,79 13,86 100 1,95 4,27 5,88 7,00 7,84 8,49 8,98 9,35 9,60 9,75 9,80 150 1,59 3,49 4,80 5,71 6,40 6,93 7,33 7,63 7,96 8,00 200 1,38 3,02 4,16 4,95 5,54 6,00 6,35 6,61 6,79 6,89 300 1,13 2,47 3,39 4,04 4,53 4,90 5,19 5,40 5,63 5,66 400 0,98 2,14 2,94 3,50 3,92 4,24 4,49 4,67 4,88 500 0,87 1,91 2,63 3,13 3,51 3,80 4,02 4,18 4,29 4,36 4,38 1000 0,62 1,35 1,86 2,21 2,48 2,68 2,84 2,96 3,04 3,08 3,10 1500 0,50 1,10 1,52 1,81 2,02 2,19 2,32 2,41 2,52 2,53 2000 0,44 0,96 1,31 1,56 1,75 1,90 2,01 2,09 2,15 2,18 4000 0,31 0,68 0,93 1,11 1,24 1,34 1,42 1,48 1,54 1,55 5000 0,28 0,60 0,83 0,99 1,20 1,27 1,32 1,36 1,39 10000 0,20 0,43 0,59 0,70 0,78 0,85 0,90 25000 0,12 0,27 0,37 0,54 0,57 0,61 50000 0,09 0,19 0,26 0,35 0,38 0,40 0,42 17
Steekproeven Samenstelling / stappenplan 1 Definitie van de ‘relevante’ populatie en haar kenmerken ↓ 2 Definitie van het steekproefkader of sampling frame 3 Bepaling van het benodigde budget en de benodigde tijd 4 Keuze van de steekproefmethode (o.m. toevallig versus niet-toevallig) 5 Bepaling van de noodzakelijke steekproefgrootte 6 Trekking van de steekproef en verzameling van de informatie 7 Nagaan van de representativiteit 8 Verwerking van de gegevens Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 18
Steekproeven Definitie populatie Doelgroep duidelijk en ondubbelzinnig vastleggen Eventueel: vooronderzoek Basis: sociodemografische kenmerken gedragsmatige kenmerken Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 19
Geslacht Leeftijd Sociale status Beroep Woonplaats Woonomgeving Steekproeven Definitie populatie op basis van sociodemografische kenmerken Geslacht Leeftijd Sociale status Beroep Woonplaats Woonomgeving Beroepssector Leefwijze … Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 20
Steekproeven Definitie populatie op basis van gedragsmatige kenmerken Gebruiker Niet-gebruiker Aankoper Ex-gebruiker … van Product Merk Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 21
Steekproeven Sampling frame Lijst van elementen van de doelgroep Mogelijke bronnen: beroepsverenigingen opdrachtgever handelsregister … Niet van alle doelgroepen lijsten Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 22
Steekproeven Keuze steekproefmethode Zuiver toevallige ↔ niet-toevallige trekking Zuiver toevallige (aselecte): ieder element gekende kans om uitgeloot statistische formules toepasbaar Niet-toevallige (selecte): kans niet gekend statistische regels niet toepasbaar geen extrapolatie Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 23
Steekproeven Bepalen steekproefgrootte praktijk Handige programma’s: http://www.surveysystem.com/sscalc.htm http://www.raosoft.com/samplesize.html http://www.dssresearch.com/toolkit/default.asp http://www.gmi-mr.nl/resources/sample-size-calculator.php http://www.macorr.com/ss_calculator.htm Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 24
Steekproeven Bepalen steekproefgrootte praktische werkwijze 1 Bepaal de gewenste betrouwbaarheid: 68,3 %, 95 %, 99,7 % enz… 2 Bepaal de gewenste maximum afwijking: d.w.z. de marge: sx of sp 3 Bepaal s (bij metingen), of p (proportie) uit ofwel: vroeger onderzoek een vooronderzoek of pretest de formule: maximumwaarde - minimumwaarde 6 Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 25
Steekproeven Standaarddeviatie S = f1 X1 − X 2 +f2 x2 − X ²+ …+fk Xk − X ² n−1 S = 𝑖=𝑙 𝑘 fi Xi − X ² n−1 Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 26
Steekproeven Standaardfout σ X = σ n s X = s n Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 27
P X − z 1 − α 2 × s n ≤ μ ≤X+ z 1 − α 2 × s n = 1 -α Steekproeven Betrouwbaarheidsinterval P X − z 1 − α 2 × s n ≤ μ ≤X+ z 1 − α 2 × s n = 1 -α Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 28
Steekproeven Standaardfout voor proporties S p = P ×Q n ≅ p ×q n Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 29
Verwerken van de gegevens Representativiteitscontrole Vergelijking kenmerken populatiesamenstelling en steekproef Criterium moet beschikbaar zijn voor populatie én steekproef Samenstelling moet niet exact dezelfde → steekproefgegevens ‘trillen’ Objectieve beoordeling → statistiek: chi-kwadraat test Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 30
Verwerken van de gegevens Chi-kwadraat (1) X 2 = F 0 − F e ² F e Verschillen tussen twee frequentietabellen samengevat in chi-kwadraat waarde Fo = de geobserveerde frequentie Fe = de verwachte frequentie Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 31
Verwerken van de gegevens Chi-kwadraat (2) Twee hypothesen Ho: de twee frequentieverdelingen verschillen niet werkelijk van elkaar, het geconstateerde verschil is te wijten aan het toeval van de steekproeftrekking en is dus te verwaarlozen Symbolisch: Fe = Fo H1: de waargenomen waarden verschillen zo sterk van de verwachte, dat we vermoeden dat ze uit een andere populatie komen Symbolisch: Fe ≠ Fo. Vrijheidsgraden Overschrijdingskans Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 32
Verwerken van de gegevens Representativiteitscorrectie Populatiesamenstelling ≠ steekproefsamenstelling … → principieel/statistisch: steekproef verwerpen → in praktijk: steekproef corrigeren = herwegen Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 33
Verwerken van de gegevens Chi-kwadraattafel Kritische waarden Vrijheids-graden Kans op voorkomen .10 .5 .02 .01 1 2.706 3.841 5.412 6.635 2 4.605 5.991 7.824 9.210 3 6.251 7.815 9.837 11.345 4 7.779 9.488 11.688 13.277 5 9.236 11.070 13.388 15.086 6 10.345 12.592 15.033 16.812 7 12.017 14.067 16.622 18.475 8 13.362 15.507 18.168 20.090 9 14.684 16.919 19.679 21.666 10 15.987 18.307 21.161 23.209 11 17.275 19.657 22.618 24.725 12 18.549 21.026 24.054 26.217 13 19.812 22.362 25.472 27.688 14 21.064 23.685 26.873 29.141 15 22.307 24.996 28.259 30.578 16 23.542 26.296 29.633 32.000 17 24.769 27.587 30.995 33.409 18 25.989 28.869 32.346 34.805 19 27.204 30.144 33.687 36.191 20 28.412 31.410 35.020 37.566 21 29.615 32.671 36.343 38.932 22 30.813 33.924 37.659 40.289 Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 34