Hoofdstuk 3 Gegevens verwerven.

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Toetsen van verschillen tussen twee of meer groepen
Overzicht Sessie 1 Inleiding
-Glucuronidase (GUS)
Het belang van een goede steekproef
De omvang van een steekproef bepalen
Inleiding tot inferentie
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
College 2 Between-subject en within-subject designs
Baarde en de goede Hoofdstuk 4: Onderzoeksontwerp
Marktonderzoek als proces
Record Linkage: Simulatie Resultaten Adelaide Ariel Biolink NL 28 maart 2014.
Fasen van onderzoek Onderzoeksplan bureauwerk Dataverzameling
Risico’s en gevaren van techniek
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Hoofdstuk 3 – Gegevens verzamelen
Experimenteel en quasi-experimenteel onderzoek
Statistiek Verzamelen Voorstellen Beschrijven Interpreteren
Gegevensverwerving en verwerking
Meervoudige lineaire regressie
Twee-factor Variantie-analyse
Inferentie voor regressie
Schatter voor covariantie
Metingen met spreiding
1212 /n Metingen aan de hoogte van een toren  D  wordt gemeten met onzekerheid S  =0.1 o. Vraag 1: Op welke afstand D moet je gaan staan om H zo nauwkeurig.
Een fundamentele inleiding in de inductieve statistiek
Onderzoeksmethode Oftewel: met welke specifieke onderzoeksmethode kan ik het best mijn onderzoeksvraag beantwoorden.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Hoofdstuk 9 Verbanden, correlatie en regressie
De steekproefopzet bepalen
Voorspellende analyse
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
Eenvoudige data-analyse: beschrijvende statistische
variabelen vaststellen
De steekproefopzet bepalen
Hoofdstuk 6 Steekproeven trekken Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian Thornhill, Marije Booij en Jan.
Wetenschappelijke methode
Hoofdstuk 1 Basisvaardigheden.
Populatiegemiddelden: recap
Vormen van studie (ontwerp)
Statistiek voor Historici
METHODEN 1 Jules Ellis. Organisatie Ik = Jules Ellis Spreekuur: Dinsdag 15: :30. Syllabus , reader , supplement Zelfstudieopdrachten.
Hoofdstuk 4 – Gegevens analyseren
De steekproefuitkomsten generaliseren naar de populatie
Steekproefonderzoek -- methodologie
Partiële r² Predictie van y gebaseerd op z alleen
Doel onderzoek : ALGEMEEN : De kwaliteit van leven in de verschillende zorggroepen. Is er een verband tussen : veranderingen in fysieke, psychische en.
Baarde en de goede Hoofdstuk 11: Data-analyse
28 mei Symposium Statistical Auditing Slide 1 Steekproefmethoden bij EU audits Paul van Batenburg.
Wat zegt de COS over steekproeven en data-analyse?
20 mei Symposium Statistical Auditing Slide 1 Wat zegt de COS over steekproeven en data-analyse? Paul van Batenburg.
– Hoe pak ik een kwantitatief onderzoek aan?
Methoden & Technieken van Onderzoek
Hogeschool Rotterdam, Opleiding Vastgoed & Makelaardij drs. ing. M.M.A. Scheepers Collegejaar college.
Methoden & Technieken van Onderzoek
Workshop basismonitoring Belgische offshore windmolenparken Thema 1: natuurlijke variabiliteit & gradiënten N. Vanermen & S. Degraer WINMON Workshop, Oktober.
Marktonderzoek © 2011 | Noordhoff Uitgevers bv College 4 Hoofdstuk 6 Steekproef.
Onderzoeksplan en onderzoeksmodel Een kort resumé vorige colleges
Het doel en de grondbeginselen van statistiek in klinische onderzoeken
Gegevens verzamelen Statistiek gaat over het verzamelen en verwerken van data (gegevens ) Data zijn vaak gespreid: -mensen hebben verschillende lengtes.
Wat zegt een steekproef?
Betrouwbaarheidsinterval
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
Eenvoudige data-analyse: beschrijvende statistische
De omvang van een steekproef bepalen
Toetsen van verschillen tussen twee of meer groepen
Hoofdstuk 4 Kwantitatieve dataverzamelingsmethoden Nel Verhoeven
Voorspellende analyse
Weging Woningmarktmodule 2018
Transcript van de presentatie:

Hoofdstuk 3 Gegevens verwerven

Bij de analyse van gegevens 2 doelstellingen: 1. Exploratieve data-analyse geen specifieke vragen onbekende gegevens, grafisch bekijken patronen zoeken, nieuwe vragen, verder onderzoek zelden overtuigende bewijzen 2. Formele statistische inferentie antwoorden op specifieke vragen minder grafisch, vooral numeriek maat voor betrouwbaarheid van conclusies

3.1. Eerste stappen Wat meten : variabelen ? Hoe meten : instrumenten of methoden ? ONTWERPEN : methodiek voor het verwerven van data

A. Waar kan men gegevens vinden ? Voorbeeld : Hoe vaak komt dit fenomeen voor in de populatie ? Anekdotisch bewijsmateriaal : lukraak gekozen individuen, niet representatief Beschikbare gegevens : kunnen vroeger verkregen data een antwoord bieden Nieuwe data verwerven door steekproeftrekking of experimenten

B. Steekproeftrekking Steekproeftrekking : een gedeelte bestuderen (steekproef) om zicht te krijgen op het geheel (populatie) Opdat conclusies zouden gelden voor de hele populatie moet steekproef goed gekozen worden

C. Experimenten In steekproef : info verzamelen zonder iets te veranderen In experiment : effect van ingreep meten DE manier om oorzaak-gevolg relatie vast te stellen DE methode die gebruikt wordt om kennis te verzamelen in de wetenschap

3.2. Proefopzet : opzet van experimenten Basisterminologie : elementen of proefpersonen experimentele conditie of behandeling Voorbeeld : medicijn voor beter presteren medicijn A en B (Factor 1 met 2 niveaus) tijdstip 10’ 20’ 30’ (Factor 2 met 3 niveaus)

=> 6 experimentele condities of behandelingen Factor 1 : tijd (3niveaus) Factor 2 : Medicijn (2niv) => 6 experimentele condities of behandelingen

Alle andere factoren worden constant gehouden in een experiment DUS conclusies van 1 variabele op een andere Goed bewijs leveren van een causaal verband In experiment kunnen ook interacties tussen factoren bekeken worden bv. 10’ medicijn A effectief en 30’ medicijn B

A. Vergelijkende experimenten Meest eenvoudig opzet : waarneming pre - behandeling - waarneming post pijn - medicijn - pijn MAAR placebo-effect DUS : NIET 1 behandeling behandelingen VERGELIJKEN => gebruik maken van een controlegroep

Placebo = schijnbehandeling Placebo effect: positief reageren ook al is er maar een schijnbehandeling (wegens vertrouwen in de arts of hoop op genezing, verwachting) In experiment : beheersing van de effecten van externe variabelen (bv. omgeving, vertrouwen in arts, verwachting, …) Vertekening : als systematisch bepaalde uitkomsten bevoordeeld worden bv. medicijn zonder controlegroep

B. Randomisatie Indien twee groepen in een experiment vergeleken moeten worden, moeten deze groepen ook vergelijkbaar zijn Twee groepen koppelen of matchen op bepaalde variabelen bv. leeftijd, geslacht, conditie, … MAAR : verborgen variabelen, moeilijk meten

Beter : randomisatie = toewijzen aan een groep op basis van toeval gerandomiseerde toewijzing groep 1 groep 2 behandeling 1 behandeling 2 vergelijk reacties

Door toewijzing op basis van toeval geen systematische verschillen tussen groepen wel toevallige verschillen tussen groepen Bij vergelijking tussen groepen na behandeling : verschil dat te groot is om toegeschreven te worden aan toeval = STATISTISCH SIGNIFICANT = toe te schrijven aan de behandeling groepen moeten wel voldoende groot zijn !!

Basisprincipes van experimenten : 1. Beheersing door vergelijking 2. Randomisatie bij toewijzing 3. Herhaling op voldoende proefpersonen

C. Hoe randomisatie doen Briefjes trekken uit een hoed Tabel van toevalscijfers gebruiken (Tabel B) Volledig gerandomiseerd : als alle onderzoekseenheden op toevallige wijze zijn toegewezen

D. Waarschuwingen bij experimenten Verborgen vertekening : ene groep anders behandelen dan andere groep => oplossing : dubbelblind experiment : proefpersoon en proefleider weten niet in welke groep proefpersoon zit Gebrek aan realisme : opzet van experiment is te verschillend van realiteit : goede kennis van vakgebied is noodzakelijk

E. Andere proefopzetten Naast volledig gerandomiseerd proefopzet Ontwerp van gekoppelde paren : niet volledig random blokken op grond van belangrijkste onvermijdelijke bronnen van variabiliteit binnen de blokken opnieuw randomiseren Voorbeeld : indien geslacht een rol speelt : eerst blokken op basis van geslacht

Proefpersonen Mannen Vrouwen Th1 Th2 Th3 Th1 Th2 Th3 Vergelijken Vergelijken

3.3. Een steekproeftrekking ontwerpen Basisterminologie: hele groep = populatie elementen zijn leden van de populatie steekproef is gedeelte van populatie dat wordt onderzocht Vertekening of systematische fouten door sommige delen van populatie te bevoordelen bv. vrijwillige reactie (70% geen kinderen meer)

A. Enkelvoudige aselecte steekproef Op zo een manier gekozen dat elke verzameling met n elementen evenveel kans heeft om de steekproef te zijn Systematische aselecte steekproef : bv. elke 7de van de lijst : wel elke eenheid evenveel kans niet elke verzameling eenheden evenveel kans

B. Gestratifieerde steekproeven Kanssteekproeftrekking : elk lid heeft op voorhand een gegeven kans om getrokken te worden (indien iedereen gelijk = EAS) Gestratifieerde aselecte steekproef stratum op voor hand bepalen dan EAS uit de verschillende strata

Strata (cfr. Blokontwerpen) : feiten die op voorhand bekend zijn: stratum = groepen van overeenkomstige individuen Bv. Stratifiëren op : Geslacht Leeftijd SES Gezondheidskenmerken (rokers vs niet-rokers)

C. Getrapte steekproeven Getrapte steekproef : bv. 1. steekproef van gemeenten 2. steekproef van postcodes uit gemeenten 3. steekproef van straten uit postcodes 4. steekproef van huisnummers uit straten Dit kan ook via gestratifieerde steekproef : Plattelandsgemeenten, stadsrand, stad

D. Waarschuwingen bij steekproefonderzoek Onvolledige dekking : populatie niet volledig opgenomen in lijst Nonrespons : meer dan 30% Vertekende reactie : suggestie van ondervrager, ras, geslacht, ... liegen van ondervraagde, vergeten, “telescoop-effect”, … Formulering van vragen

3.4. Naar statistische inferentie Statistische inferentie : conclusies over populatie op basis van resultaten van steekproef Gebaseerd op wetten van de kansrekening : dus randomisatie van data is zeer belangrijk Terminologie : parameter : getal dat de populatie beschrijft steekproefgrootheid : getal berekend uit de data

A. Steekproefvariabiliteit Voorbeeld : parameter: hoeveel % gaat niet naar de kerk steekproefgrootheid : 1035 op 1785 = 58% parameter p is onbekend en wordt geschat op basis van steekproef p = 58% is dat een nauwkeurige schatter ? Steekproefvariabiliteit bv 56% in andere steekproef

B. Steekproefverdelingen Bij herhaald trekken van steekproeven krijgen we verschillende waarden maar met een zekere verdeling STEEKPROEFVERDELING : de verdeling van de waarden die een steekproefgrootheid aanneemt bij alle mogelijke steekproeven van dezelfde omvang uit één populatie Kenmerken : symmetrische verdeling dicht bij normaalverdeling, centrum van de verdeling is p

C. Vertekening van een steekproefgrootheid Vertekening : systematische fouten in het schattingsproces zodat p in dezelfde richting afwijkt van p Zuivere schatter : een steekproefgrootheid is een zuivere schatter als de verwachting (gemiddelde) van de steekproefverdeling gelijk is aan de werkelijke waarde van de parameter

D. Variabiliteit van een steekproefgrootheid Variabiliteit van een steekproefgrootheid wordt gemeten door de spreiding van zijn steekproefverdeling Vertekening en variabiliteit zijn afzonderlijke kenmerken Grotere steekproeven geven minder variabiliteit

Variabiliteit gemeten door spreiding of standaardafwijking 68-95-99.7 regel : 95% tussen -2 en +2 standaardafwijking Als het gemiddelde 60% is dan bij 100 personen tussen 50% en 70% bij 2000 personen tussen 57% en 62% Variabiliteit hangt af van steekproefgrootte NIET erg van de omvang van de populatie Of je nu uit grote of kleine populaties steek-proef neemt : dezelfde grootte steekproef is nodig voor betrouwbare resultaten

E. Vertekening en variabiliteit Vertekening = schieten buiten de roos Roos = de grootheid in de populatie Hoge variabiliteit = schoten liggen wijd verspreid om het doel Lage variabiliteit = herhaalde schoten liggen dicht bij elkaar

Hoge vertekening Lage vertekening Lage variabiliteit Hoge variabiliteit Hoge vertekening Lage vertekening Hoge variabiliteit Lage variabiliteit

F. Waarom randomiseren Door randomisatie : Wetten van kansrekening Bij benadering normale verdeling Vertekening is minimaal Variabiliteit kan klein gemaakt worden door steekproef te vergroten => Op basis daarvan uitspraken doen over de populatie op basis van de steekproef