Math Candel Universiteit Maastricht. 1.Heldere en haalbare probleemstelling 2.Keuze van het design 3.Keuze van onderzoeks/analyse-eenheid 4.Operationalisatie.

Slides:



Advertisements
Verwante presentaties
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Advertisements

Statistische uitspraken over onbekende populatiegemiddelden
HC2MFE Meten van verschillen
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Toetsen van verschillen tussen twee of meer groepen
Math Candel Universiteit Maastricht. •Achtergrond: –Diagnose probleem –Meetinstrumenten –Conceptueel model •Presentaties van eigen analyses •Voorbeeld.
Statistiek II Deel 1.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
College 2 Between-subject en within-subject designs
Fasen van onderzoek Onderzoeksplan bureauwerk Dataverzameling
Jongeren met visuele beperking: persoonlijk netwerk en welbevinden
Vergelijkbaarheid historische studies
Betrouwbaarheid en validiteit: Alleen een kwestie van goed meten ?
Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek COLLEGE 3: VOOR PAUZE.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Betrouwbaarheid en Validiteit
IJmert Kant Epidemiologie Universiteit Maastricht
Onderzoekersforum CQ-index
Experimenteel en quasi-experimenteel onderzoek
Beschrijvende en inferentiële statistiek
P-waarde versus betrouwbaarheidsinterval
toetsen voor het verband tussen variabelen met gelijk meetniveau
Jong geleerd, fout gedaan?
Chapter 9. Understanding Multivariate Techniques
Gegevensverwerving en verwerking
Gegevensverwerving en verwerking
Non-parametrische technieken
Meervoudige lineaire regressie
Twee-factor Variantie-analyse
Inferentie voor regressie
Multifactoriële designs
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Voorspellende analyse
Eenvoudige data-analyse: beschrijvende statistische
Hoofdstuk 6 Steekproeven trekken Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian Thornhill, Marije Booij en Jan.
Populatiegemiddelden: recap
Logistische regressie
Effect modificatie Algemeen principe Bepalen van effect modificatie
Bronnen van ‘fout’ Validiteit (en precisie)
Aanvullende vragen Collegesheets M&S3
Responsie college II: Spearman-Brown G = nieuwe schaal Y= oude schaal
Voorspellende factoren van post-CVA depressie
Illustratie mogelijke redenen lage ICC’s in multilevel modellen bij de CQI Peter Moorer ARGO Rijksuniversiteit Groningen BV © ARGO – april 2009.
De steekproefuitkomsten generaliseren naar de populatie
Nederlands tijdschrift voor Diabetologie
Varianties bij replicatie (herhaald testen)
Partiële r² Predictie van y gebaseerd op z alleen
Doel onderzoek : ALGEMEEN : De kwaliteit van leven in de verschillende zorggroepen. Is er een verband tussen : veranderingen in fysieke, psychische en.
Baarde en de goede Hoofdstuk 11: Data-analyse
Cursus Regressie-analyse Rijkswaterstaat, 13 februari
Leydi Johana Breuls “In hoeverre speelt de sociale samenstelling van een sportclub een rol in de beslissing van leden om te stoppen?“ 01 Waarom?
Niet meer zenuwziek van de statistiek, maar … hoe statistiek weer te waarderen via 4C/ID? Hans van Buuren - OUNL 4C/ID
Methoden & Technieken van Onderzoek
Hogeschool Rotterdam, Opleiding Vastgoed & Makelaardij drs. ing. M.M.A. Scheepers Collegejaar college.
Latent class growth analysis als succesvolle methode om subgroepen te identificeren binnen een gewichtsreductie interventie. Bastiaan C. de Vos¹, MD,
Methoden & Technieken van Onderzoek
FOKKE en SUKKE helpen bij het veldwerk. Gebruik van een statistisch pakket SPSS Opslaan en bewerken data –selecteren –wegen –hercoderen –Ontwerpen van.
Marktonderzoek © 2011 | Noordhoff Uitgevers bv College 4 Hoofdstuk 6 Steekproef.
Onderzoeksplan en onderzoeksmodel Een kort resumé vorige colleges
Behandeling. Moet elke behandeling getoetst? Plausibel mechanisme: carotisbypass?
Prognostische factoren van chronische buikpijn bij kinderen in de eerste lijn
Illustratie mogelijke redenen lage ICC’s in multilevel modellen bij de CQI Peter Moorer ARGO Rijksuniversiteit Groningen BV © ARGO – april 2009.
Een frequent attender is meer dan de som van zijn morbiditeiten
Eenvoudige data-analyse: beschrijvende statistische
De omvang van een steekproef bepalen
Toetsen van verschillen tussen twee of meer groepen
Voorspellende analyse
Weging Woningmarktmodule 2018
Transcript van de presentatie:

Math Candel Universiteit Maastricht

1.Heldere en haalbare probleemstelling 2.Keuze van het design 3.Keuze van onderzoeks/analyse-eenheid 4.Operationalisatie van variabelen 5.Keuze van statistische technieken 6.Afbakening van populatie 7.Steekproefmethode, steekproefomvang en “power” 8.Tijdschema en procedures Dit is ook de volgorde van het verslag !!

Als rode draad een voorbeeld -Wel of geen interventie ? - Wel of niet longitudinaal ? Leidt langdurige blootstelling aan harde muziek in disco’s tot gehoorbeschadiging ?

L O N G I T U D I N A A L I____________________________________________ N ja nee T____________________________________________ E jaExperiment R Quasi-experiment V E neeCohort studieDwarsdoorsnede N (Steekproef uit basispopulatie) T Patiënt-controle I (Selectie van zieken) E ____________________________________________

Voorbeeld •Interventie: Onmogelijk, expositie aan harde muziek niet ethisch •Longitudinaal: meer zicht op causatie •Geen individuele informatie omtrent blootstelling aan muziek  prospectieve cohort studie

Vaak geneste structuur (voorbeeld)

Niveau 3 Niveau 2 Niveau 1

Vaak geneste structuur (voorbeeld) Niveau 3 Niveau 2 Niveau 1

Vaak geneste structuur (voorbeeld) Niveau 3 Niveau 2 Niveau 1

Vragen: Keuze analysetechniek: •Zijn de niveau’s fixed of random ? •Op welk niveau speelt de vraagstelling zich af ? •Is het design gebalanceerd ? •Bij random niveaus: Random-effects of Multilevel Analyse •Uitzondering: Hoogste niveau + gebalanceerd design: Aggregeer metingen tot op hoogste niveau

Hoe zet ik begrippen als “blootstelling aan harde muziek” en “gehoorschade” om in meetbare grootheden ? •Afhankelijke variabele slechts op 1 manier operationaliseren  multiple testing •Metingen dienen betrouwbaar te zijn (doe hermetingen en neem gemiddelde) •Metingen dienen valide te zijn (voorkom bijv. antwoordtendenties bij vragenlijsten)

Multiple testing •Dubbelzinnige resultaten: Sommige operationalisaties laten wel een effect zien, andere niet •Veel type I fouten Oplossing: Bonferroni correctie Bij K toetsen, neem dan als significantieniveau:  * =  /K

Illustratie Bonferroni correctie Aantal toetsen (K) Aantal toetsen

Voorbeeld •Effectmaat:Gehoorverlies in dB, gemiddeld over een reeks toonhoogten •Onafhankelijke variabelen: –Duur van blootstelling: Via een vragenlijst het aantal uren in 5 jaar (gemiddelde per week x aantal weken) – Intensiteit: Aantal dB via audiometer (meerdere metingen over 5 jaar in gefrequenteerde disco’s) •Confounders / Effectmodificatoren: Geslacht, leeftijd, expositie aan ander lawaai (via vragenlijst)

•Aantal variabelen: –Onafhankelijke variabelen –Afhankelijke variabelen •Type variabele: –Binair –Polytoom –Continu •Type design: –Tussen-subject design –Binnen-subject design

Y continuY binair 1 X binairT-toets Mann-Whitney  2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test  2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X’en Lineaire regressie ANOVA Logistische regressie

Y continuY binair 1 X binairT-toets Mann-Whitney  2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test  2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X-en Lineaire regressie ANOVA Logistische regressie

Y continuY binair 1 X binairT-toets Mann-Whitney  2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test  2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X-en Lineaire regressie ANOVA Logistische regressie

Y continuY binair 1 X binairT-toets Mann-Whitney  2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test  2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X-en Lineaire regressie ANOVA Logistische regressie

Y continuY binair 1 X binairT-toets Mann-Whitney  2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test  2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X-en Lineaire regressie ANOVA Logistische regressie

Y continuY binair 1 X binairT-toets Mann-Whitney  2 - toets voor kruistabel polytoom1-weg ANOVA Kruskal-Wallis test  2 - toets voor kruistabel continu(Rang)correlatie Lineaire regressie Logistische regressie Meerdere X-en Lineaire regressie ANOVA Logistische regressie

Voorbeeld •Afhankelijke variabele: Gehoorbeschadiging (GB) •Blootstellingsduur (DUUR) is een effectmodificator van de muziekintensiteit (INT) •Potentiële confounders: Overig lawaai (LAWAAI), geslacht (GESL) en leeftijd (LEEFT) Meervoudige lineaire regressie: GB = B 0 + B 1 *INT + B 2 *DUUR + B 3 *INT*DUUR + B 4 *LAWAAI + B 5 *GESL + B 6 *LEEFT + 

•Ethische redenen (bijv. geen ernstig zieken) •Praktische redenen (beperkte hoeveelheid tijd en geld) •Methodologische redenen: –Minder onverklaarde variantie –Minder storende factoren (“confounders”) –Voldoende variatie op risicofactor

Voorbeeld •Praktische reden: Alleen Zuid-Nederland •Methodologische redenen: Alleen jongeren tussen de 14 en 20 jaar Minder variatie wat betreft gehoorsbeschadiging t.g.v. andere factoren (bijv. werk)

Tast afbakening de generaliseerbaarheid aan ? Vraag: De generaliseerbaarheid van wat ? Het gemiddelde ?

GB Randstad Parkstad Muziekintensiteit

Relatie tussen gehoorbeschadiging en intensiteit ? GB Randstad Parkstad Muziekintensiteit

Conclusies: •Gemiddelde is niet generaliseerbaar; Dit is anders voor Randstad en Parkstad •Bestudeerde effect is wel generaliseerbaar; Gemiddelde toename in gehoorbeschadiging t.g.v. een bepaalde toename in muziekintensiteit is hetzelfde voor Randstad als voor Parkstad •Dus: Een effect kan wel generaliseerbaar zijn naar andere populaties, ook als het gemiddelde dat niet is !

•Eenvoudige toetsende statistiek gaat uit van: –Een aselecte/willekeurige steekproef –Een populatie die veel groter is dan de steekproef •In de praktijk: –Steekproef > 10% van de populatie –Gestratificeerde steekproef: Bijv. prestratificatie op geslacht of sociaal-economische status Deze variabelen als covariaat in de analyse opnemen

Voorbeeld: Reden voor stratificatie ? •Effectmodificatie: Het effect van muziekintensiteit is anders voor lange dan voor korte blootstellingsduren •Confouding: Vrouwen en mannen verschillen wat betreft de mate van blootstelling aan harde muziek In beide gevallen: Stratificatie-factor als extra covariaat in de analyse opnemen

–Tweestaps- of clustersteekproef: Men trekt een groot aantal eenheden (bedrijven, scholen, ziekenhuizen, gezondheidscentra, steden), en daarbinnen weer:  een aantal individuen:tweestapssteekproef  alle individuen:clustersteekproef Geschikte analyse:Multilevel of Random-effects analyse

Hoe krijgen we de gewenste power ? •  : Moet klein zijn om type I fouten te vermijden (vaak 0.05 of 0.01) •Signaal: Contrast op interventie of risico-factor verhogen •Ruis: –Invloed van variatie op andere factoren minimaliseren middels design of statistische correctie –Minimaliseren van meetfout

1-  :gewenste power, zeg 0.90 Z :waarde uit standaardnormale verdeling; Z 0.90 = 1.28 •Steekproefomvang voldoende groot laten zijn. Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)

 :kans op het type I fout, zeg 0.05 Z :waarde uit standaardnormale verdeling; Z = 1.96 •Steekproefomvang voldoende groot laten zijn. Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)

 :kleinste correlatie die ontdekt moet worden, zeg 0.30 •Steekproefomvang voldoende groot laten zijn. Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)

•Steekproefomvang voldoende groot laten zijn. Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)

Nog aanpassingen van deze N : A.Er zijn covariabelen: N A = N x VIF = x 2 (naar schatting) = B.Er is uitval te verwachten: Bij k % uitval:N AA = 100/(100-k) x N A Bij 10 % uitval:N AA = 100/90 x = 241

Relatie power, steekproefomvang en signaal

•Overzicht van stappen en tijdsplanning Voorbereiden van onderzoek (testen vragenlijsten, werven proefpersonen,….) Dataverzameling Tussentijdse analyses Eindrapportage en/of presentatie

Hoe om te gaan met: 1.Non-response: niet deelnemen 2.Uitval: voortijdig uit the onderzoek stappen 3.Non-compliance: niet naleven van instructies •Procedures Waarborgen anonimiteit, werven van proefpersonen, “informed consent”, blindering e.d.

Effecten van uitval/nonresponse:

Intensiteit muziek (kernvariabele) Gehoorbeschadiging

Effecten van uitval/nonresponse: Intensiteit muziek (kernvariabele) Gehoorbeschadiging Leeftijd (covariaat)

Leeftijd is geen confounder

Effecten van uitval/nonresponse: Intensiteit muziek (kernvariabele) Gehoorbeschadiging Uitval Leeftijd (covariaat)

Uitval houdt verband met kernvariabele : Intensiteit muziek (kernvariabele) Gehoorbeschadiging Uitval Leeftijd (covariaat)

Uitval houdt verband met kernvariabele en covariaat: Intensiteit muziek (kernvariabele) Gehoorbeschadiging Uitval Leeftijd (covariaat)

Uitval houdt verband met kernvariabele en covariaat: Intensiteit muziek (kernvariabele) Gehoorbeschadiging Uitval Leeftijd (covariaat) Confouding door covariaat; betrek covariaat in de analyse

Vooral uitval bij hoge muziekintensiteiten Uitval treedt met name op onder ouderen

Vooral uitval bij hoge muziekintensiteiten Uitval treedt met name op onder ouderen

Uitval houdt verband met afhankelijke variabele en kernvariabele : Intensiteit muziek (kernvariabele) Gehoorbeschadiging Uitval Leeftijd (covariaat)

Uitval zelf is confounder: uitval als extra covariaat in de analyse betrekken Gevolg: Relatie tussen uitval en afhankelijke variabele kan niet geschat worden Probleem: Voor uitvallers kennen we de waarden niet op de afhankelijke variabele

Hoe om te gaan met non-compliance ? •Intention-to-treat: Non-compliers betrekken in de analyse Adequaat beeld van de effectiviteit van een behandeling in de praktijk •Statistische correctie: Effect van interventie kan weggepoetst worden