Gegevensverwerving en verwerking

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Vierde bijeenkomst Kleinste kwadraten methode Lineaire regressie
Toetsen van verschillen tussen twee of meer groepen
-Glucuronidase (GUS)
Statistiek II Deel 1.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Math Candel Universiteit Maastricht. 1.Heldere en haalbare probleemstelling 2.Keuze van het design 3.Keuze van onderzoeks/analyse-eenheid 4.Operationalisatie.
Hoe teken je een goede grafiek: bovenbouw
Betrouwbaarheid en validiteit: Alleen een kwestie van goed meten ?
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Hoofdstuk 3 – Gegevens verzamelen
Experimenteel en quasi-experimenteel onderzoek
toetsen voor het verband tussen variabelen met gelijk meetniveau
Tussentijdse evaluatie
Statistiek ?! … Ronald Buyl - BISI.
Hoofdstuk 6: Controle structuren
Jong geleerd, fout gedaan?
Experimenteel Design Prof. Dr. S. Van Dongen
vwo A Samenvatting Hoofdstuk 15
Assenstelsels en het plotten van Functies in LOGO
Chapter 9. Understanding Multivariate Techniques
Gegevensverwerving en verwerking
Gegevensverwerving en verwerking
Gegevensverwerving en verwerking
Non-parametrische technieken
Meervoudige lineaire regressie
Twee-factor Variantie-analyse
Inferentie voor regressie
Hoofdstuk 3 Gegevens verwerven.
Schatter voor covariantie
Discrete stochasten Onderwerpen Stochasten (random variables)
Hoofdstuk 9 Verbanden, correlatie en regressie
Voorspellende analyse
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
variabelen vaststellen
Voorspellende analyse
Populatiegemiddelden: recap
Logistische regressie
Effect modificatie Algemeen principe Bepalen van effect modificatie
Statistiek voor Historici
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
Methodes voor de bepaling van de populatiedichtheid:
Hoofdstuk 16 Het vermogen van een test
De steekproefuitkomsten generaliseren naar de populatie
MF “Meten in de Fysica” Introductie en Kennismaking met Dataverwerking INTRO 7.
Onderzoeksmethoden en -Technieken
Betrouwbaarheid.
Partiële r² Predictie van y gebaseerd op z alleen
Dyslexie en het geheugen: De ontbrekende schakel?
Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)
PSO. Praktisch school onderzoek.
Paramaribo, september 2015 Ten behoeve van leerkrachten van de EBGS Mr.dr.E. Marshall & M. Day.
Methoden & Technieken van Onderzoek
Hogeschool Rotterdam, Opleiding Vastgoed & Makelaardij drs. ing. M.M.A. Scheepers Collegejaar college.
Methoden & Technieken van Onderzoek
Leraareffectiviteit – wat weten we (niet)? Daniel Muijs, University of Southampton.
Workshop Power-analyse N. Vanermen, T. Onkelinx, W. Courtens, M. Van de walle, H. Verstraete & E.W.M. Stienen Brussel, 12 januari 2016.
Workshop basismonitoring Belgische offshore windmolenparken Thema 1: natuurlijke variabiliteit & gradiënten N. Vanermen & S. Degraer WINMON Workshop, Oktober.
Testen met een klein aantal testmonsters Rob Ross.
Het doel en de grondbeginselen van statistiek in klinische onderzoeken
Leraareffectiviteit – wat weten we (niet)?
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
Gemeenschaps- en systeemecologie (Ba3) Werkcollege Diversiteitsindices
Toetsen van verschillen tussen twee of meer groepen
Voorspellende analyse
Voorspelling van criminele carrières door 2-dimensionale extrapolatie
Transcript van de presentatie:

Gegevensverwerving en verwerking Bibliotheek Staalname Statistiek - aantal stalen/replicaten - grootte staal - apparatuur - beschrijvend - variantie-analyse - correlatie - regressie Ordinatie DFA - Classificatie Experimentele setup Websites : www.statsoft.com => electronic statistic textbook allserv.rug.ac/ ~katdhond/ => reservatie PC zalen / www.dierkunderug.be.tf/ => lesnota’s

Staalname Kwalitatief Semi-kwantitatief Kwantitatief Per oppervlakte of volume-eenheid Ecologisch onderzoek - hoe groot staal ? - hoeveel stalen ? tijd en ruimte - hoeveel replicaten ? - locatie ? Tijdstip ? Bepalende factoren : grootte en levenswijze organismen patchiness aard ecosysteem - gradienten

Distributiepatronen : “ patchiness” RANDOM UNIFORM GEAGGREGEERD Variantie = < > Gemiddelde Poisson + binomiaal - binomiaal

Random patroon => Poisson distributie kans dat individu in welbepaalde cel terecht- komt is 1 / N Stel N cellen en 1 individu Stel geen krachten werken in op individu Gelijke waarschijnlijkheid om in één van de cellen terecht te komen of proces van herhaalde dichotomie (aan- of afwezig) Indien de waarnemingen verdeeld zijn volgens een poisson distributie betekent dit dat er geen invloed is van gedrag van organismen op elkaar of van omgeving op individuen. Daarom wordt in ecologie of ethologie eerst nagegaan of er een poisson distributie aanwezig is vooraleer men interacties gaat bestuderen.

Schaal waarop men de populatie bekijkt is belangrijk A : random B : aggregatie C : random D : regelmatig Niet altijd visueel zichtbaar => correcte staalname, telling en berekening van parameters noodzakelijk

Chi kwadraat test om goodness of fit na te gaan Als staal voldoende groot is => nagaan of geobserveerde frequentiedistributie al of niet overeenstemt met 1 van de 3 verwachte frequentie-distributies. (waargenomen* - verwacht*)² verwacht* * waarden in elke frequentie-klasse De berekende waarde wordt dan vergeleken met de getabelleerde waarden van df = aantal frequentieklassen - aantal geschatte parameters -1 Poisson 1 + binomiaal 2

aan de hand van 2 statistische paremeters µ en ² Alternatieve methode om distributie-patronen na te gaan : “Taylor’s Power law” aan de hand van 2 statistische paremeters µ en ² Stel we schatten het gemiddelde en de variantie van een populatie aan de hand van verschillende stalen die gekenmerkt zijn door verschillende densiteiten. Door staalgrootte tijd, omgevingsomstandigheden Vervolgens zetten we beide parameters uit ten opzichte van elkaar

Vervolgens gaan we op zoek naar de beste ‘fit’ voor de relatie tussen µ en ² onder de vorm van een machtsfunctie (“power curve”) Regressie-analyse waarbij relatie tussen 2 variabelen wordt beschreven aan de hand van een gekende functie vb machtsfunctie ² = a µb Door middel van de techniek van de kleinste kwadraten wordt dan op zoek gegaan naar a en b die de relatie tussen µ en ² het best beschrijven.

b Door µ en ² om te zetten op log schaal kan deze functie ook lineair worden voorgesteld. 2

b Stel we vinden voor een populatie dat a en b =1 2 Stel we vinden voor een populatie dat a en b =1 = poisson distributie wat wijst op een random distributiepatroon 2 In natuur vinden we meestal dat b> 1 of b is index van aggregatie

Meest geaggregeerd Meest regelmatig

Powerfunctie blijkt dikwijls soortgebonden te zijn Belang van snijpunt a ? Powerfunctie moet gebaseerd zijn op stalen waarvan de densiteiten minstens één grootte-orde van elkaar verschillen. Bij afnemende densiteiten neemt immers het belang van a toe Bij lage densiteiten kunnen geaggregeerde populaties random gaan lijken

=> n = 20 k² Grootte stalen ? Aantal stalen/replicaten ? Aantal stalen om binnen k maal SD te vallen van het populatiegemiddelde met een verwachte betrouwbaarheid

Experimentele benadering Systeem manipuleren om causale verbanden te achterhalen Minimale vereisten : - kennis van oorspronkelijke condities - betrouwbare controles - herhaling Experimenten opgezet op basis van een hypothese => verwacht of voorspeld resultaat

Kennis initiële condities : - Base line data van systeem dat men wil manipuleren - ‘Natural history’ van bestudeerde organismen moet gekend zijn Soms nodig om assumpties te definieren over initiële condities Maakt experiment minder krachtig, betrouwbaar

Controle : Vb Zonder controle => verkeerde conclusie Controle locatie moet zoveel mogelijk op experimentele locatie gelijken => Base line noodzakelijk

Natuurlijke variatie beschouwen Replicatie: Natuurlijke variatie beschouwen Let op - random locatie van behandelingen binnen systeem Plot opdelen in kwadraten => random selectie van kwadraten - vermijden om gerichte keuze te doen van controle en experimentele stalen Aantal replicaten afhankelijk van variabiliteit = > base line

Soms kan men vermoeden dat bepaalde locaties in een experiment Block design Soms kan men vermoeden dat bepaalde locaties in een experiment sterk van elkaar gaan verschillen Vb. 3 behandelingen, 3 stromen Daarom behandeling herhalen in elk van de locaties waartussen men verschillen vermoedt Nagaan van effect van behandeling van locatie van interactie

Stratificatie van data Vb hypothese over groei => duidelijke verschillen tussen sexen voor vele organismen Data voor beide geslachten worden apart gehouden => stratificatie van data Duur experiment -> moet op voorhand bepaald worden Niet laten verleiden experiment te stoppen bij mooie resultaten of te laten duren zolang beoogde resultaten er niet zijn.

Valstrikken Pseudoreplicatie Data moeten volledig onafhankelijk zijn van elkaar In ruimte en tijd Densiteitsafhankelijke processen Vb invloed van densiteit op groei Ongewenste effecten van technieken ‘Kooieffect’ => o.a. schaduw, circulatie water en zuurstof, settlement Effect van aanwezigheid observator op gedrag van organismen Effect van lokaas ‘trap-happy’ vs ‘trap-shy’ => bias