De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Gegevensverwerving en verwerking Staalname Bibliotheek - aantal stalen/replicaten - grootte staal - apparatuur - beschrijvend - variantie-analyse - correlatie.

Verwante presentaties


Presentatie over: "Gegevensverwerving en verwerking Staalname Bibliotheek - aantal stalen/replicaten - grootte staal - apparatuur - beschrijvend - variantie-analyse - correlatie."— Transcript van de presentatie:

1 Gegevensverwerving en verwerking Staalname Bibliotheek - aantal stalen/replicaten - grootte staal - apparatuur - beschrijvend - variantie-analyse - correlatie - regressie - ordinatie - classificatie Experimentele setup Statistiek Websites : => electronic statistic textbook allserv.rug.ac/ ~katdhond/ => reservatie PC zalen / ~gdsmet/MarBiolwebsite/ => lesnota’s

2 Licht temperatuur nutrienten …….. Groei voedselaanbod verstoring …….. densiteiten OnafhankelijkeAfhankelijke variabelen Correlatie = graad van associatie tussen 2 variabelen Regressie = beschrijving van verband Impliceert geen causaal verband Impliceert geen afhankelijkheid

3 Parametrisch of niet-parametrische testen Product-moment Spearman rank Kendall’s rank Als een gekende distributie (normale of Poisson) als model voor data frequentie distributie kan gebruikt worden Niet-parametrische testen die niet uitgaan van deze voorwaarden, zijn minder krachtig doordat ze niet alle aanwezige informatie gebruiken => RANKING In het geval van kleine stalen en geen normale distributie van de data zijn ze echter krachtiger dan parametrische testen.

4 Parametrisch of niet-parametrische testen Product-moment voor N koppels van waarnemingen(x 1,y 1 ) …( x i,y i )... (x N,y N ) R varieert tussen -1 en +1 De significantietest is afgeleid van een student-t distributie met N-2 df R is maat voor sterkte van lineair verband (zegt niets over vorm) HOHO Nulhypothese “ R=0 => geen associatie”

5 X Y Z Parametrisch of niet-parametrische testen Product-moment Partiële correlatie- berekening aan de hand van R : = berekening van graad van associatie waarbij het mogelijke effect van een derde factor wordt geneutraliseerd. Voorbeeld : berekening van correlatie tussen factor X en factor Y waarbij het effect van factor Z (die ook gecorreleerd is met X) constant wordt gehouden

6 Partiële correlatie- berekening aan de hand van R : = berekening van graad van associatie waarbij het mogelijke effect van een derde factor wordt geneutraliseerd. R XY = 1X Y X Z Y R XY = 1 R XY.ZW => 1 X Z V Y W

7 Parametrisch of niet-parametrische testen Spearman rank Kendall’s rank Voorbeeld:

8 Gegevensverwerving en verwerking Staalname Bibliotheek - aantal stalen/replicaten - grootte staal - apparatuur - beschrijvend - variantie-analyse - correlatie - regressie - ordinatie - classificatie Experimentele setup Statistiek Websites : => electronic statistic textbook allserv.rug.ac/ ~katdhond/ => reservatie PC zalen / ~gdsmet/MarBiolwebsite/ => lesnota’s

9 Licht temperatuur nutrienten …….. Groei voedselaanbod verstoring …….. densiteiten OnafhankelijkeAfhankelijke variabelen Correlatie = graad van verband Regressie = beschrijving van verband

10

11 Lineaire regressie-analyse - nagaan van effecten van sommige variabelen op andere variabelen - relatie tussen variabelen beschrijven met een (lineaire) functie 2 soorten variabelen : Predictor of onafhankelijke variabelen (X) Respons of afhankelijke variabelen (Y) Hoe bepalen veranderingen in de onafhankelijke variabelen de waarden van de afhankelijke variabelen??? Type 1 : relatie tussen 2 variabelen kan beschreven worden door een rechte lijn = LINEAIRE REGRESSIE Vergelijking van een rechte : Y = a + bX

12 Lineaire regressie-analyse Vergelijking van een rechte : Y = a + bX X = onafhankelijke variabelen Y = afhankelijke variabelen a en b zijn parameters of constanten 1 1 b1b1 b2b2 a1a1 a2a2 Y = a 2 +b 2 X Y = a 1 +b 1 X a = waarde van Y als X = 0 ; = snijpunt Y as b = aantal eenheden dat Y verandert als X met één eenheid verandert; = helling

13 Residuelen (e) Y = a + bX + e

14 Residuelen (e) Y = a + bX + e e= residuele = afwijking van de geobserveerde y-waarden van de voorspelde y waarden M.a.w. Y kan maar gedeeltelijk voorspeld worden op basis van X omdat Y een ariatie vertoont tengevolge van ongekende willekeurige factoren Zelden een rechte lijn door alle data ==> compromis van best passende rechte => residuelen zo klein mogelijk houden bij bepalen van a en b

15 door de METHODE van de KLEINSTE KWADRATEN = minimalisatie van de som van de gekwadrateerde residuelen Voor n koppels van observaties (x 1, y 1 )...(x i, y i )...(x n, y n ) met y 1 = a + b x 1 + e 1 en i = 1, …n De som van de kwadraten van de residuelen is dan : (y 1 - a - b x 1 )² Dus a en b worden nu zo berekend dat een zo klein mogelijke waarde voor S wordt bekomen

16 => residuelen zo klein mogelijk houden bij bepalen van a en b door de METHODE van de KLEINSTE KWADRATEN = minimalisatie van de som van de gekwadrateerde residuelen (y i - a - b x i )² Dus a en b worden nu zo berekend dat een zo klein mogelijke waarde voor S wordt bekomen Totale populatie Y = a + b X ==> Schatting S minimaal door differentiaties van S naar a en b gelijk te stellen aan 0 waaruit a en b kunnen berekend worden met als resultaat : wordt danof Met b’ de enige onbekende die moet berekend worden om een schatting van Y te bekomen

17 Betrouwbare schatting Onbetrouwbare schatting ????????????

18 Significantie-test : Maat voor betrouwbaarheid van schatting Gebaseerd op de splitsing van de som der kwadraten (SS) cfr ANOVA X as Y as = geobserveerde Y waarde = voorspelde of geschatte Y waarde = gemiddelde Y waarde Tot. var. Variatie tussen groepen (effect) Variatie binnen groepen (error) SS Y SSregr. SSres SS Y SSregr.SSres =+

19 SS Y SSregr.SSres =+ Bron van variatie Vrijheidsgraden (df) Som kwadraten SS Gemiddelde kwadraten MS = SS/df Totaal n-1 Tussen 1 tgv Regressie Binnen n-2 Residuele MS regr S ² = SS / n-2 Variantie s² = MS = SS / df Vrijheidsgraden is aantal onafhankelijke eenheden om SS te bekomen Volgt bij benadering een F-distributie met 1 en n-2 vrijheidsgraden indien b=0 Dus indien F > F tabel => Regressie is significant

20 R² ratio: Maat voor % variatie verklaard door regressieid van schatting X as Y as = geobserveerde Y waarde = voorspelde of geschatte Y waarde = gemiddelde Y waarde SS Y SSregr.SSres =+ R² = SSregr. SS Y SSres Indien =0 => R² = 1 >>0 => R²=>0 R² geeft weer hoeveel % variatie in Y kan worden toegeschreven aan een lineaire relatie met X. De overige variatie is willekeurig.

21 Standard error van de schatting = standard deviatie van de geobserveerde Y waarden van de voorspelde Y waarden = gemiddelde fout in de voorspelling van Y op basis van de regressie Standard error van b’ Standard error van a’ = schatting van de variantie van b’ Indien de schattingen van b’ van verschillende staalnamen normaal verdeeld zijn kunnen betrouwbaarheidsintervallen berekend worden voor b’. De nulhypothese dat b=0 kan dan getoetst worden aan de hand van een t-test. = schatting van de variantie van a’


Download ppt "Gegevensverwerving en verwerking Staalname Bibliotheek - aantal stalen/replicaten - grootte staal - apparatuur - beschrijvend - variantie-analyse - correlatie."

Verwante presentaties


Ads door Google