Testen met een klein aantal testmonsters Rob Ross.

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
Samantha Bouwmeester Testtheorie Responsie College Samantha Bouwmeester.
Toetsen van verschillen tussen twee of meer groepen
De omvang van een steekproef bepalen
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
TI 84 Plus versus TI Nspire augustus 2010Symposium T32 Werken met breuken TI 84 Plus Opgave mogelijkheid om breuken als breuken in te voeren (ALPHA.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
DIAGNOSE Typisch probleem:
De Weibull verdeling Waloddi Weibull ( ) Weibull:
havo A Samenvatting Hoofdstuk 8
Tussenpresentatie Modelleren C Random Seeds Sanne Ernst Jarno van Roosmalen.
Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere
P-waarde versus betrouwbaarheidsinterval
Eindpresentatie Modelleren C Random Seeds
Prestaties Schatten en Managen
Hoe kan het jou veranderen?
Jan Talmon Medische Informatica Universiteit Maastricht
vwo B Samenvatting Hoofdstuk 1
vwo C Samenvatting Hoofdstuk 14
vwo C Samenvatting Hoofdstuk 12
Thesisseminarie 4 Resultaten Correlatie en multiple regressie
Gegevensverwerving en verwerking
Meervoudige lineaire regressie
Inferentie voor regressie
Schatter voor covariantie
1212 /n Metingen aan de hoogte van een toren  D  wordt gemeten met onzekerheid S  =0.1 o. Vraag 1: Op welke afstand D moet je gaan staan om H zo nauwkeurig.
Continue kansverdelingen
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Voorspellende analyse
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
Eenvoudige data-analyse: beschrijvende statistische
Eekhoutcentrum – oktober 2005 Johan Deprez – Hilde Eggermont
1.In het onderzoek naar perceptie werd in slechts 28% van de gevallen de portie binnen een 10%-verschil met de werkelijke portie ingeschat. Het gemiddelde.
Vereisten voor een screeningsprogramma
De steekproefuitkomsten generaliseren naar de populatie
Het Trendmodel Presentatie voor: bestuurlijke bijeenkomst verdeelmodel WWB Den Haag, 5 maart 2014 Lucy.
Betrouwbaarheid.
Cursus Regressie-analyse Rijkswaterstaat, 13 februari
ribWBK11t Toegepaste wiskunde Lesweek 01
Parametric release Wat is dat?.
Hoorcollege 2 Enkele statistische verdelingen ED: Het experiment atoom Labels De empirische distributie.
TirPrs06: Wachttijdtheorie & simulatietechniek
Beleggen en financiële markten Hoofdstuk 2 Risico en rendement
Tot nu toe. Geschiedenis Uitzonderingen, verschil in incidenties.
Na de praktijk, de theorie.. Zoals een gehaktmolen 1.Je stopt er iets in. 2.Je hoeft niet te weten wat er binnenin gebeurt. 3.Het resultaat verschijnt.
De Axesse Hoe nauwkeurig is hij nu? Daan Wolters.
BEPALING VAN DE ONDERHOUDS-SCOPE VOOR REGEL- EN BLOKKLEPPEN RUUD DE COCQ.
Mart H. Mojet Workshop 2.2 Docentendag Netwerk Noord, 24 juni 2016 NLT Statistiek, Big Data, en MS Excel.
Scuba Service bvba en. Keuren van Composietflessen d.m.v. Volumetrische Expansie ISO NBN EN voor Half omwikkelde NBN EN voor Volledig.
Het doel en de grondbeginselen van statistiek in klinische onderzoeken
Wat zegt een steekproef?
Betrouwbaarheidsinterval
Hoe eenvoudig is een gemiddelde?
eenheden variabele productiefactor (arbeid) productie in aantallen
Wind gezien door de ogen van een windturbine ontwerper
Kwantitatieve onderzoeksresultaten
Eenvoudige data-analyse: beschrijvende statistische
De omvang van een steekproef bepalen
Toetsen van verschillen tussen twee of meer groepen
Voorspellende analyse
Genoomfokwaarden in de praktijk
Weging Woningmarktmodule 2018
Kwantitatieve kenmerken
De gehele getallen op een getallenas en in een assenstelsel
Hoe eenvoudig is een gemiddelde?
Gebruik van SNP-merkers in fokwaardeschatting
Transcript van de presentatie:

Testen met een klein aantal testmonsters Rob Ross

Inhoud Ideaal product Statistische verdeling Normaal (Gauss) versus Weibull Grafiek kans tegen de tijd Grafiek gelineariseerd Parameters schatten Effect kleine testseries

Ideaal product qua levensduur Voorspelbaar qua falen: – Gemiddelde goed bekend – Zeer kleine spreiding Gegarandeerd minimum levensduur Gegarandeerd maximum levensduur Duidelijke aankondiging van falen Afhankelijk van toepassing?

Kennen van een statistische verdeling Verstandig bij – Serieproductie – Kritisch onderdelen Bij grotere, complexere, eenmalige systemen vaak achterwege: – Dan duur/ingebruikname test op hele systeem – Eventueel toch testen op kritische onderdelen Focus op seriematige producten

Populatie: bij elkaar horende groep Vanwege: – Ontwerp, – Historie (productie, behandeling), – Veroudering (belasting, faalmechanisme) Gedrag is soortgelijk, maar niet gelijk – Sommige falen eerder dan andere – Spreiding door (externe) toevalligheden

Normale verdeling (Gaussverdeling) Als een gemiddelde wordt bepaald uit veel data (eigenlijk gemiddelde data) Als data zelf normaal verdeeld zijn NB: −∞ < x < ∞ – (probleem met negatieve testtijden) range [x 1,x 2 ] =[m-5s, m+5s][m-4s, m+4s][m-3s, m+3s][m-2s, m+2s][m-s, m+s] F(x 2 )-F(x 1 ) = % %99.73%95.45%68.27% 1-{F(x 2 )-F(x 1 )} = %0.0063%0.27%4.55%31.73%

Gauss: veel gebruikt om spreiding range [x 1,x 2 ] =[m-5s, m+5s][m-4s, m+4s][m-3s, m+3s][m-2s, m+2s][m-s, m+s] F(x 2 )-F(x 1 ) = % %99.73%95.45%68.27% 1-{F(x 2 )-F(x 1 )} = %0.0063%0.27%4.55%31.73%

Weibull Als het gaat om de zwakste schakel in een lange keten Als data zelf Weibull verdeeld zijn NB: 0 ≤ x < ∞ Parameters:  en  – Schaalparameter  – Vormparameter 

Voorbeeld van mogelijke levensduurdata LabelLifetime T (hr) Index i Ranked lifetime T (hr) Failed fraction F (%) Surviving fraction R (%) Original label L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L L7 L4 L1 L11 L5 L9 L2 L10 L3 L8 L6

Grafische weergave Index Observation t i (hr) (%)

Punten spreiden om hun gemiddelde Vb: 5% en 95% betrouwbaarheidsgrenzen

Extrapoleren wordt moeilijk met een S-curve

Geschaalde verdeling is makkelijker te lezen Index Observation t i (hr) (%)

Extrapoleren is nu ook makkelijker Index Observation t i (hr) (%)

Rekenkundig Hoe meer testdata, hoe nauwkeuriger de parameter schatting (maar ook duurder) b is schatting van  ML = maximum likelihood LR = lineaire regressie WLR = gewogen LR Als er geen bias was, dan was =1. Oneindige nauwkeurig zou betekenen spreiding nul.

Effecten van kleine testseries Willekeurige greep uit geheel – Grote spreiding en vertekend beeld mogelijk Volume effect – Kans op zwak exemplaar kleiner Statistische berekeningen bias – Rekenmethoden kunnen afwijking geven

Voorbeeld van generatorstaven Generator bevat 100 staven Als een staaf faalt, faalt de generator Q-programma: – Test isolatie van 4 kwart-staven (doorslagtest) – Check met eerdere testgevens op consistentie – Volgens eerdere tests:  = 400 jr;  = 3,3 – D.w.z. gemiddelde levensduur θ = ca 400 jr Probleem?

Testprobleem: belofte leek 400 jr, maar Overschatting van b door kleine n: – n=4, dan is b geschat =1,6*b echt – Corrigeer daarom: b=1,99 Overschatting van a door volume: – Het gaat om 100 i.p.v. 1 staf, volume-effect – Corrigeer daarom: a=(100) -1/b *400=39,4 jr Niet gemiddelde, maar bijv. 1% of 5% – Corrigeer daarom: t 1% =3,9 jr of t 5% =8,9 jr

In plaats van ‘gemiddelde’ 400 jr geldt: Levensduur bij faalkans 1% is 3,9 jr Levensduur bij faalkans 5% is 8,9 jr

Tot besluit Bij testen met kleine testseries moet gecorrigeerd worden Kans op zwakste exemplaar is namelijk kleiner bij beperktere test-set Goede nieuws: er zijn methoden voor correctie Onderschat niet de waarde van grondig testen