Validatie van tijdreeksmodellen Kwaliteit van voorspellingen en gekwantificeerde onzekerheid 20 november 2014, Martin Knotters.

Slides:



Advertisements
Verwante presentaties
Simulatie in de filosofie Moes Wagenaar Mieke Boon, Peter-Paul Verbeek Anton Nijholt WWTS colloquium 26 augustus 2008 UT Enschede.
Advertisements

The Need for Speed Richard R. Budding.
Zorg Beter mét Vrijwilligers
De Nederlandse Energiebeurs
“Wat is waarheid en hoe kunnen wij die kennen?”
Presteren ijverige studenten beter? De complexe relatie tussen
Xxxxxxxxxxxxxxx 4/4/2017 Inleiding onderzoeksleer Helleke Hendriks docent werktuigbouwkunde voormalig productonderzoeker bij Consumentenbond xxxxxxxxxxxxx.
Meervoudige lineaire regressie
1212 /n Metingen aan de hoogte van een toren  D  wordt gemeten met onzekerheid S  =0.1 o. Vraag 1: Op welke afstand D moet je gaan staan om H zo nauwkeurig.
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
Het verbeteren van een modulaire verificatie techniek voor aspect georiënteerd programmeren Alfons Laarman.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Flow controle Keuzes maken. Het if-statement Soms moet code alleen in bepaalde situaties uit gevoerd worden Hiervoor heeft C de if-else constructie: if(voorwaarde1){
Hoofdstuk 8 Centrale tendentie en spreiding
Voorspellende analyse
Hoofdstuk 4 Omzetprognose
Wetenschappelijke methode
Verbinden van Onderwijs en Onderzoek Inleiding in de methode
Pilot-studie KRW conceptuele modellen
Temperatuur reconstructie door Mann et al.
Risico analyse Dr.ir. Christ van Gurp KOAC-NPC Asfalt en bitumendag 20 november 2008.
Introductie/Agenda 1 Cor Verbaas 1.Business Analist. 2.Werkzaam bij AEP sinds juni Verantwoordelijk voor de business applicaties binnen AEP. 4.MFGPro.
The relevance of recall and precision in user evaluation Louise T. Su Journal of the American Society of Information Science 1994.
Waterstand- en afvoervoorspelling voor de Nederlandse rivieren van incidentele hoogwatervoorspelling naar continue en klantgerichte afvoervoorspelling.
Natuurwetenschappelijk verslag
Improving health by sharing science 11/09/2014 ICT en datakwaliteit: een goede relatie? Ariaan Siezen - Nijmegen ICT coördinator Radboud Biobank/Parelsnoer.
Ondersteuning, een nadere verdieping. BRP in ZIP-formaat
Enquête NHV dag transferruismodelleren Wie ? Totaal aantal reacties 32 Adviesbureau 9 Drinkwaterbedrijf 4 Kennisinstituut 4 Waterschap 7 niet ingevuld.
Doel van het boek Een beeld geven van hoe de wetenschap en het publiek elkaar bekijken en met elkaar omgaan Een duidelijker beeld te geven van de sociale.
Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.
Van gulzig bestuur naar ‘crafting communities’
Questionable research practices Confronteert met hoe we wetenschap bedrijven 1. Verification bias & missing replications 2. Incomplete or incorrect information.
2 Onderzoeksluik 2: Grounded theory study ervaringen van bio-psycho-sociaal redeneren Presentatie: Ank Eijkelkamp.
Met oog op klimaat en de toekomst. ICOS kenmerken Geïntegreerd Observatiesysteem voor de Koolstofkringloop In preparatory phase; ERIC in 2012 Lange termijn.
3D modellen van de Nederlandse Ondergrond
Leervragen in een PLG PLG bijeenkomst 17 november 2014
28 mei Symposium Statistical Auditing Slide 1 Steekproefmethoden bij EU audits Paul van Batenburg.
Determinants of graduates’ preparatory job search behaviour: A competitive test of praoctive personality and expectancy-value theory Claes, R., & De Witte,
20 mei Symposium Statistical Auditing Slide 1 Wat zegt de COS over steekproeven en data-analyse? Paul van Batenburg.
De ecologische voetafdruk
Smart Traffic: pilot N201 Dataverrijking door combinatie met simulatie
Hoorcollege 2 Enkele statistische verdelingen ED: Het experiment atoom Labels De empirische distributie.
Diagnostische waarde van de anamnese om lumbosacrale wortelcompressie vast te stellen
Week 3: Systeemtheorie versus biologische psychologie
Valide tijdreeksmodellen Bestaan die ? Frans van Geer.
Latent class growth analysis als succesvolle methode om subgroepen te identificeren binnen een gewichtsreductie interventie. Bastiaan C. de Vos¹, MD,
Nut en noodzaak van het ruismodel  NHV Tijdreeksanalyse discussiemiddag  Koen van der Hauw  1 oktober 2015 Enkele praktische ervaringen.
Naam van de Auteur 7 januari 2008 B ETER ONDERWIJS MET DIGITAAL LEERMATERIAAL : DROOM OF WERKELIJKHEID ? Alfons ten Brummelhuis Arrangeursdag.
Zorg dat de Docent blijft: Maak van Onderzoek een spannende Onderneming! Joseph Kessels De Haagse Onderzoeksdagen De Haagse Hogeschool 13 april 2011.
Workshop RAOS conferentie Het evidence beest: welkom in het onderwijs?! Mathilde Plender MSc / Marloes Hoencamp MSc.
(Moleculair) Mechanistisch Redeneren Een centrale denkwijze in de bètavakken Dr. ir. Marc van Mil Post-doc onderwijsinnovaties Biomedische Wetenschappen.
Businesscase vanuit een ander perspectief Herman Uffen MSc. Koplopers Archief 2020.
COINS 2.0 SEMANTIEK Hans Schevers
25 augustus 2009 Ontwikkeling PROTIDE Klankbordgroepoverleg #4.
Koppeling van sociale, economische en ecologische systemen op het platteland: landschapsbeheer en –inrichting ter vergroting van de rurale veerkracht Marleen.
Auteur: Anneke de Jong, Marja Legius en Lieven De Maesschalck Datum: 30 maart 2016 Onderzoekend vermogen.
NTL-module ‘Proeven van Vroeger’ Daan Wegener
Rekenen.
Ondergrondparameters uit pompproeven
In dialoog! Over de kunst van een goed gesprek
Student: Christof Dolphens Mentor: Dr. Jomjai Peerapattana
Opfriscursus: Statistiek voor Waterbeheer
e-Exercise: blended interventie met gereduceerd face-to-face contact
ETIM Martin N. Kreijenbroek
Wat leren docenten en onderwijsondersteuners online van goede voorbeelden van ICT-gebruik en hoe waarderen ze dit online leren? Gerard Baars
ACT model van menselijk functioneren
Historisch redeneren + taalgericht vakonderwijs (bijeenkomst 3)
Toetsen van verschillen tussen twee of meer groepen
Voorspellende analyse
Voorspelling van criminele carrières door 2-dimensionale extrapolatie
Transcript van de presentatie:

Validatie van tijdreeksmodellen Kwaliteit van voorspellingen en gekwantificeerde onzekerheid 20 november 2014, Martin Knotters

Validatie  Chatfield (1995, 403 maal geciteerd): ● Validation: model checking ● Benadrukt bestaan van ‘model uncertainty’: onzekerheid wordt vaak onderschat ● Adviseert model te valideren op een volledig nieuwe reeks, ‘true replication’ ● Data splitting, hold-out samples: onvermijdelijk bij validatie van tijdreeksmodellen ● Bayesian model averaging? Chatfield, C. (1995) Model uncertainty, data mining and statistical inference. Journal of the Royal Statistical Society A; 158(3), pag

“Essentially, all models are wrong, but some are useful” George E.P. Box

Pragmatisme  filosofische stroming (ontstaan in VS, ca. 1870)  focus op het verbinden van de praktijk met de theorie, die volgens het pragmatisme niet los van elkaar staan  praktijk als toetssteen voor de geldigheid van een theorie  “een opvatting is waar als het in de praktijk werkt”

Tijdreeksmodellering: DataModel Chatfield, p. 428 Op zoek naar het ‘true model’? òf Een meer pragmatische aanpak: Op zoek naar een model dat bruikbaar is. Meerdere modellen kunnen bruikbaar zijn. En: is modelverbetering de kosten waard?

Goodness-of-fit Past het model bij de waarnemingen? Percentage verklaarde variantie RMSE etc. Kalibratieperiode!

Goodness-of-fit PVV = 84 %, RMSE = 15 cm cm-mv

Diagnostic checking  Box en Jenkins: identification – estimation - diagnostic checking Wordt aan de modelveronderstellingen voldaan? Toegepast op residuen van de kalibratie!

Diagnostic checks  Voldoet het model aan de veronderstellingen?

Fysische plausibiliteit Komt het model overeen met hoe ik denk dat de natuur in elkaar zit? Je kennis kan beperkend zijn: data leiden niet tot nieuwe inzichten als je toetst op fysische plausibiliteit!

Validatie The proof of the pudding is in the eating Is het model bruikbaar in de praktijk?

Validatieresultaten 31A0103_1 (data splitting) PVV=82%, RMSE=19cm ME=18,7 cm, RMSE=28,5cm P=19%

Validatie van ruimtelijk voorspelde tijdreeksen

Validatie van 95%-voorspellingsintervallen: Oeps!

Validatie van de standaardafwijking van de voorspelfout: oeps!

Data worth analysis d.m.v. validatie: bodemkartering voor schadeberekeningen. Is gedetailleerde kartering nuttig?  Absolute fout bodemkaart 1: is significant kleiner dan absolute fout bodemkaart 1: (=0.05)  Gemiddeld is de afname in absolute fout gelijk aan € 13,16 ha -1 jr -1  Contante waarde daarvan is € 258 ha -1  Bodemkartering 1 : kost € 30 ha -1  Conclusie: 30 < 258, dus bodemkartering 1 : is de investering waard geweest!

Einde Bedankt voor uw aandacht!

Validatie  Oreskes e.a. (1994): ● Verification: aantonen van de ‘waarheid’ van een model ● Validation: vaststellen van de ‘geldigheid’ van een model ● Confirmation: in hoeverre worden modeluitkomsten bevestigd door waarnemingen? ● Bescheidenheid geboden: steekproef, fouten in waarnemingen Oreskes, N., K. Shrader-Frechette en K. Belitz (1994) Verification, validation, and confirmation of numerical models in the earth sciences; Science; 263(5147), pag