Data Tools Models Data, modellen en tools: Voor het oplossen van elk complex waterbouwkundig vraagstuk gebruik je in meer of mindere mate: data, modellen.

Slides:



Advertisements
Verwante presentaties
KWALITEITSZORG november 2012
Advertisements

Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Symbaloo is de leukste en makkelijkste start op internet
Unleash your productivity with Startup TOOLS today •Configuratie voor de PTC product ontwikkeling omgeving, •Applicaties voor een gecentraliseerd, grafisch.
GO symposium: Klimaatmonitoring en Luchtkwaliteit – 12/11/2004 Data Infrastructuur voor Klimaat-, Ozon-monitoring & luchtkwaliteit Status and Toekomst.
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
SamenVeilig.net Het effectieve groepsbeveiligingssysteem van BySpy.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
Metadata proces april 2009 train de trainers. Waar in het werkproces metadata Binnen de organisatie zal afgesproken moeten worden van welke data er metadata.
Server Management Framework
GIS – Scada Integratie Kees Kremer GEO Event 18 maart 2014
Een introductie. Open source Betere kwaliteit Hoge innovatiesnelheid Betere prijs/kwaliteit verhouding Vrijheid in keuze van leverancier Gedreven door.
3 december 2009 MACHU GIS. Rijkswaterstaat MACHU GIS23 december 2009 Rijkswaterstaat Beheert o.a. –5250 km2 oppervlaktewater –1686 km kanalen en rivieren.
K. U. L E U V E N - L U D I T Agenda LinSam 16/12/ u u00 : Centrale LDAP-Authenticatie LinSam(Wim M. – Werner M.) 15u u15 : KickstartServer.
Easy Bis Bestuursdienst Informatie Systeem Van agendapunt tot besluit Met automatische internet publicatie.
Dé complete online werkplek met de kracht van Office 365
PROS2 Les 11 Programmeren en Software Engineering 2.
INITIATIE DEFINITIESELECTIECONCIPIËREN INBEDDING IN ORGANISATIE ONDERHOUD Opdrachtgever/ Projectleider Eigenaar Architect en zijn team Stakeholders INITIATIEDEFINITIESELECTIECONCIPIËRENINBEDDINGONDERHOUD.
Mr. Anton Ekker zomerborrel AdLantic 5 juni 2012.
Q-KENNIS Een kennis-systeem is veelal gebaseerd op het ontsluiten van aanwezige kennis en ter faciliterering van de ontwikkeling van nieuwe kennis. Het.
Nooit meer onnodig groen? Luuk Misdom, IT&T
 Een standalone server is een server die zelf geen domeincontroller is en geen lid is van een domein.  Indien een server is opgenomen in een werkgroep,
Primaire OnderzoeksData In Utrecht Makkelijk toegankelijk een podium voor uw waardevolle onderzoeksdata.
Elke 7 seconden een nieuw getal
The vision at work Batteries included Ervaringen van een ISV op hosting avontuur Sven Middelkoop Corporate ICT Manager Exact Holding N.V.
Databases I (H. 1) Wiebren de Jonge Vrije Universiteit, Amsterdam Voorlopige versie 2003.
GPS Global Positioning System Barend Gehrels en Henk Scholten.
Presentatie Flexcollege Experimenteren met flexibiliseren
Subversion Version control
Introductie/Agenda 1 Cor Verbaas 1.Business Analist. 2.Werkzaam bij AEP sinds juni Verantwoordelijk voor de business applicaties binnen AEP. 4.MFGPro.
CQI- ziekenhuisopname ontwikkeling en discriminerend vermogen
EFS Seminar Discriminatie van pensioen- en beleggingsfondsen
Hoe gaat dit spel te werk?! Klik op het antwoord dat juist is. Klik op de pijl om door te gaan!
Eerst even wat uitleg. Klik op het juiste antwoord als je het weet.
Your GateWay to the Finest Academic Research papers in the Netherlands Technische aspecten: de ARNO archive server Thomas Place KUB.
CLOUD COMPUTING Wat is het? Wie zijn de aanbieders? Is het veilig? Wat kun je er mee? Robert K Bol PVGE Best.
Datasets, verrijkte publicaties …en de rol van DANS 1Maarten Hoogerwerf, , NVB.
De kracht van OES2 op Linux!. Agenda Sterke punten van OES2 Beheer OES2, hoe ziet dit er uit? Producten in OES2 Nieuw in OES2 SP1 (nov/dec 2008) Migratie.
Alfalab en de microtoponiemen-pilot van het Meertens Instituut Rob Zeeman Webprogrammeur Meertens Instituut (KNAW)
MCSA traject Leerjaar 4 H /10 Agenda Samenvatting H1.
PADS4 maakt het eenvoudig om informatie te verspreiden naar een specifiek publiek op de juiste plaats en het juiste moment PADS4 is een professionele oplossing.
DIGITAL ANALYTICS TOOLS. 2 DIGITALE MEDIA - METEN.
Openbaar je talent Service public, talent particulier.
MEETING SYSTEMS BV VOOREFFECTIEFVERGADEREN.  Meeting Systems bv levert software als hulpmiddel om het vergaderen te ondersteunen met de volgende kenmerken:
How Architecture helps to reduce costs November 2011.
DICK RIJKEN 30/03/01 DE WAAG AMSTERDAM. OMROEPEN? WAT? WAAROM?
3D modellen van de Nederlandse Ondergrond
APP Platform Rivium, 5 maart 2013 Rik Vietsch.
Reclaiming academic output. De beschikbaarheid van de Nederlandse wetenschappelijke productie Conclusies.
Prototyping Week 7 // Tweenlite & API. TweenMax Snel mooie en effectieve animatie.
Datum Task Force Architectuur development in 2008.
Hoe optimaliseer ik de bereikbaarheid voor mijn organisatie.
Premium Cloud Backup Makkelijk.Veilig.Betrouwbaar.
Data en visualisatie GDN Enkele producten van de Geologische Dienst Nederland Rob van Ede / Roula Dambrink.
“IT’S THE DATA STUPID..!” WAGENINGEN UNIVERSITEIT EN RESEARCH CENTRE.
Functional Web Applications Implementation and Use of Client-Side Interpreters Jan Martin Jansen.
Digital Data Conservation Joeri Both BMI dag 31 mei 2016 NKI.
Introduction To Subversion MaiLing. Inhoud Probleem stelling Oplosing: TortoiseSVN Jargon Repository Working Dir.
J.J. Keijser Nikhef Amsterdam Grid Group Nikhef Jan Just Keijser 4 December 2013.
KNVI Congres Introductie BI.
In de cloud uitwisseling van informatie tussen SAK en werkgever.
Metadata Het organiseren van informatie Tjalling Gelsema.
Dataverse Network ‘Datalab’: software om onderzoeksdata tijdens het onderzoek op te slaan, te beheren en beschikbaar te stellen 1e stap in lange-termijnopslag.
Metadata Provincie Noord-Brabant
SQL Les February 2019.
SQL Les 9 12 May 2019.
Software Development fundamentals
StatLine Database van het Centraal Bureau voor de Statistiek
Transcript van de presentatie:

Data Tools Models Data, modellen en tools: Voor het oplossen van elk complex waterbouwkundig vraagstuk gebruik je in meer of mindere mate: data, modellen en tools.

Wat is het probleem? Kwaliteit, snelle beschikbaarheid en toegankelijkheid van data voor analyse is onvoldoende Modellen en door engineers ontwikkelde tools zijn niet goed gedocumenteerd en staan niet onder versie beheer Kan veel beter! Data: data niet onder versie beheer, altijd verschillende file formaten, metadata vaak niet beschikbaar bij de data. Modellen en tools: verschillende tools-versies op PC’s gebruikers, onduidelijkheid welke versie van tool is gebruikt bij bepaalde berekeningen.

Gedetailleerd Versimpeld Gebruiker OPeNDAP Server SubVersion Server Raw Data Tools OpenEarth (BwN) biedt een infrastructuur voor dit probleem. Basis elementen: SubVersion server & OPeNDAP server. Uitgangspunt: Vaste structuur – flexibele toegang. Models Toeleverancier

Wat is NetCDF? Een matrix gebaseerde datastructuur voor het opslaan van multidimensionele data N-dimensionale coordinatensystemen X coordinaat (e.g. longitude) Y coordinaat (e.g. latitude) Z coordinaat (e.g. altitude) Tijd dimensie … andere dimensies Variabelen – maximale flexibiliteit voor het definieren van alle datatypen Temperatuur, druk, zoutgehalte, korreldiameter, etc Geometrie – impliciet of expliciet Regelmatig grid (implicit – opslag efficientie) Onregelmatig grid (expliciet) Punten X Z T Y NetCDF: NASA's Earth Science Data Systems Standards Process Group raadt NetCDF aan als te hanteren dataopslagstandaard. Voordelen: grote data uitwisselbaarheid, platform onafhankelijk, robuust in gebruik en toch eenvoudig te begrijpen.

X Y Z X Y Z Q 32 getallen 14 getallen 0.5 2 0.3 0.6 0.1 0.4 0.2 0.9 1 2 1 2 0.5 0.4 0.6 0.9 0.3 0.2 0.1 32 getallen 14 getallen Efficiente data opslag: Binair NetCDF formaat maakt complete definitie van variabelen mogelijk met gebruik van minimaal aantal getallen (zie voorbeeld) en minimale herhaling metadata. Resultaat: minimale opslagruimte, zeer grote datasets snel te bevragen.

x = nc_varget(transect.nc, 'crossshore_distance'); y = nc_varget(transect.nc, 'time'); z = nc_varget(transect.nc, 'height'); surface(x, y, z); Voorbeeld: transect.nc netcdf transect.nc { dimensions: crossshore = 198 ; time = 3 ; variables: float crossshore_distance(crossshore), shape = [198] crossshore_distance:unit = "meter" float year(time), shape = [3] year:unit = "year" float height(time,crossshore), shape = [3 198] height:unit = "meter" data: coastward_distance = (-65:5:920); year = (2006:2008); height = [ 7.62 7.49 8.26 7.91 7.72 6.03 5.41 … -7.62 -7.705 -7.79 -7.845 -7.9 -7.99 -8.08 7.64 7.49 7.95 8.54 8.34 7.54 6.62 … -7.54 -7.635 -7.73 -7.8 -7.87 -7.945 -8.02 7.56 7.43 7.95 8.84 8.42 7.7 6.77 … -7.46 -7.535 -7.61 -7.695 -7.78 -7.865 -7.95]; } Voorbeeld NetCDF file: 198 kustdwarse punten, 3 tijdsopnames, 3 x 198 hoogtes. Metadata in één file samen met de data. NB: transect.nc is een binaire file. Eenvoudige Matlab routines beschikbaar: nc_varput, nc_addvar, nc_varget (zie inzet)

SubVersion: open source versiebeheer systeem SubVersion: open source versiebeheer systeem. Gebruikers ‘committen’ hun files in één centrale database (regelmatig updaten lokale kopie). Iedere commit krijgt een eigen uniek revisienummer. Per commit kun je in een comment aangeven wat er is gewijzigd.

Blame functionaliteit: van elke regel code is bekend door wie, wanneer en als onderdeel van welk revisie nummer deze is gewijzigd. Kleuren geven de ouderdom van de code aan (blauwer = ouwer). Elke wijziging kan achteraf altijd worden teruggedraaid.

Merge tool: Verschillen tussen verschillende versies van een tool zijn eenvoudig inzichtelijk te maken. Wanneer meerdere users aan de zelfde code werken helpt de merge tool eventuele conflicten op te lossen.

Version control: elke routine/datafile kan automatisch een comment block meekrijgen met daarin info over: datum en auteur laatste wijziging, revisie nummer etc. Sla bij een project het revisienummer van de gebruikte code op en je weet welke versie is gebruikt.

Statistieken: Per project of tool kun je een aparte ‘repository’ aanmaken. Herbruikbare tools combineren in één centrale repository heeft grote voordelen (delen, samenwerken, leren). OpenEarth tools, oa gebruikt in Building with Nature, is open source en freeware.

OpenEarthRawData OpenEarth OPeNDAP OpenEarthTools Extract Transform Load Provide Raw data Scripts Database Charts & Maps Store raw data in subversion to keep track of history Add meta information Script to convert raw data into netcdf Stored files (netcdf) accessible through the web Tools and websites OpenEarthRawData OpenEarth OPeNDAP OpenEarthTools Data workflow: OpenEarth heeft de volgende afspraken voor het beschikbaar maken van data: 1. ruwe data in SubVersion, 2. scriptgewijze verrijking met meta data naar NetCDF, 3. automatisch uploaden *.nc files naar OpenDap, en 4. flexibele toegang

Community of practice: De OpenEarth opzet heeft een brede kring gebruikers (Building with Nature, EU FP7 MICORE, Delft Cluster etc.). Vanuit Building with Nature worden trainingen verzorgd (SubVersion gebruik, programmeerstandaarden, etc.).