Metadata Het organiseren van informatie Tjalling Gelsema.

Slides:



Advertisements
Verwante presentaties
Dimitri Brosens & Bart Goossens Informatie & Datacentrum INBO OMGAAN MET ONDERZOEKSDATA: INBO.
Advertisements

De relatie tussen visie doelstellingen toetsing leertrajecten Een “innige band” !
Interactieve Bodemkwaliteitskaart en
Samenwerking met MOSS 2007! Chris Hoppenbrouwers.
De kracht van SBA Business Solutions Vanuit een oplossingsgerichte gedachte, waarbij de klant altijd centraal staat, koppelen wij innovatieve producten.
Fedora Content Model en XSLT Fedora op Klompen, Amsterdam, Egbert Gramsbergen TU Delft Library / Digital Product Development
Metadata proces april 2009 train de trainers. Waar in het werkproces metadata Binnen de organisatie zal afgesproken moeten worden van welke data er metadata.
Gegevensbeheer Karin Diederiks KOAC•NPC.
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Easy Bis Bestuursdienst Informatie Systeem Van agendapunt tot besluit Met automatische internet publicatie.
Zaaktypecatalogus Kwaliteit en Vraaggericht.
Informatica 1, Blok 1, Hoofdstuk 2
Primaire OnderzoeksData In Utrecht Makkelijk toegankelijk een podium voor uw waardevolle onderzoeksdata.
Eric Sieverts Sector Innovatie & Ontwikkeling Universiteitsbibliotheek Utrecht Instituut voor Media- & Informatie Management Hogeschool van Amsterdam Moderne.
1 Het probleem RO Milieu Landbouw SocZekerheid Etc. LerenWerkenWonenPensioenEtc. Overheids- organisatie Burger ??? Regelgeving per domein Vraag op levensmoment.
Programma Open Standaarden en Open Source Software voor de Overheid dinsdag 6 april 2004 Open Source Software en Open Standaarden Standaards in samenwerking,
Databases I (H. 1) Wiebren de Jonge Vrije Universiteit, Amsterdam Voorlopige versie 2003.
Kwaliteit en kwaliteitszorg
1.3 Kwaliteitsborging.
Hoofdstuk 7 Procesmanagement.
Eenvoudige data-analyse: beschrijvende statistische
Marktonderzoek als proces
Hoofdstuk 2 Het onderzoeksonderwerp formuleren en verduidelijken Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian.
Presentatie Studiemiddag Indexen en Nadere Toegangen Ralph Stuyver, Projectmanager 4 maart 2010.
22 november 2011 Kwaliteit door meten Josje Everse En hoe de zelfevaluatie daarbij kan helpen…
Microdatagebruikersmiddag
Model VS UAVgc op basis van SE
METADATA DUBLINCORE Beheren van informatie.. Vraag VVKBuO Zoeken naar mededelingen Mededelingen on-line aanbieden Centraal beheren Publiceren.
SURF SiX expertisegroep IMS Specificaties update Pierre Gorissen 11 maart 2004.
Datasets, verrijkte publicaties …en de rol van DANS 1Maarten Hoogerwerf, , NVB.
Waarom een standaard Een norm of standaard is een procedure of een maat waarvan een groep mensen met elkaar heeft afgesproken dat ze hem zullen gebruiken.
Introductie metadata april 2009 train de trainers.
Data Maarten Terpstra en Peter le Clerq. 1.Wij denken dat bedrijven in toenemende mate data gebruiken voor toepassingen in marketing, sales, service,
Producten & Werkprocessen
Visie informatievoorziening
NGI Datamanagement Datamanagement in een procesgerichte organisatie
Recordkeeping - in 7 stappen naar een digitaal archief
Module I Informatica Dhr. C. Walters. Het belang van informatie Gegevens  Informatie  Besluitvorming Gegevens = Data, Raw Material Informatie = Gegevens.
Dordrecht Open Data Nu écht aan de slag! Dordrecht, maart 2015
Reclaiming academic output. De beschikbaarheid van de Nederlandse wetenschappelijke productie Conclusies.
1 IT Service Management Theorie (1). 2 Van ‘Beheren van dozen’ naar ‘Beheer van bedrijfsprocessen’ Bron: white paper van BMC Software. Leverancier van.
Business Intelligence
Beheer van Onderzoeksdata (RDM) Hannelore Vanhaverbeke – DOC Jan Ooghe, Kristel Hoydonckx – ICTS TOB project o.l.v. Hilde Van Kiel - UB.
Start Inhoud introductie BiSL Informatiesysteem, gegeven Informatiebeleid Positionering: Beheer informatiesystemen BiSL als informatiearchitectuur.
1 Waarom COINS en waarom “Redesign the Standard”? Dik Spekkink Clustermanager Proces & IT Wat is.
DE UT EN JOIN LISA Business Information Management & Recordmanagement Petra de JongeDecos- 1.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 De GBIF Integrated Publishing Toolkit Alberto GONZÁLEZ-TALAVÁN Programme Officer for.
Archiveren van ruimtelijke plannen | 20 november 2012 Archiveren van ruimtelijke plannen Jorien Weterings Adviseur recordkeeping.
20 januari 2016 – Herman Bongenaar
SOA en Business Process Management Hoofdstuk 5 uit Web Services van Manes, blz. 122 t/m blz. 129.
1 Vlaams Proceshuis Toelichting en demo Wegwijs Proces Anneleen Vanden Boer Thomas D’haenens.
De familie Atlassen 21 juni 2016 Channah Betgen (contentbeheer)
Maatwerk is goedkoper dan standaard GEMEENTE ROTTERDAM Bestuurs- en Concernondersteuning.
Openbaar Lichaam Bonaire
Lean Six Sigma - Verbetermanagement
Dataverse Network ‘Datalab’: software om onderzoeksdata tijdens het onderzoek op te slaan, te beheren en beschikbaar te stellen 1e stap in lange-termijnopslag.
WoordenlijstBeheer Terminologie centraal in de archiefsector
Open Data PMA 3 december 2015 Om het onderwerp open data wat levendiger te maken willen we een korte presentatie geven, met daarin: een concreet voorbeeld.
I-lab Waarom dit project, wat is het, wat is de stand van zaken en wat levert het op voor de onderzoeker?
Conclusies evaluatie Regieraden
Aanleiding en overzicht
Eenvoudige data-analyse: beschrijvende statistische
Human Resources Accounting
DCAT-AP Vlaanderen 12 december 2018
DCAT-AP Vlaanderen 26 oktober 2018
Organisatie van de datafabriek
StatLine Database van het Centraal Bureau voor de Statistiek
Open Data gemeente Nijmegen
DCAT-AP Vlaanderen voorlegging als standaard
DCAT-AP Vlaanderen voorstelling standaard 11 juni 2019
Transcript van de presentatie:

Metadata Het organiseren van informatie Tjalling Gelsema

Inhoud Waarom metadata? Soorten Standaarden Data Service Center Datameer

Metadata: analogie

Waarom metadata? Informatie, bedoeld om: Het zoeken en vinden van statistische data te ondersteunen; Mogelijkheden te bieden om potentiele gebruikers van data te informeren over de betekenis ervan; Automatische processen de mogelijkheid te bieden om data te kunnen verwerken; Rol van metadata wordt kritischer naarmate: meer (diverse) data, meer gebruikers, meer automatische processen.

Soorten metadata Grofweg in te delen in: Structurele metadata: informatie die de inhoud en structuur van een dataset beschrijft. Variabelen, datatypes, classificaties, etc.; Kwaliteitsmetadata: informatie over kwaliteitsaspecten, zoals: relevantie, nauwkeurigheid, tijdigheid, samenhang, etc,; Procesmetadata: informatie over de totstandkoming van een dataset, verwijzend naar stappen in het statistisch proces.

Structurele metadata dimensie classificatie variabele

Kwaliteitsmetadata: ESQRS ESS Standard for Quality Reports Structure

Procesmetadata: GSBPM Generic Statistical Business Process Model

Standaarden Statistical Data and Metadata eXchange (SDMX). Uitwisselen van statistieken. Ook: specificatie; Data Documentation Initiative (DDI). Beschrijven en documenteren van (statistisch) onderzoek; Generic Statistical Information Model (GSIM): klassendiagram voor structurele metadata. `doorsnede van DDI en SDMX’; Data Catalog Vocabulary (DCAT): W3C-standaard voor minimale vereisten voor een open data catalogus van datasets. Gericht op het vinden van datasets en catalogi.

Standaarden: DCAT Op RDF gebaseerde verzameling van termen (vocabulary) om een datacatalogus te beschrijven; Bevordert de ‘interoperabiliteit’ tussen datacatalogi; Standaardattributen (Dublin Core) voor: Catalog, Dataset en Distribution; Dublin Core: title, description, publisher, language; Distribution: beschrijft het formaat (csv, html, API) waarin een dataset is gepubliceerd; Catalog: mogelijkheden om catalogi te classificeren aan de hand van thema’s; Uitbreidingen: StatDCAT, GeoDCAT.

Standaarden: DCAT

Data Service Center “Waar had ik mijn data ook alweer gelaten?” “Kan ik mijn data over 10 of 20 jaar terugvinden?” “Kan ik de data over 10 of 20 jaar nog gebruiken?” “Kan ik de toegang tot de data beheren en controleren?”

Data Service Center: idee Delen en hergebruiken van statistische (bron-) data binnen het bureau; Voorheen: uitwisseling gebeurde `bilateraal’ en weinig georganiseerd; Met het DSC: datasets worden centraal geregistreerd en onder voorwaarden toegankelijk gemaakt. Afnemers kunnen zich abonneren; Informatie over datasets in toegankelijk via een catalogus, die voor iedereen in te kijken is; Gedachte: van elkaar weten welke data we in huis hebben; Ook: afstemmen van begrippen, hergebruik van begrippen.

Data Service Center: metadata Grote catalogus van databestanden stelt eisen: uniforme werkwijze van beschrijven, voldoende informatie om datasets te vinden; Dit vertaalt zich naar: model voor metadata, richtlijnen, kwaliteitseisen aan bepaalde metadata-elementen;

Richtlijnen DSC De DSC-organisatie toetst de kwaliteit van metadata aan de hand van richtlijnen, in het bijzonder van naamgeving; Voorbeeld: “De naam van een variabele bevat de grootheid die wordt gemeten”; Beschouw: Kosten van onderhoud en reparatie vs. Onderhoud en reparatie; Voorbeeld: “De aggregaatfunctie is opgenomen in de naam van een variabele (waar van toepassing)”; Beschouw: Gemiddeld besteedbaar inkomen vs. Besteedbaar inkomen.

DSC 2013-2014 De schatkamer ontsloten DSC gevuld met enorm veel metadata en datasets Zie de DSC Metadata Catalogus Centrale opslag van bronbestanden en goed versiebeheer is hiermee bereikt, én uitwisseling via DSC.

Proces hoofdlijnen

Samenvattend: Voor het publiceren van metadata bij open data, is nodig: Een model, of structuur, waarin metadata uniform wordt beschreven (bijvoorbeeld: DCAT); Kwaliteitseisen voor metadata; Procedures voor het toetsen van de kwaliteit van metadata.

Datameer Behoefte aan snelle nieuwe inzichten om zo in te spelen op de actualiteit; DSC voorziet ten dele in die behoefte; Maar: nog weinig voorzieningen om mogelijkheden te ontdekken voor het combineren van datasets; In DSC: datasets zijn discrete, geïsoleerde, entiteiten. Informatie over relaties tussen datasets is beperkt; Ook beperkt: mogelijkheden om eigen dataset samen te stellen; Datameer: vraag en aanbod van statistische informatie dichter bij elkaar brengen; DSC staat t.o.v. Datameer als open data t.o.v. linked open data.

Afnemers / Onderzoekers Slimme / flexibele processen Datameer centraal Afnemers / Onderzoekers Zelfstandig gebruiken Afnemers Publiceren Hergebruiken / Combineren Berichtgevers Respondenten Streaming data Registraties Exploreren Slimme / flexibele processen Datameer Microdata Stat. data Artikelen/Visualisaties Afnemers Ophalen

Datameer: metadata

Samenvatting Goed beheer van informatie binnen de eigen organisatie maakt dat open data kan worden beschouwd als een outputkanaal naast alle andere en verbonden met alle andere. Het inrichten van zo’n portaal wordt daarmee eenvoudiger. Metadata is daarvoor van wezenlijk belang.

Vragen?