OVER DOMEINEN & IDENTIFIERS Henk Vanstappen PACKED vzw PYM workshop
1. REALITY IS MESSY reality is messy Carl Lagoze, 2001
Pieter Brueghel de Oude Pieter Brueghel I Pieter Bruegel, 1525-ca 1569 Bruegel, Pieter, 1525?-1569 Bruegel, Pieter de Oudere Bruegel, Pieter, l'ancien Bruegel, Pieter, d.ä. Brueghel, Pieter, o Velho Брейгель, Питер, ок. ל, פיטר, האב Brueghel, Pieter the Elder, Breughel, Pieter, the Elder
PARIS
KLEED
Mona Lisa Monna Lisa La Joconde La Gioconda Portrait de Mona Lisa, ( ); dite La Joconde Inv. nr. 799 Gian Giacomo Caprotti
Mona Lisa Monna Lisa La Joconde La Gioconda Portrait de Mona Lisa, ( ); dite La Joconde Inv. nr. 799 Gian Giacomo Caprotti LHOOQ
Interbellum november september 1939 November 11th, 1918 to September 1st, 1939 ca – ca. 1935
HET PROBLEEM Resources niet uniek te identificeren Resources niet vindbaar Resources niet uitwisselbaar Extra metadata noodzakelijk
OPLOSSING#1: LIJSTJES lijsten afspraken maar: veel werk maar: probleme uitwisselbaarheid blijft
OPLOSSING#2: AUTHORITIES
OPLOSSING#3: ON LINE AUTHORITIES
OPLOSSING#4: LINKED OPEN DATA Machineleesbaar Persistent Uniek: domein+identifier
EXTERNE BRON (AUTHORITY) binnen een bepaald domein unieke identificatie van resource eventueel verrijkt met bijkomende gegevens te bevragen via http-protocol syntax: namespace (domein) + identifier
DOMEINEN & IDENTIFIERS domeinidentifier JansensJan ISBN HTML EAD AAT Wordnetpainting
DOMEINEN & IDENTIFIERS namespaceidentifier viaf.org wikipedia.orgPieter_Bruegel_the_Elder dbpedia.orgPieter_Bruegel_the_Elder geonames.org
PERSISTENTE URLS base urlidentifier e/ Pieter_Bruegel_the_Elder/
KWALITEITSEISEN URI (SYNTAX) Persistent en uniek Enkel letters, cijfers, underscore, hyphen Logische, eenvoudige opbouw Human readable Systeemonafhankelijk (geen query strings)
KWALITEITSEISEN URI (SYNTAX) Wel: Niet: E6584AF8706A95DB BE.html N=CHERCHER&FIELD_1=REF&VALUE_1=000PE025604
KWALITEITSEISEN EXTERNE BRON Inhoud scope volledigheid correct toegevoegde data (rijkdom) koppeling met andere authorities
KWALITEITSEISEN EXTERNE BRON Beheer persistente bron open licentie uitbreidbaar Toegang machineleesbaar (xml, json) GUI (html) API (OpenSearch, SRU, …)
VOORBEELD: VIAF Links: Queries: Pieter”&httpAccept=application/rss%2bxml
AGENDA Intro (Henk) Wat & hoe (Alina) Welke bronnen zijn geschikt? Persistente URI creëren Oefening: normaliseer en verrijk 10 objecten {pauze} Demo’s: Data cleanen met Open Refine (Alina) Systemen aanpassen: Adlib en CA (Jeroen & Joris) Proof of the pudding: verrijkte collectiecatalogus (Bert)
AGENDA Intro (Henk) Wat & hoe (Alina) Welke bronnen Persistente URI Oefening: normaliseer en verrijk 10 objecten {pauze} Demo’s: Data cleanen met Open Refine (Alina) Systemen aanpassen: Adlib en CA (Jeroen & Joris) Proof of the pudding: verrijkte collectiecatalogus (Bert)
OEFENING 1.Download CSV file bit.do/pydbit.do/pyd 2.Beschrijf werken in CSV file 3.Selecteer relevante domeinen en voeg waar mogelijk PURLs toe voor namen, concepten, locaties en agents 4.creeer een PID voor de werken 5.creeer een PID voor de beschrijvingen (data)