BESCHRIJVINGSPRAKTIJK DOCUMENTEREN MET DATAPROFIELEN Katrien Weyns & Bert Lemmens 28 oktober 2016 | Liberaal Archief, Gent Deze presentatie is een toelichting van het afgeronde project ‘Persistente identificatie’ 2013 – 2014 en het vervolgtraject voor 2015
Dagprogramma 9.30u dataprofiel? 10.30u pauze 10.45u groepsoefening > fotocollectie 12.30u pauze 13u individuele oefening > affiche 14.45u pauze 15u bespreking profielen 15.45u samenvatting
Dataprofielen Wat? Waarom? Hoe?
Dataprofiel terf x
Wat is een dataprofiel? verzameling beschrijvingselementen gegroepeerd volgens een bepaalde structuur vastlegt hoe mensen data moeten maken vastlegt hoe machines data moeten lezen
hertzberger x Van word naar adlib
hertzberger x NAi: Van word naar adlib
karrenmuseum x Karrenmuseum: inventaris en thesaurus historische karren > Excel begrijpen en migreren naar ???
karrenmuseum x Karrenmuseum: inventaris en thesaurus historische karren > Excel begrijpen en migreren naar ???
karrenmuseum x Karrenmuseum: inventaris en thesaurus historische karren > Excel begrijpen en migreren naar ???
zilvermuseum Zilvermuseum-DIVA: mapping van Qi naar LIDO
zilvermuseum Zilvermuseum-DIVA: mapping van Qi naar LIDO
karrenmuseum x Karrenmuseum: inventaris en thesaurus historische karren
Waarom heb je dataprofielen nodig? digitaal-digitaal migratie kennisoverdracht data uitwisseling kwaliteitscontrole
Structuur dataprofiel? datastructuur > welke velden? beschrijvingsregels > hoe invullen? omzetting naar een uitwisselingsformaat > hoe machine- leesbaar maken? >> Sjabloon:Dataprofiel Welke velden en hoe die georganiseerd zijn > datastructuur Hoe je die velden invult > beschrijvingsregels Hoe die informatie in die velden machineleesbaar wordt gemaakt > omzetting in een uitwisselingsformaat
Datastructuur A: Groep > verzameling elementen die een aspect documenteren B: Element > eenduidig stuk informatie, begrijpbaar voor mens Titel : Le rossignol = The nightingale = Die Nachtigall : conte lyrique en trois actes C: Veld > eenduidig stuk informatie, begrijpbaar voor machines Hiërarchie > verbanden tussen verschillende elementen en velden. D: Bron > waaraan zijn element en veld ontleend 245$a Main entry - Uniform title Le rossignol 242$a Translation of title by cataloging agency The nightingale 246 1$a Varying form of title Die Nachtigall 245$b Remainder of the title Conte lyrique en trois actes
Beschrijvingsregels E: soort data > tekst, lijst, getal, datum, ja/nee, id, URI F: verplicht > Moet of mag het ingevuld worden? G: herhaalbaar > Mag het één of meer keer ingevuld worden? H: invulregels (syntaxis) > Hoe vul ik het in? I: selectielijsten (terminologie) > Welke waarden mag ik gebruiken? J: voorbeeld > minstens één voorbeeldwaarde
Uitwisselingsformaat (UTF-8) (codering/markeertaal: csv, xml, json, html) (formaat > welk standaard schema gebruik je?) naam bron- en doelveld > uit welk veld komt de data en naar welk veld moet ze omgezet worden? conversieregels > Hoe moet de data eventueel aangepast worden?
Sjabloon Bepaal de datastructuur Bepaal de beschrijvingsregels Kies datastructuur standaard(en) Kies elementen (B) Kies velden (C) Bepaal groepen (A) Bepaal de beschrijvingsregels Kies beschrijvingsstandaard(en) Bepaal soort, verplichting en herhaalbaarheid van elke veld (E,F,G) Bepaal de invulregels (H) Bepaal voor alle lijsten de terminologie (I) Maak voorbeelden (J) Bepaal de mapping naar het uitwisselingsformaat Identificeer bron- en doelvelden (K,L) Bepaal indien nodig conversieregels (M)
Ex.#1: fotocollectie Katrien
Groepsoefening: beschrijving fotocollectie Voorstelling case uit Zilvermuseum/DIVA: verzameling beschrijven Doelstelling: opmaak van een dataprofiel voor de informatie zoals die nu in Archiefbank zit Standaard elementen Datastructuur Beschrijvingsregels – machineleesbaarheid Uitwisselingsformaat Één profiel of meerdere profielen? Stuksniveau vs. verzamelniveau Specifieke noden voor stukken bv. beschrijving film
Aandachtspunten - elementen Standaard of norm als basis Algemeen digitaal: Dublin Core Archieven: ISAD(G) Personen en organisaties: ISAAR-CPF Gebouwen: Docomomo Publicaties: MARC21, ISBD Kunst, architectuur, materieel erfgoed: Spectrum, CCO Aanvullen met eigen noden (beperk!) Onderscheid invoeromgeving vs. catalogus Opsplitsen van elementen in velden Niet alle elementen zichtbaar Beheersinformatie beschrijvingen
Aandachtspunten - machineleesbaarheid Datatype: getal of tekst bv. datering, trefwoorden Terminologie: Thesauri bv. AAT Persoonsnamen: RKDartist; ODIS Talen bv. Iso639-2b, zoals waarde dut* / nld Datering bv. Iso8601, zoals waarde jjjj-mm-dd Landen bv. Iso3166-1, zoals waarde BE Persistente URI, idealiter : http://[domein]/[type object]/[type document]/[identificatienummer] Gebruik unieke recordid’s Tekstcodering: UTF-8 enkel gebruiken bv. diakritische tekens
Voorbeelden - uitwisselingsformaten Dublin Core EAD EAC EAG MARC XML LIDO
Oefening in groep Doelstelling: opmaak van een dataprofiel voor de informatie zoals die nu in Archiefbank zit Aan de hand van: Uitvoerformaat in Archiefbank Invoeromgeving “Gericht zoeken” op “albrecht jacobs” Evaluatie van het profiel
Ex.#2: juwelenkistje
DIVA inv. nr. 7032, Juwelenkoffer De Opschik of De Pauw, Philippe Wolfers, 1899-1905
DIVA - Qi Qi - DIVA: https://zilverstaging.qi-cms.com user: pieter@packed.be pw: kD9N(PpR$aq>kZ#7Gy`H Inv.nr. 7032 Juwelenkoffer De Opschik of De Pauw (https://zilverstaging.qi- cms.com/content/edit/version_id/1/node_id/1/type_id/1/cluster_id/1/id/14650)
Opdracht: Je bent de nieuw collectieregistrator van DIVA. Je hebt nog nooit met Qi gewerkt. Zoek aan de hand van de Juwelenkoffer De Opschik of De Pauw uit wat DIVA allemaal registreert. Documenteer de groepen, elementen en velden in een dataprofiel. Identificeer de beschrijvingsregels. Documenteer de mapping naar DC. Alle velden van het tabblad identity + soort data verplicht en herhaalbaar Dan de beschrijvingsregels en terminologie Dan de mapping naar DC Dan tabblad beschrijving Dan tabblad Media
Samenvatting Katrien
Aan de slag op basis van collectieprofiel Hoe ga je dat aanpakken? Nieuw systeem Wijziging configuratie datatype Datacleaning met jobstudent Wie gaat dat doen? Onderdeel van collectiebeleid of informatiebeleid In overleg met ICT