Digital Data Conservation Joeri Both BMI dag 31 mei 2016 NKI
Wat gaan we niet doen? Geen blueprint voor best practice repository 1 doel – 1 repository Dit was een trial en error run
Wat gaan we dan wel doen? Onze eigen roadmap Proces vooraf, waarom besluit tot repository Welke keuzes hebben we gemaakt en waarom? Wat hadden we beter kunnen doen Pilot Cloud diensten Discussie!
Waarom?
Omvang van het probleem Top 1% IF journals; 10% van de links is 15 maanden na publicatie dood 75% van de links is dood 29% links is dood, 49% links verwijst niet naar origineel doel Foto: LawProfessor.typepad.com
Hoe is de situatie in NKI-AVL?
Waarom conserveren van data? “Scientists are human—they're as biased as any other group. But they do have one great advantage in that science is a self-correcting process.” ― Cyril PonnamperumaCyril Ponnamperuma
Let’s Build A Repository! Alle publicaties van NKI-AvL in combinatie met de ruwe data van deze publicaties (zo’n 600/jr, prospectief)
Wat is het doel van je repository en waar hou je dan rekening mee? VS
REPOSITORY TEXT IMAGE “BORN DIGITAL” Au/Vi DATASETS SOFTWARE
Take home!
Content Taal Welke data Status van data Versioning File Formats Grootte beperkingen Metadata Metadata schema’s Hergebruik Metadata Participanten Embargo Privacy Datakwaliteit Toegang tot data Hergebruik van data Bewaarperiode Tot hier en niet verder? Beleid
Dublin Core Standaardisering van metadatering Externe communicatie en uitwisseling tussen verschillende databases
Keuzes, keuzes, keuzes Infrastructuur Front-end Design Content Organization and Control Content Discovery Reporting Authentication Interoperability Social Features & Notifications
Digital CommonsDspaceEPrints Fedora Islandora Hosted Locally customer community Support community Flex. Structure DublinCore Cust. Metadata Open Source Proprierty Open Source System Upgrade Open Source Current Version 1.1 Admin Config Stand Users
Community Based Data Repository Hosted Solution Exchangable Adaptable
Data Repository
Hosted Solution
Adaptable en Exchangable Kunnen we onze eigen look&feel, en onze eigen functionaliteit inbedden. Add-ons; pdf viewer, lockss compliant, etc… Kunnen we na een periode ook makkelijk over op nieuwe versie… … of een heel nieuw systeem?
Community based
The Leftovers…
Kosten Ontwikkeling € 16000; Installatie, Pubmed lookup, aanschaf hardware € 6000; kosten voor back up, storage, beheer OS, beheer Dspace en change management Kosten Beheer/jr
Draagvlak Researchers zijn allang bezig met hun volgende experiment Focussen op de voordelen voor researchers Focussen op de voordelen voor instituut
Repository 2.0 Nu gesloten systeem, gaan we naar open repository en wanneer dan? Hoe gaan we toegang regelen? Wat willen we in toekomstige releases verder uitwerken? Blijven we hosten?