Digitaal Archief Vlaanderen www.pwc.com Digitaal Archief Vlaanderen Juni 2013 Klankbordgroep Informatiemodel
Agenda Voorstelling van het project Het Informatiemodel Principes Terminologie Informatiemodel Volgende stappen Digitaal Archief Vlaanderen Juni 2013
Voorstelling van het project 1 Digitaal Archief Vlaanderen Juni 2013
1. Voorstelling van het project Doel van het project is haalbaarheid evalueren voor het opzetten van een archiveringsdienst Scope = archief documenten in een bestuurlijke context, die vanuit een wettelijk kader worden bijgehouden bij openbare besturen Opdracht 1 Behoefteanalyse Functionele analyse Opdracht 2 Business case Digitaal Archief Vlaanderen Juni 2013
1. Voorstelling van het project Een functionele analyse en behoefteanalyse leiden tot een stappenplan en prioriteiten voor implementatie Mobilisatie Generieke blauwdruk Behoefteanalyse Stappenplan Hoe verloopt de workflow van archivering en welke zijn de generieke elementen? Welke noden inzake interne en externe ontsluiting zijn er? Welke archiefbestanden zouden in beheer kunnen worden gegeven bij het VIAA +? 1 2 4 Welke behoeften en functionaliteiten zijn nuttig / ontbreken in de generieke blauwdruk? 3 Bestaande diensten en voorzieningen bij de partners Digitaal Archief Vlaanderen Juni 2013
Evaluatie diensten-aanbod 1. Voorstelling van het project In een tweede fase bekijken we organisatorische en financiële aspecten van de archiveringsdienst Mobilisatie Evaluatie diensten-aanbod Operationeel model Financieel model Op welke wijze kunnen de niet bestaande diensten ontwikkeld worden samen met het VIAA +? Gemeenschappelijk dienstenmodel juridisch, organisatorisch en beheersmatig ingericht Financieel model en mogelijkheden inzake tarifering van gebruikers 1 4 5 Welke organisatorische impact heeft dit op de partners? 2 Welke effecten (kosten en baten) heeft dit op de partners 3 Digitaal Archief Vlaanderen Juni 2013
1. Voorstelling van het project Doelstelling van deze KBG is het afstemmen van het informatiemodel als basis voor de generieke blauwdruk Mobilisatie Generieke blauwdruk Behoefteanalyse Stappenplan Informatiemodel Verantwoordelijkheden en belang van de klankbordgroep Stem van de sector weergeven Beantwoordt dit informatiemodel aan de functionele vraag van de klant? Digitaal Archief Vlaanderen Juni 2013
Het Informatiemodel 2 Digitaal Archief Vlaanderen Juni 2013
Archivering betekent een reis door de tijd… 2. Het Informatiemodel Archivering betekent een reis door de tijd… Digitaal Archief Vlaanderen Juni 2013
Het Informatiemodel is gebaseerd op een aantal sleutel principes Verzeker duurzaamheid, leesbaarheid Technische ondersteuning is standaard max. 3 generaties (8 jaar) Verzeker authenticiteit van de informatie (het is wat het beweert te zijn) Verzeker integriteit van de informatie Iedere opslagmedia bevat fouten: ‘bit rot’ ‘silent data corruption’ Er is nood aan een systeem om de fouten op te zoeken en te corrigeren: CRC, checksums (hashvalue) Fixity information Verzeker voldoende capaciteit Bijhouden van kopieën Digitaal Archief Vlaanderen Juni 2013
Het model gaat uit van een standaard terminologie 2. Het Informatiemodel Het model gaat uit van een standaard terminologie Intact & leesbaar: Digitaal object Weergeefbaar: Digitaal Document Begrijpelijk & betrouwbaar: digitaal archief document Archival Information Package Identifier Record Origineel Migraties Metadata Checksum Digitaal Archief Vlaanderen Juni 2013
Het model gaat uit van een standaard terminologie (2) 2. Het Informatiemodel Het model gaat uit van een standaard terminologie (2) Digitaal object = Een verzameling van bits & bytes De manier van opslaan ≠ weergave => digitaal document Kenmerken Volatiel Dynamisch Herbruikbaar Aanpasbaar ↔ Digitaal archief document : vast+ statisch Relatie tussen archiefdocument – digitaal object 1-1: 1 brief = 1 PDF bestand 1-∞: 1 web pagina = 1 HTML bestand, 5 images, 1 CSS,… ∞-1: 4 rekeningen = 1 Excel bestand Digitaal Archief Vlaanderen Juni 2013
Het model gaat uit van een standaard terminologie (3) 2. Het Informatiemodel Het model gaat uit van een standaard terminologie (3) Digitaal object Digitaal document Digitaal Archief document Digitaal Archief Vlaanderen Juni 2013
Behoud van het digitaal document 2. Het Informatiemodel Behoud van het digitaal document Het digitaal document is mogelijk een representatie van het originele (weergave) Behoud strategie Hard Copy Technologisch museum Conversie Migratie Emulatie Digitaal Archief Vlaanderen Juni 2013
Het Informatiemodel is gebaseerd op het OAIS referentiemodel OAIS = Open Archival Information System SIP AIP DIP OAIS => ontwikkeld door Consultative Committee for Space Data Systems Checklist van wat er moet gedaan worden, niet hoe het moet gedaan worden ISO14721:2003 Digitaal Archief Vlaanderen Juni 2013
Het Informatiemodel is gebaseerd op het OAIS referentiemodel (2) The Content Information is that information which is the original target of preservation. It consists of the Content Data Object (Physical Object or Digital Object, i.e., bits) and its associated Representation Information needed to make the Content Data Object understandable to the Designated Community. For example, the CDO may be an image that is provided as the bit content of one CD-ROM file together with other files, on the same CDROM, that contain Representation Information. Only after the Content Information has been clearly defined can an assessment of the Preservation Description Information be made. The Preservation Description Information applies to the Content Information and is needed to preserve the Content Information, to ensure it is clearly identified, and to understand the environment in which the Content Information was created. The Preservation Description Information is divided into four types of preserving information called Provenance, Context, Reference, and Fixity. Briefly, they are the following: – Provenance describes the source of the Content Information, who has had custody of it since its origination, and its history (including processing history). – Context describes how the Content Information relates to other information outside the Information Package. For example, it would describe why the Content Information was produced, and it may include a description of how it relates to another Content Information object that is available. – Reference provides one or more identifiers, or systems of identifiers, by which the Content Information may be uniquely identified. Examples include an ISBN number for a book, or a set of attributes that distinguish one instance of Content Information from another. – Fixity provides a wrapper, or protective shield, that protects the Content Information from undocumented alteration. For example, it may involve a check sum over the Content Information of a digital Information Package. -Access Rights Information : The information that identifies the access restrictions pertaining to the Content Information, including the legal framework, licensing terms, and access control. It contains the access and distribution conditions stated within the Submission Agreement, related to both preservation (by the OAIS) and final usage (by the Consumer). It also includes the specifications for the application of rights enforcement measures The Packaging Information is that information which, either actually or logically, binds, identifies and relates the Content Information and PDI. For example, if the Content Information and PDI are identified as being the content of specific files on a CD-ROM, then the Packaging Information would include the ISO 9660 volume/file structure on the CDROM, as well as the names and directory information of the files on CD-ROM disk. The Descriptive Information is that information which is used to discover which package has the Content Information of interest. Depending on the setting, this may be no more than a descriptive title of the Information Package that appears in some message, or it may be a full set of attributes that are searchable in a catalog service. Digitaal Archief Vlaanderen Juni 2013
Belang van metadata Functie Identificatie Beschrijving van de context 2. Het Informatiemodel Belang van metadata Functie Identificatie Beschrijving van de context Aanmaak Beheer Retrieval Betrouwbaarheid Vereisten Expliciet en statisch Goed gestructureerd Gerelateerd met archiveringsdocument Mogelijkheden tot export Herbruikbaar Digitaal duurzaam Opslag Ingesloten Apart bestand Database Vb: eDAVID methode = ingekapseld in 1 AIP of XML container volgens een schema Digitaal Archief Vlaanderen Juni 2013
Diensten model Preservation Planning Producer interfaces Ingest 2. Het Informatiemodel Preservation Planning Diensten model Administration Producer interfaces Web Portal Application Requests Temporary storage Workflow Ingest Storage Catalog Archive Access Search Dissemination Audit Consumer interfaces Web Portal Application Digitaal Archief Vlaanderen Juni 2013
Informatiemodel - Hoofdproces 2. Het Informatiemodel Informatiemodel - Hoofdproces Producers Interface (portaal) aangepast aan bestaande systemen door ingang keuze Bepalen van het niveau van validatie en kwaliteitscontrole Digitaal Archief Vlaanderen Juni 2013
Informatiemodel – Voorbereiden van de archiveringsaanvraag 2. Het Informatiemodel Informatiemodel – Voorbereiden van de archiveringsaanvraag Producers P a r t n e s Selectie document Invullen meta gegevens Content data object Representation Information : · Referentie Datum van aanmaak Auteur Taxonomie Type Indicatie bewaartermijn Producers SIP definition is known Submission agreement Uitgaan van een bestaand document Gegevens worden achteraf opgeladen naar een portaal Digitaal Archief Vlaanderen Juni 2013
Informatiemodel – Validatie archiveringsaanvraag 2. Het Informatiemodel Informatiemodel – Validatie archiveringsaanvraag Wie draagt de eindverantwoordelijkheid voor de inhoud van het document? Kwaliteitscontrole! Validatie document en metadata gegevens Moet een kwaliteitscontrole nog gebeuren of werd deze reeds uitgevoerd? Bij niet valideren: is een correctie mogelijk of moet een nieuwe aanvraag gemaakt worden? Digitaal Archief Vlaanderen Juni 2013
Informatiemodel - Hoofdproces 2. Het Informatiemodel Informatiemodel - Hoofdproces Producers Submission agreement Overeenkomen wie wat doet en wanneer om tot een AIP te komen Digitaal Archief Vlaanderen Juni 2013
Informatiemodel – Submission Information Package 2. Het Informatiemodel Informatiemodel – Submission Information Package Informatie voor behoud van de gegevens: Oorsprong Context (in relatie met externe informatie) Referentie(s) Beveiliging zoals checksum voor kwaliteitscontrole Rechten: auteursrechten, toegangsrechten Overeenkomen welke informatie in de SIP opgeslagen wordt Digitaal Archief Vlaanderen Juni 2013
Informatiemodel – Archival Information Package 2. Het Informatiemodel Informatiemodel – Archival Information Package Meerdere SIP’s voor één AIP mogelijk Meerdere AIP’s voor één SIP mogelijk Toevoegen van hetzelfde document in een ander overeen te komen formaat (PDF/A, TIFF, JPEG2000) Toevoegen van systeem informatie, beveiliging, persoonsinformatie Digitaal Archief Vlaanderen Juni 2013
Informatiemodel – Ultieme doelstelling Trusted digital depository 2. Het Informatiemodel Informatiemodel – Ultieme doelstelling Trusted digital depository Attributen van een betrouwbaar digitaal depot Navolging OAIS model Administratieve verantwoordelijkheid Organisatorische levensvatbaarheid Financiële duurzaamheid Technologische en procedurele geschiktheid Systeembeveiliging Procedurele verantwoordingsplicht RLG/OCLC stelt een aantal attributen voor die een betrouwbaar digitaal depot opmaken: • De regels naleven zoals ze beschreven zijn in The reference model for an Open Archival Information System (OAIS): Het OAIS zorgt voor een functioneel en een informatie model. Door deze normen na te leven, kan een waardering gemaakt worden doordat met een vaste set van concepten en terminologie wordt gewerkt. Hier kom ik dadelijk nog uitgebreider op terug. • Administratieve verantwoordelijkheid: de organisatie expliciteert haar toewijding voor de ontwikkeling van een betrouwbaar e-depot, in overeenstemming met de gangbare standaarden, procedures en gebruiken. Het opstellen van een rampenplan mag hierbij niet vergeten worden. Een betrouwbaar depot zal steeds in alle transparantie werken. • Organisatorische levensvatbaarheid (organizational viability): de organisatie kan aantonen dat haar missie, wettelijk statuut en werkingsmiddelen voldoende zijn om een betrouwbaar e-depot blijvend te onderhouden. • Financiële duurzaamheid: de organisatie kan aantonen dat ze in een sterke financiële basis kan voorzien. • Technologische en procedurele geschiktheid: op een open, weldoordachte manier zullen preserveringsstrategieën worden opgesteld en geïmplementeerd, in samenspraak met het management, de ICT-afdeling en de archiefdienst. • Systeembeveiliging: alle gebruikte systemen zullen zo ontworpen worden dat de veiligheid van de digitale bescheiden verzekerd kan worden. Hierbij worden bepaalde procedures en beleidsmaatregelen vastgelegd die het gebruik regelen. Verder wordt speciale aandacht besteed aan processen die verlies van gegevens detecteren, vermijden en herstellen. • Procedurele verantwoordingsplicht: de organisatie verzorgt op een systematische manier een uitgebreide documentatie van alle digitale preserveringsacties die werden (en zullen worden) ondernomen. Digitaal Archief Vlaanderen Juni 2013
Digitaal Depot Levert diensten voor de archivering op lange termijn 2. Het Informatiemodel Digitaal Depot Levert diensten voor de archivering op lange termijn Deze diensten worden beschreven in de blauwdruk De diensten zijn gebaseerd op het OAIS model Onderhoud van de relaties tussen de archief documenten en de meta data Digitaal Object Intacte opslag van de bestanden Technische meta data (ID, fixity) Digitaal Document Bewaarstrategie Technische meta data (PDI, representatie) Digitaal archiefdocument Contextuele metadata Trustworthiness Digitaal Archief Vlaanderen Juni 2013
Samenstelling van de generieke blauwdruk 2. Het Informatiemodel Samenstelling van de generieke blauwdruk Business architectuur: diensten die beschikbaar zijn voor de producers en de consumers Gegevensarchitectuur: beheren van metadata, mogelijkheden om archiefstukken op te vragen op basis van metadata, gegevens uitwisseling tussen diensten en actoren Applicatie architectuur: bepalen van de samenhang van de software, niveau van automatisatie binnen het archief Technologische architectuur: technische eigenschappen van de oplossing zoals lager-niveau implementatievereisten en ondersteuning voor infrastructuur. Digitaal Archief Vlaanderen Juni 2013
Zijn er nog bijkomende vragen of opmerkingen? 2. Het Informatiemodel Zijn er nog bijkomende vragen of opmerkingen? ? Onderhoud van de relaties tussen de archief documenten en de meta data Digitaal Object Intacte opslag van de bestanden Technische meta data (ID, fixity) Digitaal Document Bewaarstrategie Technische meta data (PDI, representatie) Digitaal archiefdocument Contextuele metadata Trustworthiness Digitaal Archief Vlaanderen Juni 2013
Volgende stappen 3 Digitaal Archief Vlaanderen Juni 2013
3. Volgende stappen In een volgende stap stellen we de generieke blauwdruk op die als basis dient voor de behoefteanalyse Mobilisatie Generieke blauwdruk Behoefteanalyse Stappenplan Hoe verloopt de workflow van archivering en welke zijn de generieke elementen? Welke noden inzake interne en externe ontsluiting zijn er? Welke archiefbestanden zouden in beheer kunnen worden gegeven bij het VIAA +? 1 2 4 Welke behoeften en functionaliteiten zijn nuttig / ontbreken in de generieke blauwdruk? 3 Bestaande diensten en voorzieningen bij de partners Digitaal Archief Vlaanderen Juni 2013
3. Volgende stappen Deze wordt in detail voorgesteld en besproken op de volgende klankbordgroep Mobilisatie Generieke blauwdruk Behoefteanalyse Stappenplan Welke noden inzake interne en externe ontsluiting zijn er? 2 Welke behoeften en functionaliteiten zijn nuttig / ontbreken in de generieke blauwdruk? Mogelijke data Donderdag 25 juli Dinsdag 6 augustus 3 Digitaal Archief Vlaanderen Juni 2013
Bedankt voor uw inbreng! © 2013 PricewaterhouseCoopers. All rights reserved. “PricewaterhouseCoopers” refers to the network of member firms of PricewaterhouseCoopers International Limited, each of which is a separate and independent legal entity.
Appendix Digitaal Archief Vlaanderen Juni 2013
Behoefteanalyse en functionele analyse Mobilisatie Generieke blauwdruk Behoefteanalyse Stappenplan Activities Inleidend gesprek Kick-off meeting Informatiemodel Generieke blauwdruk Validatie Behoefteanalyse Marktverkenning Terugkoppeling Validatie Projectfiches Prioritiseren Stappenplan Case Validatie Deliverables Verslag Informatiemodel Generieke blauwdruk Stuurgroepverslag Informatiemodel Generieke blauwdruk Marktverkenning Stuurgroepverslag Programma Stappenplan Case Stuurgroepverslag Digitaal Archief Vlaanderen Juni 2013
Evaluatie diensten-aanbod Business case Mobilisatie Evaluatie diensten-aanbod Operationeel model Financieel model Activities Inleidend gesprek Kick-off meeting Beschrijving van de diensten Impact voor de partners Organisatorische en beheersaspecten Juridische aspecten Stappenplan Kostenmodel Waarde-inschatting, tarifering en co-financiering Deliverables Verslag Rapport dienstverlening en impactanalyse Stuurgroepverslag Rapport operationeel dienstenmodel Stappenplan Stuurgroepverslag Kostenmodel Scenario’s Financieel model Stuurgroepverslag Digitaal Archief Vlaanderen Juni 2013