Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008
Inleiding Nog niet goedgekeurd door stuurgroep strategisch archief of SOBO Ontwerptekst Graag uw feedback!
Wat zijn databanken? Databank bestaat uit verschillende onderdelen: –Gestructureerde gegevens –DBMS (beheer van de databank) –Toepassing Verschillende datamodellen –Bekendste is het relationele model
Wettelijke aspecten Decreet Openbaarheid van bestuur –Databank = bestuursdocument Archiefwet Auteurswet –Beschermt de auteur van de databank –Uitzonderingen voor archivering Privacywet –Legt beperkingen op voor de verwerking van gegevens Databankwet –Beschermt de auteur van de databank –Geen uitzondering voor archivering => onderzoeken wettelijke aspecten voor het archiveren => overeenkomst met de ontwikkelaar van de databank
Wat archiveren? (1) Niet éénduidig –Gegevens? –Structuur? –Toepassing? –DBMS? (enkel emulatie) Bepaald door de archiefvormer
Wat archiveren? (2) Enkele richtlijnen –Plaats van de databank in de organisatie –Extra informatie in de databank (tov afgeleiden)? –Wordt de informatie in een ander formaat bewaard? –Laat wetgeving de archivering toe? –Kan de integriteit en authenticiteit voldoende gegarandeerd worden? –Gebruikscontext: project/kerntaak –Authentieke bron? Ga bij de creatie van de databank na of deze gearchiveerd moet worden => Stel een archiefbeheersplan op
Eisen archiveringsoplossing (1) de authenticiteit en integriteit behouden door de betekenisvolle onderdelen van de databank en metadata over de databank te bewaren de metadata moeten toegankelijk en begrijpbaar zijn op lange termijn de databank moeten bruikbaar en verwerkbaar zijn door toekomstige systemen
Eisen archiveringsoplossing (2) de databank moet onafhankelijk worden van het DBMS, hardware en besturingssysteem er moet gebruikgemaakt worden van open standaarden die breed geaccepteerd zijn. het beheer en onderhoud van het archief moet onafhankelijk zijn van specifieke software (vendor lock-in vermijden)
Bewaarstrategieën - overzicht Migratie Emulatie Alternatieve bewaarstrategie Conversie
Bewaarstrategie (1) - Migratie Langetermijnbewaring (> 5 jaar - …) Omzetten naar een standaardformaat: –Gebruik XML –Of een combinatie van standaarden: Platte tekst (data, liefst Unicode) XML (enkel metadata over de databank) SQL (opgelet ISO SQL!) –Zowel structuur als zoekvragen e.d.
Migratie Eisen voor het behoud van authenticiteit Inhoud De inhoud kan goed bewaard worden. Het is belangrijk dat er wel een validatiestap is om na te kijken of de migratie geslaagd is. Context De context moet bewaard worden door beschrijvende en technische metadata toe te voegen. Structuur De structuur kan bewaard blijven, maar zal meer beschreven moeten worden in een taal begrijpbaar door de computer. Uiterlijk Het uiterlijk kan niet bewaard worden en moet beschreven worden De beste oplossing is het bewaren van functionele of technische analyse. Gedrag Het gedrag kan niet bewaard worden en moet best beschreven worden. De beste oplossing is het bewaren van functionele of technische analyse.
Bewaarstrategie (2) - Emulatie Langetermijnbewaring (> 5 jaar - …) Aangewezen als de toepassing ook bewaard moet worden
Emulatie Eisen voor het behoud van authenticiteit Inhoud De oorspronkelijke inhoud blijft bewaard Context De context moet toegevoegd worden door beschrijvende en technische metadata toe te voegen. Structuur De structuur van de oorspronkelijke databank wordt bewaard. Uiterlijk De oorspronkelijke applicatielaag blijft bewaard. Het kan snel complex worden als er extra programma’s bewaard moeten worden. Bijvoorbeeld bij databanken met een webinterface moet er naast de databanksoftware een webserver, een programmeertaal,... bewaard blijven. Gedrag Het gedrag blijft bewaard omdat de oorspronkelijke databank bewaard blijft.
Bewaarstrategie (3) - Conversie Aangewezen voor kortetermijnbewaring (≤ 5 jaar) Naar nieuwere, hogere versie Opgelet: vergeet de metadata over de databank niet!
Conversie Eisen voor het behoud van authenticiteit Inhoud Wordt goed bewaard. Het resultaat moet nagekeken worden Context De context moet toegevoegd worden door beschrijvende en technische metadata toe te voegen. Structuur Wordt goed bewaard. Het resultaat moet nagekeken worden Uiterlijk Kan bewaard worden. De verschillende componenten zijn vaak gemaakt met leveranciersspecifieke programma’s en daarom is het conversieproces afhankelijk van deze programma's. Gedrag Kan bewaard wordt. Het is het belangrijk om te testen of de omzetting naar de nieuwe versie geslaagd is.
Bewaarstrategie (4) - Alternatief Alternatieve bewaarstrategie –Vaak zijn databanken een bron en is enkel de output belangrijk (vb. documenten gegenereerd uit een databank) –De output moet wel op een goede manier bewaard worden Interactiviteit van de databank vervalt
Alternatieve bewaarstrategie Eisen voor het behoud van authenticiteit Inhoud Niet de databank, maar de output van de databank wordt bewaard Het gevolg is dat de inhoud niet op een gestructureerde manier bewaard wordt. Geen mogelijkheid tot bevraging van de gegevens. Context Door de beschrijvende en technische metadata toe te voegen voor de gekozen oplossing. Structuur Wordt niet bewaard, omdat het in een andere vorm wordt bewaard. UiterlijkWordt ook niet bewaard, omdat de databank niet bewaard wordt. GedragWordt ook niet bewaard, omdat er een andere vorm wordt gebruikt
Conclusie bewaarstrategie (1) VoordelenNadelen Migratie + Volledige neutraliteit en onafhankelijkheid + Getrouwe representatie - Kans op beperkt gegevensverlies bij oorspronkelijke migratiebewerking - Geen eenvoudige bewerking -Niet alles kan behouden worden, bijvoorbeeld de applicatielaag en hierdoor moet er veel beschreven worden Conversie + Zeer getrouwe representatie + Relatief eenvoudige ingreep + Beperkte kans op gegevensverlies op korte termijn - Volledige afhankelijkheid van platform en producent - Hoe langer gewacht wordt met de conversie, hoe meer kans op gegevensverlies Emulatie + Zeer getrouwe representatie + Alle oorspronkelijke functionaliteiten werken - Arbeidsintensieve ontwikkeling - Meerdere configuraties moeten geëmuleerd worden - Licenties van de verschillende programma’s nodig - Geen emulator voor recente databanksoftware
Conclusie bewaarstrategie (2) Kortetermijnbewaring ≤ 5 jaar Langetermijnbewaring > 5 jaar - … Permanente bewaring Migratie-XX ConversieX-- Emulatie (nu moeilijk haalbaar) -XX
Vervolgtraject Goedkeuring door (advies wordt strategie!) –stuurgroep strategisch archief –SOBO Voorstel piloot: archivering van Vlimpers –Concrete toepassing van de strategie