U vraagt, wij scannen Grootschalig digitaliseren van archivalia op verzoek van de klant VGI Studiemiddag 12 sep 2008 Marc Holtman Stadsarchief Amsterdam
Alle inhoud is geïndexeerd door zoekmachines zoals Google Zijn we nu klaar? De aanleiding Sinds 2004 zijn alle inventarissen van het SAA online via website beschikbaar Het zoeksysteem werd al meteen na lancering intensief gebruikt Online inventarissen
Voor inzage in de stukken moet nog steeds een bezoek worden gebracht aan de studiezaal “Waar zit de knop om de plaatjes te bekijken”? De Archiefbank Inventarissen zijn vanuit het oogpunt van de gebruiker beperkt De meest gestelde vraag van onze gebruikers was dan ook “Waar zijn de plaatjes?”
En zij er geregistreerde Archiefbank gebruikers Oftewel, de Archiefbank: In 2006 hebben we besloten om die knop te ontwikkelen Op dit moment bevat de Archiefbank meer dan scans De eerste versie is in juli 2007 gelanceerd De Archiefbank Een systeem voor het raadplegen en downloaden van archivalia via het web “Waar zijn de plaatjes?”
Als we alle aanvragen voor digitalisering kunnen verwerken dan kunnen we concluderen dat er geen achterstand is in digitalisering en dat de doelstelling dat de gebruiker stukken digitaal kan raadplegen is gehaald Waar dus mee te beginnen? Het SAA beheert 32 kilometer archief Alle openbare inventarisnummers kunnen voor digitalisering worden aangevraagd Uit een onderzoek naar aanvragen van originelen op studiezaal blijkt: er zijn geen publieksfavorieten U vraagt Digitaliseren op verzoek van de klant In de Archiefbank stelt de gebruiker daarom de prioriteiten in digitalisering Hoeveel tijd kost het om 32 km archief te digitaliseren? 1 meter archief = scans Bij een productie van scans per week is na 431 jaar elk stuk gedigitaliseerd
Dit kan alleen maar worden gerealiseerd wanneer aan twee voorwaarden wordt voldaan: De levertijd moet zo kort als mogelijk zijn U vraagt Korte levertijd 1. Een gestroomlijnd, efficiënt georganiseerd werkproces voor grootschalige digitalisering 2. Een snelle, gebruikersvriendelijke webapplicatie
We hebben daarom een nieuw werkproces ontwikkeld, met De gebruiker zal dus vaak een groot aantal scans nodig hebben Archiefonderzoek loopt al snel in de tientallen, tot honderden documenten Dit betekent dat de productiekosten zo laag als mogelijk moeten blijven De prijs moet in het verlengde liggen van de prijs van een eenvoudige kopie op studiezaal U vraagt Lage kosten Grootschaligheid en kwaliteit afgestemd op het gebruiksdoel als uitgangspunten Voorbeeld aanvragen He, betalen voor scans? Het probleem met raadplegen van scans van archivalia is dat een kwaliteit “minder dan leesbaar” geen nut heeft Het SAA stelt levering van een reproductie via het web gelijk aan levering van een kopie op studiezaal En méér dan leesbaar ook niet Maar wat vindt het publiek hiervan? Bijvoorbeeld Aad en Jan?Aad en Jan
Toch heeft digitalisering natuurlijk wel een conserveringsfunctie: de originelen hoeven het depot in principe niet meer te verlaten En NIET als a substituut voor de originelen De scans gemaakt in dit reproductieproces zijn gemaakt voor raadplegen door de gebruiker Wij scannen Voor archiefonderzoek via het web Conservering van de originelen blijft de belangrijkste zorg
De documenten die in dit proces worden gedigitaliseerd zijn Wij scannen Een breed spectrum aan documenttypen Klein en groot formaat (tot formaat krant) Losse en vastbladige eenheden Kaartsystemen Oud en modern materiaal Laag en hoog contrast documenten Tekst, en tekst en beeld Hybride vormen Voor alle documenttypen geldt dezelfde kwaliteitsstandaard
Om de kosten zo laag als mogelijk te houden volgt de kwaliteitsstandaard uit het gebruiksdoel De kwaliteitsstandaard luidt als volgt Wij scannen Met een kwaliteitsstandaard gebaseerd op het gebruiksdoel Raadplegen van gedigitaliseerde archivalia via het scherm of in print Informatie leesbaar in het origineel moet leesbaar zijn in de scan Een punt op de i moet als zodanig herkenbaar zijn Reproductie papierstructuur en exacte kleurreproductie niet van hoogste belang Prijsvergelijking (gemiddeld) Foto : 2 – 4 Euro Archivalia, Metamorfoze: 0,65 Euro Archivalia, Archiefbank: 0,20 Euro
Om ook de opslagkosten zo laag als mogelijk te houden slaan we geen ongecomprimeerde bestanden op Wij bewaren Geen aparte, ongecomprimeerde scans KleurruimteRGB Bittdiepte8 bits per kanaal Curve (“contrast”) zodanig dat de scans op zowel een beeldscherm als print leesbaar zijn OpslagformaatJPEG Compressiekwaliteit 10 (Photoshop)
Dit resulteert in een scan met: Op de webserver worden afgeleiden gemaakt voor inzoomen en contrastfilter voorbeeld De scans worden opgeslagen in ons interne digitaal depot én op de webserver (alle images zijn online beschikbaar) Wij bewaren Geen aparte, ongecomprimeerde scans Een relatief kleine bestandsgrootte Uitstekende leesbaarheid op scherm en print Genoeg flexibiliteit
Wij hebben een reproductieproces ontwikkeld waarin we ongeveer scan per week op basis van klantaanvragen (plus aanvulling eigen selecties) kunnen verwerken Bovendien hebben we in-huis een workflowsysteem ontwikkeld dat optimaal aansluit op de bestaande systemen en procedures Maar ook grootschalige digitalisering op projectbasis volgt dit proces Er zijn nauwelijks richtlijnen en best practices voor grootschalige digitalisering Het reproductieproces Ontwikkeling van het reproductieproces
Identificatie op basis van orderbonnen Uitgangspunten Uitgaan van bestaande metadata Het complete inventarisnummer wordt altijd gescand Constante productie ( scans, +/- 1,4 meter)
Betekenisloze bestandsnamen Identificatie op basis van orderbonnen Uitgangspunten Uitgaan van bestaande metadata Het complete inventarisnummer wordt altijd gescand Constante productie ( scans, +/- 1,4 meter)
Archiefbank aanvraagBeheersystemen A Order Orderbon Filename A03764 A Order number Serial number Scanning order A A A Range: A – A Archief 195 Invnr 836 Order A03764 A A Scanrapport A A A A A digits Barcode registration Na registratie komt de betekenis van het ordernummer te vervallen We kunnen daarom spreken van betekenisloze bestandsnamen Import
Intensieve samenwerking met digitaliseerder Betekenisloze bestandsnamen Identificatie op basis van orderbonnen Uitgangspunten Uitgaan van bestaande metadata Het complete inventarisnummer wordt altijd gescand Constante productie ( scans, +/- 1,4 meter) Geen kwetsbaar of op onconventionele wijze verpakt materiaal Scanning is uitbesteed Eenvoudige voorbewerking
Het reproductieproces is gestroomlijnd, efficiënt is georganiseerd, en geautomatiseerd waar mogelijk De back- en frontofficesystemen gebruikersvriendelijk zijn en optimaal aansluiten op de behoeften van klant en medewerker De kwaliteit van de scans, compressie en bestandsformaat zijn afgestemd op het gebruiksdoel Conclusies Grootschalig digitaliseren van archivalia voor lage kosten en met een korte levertijd is mogelijk wanneer:
En tenslotte… De Archiefbank is genomineerd voor de Computable “ICT project van het jaar” Award De andere kandidaten zijn grote commerciële giganten Degene met de meeste stemmen wint Help ons daarom om deze prijs te winnen en breng uw stem uit: