De Who – Wat moet de bibliotheek ermee? Een kijkje in de keuken bij de KB
De data Nederlands gepubliceerd geheugen vooral tekstueel grotendeels machineleesbaar gestructureerd (metadata) of semi-gestructureerd (tekst) Het resultaat van: meer dan 200 jaar gedrukte publicaties verzamelen meer dan 30 jaar digitaliseren bijna 20 jaar nationale samenwerking meer dan 10 jaar digitale publicaties verzamelen 2030: alle Nederlandse publicaties digitaal
“Een relatief kleine, maar groeiende, groep vormt de bovenste laag “Een relatief kleine, maar groeiende, groep vormt de bovenste laag. Het gaat om wetenschappers en ontwikkelaars die de grote tekstuele datasets gebruiken die de KB in de afgelopen jaren met haar samenwerkingspartners heeft opgebouwd. Steeds vaker maken geesteswetenschappers gebruik van tools, bijvoorbeeld voor informatie-extractie en datavisualisatie, om greep te krijgen op datasets die niet meer op traditionele manieren te analyseren zijn (‘big data’). De KB ondersteunt deze vorm van wetenschap, de Digital Humanities, actief.” Beleidsplan 2015-2018
http://ngramviewer.kbresearch.nl/
AVresearcherXL
www.nederlab.nl/onderzoeksportaal
translantis.wp.hum.uu.nl/
Wetenschappers willen ook: toegang tot de data zonder (G)UI voor Text and Data Mining, Distant Reading machineleesbaar, in bulk wettelijk zo open mogelijk
www.kb.nl/dataservices
De komende tijd gedifferentieerder aanbod = ook ZIP-bestanden, ‘corpus builder’, instructies, … meer vanuit het web gedacht = volgens linked data-principes transparanter = provenance, selectiecriteria, ©, … opener = in lijn met Who
steven.claeyssens@kb.nl @sclaeyssens www.kb.nl/dataservices www.kb.nl/dh steven.claeyssens@kb.nl @sclaeyssens