TST voor de archiefsector | Het NA en TST Welke raakvlakken heeft het NA met taal- en spraaktechnologie (TST)? Remco van Veenendaal Adviseur preservation
2
3
De digitale levenscyclus 4 TST voor de archiefsector |
Raakvlakken met TST: programma 5 TST voor de archiefsector | Terminologie, thesauri Doorzoekbaar maken Voorlezen Classificatie
Raakvlakken met TST: het NA 6 TST voor de archiefsector | Handschrift- herkenning Innovatief Archiveren (Apollo 19) Zoeken in Archives Portal Europe E-Discovery
Handschriftherkenning 7 TST voor de archiefsector | Inhoudelijk ontsluiten serie-archieven (idealiter meteen bij creatie – digitalisering) Aanvulling op zoeken en vinden in indexen en metadata (namen en termen)
Handschriftherkenning 8 NA: transcriberen en doorzoekbaar maken (digitale) bronnen 1 en 2 (3 niet behapbaar). Handschriftherkenning: Monk en READ (Recognition and Enrichment of Archival Documents). TST voor de archiefsector |
9 Onderzoek (met ICTU): automatische identificatie en classificatie van ongestructureerde informatie in mailboxen en op mailservers.
TST voor de archiefsector | Predictive coding toepassen op 1. Verwijder ongewenste mail 2. Schat opbrengst (handmatig) 3. Stel controleset samen 4. Train het systeem 5. Test het systeem 6. Pas het systeem toe
Innovatief Archiveren Doc-Direct: rijksbrede sharedserviceorganisatie voor beheer en bewerking archieven Ambitie: toenemend aanbod gestructureerde en ongestructureerde digitale archieven beheersen Onderdeel van keten: tussen archiefvormende overheidsorganisaties en Nationaal Archief 11 TST voor de archiefsector |
Innovatief archiveren 12 TST voor de archiefsector | Ook: Pilot Data Analytics 2: automatische selectie ongestructureerd archief volgens selectieregels en selectiecriteria.
13 TST voor de archiefsector | Meertalig zoeken: 24 talen Autocompletion Automatische suggesties *OR? Maar: zwaan, swan, cygne?
Raakvlakken met TST: …? 14 TST voor de archiefsector |