DigiHist Oude teksten, moderne technologie: Geleerdenbrievenproject In eke Schuurman (K.U.Leuven) ism Jan Odijk (U.Utrecht)

Slides:



Advertisements
Verwante presentaties
Kwaliteit van leven voor ouder wordende mensen en de betrokkenheid van familie Zorg en ondersteuning voor ouder wordende mensen met een verstandelijke.
Advertisements

Tevredenheids onderzoek Door Lizanne Jespers HBO-V studente Maart 2014
Interactum Lectoraat Kantelende kennis
Hoe kunnen we elkaar versterken?
Workshop 3: De verhouding tussen VKS en de eindtermen in het onderwijs VKS-event 10/2/2012.
Zingen Refrein Zing en speelt voor de Heer van ganser harte.
Boeken voordat de drukpers werd uitgevonden
ÉÉN GOD, DE VADER 3 nov Rotterdam.
CHAPEAU, MIJNHEER FILLON !!! Vertaald uit het Frans – Freddy Storm 02/2010.
Hergebruik van taal- en spraakdata in e-health Remco van Veenendaal projectleider TST-Centrale Ehealth4com Nijmegen 3 oktober 2013.
Adaptieve Ondersteuning van Mens-Computer Teams Een Verkenning van het Gebruik van Cognitieve Modellen van Vertrouwen en Aandacht Peter-Paul van Maanen.
1212 /mhj Quo vadis, (Bio) Medisch Ingenieur? Biomedische Technologie Technische Universiteit Eindhoven in samenwerking met Universiteit Maastricht Dick.
400 jaar Rijksuniversiteit Groningen 15 mei t/m 15 juni 2014.
C-DSD: Curating the Dutch Song Database (Nederlandse Liederenbank) C-DSD Martine de Bruin.
Het sectorprogramma ICT-onderwijs in Nederland
DARE Wetenschappelijke communicatie in beweging Werkgemeenschap Informatiewetenschappen, 27 februari 2004 Lilian van der Vaart.
Toekomst van de e-Infrastructuur
Het mysterie van taal Tekeningen: Mònica Pascual Olivé
opslag en ordening digitale verwerking van informatie
CLARIN en oude teksten: Taal- en spraakinfrastructuur voor onderzoekers in de humane en sociale wetenschappen Ineke Schuurman CCL, K.U.Leuven Coördinator.
CLARIN: een introductie Ineke Schuurman Coördinator CLARIN-Vlaanderen.
Arthurian Fiction in Medieval Europe: Narratives and Manuscripts.
Eric Sieverts Sector Innovatie & Ontwikkeling Universiteitsbibliotheek Utrecht Instituut voor Media- & Informatie Management Hogeschool van Amsterdam Moderne.
Kunnen we leren kiezen? Jan Bransen Alumnidag 2006.
Kosmische Stralen onderzoek met middelbare scholen
Belangrijke onderzoeksgegevens uit het DUO-onderzoek van VNCI/RGC Jan Apotheker and Gerard van Koten Stuurgroep Nieuwe Scheikunde RGC;17.
7/26/2014 | 1 Zoeken naar literatuur Duits. 7/26/2014 | 2 Bibliotheek Rijksuniversiteit Groningen Universiteitsbibliotheek Bibliotheek Letteren ›Bibliotheek.
Zoeken naar literatuur
Onderzoeksdata in de Bibliotheek: Tijd voor een nieuw Informatie-specialisme? Ervaringen uit de praktijk Rob Grim Research Data Specialist/e-Science Coordinator.
Business Marketing Management© 2008 Noordhoff Uitgevers bvBusiness Marketing Management© 2008 Noordhoff Uitgevers bv.
4C-ID & Klinisch Redeneren
Waarom 'Spreuken'? 20 oktober 2013 Den Haag.
1. 1 Paulus, door de wil van God een apostel van Christus Jezus, en Timoteus onze broeder, 2 aan de heilige en gelovige broeders in Christus te Kolosse:
DANS is een instituut van KNAW en NWO Data Archiving and Networked Services DAI & NARCIS Chris Baars 14 Maart 2013 DANS is een instituut van KNAW en NWO.
DANS is een instituut van KNAW en NWO Data Archiving and Networked Services NARCIS: nationale portal van onderzoekinformatie Elly Dijk SURFacademy ‘CRIS.
Hoe kunnen we een lerende eigenaar maken van zijn eigen ontwikkeling?
Grupo Mercator. Universidad Politécnica de Madrid1 Watse Castelein SDI ontwikkeling en monitoring in Spanje Wageningen – 14.
Hulpmiddelen bij presenteren. Controleer van tevoren altijd of de apparatuur die je wilt gebruiken aanwezig is, of je er gebruik van mag maken en of je.
Peter Boot Clarin-3: Early Modern Images and Text – eXtended (EMIT-X)
OVER OUDE DRUKKEN K ennismaken met boeken gedrukt vóór 1840 Wat zijn oude drukken?
Data Archiving and Networked Services DANS is een instituut van KNAW en NWO Open access tot surveydata Peter Doorn Directeur DANS Nederlandstalig Platform.
17 september 2014 Workshop Visie en doelen.
1 CLARIN - NL Taal en Spraaktechnologie in een Infrastructuur voor Geesteswetenschappers Jan Odijk Utrecht, 11 juni 2010.
Bas Savenije Bibliothecaris van de Universiteit Utrecht Utrecht, 10 juni 2005.
Datasets, verrijkte publicaties …en de rol van DANS 1Maarten Hoogerwerf, , NVB.
Het KB e-Depot Waarom, wat en voor wie
Neem het onderstaande schema over en vul het in aan de hand van 6.3
Een gouden tijd voor de Republiek De 17e eeuw: 1600 – 1700
September 2013 – 5 vwo – van der Capellen
Republiek versus Frankrijk
SYMPOSIUM En nu op weg naar het taalonderwijs van de volgende honderd jaar.
AGORA is méér dan een gebouw. Het is een concept: “een sociaal kruispunt van informatie, technologie en dienstverlening.” Dienstverlening Ruime openingstijden.
Van papier naar digitaal Casus Digital born materiaal
Februari 2015 Profielkeuze HAVO 3 T. Verhagen M. van Mens
Spreuken: De nederige wijze.
1 e-Books & i-Papers Rik Min researcher Centre for Telematics and Information Technology (CTIT) & Faculty of Educational Science and Technology (EDTE)
Modernisme Edsilia & Sanne.
Een prachtige kans voor uw kinderen
Wetenschap-pelijke methode Kritisch Empirisme
Taal- en Spraaktechnologie (TST) voor het Nederlands: Status 2015 Jan Odijk (UU) Taalcongres Brussel, 10 oktober
Wat moet je weten aan het eind van de les? Wat de Gouden Eeuw is (met jaartallen) Waarom het een economische bloeiperiode was Waarom het een wetenschappelijke.
Regenten en vorsten H7.3 DE WETENSCHAPPELIJKE REVOLUTIE.
Beeld van het heelal in de oudheid. Dit beeld paste ook bij het Christendom.
Achtergrondartikel E. D E S MET, Het Onzevader Onverwachts in het Nieuw, in Kerk en Leven, 10 september 2014, p
Wetenschap. Hugo de Groot filmpje Was een Nederlands rechtsgeleerde en schrijver. Hij ging op zijn 11 e studeren aan de Universiteit van Leiden. Gevangen.
Regenten en vorsten 2.5 Wetenschap en techniek
Regenten en vorsten 3.5 Wetenschap en techniek
Project Gouden Eeuw – havo/atheneum 1 - Nederlands
WETENSCHAPSWINKEL UT MKB WETENSCHAPSWINKEL
Disclosure belangen Charlotte Poot
Transcript van de presentatie:

DigiHist Oude teksten, moderne technologie: Geleerdenbrievenproject In eke Schuurman (K.U.Leuven) ism Jan Odijk (U.Utrecht)

Oude teksten en TST Vanuit CLARIN:  Interesse in oude teksten om ook daar onderzoekers te laten profiteren van wat taal- en spraaktechnologie (TST) te bieden hebben  Nu: vooral recentere teksten (digitaly born, goed OCR-baar, goed corrigeerbaar (spelconventies),…) Want: ‘gewoon’ inscannen van een tekst, leidend tot een image, volstaat niet om er TST op los te kunnen laten

Image niet voldoende… Tekst moet ‘machine readable/ machine leesbaar’ zijn om er taal- en spraaktechnologie op los te kunnen laten Inscannen en dan OCR Maar: OCR niet altijd optie omdat de tekst zich daartoe niet leent  slechte staat origineel  handgeschreven  Combinatie:oud handschrift

Machine leesbare bronnen  Twee voorbeelden van oude handschriften die machine- readable gemaakt worden  Leuvense Schepenbank (zie presentatie Marika Ceunen)  Geleerdenbrieven In beide gevallen:  puur menselijke inspanning (vrijwilligers, studenten) Loont het de moeite? JA !

Geleerdenbrievenproject Betrokken partijen:  Koninklijke Nederlandse Academie van Wetenschappen (Huygensinstituut)  Universiteit Utrecht  Universiteit Amsterdam  Koninklijke Bibliotheek  DANS (Data Archiving and Networked Services)  VKS (Virtual Knowledge Studio) Additionele technische ondersteuning van CLARIN-NL

Geleerdenbrievenproject 2  In 17e eeuw veel ontdekkingen  grote toename informatie  Belangrijke rol Republiek der Nederlanden Vraag: hoe verspreidde die kennis zich? Onderzoek brieven 17e eeuwse wetenschappers  Constantijn en Christiaan Huygens (vader en zoon)  Antoni van Leeuwenhoek:  Hugo de Groot (Grotius)  Casparus Barlaeus (Kasper van Baerle)  Jan Swammerdam  Renė Descartes (in Nederland )

Geleerdenbrievenproject 3  Optie 1: gewoon alles doorlezen in je luie stoel  Optie 2: gebruik maken van moderne hulpmiddelen Gekozen voor optie 2, en eerst alles machine leesbaar gemaakt Daarna tools etc (verder) ontwikkeld voor oude teksten:  text mining  (spellingscorrectie, -normalisatie op enig niveau?)  Syntactische en semantische annotaties

Geleerdenbrievenproject 4  Machine-leesbaar-maken: transcriptiewerk uitbesteed aan studenten en vrijwilligers, cf Schepenbank Ook zij mogelijk gebaat bij andere benadering

Dank voor uw aandacht ! Vragen ? Dirk Roorda