Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdWillem Coppens Laatst gewijzigd meer dan 9 jaar geleden
1
TEI tutorial Library Lab Sessie 1 (17 november 2014) Ron Van den Branden en Bert Van Raemdonck Centrum voor Teksteditie en Bronnenstudie (CTB)
2
Sessie 1 1) Who’s who? 2) Wat is markup? / Wat is TEI? (B) 3) Op verkenning: TEI by example 4) Basis XML / Basis TEI (R) 5) Aan de slag: Zelf coderen
4
Tekst: Strips op de Boekenbeurs Wat voor informatie zit er in deze tekst vervat?
5
Tekst: Strips op de Boekenbeurs Expliciet (“content”) Essentie = Het beeldverhaal wordt niet serieus genomen.
6
Tekst: Strips op de Boekenbeurs Impliciet Dit is een opinietekst uit een krant. De auteur bouwt een betoog op met enkele argumenten. Hij noemt paard en kar (namen, titels, data enz.) en citeert andere bronnen.
7
Tekst: Strips op de Boekenbeurs Impliciete informatie: hoe? Structuur Boventitel - Tussentitels Inleiding (‘chapeau’) Streamer Alinea’s Kolommen Vorm Naam van de auteur: vetjes Titels: cursief Engelse woorden: cursief Directe rede: aanhalingstekens (afbeelding: tekstballon)
8
Tekst = code Relatief eenvoudige tekst Toch veel informatie die we decoderen Lukt probleemloos < we kennen de gebruikte codes Omzetten in een ander medium (digitaal) informatie opnieuw coderen soms gelijkaardige methode, soms helemaal anders vgl: boek film gelijk: flashback, verteller anders: woorden vs. beeldtaal
10
Codeerproblemen - Tekstcorruptie - Nieuwe (onbedoelde) vormen van betekenis - ‘Noise’: Babylonische spraakverwarring Verlies van informatie
11
Babylon (1)
12
Babylon (2)
13
Babylon (3)
14
Coderen: best practice Minimaal aanwezige info (impliciet en expliciet) zo adequaat mogelijk omzetten Ideaal nieuwe/andere vormen van inzicht/gebruik mogelijk maken Hoe? weldoordachte, complexe maar transparante markup
15
Coderen / Markup Wat? Tekst verrijken met allerlei (impliciete) informatie Waarom? 'expliciteert voor de computer wat de menselijke lezer impliciet leest, en is dus noodzakelijk voor de creatie van een machine- readable tekst' Vanhoutte (1998) Hoe? Door die informatie tussen vishaakjes te zetten en in de eigenlijke tekst toe te voegen
16
Pre-computer
17
Computer Procedurele markup = instructies voor een programma dat de tekst verwerkt b.v. TeX, PostScript Centreer deze zin Cursiveer deze woorden Descriptieve markup = beschrijving van informatie in/over de tekst b.v. SGML, XML Dit is een titel Dit is een plaatsnaam
18
Computer Descriptieve markup GML (1969) SGML (1986) HTML (1991) XML (1996) XHTML (2000) L < Lauraespi.wordpress.com
19
SGML en XML = meta-talen = bouwdozen om informatie over tekststructuren en andere zaken i.v.m. de tekst weer te geven TEI (°1987) = voorbeeld van wat je met zo’n bouwpakket kunt doen = standaardcodering voor digitale bewaring, uitwisseling en publicatie van bronnen voor/door humane wetenschappen = zeer duurzame basis voor digitale edities
20
“TEI” = Consortium Stellen Guidelines op Houden conferenties Bieden allerlei bronnen aan Tijdschrift Non-profit (academische instituten en individuele onderzoekers) “TEI” = Guidelines zelf never ending story: proposals (P) ‘minimal set of conventions’ -Basis: slechts 1 DTD (Document Type Definition) -TEI Lite: slank pakket dat voor 90% van de codeerprojecten volstaat Toch: 545 elementen
21
1990: P1 (SGML) 1992: P2 (SGML) 1994: P3 (SGML) meer dan 600 elementen 1995: TeiLite (SGML) 131 elementen 2000: TEI Consortium 2001: P4 (XML) 2001: TeixLite (XML) 2007: P5 (XML)
22
Een met TEI gecodeerde tekst bevat dus -de tekst zelf -beschrijvingen v.d. structuur van die tekst (paragrafen, hoofdstukken) -beschrijvingen v.h. soort informatie dat in die tekst voorkomt (plaatsnamen, data) -beschrijving van zgn. metadata i.v.m. de tekst (auteur, bewaarplaats)
23
Voordelen -Niet afhankelijk van één bepaald besturingssysteem -Ondersteund door een levendige community -Houdbaarheidsdatum = (quasi) onbeperkt -Leesbaar door computers en door mensen -Ook uit een tekst in een onbekende taal kun je allerlei informatie aflezen (cf. Posta / BirGün) -Ideale basis voor complex onderzoek (editie)
25
Home http://www.tei-c.org/index.xml Guidelines (P5) http://www.tei-c.org/release/doc/tei-p5-doc/en/html/
26
http://www.teibyexample.org/
27
Test je kennis over TEI http://teibyexample.org/tests/TBED00v00.htm
28
Deze slides http://ctb.kantl.be/cursus/2014-liblab/ Contact bert.vanraemdonck@kantl.be @bvraemdonck ron.vandenbranden@kantl.be
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.