De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

TEI tutorial Library Lab Sessie 1 (17 november 2014) Ron Van den Branden en Bert Van Raemdonck Centrum voor Teksteditie en Bronnenstudie (CTB)

Verwante presentaties


Presentatie over: "TEI tutorial Library Lab Sessie 1 (17 november 2014) Ron Van den Branden en Bert Van Raemdonck Centrum voor Teksteditie en Bronnenstudie (CTB)"— Transcript van de presentatie:

1 TEI tutorial Library Lab Sessie 1 (17 november 2014) Ron Van den Branden en Bert Van Raemdonck Centrum voor Teksteditie en Bronnenstudie (CTB)

2 Sessie 1 1) Who’s who? 2) Wat is markup? / Wat is TEI? (B) 3) Op verkenning: TEI by example 4) Basis XML / Basis TEI (R) 5) Aan de slag: Zelf coderen

3

4 Tekst: Strips op de Boekenbeurs Wat voor informatie zit er in deze tekst vervat?

5 Tekst: Strips op de Boekenbeurs Expliciet (“content”) Essentie = Het beeldverhaal wordt niet serieus genomen.

6 Tekst: Strips op de Boekenbeurs Impliciet Dit is een opinietekst uit een krant. De auteur bouwt een betoog op met enkele argumenten. Hij noemt paard en kar (namen, titels, data enz.) en citeert andere bronnen.

7 Tekst: Strips op de Boekenbeurs Impliciete informatie: hoe? Structuur Boventitel - Tussentitels Inleiding (‘chapeau’) Streamer Alinea’s Kolommen Vorm Naam van de auteur: vetjes Titels: cursief Engelse woorden: cursief Directe rede: aanhalingstekens (afbeelding: tekstballon)

8 Tekst = code Relatief eenvoudige tekst  Toch veel informatie die we decoderen  Lukt probleemloos < we kennen de gebruikte codes Omzetten in een ander medium (digitaal)  informatie opnieuw coderen  soms gelijkaardige methode, soms helemaal anders vgl: boek  film gelijk: flashback, verteller anders: woorden vs. beeldtaal

9

10 Codeerproblemen - Tekstcorruptie - Nieuwe (onbedoelde) vormen van betekenis - ‘Noise’: Babylonische spraakverwarring  Verlies van informatie

11 Babylon (1)

12 Babylon (2)

13 Babylon (3)

14 Coderen: best practice Minimaal aanwezige info (impliciet en expliciet) zo adequaat mogelijk omzetten Ideaal nieuwe/andere vormen van inzicht/gebruik mogelijk maken Hoe? weldoordachte, complexe maar transparante markup

15 Coderen / Markup Wat? Tekst verrijken met allerlei (impliciete) informatie Waarom? 'expliciteert voor de computer wat de menselijke lezer impliciet leest, en is dus noodzakelijk voor de creatie van een machine- readable tekst' Vanhoutte (1998) Hoe? Door die informatie tussen vishaakjes te zetten en in de eigenlijke tekst toe te voegen

16 Pre-computer

17 Computer Procedurele markup = instructies voor een programma dat de tekst verwerkt b.v. TeX, PostScript  Centreer deze zin  Cursiveer deze woorden Descriptieve markup = beschrijving van informatie in/over de tekst b.v. SGML, XML  Dit is een titel  Dit is een plaatsnaam

18 Computer Descriptieve markup GML (1969) SGML (1986) HTML (1991) XML (1996) XHTML (2000) L < Lauraespi.wordpress.com

19 SGML en XML = meta-talen = bouwdozen om informatie over tekststructuren en andere zaken i.v.m. de tekst weer te geven TEI (°1987) = voorbeeld van wat je met zo’n bouwpakket kunt doen = standaardcodering voor digitale bewaring, uitwisseling en publicatie van bronnen voor/door humane wetenschappen = zeer duurzame basis voor digitale edities

20 “TEI” = Consortium  Stellen Guidelines op  Houden conferenties  Bieden allerlei bronnen aan  Tijdschrift  Non-profit (academische instituten en individuele onderzoekers) “TEI” = Guidelines zelf  never ending story: proposals (P)  ‘minimal set of conventions’ -Basis: slechts 1 DTD (Document Type Definition) -TEI Lite: slank pakket dat voor 90% van de codeerprojecten volstaat  Toch: 545 elementen

21 1990: P1 (SGML) 1992: P2 (SGML) 1994: P3 (SGML) meer dan 600 elementen 1995: TeiLite (SGML) 131 elementen 2000: TEI Consortium 2001: P4 (XML) 2001: TeixLite (XML) 2007: P5 (XML)

22 Een met TEI gecodeerde tekst bevat dus -de tekst zelf -beschrijvingen v.d. structuur van die tekst (paragrafen, hoofdstukken) -beschrijvingen v.h. soort informatie dat in die tekst voorkomt (plaatsnamen, data) -beschrijving van zgn. metadata i.v.m. de tekst (auteur, bewaarplaats)

23 Voordelen -Niet afhankelijk van één bepaald besturingssysteem -Ondersteund door een levendige community -Houdbaarheidsdatum = (quasi) onbeperkt -Leesbaar door computers en door mensen -Ook uit een tekst in een onbekende taal kun je allerlei informatie aflezen (cf. Posta / BirGün) -Ideale basis voor complex onderzoek (editie)

24

25 Home http://www.tei-c.org/index.xml Guidelines (P5) http://www.tei-c.org/release/doc/tei-p5-doc/en/html/

26 http://www.teibyexample.org/

27 Test je kennis over TEI http://teibyexample.org/tests/TBED00v00.htm

28 Deze slides http://ctb.kantl.be/cursus/2014-liblab/ Contact bert.vanraemdonck@kantl.be @bvraemdonck ron.vandenbranden@kantl.be

29


Download ppt "TEI tutorial Library Lab Sessie 1 (17 november 2014) Ron Van den Branden en Bert Van Raemdonck Centrum voor Teksteditie en Bronnenstudie (CTB)"

Verwante presentaties


Ads door Google