TEI tutorial Library Lab Sessie 1 (17 november 2014) Ron Van den Branden en Bert Van Raemdonck Centrum voor Teksteditie en Bronnenstudie (CTB)

Slides:



Advertisements
Verwante presentaties
Sprint Jabbla.
Advertisements

Schema en synthese van een zakelijke tekst
Beeld  -> woord 4 lessen beam van waardenberg beeld  -> woord 4 lessen beam van waardenberg.
Welkom. Wat gaan we doen? • Data leren gebruiken als startpunt van verhalen • Naar de IATI set kijken van buitenlandse zaken.
Uiterlijke structuur aanbrengen
Een cursus schrijven Cursus ‘pimpen’ – Studeerbaar studiemateriaal – structuur – tekstniveau – zinsniveau - woordniveau BA - dpb Brugge.
Module 7 – Hoofdstuk 5 (1) SQL – een begin.
Portfolio Website Tim Klijn Klas: MBI m1 Datum: 21 november 2007
Correct bronvermelden
(c) Marc de Graauw Presentatie XML Marc de Graauw 2 maart 2000.
Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008.
C-DSD: Curating the Dutch Song Database (Nederlandse Liederenbank) C-DSD Martine de Bruin.
HTML Les 1: Introductie HTML
Muziek downloaden PVGE Computerclub 5 JANUARI 2012.
Metadata uitwisselschema project Ellen Mulder Digiframe
Crashcursus HTML en CSS 2013
Maurice de Beijer. Wie is Maurice de Beijer Microsoft MVP DevelopMentor trainer SDN Sectiehoofd UX Onafhankelijk software ontwikkelaar
Onderzoeksmethodologie HRM Dr. Sophie De Winne 03/ (Lessius) 016/ (K.U.Leuven) 27 september Onderzoeksmethodologie.
Universal Design for Learning 24/09/2013 UGent Karen Leyman.
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
In stappen naar de innerlijke structuur
Het gegevensverwerkend proces
EXtensible Markup Language Theorie 1 © Jan De Cooman
HALLO OPLETTEN : Waarom sql DOEN : Introductie opdracht
Visual Basic .NET voor studenten
Hoofdstuk 11 Kwantitatieve gegevens analyseren Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian Thornhill, Marije.
Webmaster Training: CSS CSS2 & XHTML By Frederik Van Outryve.
1 OMI Technisch ontwerp. 2 Technisch ontwerp ‘content’ Veel breder dan business portals (Carlson) Verschillende aspecten / aandachtspunten:
Onderzoeksvaardigheden
Correct bronvermelden
Introductie Oude Geschiedenis 15 september Weekopdrachten moeten op maandag vóór 16.30u worden ingeleverd in postvak op Drift 10 Werkboek staat.
30 juni Deze morgen Vorige bijeenkomst: –een concepthierarchie van kernbegrippen in Logic & Language vakgebied (o.b.v. glossary) Vandaag: –Jon:
Joost van Dijk Web Technology
Conversie programma’s Woensdag 12 januari Wat is conversie? Het omzetten van een media-file (tekst, geluid, foto, video) van het ene formaat naar.
1 paragraaf 9 Bestanden met digitale informatie Informatica Blok 1 Hoofdstuk 1 Digitale informatie in bestanden.
WEBBUILDING 07/03/2005 Saartje De Geyter.
Deel XXI 1 Internetapplicaties Internetprogrammeren Capita Selecta.
Samen werken aan een gezonde regio!
Les 12: DTD.
MET DANK AAN COLLEGA’S IN DEN LANDE ! vee 2012
Freelancenetwork.be audit. SEO Basics Elke pagina unieke titel, merk achteraan Elke pagina één H1 tag Meta description (inhoud vd pagina) ALT tag op afbeeldingen.
Systemen die het opstellen van digitale wetgeving ondersteunen Rik De Busser ICRI/LIIR – K.U.Leuven
Coderen.
Bezoekersgerichte teksten
Marketing & Logistiek 6 atheneum.
TEI tutorial Library Lab Sessie 2 (24 november 2014) Ron Van den Branden en Bert Van Raemdonck Centrum voor Teksteditie en Bronnenstudie (CTB)
Stappenplan Samenvatten
HTML LEON KLOOS,AMO1B.. INHOUDSOPGAVE Over HTML. Coderingen. Geschiedenis van HTML.
NU Burgerschap Harald Veldman en Ingrid Leegsma 10 maart 2015 NU Methoden Congres.
Samenvatten Klas 4A de Foorakker.
1 Introductie next MCT - Programmeren 2 © S. Walcarius Waarom java? programma machinetaal (.exe) compilen platformspecifiek Een exe programma.
HTML De basis-elementen.
1 OMI Digitaal publiceren in bredere context.
TEI tutorial Library Lab Sessie 2 (24 november 2014) Ron Van den Branden en Bert Van Raemdonck Centrum voor Teksteditie en Bronnenstudie (CTB)
Overzicht ViP’s* ViP-1: structuur 1
inleiding leesvaardigheid Leesstrategieën & schrijfdoel
Workshop ‘academisch schrijven’ Jordi Heeren Instituut voor Levende Talen
Basics SERP = Search Engine Results Page Betaalde resultaten = SEA Natuurlijke resultaten = SEO Search Engine Optimization SEO is een lange termijn verhaal.
EContentplus Chris De Loof Europeana en zijn sattelietprojecten Jubelparkmuseum, Brussel 8 januari 2009 Nationale ATHENA Workshop België.
Literaire bouwstenen 3.
Centraal Examen Nederlands
Groep 6 Begrijpend lezen
Leren leren; zaakvakken (ak/gs)
E-Boeken van binnen Of wat zit er in een epub
Lectora als ontwikkeltool voor interactieve multimedia programma’s
Lezen 1.3 en 2.1 Woordenschat 1.1 en 1.2
HTML5 introductie.
Transcript van de presentatie:

TEI tutorial Library Lab Sessie 1 (17 november 2014) Ron Van den Branden en Bert Van Raemdonck Centrum voor Teksteditie en Bronnenstudie (CTB)

Sessie 1 1) Who’s who? 2) Wat is markup? / Wat is TEI? (B) 3) Op verkenning: TEI by example 4) Basis XML / Basis TEI (R) 5) Aan de slag: Zelf coderen

Tekst: Strips op de Boekenbeurs Wat voor informatie zit er in deze tekst vervat?

Tekst: Strips op de Boekenbeurs Expliciet (“content”) Essentie = Het beeldverhaal wordt niet serieus genomen.

Tekst: Strips op de Boekenbeurs Impliciet Dit is een opinietekst uit een krant. De auteur bouwt een betoog op met enkele argumenten. Hij noemt paard en kar (namen, titels, data enz.) en citeert andere bronnen.

Tekst: Strips op de Boekenbeurs Impliciete informatie: hoe? Structuur Boventitel - Tussentitels Inleiding (‘chapeau’) Streamer Alinea’s Kolommen Vorm Naam van de auteur: vetjes Titels: cursief Engelse woorden: cursief Directe rede: aanhalingstekens (afbeelding: tekstballon)

Tekst = code Relatief eenvoudige tekst  Toch veel informatie die we decoderen  Lukt probleemloos < we kennen de gebruikte codes Omzetten in een ander medium (digitaal)  informatie opnieuw coderen  soms gelijkaardige methode, soms helemaal anders vgl: boek  film gelijk: flashback, verteller anders: woorden vs. beeldtaal

Codeerproblemen - Tekstcorruptie - Nieuwe (onbedoelde) vormen van betekenis - ‘Noise’: Babylonische spraakverwarring  Verlies van informatie

Babylon (1)

Babylon (2)

Babylon (3)

Coderen: best practice Minimaal aanwezige info (impliciet en expliciet) zo adequaat mogelijk omzetten Ideaal nieuwe/andere vormen van inzicht/gebruik mogelijk maken Hoe? weldoordachte, complexe maar transparante markup

Coderen / Markup Wat? Tekst verrijken met allerlei (impliciete) informatie Waarom? 'expliciteert voor de computer wat de menselijke lezer impliciet leest, en is dus noodzakelijk voor de creatie van een machine- readable tekst' Vanhoutte (1998) Hoe? Door die informatie tussen vishaakjes te zetten en in de eigenlijke tekst toe te voegen

Pre-computer

Computer Procedurele markup = instructies voor een programma dat de tekst verwerkt b.v. TeX, PostScript  Centreer deze zin  Cursiveer deze woorden Descriptieve markup = beschrijving van informatie in/over de tekst b.v. SGML, XML  Dit is een titel  Dit is een plaatsnaam

Computer Descriptieve markup GML (1969) SGML (1986) HTML (1991) XML (1996) XHTML (2000) L < Lauraespi.wordpress.com

SGML en XML = meta-talen = bouwdozen om informatie over tekststructuren en andere zaken i.v.m. de tekst weer te geven TEI (°1987) = voorbeeld van wat je met zo’n bouwpakket kunt doen = standaardcodering voor digitale bewaring, uitwisseling en publicatie van bronnen voor/door humane wetenschappen = zeer duurzame basis voor digitale edities

“TEI” = Consortium  Stellen Guidelines op  Houden conferenties  Bieden allerlei bronnen aan  Tijdschrift  Non-profit (academische instituten en individuele onderzoekers) “TEI” = Guidelines zelf  never ending story: proposals (P)  ‘minimal set of conventions’ -Basis: slechts 1 DTD (Document Type Definition) -TEI Lite: slank pakket dat voor 90% van de codeerprojecten volstaat  Toch: 545 elementen

1990: P1 (SGML) 1992: P2 (SGML) 1994: P3 (SGML) meer dan 600 elementen 1995: TeiLite (SGML) 131 elementen 2000: TEI Consortium 2001: P4 (XML) 2001: TeixLite (XML) 2007: P5 (XML)

Een met TEI gecodeerde tekst bevat dus -de tekst zelf -beschrijvingen v.d. structuur van die tekst (paragrafen, hoofdstukken) -beschrijvingen v.h. soort informatie dat in die tekst voorkomt (plaatsnamen, data) -beschrijving van zgn. metadata i.v.m. de tekst (auteur, bewaarplaats)

Voordelen -Niet afhankelijk van één bepaald besturingssysteem -Ondersteund door een levendige community -Houdbaarheidsdatum = (quasi) onbeperkt -Leesbaar door computers en door mensen -Ook uit een tekst in een onbekende taal kun je allerlei informatie aflezen (cf. Posta / BirGün) -Ideale basis voor complex onderzoek (editie)

Home Guidelines (P5)

Test je kennis over TEI

Deze slides