DocumentverwerkingP00Inleiding Prof.Dr.ir. Patrick P. Bergmans Faculteit IngenieursWetenschappen Universiteit Gent
2 Inleiding: Lesgeven (1) Eerste les vrijdag: 13 februari 2009, 10:00 u Eerste les vrijdag: 13 februari 2009, 10:00 u Hoofdzakelijk kennismaking, inleiding en inhoud Hoofdzakelijk kennismaking, inleiding en inhoud Presentaties worden op Minerva geplaatst (pps, ppt, pdf), indien mogelijk, enkele dagen vóór de les Presentaties worden op Minerva geplaatst (pps, ppt, pdf), indien mogelijk, enkele dagen vóór de les Alle mededelingen gebeuren ad valvas op Minerva Alle mededelingen gebeuren ad valvas op Minerva Alle vragen van algemene aard worden gesteld en beantwoord via twee forums op Minerva Alle vragen van algemene aard worden gesteld en beantwoord via twee forums op Minerva Lessenforum Lessenforum Oefeningenforum Oefeningenforum wordt alleen gebruikt voor persoonlijke vragen wordt alleen gebruikt voor persoonlijke vragen Mijn adres: Mijn adres: Mijn telefoonnummer: Mijn telefoonnummer:
3 Inleiding: Lesgeven (2) Assistent op het Laboratorium (TELIN) Assistent op het Laboratorium (TELIN) Dieter Fiems, Dieter Fiems, Dieter Fiems zal alle lessen over XML geven Dieter Fiems zal alle lessen over XML geven
4 Inleiding: Jaaroefeningen Accent op oefeningen Accent op oefeningen Jaaroefeningen zijn programmeeroefeningen Jaaroefeningen zijn programmeeroefeningen Twee programmeerprojecten + één XML project Twee programmeerprojecten + één XML project Programmeertaal willekeurig Programmeertaal willekeurig Maar moeten ofwel “.exe” taken zijn (sorry, niet op Mac OS, Unix of Linux), ofwel Java source Maar moeten ofwel “.exe” taken zijn (sorry, niet op Mac OS, Unix of Linux), ofwel Java source In te dienen per , als “attachment” In te dienen per , als “attachment” Formaat, namen, enz. zullen later medegedeeld worden Formaat, namen, enz. zullen later medegedeeld worden Eén oefening per mailEén oefening per mail Telt voor 1/3 van de jaarpunten Telt voor 1/3 van de jaarpunten Niet inhaalbaar voor de tweede examenperiode Niet inhaalbaar voor de tweede examenperiode
5 Inleiding: Examen Schriftelijk examen, in aanwezigheid van de lesgever Schriftelijk examen, in aanwezigheid van de lesgever Deel theorie Deel theorie Gesloten boek Gesloten boek Twee of drie vragen Twee of drie vragen 1/3 van de jaarpunten 1/3 van de jaarpunten Deel oefeningen Deel oefeningen Open boek Open boek Twee of drie oefeningen Twee of drie oefeningen Algoritmes moeten niet geprogrammeerd worden Algoritmes moeten niet geprogrammeerd worden 1/3 van de jaarpunten 1/3 van de jaarpunten
6 Inhoud (1) Modellen van documenten Modellen van documenten Logische en fysische structuur van documenten Logische en fysische structuur van documenten Logische structuur naar fysische structuur Logische structuur naar fysische structuur Fysische structuur naar logische structuur Fysische structuur naar logische structuur Letterstijlen en lettersoorten Letterstijlen en lettersoorten Gewone, speciale en complexe alfabetten Gewone, speciale en complexe alfabetten Lettersoortfamilies (fonts) Lettersoortfamilies (fonts) Tekstverwerking binnen documenten Tekstverwerking binnen documenten Horizontale verwerking (“paragraafverwerker”) Horizontale verwerking (“paragraafverwerker”) Verticale verwerking, met en zonder lay-out Verticale verwerking, met en zonder lay-out Speciale coderingen (bv. wiskundige teksten) Speciale coderingen (bv. wiskundige teksten)
7 Inhoud (2) De “markup” talen De “markup” talen SGML, HTML SGML, HTML XML; documentgerichte eigenschappen van XML: DTD, XSL, XLL, XSLT, XSLFO, XPath XML; documentgerichte eigenschappen van XML: DTD, XSL, XLL, XSLT, XSLFO, XPath De bladzijde-beschrijvingstalen De bladzijde-beschrijvingstalen PostScript PostScript PDF PDF Documentcollecties Documentcollecties Tekstdatabanken Tekstdatabanken Beginselen van Documentbeheer Beginselen van Documentbeheer Zoekrobotten Zoekrobotten Algemene zoekrobotten Algemene zoekrobotten Tekstgerichte zoekrobotten Tekstgerichte zoekrobotten Speciale zoekrobotten (“meta” zoekrobotten, enz) Speciale zoekrobotten (“meta” zoekrobotten, enz)
8 Referenties (1) “Digital Typography,” Donald Knuth, CSLI Publications, 1999 “Digital Typography,” Donald Knuth, CSLI Publications, 1999 “Digital Typography, An Introduction to Type and Composition for Computer System design,” Richard Rubinstein, Addison-Wesley, 1988 “Digital Typography, An Introduction to Type and Composition for Computer System design,” Richard Rubinstein, Addison-Wesley, 1988 “Rookledge’s International Type Finder,” Christopher Perfect and Gordon Rookledge, Moyer Bell Limited, 1991 “Rookledge’s International Type Finder,” Christopher Perfect and Gordon Rookledge, Moyer Bell Limited, 1991 “The Concise Companion,” Neil Bradley, Addison-Wesley, 1996 “The Concise Companion,” Neil Bradley, Addison-Wesley, 1996 “The XML Schema Companion,” Neil Bradley, Addison-Wesley, 2003 “The XML Schema Companion,” Neil Bradley, Addison-Wesley, 2003 “XSL Formatting Objects,” Sharon Adler Ed., Sams Publishing, 2003 “XSL Formatting Objects,” Sharon Adler Ed., Sams Publishing, 2003
9 Referenties (2) “Document Warehousing and text Mining”, Dan Sullivan, Wiley, 2001 “Document Warehousing and text Mining”, Dan Sullivan, Wiley, 2001 “Understanding Search Engines”, Michael Berry and Murray Browne, SIAM, 2005 “Understanding Search Engines”, Michael Berry and Murray Browne, SIAM, 2005 “Modelling the Internet and the Web”, Pierre Baldi, Paolo Frasconi and Padhraic Swyth, Wiley, 2003 “Modelling the Internet and the Web”, Pierre Baldi, Paolo Frasconi and Padhraic Swyth, Wiley, 2003 “Mining the Web: Analysis of Hypertext and Semi-Structured Data”, Choumen Chakrabarti, Morgan Kaufman, 2002 “Mining the Web: Analysis of Hypertext and Semi-Structured Data”, Choumen Chakrabarti, Morgan Kaufman, 2002 “Integrative Document & Content Management”, Len Asprey and Michael Middleton, Idea Group Publishing, 2003 “Integrative Document & Content Management”, Len Asprey and Michael Middleton, Idea Group Publishing, 2003 “Text Databases and Document Management: Theory and Practice”, Amita Goyal Chin, Idea Group Publishing, 2001 “Text Databases and Document Management: Theory and Practice”, Amita Goyal Chin, Idea Group Publishing, 2001