Documentverwerking P01 Logische en Fysische Structuur

Slides:



Advertisements
Verwante presentaties
Pagina-instelling.
Advertisements

WORKSHOP. EEN CPU MAKEN VAN UW COMPUTER. Dinsdag 05 / 04 / Door; Tom Roef, bestuurslid. Sodipa Computerclub.
Word 2003 Tips en trucs Door Johan Lammers.
Handboek verzenden van Nieuwsbrief Caribbean.nl 12 september 2012 •Ga naar CMS •Kies Nieuwsbrief Caribbean.nl.
Pimp your Powerpoint 7 juni 2011
1 Samenwerkend leren met Google Docs Werking en mogelijkheden van online tekstverwerken.
Beheer en ordenen van digitale documenten 2008
HOMCOM Ledenvergadering 22/11/2010. Google • Na Google instant nu Google instant previeuw – – 1 = sneller zoeken – 2 = previeuw.
Module 7 – Hoofdstuk 5 (1) SQL – een begin.
Programmeren met Alice
(c) Marc de Graauw Presentatie XML Marc de Graauw 2 maart 2000.
Waar dienen al die toetsen eigenlijk voor?
Wat is het AnySurfer label? Een Belgisch kwaliteitslabel voor toegankelijke websites Bestaat uit een Basislabel en een Pluslabel Basislabel garandeert.
Dienstencatalogus 24 november Programma Wat is een productencatalogus Alle componenten op een rij – De generieke informatie – De specifieke informatie.
HALLO OPLETTEN : Waarom sql DOEN : Introductie opdracht
Les1: eenvoudig computergebruik
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Het oog wil oog wat. Kijk ook op
C-DSD: Curating the Dutch Song Database (Nederlandse Liederenbank) C-DSD Martine de Bruin.
Start.
F. Rubben NI Lookout 1 06/RIS/05 - NI Lookout VTI Brugge F. Rubben, ing.
Informatica Universiteit AntwerpenRapporten 4.1 Informatica 1rste BAC Biologie Hoofdstuk 4 Rapporten.
Ingenieursvaardigheden
@ faculteit wetenschappen TOetsen en LEren Doeltreffend Ondersteunen TOLEDO voor assistenten.
Hoofdstuk 6: Controle structuren
THESISSEMINARIE 2 VAKGROEP EXPERIMENTEEL-KLINISCHE EN GEZONDHEIDSPSYCHOLOGIE Probleemstelling, methode LES 1; Klinische Psychologie; Universiteit Gent;
Prof.Dr.ir. Patrick P. Bergmans Faculteit IngenieursWetenschappen
Documentverwerking P02 Tekstverwerking & Letterafmetingen
Interaction diagrams: Sequence Diagram
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Het gegevensverwerkend proces
HALLO OPLETTEN : Waarom sql DOEN : Introductie opdracht
SIP File Recovery Tool. Agenda 18/10/2006Maken agenda + onderzoeken van verschillende filetypes 25/10/2006Uitzoeken hoe er effecient gelezen en geschreven.
Joost van Dijk Web Technology
Conversie programma’s Woensdag 12 januari Wat is conversie? Het omzetten van een media-file (tekst, geluid, foto, video) van het ene formaat naar.
DocumentverwerkingP00Inleiding Prof.Dr.ir. Patrick P. Bergmans Faculteit IngenieursWetenschappen Universiteit Gent.
Documentverwerking P04 Paragraafverwerker & Woordsplitsing
Blok 7: netwerken Les 1 Christian Bokhove
Inleiding tot Excel.
Les 12: DTD.
Voor u de volgende schermen verspreidt … U hebt de poster verspreidt. De betrokken personen weten dus waar ze uw tips kunnen terugvinden. Verdeel nu de.
Smartboard: Move to reveal (gordijn en vergrootglas)
DSU the Netherlands Electronic One Form. DSU the Netherlands Adobe Acrobat PDF form Voordelen –Beveiligd –Buttons toevoegen –Inhoud definiëren van het.
Car Parrinello Moleculaire Dynamica Dynamica van de atoomkernen wordt op klassiek beschreven V=Potentiële Energie Klassieke MD : V wordt beschreven door.
De financiële functie: Integrale bedrijfsanalyse©
Van papier naar digitaal Casus Digital born materiaal
Afbeeldingen op je webpagina
Strijd tegen de zonde?.
Proeftoets periode 1 4 havo.
H51PHOTOSHOP 1 Les 4 Hagar: Vullen. audiovisueel centrum meise 2 Overzicht Elementaire handelingen  Vullen  Patronen.
Les 3 sjablonen (templates), briefpapier maken
Aan klikken. TAB blad favorieten aan klikken Nieuwe verzamel map maken.
HTML De basis-elementen.
Opslag Formaten.
1 XSLT processing & control Datamodellering 2006.
|Datum | 1 Bibliotheekinstructie Zoeken naar Literatuur februari 2015.
ARCHIEVENPROJEKT CENTER FOR RESEARCH ON DUTCH JEWRY SPI OKTOBER 2012.
 Beeld en geluid samendrukken  comprimeren Hoe doe je dit ?  Puntjes die hetzelfde zijn als 1 geheel beschouwen ⇩ Afhankelijk van het bestandstype.
PDF Portable Document Format. INHOUD Wat is een PDF? Adobe Acrobat Reader Adobe Acrobat Voordelen Nadelen Alternatieven Gebruik in de praktijk.
Beeldbewerking les 3. beeldbewerking 1.formaten (soorten bestanden) 2.dragers (media) 3.opdracht: foto’s bewerken.
Let’s go! ›Beginnerspresentatie ›Starten met prospero ›Verschil CMS en web navigator ›Nieuwe content > nieuwe folder aanmaken ›Bestanden uploaden ›Linkobject.
Anton van den Noort1 FOTOSHOWS MAKEN HCC DEVENTER.
DigEplan
Copyright © 2010 Welkom bij Welkom bij AlertPlan Wij nemen u mee op korte rondleiding in deze voor IBM ontwikkelde web-tool, te benaderen middels
Trimester 2. Hfdst 1: e-Presentatie, master! e-Presentatie Met de hulp van Powerpoint gaan we leren hoe we een elektronische presentatie kan maken.
SharePoint Alles over metadata In de Private en Public cloud.
E-Boeken van binnen Of wat zit er in een epub
Wat maakt een PPT goed?.
Huiswerkcontrole tabel 2
Cursus voor een eco-performant gebruik van uw PC
Transcript van de presentatie:

Documentverwerking P01 Logische en Fysische Structuur Prof.Dr.ir. Patrick P. Bergmans Faculteit IngenieursWetenschappen Universiteit Gent

Documenten (1) Wat is een document? Een collectie grafische objecten en tekst-objecten (= inhoud), geschikt volgens een bepaalde structuur, voorgesteld in een bepaald formaat, en bestemd voor menselijke communicatie Grafische objecten zijn figuren, illustraties, beelden Tekstobjecten zijn titels, koppen, tekst-paragrafen en tabellen Traditioneel was papier het medium voor documenten

Documenten (2) De geschiedenis van “traditionele” documenten is zeer lang (is de bijbel een document?) Dit is geen cursus in de geschiedenis van het document Recent (sedert 20-25 jaren) worden documenten elektronisch of digitaal opgeslagen In verschillende vormen Zij worden ook op een meer interactieve manier, op een computerscherm gevisualiseerd Men verwacht zeer grote evoluties in het begrip “document” in komende jaren

Papier & Digitale Documenten The Digital Document Bitmap PDL Styled Structured The Paper Document

Digitale Documenten Digitale documenten bestaan in verschillende vormen en formaten Deze formaten onderscheiden is bijzonder belangrijk In functie van de toepassing In functie van opslagcapaciteit, verwerkings-mogelijkheden, enz. Een vraag: welke vorm is de “referentievorm” Inleiding tot Documentclassificatie

Het Document als “Bitmap” Document opgeslagen als een rij pixels (net zoals een beeld) Eenvoudige 1-op-1 voorstelling van het fysische document Voorbeelden: .jpg, .tif, .bmp, .gif bestanden (Zeer) grote opslagcapaciteit Beperkte verwerking nodig voor reproductie op een fysich medium (zpals papier) Zo goed als niet wijzigbaar (“editeerbaar”) voor wat tekst betreft; wel als “beeld”

Het Document als bladzijdebeschrijving Bevat “objecten” zoals karakters, beelden en illustraties en een beschrijving van hun positie op het blad Tekst is niet verwerkbaar Voorbeeld : PostScript (.ps), PDF (.pdf) Redelijk compacte voorstelling Verwerking nodig voor reproductie (door een “RIP” = “raster image processor”) Toestelonafhankelijk Zeer beperkt editeerbaar: objecten kunnen verplaatst worden, en hun parameters gewijzigd

Het “Gestileerde” Document Document bevat gestileerde en elkaar opvolgende rijen grafische elementen en tekst, en een beperkte vorm van structuur Tekst blijft verwerkbaar Voorbeeld : Document in MS Word (.doc), een speciaal geval van (.rtf) Redelijk compacte voorstelling Vereist toestelafhankelijke verwerking (driver) Volledig editeerbaar Maar niet “structuurgecontroleerd”; m.a.w., de structuur kan vernietigd worden bij wijzigingen

Het “Gestructureerde” Document Document bevat een hoge graad van structuur Tekst is verwerkbaar Voorbeelden: SGML, XML, HTML HTML heeft ook bepaalde eigenschappen van gestileerd document Structuurgecontroleerde editeerbaarheid Opslagcapaciteit iets groter dan gestileerde documenten Vereist dikwijls ingewikkeld verwerkings-toepassingen; fysische reproductie volgens verschillende formaten mogelijk Veel gebruikt in technische documentatie

Van Digitale Documenten naar Papier Structured Content SGML, XML, HTML XML Editors, FrameMaker Presentation Format Style MS Word, Quark Xpress,Wordperfect Style sheet, DTD XML Editors, Various programs Styled Content DOC, WPF, RTF Adobe Acrobat Professional Resources Compose Postscript or PDF Driver Fonts Output Representation PDF, PS, PCL Adobe Photoshop Media Properties Render RIP, Printer Driver Page size, Screen Resolution Raw Digital Image TIFF, GIF, BMP Physical Representation Paper, Video Device Properties Playback Marking engine, Printer, Screen Toner, Ink

Vertrekkend van Papier Wat gebeurt er wanneer men met papier begint? Scan (digitaliseren) naar een Digitaal Document Maar tot welk niveau? Digitaal-naar-papier is “many-to-one” Papier-naar-digitaal is “one-to-many” Niveau waarnaar gescand moet worden is afhankelijk van de toepassing Voor opslag is een bitmap waarschijnlijk voldoende Voor tekstverwerking moet men praktisch steeds tot op het “gestileerd” document niveau terug

Van Papier naar Digitaal Structured Content Presentation Format Re- Structure Styled Content Resources Recognize Output Representation Media Properties Segment Raw Digital Image Physical Representation Device Properties Capture

Logische & Fysische Structuur (1) Beschouw een eenvoudig document Bv. een roman, een rapport Logische structuurelementen Indeling in hoofdstukken Indeling in paragrafen (alinea’s) Indeling in zinnen Indeling in woorden Die indeling blijft ongewijzigd, en is niet afhankelijk van de uiteindelijke vormgeving Zij vormen de logische structuur van een document

Logische & Fysische Structuur (2) Fysische structuurelementen Indeling in bladzijden Indeling in kolommen Indeling in tekstregels Deze indeling wordt wel degelijk gewijzigd door de vormgeving, de afmetingen van het document, de gebruikte letterstijlen, enz. Niet-interactieve (“batch”) tekstverwerking (zoals TEX) zet de logische structuur in fysische structuur, en produceert een bladzijde-beschrijving; ook “formatteren” genoemd Soms gaat men rechtstreeks (met en driver) naar de bitmap output

Logische & Fysische Structuur (3) In interactieve toepassingen (zoals bv. MS Word, Quark Xpress) Wordt de tekst inwendig “gestileerd” opgeslagen Wordt continu, en interactief, de tekst (her)verwerkt, en op het scherm getoond Indien vanuit een interactieve toepassing, een document afgedrukt wordt op twee verschillende printers, kan de output (fysische structuur) er anders uit zien Dit heeft te maken met “lettersoort” metriek (zie later) Men verwart dikwijls logische en fysische structuur bij het invoeren van een document (meer bepaald wanneer een document opgemaakt wordt)

Logische & Fysische Structuur (4) Bij de meeste tekstverwerkers wordt de “return” toets gebruikt als “einde paragraaf” (EOP, logisch), niet “einde tekstregel” (EOL, fysisch). Wordt soms gevisualiseerd als ¶. Gebruik dan nooit de “return” toets om zelf een paragraaf in tekstregels te verdelen Dit verhindert herverwerking met andere parameters Extra wit tussen paragrafen zou het resultaat van de verwerking moeten zijn, niet van een extra “return”, of “lege” paragraaf Inspringen van de eerste regel van een paragraaf heeft dezelfde eigenschap; gebruik geen spaties in het begin van een paragraaf

Logische & Fysische Structuur (5) De spatiebalk is normaal de logische afbakening van woorden; gebruik die niet voor extra spatiëring. Daarom “vreten” goede tekstverwerkers spaties in het begin en het einde van paragrafen op (zij hebben op die plaatsen geen nut) Voor dezelfde reden worden meervoudige spaties als één spatie geïnterpreteerd Tabelwerk is zeer sterk structuurgebonden; maak geen tabellen met spaties (en evenmin met herhaalde “tabs” die dikwijls onvoorspelbaar uitgevoerd worden)