De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

EXtensible Markup Language Theorie 1 © Jan De Cooman

Verwante presentaties


Presentatie over: "EXtensible Markup Language Theorie 1 © Jan De Cooman"— Transcript van de presentatie:

1 eXtensible Markup Language Theorie 1 © Jan De Cooman decoomanj.pih@hogeschool-wvl.be

2 Cursusmateriaal Slides Professional XML, Wrox, ISBN 1-861003-11-0 (zowel voor 2MCT als voor 3MCT) XML Bible, Elliotte Rusty Harold Recommendation W3C www.w3c.orgwww.w3c.org

3 Bestaande problemen SERVER CLIENT B CLIENT A WORD-DOCUMENT HTML-DOCUMENT Conversie

4 Ideale situatie SERVER CLIENT B CLIENT A DATAFORMAAT X beschikbaar in WORD DATAFORMAAT X beschikbaar in browser GÉÉN Conversie

5 Wat is XML ? eXtensible Markup Language (XML) is een door het W3C voorgestelde aanbeveling van een bestandsformaat om gemakkelijk en goedkoop elektronische documenten te verspreiden op het World Wide Web Doelstelling: Self-Describing Data

6 Voorbeelden van documenten Boeken Gebruikershandleidingen Catalogi Bestelformulieren Medische documenten Belastingsformulieren Wiskunde formules Chemische formules Medische voorschriften Woordenboeken Kranten Bibliotheek indexen Muziek DNA-sequenties Database schemas Bibliografie …

7 Op zoek naar een formaat: SGML Standard: ISO standaard sinds 1986 Generalized: aanpasbaar aan de toepassing Markup: speciale codes in de tekst geven betekenis aan de inhoud Language: structuren aanwezig om taalelementen te definiëren  heel complex, maar alles kan hiermee beschreven worden !

8 Architecturale afhankelijkheden SGML HTML... XML SMIL CDF WML... Instances / Domains HTML is reeds een SGML-toepassing, maar was zeer eenvoudig van structuur. XML moet een eenvoudiger versie van SGML voorstellen, waaruit nieuwe talen kunnen gemaakt worden.

9 XML moet voldoen aan: Extensibility “HTML met user-defined tags” Kan op elk domein gebruikt worden Structure Moet boomstructuren voorstellen  DOM (database schemas, OO hierarchies, …) Validation Applicaties kunnen controleren op de structurele integriteit van een document bij behandeling.

10 XML moet: Bruikbaar zijn over het Internet Een waaier van applicaties ondersteunen SGML compatibel zijn Gemakkelijk te schrijven zijn Gemakkelijk te interpreteren zijn door programma’s Snel te ontwerpen zijn Een formele en preciese syntax bezitten Toelaten om nieuwe talen te ontwerpen

11 Basisstructuur …. Prolog …. …… Dit is een processing instruction. Deze zal de parser (programma dat xml inleest) enkele opdrachten geven. De xml version instructie is vereiste ! Er moet altijd een root-element zijn, net zoals bij HTML alle HTML tussen -tags staat.

12 HTML en XML Heading Tag met specifieke betekenis Attribuut (metadata) Data Afsluiten tag Reuter HTML  XML 

13 Maar, veel meer regels ! TAGS 1. Altijd CASE - SENSITIVE != != NIET: Auto Fiets Trein WEL: Auto Fiets Trein

14 Maar, veel meer regels ! TAGS 2. Lege elementen of NIET: WEL: of

15 Maar, veel meer regels ! TAGS 3. Nesting en sluiten WEL …. NIET ….

16 Maar, veel meer regels ! TAGS 4. Valid Name WEL NIET -Boek, 42Boek Para$, E=mc² XmlData, vnaam@naam Een tag moet beginnen met een : of een _ of een letter, en wordt dan gevolgd door andere letters, -, _, cijfers of punten. Het attribuut mag niet beginnen met de string XML in gelijk welke vorm (xML, Xml, …)

17 Maar, veel meer regels ! ATTRIBUTEN 1.Case Sensitive 2.Attribuut waarde ALTIJD tussen dubbele aanhalingstekens WEL … NIET …

18 Voorbeeld Een boek bestaat uit meerdere hoofdstukken en elk hoofdstuk bestaat uit meerdere paragrafen. Hoe kunnen we dit in XML omzetten ? Afhankelijkheden: BOEKHOOFDSTUK PARAGRAAF

19 Kiezen root-element ….. Tussen deze tags zal alle andere data komen te staan. Tags die buiten deze tags staan, zijn illegaal, want zij zijn niet afhankelijk van de root.

20 Invullen structuur Op een mooie ochtend…. …. ….. We kiezen goede tag-names die de data verduidelijken en volgen het schema van de afhankelijkheden.

21 Data Op een mooie ochtend…. De data bestaan altijd uit ISO-10646 karakter, dus geen é, @, ü, enzovoort. Deze moeten we op een andere manier definiëren  entities of character set definiëren. Reden: portabiliteit naar andere talen en systemen.

22 Attributen Er bestaat geen duidelijke regel die zegt wanneer men data in een attribuut of als element moet neerschrijven. Attributen kunnen altijd als element geschreven worden, maar elementen niet altijd als attributen. Een attribuut is enkel zinvol wanneer het data over de data bevat, bijvoorbeeld een kleur of alignatie.

23 Attributen Op een mooie ochtend…. …. ….. Let op: in attributen gaan we nooit tags gaan plaatsen. In attributen spreekt men van CDATA (computerdata), bij elementen spreekt met van PCDATA (parseable computerdata)

24 Vervolledigen structuur Op een mooie ochtend…. …. ….. (vb)

25 Well-formed Als de XML-file voldoet aan alle regels ivm de tags, de attributen en de structuur, dan noemen we de file well- formed. Zolang een file niet well-formed is, zullen de parsers de file NIET aanvaarden en een fout genereren.

26 Comments <!– Dit is commentaar dit mag er ook in --> Comments zijn precies hetzelfde als in HTML : Commentaar wordt nooit geïnterpreteerd ! Maar, commentaar mag nooit worden genest ! (geen andere commentaartekens binnen het commentaar)

27 Escaped Content -tag ]]> Wat als je als CDATA (computer data) nu HTML hebt (bijvoorbeeld als je een cursus over HTML schrijft) ? HTML kent de -tag Dit levert een fout op, want de - tag is niet afgesloten…. Oplossing, escaped content (niet geparsed) :

28 Einde theorie 1


Download ppt "EXtensible Markup Language Theorie 1 © Jan De Cooman"

Verwante presentaties


Ads door Google