Documentverwerking P03 Alfabetten en Lettersoorten Prof.Dr.ir. Patrick P. Bergmans Faculteit IngenieursWetenschappen Universiteit Gent
Alfabetten (1) Eenvoudigst West-Europees alfabet is het “Romeins” alfabet (zonder accenten) ABCDEFGHIJKLMNOPQRSTUVWXYZ (26) abcdefghijklmnopqrstuvwxyz (26) 01234567890 (10) .,;:!?+-=_<>(){}[]|/\@#$%&* (27) (ongeveer) Enige taal die dit eenvoudige alfabet gebruikt is het Engels ! Totaal 80-90 tekens Kan voorgesteld worden met 7 bits - toch worden 8 bits of een byte gebruikt
Alfabetten (2) Zelfs Nederlands, Frans of Duits maken gebruik van “speciale” tekens (accenten, zie later) Nederlands IJ ij Frans OE œ Ç ç Duits ß Daarbij komt nog en reeks (min of meer) taal-onafhankelijke speciale tekens †‡‰§™©®± ƒ¢£¥ (munttekens) Wiskundige tekens, chemische symbolen, enz. Aanhalingstekens (anders in elke taal !) enkel/dubbel, boven/onder, geïnverteerd, enz. “voorbeeld” , « exemple »
Alfabetten (3) Accenten zijn zeer taalspecifiek Bepaalde talen maken heel intensief gebruik van accenten Frans à èéêë î ô ùû Duits ä ö ü Spaans ñ Grieks (zie later) Andere talen maken beperkt gebruik van accenten; soms worden “accenten” gebruikt om het woord te benadrukken Nederlands : vóór, hét (facultatief) Maar in “coördinaat” is het verplicht
Alfabetten (4) Of alléén maar bij het gebruik van vreemde woorden Engels Ligaturen zijn “grafische” groeperingen ff, fi, fl, ffi, ffl Andere Europese talen maken gebruik van een aantal eigen tekens en accenten ÅåĂ㥹Ǻǻ Ðđ Ęę Ğğ Łł ØøŒœ Šš Þ Grieks heeft een ander alfabet АВГΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩ Αβγδεζηθικλμνξοπρςστυφχψω (twee kleine sigma’s)
Alfabetten (5) Russisch (Cyrillisch) alfabet Hebreeuws alfabet АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ абвгдежзийклмнопрстуфхцчшщъыьэюя Hebreeuws alfabet Teksten van rechts naar links, cijfers van links naar rechts Arabisch alfabet Elke letter heeft vier vormen (begin-, midden-, eindvorm, en alleenstaande vorm) Teksten eveneens van rechts naar links, cijfers van links naar rechts
Alfabetten (6) Accenten in het Grieks zijn bijzonder ingewikkeld Soms twee accenten boven en een accent onder één enkele letter Accenten zijn typografisch complex Er zijn twee methoden Vaste accenten (oudere methode): elke combinatie van letter en accent bestaat als een apart karakter Vlottende accenten: accenten bestaan los, en worden geplaatst over de karakters Toch speciale combinaties: i zonder punt, accenten met variabele breedte
Alfabetten (7) Oosterse talen hebben een heel andere voorstelling Alfabet (“Kanji”) bevat duizendtallen tekens Men spreekt van “ideogrammen”, omdat tekens in principe bepaalde concepten of deelwoorden voorstellen Alfabetten zijn aangevuld met enkele tientallen tekens om concepten voor te stellen die niet als Kanji ideogrammen bestaan (Katakana en Hiragana) Tekst mag zowel horizontaal als verticaal samengesteld worden 8 bits zijn duidelijk niet meer voldoende; men gebruikt 2 bytes, of 16 bits (JIS karakter set)
Alfabetten (8) Uittreksel van www.omniglot.com
Alfabetten (9) Uittreksel van www.omniglot.com
Alfabetten (10) Codering van alfabetten Oude coderingen (EBCDIC bvb) worden niet meer gebruikt Eenvoudige ASCII 7 bits, 128 karakters, 96 leesbaar, 32 controle Uitsluitend bruikbaar voor Engels Uitgebreide ASCII (ISO standaarden) Eerste uitbreiding (ISO-Latin-1) bevat letters met accenten voor veel Europese talen www.htmlhelp.org/reference/charset/ Andere uitbreidingen www.unicode.org/charts/
Lettersoorten (1) Er zijn honderdtallen lettersoorten in de wereld Meer zelfs, als men kleine varianten afzonderlijk beschouwt Taxonomie is niet zeer eenvoudig, noch regelmatig In de eenvoudigste vorm bestaat een letterfamilie uit vier lettersoorten (fonts) “Normaal” (soms “Roman” genoemd), Italiek (of Cursief), Vet, en Vet Cursief In bepaalde gevallen is cursief gewoon een schuine versie van de normale lettersoort, in andere gevallen is het een totaal ander ontwerp
Lettersoorten (2) Vaste of variabele karakterbreedte De meest gebruikte lettersoorten hebben variabele karakterbreedte Special lettersoorten (bvb. Courier) hebben een vaste karakterbreedte (historische oorzaak: schrijfmachine of printers met vaste letter-breedte) Cijfers hebben meestal dezelfde breedte om tabellen netjes te kunnen schikken Uitzondering: bij “esthetische” lettersoorten, niet gebruikt voor tabelwerk hebben de cijfers niet noodzakelijk dezelfde vaste breedte Indien vaste breedte, over ‘t algemeen een ½ vierkant (maar hier ook zijn er uitzonderingen)
Lettersoorten (3) Schreefletters en schreefloze letters (in het Engels: “serif” en “sans-serif”) Schreven zijn ornamenten aangebracht aan de uiteinden van de stokken van letters Zij kunnen verschillende vormen aannemen Fijne schreefjes (lijntjes) Driehoekige schreefjes Afgeronde schreefjes Trapeziumvormige schreefjes Zware blokschreefjes Vooral bij schreeflettersoorten heeft cursief een ander ontwerp dan “Roman” De cursieve soort is meer “complex”
Lettersoorten (4) Gelijke of ongelijke stokbreedte Opgaande en neergaande stokken kunnen gelijke breedte of dikte hebben Of zij kunnen verschillende breedte hebben Zoals het gebeurt bij penschrift (neergaande stok breder, door het opengaan van de pen) Het verschil kan klein of groot zijn Omvang van de letterfamilies; zij kunnen Beperkt zijn tot de vier “klassieke” lettersoorten (of zelfs twee in bepaalde gevallen) Een grote reeks varianten bevatten (tot enkele tientallen); dit is het geval voor bepaalde moderne schreefloze letterfamilies
Lettersoorten (5) Variaties in grote letterfamilies omvatten Een grotere reeks “gewichten” Bold, Extra Bold, Black, Heavy Light, Extra Light Een aantal variaties in de breedte van de leters van het alfabet Narrow, Condensed Extended, Wide In combinatie met “Roman”/Cursief kan dit aanleiding geven tot een zeer groot aantal lettersoorten in éénzelfde familie (Arial)
Lettersoorten (6) Times Klassieke schreefletter, afgeronde schreven, variabele letterbreedte, zeer variabele stokbreedte, cursief is ander ontwerp ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz
Lettersoorten (7) Arial Klassieke schreefloze letter, variabele letter-breedte, constante stokbreedte, cursief is zelfde ontwerp ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz
Lettersoorten (8) Arial varianten : “Roman” Black Narrow ABCDEFGHIJKLMNOPQRSTUVWXYZ abcde Black Narrow Rounded Bold (afgeronde hoekjes) Meer varianten, door combinatie met cursief ABCDEabcde ABCDEabcde ABCDEabcde
Lettersoorten (9) Rockwell Schreefletter, blokschreven, variabele letter- breedte, variabele stokbreedte, cursief is ander ontwerp, grote familie (condensed, extra bold)
Lettersoorten (10) Comic Sans MS “Fantasie” schreefloze letter, variabele letter- breedte, licht variabele stokbreedte, cursief is zelfde ontwerp ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz
Lettersoorten (11) Courier Klassieke schreefletter, lijnschreven, constante letterbreedte, constante stokbreedte, cursief is zelfde ontwerp ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz
Lettersoorten (12) Old English “Gothische” letter, variabele letterbreedte, bijzonder speciale stokvorm, cursief bijna zelfde basisontwerp
Lettersoorten (13) Copperplate Schreefletter, lijnschreefjes, variabele letter- breedte, licht variabele stokbreedte, cursief is zelfde ontwerp, kleine letters als “hoofd-letters”, maar met andere maatverhoudingen
Lettersoorten (14) French Script “Script” schreefloze letter (simulatie hand-schrift), variabele letterbreedte, licht variabele stokbreedte, cursief is zelfde ontwerp
Lettersoorten (15) WingDings Symbolenalfabet met de vier traditionele varianten ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz
Lettersoorten (16) Font Classificatie Systeem Font “browsers” Gebruikt om eigenschappen van fonts te formaliseren Maar ook voor automatische fontvervanging Halfacademisch: Panose; zie http://www.w3.org/Printing/stevahn.html Commercieel: SoftList; MyFonts; vele anderen http://www.softlist.net/products/font_tool.html http://www.myfonts.com Font “browsers” Commercieel: Advanced Font Catalog; zie http://www.wizetech.com/afc/index.shtml Nota: Dit is niet bedoeld als reclame voor commerciële referenties