zoeken en ontsluiten in de wereld van Google

Slides:



Advertisements
Verwante presentaties
Web 3.0: van omgevallen boekenplank tot georganiseerde kennisbank Frank van Harmelen Vrije Universiteit Amsterdam Creative Commons License: allowed to.
Advertisements

Inleiding Na het bestuderen van dit hoofdstuk kun je:
De catalogus: verrijking door toegevoegde functionaliteit & toegevoegde functionaliteit door verrijking Jeroen Bosman, universiteitsbibliotheek Utrecht.
Hoofd Afdeling Digitale Biblitheekvoorzieningen
Online Marketing voor het MBO “SEO, dat kun je zelf!”
Module 7 – Hoofdstuk 5 (1) SQL – een begin.
Fedora Content Model en XSLT Fedora op Klompen, Amsterdam, Egbert Gramsbergen TU Delft Library / Digital Product Development
geïntegreerde zoeksystemen
Adviesraad – eenduidige parameters 1 Objecten catalogus 16 juni 2010, Oracle gebruikersgroep Huibert-Jan Lekkerkerk (IDsW)
thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.
Management van Bibliografische Informatie (MBI) Module 4 College “Big Picture” Universiteitsbibliotheek UM 2002, 10 juni.
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Metadatabeheer en -beleid
To retrieve or not to retrieve, that's the question retrieval van wetenschappelijke informatie eric sieverts.
Welkom bij de cursus Handig met Internet! Handig met Internet -Wat doet u al met internet? -Wat wilt u nog meer met internet doen? -Hoe kunt u beter.
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
C-DSD: Curating the Dutch Song Database (Nederlandse Liederenbank) C-DSD Martine de Bruin.
Het Semantic Web: voor een gezonder Web Lloyd Rutledge, Universitair Docent, INF Opening Academisch Jaar, 18 juni 2008.
Q-KENNIS Een kennis-systeem is veelal gebaseerd op het ontsluiten van aanwezige kennis en ter faciliterering van de ontwikkeling van nieuwe kennis. Het.
LITERATUUR ONDERZOEK.
Vakliteratuur opzoeken Lieve Devos. LibriSource+ Nieuw portaal voor toegang tot elektronische bronnen Gemeenschappelijk platform.
Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- en Informatie Management Hogeschool van Amsterdam DARE zomerschool - juni Tilburg.
Autonomy bij een Universiteitsbibliotheek
Eric Sieverts Sector Innovatie & Ontwikkeling Universiteitsbibliotheek Utrecht Instituut voor Media- & Informatie Management Hogeschool van Amsterdam Moderne.
Google Scholar de googlificatie van de wetenschap ? Eric Sieverts
retrieval en ontsluiting taaltechnologische aanpak voor zoekproblemen
Ontsluiten en zoeken kunnen we het nog vinden? Eric Sieverts
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Informatievaardig bij Trendanalyse: M eer dan Google Jaroen Kuijper, informatiespecialist
Geest, brein en cognitie Filosofie van de geest en Grondslagen van de cognitiewetenschap Fred Keijzer.
© Universiteitsbibliotheek Groningen METIS Aanleverloket Metis/Repositories Henk Druiven Henk Ellermann Afdeling Digitale Bibliotheek Vz. Universiteitsbibliotheek/RuG.
Programma Open Standaarden en Open Source Software voor de Overheid dinsdag 6 april 2004 Open Source Software en Open Standaarden Standaards in samenwerking,
The KB en Web 2.0 Verlaag de drempel om services te integreren. Theo van Veen, 7 november 2006.
… een nieuwe zoekmachine! “Dear finance support desk customers, The search facility within the knowledge base will be improved to help you find information.
Trefwoorden overbodig? De gebruiker aan het woord Annemieke Jurgens InfoManagement 27 april 2006.
retrieval en ontsluiting taaltechnologische aanpak voor zoekproblemen
Presentatie Studiemiddag Indexen en Nadere Toegangen Ralph Stuyver, Projectmanager 4 maart 2010.
Voor aanvang college afwisselend slides 1, 2, 3, 4, 5 , 6, 7, 8, 9, heen en terug zien via enter / backspace.
Management van Bibliografische Informatie DOELEN ALGEMEEN: leren zoeken van wetenschappelijke literatuur SPECIFIEK voor dit blok: –literatuur zoeken over.
Implementing Cross-Language Text Retrieval Systems for Large-scale text Collections and the World Wide Web n Mark W. Davis and William C.Ogden n AAAI 1997.
Workshop Informatievaardigheden Propedeuse FHSS Mediatheek TF.
InternettechnologieRik Van de WalleGent, mei Semantic Web Internettechnologie (ITech) Rik Van de Walle academiejaar
College 4, jaar 2, Winter 2009 Inzoomen op Businessmodellen Aangepast programma Deeltijd Jaar 2 Docent Toine Nagel.
Deel XXI 1 Internetapplicaties Internetprogrammeren Capita Selecta.
Overheid heeft Antwoord © Juriconnect 2008 Standaardisatie binnen overheidsinformatie Dick van den Berg Projectleider BWB Overheid heeft Antwoord ©
Repository-demonstratie Waar doen we het allemaal voor?
ONLINE VERBONDEN EN INTELLIGENTE COMPUTERS Semantisch web Tom Schurmans Gunter Fransen Nand Truyen Nele Lieben.
Meer bekendheid via je Website
Bronnenonderzoek PWS-seminar V5 13 juli 2014
PADS4 maakt het eenvoudig om informatie te verspreiden naar een specifiek publiek op de juiste plaats en het juiste moment PADS4 is een professionele oplossing.
OWL toepassing in Semantic Media Wiki
ERIC Zoeken op onderwerp Universiteitsbibliotheek.
Ordenen van gegevens Inleiding informatiesystemen © Sander Cox.
Kennismanagement & Sociale media
Search engines welk instrument voor welke taak eric sieverts Universiteitsbibliotheek Utrecht Instituut voor Media en Informatiemanagement / HvA Eric Sieverts.
Van librije tot digitale bibliotheek: de universiteitsbibliotheek utrecht eric sieverts.
Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- & Informatiemanagement Hogeschool van Amsterdam februari 2007 Toegankelijk zijn of.
Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- & Informatiemanagement Hogeschool van Amsterdam februari 2007 Toegankelijk zijn of.
Zoekstrategie VOGIN najaar 2015 Zoekstrategie. Effectief en efficiënt zoeken Zoekstrategie VOGIN najaar 2015.
Eric sieverts Inhoudelijk Toegankelijk Maken najaar 2015 retrieval en ontsluiting taaltechnologische aanpak voor zoekproblemen of eigenlijk: "vind"-problemen.
1 Waarom COINS en waarom “Redesign the Standard”? Dik Spekkink Clustermanager Proces & IT Wat is.
Hoe positioneer ik mijn uitgeverij 10 do’s en dont’s Windkracht62 1 WINDKRACHT (0) Ian Muller.
Basics SERP = Search Engine Results Page Betaalde resultaten = SEA Natuurlijke resultaten = SEO Search Engine Optimization SEO is een lange termijn verhaal.
EContentplus Chris De Loof Europeana en zijn sattelietprojecten Jubelparkmuseum, Brussel 8 januari 2009 Nationale ATHENA Workshop België.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 De GBIF Integrated Publishing Toolkit Alberto GONZÁLEZ-TALAVÁN Programme Officer for.
Centraal Examen Nederlands
Databank ABI Inform en Proquest
WoordenlijstBeheer Terminologie centraal in de archiefsector
Transcript van de presentatie:

zoeken en ontsluiten in de wereld van Google Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- en Informatie Management (Hogeschool van Amsterdam)

zoeken en ontsluiten in de wereld van Google agenda: zoeken en ontsluiting ontsluiting en metadata metadata en zoeken zoeken en taaltechnologie taaltechnologie en ontsluiting ontsluiting, taxonomieën en ontologieën ontologieën, metadata en semantisch web Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

voor het zoeken naar informatie basis-paradigma voor het zoeken naar informatie zoeker / zoekvraag documenten zoek, zoek, zoek, ...... match Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

klassieke situatie bij ontsluiting zoek, zoek, zoek, ...... match klassieke situatie bij ontsluiting zoeker moet proberen "termen" te bedenken waar onderwerp mee is ontsloten ontsluiting: indexeerder moet correcte termen aan document toekennen in principe perfecte match mogelijk Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

klassieke ontsluiting gebruikersonvriendelijk dat zoeker zelf correcte termen moet ontdekken duur dat indexeerders documenten moeten analyseren om correcte termen te kunnen toekennen en die perfecte match valt in de praktijk vaak ook nog wel tegen Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

match zoeken in de wereld van zoek, zoek, zoek, ...... zoeker tikt maar wat woorden in (en meestal zelfs maar één woord) zoeksysteem bevat alleen de woorden uit de documenten zelf je vindt vaak niet (alles) wat je zoekt - toch tevreden ? Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

zoeken in de wereld van . zoeker mist relevante informatie (recall-probleem) door: afwijkende spelling en woordvormen gebruik van synoniemen en andere talen aanwezigheid specifiekere begrippen .... zoeker vindt niet-relevante informatie (precisie-probleem) door: onvoldoende gespecificeerde vraag ontbrekende / onjuiste verbanden tussen zoektermen woorden die meer betekenissen kunnen hebben Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

waarom toch tevreden gebruikers ? zoeksysteem ziet er zo lekker (simpel) uit zoeker vindt altijd wel wat (in 8 miljard webpagina's) slimme ordening van resultaten, zodat bij meeste vragen voor meerderheid van gebruikers altijd wel iets relevants bij de eerste 10 zit who cares about lousy recall & precision ? Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

wil gebruiker nog iets anders ? zelfs wetenschappelijke bibliotheken moeten hun best doen gebruikers nog iets anders te laten gebruiken dan alleen Google of Google Scholar : dat andere, professionele systemen zeer verantwoorde gecontroleerde ontsluiting bieden, is niet meer genoeg je moet net zo simpel (en kaal?) interface bieden + one-stop shopping + direct de full-text resultaten zelf Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

how about metadata ? iedereen heeft het over metadata: "gegevens over gegevens" zowel inhoudelijke als formele ontsluiting html biedt metatags <meta name="keyword" content="retrieval"> <meta name="creator" content="eric sieverts"> in bibliotheekwereld: "dublin core" als standaardisatie afgesproken Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

dublin core standaard afspraken over gebruik van "Dublin Core" (1997-2003) met 15 "velden" voor formele en inhoudelijke elementen, voortkomend uit, maar ook geadopteerd buiten bibliotheekwereld inhoudelijk (onderwerp) formeel (inhoud) formeel (intellectueel eigendom) formeel (fysieke weergave) title source creator date subject language publisher type description relation contributor format coverage rights identifier intussen nog 3 aanvullingen: audience, provenance, rightsHolder voorbeelden: <META   NAME="DC.Creator"   CONTENT="Eric Sieverts"> <META   NAME="DC.Subject"   CONTENT="metadata"> <META   NAME="DC.Type"   CONTENT="text/html"> Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

dublin core - verfijningen verfijningen van syntax en semantiek van "velden" via qualificaties/subelementen van Dublin Core bij "coverage": specificatie of het plaats- of tijd-aanduiding is <META   NAME="DC.Coverage.Spatial"   CONTENT="Frankrijk"> <META   NAME="DC.Coverage.Temporal"   CONTENT="1914"> bij "relation": specificatie van aard van relatie tussen bij elkaar horende webpagina's (of andere objecten) <META   NAME="DC.Relation.IsPartOf"   CONTENT="......"> <META   NAME="DC.Relation.HasPart"   CONTENT="......"> <META   NAME="DC.Relation.IsVersionOf"   CONTENT="......"> <META   NAME="DC.Relation.HasVersion"   CONTENT="......"> Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

dublin core - inhoud voor semantiek van metadata-inhoud: daarvoor wordt geen standaardisatie opgelegd !! wel gebruikte standaard vermelden (in "scheme"-attribuut) voorbeelden <META NAME="DC.Date" CONTENT="2004-12-31" SCHEME="ISO8601"> <META  NAME="DC.Subject"  CONTENT="567.2"  SCHEME="SISO"> <META  NAME="DC.Subject"  CONTENT="hay fever"  SCHEME="MeSH"> <META  NAME="DC.Language"  CONTENT="nl"  SCHEME="ISO639-1"> <META  NAME="DC.Source"  CONTENT="90-6630-490-1"  SCHEME="ISBN"> Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

metadata & zoekmachines ? zoek, zoek, zoek, ...... match metadata & zoekmachines ? gebruiker kent geen metadata-standaarden google indexeert geen metadata op het vrije web heb je (bijna) niets aan metadata Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

hoezo dan metadata ? eigenlijk alleen voor lokaal of specialistisch gebruik voorbeeld: Open Archive Initiative gebruikt Dublin Core (in XML) om beschrijvingen uit elkaars document-archieven (repositories) te kunnen uitwisselen en (her)gebruiken, zoals in OAIster zoekmachine Dublin Core gaat niet verder dan "veld"-specificaties en -syntax (simpeler dan ISBD, MARC of AACR2) zelfs lokaal vaak nog geen standaardisatie van daarbinnen gebruikt ontsluitingssysteem maar in het semantisch web wil men wel metadata kunnen gebruiken ! ! Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

taaltechnologie bij zoeker zoek, zoek, zoek, ...... match taaltechnologie bij zoeker simpele zoekvraag automatisch geëxpandeerd en gedisambigueerd door ontologie of semantisch netwerk zoeksysteem bevat alleen de woorden uit de documenten zelf door verbeterde zoekvraag een beter antwoord ? Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

taaltechnologie voor betere "query" door "word stemming" en "fuzzy zoeken" automatisch op meer woordvormen gezocht >> betere recall semantisch netwerk (of ontologie) bevat relaties tussen begrippen waardoor inhoudelijk verwante termen aan vraag kunnen worden toegevoegd >> betere recall bij woord met meer betekenissen, bevat semantisch netwerk (of ontologie) verschillende relaties voor verschillende betekenissen >> disambigueren >> betere precisie geleerden zijn het er nog niet over eens hoeveel dit verbetert Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

taaltechnologie bij zoeker zoek, zoek, zoek, ...... match taaltechnologie bij zoeker uit resultaat van simpele zoekvraag gegenereerde specifiekere termen worden zoeker ter keuze voorgelegd zoeksysteem bevat alleen de woorden uit de documenten zelf doordat zoeker vraag verbetert, beter antwoord ? Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

taaltechnologie voor betere "query" door statistische analyse van zoekresultaat, genereert software lijstje mogelijke specifieke(re) zoektermen, waarmee gebruiker naar eigen inzicht zoekvraag kan verfijnen (of anderszins verbeteren) zulke woorden kunnen ook uit woordenlijstje, thesaurus, semantisch netwerk e.d. worden afgeleid meestal >> betere precisie Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

taaltechnologie bij zoeker zoek, zoek, zoek, ...... match taaltechnologie bij zoeker simpele zoekvraag automatisch vertaald naar "correcte" zoektermen documenten ontsloten: er zijn "correcte" termen aan toegekend in principe perfecte match mogelijk Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

zoekvraag vertalen naar juiste term met behulp van semantisch netwerk, user thesaurus, concordantie, e.d., of dialoog-systeem dat gebruiker meer informatie over zijn vraag ontfutselt, of andere taaltechnologie kan systeem de juiste zoektermen vinden bij door gebruiker ingetikte zoekwoorden voorbeeld: Pubmed database op internet Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

taaltechnologie bij document zoek, zoek, zoek, ...... match taaltechnologie bij document zoeken met "correcte" term of browsen naar "juiste" categorie taaltechnologie verrijkt document met "correcte" ontsluitingstermen (thesaurusterm, klasse uit taxonomie) in principe perfecte match mogelijk Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

automatische "verrijking" van documenten met combinaties van linguistische statistische regelgebaseerde technieken kan inhoud van documenten door computer worden geanalyseerd en op basis daarvan worden verrijkt met termen uit thesaurus, of worden ingedeeld in categorie van taxonomie ondanks wat beperkingen gaat dat al steeds beter Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

taaltechnologie aan beide kanten zoek, zoek, zoek, ...... match taaltechnologie aan beide kanten gebruiker tikt maar wat in, maar systeem zoekt toch op "goede" termen computer kan documenten inhoudelijk karakteriseren (metadata toekennen) beter zoekresultaat & lagere kosten ? Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

taaltechnologie aan beide kanten zoek, zoek, zoek, ...... match taaltechnologie aan beide kanten voor veel van die technieken blijft het wel nodig dat een thesaurus / taxonomie / classificatie beschikbaar is en voor het semantisch web geldt dat al evenzeer Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

Resource Description Framework RDF is gespecificeerd voor (vooral) XML-omgeving om in het algemeen betekenis/semantiek aan documenten te kunnen toevoegen XML-tags (gedefinieerd via dtd of schema) kunnen al betekenis geven aan onderdelen van document-inhoud zelf RDF maakt dat je op meer gestandaardiseerde en beter georganiseerde wijze betekenis kunt meegeven, ook los van het document/object zelf met RDF kunnen dan bijvoorbeeld volgens Dublin Core gestructureerde metadata worden toegevoegd Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

Resource Description Framework RDF definieert een infrastructuur om zulke semantiek gestandaardiseerd te definiëren waarbij documenten zelf-verklarend worden zodanig dat computers hun betekenis kunnen afleiden waarbij verwezen wordt naar computerleesbare beschrijvingen van de semantiek en de standaarden die ze gebruiken zodat samenwerking en (her)gebruik van elders ontwikkelde standaarden mogelijk wordt Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

het rdf-model bedoeld voor beschrijven van bronnen (resources / objecten) die identificeerbaar zijn via een uniform resource identifier (URI) middels eigenschappen (property-types / attributen) die een waarde (value) kunnen hebben property-types definiëren relaties tussen values en resources voorbeeld: "Jan is de auteur van document1" (of eigenlijk: "document1 heeft als auteur Jan") of zelfs Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

het rdf-model dat wordt in rdf-syntax dan iets ingewikkelds als: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns="http://www.john.smith.net/rdfexample/"> <rdf:Description rdf:about="http://www.xxx.com/yyy/doc1.xml"> <author> <rdf:Description rdf:about="http://www.xxx.com/autId/7801"> <name>John Smith</name> <affiliation>Home Inc.</affiliation> <email>Smith@home.com</email> </rdf:Description> </author> </rdf:RDF> xml namespace verwijzingen, o.a. naar definitie voor RDF rdf:description wordt gebruikt voor identificatie van de resources (kan ook verwijzen naar html-document) en daarbinnen de elementen Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

het rdf-model dublin core metadata worden in rdf-syntax iets als: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://www.mim.hva.nl/d28/rdf.ppt"> <dc:title>Minicursus RDF</dc:title> <dc:description>In dit document wordt uitgelegd hoe rdf werkt </dc:description> <dc:date>2003-12-08</dc:date> <dc:format>text/ppt</dc:format> <dc:language>nl</dc:language> <dc:publisher>HvA - MIM</dc:publisher> <dc:contributor>Eric Sieverts</dc:contributor> </rdf:Description> </rdf:RDF> Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

waar het bij rdf wezenlijk om draait computerinterpreteerbaar relaties leggen tussen objecten, eigenschappen en waarden computerinterpreteerbaar betekenis toekennen aan die relaties via "namespace"-verwijzingen doorlinken naar plekken op het web waar "systemen" computerinterpreteerbaar gedefinieerd zijn (metadata-standaarden, inhoudelijke ontsluitingssystemen, betekenissen van begrippen daarin, …) gebruik kunnen maken van elders geïnvesteerde moeite, zonder dat zelf nog eens over te hoeven doen en: dat is ook de basis waar het semantisch web op voort wil bouwen Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

ontologieën en semantisch web wat betekenen “ontologieën” eigenlijk ? begrip oorspronkelijk afkomstig uit de filosofie en daarna ook uit de wereld van de kunstmatige intelligentie: in ontologie wordt kennis van (een stukje van) de wereld vastgelegd het dient als "kennis-representatie" wordt in semantisch web-wereld zeer ruim opgevat: in het algemeen aanduiding voor allerlei soorten ontsluitings-systemen wel essentieel: ontologie moet computerleesbaar, -interpreteerbaar en -verwerkbaar beschikbaar zijn (er zijn dus formele beschrijvingstalen voor nodig; men werkt onder meer aan "OWL" - web ontology language) Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

ontologieën en semantisch web voorbeelden van gebruikte ontologieën in kunstdocumentatie-systeem: vanuit één systeem namespace-verwijzingen naar: Art & Architecture Thesaurus (thesaurus) IconClass (beeld-classificatie) WordNet (semantisch netwerk) Union List of Artist Names (authority list) AAT  Wordnet equivalenties (concordantie) Dublin Core voor annotaties (metadata-systeem) uiteindelijk doel: met betere precisie en recall kunnen zoeken naar (afbeeldingen en/of beschrijvingen van) kunstwerken Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

annotating with a concept : term disambiguation

typisch semantisch web voorbeeld: zoeken naar plaatje © Guus Schreiber UvA / VU A person searches for photos of an “orange ape” An image collection of animal photographs contains snapshots of orang-utans. The search engine finds the photos, despite the fact that the words “orange” and “ape” do not appear in annotations Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

semantische annotatie

rdf annotatie van een web-bron © Guus Schreiber UvA / VU Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

de "species ontology" © Guus Schreiber UvA / VU zie: http://www.diffuse.org/Presentations/Schreiber.ppt Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

zoek, zoek, zoek, ...... match ook voor het semantisch web zal dus nog volop moeten worden "ontsloten", maar: met slimme systemen die domme documenten (helpen) ontsluiten en slimme systemen die domme zoekvragen (kunnen) verbeteren zal zelfs een aap goede informatie kunnen vinden Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl