thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven en verder: usability / user interfaces economische aspecten logistieke aspecten juridische aspecten Eric Sieverts | | | kikken op clicken ?
onderwerpsontsluiting Eric Sieverts | | | nut van gecontroleerd vocabulaire free-text retrieval problemen met recall: als te weinig digitale tekst (en door ontbreken van standaardisatie als retrieval software zelf te dom is) problemen met precisie: als te weinig digitale tekst OK door standaardisatie / autorisatie, maar toch: problemen met recall: als te weinig trefwoorden (wat bijna altijd geval zal zijn) problemen met precisie: bij specialistisch onderwerp
onderwerpsontsluiting Eric Sieverts | | | nut van gecontroleerd vocabulaire free-text retrieval en wat is de bottomline bij het (niet) vinden op titelwoorden? 48 % WEL gevonden ! of 52% NIET gevonden ! bovendien: zijn we er eigenlijk al uit hoe gebruikers er achter moeten komen op welke woorden ze dan “moeten” zoeken? (werkt Pubmed-oplossing voor ons ook ?)
onderwerpsontsluiting Eric Sieverts | | | weinig digitale tekst veel digitale tekst ook in gevallen waar titel wel "veelzeggend" is: alleen hoofdonderwerp globaal ontsloten indien "table of contents" of goede "samenvatting": alle invalshoeken / onderdelen "diepte-indexering" / "granulariteit" alleen hele boek fragmenten / hoofdstukken “i-Tunisering”
onderwerpsontsluiting alleen "gecontroleerd"? nut van "user generated" ontsluiting (tags, kennisrepresentatie-wiki, …) –niet-gecontroleerd, maar toch beter? –up-to-date-ness –communities of practice –nut: specifiek ↔ algemeen –hoeveel materiaal krijgt die tags? –toch ook vorm van controle?>> Eric Sieverts | | |
tags gebundeld op DDC-ranges
retrieval of ontsluiting free-text retrieval alleen competitief met ontsluiting als er voldoende tekst is in dat geval retrieval veel beter voor recall dan waarschijnlijk ook beter voor precisie, zeker voor specialistische onderwerpen automatische classificatie ook alleen mogelijk als er voldoende tekst is (EN goede thesaurus!) begrip "metadata" oprekken voor TOCs, samenvattingen, flapteksten, user tags… begrip metadata heel wat meer dan “door mensen toegekende inhoudelijke ontsluiting” Eric Sieverts | | |
alleen maar zoeken? Eric Sieverts | | | zoeken ontdekken beoordelen webservices met suggesties zoals Amazon webservices, user generated content, … ook verleiden? hoeveel beoordeeld? “most popular” “long tail”
catalogiseren hoe belangrijk is "titelbeschrijving" nog? alleen nog als hulpmiddel voor vinden (en beoordelen) ? –voor parametric search / faceted search ? kan het voor gewoon materiaal eenvoudiger ? gaat iemand iets met FRBR doen? Eric Sieverts | | |
the experience iedereen denkt dat Google "de maat der dingen" is voor onze gebruikers Eric Sieverts | | |
the experience iedereen denkt dat Google "de maat der dingen" is voor onze gebruikers maar let op: de Google paradox –met Google "kun je alles vinden" –maar: als echt "alles" in Google zit, is het eigenlijk niet meer te vinden wat bedoelde Erik Oltmans dus met "zoiets als Google"? Eric Sieverts | | |