To retrieve or not to retrieve, that's the question retrieval van wetenschappelijke informatie eric sieverts.

Slides:



Advertisements
Verwante presentaties
•Vul in de zoekbox je zoekterm(en) in. Je heeft geen AND of OR functie te gebruiken. De woorden worden vanzelf verbonden met AND in de zoekmotor. •Het.
Advertisements

Business Source Premier (BSP) Zoekresultaten uitbreiden door gebruik van synoniemen Universiteitsbibliotheek verder = klikken.
Juriconnect Informatiemiddag
RSI? zoeken naar de in de e-hooiberg >
De catalogus: verrijking door toegevoegde functionaliteit & toegevoegde functionaliteit door verrijking Jeroen Bosman, universiteitsbibliotheek Utrecht.
Business Source Premier (BSP) Zoekresultaat uitbreiden door gebruik van meerdere EBSCO-databases Universiteitsbibliotheek verder = klikken.
geïntegreerde zoeksystemen
Zoeken in de NAZ Nederlandse Artikelendatabank voor de Zorg (alleen voor abonnees) LEVV, november 2006.
thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.
Management van Bibliografische Informatie (MBI) Module 4 College “Big Picture” Universiteitsbibliotheek UM 2002, 10 juni.
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Presentatie keuze retrieval software Helen Blankers Dennis Boom Barbara Smith Willem Brouwer 4 april 2008 ORAND.
HALLO OPLETTEN : Waarom sql DOEN : Introductie opdracht
Mediatheek R5. Faciliteiten en dienstverlening (1/2): de collectie Fysieke collectie: boeken en naslagwerken / tijdschriften / AVM / scripties Digitale.
LITERATUUR ONDERZOEK.
Introductie electronische bronnen
Basishandleiding Limo Meer info online via LIMO Help 1.
Vakliteratuur opzoeken Lieve Devos. LibriSource+ Nieuw portaal voor toegang tot elektronische bronnen Gemeenschappelijk platform.
Autonomy bij een Universiteitsbibliotheek
zoeken en ontsluiten in de wereld van Google
Eric Sieverts Sector Innovatie & Ontwikkeling Universiteitsbibliotheek Utrecht Instituut voor Media- & Informatie Management Hogeschool van Amsterdam Moderne.
Google Scholar de googlificatie van de wetenschap ? Eric Sieverts
retrieval en ontsluiting taaltechnologische aanpak voor zoekproblemen
Ontsluiten en zoeken kunnen we het nog vinden? Eric Sieverts
longlist RfQ con tent PvE keuze RFI shortlist PoC test
Introductie Digitale Bibliotheek UGent
Oktober 2004Bedrijvig op het Internet1 Prof. Dr. Geert Poels Ann Maes Frederik Gailly.
© Universiteitsbibliotheek Groningen METIS Aanleverloket Metis/Repositories Henk Druiven Henk Ellermann Afdeling Digitale Bibliotheek Vz. Universiteitsbibliotheek/RuG.
Fast and Effective Query Refinement B. Velez, R. Weiss, M.A. Sheldon, D.K. Gifford SIGIR 1997.
Sociological Abstracts Zoekresultaat uitbreiden met meer zoektermen en andere zoekvelden Universiteitsbibliotheek verder = klikken.
MLA Zoekresultaten uitbreiden door gebruik van synoniemen Universiteitsbibliotheek verder = klikken.
Philosopher’s Index Zoekresultaten uitbreiden door te zoeken in meerdere databases tegelijk Klik met muis = verder gaan.
ATLA Religion Database + ATLAS Zoekresultaten uitbreiden door zoeken in meerdere databases Klikken = verder gaan.
retrieval en ontsluiting taaltechnologische aanpak voor zoekproblemen
Indexen en zoekstrategieën Marc Jeurissen Anet Gebruikersdag 15 juni 2011.
Voor aanvang college afwisselend slides 1, 2, 3, 4, 5 , 6, 7, 8, 9, heen en terug zien via enter / backspace.
Management van Bibliografische Informatie DOELEN ALGEMEEN: leren zoeken van wetenschappelijke literatuur SPECIFIEK voor dit blok: –literatuur zoeken over.
30 juni Deze morgen Vorige bijeenkomst: –een concepthierarchie van kernbegrippen in Logic & Language vakgebied (o.b.v. glossary) Vandaag: –Jon:
Implementing Cross-Language Text Retrieval Systems for Large-scale text Collections and the World Wide Web n Mark W. Davis and William C.Ogden n AAAI 1997.
Module 1 Welke soorten informatiebronnen zijn er en hoe ze te gebruiken?
Together, We Can LexisNexis Academic 2009 Chris Vastenhoud.
E-bibliotheken Full text, e-artikels, e-tijdschriften en e-boeken Dag- en weekbladen: Mediargus : Vlaams Mediargus LexisNexis: Internationaal LexisNexis.
Basiscursus SWI Informatie gebruik Informatie retrieval.
Your GateWay to the Finest Academic Research papers in the Netherlands Technische aspecten: de ARNO archive server Thomas Place KUB.
 Website faculteitsbibliotheek  Zoekmachine LIMO: boeken, artikels, eindwerken, tijdschrifttitels, kranten Bibliotheek Sociale Wetenschappen Introductie.
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Politieke Wetenschappen  Website faculteitsbibliotheek  Catalogus LIBISnet: boeken, eindwerken,
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Sociologie / Sociaal Werk   Website faculteitsbibliotheek   Catalogus LIBISnet: boeken,
Business Source Premier (BSP) Zoekresultaten uitbreiden door wijziging van veldnamen Universiteitsbibliotheek verder = klikken.
EhBIB Search Eenvoudig en geavanceerd zoeken Zoekresultaten weergeven.
Hogeschool PXL – Elfde Liniestraat 24 – B-3500 Hasselt Wegwijs met LexisNexis Academic Handleiding voor het gebruik van.
ERIC Zoeken op onderwerp Universiteitsbibliotheek.
Informatievaardigheden Ecologie-2 (NCP-20503) september/oktober 2012 Corrie van Zeist, Liza Bruggenkamp, Marco van Veller, Wouter Gerritsma en Ans Brouwer.
Portal Solution. IVS Portal solution 100 % developed by IVS Created in Microsoft.Net environment Based on SQL back-end server Single Sign-on to multiple.
Informatievaardigheden Bedrijfs- en Consumentenwetenschappen
Catalogus van de UvA Zoekresultaten uitbreiden Universiteitsbibliotheek verder = klikken.
Sociological Abstracts Zoekresultaat uitbreiden met meer zoektermen en andere zoekvelden Universiteitsbibliotheek verder = klikken.
LLBA Zoekresultaat uitbreiden met synoniemen Universiteitsbibliotheek verder = klikken.
ERIC Zoekresultaten uitbreiden Verder = klikken. Een zoekresultaat uitbreiden kan op verschillende manieren Gebruik meer zoektermen:  Synoniemen of verwante.
Informatievaardigheden Introductie BPE-10806
Kurt De Belder, MA, MLIS Hoofd sector Elektronische Diensten Universiteitsbibliotheek Universiteit van Amsterdam Geïntegreerde toegang tot catalogi kunstbibliotheken.
Search engines welk instrument voor welke taak eric sieverts Universiteitsbibliotheek Utrecht Instituut voor Media en Informatiemanagement / HvA Eric Sieverts.
Van librije tot digitale bibliotheek: de universiteitsbibliotheek utrecht eric sieverts.
Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- & Informatiemanagement Hogeschool van Amsterdam februari 2007 Toegankelijk zijn of.
OnderZOEK Informatiebronnen Strategieën September 2011 Nathalie van den Eerenbeemt.
Eric sieverts Inhoudelijk Toegankelijk Maken najaar 2015 retrieval en ontsluiting taaltechnologische aanpak voor zoekproblemen of eigenlijk: "vind"-problemen.
EContentplus Chris De Loof Europeana en zijn sattelietprojecten Jubelparkmuseum, Brussel 8 januari 2009 Nationale ATHENA Workshop België.
1 Philosopher’s Index Handleiding Philosopher’s Index.
Voor bibliotheken. Training AquaBrowser Zoetermeer, 20 mei 2010.
_________________________________ Handleiding
Surfen op het internet Basisbegrippen
Transcript van de presentatie:

to retrieve or not to retrieve, that's the question retrieval van wetenschappelijke informatie eric sieverts

wat er gebeurt in retrieval-land nieuwe technieken klassieke technieken wat wel en niet wordt toegepast de problematiek van grote bibliotheken oplossingen? to retrieve or not to retrieve, that's the question Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002

wat er gebeurt in retrieval-land Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 dankzij het web is information retrieval in beweging veel van de nieuwe ontwikkelingen zijn practische toepassing van oude ideeën vooral gericht op niet-gestructureerde informatie, zoals web-pagina’s en tekstdocumenten meer gericht op betere precisie dan op betere recall, omdat Google uit 2,5 miljard moet kunnen selecteren deel van “onze” gebruikers hecht ook wel degelijk aan recall

toegepaste technieken  betere precisie Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 probabilistische of andere techniek voor relevantie-ordening hoe meer van gevraagde termen hoe beter (op web: alle termen) belang van termen in document (term-positie - in de titel, vooraan, in koppen / relatieve termfrequentie - tf  idf) gewenste term-relatie (term-afstand en -volgorde) probabilistische termgewichten (zeldzame termen belangrijker) populariteit=kwaliteit van document (aantal hyperlink verwijzingen, gebruiks-/bezoek-frequentie)

toegepaste technieken  betere precisie Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 probabilistische of andere techniek voor relevantie-ordening hoe meer van gevraagde termen hoe beter (op web: alle termen) belang van termen in document (term-positie - in titel, vooraan, in koppen - / relatieve termfrequentie - tf  idf) gewenste term-relatie (term-afstand en -volgorde) probabilistische termgewichten (zeldzame termen belangrijker) populariteit=kwaliteit van document (aantal hyperlink verwijzingen, gebruiks-/bezoek-frequentie) wel goed bij Google, maar misschien niet zo goed toepasbaar voor wetenschappelijke artikelen ?

toegepaste technieken  betere precisie Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 probabilistische of andere techniek voor relevantie-ordening statistiek / kennisregels voor preciseren en/of disambigueren al verkregen zoekresultaat clusteren in betekenissen / contexten uit al verkregen zoekresultaat afleiden van suggesties voor termen om te preciseren / in te perken

custom search folders

toegepaste technieken  betere precisie Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 probabilistische of andere techniek voor relevantie-ordening statistiek / kennisregels voor preciseren en/of disambigueren semantische kennis (koppeling aan semantisch netwerk) voor onderscheiden van betekenissen (disambigueren) woorden in omgeving van term in document matchen met nabije termen in semantisch netwerk

toegepaste technieken  betere precisie Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 probabilistische of andere techniek voor relevantie-ordening statistiek / kennisregels voor preciseren en/of disambigueren semantische kennis (koppeling aan semantisch netwerk) voor onderscheiden van betekenissen (disambigueren) relevance feedback: verder zoeken op basis van als relevant aangemerkte resultaten (nu of later) verder zoeken op woorden of “patronen” uit aangevinkte resultaten uit voorgaande vraag (ook : query-by-example / more-like-this)

toegepaste technieken  betere precisie Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 probabilistische of andere techniek voor relevantie-ordening statistiek / kennisregels voor preciseren en/of disambigueren semantische kennis (koppeling aan semantisch netwerk) voor onderscheiden van betekenissen (disambigueren) relevance feedback: verder zoeken op basis van als relevant aangemerkte resultaten relevance feedback: aanpassen van term-probabilistiek woorden uit relevante documenten krijgen hoger gewicht bij berekening van relevantie-volgordes

toegepaste technieken  betere precisie Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 probabilistische of andere techniek voor relevantie-ordening statistiek / kennisregels voor preciseren en/of disambigueren semantische kennis (koppeling aan semantisch netwerk) voor onderscheiden van betekenissen (disambigueren) relevance feedback: verder zoeken op basis van als relevant aangemerkte resultaten relevance feedback: aanpassen van term-probabilistiek opgebouwde gebruikersprofielen relevance feedback, monitoren zoekgedrag, ingebracht interesseprofiel but how about privacy ?

toegepaste technieken  betere recall Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 (morfologische) stemming van woorden in document en in query: computer, computers, computing, computation, …  comput community, communism, communication, ……….  commun ??

toegepaste technieken  betere recall Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 (morfologische) stemming van woorden fuzzy zoeken morfologie  morphologie duivendak  duijvendak, duitenzak,... kok  kop, kak, …

toegepaste technieken  betere recall Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 (morfologische) stemming van woorden fuzzy zoeken zoekvraag uitbreiden met synoniemen / verwante termen ontleend aan semantisch netwerk (of aan thesaurus, of aan ontologie?)

visualisatie van “wordnet”

toegepaste technieken  betere recall Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 (morfologische) stemming van woorden fuzzy zoeken zoekvraag uitbreiden met synoniemen / verwante termen ontleend aan vocabulair zoekvraag uitbreiden met synoniemen / verwante termen afgeleid uit documenten in zoekresultaat statistische analyse van kenmerkende termen uit documenten in eerder zoekresultaat eventueel ook via relevance feedback - alleen uit als relevant gemarkeerde documenten

toegepaste technieken  betere recall Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 (morfologische) stemming van woorden fuzzy zoeken zoekvraag uitbreiden met synoniemen / verwante termen ontleend aan vocabulair zoekvraag uitbreiden met synoniemen / verwante termen afgeleid uit documenten in zoekresultaat suggesties voor (meer) correcte spelling van zoekterm

klassieke technieken Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 gebruik maken van structuur van documenten klassiek: velden, nieuw: xml-elementen, nieuw: kenmerkende paragrafen uit full-text document (doelstelling, methode, conclusies) gebruik van classificaties en thesauri o.a. voor recall-verbetering door o.a. generiek zoeken

wat wel en niet wordt toegepast Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 waar wat bibliografische databases full-text artikelen het web nieuwevrijwel nietbeperktvrij veel klassiekevaak welbeperktvrijwel niet

de problematiek van grote bibliotheken Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 voor gebruikers te veel afzonderlijke bronnen te doorzoeken in Utrecht bijna 200 databases

de problematiek van grote bibliotheken Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 voor gebruikers te veel afzonderlijke bronnen te doorzoeken in Utrecht bijna 200 databases in Utrecht bijna 6000 digitale tijdschriften

de problematiek van grote bibliotheken Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 voor gebruikers te veel afzonderlijke bronnen te doorzoeken in Utrecht bijna 200 databases in Utrecht bijna 6000 digitale tijdschriften bijna alle bronnen met eigen zoekinterface en functionaliteit

de problematiek van grote bibliotheken Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 voor gebruikers te veel afzonderlijke bronnen te doorzoeken in Utrecht bijna 200 databases in Utrecht bijna 6000 digitale tijdschriften bijna alle bronnen met eigen zoekinterface en functionaliteit veel interfaces met uitgebreide / complexe functionaliteit (is dat wel allemaal ergonomisch verantwoord?)

huidige oplossingen voor grote bibliotheken Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 geïntegreerde toegang via uniform eenvoudig interface (one-stop-shopping) centrale index -eigen keuze geavanceerde zoek- machine / retrieval software -vaak nog probleem met indexeren van extern opgeslagen data -problemen met niet-uniforme gecontroleerde ontsluiting meta-search / portal -extern en lokaal beschikbare retrieval systemen bevraagd met enkele query (via Z39.50, http,...) -geen geavanceerde retrieval; beperkt tot grootste gemene deler van klassieke booleaanse functies -problemen met niet-uniformiteit van zoekvelden en gecontroleerde ontsluiting

indexer internet document text files central index search integrated system: local central index solution indexing- rules for targets full-text links document text files

muscat / verity / autonomy /... internet document text files central index search integrated system: local central index solution indexing- rules for targets full-text links document text files

huidige oplossingen voor grote bibliotheken Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 geïntegreerde toegang via uniform eenvoudig interface centrale index -eigen keuze geavanceerde zoek- machine / retrieval software -vaak nog probleem met indexeren van extern opgeslagen data -problemen met niet-uniforme gecontroleerde ontsluiting meta-search / portal -extern en lokaal beschikbare retrieval systemen bevraagd met enkele query (via Z39.50, http,...) -geen geavanceerde retrieval; beperkt tot grootste gemene deler van klassieke booleaanse functies -problemen met niet-uniformiteit van zoekvelden en gecontroleerde ontsluiting

internet search integrated system: metasearch / portal solution index files search query-generator / result-collector index search index search index Z39.50 internal api httphttp xml Z39.50http configuration data for targets search files

internet search integrated system: metasearch / portal solution index files search metalib / iPort / zPortal / muse /... index search index search index Z39.50 internal api httphttp xml Z39.50http configuration data for targets search files

huidige oplossingen voor grote bibliotheken Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 geïntegreerde toegang via uniform eenvoudig interface centrale index -eigen keuze geavanceerde zoek- machine / retrieval software -vaak nog probleem met indexeren van extern opgeslagen data -problemen met niet-uniforme gecontroleerde ontsluiting meta-search / portal -extern en lokaal beschikbare retrieval systemen bevraagd met enkele query (via Z39.50, http,...) -geen geavanceerde retrieval; beperkt tot grootste gemene deler van klassieke booleaanse functies -problemen met niet-uniformiteit van zoekvelden en gecontroleerde ontsluiting

oplossingen voor grote bibliotheken Eric Sieverts - Universiteitsbibliotheek Utrecht / Hogeschool van Amsterdam | Workshop zoeken & vinden | 15 oktober 2002 geïntegreerde toegang (one-stop-shopping principe) via uniform eenvoudig interface (als "Google") met geavanceerde retrieval-techniek met behoud van gebruik van gecontroleerde ontsluiting wel al soms wel nauwelijks vrijwel niet