Search engines welk instrument voor welke taak eric sieverts Universiteitsbibliotheek Utrecht Instituut voor Media en Informatiemanagement / HvA Eric Sieverts.

Slides:



Advertisements
Verwante presentaties
Ebook Library – Eenvoudig zoeken. In deze demo EBL Eenvoudig zoeken: •Snel zoeken •Browsen op categorie of onderwerp •Volledige tekst doorzoeken NB: EBL.
Advertisements

WorldCat Local – Eenvoudig zoeken. In deze demo Eenvoudig zoeken: •Zoeken naar titels •De sortering van de resultaten aanpassen •De beschikbaarheid van.
Communicatie & Presentatie
Mensenhandelweb De database met alle informatie over kinder- en mensenhandel.
Effectief zoeken en verwerken van digitale informatie
geïntegreerde zoeksystemen
thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
To retrieve or not to retrieve, that's the question retrieval van wetenschappelijke informatie eric sieverts.
Welkom bij de cursus Handig met Internet! Handig met Internet -Wat doet u al met internet? -Wat wilt u nog meer met internet doen? -Hoe kunt u beter.
OpMaat Combineren van zoektermen Universiteitsbibliotheek verder = klikken.
Q-KENNIS Een kennis-systeem is veelal gebaseerd op het ontsluiten van aanwezige kennis en ter faciliterering van de ontwikkeling van nieuwe kennis. Het.
LITERATUUR ONDERZOEK.
Vakliteratuur opzoeken Lieve Devos. LibriSource+ Nieuw portaal voor toegang tot elektronische bronnen Gemeenschappelijk platform.
Autonomy bij een Universiteitsbibliotheek
zoeken en ontsluiten in de wereld van Google
Eric Sieverts Sector Innovatie & Ontwikkeling Universiteitsbibliotheek Utrecht Instituut voor Media- & Informatie Management Hogeschool van Amsterdam Moderne.
Google Scholar de googlificatie van de wetenschap ? Eric Sieverts
retrieval en ontsluiting taaltechnologische aanpak voor zoekproblemen
Ontsluiten en zoeken kunnen we het nog vinden? Eric Sieverts
Fast and Effective Query Refinement B. Velez, R. Weiss, M.A. Sheldon, D.K. Gifford SIGIR 1997.
Sociological Abstracts Zoekresultaat uitbreiden met meer zoektermen en andere zoekvelden Universiteitsbibliotheek verder = klikken.
ATLA Religion Database + ATLAS Zoeken naar en in ATLAS full-text artikelen Klikken = verder gaan.
ATLA Religion Database + ATLAS Bijbelhoofdstuk als onderwerp (eenvoudige zoekactie) Klikken = verder gaan.
ERIC Combineren van zoektermen met Booleaanse operatoren
ERIC Zoekresultaat uitbreiden door te zoeken in meer databases.
Philosopher’s Index Zoekresultaten uitbreiden door te zoeken in meerdere databases tegelijk Klik met muis = verder gaan.
ATLA Religion Database + ATLAS Zoekresultaten uitbreiden door zoeken in meerdere databases Klikken = verder gaan.
Trefwoorden overbodig? De gebruiker aan het woord Annemieke Jurgens InfoManagement 27 april 2006.
retrieval en ontsluiting taaltechnologische aanpak voor zoekproblemen
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 november 2010 Wageningen.
Voor aanvang college afwisselend slides 1, 2, 3, 4, 5 , 6, 7, 8, 9, heen en terug zien via enter / backspace.
30 juni Deze morgen Vorige bijeenkomst: –een concepthierarchie van kernbegrippen in Logic & Language vakgebied (o.b.v. glossary) Vandaag: –Jon:
The relevance of recall and precision in user evaluation Louise T. Su Journal of the American Society of Information Science 1994.
Implementing Cross-Language Text Retrieval Systems for Large-scale text Collections and the World Wide Web n Mark W. Davis and William C.Ogden n AAAI 1997.
Module 1 Welke soorten informatiebronnen zijn er en hoe ze te gebruiken?
Klik ergens op het witte deel van deze pagina om verder te gaan
1 Datastructuren Een informele inleiding tot Skiplists Onderwerp 13.
Aan de slag met weblogs Pierre Gorissen 14 juni 2005.
MET DANK AAN COLLEGA’S IN DEN LANDE ! vee 2012
ONLINE VERBONDEN EN INTELLIGENTE COMPUTERS Semantisch web Tom Schurmans Gunter Fransen Nand Truyen Nele Lieben.
Business Source Premier (BSP) Zoekresultaten uitbreiden door wijziging van veldnamen Universiteitsbibliotheek verder = klikken.
Hoe krijg ik volk op mijn site? Keywords Titles Descriptions.
Informatievaardigheden Ecologie-2 (NCP-20503) september/oktober 2012 Corrie van Zeist, Liza Bruggenkamp, Marco van Veller, Wouter Gerritsma en Ans Brouwer.
Het opbouwen van een data base
1.Klik in het hoofdvenster van Lync op het tabblad Chatruimten. 2.Typ in het zoekvak de naam van een ruimte of een of meer trefwoorden. De overeenkomende.
Inhoud Presentatie 1. Probleemstelling onderzoek 2. Wat is een search engine? 3. Geschiedenis van search engines 4. Hoe werkt een search engine? 5. Welke.
ATLA Religion Database + ATLAS Bijbelhoofdstuk als onderwerp (gecompliceerde zoekactie) Klikken = verder gaan.
Opmaat Jurisprudentie Sdu Zoeken op onderwerp: Zoekresultaten uitbreiden Universiteitsbibliotheek verder = klikken.
Informatievaardigheden Bedrijfs- en Consumentenwetenschappen
Catalogus van de UvA Zoekresultaten uitbreiden Universiteitsbibliotheek verder = klikken.
LLBA Zoekresultaat uitbreiden met synoniemen Universiteitsbibliotheek verder = klikken.
ERIC Zoekresultaten uitbreiden Verder = klikken. Een zoekresultaat uitbreiden kan op verschillende manieren Gebruik meer zoektermen:  Synoniemen of verwante.
Van librije tot digitale bibliotheek: de universiteitsbibliotheek utrecht eric sieverts.
Jongeren en informatieverwerking. Informatie en de ‘generatie Einstein ‘ Een hardnekkige misvatting: Jongeren zijn voldoende ict-vaardig want ze zijn.
Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- & Informatiemanagement Hogeschool van Amsterdam februari 2007 Toegankelijk zijn of.
Eric sieverts Inhoudelijk Toegankelijk Maken najaar 2015 retrieval en ontsluiting taaltechnologische aanpak voor zoekproblemen of eigenlijk: "vind"-problemen.
Wat is een goede onderzoeksvraag?
De informatiespecialist en het WWW Jos van Helvoort (IDM) voor Bibliotheek HHS.
Basics SERP = Search Engine Results Page Betaalde resultaten = SEA Natuurlijke resultaten = SEO Search Engine Optimization SEO is een lange termijn verhaal.
SEO Kateryna Glushak en Saartje Van Broeckhoven. Wat?  Search Engine Optimization  Zoekmachineoptimalisatie  Techniek om website hoger te laten scoren.
Centraal Examen Nederlands
Voor bibliotheken. Training AquaBrowser Zoetermeer, 20 mei 2010.
Surfen op het internet Basisbegrippen
Beginnen met SEO SEO webinar Alon Bromet & Robbert Kleijwegt
Bronnen en onderzoeksvragen
Nieuw Beter zoeken met Kenniswijzer.
LinkedIn Wat moet ik ermee?.
Wie zoekt, die vindt…!!! Workshop Zoekvaardigheden Profielwerkstuk MAVO Mediatheek De Nassau.
Transcript van de presentatie:

search engines welk instrument voor welke taak eric sieverts Universiteitsbibliotheek Utrecht Instituut voor Media en Informatiemanagement / HvA Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

information retrieval retrieval is een commodity geworden als dat al in elk systeem zit, is het dan nog wel interessant ? JA ! want iedereen heeft ermee te maken want de vraag is niet meer OF, maar HOE en die hoe-vraag blijft interessant Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

information retrieval kwaliteit en extra functionaliteit wordt steeds belangrijker –op het web –in intranets maar dat zijn wel heel verschillende omgevingen Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

wat is waar belangrijk ? web 1.relevantie/precisie (probleem van de grote hoeveelheid) 2.wat is er nieuw ? 3.volledigheid (die éne) intranet 1.volledigheid (alle relevante informatie) 2.wat is er nieuw ? 3.relevantie/precisie (het is al beperkt domein) Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

wat is waar belangrijk ? Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001) web search tools richten zich vooral DAAR op web 1.relevantie/precisie (probleem van de grote hoeveelheid) 2.wat is er nieuw ? 3.volledigheid (die éne)

wat is waar belangrijk ? Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001) maar wat DAAR goed werkt, hoeft DAAR nog niet goed te werken intranet 1.volledigheid (alle relevante informatie) 2.wat is er nieuw ? 3.relevantie/precisie (het is al beperkt domein) web 1.relevantie/precisie (probleem van de grote hoeveelheid) 2.wat is er nieuw ? 3.volledigheid (die éne)

zoekmachines op het web web is uitstekende proeftuin, want daar is gratis onuitputtelijke hoeveelheid informatie beschikbaar maar: niet alles wat daar is ontwikkeld blijft daar ook beschikbaar het veelsoortige materiaal op het web is niet representatief voor elke collectie informatie Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

de algemene zoek-problemen te lage recall:  je mist te veel te lage precisie / te lage relevantie:  te veel niet relevante gevonden  ondanks relevance ranking zijn de eerste niet relevant genoeg Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

recall-killers fouten in zoektermen (spelling) verkeerde zoektermen andere mogelijke vormen van zelfde woord veel mogelijke synoniemen te veel zoekelementen gecombineerd Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

precisie-/relevantie-killers te weinig zoekelementen gecombineerd ongewenst syntactisch verband tussen de elementen zoektermen met meer betekenissen gebruikte zoekterm niet specifiek genoeg full-text bevat veel betekenisloze woorden Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

taaltechnologie ter verbetering betere relevance ranking technieken semantische kennis toevoegen zoekresultaat in "domeinen” laten indelen terugkoppeling van zoekersoordeel Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

relevance ranking kan een computer beoordelen of de ene hit relevanter is dan de andere ? nee, maar je kan wel proberen factoren te bedenken die daar “waarschijnlijk” mee samenhangen (en waarmee de computer kan rekenen) Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

relevance ranking factoren 1.meer van de gevraagde termen in een document 2.gevraagde termen in titel of begin van document 3.gevraagde termen komen in document herhaald voor 4.gevraagde termen staan in document dicht bij elkaar 5.termen in document staan in zelfde volgorde als in de vraag 6.zeldzame termen krijgen zwaarder gewicht dan algemene 7.hoeveelheid hyperlinks die naar document verwijst 8.hoe vaak een document wordt "bezocht" google bewijst dat dat goed werkt Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

1.meer van de gevraagde termen in een document 2.gevraagde termen in titel of begin van document 3.gevraagde termen komen in document herhaald voor 4.gevraagde termen staan in document dicht bij elkaar 5.termen staan in document in zelfde volgorde als in de vraag 6.zeldzame termen krijgen zwaarder gewicht dan algemene 7.hoeveelheid hyperlinks die naar document verwijst 8.hoe vaak een document wordt "bezocht" relevance ranking factoren Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001) allemaal gericht op hogere relevantie voor "de eerste tien", dus op precisie

semantische kennis in semantisch netwerk worden verbanden gelegd tussen inhoudelijk verwante woorden (in één of meer talen) omgeving van woord in het netwerk kan betekenissen onderscheiden (in document en in query) omgeving van woord in het netwerk kan termen leveren om query te expanderen Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001) voorbeeld: retrievalware van excalibur

visualisatie van wordnet

bepaalde gewenste betekenissen van zoekterm geselecteerd

semantische kennis in semantisch netwerk worden verbanden gelegd tussen inhoudelijk verwante woorden (in één of meer talen) omgeving van woord in het netwerk kan betekenissen onderscheiden (in document en in query) omgeving van woord in het netwerk kan termen leveren om query te expanderen Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001) verbeteren van precisie verbeteren van recall

automatisch clusteren/classificeren op grond van kennisregels (en bestaande taxonomie) –NorthernLight “custom search folders” –SmartLogik's MuscatStructure software –Verity filters/topics op grond van statistiek of patronen –AltaVista (3 jaar geleden) –Teoma –Autonomy Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

custom search folders

toekenning document aan taxonomy-term gebaseerd op rules base, zoals bij producten van Verity of Smartlogik

op grond van kennisregels (en bestaande taxonomie) –NorthernLight “custom search folders” –SmartLogik's MuscatStructure software –Verity filters/topics op grond van statistiek of patronen –AltaVista (3 jaar geleden) –Teoma –Autonomy Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001) automatisch clusteren/classificeren

op grond van kennisregels (en bestaande taxonomie) –NorthernLight “custom search folders” –SmartLogik's MuscatStructure software –Verity filters/topics op grond van statistiek of patronen –AltaVista (3 jaar geleden) –Teoma –Autonomy verbeteren van precisie automatisch clusteren/classificeren Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

terugkoppeling gebruiker klikt bij relevante hit op “more like this” computer zoekt op grond van daarin aanwezige termen of patronen naar daarop lijkende documenten bijv.:Webtop zoekmachine Autonomy Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

max havelaar keurmerk producten max havelaar - het boek more like this

terugkoppeling gebruiker klikt bij relevante hit op “more like this” computer zoekt op grond van daarin aanwezige termen of patronen naar daarop lijkende documenten bijv.:Webtop zoekmachine Autonomy Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001) verbeteren van precisie

terugkoppeling gebruiker markeert relevante hits computer haalt karakteristieke (andere) termen uit die documenten (statistiek)  gebruiker kiest daaruit termen om de zoekactie uit te breiden / in te perken bijv.: SmartLogik MuscatDiscovery software Scirus database van Elsevier Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

terugkoppeling gebruiker markeert relevante hits computer haalt karakteristieke (andere) termen uit die documenten (statistiek)  gebruiker kiest daaruit termen om de zoekactie uit te breiden / in te perken Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001) verbeteren van precisie en soms recall

terugkoppeling gebruiker markeert relevante hits zoektermen of patronen die in die documenten voorkomen krijgen hoger gewicht  bij toekomstige zoekacties krijgen documenten met die termen of patronen een hogere berekende relevantie bijv.: - SmartLogik MuscatDiscovery software - Autonomy Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

terugkoppeling Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001) gebruiker markeert relevante hits zoektermen of patronen die in die documenten voorkomen krijgen hoger gewicht  bij toekomstige zoekacties krijgen documenten met die termen of patronen een hogere berekende relevantie bijv.: - SmartLogik MuscatDiscovery software - Autonomy verbeteren van precisie

agents hulpprogramma’s om zonder begeleiding informatie voor je te zoeken (bijvoorbeeld voor automatische attendering) maar pas op voor de hype: het “filtert” maar dat is meestal gewoon retrieval je moet zelf opgeven waarin de agent moet zoeken of waar hij heen moet gaan wel prima voor attendering uit vaste bronnen gebruiken vaak al goede terugkoppeltechnieken Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

retrieval of taxonomie al gaat retrieval steeds beter, toch zijn er veel situaties waar bladeren door onderwerps- indelingen - taxonomieën - toch nog handiger is op web: Yahoo, Open Directory ook vaak te groot, te veel takken, moeilijk consistent te houden, te veel links per rubriek in intranet: beperkt domein, afgestemd op eigen organisatie eerder genoemde clustertechnieken te gebruiken Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)

conclusie ? / vragen ? Eric Sieverts (MIM-HvA/UBU) Retrieval Day (1/11/2001)