1 Keuzes in het zoekproces Jeroen Bosman VOGIN, 7 juni 2006 Wageningen.

Slides:



Advertisements
Verwante presentaties
Evaluatie van MS Exchange 2000 en opzetten van een server voor wereldwijde uitwisseling van projectinformatie Bertels David 3ICT1 Stageplaats: Acros Organics.
Advertisements

Inleiding Na het bestuderen van dit hoofdstuk kun je:
RSI? zoeken naar de in de e-hooiberg >
De catalogus: verrijking door toegevoegde functionaliteit & toegevoegde functionaliteit door verrijking Jeroen Bosman, universiteitsbibliotheek Utrecht.
Onderwerpen Oude situatie Eerste aanpak en problemen
7 sep 04 pag. 1 Zoeken op Internet © 2004 Be Value BV Zoeken op Internet Bert Plat.
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Ronde (Sport & Spel) Quiz Night !
Welkom bij de cursus Handig met Internet! Handig met Internet -Wat doet u al met internet? -Wat wilt u nog meer met internet doen? -Hoe kunt u beter.
1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 17 november 2008 Wageningen.
© BeSite B.V www.besite.nl Feit: In 2007 is 58% van de organisaties goed vindbaar op internet, terwijl in 2006 slechts 32% goed vindbaar.
Mediatheek R5. Faciliteiten en dienstverlening (1/2): de collectie Fysieke collectie: boeken en naslagwerken / tijdschriften / AVM / scripties Digitale.
Internet als informatiebron
LITERATUUR ONDERZOEK.
Basishandleiding Limo Meer info online via LIMO Help 1.
Oktober 2004Bedrijvig op het Internet1 Prof. Dr. Geert Poels Ann Maes Frederik Gailly.
Literatuuronderzoek Bachelor scriptie
1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 16 november 2010 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 november 2009 Wageningen.
1 Nieuwe (on)mogelijkheden zoekmachines Jeroen Bosman VOGIN, 4 juni 2009 Wageningen.
1 Bijblijven met het web: attenderingen en spionnen Jeroen Bosman VOGIN, 21 november 2013 Wageningen.
1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 20 november 2012 Wageningen.
1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 1 november 2006 Wageningen.
Internetzoeken inleidingen en opdrachten
Opsporen en beheren onderwijskundige literatuur Literatuurzoeken: aandachtspunten Kritisch lezen Opfrissen ERIC, PsycINFO Web of Science Opfrissen EndNote.
30 juni Deze morgen Vorige bijeenkomst: –een concepthierarchie van kernbegrippen in Logic & Language vakgebied (o.b.v. glossary) Vandaag: –Jon:
PLAYBOY Kalender 2006 Dit is wat mannen boeit!.
nieuwe toepassingen 2008 Schoolbib 2.0 / VVBAD Mechelen, 5 november 2008 Rosemie Callewaert - Project Manager VCOB.
Workshop Informatievaardigheden
Informatievaardigheden Welkom bij de introductie INFORMATIEVAARDIGHEDEN Mediatheek PTH Zoeken, verwerken en beoordelen van relevante informatie
Workshop Informatievaardigheden Propedeuse FHSS Mediatheek TF.
Module 1 Welke soorten informatiebronnen zijn er en hoe ze te gebruiken?
Wouter Jansweijer, 16 September, Literatuur zoeken Project informatiewetenschappen october 2002.
1 Bijblijven met het web: attenderingen en spionnen Jeroen Bosman VOGIN, 14 april 2008 Leiden.
 Website faculteitsbibliotheek  Zoekmachine LIMO: boeken, artikels, eindwerken, tijdschrifttitels, kranten Bibliotheek Sociale Wetenschappen Introductie.
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Communicatiewetenschappen  Website faculteitsbibliotheek  Catalogus LIBISng: boeken, eindwerken,
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Politieke Wetenschappen  Website faculteitsbibliotheek  Catalogus LIBISnet: boeken, eindwerken,
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken  Website faculteitsbibliotheek  Catalogus LIBISng: boeken, eindwerken, tijdschriften  Databanken:artikels.
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken  Website faculteitsbibliotheek  Catalogus LIBISng: boeken, eindwerken, tijdschriften  Databanken:artikels.
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Sociologie / Sociaal Werk   Website faculteitsbibliotheek   Catalogus LIBISnet: boeken,
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Communicatiewetenschappen   Website faculteitsbibliotheek   Catalogus LIBISnet: boeken,
ECHT ONGELOOFLIJK. Lees alle getallen. langzaam en rij voor rij
Informatievaardigheden. Niveau 2. Gevorderd. Academiejaar 2010 – 2011 Els Martens & Carl Demeyere.
De financiële functie: Integrale bedrijfsanalyse©
1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 4 november 2014 Wageningen.
ERIC Zoeken op onderwerp Universiteitsbibliotheek.
Informatievaardigheden Ecologie-2 (NCP-20503) september/oktober 2012 Corrie van Zeist, Liza Bruggenkamp, Marco van Veller, Wouter Gerritsma en Ans Brouwer.
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
Informatievaardigheden
Informatievaardigheden Introductie Biologie YBI_10306
Informatievaardigheden Corrie van Zeist, Marco van Veller, Ans Brouwer en Wouter Gerritsma September 2009.
Workshop Informatievaardigheden 1 Nathalie van den Eerenbeemt Marjolein de Wilde Zoeken naar goede bronnen.
Inhoud Presentatie 1. Probleemstelling onderzoek 2. Wat is een search engine? 3. Geschiedenis van search engines 4. Hoe werkt een search engine? 5. Welke.
3/23/2015 | 1 Bibliotheekinstructie Klassieken en Oude Geschiedenis.
Informatievaardigheden NCP Ecologie II Corrie van Zeist, Marco van Veller, Ans Brouwer en Wouter Gerritsma Bibliotheek Wageningen UR September 2009.
Informatievaardigheden NCP Ecologie II
Informatievaardigheden NCP Ecologie II
Informatievaardigheden Corrie van Zeist en Marco van Veller September 2008.
3/30/2015 | 1 Bibliotheekinstructie Nederlands 2014.
Informatievaardigheden Corrie van Zeist September 2007.
Informatievaardigheden Bedrijfs- en Consumentenwetenschappen
Bibliotheek Instructie
1 XSLT processing & control Datamodellering 2006.
Bibliotheek Wageningen UR Overal dichtbij. Bibliotheek Wageningen UR: Overal dichtbij Hoe kan ik: “off-campus” toegang krijgen tot tijdschriften en databases?
1 Bijblijven met het web: attenderingen en spionnen Jeroen Bosman VOGIN, 6 november 2014 Wageningen.
Informatievaardigheden Introductie BPE-10806
1 Philosopher’s Index Handleiding Philosopher’s Index.
Keuzes in het zoekproces en structuur van het web
Transcript van de presentatie:

1 Keuzes in het zoekproces Jeroen Bosman VOGIN, 7 juni 2006 Wageningen

2

3

4 Kenmerken zoekexpert Kennis onderwerp Bronnenkennis Kennis zoektools Talenkennis, taalcreativiteit Logica Zorgvuldig gebruik zoektools Snelheid Reflectie op eigen zoekproces

5 Zoeksystematiek 1.Vraaganalyse 2.Verkenning 3.Opstellen zoekprofiel: waaraan moet de informatie voldoen 4.Keuze ingang(en): zoekmachines, gidsen, bookmarksites 5.Daadwerkelijk zoeken 6.Nabewerking per relevante bron 7.Eventueel andere ingangen of geheel andere typen bronnen (gedrukte literatuur, deskundigen) 8.Expliciete reflectie op zoekproces en zoekresultaat 9.Bij doorlopende interesse evt. web en page alerts/feeds instellen

6 Vraaganalyse Opdrachtgever: wat wil men met de informatie? Voorwaarden aan aard van informatie (onderzoek, opinie, peer reviewed, actualiteit etc.) Randvoorwaarden: tijd, geld, vertrouwelijkheid Rapportagevorm (inhoudelijk, technisch)

7 Verkenning Welke vraag/onderwerp Wat ligt er al, nuttig als uitgangspunt? Inhoudelijk verkennen (via bv Wikipedia of ander naslagwerk of via korte zoekactie) Ideeën opdoen qua context, jargon, zoektermen, typen bronnen, auteurs

8 Zoekprofiel Onderscheiden elementen (variabelen) Welke? Allebei even belangrijk? Vooraf genereren zoektermen Uit reeds gevonden bronnen Uit naslagwerken/zoekacties van verkenningsfase Uit woordenboeken, thesauri (Het juiste woord, Roget’s Thesaurus) Afbakening in tijd, ruimte, speciale omstandigheden waaronder een proces moet spelen Relevante typen informatie en publicaties Relevante publicatieperiode

9 Keuze zoekingang Bepaald door zoekprofiel: onderwerp, type informatie, type publicatie, relevante publicatiejaren Bepaald door beschikbaarheid: toegankelijkheid, kosten, licenties Bepaald door extra wensen: –Zoekmethode: catalogus-, bibliografische, sneeuwbal(citatie)methode (op het web: zoekmachines, gidsen/directories, backlinks) –Zoeken in full-text, links naar full-text Ook letten op volgorde ingangen (dekking, bekendheid, selectiviteit) Zie ook ‘startpagina’ bij deze cursus

10 Daadwerkelijk zoeken Bij zoekmachine input zoektermen en instellingen, bij gids klikken in hiërarchie of ook zoeken met zoektermen Eén of meer keren snelle beoordeling zoekresultaat en aanpassing termen/instellingen Selectie uit resultaat: waarnaar kijken? Evaluatie gevonden bron: waarop letten?

11 Nabewerking per (relevante) bron opslaan (mail, document, endnote/refworks e.d) versturen (handmatig, vanuit systeem) bookmark (browser, del.icio.us) alert/spion RSS-feed Komt op vierde dag apart aan de orde

12 Reflectie Hoeveel gevonden in hoeveel tijd? Voldoet oogst aan zoekprofiel? Welke aspecten van zoekprofiel waren meest selectief? Waren alle vooraf bedachte ingangen even nuttig? Wat was de overlap tussen de ingangen? Goede volgorde ingangen gehanteerd? Iets geleerd over eigen sterke/zwakke punten?

13 WWW: bowtie model

14 domeinen soorten top-level-domains (TLD) iso-3166iso-3166 –generiek: com / org / net (vrij) int / edu / gov / mil / arpa (beperkt) –landen: nl/be/au/at/de/uk/us (ccTLD’s, 34%) –jump: tv / nu / to / tk –nieuw: biz/info/name/coop/pro/aero generieke ‘subtopleveldomeinen’: co / gob / ac / org etc. (zie bv.

15 opbouw URL protocol : // servernaam. subdomein. domein. TLD / map / filenaam. extensie http : // www. library. uu. nl / geosource / index. html

16 URL’s van databasepagina’s /scan?VALUE=geografische+huis&SCAN= TIT bin/advsearch?offset=40&terms=3&type=any&query= utrecht&exec=FAST+Search&lang=any&enco=iso &A1=+&A2=%2B&A3=-&hits=10&nooc=on

17 Inhoud WWW: algemeen Omvang: 11,5 miljard + databases + FTP Weinig wetenschappelijke teksten onafgeschermd Kwaliteit Betrouwbaarheid Actualiteit Kosten/afscherming

18 Inhoud WWW: aanbieders Bedrijven Overheid Internationale organisaties Verenigingen, actiegroepen Universiteiten Bibliotheken Uitgevers Particulieren

19 zoektools: wanneer wat? indien zoekvraag feitelijk, specialistisch, met voorkennis, onder tijdsdruk: zoekmachines indien zoekvraag breed, exploratief, inventariserend, met weinig voorkennis, met relatief veel tijd: onderwerpsgidsen

20 Onderwerpsgidsen: algemeen + geen zoektermen nodig vaak actueel annotaties weinig ruis - onvolledig dode links voorkeur maker houdt groei niet bij voor homepages

21 Onderwerpsgidsen: breed internationaal/VS: –Open Directory (in Gigablast extra zoekfuncties hiervoor)Open Directory –YahooYahoo –LooksmartLooksmart Nederlands: –startpagina+dochters en concurrentenstartpaginadochters –startnederland (meta-gids)startnederland

22 Onderwerpsgidsen: gespecialiseerd Miljoenen Breed wetenschappelijk: Infomine, Internet Scout Zoeken: –via Yahoo (per onderwerp onder ‘webdirectories’) –via Open Directory of Startnederland –via RDN (wetenschappelijk) –via Pinakes (wetenschappelijk) Tijd besteden aan vinden van goede onderwerpsgidsen: –via collegae –via discussielijsten

23 Zoekmachines: dekking > 15% van de webpagina’s in geen enkele van de grootste zoekmachines Van resterende wel geïndexeerde pagina’s zelfs Google maar 76%, Yahoo 69%, MSN 62% ( size/ ) dekking zeer ongelijkmatig verschil in actualiteit

24 Zoekmachines: ontwikkeling Webcrawler, Lycos, Alta Vista (10) concurrentie Hotbot, Excite, Yahoo (50) 1997 Northern Light, MSN, sterke groei web > opkomst Google en Alltheweb en crisis Infoseek, Northern Light, AV, Excite, ILSE o.a. (100) 2002 komst Teoma, Wisenut, Gigablast (1000) 2003 renaissance AV, glorietijd Google (3000) 2004 consolidatie/concurrentie (4000) : –Google+Blogger, verbreding: boeken, kritiek, beursgang –Overture+Alltheweb+AV+Yahoo, ontmanteling AV/ATW –Microsoft: introductie MSNsearch beta: zelf indexeren 2005 verbreding/innovatie/content ( ) –Samenwerking content providers-zoekmachines? –Opkomst vijfde grote speler, Amazon met A9? –Doorgroei Gigablast (2000) 2006 puur zoeken raakt op achtergrond, uploaden, gemengde content

25 Zoekmachines: wat vind je niet? recente webpagina’s/wijzigingen bij sommige: PDF en andere niet html bestanden dynamisch gegenereerde pagina’s informatie in databases pagina’s met no robots file pagina’s met toegangsrestricties verdwenen pagina’s (maar: cache en Wayback Machine archive.org)

26 Zoekmachines: beperkingen Google genest Booleaans zoeken > Yahoo/MSN/Gigablast backlinksindex vrij klein > Yahoo zeer grote pagina’s niet volledig geïndexeerd > Yahoo truncatie en patroonzoeken > Exalead

27 kwaliteit van de invoer in zoekmachines, termen 1.belang van juiste zoektermen 2.spellingsvarianten en truncatie (alleen nog Exalead, hoewel…) 3.denken in termen van het te vinden document, gebruik zinsnedes 4.gebruik van algemene thesauri (Het juiste woord en Roget's) en evt. gespecialiseerde thesauri bij het zoeken naar alternatieve zoektermen, Word-synoniemen 5.gewicht aanbrengen met zoektermherhaling in Google 6.gebruik van speciale termen (evt slang) om te beperken tot een specifieke context waarin term moet voorkomen 7.gebruik van gesuggereerde termen (o.a. Google Suggest / Gigablast) 8.inschatten effect gebruikte termen op basis van resultaat 9.gevaar effect combineren gespecialiseerde en algemene termen 10. voorbeeldzoeken versus generiek zoeken voor opsommingen

28 Relatieve omvang, april 2006 A9 ExaleadGigablast Google MSNsearch ScirusAskYahoo! Nederlands algemeen fietsenstalling poldermodel Terschelling Schylge wad VMBO onderwijs "van de hak op de tak" gemiddelde Engels/internationaal algemeen production Cairo Coptic zenith aardvark MI5 submarine "read my lips" gemiddelde

29 lunchpauze Vervolg 13:30