1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 20 november 2012 Wageningen.

Slides:



Advertisements
Verwante presentaties
RSI? zoeken naar de in de e-hooiberg >
Advertisements

De catalogus: verrijking door toegevoegde functionaliteit & toegevoegde functionaliteit door verrijking Jeroen Bosman, universiteitsbibliotheek Utrecht.
Onderwerpen Oude situatie Eerste aanpak en problemen
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 18 mei 2011 Wageningen.
7 sep 04 pag. 1 Zoeken op Internet © 2004 Be Value BV Zoeken op Internet Bert Plat.
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Ronde (Sport & Spel) Quiz Night !
7/12/2014 | 1 Bibliotheekinstructie ATW 2013 archeologie2013.
1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 17 november 2008 Wageningen.
© BeSite B.V www.besite.nl Feit: In 2007 is 58% van de organisaties goed vindbaar op internet, terwijl in 2006 slechts 32% goed vindbaar.
Internet als informatiebron
LITERATUUR ONDERZOEK.
Basishandleiding Limo Meer info online via LIMO Help 1.
7/26/2014 | 1 Bibliotheekinstructie CIW 2013 archeologie2013.
Bibliotheekinstructie
7/26/2014 | 1 Bibliotheekinstructie Arctic Studies 2014 archeologie2013.
1 RSS en weblogs zoeken Jeroen Bosman VOGIN, 9 juni 2009 Wageningen.
1 Bijblijven met het web: attenderingen en spionnen Jeroen Bosman VOGIN, 18 november 010 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 mei 2011 Wageningen.
1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 16 november 2010 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 november 2009 Wageningen.
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 23 november 2009 Wageningen.
1 Nieuwe (on)mogelijkheden zoekmachines Jeroen Bosman VOGIN, 4 juni 2009 Wageningen.
1 Bijblijven met het web: attenderingen en spionnen Jeroen Bosman VOGIN, 21 november 2013 Wageningen.
1 realtime & social: blogs & tweets Jeroen Bosman VOGIN, Wageningen, 16 mei 2013.
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 17 november 2011 Wageningen.
1 Weblogs, RSS en tweets zoeken Jeroen Bosman VOGIN, 20 mei 2010 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 november 2010 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 18 mei 2010 Wageningen.
1 RSS, weblogs en tweets zoeken Jeroen Bosman VOGIN, 23 november 2009 Wageningen.
1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 1 november 2006 Wageningen.
1 Keuzes in het zoekproces Jeroen Bosman VOGIN, 7 juni 2006 Wageningen.
Opsporen en beheren onderwijskundige literatuur Literatuurzoeken: aandachtspunten Kritisch lezen Opfrissen ERIC, PsycINFO Web of Science Opfrissen EndNote.
nieuwe toepassingen 2008 Schoolbib 2.0 / VVBAD Mechelen, 5 november 2008 Rosemie Callewaert - Project Manager VCOB.
Workshop Informatievaardigheden
Workshop Informatievaardigheden Propedeuse FHSS Mediatheek TF.
Dia 1 Productencatalogus: Infosessie provinciale en lokale besturen 24/11/11.
Wouter Jansweijer, 16 September, Literatuur zoeken Project informatiewetenschappen october 2002.
1 Bijblijven met het web: attenderingen en spionnen Jeroen Bosman VOGIN, 14 april 2008 Leiden.
1 realtime and social: blogs & tweets, FB & G+ Jeroen Bosman VOGIN, 17 november 2011 Wageningen.
 Website faculteitsbibliotheek  Zoekmachine LIMO: boeken, artikels, eindwerken, tijdschrifttitels, kranten Bibliotheek Sociale Wetenschappen Introductie.
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Politieke Wetenschappen  Website faculteitsbibliotheek  Catalogus LIBISnet: boeken, eindwerken,
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken  Website faculteitsbibliotheek  Catalogus LIBISng: boeken, eindwerken, tijdschriften  Databanken:artikels.
Informatievaardigheden. Niveau 2. Gevorderd. Academiejaar 2010 – 2011 Els Martens & Carl Demeyere.
Google versus Bing Gigantenstrijd.
1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 4 november 2014 Wageningen.
ERIC Zoeken op onderwerp Universiteitsbibliotheek.
realtime & social: blogs & tweets
Informatievaardigheden Ecologie-2 (NCP-20503) september/oktober 2012 Corrie van Zeist, Liza Bruggenkamp, Marco van Veller, Wouter Gerritsma en Ans Brouwer.
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
Informatievaardigheden Corrie van Zeist, Marco van Veller, Ans Brouwer en Wouter Gerritsma September 2009.
Workshop Informatievaardigheden 1 Nathalie van den Eerenbeemt Marjolein de Wilde Zoeken naar goede bronnen.
Inhoud Presentatie 1. Probleemstelling onderzoek 2. Wat is een search engine? 3. Geschiedenis van search engines 4. Hoe werkt een search engine? 5. Welke.
3/23/2015 | 1 Bibliotheekinstructie Klassieken en Oude Geschiedenis.
Informatievaardigheden NCP Ecologie II
Literatuur zoeken. VOORBEREIDING - Wat wil je weten? - Wat is de exacte zoekvraag? - Welke aspecten wil je uitzoeken? - Zet de vraag om in zoektermen.
Informatievaardigheden Corrie van Zeist en Marco van Veller September 2008.
3/30/2015 | 1 Bibliotheekinstructie Nederlands 2014.
Informatievaardigheden Corrie van Zeist September 2007.
Informatievaardigheden Bedrijfs- en Consumentenwetenschappen
Bibliotheek Instructie
1 Bijblijven met het web: attenderingen en spionnen Jeroen Bosman VOGIN, 6 november 2014 Wageningen.
Workshop Informatievaardigheden
Informatievaardigheden Introductie BPE-10806
INFORMATIEVAARDIGHEDEN SAW B.Wydooghe L. Gheysen C. Neckebroeck.
1 realtime & social: blogs & tweets Jeroen Bosman VOGIN, 19 november 2015 Wageningen.
Basics SERP = Search Engine Results Page Betaalde resultaten = SEA Natuurlijke resultaten = SEO Search Engine Optimization SEO is een lange termijn verhaal.
1 Philosopher’s Index Handleiding Philosopher’s Index.
realtime & social: blogs & tweets
Keuzes in het zoekproces en structuur van het web
Transcript van de presentatie:

1 Keuzes in het zoekproces en structuur van het web Jeroen Bosman VOGIN, 20 november 2012 Wageningen

2

3

4 Kenmerken zoekexpert Kennis onderwerp Bronnenkennis Kennis zoektools Talenkennis, taalcreativiteit Logica (“verzamelingenleer”) Zorgvuldig gebruik zoektools Snelheid (m.n. bij selecteren en evalueren) Reflectie op eigen zoekproces (bv met reverse search)

5 Deel I: keuzes in het zoekproces

6 Zoeksystematiek 1.Vraaganalyse Wensen ‘opdrachtgever’ Verkenning Opstellen zoekprofiel: waaraan moet de informatie voldoen, genereren zoektermen 2.Aanbod Keuze ingang(en): zoekmachines, databases, gidsen, bookmarksites 3.Match Daadwerkelijk zoeken (gebruik syntax, optiues en filters) Selecteren (is het relevant?) 4.Nabewerking per relevante bron Evaluatie (is het goed genoeg?) Opslaan, printen, delen Eventueel doorzoeken via auteurs en verwijzingen uit gevonden bronnen 5.Nabewerking zoekactie geheel Bij doorlopende interesse evt. web en page alerts/feeds instellen Expliciete reflectie op zoekproces en zoekresultaat 6.Vervolg op zoekactie Eventueel andere ingangen of geheel andere typen bronnen (gedrukte literatuur, deskundigen)

7 Vraaganalyse 1: wensen opdrachtgever Opdrachtgever: wat wil men met de informatie? Voorwaarden aan aard van informatie (onderzoek, opinie, peer reviewed, actualiteit etc.) Randvoorwaarden: tijd, geld, vertrouwelijkheid Rapportagevorm (inhoudelijk, technisch)

8 Vraaganalyse 2: Verkenning Welke vraag/onderwerp Wat ligt er al, nuttig als uitgangspunt? Inhoudelijk verkennen (via bv Wikipedia of ander naslagwerk of via korte zoekactie) Ideeën opdoen qua context, jargon, zoektermen, typen bronnen, auteurs

9 Vraaganalyse 3: Zoekprofiel Onderscheiden elementen (variabelen) Welke? Allebei even belangrijk? Vooraf genereren zoektermen Uit reeds gevonden bronnen Uit naslagwerken/zoekacties van verkenningsfase Uit woordenboeken, thesauri (Het juiste woord, Roget’s Thesaurus) Afbakening in tijd, ruimte, speciale omstandigheden waaronder een proces moet spelen Relevante typen informatie en publicaties Relevante publicatieperiode

10 Aanbod: Keuze zoekingang Bepaald door zoekprofiel: onderwerp, type informatie, type publicatie, relevante publicatiejaren, disciplinair perspectief Bepaald door beschikbaarheid: toegankelijkheid, kosten, licenties Bepaald door extra wensen: –Zoekmethode: catalogus-, bibliografische, sneeuwbal(citatie)methode (op het web: zoekmachines, gidsen/directories, backlinks) –Zoeken in full-text, links naar full-text Ook letten op volgorde ingangen (dekking, bekendheid, selectiviteit) Zie voor links naar ingangen de ‘startpagina’ bij deze cursusstartpagina

11 Match 1: Zoektermen ingeven Let op woordvarianten en spelling: Varianten in OR-relatie of: Trunceren: alles wat met woordstam begint (alleen Exalead) Automatische “stemming” (enkel-/meervoud enz. bij Google?) Oxford-English of American–English (s/z, ou/o) Samenstellingen in Engels los: kwaliteitscontrole > quality control Denken in termen van het te vinden document (jargon/slang), gebruik zinsnedes / exact phrase met “… …”

12 Match 2: zoektermen ingeven, vv. Gebruik termsuggesties –voor zoekactie: Google, Exalead, Bing, Yahoo –termen uit gevonden goede webpagina’s –hulpmiddelen: thesaurus, synoniemenwoordenb. (startpag.) BingGoogleYahoo

13 Match 3: zoektermen ingeven, vv. Gewicht aanbrengen met zoektermherhaling in Google Voorbeeldzoeken voor ‘lijstjes’ Iteratief proces: één of meer keren snelle beoordeling zoekresultaat en aanpassing termen/instellingen –Aantallen treffers: wel letten op veranderingen, niet op absolute niveau

14 Match 4: Selectie op relevantie Wat voor rangorde hebben de resultaten? De rangorde: beïnvloeden, vertrouwen of alles bekijken? Kijk naar meer dan titels: –bij boeken/artikelen: samenvattingen citaties omvang (bv LexisNexis) –bij web: KWIC domein/organisatie wel/niet PDF omvang (indien gegeven, vooral zinnig bij PDF) preview

15 Nabewerking per bron 1: beoordeling Formeel (vooral bij websites): –Aanduiding maker/auteur (“about us”) –Aanduiding postadres, telefoonnummer –Aanduiding doel/doelgroep –Goede opmaak –Geen reclame en pop-ups –Heldere navigatie –Interne zoekfunctie –Voldoende snelheid server –Backlinks door gezaghebbende organisaties –Up to date? –Zinnige datering inhoud –Geen grof taalgebruik –Geen kinderlijk taalgebruik –Geen storende taalfouten Beoordeling door anderen (vooral bij reguliere publicaties) –Status bron (peer reviewed, uitgever, gezaghebbende instantie) –Affiliatie auteur –Plaats in citatienetwerk (door wie, hoe vaak) Inhoudelijk (vooral bij reguliere publicaties) –Bronvermelding (voldoende, geen kernpublicaties gemist) –Opbouw, argumentatie, methode, verantwoording

16 Nabewerking per bron 2: opslaan (mail, document, Endnote / Refworks / Mendeley / Zotero / Evernote / Diigo e.d. versturen (handmatig, vanuit systeem) bookmark (browser, Connotea, CiteUlike, ‘like’, +) alert/spion RSS-feed

17 Vervolg op zoekactie: Reflectie Hoeveel gevonden in hoeveel tijd? Voldoet oogst aan zoekprofiel? Welke aspecten van zoekprofiel waren meest selectief? Waren alle vooraf bedachte ingangen even nuttig? Wat was de overlap tussen de ingangen? Goede volgorde ingangen gehanteerd? Wat had de zoekvraag moeten zijn om het beste gevonden document direct te vinden (reverse earch) Iets geleerd over eigen sterke/zwakke punten?

18 Deel II: Structuur van het web

19 Er is wel structuur: domeinen soorten top-level-domains (TLD) iso-3166iso-3166 –generiek: com / org / net (vrij) int / edu / gov / mil / arpa (beperkt) –landen: nl/be/au/at/de/uk/us (ccTLD’s, 34%) –jump: tv / nu / to / tk –nieuw: biz/info/name/coop/pro/aero/museum/mobi generieke ‘subtopleveldomeinen’: co / gob / ac / org etc. (zie en ) per 2009 ook URL’s in niet-Latijns schrift

20 opbouw URL protocol : // servernaam. subdomein. domein. TLD / map / filenaam. extensie http : // libguides. library. uu. nl / evalueren

21 URL’s van databasepagina’s 4VT2GSG5VD5VKEI6FMCCN7G75L75LG-04490?func=find- b&find_code=WRD&request=geografische+huis&adjacent =N&x=43&y=11http://aleph.library.uu.nl/F/HDRH5QK8UGC775UMSMU4 4VT2GSG5VD5VKEI6FMCCN7G75L75LG-04490?func=find- b&find_code=WRD&request=geografische+huis&adjacent =N&x=43&y=11 l=nl&rlz=1R2MEDC_nlNL330&num=10&btnG=Google+zoe ken&as_epq=&as_oq=&as_eq=&lr=lang_nl&cr=&as_ft=i& as_filetype=pdf&as_qdr=all&as_occt=any&as_dt=i&as_sit esearch=&as_rights=&safe=images

22 zoektools: wanneer wat? indien zoekvraag feitelijk, specialistisch, met voorkennis, onder tijdsdruk: zoekmachines indien zoekvraag breed, exploratief, inventariserend, met weinig voorkennis, met relatief veel tijd: onderwerpsgidsen, door mensen gemaakte overzichten

23 Onderwerpsgidsen: algemeen + geen zoektermen nodig vaak actueel annotaties weinig ruis - onvolledig dode links voorkeur maker houdt groei niet bij voor homepages

24 Onderwerpsgidsen Alle onderwerpen: Open Directory, Yahoo Nederlands: startpagina, meta: startnederland Breed wetenschappelijk: Infomine Web2.0-variant: Digg (nieuws) Zoeken: –via Yahoo (per onderwerp onder ‘webdirectories’) –via Open Directory –via Pinakes (wetenschappelijk) –vragen aan collegae –vragen via discussielijsten, twitter etc.

25 Zoekmachines: dekking > 15% van de webpagina’s in geen enkele van de grootste zoekmachines van resterende wel geïndexeerde pagina’s zelfs Google maar 76%, Yahoo 69%, Live/Bing 62% ( ) ( ) overlap eerste pagina slechts 10% (Spink studie 2006)Spink studie 2006 dekking zeer ongelijkmatig verschil in actualiteit

26 Zoekmachines: ontwikkeling 1994 Webcrawler, Lycos, Alta Vista (10) 1995 concurrentie Hotbot, Excite, Yahoo (50) 1997 Northern Light, MSN, sterke groei web > opkomst Google en Alltheweb en crisis Infoseek, Northern Light, AV, Excite, ILSE o.a. (100) 2002 komst Teoma, Wisenut, Gigablast (1000) 2003 renaissance AV, glorietijd Google (3000) 2004 consolidatie/concurrentie (4000) : –Google+Blogger, verbreding: boeken, kritiek, beursgang –Overture+Alltheweb+AV+Yahoo, ontmanteling AV/ATW –Microsoft: introductie MSNsearch beta: zelf indexeren 2005 verbreding/innovatie/content ( ) –Samenwerking content providers-zoekmachines? –Teoma wordt Ask en opkomst Amazon met A9 –Doorgroei Gigablast (2000) puur zoeken raakt op achtergrond ( ) –Live gelanceerd, YouTube gekocht –uploaden, web 2.0 –gemengde content (Google universal, iGoogle bv.) –specifieke diensten (Google CSE bv) 2008 Google universal verder ingevoerd (>100000) 2009 Nieuwe zoekmachine van Microsoft: Bing (>400000) 2010 Yahoo stopt eigen index 2010 Instant search en preview bij Google (>800000) 2011 Groei Blekko / Google+ en effect op rest Google 2012 Pinterest / Facebook in search

27 Zoekmachines: wat vind je niet? recente webpagina’s/wijzigingen dynamisch gegenereerde pagina’s informatie in databases pagina’s met no robots file pagina’s met toegangsrestricties verdwenen pagina’s maar: –Cache (bij Google link in preview) –Wayback Machine archive.org

28 Zoekmachines: beperkingen Google genest Booleaans zoeken > Bing/Exalead zeer grote pagina’s soms niet volledig geïndexeerd? > Yahoo + niet bruikbaar voor exact search van 1 woord truncatie en fonetisch zoeken > Exalead? zoekgeschiedenis zonder inloggen: Bing inperken op RSS format > Yahoo webpagina’s met audio: Exalead

29 Land/taalversies Google Interfacetaal –beïnvloedt ook (ranking) resultaat! Taalinstelling zoekactie –voorkeuren eenmalig of ‘implied’ door zoekterm Landsversie: –beïnvloedt ranking sterk –ncr: no country redirect –Let ook bij Bing op landsinstelling: alleen VS versie heeft alle functionaliteit