De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

1 Internetzoeken inleidingen en opdrachten Jeroen Bosman VOGIN, voor HVU Utrecht.

Verwante presentaties


Presentatie over: "1 Internetzoeken inleidingen en opdrachten Jeroen Bosman VOGIN, voor HVU Utrecht."— Transcript van de presentatie:

1 1 Internetzoeken inleidingen en opdrachten Jeroen Bosman VOGIN, voor HVU Utrecht

2 2

3 3

4 4 Kenmerken zoekexpert Kennis onderwerp Bronnenkennis Kennis zoektools Talenkennis, taalcreativiteit Logica Zorgvuldig gebruik zoektools Snelheid Reflectie op eigen zoekproces

5 5 Programma 9:30 / welkom, introductie 9:40 / zoeken op het web en bijbehorende tools (1) 10:30 / gevorderde zoekmachine-tactieken (2) 12:00 / lunchpauze 13:00 / mini-workshop: bronnenkennis (4) 13:45 / interactieve bronnen: nieuwsgroepen/discussielijsten (5) 14:10 / current awareness & attenderingen (6) 15:00 / databases op internet: het diepe web (7) 14:40 / bronnen van zoekkennis (8) 15:30 / systematisch zoeken en case studies: (9)

6 6 Inhoud WWW: algemeen Omvang: 11,5 miljard + databases + FTP Weinig wetenschappelijke teksten onafgeschermd Kwaliteit Betrouwbaarheid Actualiteit Kosten/afscherming 1

7 7 Zoeken: benaderingen Aanbieders Bekende pagina’s URL verzinnen Onderwerpsgids Zoekmachines Online vragen stellen 1

8 8 Inhoud WWW: aanbieders Bedrijven Overheid Internationale organisaties Verenigingen, actiegroepen Universiteiten Bibliotheken Uitgevers Particulieren 1

9 9 zoektools: wanneer wat? indien zoekvraag feitelijk, specialistisch, met voorkennis, onder tijdsdruk: zoekmachines indien zoekvraag breed, exploratief, inventariserend, met weinig voorkennis, met relatief veel tijd: onderwerpsgidsen 1

10 10 Onderwerpsgidsen: algemeen + geen zoektermen nodig vaak actueel annotaties weinig ruis - onvolledig dode links voorkeur maker houdt groei niet bij voor homepages 1

11 11 Onderwerpsgidsen: breed internationaal/VS: –Open Directory (in Gigablast extra zoekfuncties hiervoor)Open Directory –YahooYahoo –LooksmartLooksmart Nederlands: –startpagina+dochters en concurrentenstartpaginadochters –startnederland (meta-gids)startnederland 1

12 12 Onderwerpsgidsen: gespecialiseerd Miljoenen Breed wetenschappelijk: Infomine, Internet Scout Zoeken: –via Yahoo (per onderwerp onder ‘webdirectories’) –via Open Directory of Startnederland –via RDN (wetenschappelijk) –via Pinakes (wetenschappelijk) Tijd besteden aan vinden van goede onderwerpsgidsen: –via collegae –via discussielijsten 1

13 13 Zoekmachines: dekking > 15% van de webpagina’s in geen enkele van de grootste zoekmachines Van resterende wel geïindexeerde pagina’s zelfs Google maar 76%, Yahoo 69%, MSN 62% ( ) dekking zeer ongelijkmatig verschil in actualiteit (Google/MSN meest vers volgens studie uit 2003) langzame groei dekking bij subtop: Teoma, Gigablast, Ask(Jeeves) verschil in dekking: Teoma en Wisenut beperkt in Nederland 1

14 14 Zoekmachines: ontwikkeling Webcrawler, Lycos, Alta Vista (10) concurrentie Hotbot, Excite, Yahoo (50) 1997 Northern Light, MSN, sterke groei web > opkomst Google en Alltheweb en crisis Infoseek, Northern Light, AV, Excite, ILSE o.a. (100) 2002 komst Teoma, Wisenut, Gigablast (1000) 2003 renaissance AV, glorietijd Google (3000) 2004 consolidatie/concurrentie (4000) : –Google+Blogger, verbreding: boeken, kritiek, beursgang –Overture+Alltheweb+AV+Yahoo, ontmanteling AV/ATW –Microsoft: introductie MSNsearch beta: zelf indexeren 2005 verbreding/innovatie/content ( ) –Samenwerking content providers-zoekmachines? –Opkomst vijfde grote speler, Amazon met A9? –Doorgroei Gigablast (2000) 1

15 15 A9ATWAVExalead Giga- blastGoogleMSNsearchScirusTeomaWisenutYH Nederlands fietsenstalling poldermodel Terschelling Schylge wad VMBO onderwijs "van de hak op de tak" gemiddelde Engels production Cairo zenith aardvark MI5 submarine "read my lips" gemiddelde Relatieve omvang, maart 2005

16 16 Zoekmachines: wat vind je niet? recente webpagina’s/wijzigingen bij sommige: PDF en andere niet html bestanden tekst onderaan zeer lange documentendynamisch gegenereerde pagina’s informatie in databases pagina’s met no robots file pagina’s met toegangsrestricties verdwenen pagina’s (maar: Google/Gigablast cache en Wayback Machine archive.org) 1

17 17 Zoekmachines: beperkingen Google genest Booleaans zoeken > Yahoo/MSN/Gigablast backlinksindex vrij klein > Yahoo zoeken beperken tot meer dan 1 specifieke site > Gigablast zeer grote pagina’s niet volledig geïndexeerd > Yahoo truncatie > Exalead 1

18 18 opdrachten zoektools 1-o Maak nu de opdrachten bij onderdeel 1

19 19 WWW: bowtie model 2

20 20 vaak gebruikte relevantie criteria  hoe meer van de gevraagde termen, hoe beter  als termen in titel of begin document staan, des te beter  hoe vaker die termen in document herhaald worden, hoe beter  hoe dichter termen bij elkaar en in zelfde volgorde staan, hoe beter  zeldzame term krijgt hoger gewicht dan heel algemene term  termen in opsommingslijst hoger gewicht en: "populaire" pagina's zijn relevanter  aantal backlinks  aantal links op herkomstpagina van backlinks (zorgt voor ‘traagheid’) 2

21 21 domeinen soorten top-level-domains (TLD) –generiek: com / org / net (vrij) int / edu / gov / mil / arpa (beperkt) –landen: nl/be/au/at/de/uk/us (ccTLD’s, 34%) –jump: tv / nu / to / tk –nieuw: biz/info/name/coop/pro/aero generieke ‘subtopleveldomeinen’: co / gob / ac / org etc. (zie 2

22 22 opbouw URL protocol : // servernaam. subdomein. domein. TLD / map / filenaam. extensie http : // www. library. uu. nl / geosource / index. html 2

23 23 URL’s van databasepagina’s /scan?VALUE=geografische+huis&SCAN=TIT bin/advsearch?offset=40&terms=3&type=any&query=utre cht&exec=FAST+Search&lang=any&enco=iso &A1=+&A2=%2B&A3=-&hits=10&nooc=on 2

24 24 recall-killers en precisie-killers bij zoekmachines recall-killers: –verkeerde bron: -> probeer andere –verkeer spelling: -> woordenboeken –woordvarianten gemist: -> trunceren –te smalle zoektermen precisie-killers –niet genoeg termen (bij best-match) –niet genoeg aspecten (bij Booleaans) –geen inhoudelijke relatie: -> phrase/near –homoniemen –lange webpagina’s bevatten alle termen: -> in titelveld zoeken –effect metatags 2

25 25 termen verzinnen voorbeeldzoeken versus generiek zoeken voor opsommingen (zie ook ‘Google sets’) gebruik minimaal 2, liever 3-5 termen gebruik zo mogelijk verwachte zinsneden, denk dan in termen van te vinden document gebruik eventueel termsuggesties van AV, Gigablast, Teoma of clusters van metazoekmachine Vivisimo evt. bekijken index van Google Suggest 2

26 26 opdrachten gevorderde zoekmachinetactieken Maak nu de opdrachten bij onderdeel 2 2-o

27 27 Kenmerken desktop search engines Is een desktop programma Metazoekmachine + zoeken in set gekende databases Kan resultaten ordenen, controleren, ontdubbelen, vastleggen en binnenhalen Is tevens tool voor zoekvraagmanagement (zoekgeschiedenis) Te gebruiken als webattenderingsdienst Gericht op gevorderd particulier gebruik Databasesselectie vaak op VS gericht vb.: Copernic Agent (search history nu ook by Google en Yahoo) 3

28 28 Zoeken: 10 gouden regels Bedenk wie gezochte informatie zou aanbieden en gok URL daarvan Gebruik ‘advanced search’ van intern. zoekmachine en lees ‘help’ Gebruik Google voor vinden van homepages van organisaties, bedrijven etc. Gebruik voor uitputtende zoektochten Google / Yahoo, evt. Teoma Gebruik metazoekmachines (Dogpile, Ixquick, Vivisimo) alleen voor zeer specifieke termen Gebruik i.h.a. algemene onderwerpsgidsen (Yahoo, Open Directory, Looksmart, Startnederland) als u niet in staat bent specifieke termen te verzinnen Gebruik i.h.a. gespecialiseerde onderwerpsgidsen voor onderwerpen waar u regelmatig naar zoekt en alleen voor homepages en pagina's die niet te diep in een site zitten Gebruik 2 of meer termen, zo specifiek mogelijk, zo mogelijk een zinsnede ('phrase’) Gebruik CompletePlanet maar ook onderwerpsgidsen (‘directories’ bij Yahoo-categorieën) om databases te vindenCompletePlanet Gebruik bij te veel resultaat gevorderde opties als beperken met domein, datum, taal, omvang of zoeken op titelwoorden

29 29 Lunchpauze (vervolg 13:00)

30 30 proefondervindelijk en met overleg in subgroepjes uit 40 brede bronnen de tien beste kiezen Aladin All Music Guide Alltheweb Alta Vista Amazon Bartleby BBC Britannica CBS-Statline Columbia Encyclopedia EVD Geassocieerde Persdiensten regionale kranten Geheugen van Nederland Gigablast webzoekmachine+gids Google webzoekmachine Google Groups Google Scholar IMDB Infomine Infoplease Internet Public Library KB Kennisnet Krantenbank Looksmart MSN search OCLC Worldcat Omroep.nl Open Directory Overheid.nl Perinorm Picarta Publist Pubmed Startnederland Swets Teletekst NOS Van Dale GWHN VNG Wettenbank Wikipedia Yahoo gids 4

31 31 Maak nu (2 aan 2) de opdracht bij onderdeel 4 4-o

32 32 klassiek: bronnenkennis encyclopedie bibliografie feitelijke naslag boeken tijdschriften nieuwsbrieven vraag/antwoord 4 online edities: Britannica / ColumbiaBritannicaColumbia e-only: Encarta / Nupedia / WikipediaEncartaNupediaWikipedia onderwerpsgidsen: Yahoo / Looksmart / Open Directory / Infomine / RDN / Geosource / WebECYahooLooksmartOpen Directory InfomineRDNGeosourceWebEC meta: Pinakes / Yahoo webdirectoriesPinakesYahoo webdirectories bibliografische databases: Google Scholar / Findarticles Pubmed / Eric / MLB / ADSABSGoogle Scholar Findarticles PubmedEricMLBADSABS e-almakken: CIA World Factbook / QuidCIA World FactbookQuid integrators: Infoplease / Bartleby / XreferInfopleaseBartlebyXrefer statistische diensten: CBS / UN / OESO / EurostatCBSUNOESO landen/handelsinformatie: EVDEVD bibliotheek(catalogi): Picarta / Library of Congress / meta: KB-gidsPicartaLibrary of CongressKB-gids fulltextboeken: Gutenberg / DBNL / WordthequeGutenbergDBNLWordtheque boekwinkels: Amazon / Bol / ProxisAmazonBolProxis tijdschriftsites: Publist / OCLC Firstsearch / IngentaPublistOCLC FirstsearchIngenta nieuwsbrieven: NewJourNewJour e-bibliofoons: Aladin / Allexperts / Google AnswersAladinAllexpertsGoogle Answers discussielijsten/nieuwsgroepen (5)

33 33 Interactief: discussielijsten werkt via (later ook vaak web-interface) vaak eerst abonneren, verzenden alleen door abonnees vrij sterke communities soms zeer hoge kwaliteit zoeken lijsten: topica, catalist, jiscmail.ac.uk, listserv.surfnet.nl, groups.yahoo 5

34 34 Interactief: nieuwsgroepen heet: usenet, news, forums, groups apart protocol vereist newsreader (kijk bij Tucows of ZDNet) of: lezen via archief bij Google voor specifieke problemen (foutmeldingen) voor laagdrempelige, actuele discussies voor sociaal-cultureel en taal(historisch) onderzoek vluchtig, wilde westen, illegale zaken functies deels overgenomen door vele internetfora a la fok.nl 5

35 35 maak nu de opdrachten bij onderdeel 5 5-o

36 36 bijblijven: current awareness, spionnen & attenderingen nieuwe sites: – nieuwsbrieven met nieuwe sites (Scout report, lii.org, –weblogs –webalerts/trackers (GoogleAlert, Google Web Alerts, Karnak)GoogleAlertGoogle Web AlertsKarnak –offline search engines als Copernic veranderde pagina’s: –page-alerts/spionnen: desktop: C4U / Copernic Tracker / Website Watcher of evt. webdienst: Trackengine, Infominder, ProfusionTrackengineProfusion nieuws: –gespecialiseerde sites bekende media (BBC, CNN) –zoeken in nieuws (Yahoo, Daypop, Google (laatste niet nl)) –Google news alert –page alerts op resultaat nieuwszoekactie –nieuwspagina’s als nu.nl –RSS-nieuwsdiensten 6

37 37

38 38 RSS Rich Site Summary / Really Simple Syndication Voor sites met (on)regelmatig nieuwe actuele inhoud, bv nieuwsbrieven, weblogs Lezen, beheren als ware het Maakt gebruik van xml-structuur Vereist software (reader), bv Feedreader (gratis) of Feeddemon Toevoegen van een ‘feed’: klik bij pagina op oranje xml- logo en voeg van die pagina url toe aan reader Drie nauwverwante formats: rss/atom/rdf Zoeken berichten: Daypop, Feedster, Blogpulse, Technorati Syndicatie gebuert ook op het web (bv. LISfeeds.com) 6

39 39 Maak de opdracht bij onderdeel 6 6-o

40 40 WWW zoekparadox <1995: beperkte zoekmachines : gouden tijd zoekmachines : professionalisering websites 2000 e.v.: sterke groei zoekmachines, maar: diepe web blijft lastig Kortom: hoe beter de organisatie van websites, hoe lastiger inhoud te vinden is, want zit in databases 7

41 41 Zoeken naar databases Bright Planet’s Complete Planet Internets.com via Invisibleweb.net van Gary Price via gewone onderwerpsgidsen of zoekmachines, bijvoorbeeld YahooYahoo 7

42 42 Zoeken in databases via individuele databasetoegang meer dan 1 tegelijk: met behulp van offline search engines: Copernic of Bull’s Eye (evt. Lexibot) meer dan 1 tegelijk: via Intelliseek’s Profusion op het web (beperkt) traditioneel: online hosts (overlap met webdatabases) technologische oplossing: open-url 7

43 43 opdrachten databases Maak nu de opdrachten bij onderdeel 7 7-o

44 44 Bronnen van zoekkennis Searchenginewatch (Sullivan, Sherman) Searchengineshowdown (Notess) Voelspriet (Van Ess) (forum) Zoekprof (Stielstra) Weblogs: Resourceshelf (Price), Researchbuzz (Calishain) Kritische verhalen: Digital Reference Shelf (Jasco) Tutorials (Complete Planet, Science Direct) Literatuur: –The Searcher, Informatie Professional, Online, D-Lib, Freepint –De wetenschappelijke tijdschriften (JiS, WWW, JAL) Eigen tests!!!!!!!! 8

45 45 opdrachten bronnen van zoekkennis Maak nu de opdrachten bij onderdeel 8 8-o

46 46 MiniCases doel: integratie vaardigheden in praktijk en werken onder tijdsdruk keuze uit aangeboden cases, evt. eigen onderwerp 9

47 47 Zoeksystematiek 1.Verkenning 2.Zoekprofiel: –Onderscheiden elementen –Vooraf genereren zoektermen 3.Keuze gids/zoekmachine 4.Daadwerkelijk zoeken Bij zoekmachine eerste smal, dan breed, dan evt weer inzoomen Tweede zoekmachine Eventueel andere typen bronnen (gedrukte literatuur, deskundigen) 5.Expliciete reflectie op zoekproces en zoekresultaat 6.Bij doorlopende interesse evt. web en page alerts instellen 9

48 48 Hulpprogramma’s downloadmanagers (download accelerator) webstrippers viewers (Acrobat Reader) multimedia plug-ins (quicktime, flash, shockwave, etc.) personal search agents (Gossip bv.) searchbots (Copernic, Lexibot) screen capture (bv. jascap of hardcopy) page alerts: Copernic Tracker, C4U, Website Watcher web alerts: Google alert surfhulp: Quickbrowse


Download ppt "1 Internetzoeken inleidingen en opdrachten Jeroen Bosman VOGIN, voor HVU Utrecht."

Verwante presentaties


Ads door Google