De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

1 “resources” en hun zoeksystemen op internet Eric Sieverts BZK, 16 oktober 2012, Den Haag GO Opleidingen.

Verwante presentaties


Presentatie over: "1 “resources” en hun zoeksystemen op internet Eric Sieverts BZK, 16 oktober 2012, Den Haag GO Opleidingen."— Transcript van de presentatie:

1 1 “resources” en hun zoeksystemen op internet Eric Sieverts BZK, 16 oktober 2012, Den Haag GO Opleidingen

2 2 doelstelling / leerdoelen leerdoelen van deze cursus: U bent in staat de voor uw onderzoek meest geschikte bronnen te selecteren U kunt daarbij toe te passen zoeksystemen optimaal gebruiken. U kunt anderen adviseren bij de keuze van informatiebronnen en het zoeken daarin

3 gedachtenbepaling vooraf wat is een bron? is Google een bron? is het web een bron? NEE (althans voor deze cursus) Google is een zoekingang op heel veel bronnen het web is een medium waarop heel veel soorten bronnen beschikbaar zijn

4 gedachtenbepaling vooraf uitgangspunt voor de cursus: een bron is een collectie van een bepaald soort informatie die online beschikbaar is, waarbij de soort bepaald kan zijn door de vorm (krantenartikelen, blogs, video's, plaatjes,...), en/of door de inhoud (medische informatie, nieuws, wetenschap,...)

5 gedachtenbepaling vooraf om "bronnen" te kunnen raadplegen maken we gebruik van zoeksystemen of zoekingangen. in die zin is Bing een zoekingang op een veelheid aan bronnen. in die zin is IceRocket een zoekingang op weblogs. in die zin is een zoekingang op wetenschappelijke bronnen.

6 6 bekend verondersteld verschil tussen soorten diensten op internet typerende aanbieders op internet domeinenstructuur en url-opbouw verschillende soorten zoekstrategieën en -doelen verschil/toepassing gidsen versus zoekmachines werking en geavanceerde opties van zoekmachines betekenis van recall en precision betekenis diepe/onzichtbare web wijze van ranking zoekmachines, werking PageRank startpagina voor zoekhulpmiddelen

7 7 soorten informatiebronnen naar aard van informatie –wetenschappelijke informatie –naslagwerken –nieuwsberichten –krantenartikelen –(digitale) boeken –... naar “medium” –webpagina’s –pdf’s –images –videos –weblogs –rss-feeds –tweets –... ander onderscheid: primair - secundair - tertiair –KNMI - weer-startpagina - StartNederlandKNMIweer-startpaginaStartNederland doorzoekbaarheid –alleen metadata - full-text

8 8 soorten informatiebronnen niet al zulke combinaties zijn zinvol/mogelijk web-pagina pdf image video weblog tweet rss-feed wetenschap naslag nieuws kranten eBooks...

9 9 informatiebronnen en hun zoekingangen (de zoektools) kun je alles (ook) met Google vinden? welke Googles (en Bing’s) zijn er allemaal? (image-, blog-, video-, news-, book-, scholar-, groups-search, maar meeste ook geïntegreerd in gewone Google) kun je met die Googles alles vinden? welke alternatieven zijn er voor die Googles? –(zie bijv. Browsys Advanced Finder ) [voor sommige zoektools werkt direct zoeken niet goed meer] –alternatieven voor het diepe (en betaalde) web

10 10 1.boeken & (wetenschappelijke) artikelen boeken –Google BooksGoogle Books –Hathitrust Digital Library (open book scan project)Hathitrust Digital Library –Amazon (ook reviews, inhoud, boek-boek citaties)Amazon –Worldcat (catalogus van bibliotheken met postcode-functie)Worldcat –Librarything (catalogus van boeken van bezitters)Librarything –GoodReads (reviews, recommandatie, vrienden,...)GoodReads –PicartaPicarta –Bibliotheek.nlBibliotheek.nl –DOAB (directory of open access books)DOAB –Open Textbook Catalog (open access leerboeken)Open Textbook Catalog –enz. artikelen (e.d.) enz.

11 11 1.boeken & (wetenschappelijke) artikelen (2) boeken artikelen (e.d.) –Google Scholar (artikelen, rapporten, proefschriften,...)Google Scholar –Omega / sEURch / UvA-library (zoeksystemen van UU / EUR / UvA)OmegasEURchUvA-library –Scirus / SciVerse (artikelen van Elsevier, uit databases, webpagina’s)ScirusSciVerse –OAIster / Scientific Commons (uit academische repositories)OAIsterScientific Commons –NARCIS ( proefschriften, publicaties [veel artikelen] uit NL)NARCIS –DOAJ (artikelen in Open Access tijdschriften)DOAJ –CORE (artikelen in Open Access tijdschriften)CORE –Magportal (ook -Engelstalige- publiekstijdschriften)Magportal –DeepDyve (wetenschappelijke artikelen "te huur")DeepDyve –enz. enz.

12 12 1.boeken & (wetenschappelijke) artikelen (3) boeken artikelen (e.d.) vakspecifiek zoeken (gratis zoekingangen; vaak alleen de metadata) –geneeskunde: PubmedPubmed –economie: RepEcRepEc –computerkunde, informatica: CiteSeerCiteSeer –onderwijs: ERICERIC –(hoge energie-) fysica: SPIRES-HEPSPIRES-HEP –bibliotheekwetenschap: LISTALISTA –filosofie: International Philosophical BibliographyInternational Philosophical Bibliography –transport: TRISTRIS enz.

13 13 boeken: Google Books Van kaft tot kaft gescand (en doorzoekbaar!) Sterk voor ontdekken van niet-hoofdinhoud van boeken Vaak beperkt doorbladerbaar (no preview / snippet view / limited preview / full preview) Content via uitgevers en via grote bibliotheken Probleem met copyrighted materiaal uit bibliotheken Vergeleken met Amazon search inside: meer oud, minder recent Ook ‘My Library’ optie vbvb NL-boeken niet alleen uit Gent (en binnenkort KB), ook uit US/UK Nu ook enkele ‘magazines’ Metadata op about-this-book-pagina Bibliotheken linken vanuit catalogus (bijv. Picarta)

14 14 wetenschap: Google Scholar > 100 miljoen wetenschappelijke publicaties verschil full record en aanwezigheid als ‘citation’ verschil full-text links en bibliografische links concurrent van Web of Science, Scopus, Picarta, Scirus, OAIster, DOAJ, Ingenta, gericht geïndexeerd in vele bronnen (uitgevers, abstract-databases, universiteiten, repositories,...) met citaties! aantallen citaties mede gebruikt voor ranking (waardoor recente publicaties relatief laag scoren).... >>

15 15 wetenschap: Google Scholar.... advanced search beperkt, nog veel fouten door computer-generated metadata van zoekresultaat naar volledige tekst vaak een probleem (niet aanwezig, alleen tegen betaling) soms veel versies van artikel (waaronder wel gratis) koppeling aan bibliotheekbezit, Google Scholar library programme voegt links naar eigen bezit toe geen info over bronnen, updates Maak nu de opdrachten van onderdeel 1

16 16 2.feiten & naslag encyclopedieën e.d. –wikipedia>wikipedia –overzicht in Yahoo DirectoryYahoo Directory –overzicht in Open DirectoryOpen Directory –internet movie databaseinternet movie database vragen & antwoorden –QuoraQuora –Yahoo-answersYahoo-answers –FAQs: internet FAQ consortiuminternet FAQ consortium zoekmachine voor naslagwerkpagina’s + berekening –Wolfram AlphaWolfram Alpha woordenboeken, vertaaldiensten e.d. enz.

17 17 in >250 talen>250 talen levert “wisdom of the crowds” altijd “wisdom”? goed voor “feitelijke” onderwerpen veel detailonderwerpen (20 miljoen lemma’s, 1 miljoen NL) soms nuttig om relevante eigen publicaties / boeken uit eigen collectie als referenties aan lemma toe te voegen toch wel beleid & beheer: stewards, administratorsbeleidstewardsadministrators Qwika: wikipedia metasearch (1158 wiki's in 12 talen, incl. computer-vertaling)Qwika wikipedia

18 18 2.feiten & naslag (2) encyclopedieën e.d. vragen & antwoorden zoekmachine voor naslagwerkpagina’s + berekening woordenboeken, vertaaldiensten e.d. –answers.com (voert een metasearch uit)answers.com –Roget thesaurusRoget thesaurus –AcronymfinderAcronymfinder –BartlebyBartleby –Google Translate(d search)>Google Translate(d search) –Mijn Woordenboek synoniemenMijn Woordenboek synoniemen –Synoniemen.netSynoniemen.net –overzicht in Open DirectoryOpen Directory –overzicht in Open Directory NederlandsOpen Directory Nederlands enz.

19 19 vertaalt Nederlandse zoekvraag in aangevinkte taal/talen en vertaalt daarmee gevonden resultaten weer terug naar het Nederlands

20 20

21 21 Maak nu de opdrachten van onderdeel 2

22 22 3.nieuws, kranten, tijdschriften Google News Yahoo News BBC, CNN e.d.BBCCNN nu.nl € LexisNexis, € FactivaLexisNexisFactiva krantensites (overzicht: startnederland.nl)startnederland.nl tijdschriftensites (overzicht: startnederland.nl)startnederland.nl Newslink-magazines.... [weblogs & tweets: zie 5 en 6] [video/tv-nieuws: zie 7]

23 23 gespecialiseerd: Google News Engelstalig nieuws uit 4500 bronnen + aparte versies in andere talen dan Engels: –chinees(1000 bronnen) –duits(700 bronnen) –frans(500 bronnen) –hebreeuws(100 bronnen) –italiaans(250 bronnen) –japans(600 bronnen) –koreaans(550 bronnen) –nederlands(>400 bronnen) –portugees(200 bronnen) –spaans(700 bronnen) –enz. Maak nu de opdrachten van onderdeel 3

24 24 4.archief & oud nieuws web archive (oude versies van websites, terug tot 1996, ingang via -oude- url) historische nederlandse kranten (versnipperd aanbod) –historische kranten KBhistorische kranten KB –landelijke krantendatabank (ook papieren collecties)landelijke krantendatabank –Los: Groene Amsterdammer (>1877), Leeuwarder Courant (>1752)Groene AmsterdammerLeeuwarder Courant € LexisNexisLexisNexis ‘echte archieven’ via Archieven.orgArchieven.org Maak nu de opdrachten van onderdeel 4

25 25 5.blogs & rss-feeds Google blogsearch Icerocket Technorati (Exalead >> achteraf inperken op blogs )Exalead –denk aan verschil tussen ingang op individuele berichten en ingang op blogs of feeds als geheel –wie citeert wie? (google blogsearch)google blogsearch –filtermogelijkheid op “autoriteit” ?=? belang, kwaliteit,.... –filter op termen binnen je feedreader –blogs of onderwerp volgen met blogsalert? –#hashtags

26 26 5.blogs & rss-feeds zoeken naar RSS feeds (meer dan alleen blogs) –CTRLQ: –RSS Searchhub: –overzicht (op "makeuseof")overzicht  voor vinden van feeds van bepaalde bron / website  voor vinden van feed waarin bepaald onderwerp Maak nu de opdrachten van onderdeel 5

27 27 6.tweets en social search (1) Twitter in 140 tekens –vaak met verkorte links –vaak met foto- of video-link –vaak met hashtags (#afgesprokentrefwoord) zoeken (vaak beperkt tot berichten uit laatste 1 à 2 weken) –twitter (ook advanced search)twitteradvanced search –tweetzi, topsy, kurrently, postpost, …tweetzitopsykurrentlypostpost –snapbird (hele tijdlijn van 1 tweep)snapbird –tweetscan (op beperkte schaal wel oudere berichten)tweetscan –twicsy (foto's op twitter),...twicsy –bing - social (ook Facebook)bing - social overzicht/vergelijking tools: All the easiest ways to search old tweetsAll the easiest ways to search old tweets

28 28 6.tweets en social search (2) veel hulptools –twubs (bijv. bij congres) :twubs volg in real-time alles met bepaalde hashtag en voeg die tag automatisch toe aan eigen berichten –whathashtag : welke hashtags meest toegekend bij zoekterm?whathashtag –... Twitter als continue informatiebron: –volg de "juiste" personen die interessante nieuwtjes, rapporten, artikelen via Twitter delen links uit tweets automatisch bewaren als social bookmarks –met delicious zelf (tabblad sources)delicious –via packrati.us >> delicious, pinboard, diigo,...packrati.us

29 29 6.tweets en social search (3) “Real time / social search engines” –socialsearcher, socialmention, samepoint, whostalkin, …socialsearchersocialmentionsamepointwhostalkin (tweets + blogs + facebook + …) –Google personal results / Google+ ("search plus your world") –real-time foto’s: skylinesskylines Forumdiscussies –omgili, boardtracker,...omgiliboardtracker –Google groups (ook oude nieuwgroep-discussies)Google groups voor methoden van onderzoek: –adviezen van Henk van Ess in "de digitale detective" (2012)"de digitale detective" –How to: use social media in newsgathering (2012)How to: use social media in newsgathering –100+ Social Media Monitoring Tools (2010)100+ Social Media Monitoring Tools Maak nu de opdrachten van onderdeel 6

30 30 7.multimedia images –Google-image (simpele beeldherkenning; ook foto’s uit Picasa)Google-image –Yahoo-image (ook veel foto’s uit Flickr)Yahoo-image –Bing-imageBing-image –Exalead-imageExalead-image (veel verschillen in zoekresultaten door verschillen in “tekstzoekvelden”) –Flickr (zoekt vooral op tags; ondersteunt “Creative Commons” )Flickr andere uploadsites: Pbase, Smugsmug, Photobucket, Zoom, Zenfolio –Google (search by image), Tineye (zoekt exacte copieën),GoogleTineye TiltomoTiltomo, Retrievr (voorbeeldzoeken met beeldherkenning op Flickr)Retrievr –speciale sites (beeldbank nationaal archief, wikimedia commons,...)beeldbank nationaal archiefwikimedia commons –geografisch (panoramio [google-maps], worldc.am [instagram],...)panoramioworldc.am video audio

31 31 7.multimedia (2) images video –YouTube (uploads - groei: 70 uur/minuut, ook advanced search)YouTube Youtube Edu channel –Blinkx (omroepen - 35 miljoen uur video, spraakherkenning?)Blinkx –VoxaleadNews (met spraakherkenning - in meer talen - ook NL)VoxaleadNews –Google-video (ook video’s uit YouTube; zoekt alleen in metadata)Google-video –Bing-videoBing-video –ScienceCinema (met spraakherkenning!ScienceCinema vooral energie-gerelateerde onderwerpen) –TV-uitzendingen: Uitzending gemist, Beeld & Geluid, Academia audio –VoxaleadNews (met spraakherkenning - in meer talen - ook NL)VoxaleadNews Maak nu de opdrachten van onderdeel 7

32 32 8.gespecialiseerde versus algemene zoekingangen gespecialiseerde: selectief & vaak “dieper” dan algemene zoekmachine –interne zoekfunctie van individuele site –kant en klare onderwerpsgerichte zoekingangen Scirus (wetenschap algemeen)Scirus Findlaw (rechten USA)Findlaw WebMD / Medscape (geneeskunde)WebMDMedscape Google-finance (financiële gegevens + nieuws)Google-finance..... –homemade met: Google CSE, Blekko (slashtags)Google CSEBlekko (zie: )http://www.searchengineshowdown.com/cse/ zelf selecteren welke sites (url’s) in zoekmachine moeten worden meegenomen

33 33 ingangen op diepe web toegang tot het diepe web –“handmatig” (elke database afzonderlijk doorzoeken) overzicht "Complete planet" bij BrightPlanetComplete planet voor "wetenschap" al eerder verzamelzoeksystemen genoemdeerder –“halfautomatisch” (doorzocht via desktop metasearch engine) copernic-agent (metasearch vanaf eigen PC)copernic-agent –“automatisch” (gegevens uit bepaalde database/bron zitten ook al -allemaal?- in algemene zoekmachines) bijv. catalogus UB Wageningen Maak nu de opdrachten van onderdeel 7

34 34 9.zoeken met webzoekmachines > 15% van webpagina’s in geen van grote zoekmachines van resterende wel geïndexeerde pagina’s zelfs Google maar 76%, Yahoo 69%, MSN 62% (2005) geen betrouwbare recentere cijfers mijn inschatting: Google nu iets kleiner dan Yahoo ? Google nu iets groter dan Bing ? maar nu: Yahoo==Bing ! Google nu ~10x zo groot als kleinere dekking zeer ongelijkmatig verschil in actualiteit verschil in dekking  verschil in ranking (vaak zeer weinig overlap bij eerste 10)

35 35

36 36 rangorde: google's pagerank pagerank van pagina x is: PR(x) = (1-d) + d*  {PR(y  x) / C(y)} y elke "pagina y" die naar pagina x linkt draagt bij aan die som  PR(y  x) = pagerank van pagina y die naar x linkt [link vanuit pagina die zelf hoge pagerank heeft, draagt meer bij] C(y) = aantal links in pagina y [link vanuit pagina die erg veel links bevat, draagt minder bij] d = "dempingsfactor" (ong. 0.85) waardoor:0.15  PR(x)  

37 37 rangorde: extra factoren pagerank is pas van belang als zoekwoord-gerelateerde (inhoudelijke) factoren weinig bepalend zijn, zoals: pagina relevanter als zoekwoord in titel pagina relevanter als zoekwoord in URL pagina relevanter als zoekwoord in koppen pagina relevanter als zoekwoord meer in begin van tekst pagina relevanter als zoekwoord daarin vaker wordt herhaald pagina relevanter als zoekwoorden daarin dicht bij elkaar pagina relevanter als zoekwoorden daarin in zelfde volgorde zeldzaam zoekwoord is belangrijker dan heel algemeen pagina relevanter als zoekwoord ook vaak in verwijzende link-tekst pagina relevanter als hij "lijkt" op eerder bekeken pagina's voor specifieke informatie over Google, zie bijv.:

38 38 andere algemene webzoekmachines probeer naast Google eens:Google Bing (microsoft, groot)Bing Yahoo! (content=Bing, groot)Yahoo! Exalead (frans, tamelijk klein, veel geavanceerde functies)Exalead Gigablast ("groene" zoekmachine, tamelijk klein, paar unieke functies)Gigablast Blekko ("hashtags" om [domein-]selectiever te kunnen zoeken)Blekko DuckDuckGo (verzekert privacy, geen personalisatie, tamelijk klein)DuckDuckGo Ask (tamelijk klein, weinig unieks meer)Ask in US hebben die samen nog 30% marktaandeel; in NL maar 3%

39 39 aantallen bij webzoekmachines gemelde resultaataantallen zijn vaak zeer onbetrouwbaar bij Google (en andere) zijn vermelde aantallen niet stabiel, onbetrouwbaar, met soms onverklaarbare effecten –inperken geeft soms groter aantal, uitbreiden kleiner aantal –afhankelijk van verdeling index over servers Google –afhankelijk van Google versie / ingelogd zijn / zoekgeschiedenis –afhankelijk van keuze “your part of the world” bij Bing Danny Sullivan legt uit waarom Google niet kan tellen: Why Google Can’t Count Results Properly

40 40 omgaan met zoektermen belang van "juiste" zoektermen: denk in termen van het te vinden document (wat zou in relevant document staan?) –spellingvarianten, enkel-meervoud-werkwoord (zelf bedenken of automatisch - Google) –truncatie (alleen Exalead) –alternatieve zoektermen / synoniemen: soms automatisch bij Google te vinden met "thesauri" / synoniemenlijsten (mijnwoordenboek, synoniemen.net, Roget's, answers.com, Bartleby)mijnwoordenboeksynoniemen.netRoget's answers.comBartleby te vinden via synoniemen uit Word-tekstverwerker te vinden door te kijken in wat al is gevonden –....

41 41 omgaan met zoektermen denk in termen van het te vinden document (hoe zou het in relevant document staan?) –.... –"exact phrase"  losse woorden –woordnabijheid: met term-wildcard ( * ) bij Google & Yahoo "veiligheid * * tunnels" met NEAR bij Yahoo, Bing, Exalead veiligheid NEAR tunnels met AROUND(n) bij Google veiligheid AROUND(4) tunnels –eventueel een phrase van losse woorden (zonder "") ! invloed van volgorde van losse woorden op ranking (zie: Thumbshots – Ranking)Thumbshots – Ranking –....

42 42

43 43 omgaan met zoektermen denk in termen van het te vinden document (hoe zou het in relevant document staan?) –.... –voor opsomming: generiek zoeken vs. voorbeeld zoeken ( overzicht amerikaanse presidenten vs. clinton, johnson, reagan, obama, lincoln,... ) –gebruik context-specifieke zoektermen (event. slang, jargon) om te beperken tot specifieke context waarin onderwerp moet voorkomen (populair  wetenschappelijk ; volwassenentaal  jeugdtaal) –gewicht specifieke term verhogen door herhaling (Google) –....

44 44 omgaan met zoektermen belang van "juiste" zoektermen: –gebruik van gesuggereerde termen vooraf: Google, Bing, Yahoo, Exalead achteraf inperken: Ask, Exalead, Gigablast, Scirus

45 45 zoektermen Booleaans combineren bijzonderheden van Booleaans bij Google & Yahoo: je mag de AND's weglaten hier gaat -als enige systemen- OR voor AND je hoeft dus geen haakjes te gebruiken je moet i.p.v. "NOT" per losse term - (min)teken gebruiken voorbeelden: architectuur OR bouwkunst nederland OR holland -molens -windmolens i.p.v. (architectuur OR bouwkunst) AND (nederland OR holland) NOT (molens OR windmolens) "moderne OR hedendaagse bouwkunst" i.p.v. "moderne bouwkunst" OR "hedendaagse bouwkunst" wat helemaal NIET kan bij Google/Yahoo: (bouwkunst AND nederland) OR (architecture AND netherlands)

46 46 zoektermen Booleaans combineren maar Booleaans bij Bing je moet WEL haakjes gebruiken bij OR je mag ook NOT gebruiken dus wel: (architectuur OR bouwkunst) AND (nederland OR holland) NOT (molens OR windmolens) of (architectuur OR bouwkunst) (nederland OR holland) NOT (molens OR windmolens) maar weer geen: "moderne OR hedendaagse bouwkunst" dat moet voluit: "moderne bouwkunst" OR "hedendaagse bouwkunst"

47 47 Booleaanse bouwsteencombinatie Maak nu de opdrachten van onderdeel 8A bouwsteencombinaties met AND's en OR's (veilig OR veiligheid) AND lange AND (tunnels OR autotunnels OR verkeerstunnels) stapsgewijze opbouwen bij Google zoek op termen voor eerste bouwsteen: veilig OR veiligheid als Google-instant "aan" staat, zie je meteen al het resultaat (zonder op [search] te hoeven klikken) tik gewoon door met termen voor tweede bouwsteen; lange je ziet meteen weer het resultaat tik door met termen voor derde concept: tunnels OR autotunnels OR verkeerstunnels enz. resultaat: (veilig OR veiligheid) AND lange AND (tunnels OR autotunnels OR verkeerstunnels)

48 48 zoektermen: Google denkt voor ons Google probeert de zoekvraag te verbeteren / verbreden automatische spellingcorrecties (veilgheid >> veiligheid) zoekt op woorden met dezelfde woordstam (enkel-/meervoud, werkwoordsvormen, vervoegingen, verbuigingen) afkortingen (jfk >> john f kennedy | wwii >> world war II) voegt synoniemen van woorden toe (vaccination >> immunization) bij losse zoekwoorden ook samengestelde term en omgekeerd (veiligheid maatregel >> veiligheidsmaatregel | catfood >> cat food) maakt soms een term optional als die niet discriminerend genoeg is dit alles wat vaker en uitgebreider in Engels dan in Nederlands personaliseert zoekactie op basis van eerder zoek/browse-gedrag en als je dat nou niet wilt >> "verbatim"

49 49

50 50 vorige maand nieuw geïntroduceerde optie verbatim == "woordelijk" op google.nl: "woord voor woord"

51 51

52 52 exact zoeken en bijzondere tekens woordstam-zoeken voorkomen met ".." ( "greenhouses" greenhouse effect ) ook (automatisch) op synoniemen zoeken met een ~ ( ~term [Google] ; maar pas op voor precisie-problemen ! ) op sommige leestekens kun je sinds kort zoeken (&, %,..) (maar niet op allemaal - €, /, ", komma,... ) getallen werken net als woorden, maar: –komma wordt gelezen als spatie, net als andere leestekens (12,93  12 93, maar 100,000 wel  ) –punt kan wel (12.93  12.93) getallen zoeken in range ( of $10..$20, uniek voor Google)

53 53 velden, formele kenmerken beperking op formele vereisten : taal, datum, domein, land/werelddeel, bestandstype, media veldspecifiek zoeken (titel, url, links) : wanneer wel / niet? zoeken via backlinks (koppelingen naar …) : link:url, maar pas op: Google geeft beperkt resultaat alternatief: opensiteexplorer.org (gratis versie: 3x per dag...)opensiteexplorer.org domein (site) : meervoudig sitefilter (bij Gigablast of Google- syntax kennen) met Google-syntax kan in eenvoudig zoekscherm vaak meer dan in voorgeprogrammeerde “advanced search” bijv. filetype:rss / site:microsoft.com OR site:google.com selectie vooraf vs. achteraf inperken via "more search tools" op datum zoeken.... >>

54 54 formele kenmerken, datum op datum beperken : = meestal datum van -recentste- indexering door zoekmachine (niet werkelijke datum van publicatie) Google advanced search biedt Google minder opties dan in linkermenu: hour / past 24 hours / week / month / year / custom bij Google resultaat achteraf inperken op periode:  "more search tools" - "custom range" - "from:.. to:.." bij Exalead (vooraf inperken - exacte voor/na datum) hoe datum van publicatie van gevonden pagina te controleren als niet op webpagina zelf? soms werkt: javascript:alert(document.lastModified)javascript:alert(document.lastModified) maar helaas steeds vaker niet meer …. Maak nu de opdrachten van onderdeel 8B

55 10.vergelijken en beoordelen van (zoekingangen van) bronnen wat voor soort materiaal zit er in –primaire (c.q. full-text) vs. secundaire informatie –naslag / nieuws / onderzoekresultaten / statistieken / websites / artikelen / boeken / rapporten /... welk onderwerpsgebied welke doelgroep (niveau) hoeveel zit erin (aantal items, dekkingsgraad,...) vaak moeiliijk te bepalen door verschillen in functionaliteit en onbetrouwbare aantallen voor zoekresultaten uit zoekmachines hoe goed werkt het zoeksysteem (functionaliteit, gebruiksgemak, selectiviteit,...) wat is de kwaliteit van de content zie bijvoorbeeld JISC Academic Database Assessment ToolJISC Academic Database Assessment Tool bekijk: bron zelf / Wikipedia / leveranciers / JISC

56 56 beoordelingscriteria voor websites Goede opmaak Aanduiding maker/auteur (“about us”) Aanduiding postadres, telefoonnummer Aanduiding doel/doelgroep Geen reclame en pop-ups Heldere navigatie Interne zoekfunctie Voldoende snelheid server Backlinks door gezaghebbende organisaties Up to date? Zinnige datering inhoud Geen grof taalgebruik Geen kinderlijk taalgebruik Geen storende taalfouten Zelfs als alles in orde lijkt, bij gevoelige onderwerpen toch nog uitkijken Lookup:http://www.allwhois.com of Maak nu de opdrachten van onderdeel 9

57 bijblijven met bronnen & zoeken Weblogs: –ResourceblogResourceblog –InfoDocket (Gary Price)InfoDocket –SearchEngineLand (Sullivan, Sherman)SearchEngineLand –InternetNews/WebSearchGuide (Gwen Harris)InternetNews/WebSearchGuide –Phil Bradley's weblogPhil Bradley's weblog –Search Engine Showdown (Greg Notess)Search Engine Showdown –Inside Search (Google search blog)Inside Search –FUMSIFUMSI –“Spion” op bronnenlijst (Copernic Tracker, WatchThatPage, …)Copernic TrackerWatchThatPage –RSS-feed op lijsten indien aanwezig Pandia FreePint

58 58 bijblijven met behulp van RSS Rich Site Summary / Really Simple Syndication voor sites met (on)regelmatig nieuwe actuele inhoud, bijvoorbeeld nieuwsbrieven, weblogs (+ ook sommige databases) lezen, beheren als ware het maakt gebruik van xml-structuur vereist software (reader), bijv. Feedreader, Feeddemon, Shrook, … of online lezen bijv. bij Google Reader of NetvibesFeedreaderFeeddemonShrookGoogle ReaderNetvibes toevoegen van een ‘feed’: klik bij pagina op oranje (soms blauw) rss- of xml-logo en voeg url daarvan aan reader toe drie nauwverwante formats: rss/atom/rdf (readers multiformat) RSS-feeds zoeken: blogberichten zoeken: Google Blogsearch, Technorati, IceRocket, real-time search [zie eerder]


Download ppt "1 “resources” en hun zoeksystemen op internet Eric Sieverts BZK, 16 oktober 2012, Den Haag GO Opleidingen."

Verwante presentaties


Ads door Google