Avans, januari 2012 Eric Sieverts Universiteitsbibliotheek Utrecht & opleiding Media, Informatie & Communicatie (HVA) “resources” op internet en hun zoeksystemen
programma Wat zijn bronnen? Soorten informatiebronnen Zoeksystemen voor bronnen op internet; meer dan Google Boeken en artikelen / wetenschap Feiten, naslag, vertaling Nieuws Oud Nieuws Blogs, feeds, tweets, "real time" zoeken AV materiaal Gespecialiseerde persoonlijke zoekmachines Het diepe web Vergelijken en beoordelen Bijblijven Avans, januari 2012 Eric Sieverts
wat is een bron? is Google een bron? is het web een bron? NEE (althans voor deze workshop) Google is een zoekingang op heel veel bronnen het web is een medium waarop heel veel soorten bronnen beschikbaar zijn Avans, januari 2012 Eric Sieverts
wat is een bron? uitgangspunt voor vandaag: een bron is een collectie van een bepaald soort informatie die online beschikbaar is, waarbij de soort bepaald kan zijn door de vorm (krantenartikelen, blogs, video's, plaatjes,...), en/of door de inhoud (medische informatie, nieuws, wetenschap,...) Avans, januari 2012 Eric Sieverts
wat zijn zoekingangen? om "bronnen" te kunnen raadplegen maken we gebruik van zoeksystemen / zoekingangen / zoektools in die zin is Bing een zoekingang op een veelheid aan bronnen. in die zin is IceRocket een zoekingang op weblogs. in die zin is een zoekingang op wetenschappelijke bronnen. Avans, januari 2012 Eric Sieverts
soorten informatiebronnen Avans, januari 2012 Eric Sieverts naar aard van informatie –wetenschappelijke informatie –naslagwerken –nieuwsberichten –krantenartikelen –(digitale) boeken –... naar “medium” –webpagina’s –pdf’s –images –videos –weblogs –rss-feeds –... ander onderscheid: primair - secundair - tertiair –KNMI - weer-startpagina - StartNederlandKNMIweer-startpaginaStartNederland doorzoekbaarheid –alleen metadata - full-text
soorten informatiebronnen Avans, januari 2012 Eric Sieverts niet al zulke combinaties zijn zinvol/mogelijk web-pagina pdf image video weblog rss-feed wetenschap naslag nieuws kranten eBooks...
informatiebronnen en hun zoektools kun je alles (ook) met Google vinden? welke Googles (en Yahoo’s/Bing's) zijn er allemaal? (image-, blog-, video-, news-, book-, scholar-, groups-search) kun je met die Googles alles vinden? welke alternatieven zijn er voor die Googles? –zie bijv. Browsys Advanced Finder –alternatieven voor het diepe (en betaalde) web Avans, januari 2012 Eric Sieverts
boeken & (wetenschappelijke) artikelen Avans, januari 2012 Eric Sieverts boeken –Google BooksGoogle Books –Amazon (ook reviews, inhoud, boek-boek citaties)Amazon –Worldcat (catalogus van bibliotheken met postcode-functie)Worldcat –Librarything (catalogus van boeken van bezitters)Librarything –Picarta (bevat ook artikelen)Picarta –Bibliotheek.nlBibliotheek.nl –NARCIS ( proefschriften, publicaties [veel artikelen] uit NL)NARCIS –enz. artikelen (e.d.) enz.
boeken & (wetenschappelijke) artikelen boeken artikelen (e.d.) –Google Scholar (artikelen, rapporten, proefschriften,...)Google Scholar –Scirus (artikelen uit ElsevierScience, uit databases, + webpagina’s,...)Scirus –Omega / sEURch / UvA-library (zoeksystemen van UU / EUR / UvA)OmegasEURchUvA-library –OAIster / Scientific Commons (uit academische repositories)OAIsterScientific Commons –DOAJ / Open J-Gate (artikelen in Open Access tijdschriften)DOAJOpen J-Gate –FindArticles, Magportal (ook -Engelstalige- publiekstijdschriften)FindArticles Magportal –ArticleFinder (vooral uit wetenschappelijke tijdschriften)ArticleFinder –DeepDyve (wetenschappelijke artikelen "te huur")DeepDyve –enz. enz. Avans, januari 2012 Eric Sieverts
boeken & (wetenschappelijke) artikelen boeken artikelen (e.d.) vakspecifiek zoeken (gratis zoekingangen; vaak alleen de metadata) –geneeskunde: PubMedPubMed –economie: RepEcRepEc –computerkunde, informatica: CiteSeerCiteSeer –onderwijs: ERICERIC –(hoge energie-) fysica: SPIRES-HEPSPIRES-HEP –bibliotheekwetenschap: LISTALISTA –filosofie: International Philosophical BibliographyInternational Philosophical Bibliography –transport: TRISTRIS enz. Avans, januari 2012 Eric Sieverts
boeken: Google Books Avans, januari 2012 Eric Sieverts Van kaft tot kaft gescand (en doorzoekbaar!) Sterk voor ontdekken van niet-hoofdinhoud van boeken Vaak beperkt doorbladerbaar (no preview / snippet view / limited preview / full preview) Content via uitgevers en via grote bibliotheken Plaatsnamen uit boek >> mashup met Google-Maps Probleem met copyrighted materiaal uit bibliotheken Vergeleken met Amazon search inside: meer oud, minder recent Ook ‘My Library’ optie vbvb NL-boeken niet alleen uit Gent (en binnenkort KB), ook uit US/UK Nu ook enkele ‘magazines’ Metadata op about-this-book-pagina Bibliotheken linken vanuit catalogus (bijv. Picarta)
wetenschap: Google Scholar > 100 miljoen wetenschappelijke publicaties verschil full record en aanwezigheid als ‘citation’ verschil full-text links en bibliografische links concurrent van Web of Science, Scopus, Findarticles, Picarta, Scirus, OAIster, DOAJ, Infotrieve, Ingenta gericht geïndexeerd in vele bronnen (uitgevers, databases, universiteiten) met citaties! aantallen citaties mede gebruikt voor ranking.... >> Avans, januari 2012 Eric Sieverts
wetenschap: Google Scholar.... advanced search beperkt, nog veel fouten door computer-gegenereerde metadata van zoekresultaat naar volledige tekst vaak een probleem (niet aanwezig, alleen tegen betaling) soms veel versies van artikel (waaronder wel gratis) koppeling aan bibliotheekbezit, Google Scholar library programme voegt links naar eigen bezit toe geen info over bronnen, updates Avans, januari 2012 Eric Sieverts
feiten, naslag, vertaling encyclopedieën e.d. –wikipediawikipedia –overzicht in Yahoo DirectoryYahoo Directory –overzicht in Open DirectoryOpen Directory –overzicht in encyclopedie.pagina.nlencyclopedie.pagina.nl –internet movie databaseinternet movie database vragen & antwoorden –QuoraQuora –Yahoo-answersYahoo-answers –FAQs: internet FAQ consortiuminternet FAQ consortium zoekmachine voor naslagwerkpagina’s + berekening –Wolfram AlphaWolfram Alpha woordenboeken, vertaaldiensten e.d. enz. Avans, januari 2012 Eric Sieverts
feiten, naslag, vertaling encyclopedieën e.d. vragen & antwoorden zoekmachine voor naslagwerkpagina’s + berekening woordenboeken, vertaaldiensten e.d. –answers.com (voert een metasearch uit)answers.com –Roget thesaurusRoget thesaurus –AcronymfinderAcronymfinder –BartlebyBartleby –Google Translate(d search) [zie middagprogramma]Google Translate(d search) –Mijn Woordenboek synoniemenMijn Woordenboek synoniemen –Synoniemen.netSynoniemen.net –overzicht in Open DirectoryOpen Directory –overzicht in Open Directory NederlandsOpen Directory Nederlands enz. Avans, januari 2012 Eric Sieverts
wikipedia in >250 talen>250 talen levert “wisdom of the crowds” altijd “wisdom”? goed voor “feitelijke” onderwerpen veel detailonderwerpen (10 miljoen lemma’s, NL) soms nuttig om relevante eigen publicaties / boeken uit eigen collectie als referenties aan lemma toe te voegen toch wel beleid & beheer: stewards, administratorsbeleidstewardsadministrators Qwika: wikipedia metasearch (1158 wiki's in 12 talen, incl. computer-vertaling)Qwika Avans, januari 2012 Eric Sieverts
nieuws, kranten, tijdschriften Google News Yahoo News BBC, CNN e.d.BBCCNN nu.nl € LexisNexis, € FactivaLexisNexisFactiva krantensites (overzicht: startnederland.nl)startnederland.nl tijdschriftensites (overzicht: startnederland.nl)startnederland.nl Newslink-magazines.... [weblogs & tweets: zie apart onderdeel] Avans, januari 2012 Eric Sieverts
gespecialiseerd: Google News Engelstalig nieuws uit 4500 bronnen + aparte versies in andere talen dan Engels: –chinees(1000 bronnen) –duits(700 bronnen) –frans(500 bronnen) –hebreeuws(100 bronnen) –italiaans(250 bronnen) –japans(600 bronnen) –koreaans(550 bronnen) –nederlands(>400 bronnen) –portugees(200 bronnen) –spaans(700 bronnen) –enz. Avans, januari 2012 Eric Sieverts
oud nieuws, archieven web archive (oude versies van websites, terug tot 1996, ingang via -oude- url) historische nederlandse kranten (versnipperd aanbod) –historische kranten KBhistorische kranten KB –landelijke krantendatabank (ook papieren collecties)landelijke krantendatabank –Los: Groene Amsterdammer (>1877), Leeuwarder Courant (>1752)Groene AmsterdammerLeeuwarder Courant € LexisNexisLexisNexis ‘echte archieven’ via Archieven.orgArchieven.org Avans, januari 2012 Eric Sieverts
blogs, rss-feeds. tweets, real-time Google blogsearch Icerocket / TechnoratiIcerocketTechnorati (Exalead >> achteraf inperken op blogs )Exalead –denk aan verschil tussen ingang op individuele berichten en ingang op blogs of feeds als geheel –wie citeert wie? (google blogsearch)google blogsearch –filtermogelijkheid op “autoriteit” ?=? belang, kwaliteit,.... –filter op termen binnen je feedreader –blogs of onderwerp volgen met blogsalert? –#hashtags Avans, januari 2012 Eric Sieverts
blogs, rss-feeds. tweets, real-time Forumdiscussies –omgili, boardtracker,...omgiliboardtracker Twitter in 140 tekens –vaak met verkorte links (intern of met is.gd / tinyurl / bit.ly / tr.im /...) –vaak met hashtags (#afgesprokentrefwoord) Zoeken (maar geen "oude" berichten) –twitter (ook advanced search)twitteradvanced search –tweetzi, topsy, kurrently, …tweetzitopsykurrently “Real time web” (twitter, facebook, blogs, forums,...) –socialmention, samepoint, whostalkin, …socialmentionsamepointwhostalkin –met Google achteraf op in te perken ("social") Avans, januari 2012 Eric Sieverts
multimedia images –Google-image (beeldherkenning; voorbeeldzoeken; ook uit Google-Photos)Google-image –Yahoo-image (ook veel foto’s uit Flickr)Yahoo-image –Bing-imageBing-image –Ask-imageAsk-image –Exalead-imageExalead-image (veel verschillen in zoekresultaten door verschillen in “tekstzoekvelden”) –Flickr (zoekt vooral op tags; ondersteunt “Creative Commons” )Flickr –Andere uploadsites: Pbase, Smugsmug, Photobucket, Zoom, Zenfolio –Tiltomo, Retrievr (voorbeeldzoeken met beeldherkenning op Flickr)TiltomoRetrievr –Speciale sites als Beeldbank nationaal archief... video audio Avans, januari 2012 Eric Sieverts
multimedia images video –Google-video (ook video’s uit YouTube; zoekt alleen in metadata)Google-video –YouTube (groei: 30 uur/minuut, ook advanced searchYouTube Youtube Edu channel –Blinkx (35 miljoen uur video, spraakherkenning?)Blinkx –TruveoTruveo –VideoSurfVideoSurf –VoxaleadNews (werkt met spraakherkenning; ook Nederlands!)VoxaleadNews –ScienceCinema (werkt met Engelse spraakherkenning!ScienceCinema vooral energie-gerelateerde onderwerpen) –TV-uitzendingen: Uitzending gemist, Beeld & Geluid, Academia audio –Yahoo-audio (vooral muziek; geen spraakherkenning)Yahoo-audio Avans, januari 2012 Eric Sieverts
gespecialiseerd vs. algemeen zoektool gespecialiseerde zoekmachine selectiever & vaak “dieper” dan algemene zoekmachine –interne zoekfunctie van individuele site –kant en klare onderwerpsgerichte zoekingangen Scirus (wetenschap algemeen)Scirus Findlaw (rechten USA)Findlaw WebMD / Medscape (geneeskunde)WebMDMedscape Google-finance (financiële gegevens + nieuws)Google-finance..... –persoonlijk gemaakt: zelf selecteren welke sites (url’s) in zoekmachine moeten worden meegenomen Google CSE Blekko (slashtags)Blekko Avans, januari 2012 Eric Sieverts
toegang tot het "diepe" web spul uit databases zit in principe niet in Google etc. zelf “handmatig” databases afzonderlijk doorzoeken –overzicht "Complete planet" bij BrightPlanetComplete planet –voor "wetenschap" al eerder verzamelzoeksystemen genoemdeerder “halfautomatisch” laten doorzoeken via (desktop) metasearch –goshme (geavanceerde metasearch)goshme –copernic-agent (metasearch vanaf eigen PC)copernic-agent “automatisch” al gevonden, omdat (met technische truc) gezorgd is dat gegevens uit database toch in Google komen bijv. catalogus UB Wageningen Avans, januari 2012 Eric Sieverts
vergelijken en beoordelen wat voor soort materiaal zit er in –primaire (c.q. full-text) vs. secundaire informatie –naslag / nieuws / onderzoekresultaten / statistieken / websites / artikelen / boeken / rapporten /... welk onderwerpsgebied welke doelgroep (niveau) hoeveel zit erin (aantal items, dekkingsgraad,...) vaak moeilijk te bepalen door onbetrouwbare resultaataantallen hoe goed werkt het zoeksysteem (functionaliteit, gebruiksgemak, selectiviteit,...) wat is kwaliteit van de content zie bijvoorbeeld JISC Academic Database Assessment ToolJISC Academic Database Assessment Tool bekijk: bron zelf / Wikipedia / leveranciers / JISC Avans, januari 2012 Eric Sieverts
bijblijven (bronnen & zoeken) Weblogs (met RSS-feeds) : –ResourceblogResourceblog –InfoDocket (Gary Price)InfoDocket –SearchEngineLand (Sullivan, Sherman)SearchEngineLand –InternetNews/WebSearchGuide (Gwen Harris)InternetNews/WebSearchGuide –Phil Bradley's weblogPhil Bradley's weblog –Search Engine Showdown (Greg Notess)Search Engine Showdown –Inside Search (Google search blog)Inside Search –“Spion” op bronnenlijst (Copernic Tracker, WatchThatPage, …)Copernic TrackerWatchThatPage –RSS-feed op lijsten indien aanwezig Pandia FreePint Avans, januari 2012 Eric Sieverts
bjblijven met behulp van RSS Rich Site Summary / Really Simple Syndication voor sites met (on)regelmatig nieuwe actuele inhoud, bijvoorbeeld nieuwsbrieven, weblogs (+ ook sommige databases) lezen, beheren als ware het maakt gebruik van xml-structuur vereist software (reader), bijv. Feedreader, Feeddemon, Shrook, … of online lezen bijv. bij Google Reader of NetvibesFeedreaderFeeddemonShrookGoogle ReaderNetvibes toevoegen van een ‘feed’: klik bij pagina op oranje (soms blauw) rss- of xml-logo en voeg url daarvan aan reader toe drie nauwverwante formats: rss/atom/rdf (readers multiformat) zoeken van berichten: Google Blogsearch, Technorati, IceRocket, real-time search [zie eerder] Avans, januari 2012 Eric Sieverts