“resources” en hun zoeksystemen op internet

Slides:



Advertisements
Verwante presentaties
Ebook Library – Eenvoudig zoeken. In deze demo EBL Eenvoudig zoeken: •Snel zoeken •Browsen op categorie of onderwerp •Volledige tekst doorzoeken NB: EBL.
Advertisements

1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 18 mei 2011 Wageningen.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 16 mei 2013 Wageningen.
“resources” op internet en hun zoeksystemen
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Zoeken met Google Door Kick de Wolff 13 juni 2006.
© BeSite B.V www.besite.nl Feit: In 2007 is 58% van de organisaties goed vindbaar op internet, terwijl in 2006 slechts 32% goed vindbaar.
zoeken op internet bronnen en zoektechnieken – update en vervolg
Inleiding Social Software Pierre Gorissen Fontys Hogescholen
Mediatheek R5. Faciliteiten en dienstverlening (1/2): de collectie Fysieke collectie: boeken en naslagwerken / tijdschriften / AVM / scripties Digitale.
Internet als informatiebron
LITERATUUR ONDERZOEK.
Introductie electronische bronnen
Basishandleiding Limo Meer info online via LIMO Help 1.
Zoeken naar literatuur Opstelling in de kast Catalogus Picarta Bibliografieën Elektronische tijdschriftbestanden Literatuurgids per vakgebied OZON-module.
1 RSS en weblogs zoeken Jeroen Bosman VOGIN, 9 juni 2009 Wageningen.
1 Bijblijven met het web: attenderingen en spionnen Jeroen Bosman VOGIN, 18 november 010 Wageningen.
1 RSS en weblogs zoeken Jeroen Bosman VOGIN, 14 april 2008 Leiden.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 mei 2011 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 november 2009 Wageningen.
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 23 november 2009 Wageningen.
1 Nieuwe (on)mogelijkheden zoekmachines Jeroen Bosman VOGIN, 4 juni 2009 Wageningen.
1 Bijblijven met het web: attenderingen en spionnen Jeroen Bosman VOGIN, 21 november 2013 Wageningen.
1 realtime & social: blogs & tweets Jeroen Bosman VOGIN, Wageningen, 16 mei 2013.
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 20 juni 2013 Wageningen.
“resources” en hun zoeksystemen op internet
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 17 november 2011 Wageningen.
1 Weblogs, RSS en tweets zoeken Jeroen Bosman VOGIN, 20 mei 2010 Wageningen.
Avans, januari 2012 Eric Sieverts Universiteitsbibliotheek Utrecht & opleiding Media, Informatie & Communicatie (HVA) “resources” op internet en hun zoeksystemen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 november 2010 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 18 mei 2010 Wageningen.
1 RSS, weblogs en tweets zoeken Jeroen Bosman VOGIN, 23 november 2009 Wageningen.
Web 2.0 Social Software Toolkit 1/21 Introductie tot Social Software Patrick Klaassen RU
nieuwe toepassingen 2008 Schoolbib 2.0 / VVBAD Mechelen, 5 november 2008 Rosemie Callewaert - Project Manager VCOB.
Workshop Informatievaardigheden
1 realtime and social: blogs & tweets, FB & G+ Jeroen Bosman VOGIN, 17 november 2011 Wageningen.
zoektechnieken voor zoekmachines op internet
 Website faculteitsbibliotheek  Zoekmachine LIMO: boeken, artikels, eindwerken, tijdschrifttitels, kranten Bibliotheek Sociale Wetenschappen Introductie.
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Politieke Wetenschappen  Website faculteitsbibliotheek  Catalogus LIBISng: boeken, eindwerken,
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Communicatiewetenschappen  Website faculteitsbibliotheek  Catalogus LIBISng: boeken, eindwerken,
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Sociologie  Website faculteitsbibliotheek  Catalogus LIBISng: boeken, eindwerken, tijdschriften.
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Communicatiewetenschappen  Website faculteitsbibliotheek  Catalogus LIBISng: boeken, eindwerken,
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Politieke Wetenschappen  Website faculteitsbibliotheek  Catalogus LIBISnet: boeken, eindwerken,
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken  Website faculteitsbibliotheek  Catalogus LIBISng: boeken, eindwerken, tijdschriften  Databanken:artikels.
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Sociologie / Sociaal Werk   Website faculteitsbibliotheek   Catalogus LIBISnet: boeken,
Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Communicatiewetenschappen   Website faculteitsbibliotheek   Catalogus LIBISnet: boeken,
Website Mediacentrum Hogeschool Leiden:
1 Bijblijven met het web: RSS, attenderingen en trackers Jeroen Bosman VOGIN, 9 juni 2006 Wageningen.
Webmaster ToolsWebmaster Tools Google Webmaster Tools Gedetailleerde rapporten over uw pagina's in Google. Weet wat google van u vind! Ontdek.
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 6 november 2014 Wageningen.
ERIC Zoeken op onderwerp Universiteitsbibliotheek.
realtime & social: blogs & tweets
Informatievaardigheden Ecologie-2 (NCP-20503) september/oktober 2012 Corrie van Zeist, Liza Bruggenkamp, Marco van Veller, Wouter Gerritsma en Ans Brouwer.
DIGITAL ANALYTICS TOOLS. 2 DIGITALE MEDIA - METEN.
Workshop Informatievaardigheden 1 Nathalie van den Eerenbeemt Marjolein de Wilde Zoeken naar goede bronnen.
3/23/2015 | 1 Bibliotheekinstructie Klassieken en Oude Geschiedenis.
Informatievaardigheden NCP Ecologie II
3/30/2015 | 1 Bibliotheekinstructie Nederlands 2014.
Bibliotheek Instructie
Bibliotheek Wageningen UR Overal dichtbij. Bibliotheek Wageningen UR: Overal dichtbij Hoe kan ik: “off-campus” toegang krijgen tot tijdschriften en databases?
1 Bijblijven met het web: attenderingen en spionnen Jeroen Bosman VOGIN, 6 november 2014 Wageningen.
1 Bijblijven met het web: RSS, attenderingen en trackers Jeroen Bosman VOGIN, 3 november 2006 Wageningen.
Informatievaardigheden Introductie BPE-10806
Search engines welk instrument voor welke taak eric sieverts Universiteitsbibliotheek Utrecht Instituut voor Media en Informatiemanagement / HvA Eric Sieverts.
1 realtime & social: blogs & tweets Jeroen Bosman VOGIN, 19 november 2015 Wageningen.
Social media. Agenda Over ons Facebook Twitter Linkedin Instagram.
Basics SERP = Search Engine Results Page Betaalde resultaten = SEA Natuurlijke resultaten = SEO Search Engine Optimization SEO is een lange termijn verhaal.
realtime & social: blogs & tweets
Jeroen Bosman VOGIN, 24 november 2008 Wageningen
Transcript van de presentatie:

“resources” en hun zoeksystemen op internet Eric Sieverts BZK, 16 oktober 2012, Den Haag GO Opleidingen

doelstelling / leerdoelen leerdoelen van deze cursus: U bent in staat de voor uw onderzoek meest geschikte bronnen te selecteren U kunt daarbij toe te passen zoeksystemen optimaal gebruiken. U kunt anderen adviseren bij de keuze van informatiebronnen en het zoeken daarin Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

gedachtenbepaling vooraf wat is een bron? is Google een bron? is het web een bron? NEE (althans voor deze cursus) Google is een zoekingang op heel veel bronnen het web is een medium waarop heel veel soorten bronnen beschikbaar zijn

gedachtenbepaling vooraf uitgangspunt voor de cursus: een bron is een collectie van een bepaald soort informatie die online beschikbaar is, waarbij de soort bepaald kan zijn door de vorm (krantenartikelen, blogs, video's, plaatjes, ...), en/of door de inhoud (medische informatie, nieuws, wetenschap, ...)

gedachtenbepaling vooraf om "bronnen" te kunnen raadplegen maken we gebruik van zoeksystemen of zoekingangen. in die zin is Bing een zoekingang op een veelheid aan bronnen. in die zin is IceRocket een zoekingang op weblogs. in die zin is een zoekingang op wetenschappelijke bronnen.

bekend verondersteld verschil tussen soorten diensten op internet typerende aanbieders op internet domeinenstructuur en url-opbouw verschillende soorten zoekstrategieën en -doelen verschil/toepassing gidsen versus zoekmachines werking en geavanceerde opties van zoekmachines betekenis van recall en precision betekenis diepe/onzichtbare web wijze van ranking zoekmachines, werking PageRank startpagina voor zoekhulpmiddelen http://gostartpagina.pbworks.com

soorten informatiebronnen naar aard van informatie wetenschappelijke informatie naslagwerken nieuwsberichten krantenartikelen (digitale) boeken ... naar “medium” webpagina’s pdf’s images videos weblogs rss-feeds tweets ... ander onderscheid: primair - secundair - tertiair KNMI - weer-startpagina - StartNederland doorzoekbaarheid alleen metadata - full-text Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

soorten informatiebronnen niet al zulke combinaties zijn zinvol/mogelijk web- pagina pdf image video weblog tweet rss-feed wetenschap naslag nieuws kranten eBooks ... Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

informatiebronnen en hun zoekingangen (de zoektools) kun je alles (ook) met Google vinden? welke Googles (en Bing’s) zijn er allemaal? (image-, blog-, video-, news-, book-, scholar-, groups-search, maar meeste ook geïntegreerd in gewone Google) kun je met die Googles alles vinden? welke alternatieven zijn er voor die Googles? (zie bijv. Browsys Advanced Finder http://www.browsys.com/finder ) [voor sommige zoektools werkt direct zoeken niet goed meer] alternatieven voor het diepe (en betaalde) web Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

boeken & (wetenschappelijke) artikelen Google Books Hathitrust Digital Library (open book scan project) Amazon (ook reviews, inhoud, boek-boek citaties) Worldcat (catalogus van 10.000 bibliotheken met postcode-functie) Librarything (catalogus van 58.000.000 boeken van 1.000.000 bezitters) GoodReads (reviews, recommandatie, vrienden, ...) Picarta Bibliotheek.nl DOAB (directory of open access books) Open Textbook Catalog (open access leerboeken) enz. artikelen (e.d.) Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

boeken & (wetenschappelijke) artikelen (2) artikelen (e.d.) Google Scholar (artikelen, rapporten, proefschriften, ...) Omega / sEURch / UvA-library (zoeksystemen van UU / EUR / UvA) Scirus / SciVerse (artikelen van Elsevier, uit databases, webpagina’s) OAIster / Scientific Commons (uit academische repositories) NARCIS (40.000 proefschriften, 600.000 publicaties [veel artikelen] uit NL) DOAJ (artikelen in Open Access tijdschriften) CORE (artikelen in Open Access tijdschriften) Magportal (ook -Engelstalige- publiekstijdschriften) DeepDyve (wetenschappelijke artikelen "te huur") enz. Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

boeken & (wetenschappelijke) artikelen (3) artikelen (e.d.) vakspecifiek zoeken (gratis zoekingangen; vaak alleen de metadata) geneeskunde: Pubmed economie: RepEc computerkunde, informatica: CiteSeer onderwijs: ERIC (hoge energie-) fysica: SPIRES-HEP bibliotheekwetenschap: LISTA filosofie: International Philosophical Bibliography transport: TRIS enz. Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp 12 12

boeken: Google Books Van kaft tot kaft gescand (en doorzoekbaar!) Sterk voor ontdekken van niet-hoofdinhoud van boeken Vaak beperkt doorbladerbaar (no preview / snippet view / limited preview / full preview) Content via uitgevers en via grote bibliotheken Probleem met copyrighted materiaal uit bibliotheken Vergeleken met Amazon search inside: meer oud, minder recent Ook ‘My Library’ optie vb NL-boeken niet alleen uit Gent (en binnenkort KB), ook uit US/UK Nu ook enkele ‘magazines’ Metadata op about-this-book-pagina Bibliotheken linken vanuit catalogus (bijv. Picarta)

wetenschap: Google Scholar > 100 miljoen wetenschappelijke publicaties verschil full record en aanwezigheid als ‘citation’ verschil full-text links en bibliografische links concurrent van Web of Science, Scopus, Picarta, Scirus, OAIster, DOAJ, Ingenta, gericht geïndexeerd in vele bronnen (uitgevers, abstract-databases, universiteiten, repositories, ...) met citaties! aantallen citaties mede gebruikt voor ranking (waardoor recente publicaties relatief laag scoren) .... >>

wetenschap: Google Scholar .... advanced search beperkt, nog veel fouten door computer-generated metadata van zoekresultaat naar volledige tekst vaak een probleem (niet aanwezig, alleen tegen betaling) soms veel versies van artikel (waaronder wel gratis) koppeling aan bibliotheekbezit, Google Scholar library programme voegt links naar eigen bezit toe geen info over bronnen, updates Maak nu de opdrachten van onderdeel 1

2. feiten & naslag encyclopedieën e.d. vragen & antwoorden wikipedia > overzicht in Yahoo Directory overzicht in Open Directory internet movie database vragen & antwoorden Quora Yahoo-answers FAQs: internet FAQ consortium zoekmachine voor naslagwerkpagina’s + berekening Wolfram Alpha woordenboeken, vertaaldiensten e.d. enz. Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

wikipedia in >250 talen levert “wisdom of the crowds” altijd “wisdom”? goed voor “feitelijke” onderwerpen veel detailonderwerpen (20 miljoen lemma’s, 1 miljoen NL) soms nuttig om relevante eigen publicaties / boeken uit eigen collectie als referenties aan lemma toe te voegen toch wel beleid & beheer: stewards, administrators Qwika: wikipedia metasearch (1158 wiki's in 12 talen, incl. computer-vertaling)

2. feiten & naslag (2) encyclopedieën e.d. vragen & antwoorden zoekmachine voor naslagwerkpagina’s + berekening woordenboeken, vertaaldiensten e.d. answers.com (voert een metasearch uit) Roget thesaurus Acronymfinder Bartleby Google Translate(d search) > Mijn Woordenboek synoniemen Synoniemen.net overzicht in Open Directory overzicht in Open Directory Nederlands enz. Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

vertaalt Nederlandse zoekvraag in aangevinkte taal/talen en vertaalt daarmee gevonden resultaten weer terug naar het Nederlands

Maak nu de opdrachten van onderdeel 2

3. nieuws, kranten, tijdschriften Google News Yahoo News BBC , CNN e.d. nu.nl € LexisNexis, € Factiva krantensites (overzicht: startnederland.nl) tijdschriftensites (overzicht: startnederland.nl) Newslink-magazines .... [weblogs & tweets: zie 5 en 6] [video/tv-nieuws: zie 7] Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

gespecialiseerd: Google News Engelstalig nieuws uit 4500 bronnen + aparte versies in andere talen dan Engels: chinees (1000 bronnen) duits (700 bronnen) frans (500 bronnen) hebreeuws (100 bronnen) italiaans (250 bronnen) japans (600 bronnen) koreaans (550 bronnen) nederlands (>400 bronnen) portugees (200 bronnen) spaans (700 bronnen) enz. Maak nu de opdrachten van onderdeel 3

4. archief & oud nieuws web archive (oude versies van websites, terug tot 1996, ingang via -oude- url) historische nederlandse kranten (versnipperd aanbod) historische kranten KB landelijke krantendatabank (ook papieren collecties) Los: Groene Amsterdammer (>1877), Leeuwarder Courant (>1752) € LexisNexis ‘echte archieven’ via Archieven.org Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp Maak nu de opdrachten van onderdeel 4

5. blogs & rss-feeds Google blogsearch Icerocket Technorati (Exalead >> achteraf inperken op blogs ) denk aan verschil tussen ingang op individuele berichten en ingang op blogs of feeds als geheel wie citeert wie? (google blogsearch) filtermogelijkheid op “autoriteit” ?=? belang, kwaliteit, .... filter op termen binnen je feedreader blogs of onderwerp volgen met blogsalert? #hashtags Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

5. blogs & rss-feeds zoeken naar RSS feeds (meer dan alleen blogs) CTRLQ: http://ctrlq.org/rss/ RSS Searchhub: http://www.rsssearchhub.com/ overzicht (op "makeuseof") voor vinden van feeds van bepaalde bron / website voor vinden van feed waarin bepaald onderwerp Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp Maak nu de opdrachten van onderdeel 5

6. tweets en social search (1) Twitter in 140 tekens vaak met verkorte links vaak met foto- of video-link vaak met hashtags (#afgesprokentrefwoord) zoeken (vaak beperkt tot berichten uit laatste 1 à 2 weken) twitter (ook advanced search) tweetzi, topsy, kurrently, postpost, … snapbird (hele tijdlijn van 1 tweep) tweetscan (op beperkte schaal wel oudere berichten) twicsy (foto's op twitter), ... bing - social (ook Facebook) overzicht/vergelijking tools: All the easiest ways to search old tweets Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp 27 27

6. tweets en social search (2) veel hulptools twubs (bijv. bij congres) : volg in real-time alles met bepaalde hashtag en voeg die tag automatisch toe aan eigen berichten whathashtag : welke hashtags meest toegekend bij zoekterm? ... Twitter als continue informatiebron: volg de "juiste" personen die interessante nieuwtjes, rapporten, artikelen via Twitter delen links uit tweets automatisch bewaren als social bookmarks met delicious zelf (tabblad sources) via packrati.us >> delicious, pinboard, diigo, ... Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp 28 28

6. tweets en social search (3) “Real time / social search engines” socialsearcher, socialmention, samepoint, whostalkin, … (tweets + blogs + facebook + …) Google personal results / Google+ ("search plus your world") real-time foto’s: skylines Forumdiscussies omgili, boardtracker, ... Google groups (ook oude nieuwgroep-discussies) voor methoden van onderzoek: adviezen van Henk van Ess in "de digitale detective" (2012) How to: use social media in newsgathering (2012) 100+ Social Media Monitoring Tools (2010) Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp Maak nu de opdrachten van onderdeel 6 29 29

7. multimedia images video audio Google-image (simpele beeldherkenning; ook foto’s uit Picasa) Yahoo-image (ook veel foto’s uit Flickr) Bing-image Exalead-image (veel verschillen in zoekresultaten door verschillen in “tekstzoekvelden”) Flickr (zoekt vooral op tags; ondersteunt “Creative Commons” ) andere uploadsites: Pbase, Smugsmug, Photobucket, Zoom, Zenfolio Google (search by image), Tineye (zoekt exacte copieën), Tiltomo, Retrievr (voorbeeldzoeken met beeldherkenning op Flickr) speciale sites (beeldbank nationaal archief, wikimedia commons, ...) geografisch (panoramio [google-maps], worldc.am [instagram], ...) video audio Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

7. multimedia (2) images video audio YouTube (uploads - groei: 70 uur/minuut, ook advanced search) Youtube Edu channel Blinkx (omroepen - 35 miljoen uur video, spraakherkenning?) VoxaleadNews (met spraakherkenning - in meer talen - ook NL) Google-video (ook video’s uit YouTube; zoekt alleen in metadata) Bing-video ScienceCinema (met spraakherkenning! vooral energie-gerelateerde onderwerpen) TV-uitzendingen: Uitzending gemist, Beeld & Geluid, Academia audio Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp Maak nu de opdrachten van onderdeel 7

8. gespecialiseerde versus algemene zoekingangen selectief & vaak “dieper” dan algemene zoekmachine interne zoekfunctie van individuele site kant en klare onderwerpsgerichte zoekingangen Scirus (wetenschap algemeen) Findlaw (rechten USA) WebMD / Medscape (geneeskunde) Google-finance (financiële gegevens + nieuws) ..... homemade met: Google CSE, Blekko (slashtags) (zie: http://www.searchengineshowdown.com/cse/ ) zelf selecteren welke sites (url’s) in zoekmachine moeten worden meegenomen

ingangen op diepe web toegang tot het diepe web “handmatig” (elke database afzonderlijk doorzoeken) overzicht "Complete planet" bij BrightPlanet voor "wetenschap" al eerder verzamelzoeksystemen genoemd “halfautomatisch” (doorzocht via desktop metasearch engine) copernic-agent (metasearch vanaf eigen PC) “automatisch” (gegevens uit bepaalde database/bron zitten ook al -allemaal?- in algemene zoekmachines) bijv. catalogus UB Wageningen Automatisch bv bij NIWI (NOD?) Maak nu de opdrachten van onderdeel 7

9. zoeken met webzoekmachines > 15% van webpagina’s in geen van grote zoekmachines van resterende wel geïndexeerde pagina’s zelfs Google maar 76%, Yahoo 69%, MSN 62% (2005) http://www.cs.uiowa.edu/~asignori/web-size/ geen betrouwbare recentere cijfers mijn inschatting: Google nu iets kleiner dan Yahoo ? Google nu iets groter dan Bing ? maar nu: Yahoo==Bing ! Google nu ~10x zo groot als kleinere dekking zeer ongelijkmatig verschil in actualiteit verschil in dekking  verschil in ranking (vaak zeer weinig overlap bij eerste 10)

rangorde: google's pagerank pagerank van pagina x is: PR(x) = (1-d) + d* {PR(yx) / C(y)} y elke "pagina y" die naar pagina x linkt draagt bij aan die som  PR(yx) = pagerank van pagina y die naar x linkt [link vanuit pagina die zelf hoge pagerank heeft, draagt meer bij] C(y) = aantal links in pagina y [link vanuit pagina die erg veel links bevat, draagt minder bij] d = "dempingsfactor" (ong. 0.85) waardoor: 0.15  PR(x)  

rangorde: extra factoren pagerank is pas van belang als zoekwoord-gerelateerde (inhoudelijke) factoren weinig bepalend zijn, zoals: pagina relevanter als zoekwoord in titel pagina relevanter als zoekwoord in URL pagina relevanter als zoekwoord in koppen <H1> <H2> pagina relevanter als zoekwoord meer in begin van tekst pagina relevanter als zoekwoord daarin vaker wordt herhaald pagina relevanter als zoekwoorden daarin dicht bij elkaar pagina relevanter als zoekwoorden daarin in zelfde volgorde zeldzaam zoekwoord is belangrijker dan heel algemeen pagina relevanter als zoekwoord ook vaak in verwijzende link-tekst pagina relevanter als hij "lijkt" op eerder bekeken pagina's voor specifieke informatie over Google, zie bijv.: http://www.vaughns-1-pagers.com/internet/google-ranking-factors.htm Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

andere algemene webzoekmachines probeer naast Google eens: Bing (microsoft, groot) Yahoo! (content=Bing, groot) Exalead (frans, tamelijk klein, veel geavanceerde functies) Gigablast ("groene" zoekmachine, tamelijk klein, paar unieke functies) Blekko ("hashtags" om [domein-]selectiever te kunnen zoeken) DuckDuckGo (verzekert privacy, geen personalisatie, tamelijk klein) Ask (tamelijk klein, weinig unieks meer) in US hebben die samen nog 30% marktaandeel; in NL maar 3%

aantallen bij webzoekmachines gemelde resultaataantallen zijn vaak zeer onbetrouwbaar bij Google (en andere) zijn vermelde aantallen niet stabiel, onbetrouwbaar, met soms onverklaarbare effecten inperken geeft soms groter aantal, uitbreiden kleiner aantal afhankelijk van verdeling index over servers Google afhankelijk van Google versie / ingelogd zijn / zoekgeschiedenis afhankelijk van keuze “your part of the world” bij Bing Danny Sullivan legt uit waarom Google niet kan tellen: http://searchengineland.com/why-google-cant-count-results-properly-53559 Why Google Can’t Count Results Properly

omgaan met zoektermen .... belang van "juiste" zoektermen: denk in termen van het te vinden document (wat zou in relevant document staan?) spellingvarianten, enkel-meervoud-werkwoord (zelf bedenken of automatisch - Google) truncatie (alleen Exalead) alternatieve zoektermen / synoniemen: soms automatisch bij Google te vinden met "thesauri" / synoniemenlijsten (mijnwoordenboek, synoniemen.net, Roget's, answers.com, Bartleby) te vinden via synoniemen uit Word-tekstverwerker te vinden door te kijken in wat al is gevonden .... Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

omgaan met zoektermen denk in termen van het te vinden document (hoe zou het in relevant document staan?) .... "exact phrase"  losse woorden woordnabijheid: met term-wildcard ( * ) bij Google & Yahoo "veiligheid * * tunnels" met NEAR bij Yahoo, Bing, Exalead veiligheid NEAR tunnels met AROUND(n) bij Google veiligheid AROUND(4) tunnels eventueel een phrase van losse woorden (zonder "") ! invloed van volgorde van losse woorden op ranking (zie: Thumbshots – Ranking) Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

omgaan met zoektermen denk in termen van het te vinden document (hoe zou het in relevant document staan?) .... voor opsomming: generiek zoeken vs. voorbeeld zoeken ( overzicht amerikaanse presidenten vs. clinton, johnson, reagan, obama, lincoln, ... ) gebruik context-specifieke zoektermen (event. slang, jargon) om te beperken tot specifieke context waarin onderwerp moet voorkomen (populair  wetenschappelijk ; volwassenentaal  jeugdtaal) gewicht specifieke term verhogen door herhaling (Google) Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

omgaan met zoektermen belang van "juiste" zoektermen: gebruik van gesuggereerde termen vooraf: Google, Bing, Yahoo, Exalead achteraf inperken: Ask, Exalead, Gigablast, Scirus Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

zoektermen Booleaans combineren bijzonderheden van Booleaans bij Google & Yahoo: je mag de AND's weglaten hier gaat -als enige systemen- OR voor AND je hoeft dus geen haakjes te gebruiken je moet i.p.v. "NOT" per losse term - (min)teken gebruiken voorbeelden: architectuur  OR  bouwkunst  nederland  OR  holland  -molens  -windmolens i.p.v. (architectuur OR bouwkunst) AND (nederland OR holland) NOT (molens OR windmolens) "moderne OR hedendaagse bouwkunst" i.p.v. "moderne bouwkunst" OR "hedendaagse bouwkunst" wat helemaal NIET kan bij Google/Yahoo: (bouwkunst AND nederland) OR (architecture AND netherlands) Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

zoektermen Booleaans combineren maar Booleaans bij Bing je moet WEL haakjes gebruiken bij OR je mag ook NOT gebruiken dus wel: (architectuur OR bouwkunst) AND (nederland OR holland) NOT (molens OR windmolens) of (architectuur OR bouwkunst) (nederland OR holland) NOT (molens OR windmolens) maar weer geen: "moderne OR hedendaagse bouwkunst" dat moet voluit: "moderne bouwkunst" OR "hedendaagse bouwkunst" Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

Booleaanse bouwsteencombinatie bouwsteencombinaties met AND's en OR's (veilig OR veiligheid) AND lange AND (tunnels OR autotunnels OR verkeerstunnels) stapsgewijze opbouwen bij Google zoek op termen voor eerste bouwsteen:   veilig OR veiligheid als Google-instant "aan" staat, zie je meteen al het resultaat (zonder op [search] te hoeven klikken) tik gewoon door met termen voor tweede bouwsteen; lange je ziet meteen weer het resultaat tik door met termen voor derde concept:     tunnels OR autotunnels OR verkeerstunnels enz. resultaat: Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie Maak nu de opdrachten van onderdeel 8A

zoektermen: Google denkt voor ons Google probeert de zoekvraag te verbeteren / verbreden automatische spellingcorrecties (veilgheid >> veiligheid) zoekt op woorden met dezelfde woordstam (enkel-/meervoud, werkwoordsvormen, vervoegingen, verbuigingen) afkortingen (jfk >> john f kennedy | wwii >> world war II) voegt synoniemen van woorden toe (vaccination >> immunization) bij losse zoekwoorden ook samengestelde term en omgekeerd (veiligheid maatregel >> veiligheidsmaatregel | catfood >> cat food) maakt soms een term optional als die niet discriminerend genoeg is dit alles wat vaker en uitgebreider in Engels dan in Nederlands personaliseert zoekactie op basis van eerder zoek/browse-gedrag en als je dat nou niet wilt ........ >> "verbatim" Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

verbatim == "woordelijk" vorige maand nieuw geïntroduceerde optie verbatim == "woordelijk" op google.nl: "woord voor woord"

exact zoeken en bijzondere tekens woordstam-zoeken voorkomen met ".." ( "greenhouses" <geeft NIET> greenhouse effect ) ook (automatisch) op synoniemen zoeken met een ~ ( ~term [Google] ; maar pas op voor precisie-problemen ! ) op sommige leestekens kun je sinds kort zoeken (&, %, ..) (maar niet op allemaal - €, /, ", komma, ...) getallen werken net als woorden, maar: komma wordt gelezen als spatie, net als andere leestekens (12,93  12 93 , maar 100,000 wel  100000) punt kan wel (12.93  12.93) getallen zoeken in range (10..20 of $10..$20, uniek voor Google) Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

velden, formele kenmerken beperking op formele vereisten : taal, datum, domein, land/werelddeel, bestandstype, media veldspecifiek zoeken (titel, url, links) : wanneer wel / niet? zoeken via backlinks (koppelingen naar …) : link:url , maar pas op: Google geeft beperkt resultaat alternatief: opensiteexplorer.org (gratis versie: 3x per dag ...) domein (site) : meervoudig sitefilter (bij Gigablast of Google-syntax kennen) met Google-syntax kan in eenvoudig zoekscherm vaak meer dan in voorgeprogrammeerde “advanced search” bijv. filetype:rss / site:microsoft.com OR site:google.com selectie vooraf vs. achteraf inperken via "more search tools" op datum zoeken .... >>

formele kenmerken, datum op datum beperken : = meestal datum van -recentste- indexering door zoekmachine (niet werkelijke datum van publicatie) Google advanced search biedt Google minder opties dan in linkermenu: hour / past 24 hours / week / month / year / custom bij Google resultaat achteraf inperken op periode:  "more search tools" - "custom range" - "from: .. to: .." bij Exalead (vooraf inperken - exacte voor/na datum) hoe datum van publicatie van gevonden pagina te controleren als niet op webpagina zelf? soms werkt: javascript:alert(document.lastModified) maar helaas steeds vaker niet meer …. Maak nu de opdrachten van onderdeel 8B

10. vergelijken en beoordelen van (zoekingangen van) bronnen wat voor soort materiaal zit er in primaire (c.q. full-text) vs. secundaire informatie naslag / nieuws / onderzoekresultaten / statistieken / websites / artikelen / boeken / rapporten / ... welk onderwerpsgebied welke doelgroep (niveau) hoeveel zit erin (aantal items, dekkingsgraad, ...) vaak moeiliijk te bepalen door verschillen in functionaliteit en onbetrouwbare aantallen voor zoekresultaten uit zoekmachines hoe goed werkt het zoeksysteem (functionaliteit, gebruiksgemak, selectiviteit, ...) wat is de kwaliteit van de content zie bijvoorbeeld JISC Academic Database Assessment Tool bekijk: bron zelf / Wikipedia / leveranciers / JISC

beoordelingscriteria voor websites Goede opmaak Aanduiding maker/auteur (“about us”) Aanduiding postadres, telefoonnummer Aanduiding doel/doelgroep Geen reclame en pop-ups Heldere navigatie Interne zoekfunctie Voldoende snelheid server Backlinks door gezaghebbende organisaties Up to date? Zinnige datering inhoud Geen grof taalgebruik Geen kinderlijk taalgebruik Geen storende taalfouten Zelfs als alles in orde lijkt, bij gevoelige onderwerpen toch nog uitkijken Lookup: http://www.allwhois.com of http://centralops.net/co/DomainDossier.aspx Maak nu de opdrachten van onderdeel 9

11. bijblijven met bronnen & zoeken Weblogs: Resourceblog InfoDocket (Gary Price) SearchEngineLand (Sullivan, Sherman) InternetNews/WebSearchGuide (Gwen Harris) Phil Bradley's weblog Search Engine Showdown   (Greg Notess) Inside Search (Google search blog) FUMSI “Spion” op bronnenlijst (Copernic Tracker, WatchThatPage, …) RSS-feed op lijsten indien aanwezig Pandia FreePint

bijblijven met behulp van RSS Rich Site Summary / Really Simple Syndication voor sites met (on)regelmatig nieuwe actuele inhoud, bijvoorbeeld nieuwsbrieven, weblogs (+ ook sommige databases) lezen, beheren als ware het email maakt gebruik van xml-structuur vereist software (reader), bijv. Feedreader, Feeddemon, Shrook, … of online lezen bijv. bij Google Reader of Netvibes toevoegen van een ‘feed’: klik bij pagina op oranje (soms blauw) rss- of xml-logo en voeg url daarvan aan reader toe drie nauwverwante formats: rss/atom/rdf (readers multiformat) RSS-feeds zoeken: http://www.rsssearchhub.com/, http://ctrlq.org/rss/ blogberichten zoeken: Google Blogsearch, Technorati, IceRocket, real-time search [zie eerder]