“resources” en hun zoeksystemen op internet

“resources” en hun zoeksystemen op internet
Eric Sieverts BZK, 16 oktober 2012, Den Haag GO Opleidingen

doelstelling / leerdoelen
leerdoelen van deze cursus: U bent in staat de voor uw onderzoek meest geschikte bronnen te selecteren U kunt daarbij toe te passen zoeksystemen optimaal gebruiken. U kunt anderen adviseren bij de keuze van informatiebronnen en het zoeken daarin Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

gedachtenbepaling vooraf
wat is een bron? is Google een bron? is het web een bron? NEE (althans voor deze cursus) Google is een zoekingang op heel veel bronnen het web is een medium waarop heel veel soorten bronnen beschikbaar zijn

uitgangspunt voor de cursus: een bron is een collectie van een bepaald soort informatie die online beschikbaar is, waarbij de soort bepaald kan zijn door de vorm (krantenartikelen, blogs, video's, plaatjes, ...), en/of door de inhoud (medische informatie, nieuws, wetenschap, ...)

om "bronnen" te kunnen raadplegen maken we gebruik van zoeksystemen of zoekingangen. in die zin is Bing een zoekingang op een veelheid aan bronnen. in die zin is IceRocket een zoekingang op weblogs. in die zin is een zoekingang op wetenschappelijke bronnen.

bekend verondersteld verschil tussen soorten diensten op internet
typerende aanbieders op internet domeinenstructuur en url-opbouw verschillende soorten zoekstrategieën en -doelen verschil/toepassing gidsen versus zoekmachines werking en geavanceerde opties van zoekmachines betekenis van recall en precision betekenis diepe/onzichtbare web wijze van ranking zoekmachines, werking PageRank startpagina voor zoekhulpmiddelen

soorten informatiebronnen
naar aard van informatie wetenschappelijke informatie naslagwerken nieuwsberichten krantenartikelen (digitale) boeken ... naar “medium” webpagina’s pdf’s images videos weblogs rss-feeds tweets ... ander onderscheid: primair - secundair - tertiair KNMI - weer-startpagina - StartNederland doorzoekbaarheid alleen metadata full-text Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

soorten informatiebronnen
niet al zulke combinaties zijn zinvol/mogelijk webpagina pdf image video weblog tweet rss-feed wetenschap naslag nieuws kranten eBooks ... Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

informatiebronnen en hun zoekingangen (de zoektools)
kun je alles (ook) met Google vinden? welke Googles (en Bing’s) zijn er allemaal? (image-, blog-, video-, news-, book-, scholar-, groups-search, maar meeste ook geïntegreerd in gewone Google) kun je met die Googles alles vinden? welke alternatieven zijn er voor die Googles? (zie bijv. Browsys Advanced Finder ) [voor sommige zoektools werkt direct zoeken niet goed meer] alternatieven voor het diepe (en betaalde) web Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

boeken & (wetenschappelijke) artikelen
Google Books Hathitrust Digital Library (open book scan project) Amazon (ook reviews, inhoud, boek-boek citaties) Worldcat (catalogus van bibliotheken met postcode-functie) Librarything (catalogus van boeken van bezitters) GoodReads (reviews, recommandatie, vrienden, ...) Picarta Bibliotheek.nl DOAB (directory of open access books) Open Textbook Catalog (open access leerboeken) enz. artikelen (e.d.) Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

boeken & (wetenschappelijke) artikelen (2)
artikelen (e.d.) Google Scholar (artikelen, rapporten, proefschriften, ...) Omega / sEURch / UvA-library (zoeksystemen van UU / EUR / UvA) Scirus / SciVerse (artikelen van Elsevier, uit databases, webpagina’s) OAIster / Scientific Commons (uit academische repositories) NARCIS ( proefschriften, publicaties [veel artikelen] uit NL) DOAJ (artikelen in Open Access tijdschriften) CORE (artikelen in Open Access tijdschriften) Magportal (ook -Engelstalige- publiekstijdschriften) DeepDyve (wetenschappelijke artikelen "te huur") enz. Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

boeken & (wetenschappelijke) artikelen (3)
artikelen (e.d.) vakspecifiek zoeken (gratis zoekingangen; vaak alleen de metadata) geneeskunde: Pubmed economie: RepEc computerkunde, informatica: CiteSeer onderwijs: ERIC (hoge energie-) fysica: SPIRES-HEP bibliotheekwetenschap: LISTA filosofie: International Philosophical Bibliography transport: TRIS enz. Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp 12 12

boeken: Google Books Van kaft tot kaft gescand (en doorzoekbaar!)
Sterk voor ontdekken van niet-hoofdinhoud van boeken Vaak beperkt doorbladerbaar (no preview / snippet view / limited preview / full preview) Content via uitgevers en via grote bibliotheken Probleem met copyrighted materiaal uit bibliotheken Vergeleken met Amazon search inside: meer oud, minder recent Ook ‘My Library’ optie vb NL-boeken niet alleen uit Gent (en binnenkort KB), ook uit US/UK Nu ook enkele ‘magazines’ Metadata op about-this-book-pagina Bibliotheken linken vanuit catalogus (bijv. Picarta)

wetenschap: Google Scholar
> 100 miljoen wetenschappelijke publicaties verschil full record en aanwezigheid als ‘citation’ verschil full-text links en bibliografische links concurrent van Web of Science, Scopus, Picarta, Scirus, OAIster, DOAJ, Ingenta, gericht geïndexeerd in vele bronnen (uitgevers, abstract-databases, universiteiten, repositories, ...) met citaties! aantallen citaties mede gebruikt voor ranking (waardoor recente publicaties relatief laag scoren) .... >>

wetenschap: Google Scholar
.... advanced search beperkt, nog veel fouten door computer-generated metadata van zoekresultaat naar volledige tekst vaak een probleem (niet aanwezig, alleen tegen betaling) soms veel versies van artikel (waaronder wel gratis) koppeling aan bibliotheekbezit, Google Scholar library programme voegt links naar eigen bezit toe geen info over bronnen, updates Maak nu de opdrachten van onderdeel 1

2. feiten & naslag encyclopedieën e.d. vragen & antwoorden
wikipedia > overzicht in Yahoo Directory overzicht in Open Directory internet movie database vragen & antwoorden Quora Yahoo-answers FAQs: internet FAQ consortium zoekmachine voor naslagwerkpagina’s + berekening Wolfram Alpha woordenboeken, vertaaldiensten e.d. enz. Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

wikipedia in >250 talen
levert “wisdom of the crowds” altijd “wisdom”? goed voor “feitelijke” onderwerpen veel detailonderwerpen (20 miljoen lemma’s, 1 miljoen NL) soms nuttig om relevante eigen publicaties / boeken uit eigen collectie als referenties aan lemma toe te voegen toch wel beleid & beheer: stewards, administrators Qwika: wikipedia metasearch (1158 wiki's in 12 talen, incl. computer-vertaling)

2. feiten & naslag (2) encyclopedieën e.d. vragen & antwoorden
zoekmachine voor naslagwerkpagina’s + berekening woordenboeken, vertaaldiensten e.d. answers.com (voert een metasearch uit) Roget thesaurus Acronymfinder Bartleby Google Translate(d search) > Mijn Woordenboek synoniemen Synoniemen.net overzicht in Open Directory overzicht in Open Directory Nederlands enz. Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

vertaalt Nederlandse zoekvraag in aangevinkte taal/talen en vertaalt daarmee gevonden resultaten weer terug naar het Nederlands

Maak nu de opdrachten van onderdeel 2

3. nieuws, kranten, tijdschriften
Google News Yahoo News BBC , CNN e.d. nu.nl € LexisNexis, € Factiva krantensites (overzicht: startnederland.nl) tijdschriftensites (overzicht: startnederland.nl) Newslink-magazines .... [weblogs & tweets: zie 5 en 6] [video/tv-nieuws: zie 7] Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

gespecialiseerd: Google News
Engelstalig nieuws uit 4500 bronnen + aparte versies in andere talen dan Engels: chinees (1000 bronnen) duits (700 bronnen) frans (500 bronnen) hebreeuws (100 bronnen) italiaans (250 bronnen) japans (600 bronnen) koreaans (550 bronnen) nederlands (>400 bronnen) portugees (200 bronnen) spaans (700 bronnen) enz. Maak nu de opdrachten van onderdeel 3

4. archief & oud nieuws web archive
(oude versies van websites, terug tot 1996, ingang via -oude- url) historische nederlandse kranten (versnipperd aanbod) historische kranten KB landelijke krantendatabank (ook papieren collecties) Los: Groene Amsterdammer (>1877), Leeuwarder Courant (>1752) € LexisNexis ‘echte archieven’ via Archieven.org Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp Maak nu de opdrachten van onderdeel 4

5. blogs & rss-feeds Google blogsearch Icerocket Technorati
(Exalead >> achteraf inperken op blogs ) denk aan verschil tussen ingang op individuele berichten en ingang op blogs of feeds als geheel wie citeert wie? (google blogsearch) filtermogelijkheid op “autoriteit” ?=? belang, kwaliteit, .... filter op termen binnen je feedreader blogs of onderwerp volgen met blogsalert? #hashtags Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

5. blogs & rss-feeds zoeken naar RSS feeds (meer dan alleen blogs)
CTRLQ: RSS Searchhub: overzicht (op "makeuseof") voor vinden van feeds van bepaalde bron / website voor vinden van feed waarin bepaald onderwerp Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp Maak nu de opdrachten van onderdeel 5

6. tweets en social search (1)
Twitter in 140 tekens vaak met verkorte links vaak met foto- of video-link vaak met hashtags (#afgesprokentrefwoord) zoeken (vaak beperkt tot berichten uit laatste 1 à 2 weken) twitter (ook advanced search) tweetzi, topsy, kurrently, postpost, … snapbird (hele tijdlijn van 1 tweep) tweetscan (op beperkte schaal wel oudere berichten) twicsy (foto's op twitter), ... bing - social (ook Facebook) overzicht/vergelijking tools: All the easiest ways to search old tweets Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp 27 27

veel hulptools twubs (bijv. bij congres) : volg in real-time alles met bepaalde hashtag en voeg die tag automatisch toe aan eigen berichten whathashtag : welke hashtags meest toegekend bij zoekterm? ... Twitter als continue informatiebron: volg de "juiste" personen die interessante nieuwtjes, rapporten, artikelen via Twitter delen links uit tweets automatisch bewaren als social bookmarks met delicious zelf (tabblad sources) via packrati.us >> delicious, pinboard, diigo, ... Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp 28 28

“Real time / social search engines” socialsearcher, socialmention, samepoint, whostalkin, … (tweets + blogs + facebook + …) Google personal results / Google+ ("search plus your world") real-time foto’s: skylines Forumdiscussies omgili, boardtracker, ... Google groups (ook oude nieuwgroep-discussies) voor methoden van onderzoek: adviezen van Henk van Ess in "de digitale detective" (2012) How to: use social media in newsgathering (2012) 100+ Social Media Monitoring Tools (2010) Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp Maak nu de opdrachten van onderdeel 6 29 29

7. multimedia images video audio
Google-image (simpele beeldherkenning; ook foto’s uit Picasa) Yahoo-image (ook veel foto’s uit Flickr) Bing-image Exalead-image (veel verschillen in zoekresultaten door verschillen in “tekstzoekvelden”) Flickr (zoekt vooral op tags; ondersteunt “Creative Commons” ) andere uploadsites: Pbase, Smugsmug, Photobucket, Zoom, Zenfolio Google (search by image), Tineye (zoekt exacte copieën), Tiltomo, Retrievr (voorbeeldzoeken met beeldherkenning op Flickr) speciale sites (beeldbank nationaal archief, wikimedia commons, ...) geografisch (panoramio [google-maps], worldc.am [instagram], ...) video audio Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp

7. multimedia (2) images video audio
YouTube (uploads - groei: 70 uur/minuut, ook advanced search) Youtube Edu channel Blinkx (omroepen - 35 miljoen uur video, spraakherkenning?) VoxaleadNews (met spraakherkenning - in meer talen - ook NL) Google-video (ook video’s uit YouTube; zoekt alleen in metadata) Bing-video ScienceCinema (met spraakherkenning! vooral energie-gerelateerde onderwerpen) TV-uitzendingen: Uitzending gemist, Beeld & Geluid, Academia audio Opdrachten: vergelijk opbrengst Engels versus Nederlands voor algemeen en nieuwsonderwerp Maak nu de opdrachten van onderdeel 7

8. gespecialiseerde versus algemene zoekingangen
selectief & vaak “dieper” dan algemene zoekmachine interne zoekfunctie van individuele site kant en klare onderwerpsgerichte zoekingangen Scirus (wetenschap algemeen) Findlaw (rechten USA) WebMD / Medscape (geneeskunde) Google-finance (financiële gegevens + nieuws) ..... homemade met: Google CSE, Blekko (slashtags) (zie: ) zelf selecteren welke sites (url’s) in zoekmachine moeten worden meegenomen

ingangen op diepe web toegang tot het diepe web
“handmatig” (elke database afzonderlijk doorzoeken) overzicht "Complete planet" bij BrightPlanet voor "wetenschap" al eerder verzamelzoeksystemen genoemd “halfautomatisch” (doorzocht via desktop metasearch engine) copernic-agent (metasearch vanaf eigen PC) “automatisch” (gegevens uit bepaalde database/bron zitten ook al -allemaal?- in algemene zoekmachines) bijv. catalogus UB Wageningen Automatisch bv bij NIWI (NOD?) Maak nu de opdrachten van onderdeel 7

9. zoeken met webzoekmachines
> 15% van webpagina’s in geen van grote zoekmachines van resterende wel geïndexeerde pagina’s zelfs Google maar 76%, Yahoo 69%, MSN 62% (2005) geen betrouwbare recentere cijfers mijn inschatting: Google nu iets kleiner dan Yahoo ? Google nu iets groter dan Bing ? maar nu: Yahoo==Bing ! Google nu ~10x zo groot als kleinere dekking zeer ongelijkmatig verschil in actualiteit verschil in dekking  verschil in ranking (vaak zeer weinig overlap bij eerste 10)

rangorde: google's pagerank
pagerank van pagina x is: PR(x) = (1-d) + d* {PR(yx) / C(y)} y elke "pagina y" die naar pagina x linkt draagt bij aan die som  PR(yx) = pagerank van pagina y die naar x linkt [link vanuit pagina die zelf hoge pagerank heeft, draagt meer bij] C(y) = aantal links in pagina y [link vanuit pagina die erg veel links bevat, draagt minder bij] d = "dempingsfactor" (ong. 0.85) waardoor: 0.15  PR(x)  

rangorde: extra factoren
pagerank is pas van belang als zoekwoord-gerelateerde (inhoudelijke) factoren weinig bepalend zijn, zoals: pagina relevanter als zoekwoord in titel pagina relevanter als zoekwoord in URL pagina relevanter als zoekwoord in koppen <H1> <H2> pagina relevanter als zoekwoord meer in begin van tekst pagina relevanter als zoekwoord daarin vaker wordt herhaald pagina relevanter als zoekwoorden daarin dicht bij elkaar pagina relevanter als zoekwoorden daarin in zelfde volgorde zeldzaam zoekwoord is belangrijker dan heel algemeen pagina relevanter als zoekwoord ook vaak in verwijzende link-tekst pagina relevanter als hij "lijkt" op eerder bekeken pagina's voor specifieke informatie over Google, zie bijv.: Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

andere algemene webzoekmachines
probeer naast Google eens: Bing (microsoft, groot) Yahoo! (content=Bing, groot) Exalead (frans, tamelijk klein, veel geavanceerde functies) Gigablast ("groene" zoekmachine, tamelijk klein, paar unieke functies) Blekko ("hashtags" om [domein-]selectiever te kunnen zoeken) DuckDuckGo (verzekert privacy, geen personalisatie, tamelijk klein) Ask (tamelijk klein, weinig unieks meer) in US hebben die samen nog 30% marktaandeel; in NL maar 3%

aantallen bij webzoekmachines
gemelde resultaataantallen zijn vaak zeer onbetrouwbaar bij Google (en andere) zijn vermelde aantallen niet stabiel, onbetrouwbaar, met soms onverklaarbare effecten inperken geeft soms groter aantal, uitbreiden kleiner aantal afhankelijk van verdeling index over servers Google afhankelijk van Google versie / ingelogd zijn / zoekgeschiedenis afhankelijk van keuze “your part of the world” bij Bing Danny Sullivan legt uit waarom Google niet kan tellen: Why Google Can’t Count Results Properly

omgaan met zoektermen .... belang van "juiste" zoektermen:
denk in termen van het te vinden document (wat zou in relevant document staan?) spellingvarianten, enkel-meervoud-werkwoord (zelf bedenken of automatisch - Google) truncatie (alleen Exalead) alternatieve zoektermen / synoniemen: soms automatisch bij Google te vinden met "thesauri" / synoniemenlijsten (mijnwoordenboek, synoniemen.net, Roget's, answers.com, Bartleby) te vinden via synoniemen uit Word-tekstverwerker te vinden door te kijken in wat al is gevonden .... Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

omgaan met zoektermen denk in termen van het te vinden document
(hoe zou het in relevant document staan?) .... "exact phrase"  losse woorden woordnabijheid: met term-wildcard ( * ) bij Google & Yahoo "veiligheid * * tunnels" met NEAR bij Yahoo, Bing, Exalead veiligheid NEAR tunnels met AROUND(n) bij Google veiligheid AROUND(4) tunnels eventueel een phrase van losse woorden (zonder "") ! invloed van volgorde van losse woorden op ranking (zie: Thumbshots – Ranking) Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

omgaan met zoektermen denk in termen van het te vinden document
(hoe zou het in relevant document staan?) .... voor opsomming: generiek zoeken vs. voorbeeld zoeken ( overzicht amerikaanse presidenten vs. clinton, johnson, reagan, obama, lincoln, ... ) gebruik context-specifieke zoektermen (event. slang, jargon) om te beperken tot specifieke context waarin onderwerp moet voorkomen (populair  wetenschappelijk ; volwassenentaal  jeugdtaal) gewicht specifieke term verhogen door herhaling (Google) Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

omgaan met zoektermen belang van "juiste" zoektermen:
gebruik van gesuggereerde termen vooraf: Google, Bing, Yahoo, Exalead achteraf inperken: Ask, Exalead, Gigablast, Scirus Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

zoektermen Booleaans combineren
bijzonderheden van Booleaans bij Google & Yahoo: je mag de AND's weglaten hier gaat -als enige systemen- OR voor AND je hoeft dus geen haakjes te gebruiken je moet i.p.v. "NOT" per losse term - (min)teken gebruiken voorbeelden: architectuur OR bouwkunst nederland OR holland -molens -windmolens i.p.v. (architectuur OR bouwkunst) AND (nederland OR holland) NOT (molens OR windmolens) "moderne OR hedendaagse bouwkunst" i.p.v. "moderne bouwkunst" OR "hedendaagse bouwkunst" wat helemaal NIET kan bij Google/Yahoo: (bouwkunst AND nederland) OR (architecture AND netherlands) Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

zoektermen Booleaans combineren
maar Booleaans bij Bing je moet WEL haakjes gebruiken bij OR je mag ook NOT gebruiken dus wel: (architectuur OR bouwkunst) AND (nederland OR holland) NOT (molens OR windmolens) of (architectuur OR bouwkunst) (nederland OR holland) NOT (molens OR windmolens) maar weer geen: "moderne OR hedendaagse bouwkunst" dat moet voluit: "moderne bouwkunst" OR "hedendaagse bouwkunst" Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

Booleaanse bouwsteencombinatie
bouwsteencombinaties met AND's en OR's (veilig OR veiligheid) AND lange AND (tunnels OR autotunnels OR verkeerstunnels) stapsgewijze opbouwen bij Google zoek op termen voor eerste bouwsteen: veilig OR veiligheid als Google-instant "aan" staat, zie je meteen al het resultaat (zonder op [search] te hoeven klikken) tik gewoon door met termen voor tweede bouwsteen; lange je ziet meteen weer het resultaat tik door met termen voor derde concept: tunnels OR autotunnels OR verkeerstunnels enz. resultaat: Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie Maak nu de opdrachten van onderdeel 8A

zoektermen: Google denkt voor ons
Google probeert de zoekvraag te verbeteren / verbreden automatische spellingcorrecties (veilgheid >> veiligheid) zoekt op woorden met dezelfde woordstam (enkel-/meervoud, werkwoordsvormen, vervoegingen, verbuigingen) afkortingen (jfk >> john f kennedy | wwii >> world war II) voegt synoniemen van woorden toe (vaccination >> immunization) bij losse zoekwoorden ook samengestelde term en omgekeerd (veiligheid maatregel >> veiligheidsmaatregel | catfood >> cat food) maakt soms een term optional als die niet discriminerend genoeg is dit alles wat vaker en uitgebreider in Engels dan in Nederlands personaliseert zoekactie op basis van eerder zoek/browse-gedrag en als je dat nou niet wilt >> "verbatim" Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

verbatim == "woordelijk"
vorige maand nieuw geïntroduceerde optie verbatim == "woordelijk" op google.nl: "woord voor woord"

exact zoeken en bijzondere tekens
woordstam-zoeken voorkomen met ".." ( "greenhouses" <geeft NIET> greenhouse effect ) ook (automatisch) op synoniemen zoeken met een ~ ( ~term [Google] ; maar pas op voor precisie-problemen ! ) op sommige leestekens kun je sinds kort zoeken (&, %, ..) (maar niet op allemaal - €, /, ", komma, ...) getallen werken net als woorden, maar: komma wordt gelezen als spatie, net als andere leestekens (12,93  , maar 100,000 wel  ) punt kan wel (12.93  12.93) getallen zoeken in range ( of $10..$20, uniek voor Google) Opdracht zoekactie verfijnen tot er bij de eerste 50 geen niet-relevante meer zitten, lettend op deze punten; gebruiken thesaurus of Word-synoniemen; truncatie

velden, formele kenmerken
beperking op formele vereisten : taal, datum, domein, land/werelddeel, bestandstype, media veldspecifiek zoeken (titel, url, links) : wanneer wel / niet? zoeken via backlinks (koppelingen naar …) : link:url , maar pas op: Google geeft beperkt resultaat alternatief: opensiteexplorer.org (gratis versie: 3x per dag ...) domein (site) : meervoudig sitefilter (bij Gigablast of Google-syntax kennen) met Google-syntax kan in eenvoudig zoekscherm vaak meer dan in voorgeprogrammeerde “advanced search” bijv. filetype:rss / site:microsoft.com OR site:google.com selectie vooraf vs. achteraf inperken via "more search tools" op datum zoeken .... >>

formele kenmerken, datum
op datum beperken : = meestal datum van -recentste- indexering door zoekmachine (niet werkelijke datum van publicatie) Google advanced search biedt Google minder opties dan in linkermenu: hour / past 24 hours / week / month / year / custom bij Google resultaat achteraf inperken op periode:  "more search tools" - "custom range" - "from: .. to: .." bij Exalead (vooraf inperken - exacte voor/na datum) hoe datum van publicatie van gevonden pagina te controleren als niet op webpagina zelf? soms werkt: javascript:alert(document.lastModified) maar helaas steeds vaker niet meer …. Maak nu de opdrachten van onderdeel 8B

10. vergelijken en beoordelen van (zoekingangen van) bronnen
wat voor soort materiaal zit er in primaire (c.q. full-text) vs. secundaire informatie naslag / nieuws / onderzoekresultaten / statistieken / websites / artikelen / boeken / rapporten / ... welk onderwerpsgebied welke doelgroep (niveau) hoeveel zit erin (aantal items, dekkingsgraad, ...) vaak moeiliijk te bepalen door verschillen in functionaliteit en onbetrouwbare aantallen voor zoekresultaten uit zoekmachines hoe goed werkt het zoeksysteem (functionaliteit, gebruiksgemak, selectiviteit, ...) wat is de kwaliteit van de content zie bijvoorbeeld JISC Academic Database Assessment Tool bekijk: bron zelf / Wikipedia / leveranciers / JISC

beoordelingscriteria voor websites
Goede opmaak Aanduiding maker/auteur (“about us”) Aanduiding postadres, telefoonnummer Aanduiding doel/doelgroep Geen reclame en pop-ups Heldere navigatie Interne zoekfunctie Voldoende snelheid server Backlinks door gezaghebbende organisaties Up to date? Zinnige datering inhoud Geen grof taalgebruik Geen kinderlijk taalgebruik Geen storende taalfouten Zelfs als alles in orde lijkt, bij gevoelige onderwerpen toch nog uitkijken Lookup: of Maak nu de opdrachten van onderdeel 9

11. bijblijven met bronnen & zoeken
Weblogs: Resourceblog InfoDocket (Gary Price) SearchEngineLand (Sullivan, Sherman) InternetNews/WebSearchGuide (Gwen Harris) Phil Bradley's weblog Search Engine Showdown (Greg Notess) Inside Search (Google search blog) FUMSI “Spion” op bronnenlijst (Copernic Tracker, WatchThatPage, …) RSS-feed op lijsten indien aanwezig Pandia FreePint

bijblijven met behulp van RSS
Rich Site Summary / Really Simple Syndication voor sites met (on)regelmatig nieuwe actuele inhoud, bijvoorbeeld nieuwsbrieven, weblogs (+ ook sommige databases) lezen, beheren als ware het maakt gebruik van xml-structuur vereist software (reader), bijv. Feedreader, Feeddemon, Shrook, … of online lezen bijv. bij Google Reader of Netvibes toevoegen van een ‘feed’: klik bij pagina op oranje (soms blauw) rss- of xml-logo en voeg url daarvan aan reader toe drie nauwverwante formats: rss/atom/rdf (readers multiformat) RSS-feeds zoeken: blogberichten zoeken: Google Blogsearch, Technorati, IceRocket, real-time search [zie eerder]

“resources” en hun zoeksystemen op internet

Verwante presentaties

Presentatie over: "“resources” en hun zoeksystemen op internet"— Transcript van de presentatie:

Verwante presentaties

Over het project

Feedback

Inloggen

Inloggen via een sociaal netwerk:

“resources” en hun zoeksystemen op internet

Verwante presentaties

Presentatie over: "“resources” en hun zoeksystemen op internet"— Transcript van de presentatie:

Verwante presentaties

Over het project

Feedback