To Google or not to Google hoe zoeken we op het web? Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- en Informatie Management (Hogeschool.

Slides:



Advertisements
Verwante presentaties
HET DIGITALE ARBEIDSPLEIN Het Digitale Arbeidsplein is een website ontwikkeld in het kader van het project “Zelfmanagement van de eigen loopbaan” van MeijerConsult.
Advertisements

Er zijn 3 methodes om slimmer te zoeken. 1.Door toetscombinaties te gebruiken. Bij windows: Alt + Tab = schakelen tussen programma’s. Windows + D = bureaublad.
RECLAME OP INTERNET ASCC Clubmiddag 15 april 2014.
Ebook Library – Eenvoudig zoeken. In deze demo EBL Eenvoudig zoeken: •Snel zoeken •Browsen op categorie of onderwerp •Volledige tekst doorzoeken NB: EBL.
Workshop Zoekmachine optimalisatie workshop internet marketing
Welk effect heeft uw Website? Gerard Duursma Online Marketeer linkedin.com/in/bonopoly.
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 18 mei 2011 Wageningen.
Web 2.0 en de informatievoorziening Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- en Informatie Management (Hogeschool van Amsterdam)
thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.
Topic 1: Social Media Innovative Generations © Innovative Generations.
Search & Retrieval de Googl ificatie van onze samenleving
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
To retrieve or not to retrieve, that's the question retrieval van wetenschappelijke informatie eric sieverts.
Zoeken met Google Door Kick de Wolff 13 juni 2006.
The new Amazon Easy Intuitive Clean Powerful Tags User friendly.
Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- en Informatie Management Hogeschool van Amsterdam DARE zomerschool - juni Tilburg.
Google Scholar de googlificatie van de wetenschap ? Eric Sieverts
Philosopher’s Index Zoekresultaten uitbreiden door te zoeken in meerdere databases tegelijk Klik met muis = verder gaan.
1 RSS en weblogs zoeken Jeroen Bosman VOGIN, 14 april 2008 Leiden.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 mei 2011 Wageningen.
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 23 november 2009 Wageningen.
1 realtime & social: blogs & tweets Jeroen Bosman VOGIN, Wageningen, 16 mei 2013.
1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 20 juni 2013 Wageningen.
1 Weblogs, RSS en tweets zoeken Jeroen Bosman VOGIN, 20 mei 2010 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 november 2010 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 18 mei 2010 Wageningen.
1 RSS, weblogs en tweets zoeken Jeroen Bosman VOGIN, 23 november 2009 Wageningen.
Workshop Informatievaardigheden Propedeuse FHSS Mediatheek TF.
Wauw!!! Google Panda update WAUW !!!!. Google Panda update Plots geen bezoekers en/of omzet meer? In de US had deze update een impact op bijna 12% van.
Google WEB Services 6 oktober Wat zijn WEB services ? Google WEB Services Applicaties via het WEB Ruimte beschikbaar stellen op het WEB Communicatie.
1 realtime and social: blogs & tweets, FB & G+ Jeroen Bosman VOGIN, 17 november 2011 Wageningen.
Les Informatica 02/03/2004 Yperman Hans
Aan de slag met weblogs Pierre Gorissen 14 juni 2005.
Website Mediacentrum Ga naar “Hulp bij zoeken”  “Toegang tot de databanken”  “VPN installeren” Voordat je gebruik.
Website Mediacentrum Hogeschool Leiden:
Bronnenonderzoek PWS-seminar V5 13 juli 2014
Hoe krijg ik volk op mijn site? Keywords Titles Descriptions.
PADS4 maakt het eenvoudig om informatie te verspreiden naar een specifiek publiek op de juiste plaats en het juiste moment PADS4 is een professionele oplossing.
Webmaster ToolsWebmaster Tools Google Webmaster Tools Gedetailleerde rapporten over uw pagina's in Google. Weet wat google van u vind! Ontdek.
realtime & social: blogs & tweets
Inhoud Presentatie 1. Probleemstelling onderzoek 2. Wat is een search engine? 3. Geschiedenis van search engines 4. Hoe werkt een search engine? 5. Welke.
Wat is Social Media? Verzamelnaam voor alle internet toepassingen waarmee het mogelijk is om informatie met elkaar te delen: Tekst (nieuws, artikelen)
Literatuur zoeken. VOORBEREIDING - Wat wil je weten? - Wat is de exacte zoekvraag? - Welke aspecten wil je uitzoeken? - Zet de vraag om in zoektermen.
Blackboard Diensten Mediacentrum Instructies “Thuis toegang tot de databanken” Print deze instructie uit en volg de aanwijzingen op.
Kennismanagement & Sociale media
Online filmpjes maken. (
1 Bijblijven met het web: RSS, attenderingen en trackers Jeroen Bosman VOGIN, 3 november 2006 Wageningen.
Online filmpjes maken. (
Social Media – Topic 1 Originalosboys. Wat is Social Media Verzamelbegrip Het ontstaan van Social Media Invloeden van Social Media.
Phone Challenge Workshop Mbo niveau l Jouw telefoonkosten l Film ‘Een dag vol data’ l Dataquiz l Abonnementen vergelijken l De Mobiel Profiel.
Webteksten en SEO Wat hebben zij met elkaar te maken?
Iedereen gebruikt social media.
Search engines welk instrument voor welke taak eric sieverts Universiteitsbibliotheek Utrecht Instituut voor Media en Informatiemanagement / HvA Eric Sieverts.
1 Phone Challenge Workshop 2015 Niveau 1+2 mbo. Introductie.
Van librije tot digitale bibliotheek: de universiteitsbibliotheek utrecht eric sieverts.
1 realtime & social: blogs & tweets Jeroen Bosman VOGIN, 19 november 2015 Wageningen.
Social media. Agenda Over ons Facebook Twitter Linkedin Instagram.
Hoe positioneer ik mijn uitgeverij 10 do’s en dont’s Windkracht62 1 WINDKRACHT (0) Ian Muller.
Basics SERP = Search Engine Results Page Betaalde resultaten = SEA Natuurlijke resultaten = SEO Search Engine Optimization SEO is een lange termijn verhaal.
SEO Kateryna Glushak en Saartje Van Broeckhoven. Wat?  Search Engine Optimization  Zoekmachineoptimalisatie  Techniek om website hoger te laten scoren.
Social bookmarking Evy Mertens Maud Schyns Laurent Mulliez Lien Staelens.
Maak je website beter vindbaar!
Zoeken op internet
Attenderingen instellen op zoekacties (search alert)
realtime & social: blogs & tweets
Attenderingen instellen op zoekacties (search alert)
Goochelen met Google Zoeken
Wie zoekt, die vindt…!!! Workshop Zoekvaardigheden Profielwerkstuk MAVO Mediatheek De Nassau.
Marketing en zoekmachines
Transcript van de presentatie:

to Google or not to Google hoe zoeken we op het web? Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- en Informatie Management (Hogeschool van Amsterdam)

zoekmachines zijn er al lang lycos in 1994 de eerste "echte", met bijna 1,5 miljoen pagina's altavista in 1996 de nieuwste grootste, met ruim 30 miljoen pagina's maar geen van alle heeft ons gedrag én zelfs onze taal zo beïnvloed als

wat maakte anders ? zijn "kale" interface zijn goede zoekresultaten (al geeft elke zoekmachine -bijna- exact wat je vraagt) –andere, betere relevantie-ordening –grote dekking (> 20 miljard) geeft vaker goed resultaat –goed voor simpele vragen van de grote massa zijn timing –Microsoft meldt eind 2004 index van 5 miljard pagina's, Google 3 dagen later: index 4  8 miljard pagina’s –Elsevier brengt eind 2004 definitief Scopus uit, Google komt binnen 2 weken met Google Scholar zijn PR –company motto: "Don't do evil“ –everyone loves Google (or don’t we?) Eric Sieverts | | |

Google 1960

marktaandeel zoekmachines (schattingen medio 2006) UK NL USA

agenda 10 redenen om Google te gebruiken 10 redenen om Google NIET te gebruiken web 2.0? trends in zoeken Eric Sieverts | | |

waarom Google gebruiken 1. Google is de grootste 2. Google is zo eenvoudig in gebruik 3. uitstekend ranking mechanisme 4. slimme automatische vraagverbetering 5. vraagexpansie met synoniemen 6. extra online tools 7. veel offline tools & online diensten 8. additionele zoekmachines voor andere media 9. automatische attenderingsdienst 10. bewaart desgewenst je zoekgeschiedenis Eric Sieverts | | |

1: google is de grootste hoewel Google zelf geen aantal pagina’s meer opgeeft, hoewel Searchenginewatch en Searchengineshowdown geen groottes van zoekmachines meer vermelden, blijkt uit zoekresultaten dat Google gemiddeld wat vaker meer oplevert dan runner-up Yahoo! en Google zeker groter is dan Ask, LiveSearch, Exalead of Gigablast Eric Sieverts | | |

2: google eenvoudig in gebruik het “kale” zoekscherm van Google is de usability benchmark voor zoeksystemen geworden iedereen kan met Google uit de voeten (en iets vinden) als een zoeksysteem ingewikkelder is dan Google, wordt het niet meer gebruikt (?) maar: Google kan ingewikkelder zijn dan het er uitziet! Eric Sieverts | | |

3: uitstekend ranking mechanisme “pagerank” was eerste mechanisme waarin “democratisch bepaalde kwaliteit” van gevonden informatie meespeelde PR(x) = (1-d) + d*  {PR(y  x) / C(y)} y maar dat jouw pagina niet altijd als eerste uit Google komt, ligt minder aan Google dan aan jouw pagina “pagerank” vooral maatgevend voor ranking-volgorde bij “stupid one-word queries” bij “intelligenter” queries goede ranking vooral op basis van andere parameters (positie, phrases, woordvolgorde) maar: LiveSearch biedt mogelijkheid ranking zelf te tunen Eric Sieverts | | |

4: ingebouwde vraagverbetering Google zoekt automatisch op enkel- en meervoud en nog enkele woordvarianten van Engelse woorden op de Engelstalige site Google doet dat met sommige Nederlandse woorden op de Nederlandstalige site, maar niet heel consistent Google doet dat slim voor bepaalde vaste afkortingen (JFK, WWII) Google doet dat ook voor bepaalde Nederlandse namen op de Nederlandstalige site maar: nogal onduidelijk wat wanneer wel of niet Eric Sieverts | | |

5: vraagexpansie met synoniemen door ~ voor een (Engelse) zoekterm te zetten, zoekt Google ook op (Engelse) synoniemen van dat woord maar: levert vaak meer troep dan verbetering Eric Sieverts | | |

6: extra online tools via gewone zoekvenster is Google ook: rekenmachine ( 3*7/5 ) omrekenaar ( 87F in C ) valutahulp ( 27USD in EUR ) adreszoeker ( 650 Madison Avenue, Albany, NY ) telefoonboek ( john smith, schenectady, ny ) definities ( define:relevance ) enz. Eric Sieverts | | |

7: offline tools & online diensten Google toolbar Google desktop Picasa – foto’s beheren en uitwisselen Google mail online RSS reader online tekstverwerker online spreadsheet Blogger weblog host coop – custom search engine Google suggest enz. Eric Sieverts | | |

8: zoeken in andere media image search newsgroup search video search blog search news search (voor 10 talen) book search google scholar google maps / google earth shopping search finance search desktop search program code search Eric Sieverts | | |

8: zoeken in nieuws Eric Sieverts | | | Engelstalig nieuws uit 4500 bronnen + aparte versies in andere talen dan Engels: –chinees(1000 bronnen) –duits(700 bronnen) –frans(500 bronnen) –hebreeuws(100 bronnen) –italiaans(250 bronnen) –japans(600 bronnen) –koreaans(550 bronnen) –nederlands(>400 bronnen) –portugees(200 bronnen) –spaans(700 bronnen)

9: persoonlijke attenderingsdienst regelmatige attendering via mail, op basis van eigen zoekvraag, uit: –web –nieuws –nieuwsgroepen –blogs Eric Sieverts | | |

10: bewaart je zoekgeschiedenis als je een account hebt aangemaakt, kan je zoekgeschiedenis worden bewaard je kunt zo terugvinden hoe je eerder hebt gezocht je kunt zo terugvinden wat je eerder had gevonden (als je resultaten wel hebt aangeklikt, maar hebt vergeten te bookmarken) Eric Sieverts | | |

waarom Google NIET gebruiken 1. Google biedt geen truncatie en “proximity” search 2. Google biedt geen goede tijdinperking 3. Google zoekt niet op metadata 4. Google biedt geen reproduceerbare resultaten 5. Google levert veel minder backlinks 6. Google biedt geen hulp zoekvraag te verfijnen 7. voor video zijn YouTube en Blinkx veel beter 8. voor blogsearch is Technorati beter 9. problemen met privacy? 10. Google biedt weinig web-2.0 functionaliteit Eric Sieverts | | |

1: geen truncatie en proximity maar: Google zoekt (in Engels) toch al op enkel- en meervoud woordnabijheid telt toch al flink mee bij ranking meeste andere grote zoekmachines bieden dat ook niet uitzondering: Exalead Eric Sieverts | | |

truncatie proximity fuzzy

2 : geen (goede) tijdinperking alleen heel beperkte keuze: laatste 3 / 6 / 12 maanden en dat werkt bovendien NIET goed wel ongedocumenteerde "daterange" optie met gebruik van juliaans datum format daterange: maar dat werkt bovendien NIET goed wel gedetailleerd en betrouwbaar mogelijk bij AllTheWeb, AltaVista of Exalead Eric Sieverts | | |

2 : geen (goede) tijdinperking Eric Sieverts | | |

3: Google zoekt niet in metadata Google niet i.v.m. mogelijk misbruik van metadata maar andere doen dat wel (weer): yahoo, alltheweb, altavista, ask, hotbot, gigablast (maar meestal niet meer dan eerste 16 of 24 keywords) die vinden dus makkelijker pagina’s met weinig “eigen” tekst Eric Sieverts | | |

buitenbeentje: Gigablast ondanks zijn naam, met 10 G niet zo groot als Google of Yahoo maar wel groot aantal metadata zoekvelden en juist andere dan keyword(s) en description!  alleen jammer dat er zoveel webpagina's zonder dat soort metadata zijn  alleen jammer dat ze dan meestal niet op standaard wijze gebruikt worden Eric Sieverts | | |

metadata zoeken bij Gigablast city:amsterdam country:belgium state:alabama author:eric subject:soccer language:french audience:youth dc.creator:eric dc.language:dutch enz. Eric Sieverts | | |

4: geen betrouwbare aantallen gevonden aantal van zelfde vraag blijkt vaak telkens verschillend bij bekijken van afzienbaar aantal resultaten zie je pas bij bekijken van hele lijst hoeveel echt is gevonden (meestal minder) niet duidelijk wanneer op woordvarianten wordt gezocht Booleaanse resultaten kloppen (daardoor?) vaak niet verschillen tussen NL en USA versie maar: bij Ask en andere zoekmachines soms ook rare effecten Eric Sieverts | | |

4: geen betrouwbare aantallen voorbeeld: recept AND doornhaai123 (in resultaat ook “recepten”) recepten AND doornhaai195(in resultaat geen “recept”) (recept OR recepten) AND doornhaai123 Eric Sieverts | | |

5: veel minder backlinks met “link zoeken” vindt Google altijd vele malen minder webpagina’s die een link naar een opgegeven URL bevatten dan Yahoo, AllTheWeb, AltaVista of Exalead maar: het zijn de minst belangrijke (met laagste pagerank) die ontbreken Eric Sieverts | | |

6: geen hulp bij verfijnen zoekvraag omdat mensen vaak slecht zoeken en veel te veel vinden, is het vaak nodig zoekvragen te verfijnen sommige zoekmachines bieden daarbij hulp door statistische analyse van woorden uit zoekresultaat (Ask, Quintura/Yahoo, AllTheWeb, Clusty) sommige zoekmachines delen resultaat (ook) op naar meer formele kenmerken (Exalead) Eric Sieverts | | |

Google video begon ooit met publieke TV-programma’s van de satelliet in Californië, met gebruikmaking van de ondertitels voor slechthorenden om op te zoeken halfslachtige switch naar uploads door gebruikers YouTube intussen veel populairder voor het uploaden, het uitwisselen en het via tagging karakteriseren (van al die slechte met mobieltjes opgenomen filmpjes) daarom [?] recent opgekocht door Google Blinkx bevat veel meer, ook professioneel materiaal van nieuwsdiensten, via spraakherkenning “full-text” zoeken Eric Sieverts | | | 7: YouTube & Blinkx veel beter voor video

uploaden  crawlen kwaliteit vaak slecht  veel professioneel materiaal “metadata” (tagging)  spraakherkenning meer browsen dan  full-text zoeken zoeken 7: YouTube & Blinkx beter voor video

8: blogsearch liever met Technorati voor blog-posts is Technorati vaak completer (zeker voor niet-Engelstalig) en wat sneller aparte zoekmachines voor podcasts (audio & video van omroepen, amateurs en ook bedrijven) zelfs met “full-text” search via spraakherkenning en aanduiding na hoeveel minuten het zoekwoord voorkomt Eric Sieverts | | |

9: privacy problematiek bij Google, identificeer je je als je contact maakt –voor -dienstverlening (Gmail) –voor persoonlijke attendering (Google alerts) –voor bewaren van je persoonlijke zoekgeschiedenis dan wordt veel van je voor lange tijd bewaard: –al je verdere zoekacties EN OOK alle aangeklikte resultaten –surf-gedrag via Google-toolbar –en google maakt (voor jou privé) full-text index op al je Gmail –en ze kennen de onderwerpen van "alerts" die je hebt lopen ze weten dus heel veel van je, zeker als ze ook nog slimme textmining technieken op die gegevens loslaten dat kunnen en willen ze om advertenties en resultaten te kunnen leveren die voor jou persoonlijk relevanter zijn; aan die nieuwe ranking technieken wordt al gewerkt Eric Sieverts | | |

geruststellend motto van Google is "do no evil" –ze beloven je privacy te respecteren –ze hebben ook rechtzaak gewonnen van het US Dept. of Justice die gebruiksgegevens van ze wilde hebben (en ze van andere zoekmachines ook kreeg!) maar wie garandeert dat dat altijd zo blijft, tegenover elk rechtssysteem, en tegenover elke overheid? how about privacy ?

10: Google weinig web 2.0 aware veel van Google's oplossingen berusten op software, veel aspecten van web 2.0 vooral op "peopleware" honderden nieuwe diensten en startups (en ook Yahoo!) leggen wel "de macht bij het volk" bij Google zelf –geen tagging –geen tagclouds –weinig sociale netwerken maar wel in zekere mate: –overnames van web 2.0 successen –ajax-achtige browser-based toepassingen –rss en blog ondersteuning Eric Sieverts | | |

auteurs

wat valt onder Web 2.0 ? zelf publiceren (blogs, wiki's, foto's, video's, podcasts, …) zelf het nieuws bepalen (newsvine, digg, postgenomic, …) zelf bookmarken (del.icio.us, myweb, furl, H2O playlist, connotea, citeulike, …) zelf "ontsluiten" (taggen van eigen en andermans spul: flickr, del.icio.us, digg, youtube, technorati, rawsugar, …) zelf netwerken (hyves, myspace, orkut, facebook, …) zelf zoekmachientje "maken" (rollyo, wink, yoono, stumbleupon, google-coop) samen voor ons zelf ("delen" bij al het bovenstaande)

Web 2.0 en zoeken social software en tagging als concurrentie voor het "echte" zoeken? "most popular"  zelf omschreven behoefte tags  metadata tag cloud  zoekvenster andermans advies  zelf zoeken notification (rss)  zelf zoeken amusement  werk en studie Flickr.com  klassieke image-search YouTube  Blinkx

verdere trends in het zoeken disclaimer: "ik ben geen trendwatcher" weer concurrentie bij gewone zoekmachines (Ask, Exalead, …) weer concurrentie bij wetenschappelijk zoeken (Academic Live, Scirus, OAister, DOAJ, …) weer concurrentie bij full-text boek-zoeken (Microsoft, Yahoo!, …) weer concurrentie bij gespecialiseerd zoeken –specialisatie op media –specialisatie op toepassingen –specialisatie op domeinen ook relevance ranking gepersonaliseerd