Zoekmachines ICT voor Studie en Werk College 6 5 oktober 2006 Toine Bogers.

Slides:



Advertisements
Verwante presentaties
Inleiding Youtube Google Overname Adverteermodel Viral Video Zoekmachine Picasaweb KPN Videosite Inleiding Presentatie waarover?
Advertisements

Van Web 1.0 over Web 2.0 naar … 3Dinternet Valère Awouters lokaal 3.07 Het internet is in volle evolutie. In de 1ste generatie van het internet.
RSI? zoeken naar de in de e-hooiberg >
1 Samenwerkend leren met Google Docs Werking en mogelijkheden van online tekstverwerken.
SURFnet Search Engine NG Opzet en uitgangspunten Utrecht, 09 juni 2004 Henny Bekker.
Welk effect heeft uw Website? Gerard Duursma Online Marketeer linkedin.com/in/bonopoly.
Efficiënt zoeken Informatie zoeken op verschillende manieren Je hebt een URL of hyperlink bij de hand VVVVb. W W W W W WWWW WWWW.... SSSS IIII TTTT.
Social Technographics Hoe ontwikkel je een succesvolle social media strategie? Reineke Reitsma Director, Consumer Technographics Forrester Research 11.
Alfalab Microtoponiemenproject Expertmeeting (annotaties) Meertens Instituut 8 April 2010 Charles van den Heuvel Virtual Knowledge Studio for the Humanities.
Internet College 2 Architecturen. Architectuur van netwerktoepassingen •Peer to peer –Windows werkgroep •File- en printer sharing •Internet connection.
Mashups for the masses Maarten Brugman & Sven Vintges Atos Origin SI Center of Excellence RIA.
Internet world Web 1,2,3.0 Web 1.0 – (statische informatie) * Informatieve websites Web 2.0 – 2004-heden (dynamische informatie) * Discussieforum.
Digitale tools: SlideShare
JQuery en ASP.NET Bart De Meyer.
Access en MySql Ynte Jan Kuindersma, BIRD Automation Nationale Officedag 2009 EDE, 14 Oktober 2009.
Project Combat Casper Bommelé Marc Eekhout Michel van der Hut
Cloud Computing woensdag 20 november Wat is Cloud Computing ? Cloud Computing.
Lucene/SOLR 1: inleiding + indexering
Minicollege Bedrijfsbezoek
DATA over. Visie Elk jaar neemt behoefte aan data en interactie tussen systemen (zowel B-2- B als B-2-C) exponentieel toe; daarom zal het structureren.
Introduction multimedia. convergence standards retrieval applications & technology.
NFC Near Field Communication. Wat is NFC NFC = Near Field Communication NFC = Near Field Communication Draadloze communicatie via (radio- frequentie)
Corporate Communications February 2011 Succesvol met Outsourcing Gerben Edelijn, CEO Thales Nederland.
Presentatie IA Solutions 2005: Programma generatie voor: PLC en SCADA Een update van deze PPT is te downloaden op: Rob Kits - Technisch.
Speaking OData to SharePoint 2010 in a RESTful manner Michaël Hompus | Principal Developer | Winvision.
VRB ICT en AI 1 ICT: een uitdaging voor AI Richard Benjamins SWI, Universiteit van Amsterdam.
Michiel Vanuytsel en Pieter Verdickt
Network Address Translation
Oktober 2004Bedrijvig op het Internet1 Prof. Dr. Geert Poels Ann Maes Frederik Gailly.
Specialismen Analyse en verificatie van protocollen Analyse van Petri-netten Component-specificatie Web-based information systems (Query)talen voor Web.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 mei 2011 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 november 2010 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 18 mei 2010 Wageningen.
WinFX Overview Martin Tirion Senior Consultant Microsoft Services.
Client Management met ConfigMgr Jannes Alink – Management.
Indexen en zoekstrategieën Marc Jeurissen Anet Gebruikersdag 15 juni 2011.
District 1550 Werkdag 6 oktober 2012 Vanaf I juli 2013 geen “Future Vision” meer  The New Foundation ? Vóor 1 Juli 2013:  District Qualification  Club.
Web 2.0 Social Software Toolkit 1/21 Introductie tot Social Software Patrick Klaassen RU
Maart 2001 De e-reader Blok pl. groep / faculteit UB / Studielandschap Student.
Cloud computing. Cloud introductie  Gebruiker: ‘ Computer Basics: What is the Cloud?’ ‘De cloud.
PLAYBOY Kalender 2006 Dit is wat mannen boeit!.
Wauw!!! Google Panda update WAUW !!!!. Google Panda update Plots geen bezoekers en/of omzet meer? In de US had deze update een impact op bijna 12% van.
Hoe werkt een zoekmachine?. In feite als een gewone browser Zoekmachine discrimineert niet; álles wat geïndexeerd mag worden, wordt geïndexeerd Ranking.
Woensdagochtend presentaties 2012/2013 Woensdag 24 oktober 2012 Google Services.
Google Cum presentatie Rudiger. Wat betekent Google De naam 'Google' is een variatie op het woord 'googol', dat is verzonnen door Milton Sirotta, het.
Deltion College Engels C1 Gesprekken voeren [Edu/004]/ thema: There are lies, damned lies and statistics... can-do : kan complexe informatie en adviezen.
Deltion College Engels En Projectopdracht [Edu/001] thema: research without borders can-do/gesprekken voeren : 1. kan eenvoudige feitelijke informatie.
INTERNET het communicatie-instrument voorbij Introductie.
Copyright 2005 Stg Wireless Leiden Jasper Koolhaas Voorzitter Stichting Wireless Leiden mensen toegang tot breedband Internet.
Web Applicaties Bouwen met Visual Studio .NET
OHT 11.1 De Pelsmacker,Geuens & Van den Bergh, Marketingcommunicatie, vierde editie © Pearson Education 2011 Sponsoring In dit hoofdstuk zul je het volgende.
Internet en Aan de slag! Wat is internet? Hoe internet raadplegen? Wat is ? Hotmail: mail lezen.
TOPIC O: Pointers | pag. 1 Pointer = adres in het geheugen, is zelf geen geheugen! Expliciet geheugen aanvragen vóór gebruik.
Dogme Lotte Clijsters, Delphine Desmet, Pieter Logie, Nico Puype, Katrin Verlende.
Arjen Kamphuis Infosecurity intro blijf de baas over je eigen bits.
1 De ontdekking van Web 2.0 Presentatie Team Ordina type hier de datum 19 april 2007.
We zijn toch allemaal zoekende?
Ontbijtsessie 2 juli 2014 Kwaliteitsverbeteringen in Infra Projecten.
mei 2008 Jonna Lind Marianne Mantel Jan Lauwen
Link Popularity Het principe van linkpopulariteit kun je als volgt samenvatten: hoe meer webpagina's er naar een bepaalde webpagina linken, des te belangrijker.
PADS4 maakt het eenvoudig om informatie te verspreiden naar een specifiek publiek op de juiste plaats en het juiste moment PADS4 is een professionele oplossing.
Webmaster ToolsWebmaster Tools Google Webmaster Tools Gedetailleerde rapporten over uw pagina's in Google. Weet wat google van u vind! Ontdek.
Webpromotie & SEO copywriting. Zoekmachines Slechts één zoekmachine van belang: Google Marktaandeel Google in het de westerse wereld:
Inhoud Presentatie 1. Probleemstelling onderzoek 2. Wat is een search engine? 3. Geschiedenis van search engines 4. Hoe werkt een search engine? 5. Welke.
Advanced Business Information Solutions Zoekmachines en andere vormen van webmarketing.
HOM - COM Ledenvergadering 21 / 06 / Efficiënt en Onderzoek van 2007 en bevestigd in 2010 Slechts 1 op 3 van de s wordt gelezen 9 tips.
Het Digitaal Educatief Produkt Waar haal je dat vandaan?
Basics SERP = Search Engine Results Page Betaalde resultaten = SEA Natuurlijke resultaten = SEO Search Engine Optimization SEO is een lange termijn verhaal.
SEO Kateryna Glushak en Saartje Van Broeckhoven. Wat?  Search Engine Optimization  Zoekmachineoptimalisatie  Techniek om website hoger te laten scoren.
Hom Com Ledenvergadering 26/03/2012. Google de-amazone-met-google-street-view
Transcript van de presentatie:

Zoekmachines ICT voor Studie en Werk College 6 5 oktober 2006 Toine Bogers

Wat is een zoekmachine?  Definitie: Een zoekmachine is een programma dat op basis van een zoekopdracht relevante informatie probeert te vinden in een verzameling met documenten, zoals het WWW.

Geschiedenis  Explosieve groei WWW  steeds meer informatie digitaal en online beschikbaar/bereikbaar  gemiddeld 19 clicks tussen 2 webpagina's  zoals in een bibliotheek: onvindbaar zonder ordening en index  Oplossing: directories en zoekmachines

Geschiedenis  Directories  hierarchie van handmatig toegevoegde wegpagina’s  voorbeelden: Yahoo! Directory, DMOZ

Geschiedenis  Directories  voordelen  hogere kwaliteit  geordend  nadelen  subjectief  arbeidsintensief  passief

Geschiedenis  Zoekmachines  doorzoeken automatisch het WWW op basis van een zoekopdracht  voorbeelden:

Geschiedenis  Zoekmachines  voordelen  geautomatiseerd  objectief  actief  nadelen ……

Hoe werkt een zoekmachine? search engine client query search engine server documents Web pages Web pages browser

Hoe werkt een zoekmachine? search engine client search engine server query documents Web pages Web pages browser

Hoe werkt een zoekmachine? World Wide Web World Wide Web search engine client search engine server query documents browser

Hoe werkt een zoekmachine? webpage search engine client search engine server query documents browser webpage

Hoe werkt een zoekmachine? Web index webpage search engine client search engine server query documents browser webpage

Hoe werkt een zoekmachine? crawler Web index webpage search engine client search engine server query documents browser webpage

Geschiedenis  Verschillende generaties  1e generatie (Archie)  locatie  2e generatie (Lycos)  locatie & inhoud  3e generatie (Google)  locatie, inhoud & autoriteit  4e generatie  ??? webpage hubautoriteit

Lies, damned lies & statistics  Getallen  marktaandeel VS

Lies, damned lies & statistics  Getallen  marktaandeel VS

Lies, damned lies & statistics  Getallen  marktaandeel Groot-Brittannië

Lies, damned lies & statistics  Getallen  marktaandeel Nederland & Duitsland

Lies, damned lies & statistics  Getallen  marktaandeel  grootte geindexeerde Web  overlap (70%-90%)  “much of the Web is crap”  > 14,3 miljard geindexeerde pagina’s

Lies, damned lies & statistics  Getallen  marktaandeel  grootte geindexeerde Web

Lies, damned lies & statistics  Getallen  marktaandeel  grootte geindexeerde Web  > 14,3 miljard pagina’s  aantal zoekopdrachten  ± 1 miljard per dag ≈ per seconde

Zoeken  basis  Booleaanse operatoren  pirate AND monkey  pirate OR monkey  pirate NOT monkey  pirate AND monkey NOT robot  filteren stopwoorden  exacte frases  “pirates of the caribbean” 

Zoeken  gevorderden  proximity (NEAR, ADJ)  pirates NEAR software  wildcards (*)  “pirates of *”  synoniemen (~)  ~pirate  veldspecifiek zoeken (title, domain, filetype)  pirate filetype:ppt

Problemen voor zoekmachines  groei & dynamiek van het WWW  +11 miljoen pagina’s per dag  dynamisch  updates  link rot

Problemen voor zoekmachines  groei & dynamiek van het WWW  niet alles is indexeerbaar  geen verwijzing  geen indexering  dynamisch gegenereerde pagina’s Surface Web > 14,3 miljard Deep Web 400 tot 550 keer groter totale WWW > 5 biljoen

Problemen voor zoekmachines  groei & dynamiek van het WWW  niet alles is indexeerbaar  niet alles moet geindexeerd worden  search engine spamming  keyword stuffing  link farms

Problemen voor zoekmachines  groei & dynamiek van het WWW  niet alles is indexeerbaar  niet alles moet geindexeerd worden  query syntax niet toereikend  beperkt tot keywords  ambiguiteit!

Problemen voor zoekmachines ‘jaguar’

Problemen voor zoekmachines  groei & dynamiek van het WWW  niet alles is indexeerbaar  niet alles moet geindexeerd worden  query syntax niet toereikend  beperkt tot keywords  ambiguiteit!  gemiddelde 2 zoektermen

4e generatie zoekmachines  andere domeinen  desktop  Google Desktop, Spotlight  enterprise/intranet  Verity, Panoptic, Grokker  blogs  Bloogz, Technorati, Google Blog Search  multimedia  Ditto, Google Images/Video, AllTheWeb

4e generatie zoekmachines  andere domeinen  andere algoritmes/toepassingen  meta search  Dogpile, Vivisimo  clustering  Clusty, Grokker  question answering systemen  Brainboost, AnswerBus, Inferret, Ionaut

4e generatie zoekmachines  andere domeinen  andere algoritmes/toepassingen  meta search  Dogpile, Vivisimo  clustering  Clusty, Grokker  question answering systemen  Brainboost, AnswerBus, Inferret, Ionaut  personalizatie  recommender systems  Amazon, MyStrands, Pandora, MovieLens

4e generatie zoekmachines  andere domeinen  andere algoritmes/toepassingen  meta search  Dogpile, Vivisimo  clustering  Clusty, Grokker  question answering systemen  Brainboost, AnswerBus, Inferret, Ionaut  personalizatie  recommender systems  Amazon, MyStrands, Pandora, MovieLens  social tagging  Flickr, del.icio.us, LastFM

4e generatie zoekmachines  andere domeinen  andere algoritmes/toepassingen  andere rol  van passief naar actief  IntelliGent, Watson

Fun with Google 101  Google Bomb  miserable failure  raar kapsel  vreemdelingenhaat  more evil than satan

Fun with Google 101  Google Bomb  Google suggestions

Fun with Google 101  Google Bomb  Google suggestions  Googlewhack  intergalactically janitorial  icebreaking snaggletooth  obverse tartiness  tailgated winnebagoes  arachnophobic swashbuckler

Fun with Google 101  Google Bomb  Google suggestions  Googlewhack  Googlisms  Google Trends

The Dark side of the Force search  censuur  Frankrijk  Duitsland  China

The Dark side of the Force search  censuur  AOL search data  grootte  gebruikers  3 maanden  20 miljoen zoektermen  slecht geanonimiseerd  mirrors  

Literatuur  Van Driel (Red.), Digitale Communicatie (tweede editie), Boom,  hoofdstuk 7  Engelse Wikipedia pagina’s  search engine  web directory  Google  Google pagerank