SURFnet Search Engine NG Opzet en uitgangspunten Utrecht, 09 juni 2004 Henny Bekker.

Slides:



Advertisements
Verwante presentaties
Juriconnect Informatiemiddag
Advertisements

RSI? zoeken naar de in de e-hooiberg >
Online Marketing voor het MBO “SEO, dat kun je zelf!”
Online Marketing voor het MBO “SEO, dat kun je zelf!”
Bouw je eigen website met gratis software Je eigen website bouwen  Waarom?  Eigen zaak (  Vereniging (
Landing Websites The fly-catcher on the web. Wat willen we op het WEB  Naamsbekendheid, profileren  Relevante (be)zoekers  kopers  klanten  Verkoop.
Agence fédérale pour la Sécurité de la Chaîne alimentaire Een nieuwe website voor het FAVV ? RC van 28 mei 2008 Federaal Agentschap voor de Veiligheid.
Online Marketing voor het MBO “SEO, dat kun je zelf!”
Onderwerpen Oude situatie Eerste aanpak en problemen
Marktonderzoek Danneels
15/10/2013. De meest voorkomende soorten navigatie zijn:  Tekstlinks  Afbeeldingen  Roll-over images  Flashnavigatie  jQuery-navigatie.
Efficiënt zoeken Informatie zoeken op verschillende manieren Je hebt een URL of hyperlink bij de hand VVVVb. W W W W W WWWW WWWW.... SSSS IIII TTTT.
E-RADEN Roadmap. AGENDA • Overzicht van nieuwe ontwikkelingen 2009 • Interfaces • Document Types : Meta-data • E-raden gratis ? • Perspectieven.
Vormingsdag Digidak Mediageletterdheid: Wat, hoe & waarom? Juni 29, 2012 Malle Mariën Ilse, IBBT-SMIT Vrije Universiteit Brussel.
thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.
De elektronische identiteitskaart Denis Van Melsen.
ASCC clubmiddag 20 december 2011 Ruud Vloeimans 2011 © R.P.Vloeimans, Amstelveen, Netherlands.
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Linux in het bedrijfsleven
Een introductie. Open source Betere kwaliteit Hoge innovatiesnelheid Betere prijs/kwaliteit verhouding Vrijheid in keuze van leverancier Gedreven door.
Vernieuwde SCORM-engine PAT Learning Summit On the Move.
To retrieve or not to retrieve, that's the question retrieval van wetenschappelijke informatie eric sieverts.
Deze presentatie mag noch geheel, noch gedeeltelijk worden gebruikt of gekopieerd zonder de schriftelijke toestemming van Seniornet Vlaanderen VZW Mijn.
The Next Generation Webpresentatietechniek nieuwe stijl
49e adlib gebruikersgroep vergadering Brabants Museum 7 december 2004 Bert Degenhart Drenth.
Oktober 2004Bedrijvig op het Internet1 Prof. Dr. Geert Poels Ann Maes Frederik Gailly.
Philosopher’s Index Zoekresultaten uitbreiden door te zoeken in meerdere databases tegelijk Klik met muis = verder gaan.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 mei 2011 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 november 2009 Wageningen.
1 Nieuwe (on)mogelijkheden zoekmachines Jeroen Bosman VOGIN, 4 juni 2009 Wageningen.
… een nieuwe zoekmachine! “Dear finance support desk customers, The search facility within the knowledge base will be improved to help you find information.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 16 november 2010 Wageningen.
1 Nieuwe (on)mogelijkheden webzoekmachines Jeroen Bosman VOGIN, 18 mei 2010 Wageningen.
WEBSITES ONTWIKKELINGEN Trends en standaarden op het gebied van webdesign HTML, DHTML, XHTML, FLASH, CSS Henk Zegwaard december 2003.
ICT-voorstelling: onderhoud van een website Donderdag 23 oktober 2008.
Indexen en zoekstrategieën Marc Jeurissen Anet Gebruikersdag 15 juni 2011.
30 juni Deze morgen Vorige bijeenkomst: –een concepthierarchie van kernbegrippen in Logic & Language vakgebied (o.b.v. glossary) Vandaag: –Jon:
SEO Tools.
Wauw!!! Google Panda update WAUW !!!!. Google Panda update Plots geen bezoekers en/of omzet meer? In de US had deze update een impact op bijna 12% van.
Hoe werkt een zoekmachine?. In feite als een gewone browser Zoekmachine discrimineert niet; álles wat geïndexeerd mag worden, wordt geïndexeerd Ranking.
Nr 1 met foto’s Video over image tags
De SURF familie De samenwerkingsorganisatie De intermediair tussen
Google Cum presentatie Rudiger. Wat betekent Google De naam 'Google' is een variatie op het woord 'googol', dat is verzonnen door Milton Sirotta, het.
Your GateWay to the Finest Academic Research papers in the Netherlands Technische aspecten: de ARNO archive server Thomas Place KUB.
Het KB e-Depot Waarom, wat en voor wie
Juriconnect vanuit het perspectief van de kennismanager en eindgebruiker Diederik Benschop 5 april 2017.
Naam van de Auteur 7 januari 2008 Kennisnet Videodienstverlening Open source, open content Pieter Varekamp November 2008.
ONLINE VERBONDEN EN INTELLIGENTE COMPUTERS Semantisch web Tom Schurmans Gunter Fransen Nand Truyen Nele Lieben.
Starten met PHP Dynamischer bouwen. PHP is een een scripttaal waarmee de server pagina’s in elkaar kunt laten zetten. Het verschil met HTML: Een php pagina.
Welkom De techniek van websites
Samen met Schuttevaer Omzet scoren met Google Welkom op de workshop Koersen op uw doelgroep!
Business Source Premier (BSP) Zoekresultaten uitbreiden door wijziging van veldnamen Universiteitsbibliotheek verder = klikken.
Google versus Bing Gigantenstrijd.
Webmaster ToolsWebmaster Tools Google Webmaster Tools Gedetailleerde rapporten over uw pagina's in Google. Weet wat google van u vind! Ontdek.
Webpromotie & SEO copywriting. Zoekmachines Slechts één zoekmachine van belang: Google Marktaandeel Google in het de westerse wereld:
realtime & social: blogs & tweets
Een overzicht van de hedendaagse mogelijkheden voor het bouwen van websites.
Inhoud Presentatie 1. Probleemstelling onderzoek 2. Wat is een search engine? 3. Geschiedenis van search engines 4. Hoe werkt een search engine? 5. Welke.
Meetup Toptaken-website 29 januari 2015, Deventer – Michiel van Straalen, Adviseur nieuwe media.
Deltion College Engels B1 Lezen [no. 001] can-do : 2 products compared.
Deltion College Engels A2 Spreken/presentaties [Edu/001] thema:Sight-seeing in Holland Can-do: kan een kort, eenvoudig, vooraf ingeoefend praatje houden.
HOM - COM Ledenvergadering 21 / 06 / Efficiënt en Onderzoek van 2007 en bevestigd in 2010 Slechts 1 op 3 van de s wordt gelezen 9 tips.
Deltion College Engels C1 Schrijven [Edu/007] thema: Mind twister or how to write an essay… can-do : kan heldere, goed gestructureerde uiteenzetting schrijven.
1 OMI Digitaal publiceren in bredere context.
Kennisnet – Copacabana Van Dienst naar Service.
Basics SERP = Search Engine Results Page Betaalde resultaten = SEA Natuurlijke resultaten = SEO Search Engine Optimization SEO is een lange termijn verhaal.
EContentplus Chris De Loof Europeana en zijn sattelietprojecten Jubelparkmuseum, Brussel 8 januari 2009 Nationale ATHENA Workshop België.
Agenda Wie ben ik? Redkiwi Online marketing In de diepte: SEO.
Beginnen met SEO SEO webinar Alon Bromet & Robbert Kleijwegt
LOREnet feb
Transcript van de presentatie:

SURFnet Search Engine NG Opzet en uitgangspunten Utrecht, 09 juni 2004 Henny Bekker

2 van 13 Overview •Wat is er nieuw op het Web? –Zoeken en gevonden worden •De oude SURFnet Search Engine –Waarom een eigen zoekdienst? •De nieuwe generatie SURFnet Search Engine –Eerste fase –Tweede fase •Screendumps •Vragen & opmerkingen

3 van 13 Wat is er nieuw op het Web? •Dynamische pagina’s veranderen periodiek –5% tot 8% van de pagina’s per week –60% is nieuw en 40% hergebruik content •Niet dynamische pagina’s veranderen weinig –Halfwaarde van URL’s is 4 jaar –In.COM domein is dit 12 maanden •Dynamiek link-struktuur is groter dan content –25% nieuwe links tot 8% nieuwe content –Na één jaar is 80% van de links nieuw •Hergebruik van de ‘statische’ links –Content + metadata voor gevonden worden; –Links voor relevantie van het zoekresultaat.

4 van 13 Zoeken en gevonden worden •Zoeken: Geen doel op zich, maar middel tot: –65% Zoeken naar informatie; –20% Zoeken van resources; –15% Navigatie. •Ongeveer 6% van de links geeft een 404 –Gefrustreerde zoekers –Degradatie van relevantie –Oplossing: Maak hiervan een zoekpagina •If your page isn’t in Google, or ranked at the bottom, you don’t exist on the Web! –Populaire pagina’s worden steeds populairder; –De rijken worden rijker •Nieuwe pagina’s worden zelden populair.

5 van 13 Waarom een eigen index zoekdienst? •Index met hoge kwaliteit informatie van/voor de doelgroep –Index op basis van domeinnamen –Indexering van metadata –Geen ‘banners’ en/of reclame –Geen verkoop van hoge ranking posities in het resultaat •Snelle verversing van de index –Minimaal eens per week wordt de index ververst –HTML en tekst bestanden anders dan PDF en PostScript •Indexeren van informatie die andere Search Engines niet vinden •Gebruik voor speciale toepassingen –Web/LDAP-index –ListServ index •Basis voor het ontwikkelen van nieuwe diensten •Faciliteit voor instellingen die geen eigen index willen onderhouden

6 van 13 De oude SURFnet Search Engine •Gebaseerd op AltaVista Enterprise v3.0 –Is ruim 6 jaar operationeel (op dezelfde hardware) •Voordelen –Bekende techniek –Is zeer stabiel (na grote aanloopproblemen) –In twee jaar 100% beschikbaarheid op eindgebruikers niveau •Nadelen –Slechte ondersteuning voor indexering CMS –Moeite met ‘up-to-date’ houden van de index –Slechte ondersteuning mbt conversie documenten –Verouderde techniek voor bouw user interfaces –Geen technische ondersteuning en/of nieuwe versie sinds 2001

7 van 13 SURFnet Search Engine Next Generation •Gebaseerd op Fast Data Search v3.2.2 –Gebruik van open source tools/converters •Basis voor nieuwe ontwikkelingen –Attenderingsdienst –Crawling van IPv6 sites •Backward compatible met huidige SSE –Local-search (qsearch.pl) •Fasering met betrekking tot ontwikkeling –Fase 1:oktober 2003 t/m mei 2004 –Fase 2:mei 2004 t/m december 2004

8 van 13 SURFnet Search Engine NG – Fase I •Alle features zowel in Nederlands als Engels •Indexering van dynamische data (CMS & ASP-scripts) •Zoeken met taalfilters zoals: –Lemmatizering (vervoegingen van woorden) –Spellingscontrole (suggestie in geval van 0 hits) –Homoniemen (klinken als het originele woord) –Synoniemen (woorden met dezelfde betekenis) •Aangepast relevantiemechanisme (metadata heeft hogere relevantie bij het weergave van het zoekresultaat) •Resultaatclustering (clusters van gelijkwaardige woorden in het zoekresultaat) •Hedendaagse user interfaces –Opslaan zoekprofiel

9 van 13 SURFnet Search Engine NG – Fase II •Verbeteringen aan de Web crawler •Uitbreiding local-search (alle features van de main interfaces) •URL upload interface •Webservices –Interface voor uploaden van XML files [XML-RPC] –Interface tbv externe query interfaces. •Automatische classificatie •Taxonomie Search –Navigeren mbv grafische browsers in het zoekresultaat •Toolbar voor zoeken in browser met Search-NG •Geavanceerde support voor wildcards

10 van 13

11 van 13

12 van 13 Referenties •AltaVistahttp:// •Fasthttp:// •Search-NG •PageRank – •SearchEngineWatch – •W3C 2004 papers [URL’s to be announced] –Wat’s new on the Web –Understanding User Goals in Web Search –Ranking the Web Frontier –Sic Transit Gloria Telae: Towards an Understanding of the Web's Decay

13 van 13 Vragen & opmerkingen