metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
behoefte aan integreren van meer bronnen / zoeksystemen waarom wil je dat voor je gebruikers? het is onhandig als ze dezelfde zoekvraag aan elk afzonderlijk systeem telkens weer opnieuw moeten stellen het is gebruikersonvriendelijk dat die systemen vaak allemaal verschillende zoekinterfaces hebben © eric sieverts, UB Utrecht
behoefte aan integreren van meer bronnen / zoeksystemen waarom wil je dat voor je gebruikers? het is onhandig als ze dezelfde zoekvraag aan elk afzonderlijk systeem telkens weer opnieuw moeten stellen het is gebruikersonvriendelijk dat die systemen vaak allemaal verschillende zoekinterfaces hebben © eric sieverts, UB Utrecht
integreren van meer bronnen / zoeksystemen globaal twee soorten aanpak: alle bronnen zelf in je eigen centrale systeem (zoekmachine) indexeren de OMEGA-aanpak meta-zoeksysteem dat de bij de afzonderlijke bronnen behorende zoeksystemen in één keer parallel bevraagt (gedistribueerde zoekactie) de METALIB-aanpak © eric sieverts, UB Utrecht
indexer internet tekstbestanden (metadata) tekstbestanden centrale index zoeken geïntegreerd systeem via lokale centrale index indexeer- regels voor targets full-text links mega
eigen centrale index voorbeelden: UB Utrecht - Omega-systeem metadata van artikelen uit groot aantal tijdschriften van diverse leveranciers OAIster via Open Archive protocol “ge-harveste” metadata (volgens Dublin Core), uit ruim 400 “institutionele archieven” met wetenschappelijke publikaties © eric sieverts, UB Utrecht
eigen centrale index voordelen: garantie van uniforme zoekmogelijkheden geavanceerde zoekfunctionaliteit mogelijk, want we hebben zelf in de hand welke zoekmachine we kiezen en hoe we die configureren nadelen: zwaar systeem (eigen zoekmachine) te hosten en beheren kan niet voor alle “content” © eric sieverts, UB Utrecht
wanneer eigen index ? als je zelf beheer kunt krijgen over te doorzoeken “content” –wel bij materiaal van (sommige / grote) uitgevers (zoals Elsevier, JStor, etc) –niet bij materiaal van uitgevers die dat (nog) niet willen / kunnen / begrijpen –niet bij databases waar bijbehorend zoek- systeem al verweven is met (de ontsluiting van) de gegevens (zoals Ovid, CSA, Pubmed, etc) © eric sieverts, UB Utrecht
meta-search oplossing daarvoor is nodig: het betreffende materiaal / content moet al een eigen zoeksysteem hebben dat zoeksysteem moet extern (via internet) te benaderen zijn met dat zoeksysteem moet via gestructureerde interactie gecommuniceerd kunnen worden (opdrachten versturen, antwoorden binnenhalen) © eric sieverts, UB Utrecht
internet zoeken geïntegreerd systeem via meta-zoekmethode index be- stand zoek query-generator / antwoord-inzamelaar index be- stand zoek index be- stand zoek index be- stand zoek index be- stand zoek index be- stand zoek Z39.50 intern api httphttp xml Z39.50http configuratie gegevens van targets
meta-search oplossing metasearch software (zoals Metalib) kan communiceren met verschillende soorten zoeksystemen: –Z39.50 protocol (vooral bibliografische databases) redelijk gestandaardiseerd, maar weinig geavanceerd –interactie op basis van xml (o.a. nieuw SRU-protocol) redelijk flexibel, maar nog geen ruime ondersteuning –http-protocol / web-formulieren ("screen-scraping") wijd verbreid, maar niet gestructureerd / weinig stabiel –lokale “legacy”-systemen © eric sieverts, UB Utrecht
meta-search oplossing voordelen: –geen zwaar eigen systeem te beheren –ook geschikt voor niet zelf indexeerbare content nadelen: –grootste gemene deler van zoekfunctionaliteit –geen geavanceerde zoekfuncties beschikbaar –soms ingewikkeld configuratie-werk (zowel voor Z39.50 als voor en screen-scraping) © eric sieverts, UB Utrecht
meta-search toepassingen UBU wat we zelf niet makkelijk kunnen indexeren en wel een bijbehorend zoeksysteem heeft –full-text tijdschriften die we (nog) niet in Omega-zoekmachine hebben kunnen krijgen –bibliografische databases, catalogi etc. die we niet zelf kunnen indexeren én niet tot de eigen full-text collectie behoort (dus eigenlijk niet in Omega-zoeksysteem thuishoort) © eric sieverts, UB Utrecht
meta-search bij Omega uitgevers die (nog) geen metadata leveren mogelijke problemen: –meestal web-interfaces die configuratie met screen-scraping nodig maken –meeste waarschijnlijk (nog) niet standaard ondersteund door Metalib (ExLibris) © eric sieverts, UB Utrecht
bibliografische meta-search al die verschillende niet-fulltext zoeksystemen mogelijke problemen bij Metalib: –veel “native” interfaces bieden veel betere / geavanceerder zoekmogelijkheden –niet meer dan 10 tegelijk doorzoekbaar te maken –samenvoegen van op relevantie geordende zoekresultaten geeft problemen –nog niet allemaal standaard ondersteund door Metalib –….. © eric sieverts, UB Utrecht
mogelijke scenario’s voor toepassen van meta-search scenario 1: we bieden gebruikers twee systemen: –metasearch systeem dat alle bibliografische bronnen tegelijk doorzoekbaar maakt (in groepjes van maximaal 10) –Omega-systeem dat alle full-text materiaal tegelijk doorzoekbaar maakt via: Omega-zoekmachine + metasearch van “overige” uitgevers © eric sieverts, UB Utrecht
internet “biblio” metasearch scenario 1 index Aleph zoek index biblo graf. zoek index ncc zoek index biblio graf. zoek index full text zoek index full text zoek omega index “full-text” metasearch omega zoekmach. bibliografisch zoekenomega zoeken full-text zoeken
mogelijke scenario’s voor toepassen van meta-search scenario 2: we bieden gebruikers één systeem: –systeem dat “alles” tegelijk doorzoekbaar maakt via metasearch (opgedeeld in groepjes van maximaal 10) daarónder native interfaces van alle individuele systemen; daarbij behalve Pubmed, Psycinfo, catalogus enz., óók Omega dat alle full-text materiaal tegelijk doorzoekbaar maakt © eric sieverts, UB Utrecht
internet “alles” metasearch scenario 2 index Aleph zoek index biblo graf. zoek index ncc zoek index biblio graf. zoek index full text zoek index full text zoek omega index “full-text” metasearch omega zoekmach. alles zoeken omega full-text zoeken index biblio graf. zoek pubmed catalogus