Google Scholar de googlificatie van de wetenschap ? Eric Sieverts Universiteitsbibliotheek Utrecht Instituut voor Media- en Informatie Management (Hogeschool van Amsterdam)
zoekmachines zijn er al lang lycos in 1994 de eerste "echte", met bijna 1,5 miljoen pagina's altavista in 1996 de nieuwste grootste, met ruim 30 miljoen pagina's maar geen van alle heeft ons gedrag én zelfs onze taal zo beïnvloed als
wat maakte anders ? zijn "kale" interface zijn goede zoekresultaten maar in feite geeft elke zoekmachine "correcte" resultaten (je vindt/krijgt altijd wat je vraagt) wel andere, betere relevantie-ordening grote dekking (nu 8 miljard) garandeert vaker bevredigend resultaat goed voor simpele vragen van de grote massa zijn PR en timing als MSN meldt nu 5 miljard pagina's te doorzoeken, meldt Google 3 dagen later: 4 >> 8 miljard als Elsevier Scopus definitief op de markt brengt, komt Google binnen 2 weken met Google Scholar Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
wat is Google Scholar ? heel iets anders dan de gewone Google: multidisciplinaire database met wetenschappelijke artikelen van zowel "open access" als commerciële uitgevers die voor een deel full-text doorzoekbaar zijn via Googliaanse zoekmethodiek Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
wat zit er in Google Scholar ? onder andere: leverancier hoeveelheid aard OCLC ca. 40.000.000 catalogusrecords Pubmed 2.110.000 bibliografisch Harvard 667.000 Ingenta 1.040.000 bibliografisch / full-text arXiv preprints 278.000 full-text 23 grootste uitgevers 3.300.000 schattingen door Jeroen Bosman (UB Utrecht) - december 2004 Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
wat zit er niet in Google Scholar ? o.a.: tijdschriftartikelen van Elsevier Science (tenzij abstract toevallig uit andere bron gekomen is) tijdschriftartikelen van JStor (idem) tijdschriftartikelen van Muse (idem) een variabel percentage artikelen van de uitgevers die er (deels) wel inzitten wetenschappelijke gewone webpagina's ...... Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
hoeveel zit er in Google Scholar ? schatting: echt full-text: van uitgevers 8 miljoen van universitaire sites 5 miljoen ca. alleen bibliografisch: uit databases 5 miljoen ca. uit OCLC Worldcat 25 miljoen ?? “alleen citaties” 25 miljoen ?? totaal 70 miljoen ? Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
wat ervan zit in Google Scholar ? [citation] alleen gegevens uit literatuurlijst van andere publicatie(s) (soms zelfs geen titel om te doorzoeken) summiere vindkans [book] summiere gegevens uit Worldcat catalogus (titel + enkele trefwoorden) kleine vindkans artikel uit bibliogr. bron bibliografische gegevens (titel + trefwoorden + uitgebreide samenvatting) redelijke vindkans full-text artikel bijna hele inhoud van de artikelen (eerste 100 kB 30 blz. van de tekst) maximale vindkans Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
"oude" artikelen die alleen als gescand image beschikbaar zijn (Tiff-PDF), blijken zelfs ge-OCR-d om ze full-text doorzoekbaar te maken
dekking t.o.v. andere databases case study voor één (zeldzaam) onderwerp zoekterm: “alexander disease” Jeroen Bosman (UB Utrecht) - december 2004 aantal % van totaal aantal uniek aantal 2004 Google Scholar 33 58 1 3 Scopus 39 68 5 Pubmed 38 67 6 Picarta 35 61 4 Web of Science 30 53 9 7 totaal 57 100 Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
Google Scholar als citatie-index Google Scholar is ook een citatie index gebruikt aantal citaties als één van zijn ranking-parameters (net zoals gewone Google dat doet met hyperlinks) linkt ook naar die citerende artikelen (wat eenvoudiger dan ISI's citatie-indexen) Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
Google Scholar vs. Web of Science aantal gevonden "citaties" van Scholar, vergeleken met WoS op basis van ca. 50 random artikelen vakgebied Google Scholar/ Web of Science variatie humaniora 1,9 x 0 -- 5,7 x sociale wetensch 0,7 x 0,3 -- 1,6 x economie 1,3 x 0,3 -- 3,0 x biomedisch 0,7 -- 0,9 x natuurkunde 0,6 x 0 -- 2,0 x Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
Google Scholar vs. Web of Science vergelijking van individuele citaties voor 2 artikelen via Google Scholar en Web of Science (ISI) natuurkunde-artikel sociaal-wetenschappelijk artikel WoS 35 GS 16 WoS 16 GS 15 4 Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
Google Scholar als citatie-index zeer voorzichtige conclusie: dekking van Scholar voor humaniora en sociale wetenschappen is wel nog minder dan voor natuurwetenschappen, toch lijkt het voor citatie-zoeken op die terreinen zeker goede aanvulling op reguliere citatie-index maar: vergelijken is nog wat hachelijk Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
succes van Google garantie voor succes van Google Scholar ? gebruikers oppervlakkig serieus soort gebruik quick & dirty als je maar iets vindt precisie + recall echt belangrijke mag je niet missen omvang collectie 8 miljard 70 miljoen gecontroleerde ontsluiting ontbreekt geen probleem voor professional een beperking zoekmogelijkheden (truncatie, proximity) ontbreken ernstige beperking of eigenlijk maar 13 ? Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
auteurs
auteurs
Google-succes ook voor Scholar ? automatisch niet puur op kwalitatieve gronden wel aantrekkingskracht op gebruikers maar: niet alles wat je vindt is full-text (WorldCat boek-verwijzingen naar US bibliotheken en web-search leveren -hier- meestal niets op) niet ieder mag (gratis) bij elke gevonden full-text gebruiker ziet niet dat wel beschikbare toegang vaak door licentie van zijn bibliotheek verzorgd is Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
als Google Scholar wel succes: wetenschappelijke productie veel zichtbaarder dan bij klassieke databases auteurs worden zich eens te meer bewust van die zichtbaarheid en van toegangsbeperkingen bij het klassieke uitgeef-model extra stimulans voor open-access model maar: zwaar weer voor database-producenten Eric Sieverts | e.sieverts@library.uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl