Het Web Geciteerd Paul Wouters en Repke de Vries Networked Research and Digital Information - NIWI-KNAW
Overzicht b internet en wetenschap b informatie zoeken en produceren b veroudering van informatie b hoe wordt het Web geciteerd? b onderzoeksmethode b resultaten b conclusies
Internet en wetenschap b van oudsher nauwe relatie b hoe is echter de interactie? b dalende kosten data b digitalisering b 1 communicatiemedium b hybride gemeenschappen b diversificatie
Dubbele wending b informatisering van wetenschap b communicatieve wending
Informatisering b onderzoek afhankelijker van IT b vloedgolf van data b kennis instrumenteler en relevanter b zelfbeeld van de onderzoeker (metaforen) b feedback processen - versnelling?
Communicatieve wending b convergerende media b communicatie alomaanwezig b wees zichtbaar of verdwijn? b diversificatie doelgroepen/netwerken b transparante grenzen b permanente controverses?
Wetenschappelijke informatie en internet/Web b nieuwe bronnen van data en informatie b nieuwe interfaces met al bestaande bronnen b het dominante communicatiemedium b nieuwe onderzoeksinstrumenten mogelijk b probleem: kwaliteitsbewaking b probleem: veroudering
Infoproblemen b dekking zoekmachines beperkt b kwaliteit zoekvragen b het onzichtbare Web b instabiliteit Web pagina’s b ruis (“overbelasting met informatie”) b hoe lossen onderzoekers dit op?
Wat weten we? b informatiezoekgedrag b motivaties voor hyperlinking b e-journals (veldverschillen) b using internet info sources b impact of e-journals b Web site persistence b Web pages cited in SCISEARCH abstracts
Informatie-veroudering b meer-dimensionaal concept b twee dimensies centraal: tijdigheidtijdigheid beschikbaarheidbeschikbaarheid b infostructuur b veranderingen publicatieproces/infoketen b gedrag onderzoekers
Onderzoeksvragen b welke invloed heeft gebruik internet op aard van info-veroudering? b in welke mate wordt info-veroudering versterkt/verzwakt door gebruik internet?
Onderzoeksvraag geoperationaliseerd b referentie-analyse b verwijzen onderzoekers meer naar Web? b naar welk type informatie verwijzen zij? b in welke mate zijn de bronnen nog live? b hoe oud is de info waarnaar wordt verwezen?
Gemeten indicatoren b aandeel referenties met een hyperlink b indeling ref naar categorie hyperlinked bronnen b aandeel hyperlinks dat nog live is b verschil leeftijd citerend - geciteerde bron
Wetenschapsgebieden b bibliotheek- en informatiewetenschap b wiskundige informatica b sociologie b biochemie/biotechnologie b neurowetenschappen
Data b Niet het Web of Science: gestandaardiseerde referentiesgestandaardiseerde referenties ejournals als print journalsejournals als print journals hyperlinks verdwijnen somshyperlinks verdwijnen soms b Full text uit Science Direct database b 41 tijdschriften, 7 e-journals
Methode b downloaden met Office Explorer Pro b online files in 5 verschillende types: statische HTMLstatische HTML dynamische HTMLdynamische HTML PDF text basedPDF text based PDF image basedPDF image based PDF mixed text/imagePDF mixed text/image
Methode 2 b HTML: Perl-extractie referenties en links b PDF: conversie in tekst: van PDF naar TIFF met Image Alchemy 1.9van PDF naar TIFF met Image Alchemy 1.9 van TIFF naar txt met OCR SHOPvan TIFF naar txt met OCR SHOP extractie referenties met Perlextractie referenties met Perl b Analyse met Perl 5.0 scripts b Link testen met linklint 2.1
NR files and size in MB
NR articles and REF ref/article
Price Index Neuro
Price Index Bio
Price Index Info
% Webreferences: NEURO
% Webreferences: MATHCOMP
% Webreferences: LIBINFO
Typology webrefs
Link functionality
Link functionality - 2
Resultaten b lichte stijging/stabiliteit aantal refs b % webrefs stijgt b info wet: verdeeld beeld % webrefs b PI refs en Webrefs niet verschillend b biowet: wel jongere Webrefs b meeste hyperlinks uitgever gegenereerd b merendeel open hyperlinks live
Conclusies b meeste referenties nog traditioneel b doorgaans geen invloed op tijdigheid b bestandsformaat belangrijke variabele b hyperlinks niet gelijk aan referenties b uitgever neemt cruciale positie in b grote invloed op beschikbaarheid