1 Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 6 november 2014 Wageningen
2 Nieuws voorbeeldaardzoekenbijblijven persbureausANP, AFP Reuters, Novum, Visnews feitelijke berichten en foto’s via andere nieuwsdiensten (bv. Nu.nl, NOS Nieuws) RSS-feeds Nu.nl krantenNRC / NYT / El Pais / Trouw persbericht, redactioneel, achtergrond, opinie etc. Google Nieuws/News LexisNexis (Academic) / Krantenbank Factiva / Howards H. RSS-feeds van kranten / alert in database / Google news alert RTVNOS-Journaal BBC Journaal RTL Journaal Actualiteitenprog. gelijk aan krant, maar dan geluid/beeld B&G Academia / uitzending gemist- / RTLgemist- Ooitgemist / Blinkx / Youtube deels nog npo.nl RSS-feeds organisatiesWNF, IMF, FIFA, ANWB etc. persberichten, nieuws op eigen terrein, tweets alg. zoekmach. / interne zoekmach./ Google News / Howards home RSS-feed op zoekactie individuenBv Phil Bradleyblog, podcast, vodcast, tweets, update/post Google blogs / YouTube / Twitter search, Facebook search / LinkedIn, Google+ / Topsy feeds, tweets, filters in RSS readers
Google Nieuws/News 3 Per taalgebied Ook nieuws van kleine organisaties Gegroepeerd Verschil browse-ingang en zoeken via Google websearch
LexisNexis Academic 4 vanaf ~ nieuwsbronnen bedrijfsgegevens alleen tekst verwarrende interface, beste: nieuws | alle nieuws Let op rankingcriterium en Let op syntax (! i.p.v. * voor trunceren)
5 Zoeken actuele discussies: Twitter search: relatief goede advanced search Nieuwsgroepen: zoeken via Google Groups Discussielijsten: lastig doorzoekbaar tenzij er een webarchief is –Overzicht bv bij JISCmail >> Fora doorzoeken zoeken met Omgili of een site beperking in Google
6 Interactief: nieuwsgroepen als discussieplatform grotendeels actherhaald heet: usenet, news, forums, groups vroeger apart protocol en vereiste newsreader nu lezen en archief bij Google Groups voor specifieke problemen (foutmeldingen) voor laagdrempelige, actuele discussies voor sociaal-cultureel en taal(historisch) onderzoek vluchtig, wilde westen, illegale zaken Functies deels overgenomen door fora en profielsites (FB/Google+), Twitter en blog comments
7 Interactief: discussielijsten werkt via (later ook vaak web-interface) vaak eerst abonneren, verzenden alleen door abonnees vrij sterke communities soms zeer hoge kwaliteit soms openbaar webarchief zoeken lijsten: –Catalist (lijsten met Listserv software) – (Brits hoger onderwijs/wetenschap) –groups.yahoo (lijsten van Yahoo) bv Nedbib > of Web4Lib > of DIG_REF of SCHOLCOMM of GOAL of SIGMETRICS>
8 Videosearch Zoeken met: Algemeen: Blinkx en Google Video Youtube (ook advanced filters!), Vimeo Hoger onderwijs: B&G Academia Known item search en populaire video gaat goed Maar onderwerpzoeken lastig Semantic gap tussen eigenlijke informatie en doorzoekbare proxy daarvan >>
Beeldontsluiting – semantic gap text based image en sound retrieval: de computer zoekt in tekst die aan het beeld/geluid gerelateerd is –in expliciet aanwezige computerleesbare tekst in bijbehorende webpagina in aanwezige metadata (extern of intern) –in computerleesbaar gemaakte “embedded” tekst OCR van in afbeelding aanwezige tekst spraakherkenning in geluidsbestand content based image en sound retrieval >> 9