Basiscursus SWI Informatie gebruik Informatie retrieval
Literatuur 4 Buckland, Information & Information Systems Ch 9: Inquiries 4 Vickery & Vickery, Information science in theory & practice, H5: Infromation Retrieval 4 Buckland, Information & Information Systems Ch 11: Becoming informed
Info gebruik 4 Wat willen /moeten mensen weten? 4 Hoeveel informatie? 4 Belang en urgentie? 4 Strategieën om informatie te krijgen
Wat wil of moet men weten? 4 Motieven, waarden –overleving, succes, respect, nieuwsgierigheid, ontspanning 4 Situatie –sociale, geografische en professionele contexten met eigen waarden en referentiekader (linguïstisch, cognitief) 4 Culturele factoren, sociale factoren –‘normaal gedrag’, life-style, trends, mode
Informatie systemen 4 Zoeken van informatie 4 Niet alleen instrumenteel, maar ook andere doelen –een bibliotheek is tegelijkertijd een plek om te studeren om mensen te ontmoeten voor recreatie leren lezen opvoeding beïnvloeden
Effecten van informatie 4 utilitair 4 inspiratie 4 educatief 4 recreatief
Informatie en onwetendheid 4 we zijn in zekere zin volstrekt onwetend –onze individuele kennis is bijna niets in vergelijking met alle beschikbare kennis –onwetendheid: gebrek aan kennis of tegenstrijdige kennis 4 op zich geen probleem, maar soms voelen we die onwetendheid wel als probleem –dan gaan we op onderzoek uit –motivatie kan utilitair zijn, maar ook vager: ik wil dit gewoon weten
Typen onwetendheid 4 gevoelde –niet erg 4 benauwende / belemmerende –leidt tot zoeken 4 schadelijke –diagnostisch (info behoefte bij anderen)
Van niet weten naar onderzoeken 4 kennisbehoefte –optie 1: behoefte elimineren ik ga niet …. –optie 2: nadenken strijdigheid in kennis analytisch oplossen –optie 3:ondervraag anderen boek, bibliotheek, collega, vriend, instelling, database
Informatiebehoefte: niveaus 4 actuele behoefte, nog niet gearticuleerd 4 mentale articulatie (bewust) 4 formele articulatie 4 de vraag geformuleerd zodat het informatiesysteem er iets mee kan (compromis!) –REPRESENTATIE elke info systeem heeft verschillende verschillend per type info systeem
Ondervragen van info- systeem 4 Dit was optie 3: –vele varianten van info systemen –hoe te kiezen uit mogelijkheden? –wat komt er dan uit? 4 Hangt af van niveau van expertise van de informatiezoeker –titelwoorden (beginner) –trefwoorden (gevorderd) –referenties (deskundig) –collega’s (expert)
Sociale aspecten 4 indirect vragen om onwetendheid te verbergen –vragen naar een goed statistiek boek in plaats van “wat is een correlatiecoëfficiënt” 4 urgentie en belang
Hoe krijg je informatie 4 observatie –is de pasta gaar? 4 communicatie –schat, staat de bokma koud? 4 ‘retrieval’ –opzoeken van opgeslagen communicaties boeken, tijdschriften, andere documenten
Informatie en communicatie 4 gerelateerd maar niet identiek –bv. boek over planten is informatie & communicatie –planten observeren is alleen informatie 4 observatie –methoden en technieken van onderzoek –volgend trimester: M&T cursus
terugzoeken vereist 4 informatie in adequate vorm –classificeren –opslaan 4 collectie vorming 4 indexeren 4 zoektalen 4 domein kennis
Wat wordt er zoal opgeslagen en gezocht? 4 Kwalitatieve en kwantitatieve info over variabelen 4 Tekst (inclusief afbeeldingen) 4 Grafisch materiaal 4 Beschrijvingen van voorwerpen 4 Organisatie informatie (namen, plaatsen, etc..) 4 Bibliografische referenties
Proces van info retrieval 4 zoek bibliografie met referenties naar teksten over …. 4 lokaliseer de teksten en zoek selecteer die met de relevante informatie (b.v. eigenschappen produkt, adres leverancier) 4 zoek die documenten op 4 gebruik ze voor verdere informatie search
Tools, technieken, instellingen 4 boeken met hoofdstuk indelingen en index 4 idem handboeken en manuals 4 catalogi, bibliografieën 4 publikaties met abstracts, en indexen 4 adresboeken 4 elektronische databanken (Dialog etc..) 4 machine-leesbare documenten
Proces van info retrieval –1. indexeren –2. opslaan –3. formuleren en 10. herformuleren –4. ‘matchen’ –5. selectie –6. boodschap aanleveren –7. lokaliseren –8. Informatie leveren –9. evaluatie
Informatie analyse (ten behoeve van indexeren en terugvinden) 4 indexeer-kwaliteit bepaalt wat we terugvinden 4 woordgebruik is divers en dynamisch, en dus: 4 gebleken inconsistentie (tussen personen en in tijd) –niet ‘fout’, wel onvermijdelijk 4 structuur oorspronkelijke document –titel, hoofdstukindelingen, summary etc. –thesaurus: brengt structuur in woorden
Thesaurus 4 Woordstructuur –Use (geprefereerde term) –Used for (synoniemen) –Broader term –Narrower term
Automatisch indexeren 4 Neem elektronisch document –vaak: alleen de abstracts, titels e.d.. 4 Automatische woordfrequentietabel 4 Gooi de heel frequente niet- significante woorden eruit. 4 Formuleer drempel, en alles lager eruit –Die zijn niet geschikt om te zoeken –Alternatief: via thesaurus vervangen 4 Geavanceerd: zoek ‘word-word co-occurrencies’, en gebruik woordclusters voor retrieval (nog nauwelijks in gebruik)
Vraag formuleren en zoeken 4 meestal niet in natuurlijke taal (nadere syntax) 4 meestal niet in gewone termen (maar vervangen via thesaurus) 4 meestal is initiële vraag inadequaat: herformulering 4 dus: opzoeken is ‘kunde’, en vereist eigenlijk kennis van index, thesaurus, en gebied/domein
Vraag formuleren: techniek 4 keuze van adequate termen –boolean operatoren (AND, OR) –vergroten en verkleinen –experimenteren met andere termen (synoniemen) 4 zoekeconomie –organisatie van databases / indexen –meestal niet op ‘strings’
Evaluatie 4 precision: welk deel van de ‘retrieved’ set is relevant? 4 recall: welk deel van de relevante documenten is gevonden? 4 trade off: maximaliseren van ene gaat ten koste van andere! 4 onderzoek: hoe is dit te verbeteren?
Hulpmiddelen voor verbeteren ‘query’ 4 user manual voor de databases –syntax, thesaurus 4 helpsysteem 4 interactieve keuze van zoektermen 4 elektronische vertaling zoektermen in thesaurus termen 4 intelligentie (woord-woord associaties, vraag vertalen etc..)
Informatie terugvinden (retrieval) en semantiek: 4 Communicatie van betekenis 4 Vele vertaalstappen, dus veel kans op onbegrip: 4 producent keuze begrippen referent keuze begrippen georganiseerde indexering 4 keuze begrippen kennisstructuur linguïstische symbolen keuze begrippen 4 consument vraag keuze begrippen vorm query
Semantiek, pragmatiek en context –De semantische problemen bij informatie retrieval (terug vinden) verwijzen dus weer naar het semantisch informatiebegrip –Semantiek is contextueel –De problemen van relevantie verwijzen naar het pragmatische informatiebegrip: of informatie relevant is, hangt ook af van de context en van de gebruiker.