30 juni 2000 1 Deze morgen Vorige bijeenkomst: –een concepthierarchie van kernbegrippen in Logic & Language vakgebied (o.b.v. glossary) Vandaag: –Jon:

Slides:



Advertisements
Verwante presentaties
Beeld  -> woord 4 lessen beam van waardenberg beeld  -> woord 4 lessen beam van waardenberg.
Advertisements

Online Marketing voor het MBO “SEO, dat kun je zelf!”
Record Linkage: Simulatie Resultaten Adelaide Ariel Biolink NL 28 maart 2014.
EDC ervaringen op de werkvloer – fase I/IIa
12 juni 2010 Door Bart Bongers en Alex Bossers
01 van 06 Portal4U Loe Hameleers Twan Saleming Klanten: Wat kost dat artikel? Wanneer wordt geleverd? Die werkt hier niet meer.. Die factuur ken ik niet.
To retrieve or not to retrieve, that's the question retrieval van wetenschappelijke informatie eric sieverts.
HALLO OPLETTEN : Waarom sql DOEN : Introductie opdracht
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
CLOUD-VITAE VEREENVOUDIG UW SELECTIEPROCES. Over Cloud-Vitae Opgericht in 2013, gevestigd in Papendrecht, innovatief en snelgroeiend. 15 jaar ervaring.
Presentatie A&O netwerk Arbeid & Organisatie van het NIP Nederlands Instituut van Psychologen darwine.
Databases.
VOB 21 april 2009 Dr. Hilde Goris
Adobe formulieren : stand van zaken.
© BeSite B.V www.besite.nl Feit: In 2007 is 58% van de organisaties goed vindbaar op internet, terwijl in 2006 slechts 32% goed vindbaar.
Jan Talmon Medische Informatica Universiteit Maastricht
Visibility-based Probabilistic Roadmaps for Motion Planning Tim Schlechter 13 februari 2003.
Parallelle Algoritmen String matching. 1 Beter algoritme patroonanalyse Bottleneck in eenvoudig algoritme: WITNESS(j) (j = kandidaat in eerste i-blok)
Ontwerpen van Informatiesystemen met
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
SQL & datamodelleren.
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Fast and Effective Query Refinement B. Velez, R. Weiss, M.A. Sheldon, D.K. Gifford SIGIR 1997.
Navigatie met de Glossary Jon Ragetli. 21 maart Inhoud _Achtergrond _Huidige glossary –Inhoud –Verwijzingen _Fracas glossary _WordNet _Ideale electronische.
Hoe vind ik Kamerstukken digitaal met OpMaat
retrieval en ontsluiting taaltechnologische aanpak voor zoekproblemen
TALENT SCORION Handleiding Scorion Peer Evaluatie
HALLO OPLETTEN : Waarom sql DOEN : Introductie opdracht
Latente semantische analyse (LSA) en erkenning van EVC’s: wat kunnen we ermee? Jan van Bruggen Ellen Rusman Bas Giesbers Oktober 2005.
Nieuw in LIPS VLUG 2 26 juni 2006 Kristof Brams. Overzicht Vernieuwde editor Printervriendelijke pagina Statistieken Variabele fontgrootte Grootte van.
Prakticum MTI mei/juni Administravia bijeenkomsten programmeerstijl: donderdag 16 mei 9-11 donderdag 23 mei 9-11 bijeenkomst MTI opdracht: vrijdag.
1 OMI Technisch ontwerp. 2 Technisch ontwerp ‘content’ Veel breder dan business portals (Carlson) Verschillende aspecten / aandachtspunten:
19 juni 2008 De Digitale Balie Martin de Bruijn. 19 juni 2008 De Digitale Balie. Wat is de Digitale Balie?. De ontwikkeling van de Digitale Balie. Waar.
nieuwe toepassingen 2008 Schoolbib 2.0 / VVBAD Mechelen, 5 november 2008 Rosemie Callewaert - Project Manager VCOB.
The relevance of recall and precision in user evaluation Louise T. Su Journal of the American Society of Information Science 1994.
Implementing Cross-Language Text Retrieval Systems for Large-scale text Collections and the World Wide Web n Mark W. Davis and William C.Ogden n AAAI 1997.
Joost van Dijk Web Technology
Wouter Jansweijer, 16 September, Literatuur zoeken Project informatiewetenschappen october 2002.
HBO-I Conference Tour RUP| versie 1.0 | 18 maart 2010 RUP toegepast binnen DUO Een korte impressie hoe we binnen DUO RUP ingevoerd hebben (aan het.
Databases.
© L.A.F.M. Kerklaan HCG 1 16 november 2001Juridisch bibliothecarissen Het managen van de juridische bibliotheek Het kwaliteitshandboek als praktisch instrument.
Ontwikkeld door Anne Coppens en Carlo Verhaar Presentatie Beoordeling.
Praat eens met een veteraan darwine.
Zoeken en vinden: ranking & clustering TU Delft Library Digitale Productontwikkeling Egbert Gramsbergen.
Zonnekeur Installateur Solar days 2014, Wageningen Gerard van Amerongen Stichting DEPK 1.
Relationele Databases
Welkom De techniek van websites
Meer bekendheid via je Website
24 april 2008 | 1 › / Henk Druiven Repository-gebruikersdag donderdag 24 april 2008.
Interactieve (Marketing) communicatie COLLEGE 07 SHEET 1 Interactieve (Marketing) Communicatie.
Bezoekersgerichte teksten
Online informatie zoeken via de bibliotheekwebsite Demo Nyenrode bibliotheek.
DigiDoc Een digitaal kantoor voor iedereen !. Ceci n’est pas du software?! 2.
Ontwikkeling van aanbevelingsalgoritmen voor online social games Jan Heuninck.
Inhoud Presentatie 1. Probleemstelling onderzoek 2. Wat is een search engine? 3. Geschiedenis van search engines 4. Hoe werkt een search engine? 5. Welke.
MEETING SYSTEMS BV VOOREFFECTIEFVERGADEREN.  Meeting Systems bv levert software als hulpmiddel om het vergaderen te ondersteunen met de volgende kenmerken:
Handboek integrale veiligheid voor lokale besturen.
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Databases I (H. 2) Wiebren de Jonge Vrije Universiteit, Amsterdam versie 2003 (blijft dit jaar ‘incompleet’)
Webteksten en SEO Wat hebben zij met elkaar te maken?
Masterproef: finale presentatie Vital D’haveloose Promotor: prof. Erik Duval Co-promotor: dr. Joris Klerkx Begeleider: ir. Robin De Croon.
Search engines welk instrument voor welke taak eric sieverts Universiteitsbibliotheek Utrecht Instituut voor Media en Informatiemanagement / HvA Eric Sieverts.
Thema 2, week 1.4 Leerdoelen en instructiemodellen 22 september 2014
Bijeenkomst vakcoördinatoren. 2 Opzet Voorstelling vakbegeleiding Doel bijeenkomsten Uitnodigende school.
Basics SERP = Search Engine Results Page Betaalde resultaten = SEA Natuurlijke resultaten = SEO Search Engine Optimization SEO is een lange termijn verhaal.
Databases.
Kluwer The end of Publishing
Databases.
Ontwerponderzoek.
Marketing en zoekmachines
Transcript van de presentatie:

30 juni Deze morgen Vorige bijeenkomst: –een concepthierarchie van kernbegrippen in Logic & Language vakgebied (o.b.v. glossary) Vandaag: –Jon: tools voor infrastructuur concepthiërarchie –Jan: domeinkennis voor concepthiërarchie –Maarten: demo van prototype –Jon: plannen

30 juni Hiërarchie als Ruggengraat logic modal logic epistemic logic dynamic logic alethic logic symbolic logic... hiërarchiehiërarchie handboek WWW Links: in hiërarchie naar handboek naar Web

30 juni Overzicht Inhoud entries (handmatig) Links –in hiërarchie (handmatig, domeinkennis vereist) –naar handboek (automatisch) –naar Web (automatisch) Automatisch: een expert ondersteund met techniek (Machine Learning, Information Retrieval) Leren van lezers

30 juni Links Genereren Doel: Links van hiërarchie naar handboek Reden: handmatig te veel werk Methode: –Vector Space model voor Information Retrieval query = glossary entry documenten te vinden: handboek pagina’ neem de N pagina’s met de hoogste similariteit –intuïtie: belang van de naam is groot

30 juni Vector Space Model Tekst en query: vector van gewichten op woordstammen Waarde van de gewichten –frequentie in document hoog: gewicht hoog –komt vaak voor in andere docs: gewicht laag –‘normalisatie’ om kleine documenten te bevoordelen Similariteit = inproduct van de vectoren

30 juni Links Genereren - Evaluatie Niet: traditionele recall & precision Geëvalueerd voor 14 glossary entries m.b.v. relevantie (  precision) –waardes: 0 tot en met 2 pagina kleinste omvattende sectie

30 juni Links Genereren - Experimenten Gewichtenschema experimenteel bepaald: –tfc.tfx –Query: Document: tf: term frequency, N: aantal documenten, n: aantal documenten met term Gewicht aan naam van de entry: –tekst+naam –tekst+3*naam – tekst+5*naam – alleen naam

Links Genereren - Resultaten

30 juni Links Genereren - verder? 50% van de links in orde Criterium voor onderscheid goed/slecht –similariteit, ranking Links genereren met frases i.p.v. woorden –hyper/hyponiemen ‘logic’ vs. ‘modal logic’ Hiërarchie en link generatie (score?) Bottom-up: vanuit handboek Links handboek tekst naar hiërarchie

30 juni Links Genereren - verder? Tekst classificatie (machine learning) –SVM, kNN, LLSF, NNet, NB Leren van juiste gewichtenschema’s Belangrijk: kijk naar connectiviteit –links (Google)  references (handboek)? Uitdaging van dit domein: klein aantal grote teksten i.p.v. andersom

30 juni Koppeling hiërarchie en Web Wrappers: Koppeling digitale handboek en online databases (DB) of zoekmachines (ZM) –wrapper stelt queries aan DB/ZM –DB/ZM levert resultaatpagina –wrapper extraheert resultaten onsamenhangend  relationeel Nadeel: Web verandert snel Wrapper Handboek (gestructureerd) Web (ongestructureerd)

30 juni Resultaatpagina’s Top: nutteloos Resultaat Advertentie Begin van de resultaten Nutteloze ‘info’: Nutteloze HTML

30 juni Wrappers - Automatisch Genereren Minimale input van gebruiker: één resultaat –initiële grammatica Similariteit in structuur voor vinden andere resultaten –Grammatica aanpassen voor gevonden items (grammar induction) Werkt relatief zeer goed maar nog niet perfect –meer input?– andere grammatica-vorm?

30 juni Leren van lezers Logs van gebruik –kwaliteit nut linktypes –nut van de beschrijvingen –gebruik van handboek, web Lastig handmatig te analyseren –statistiek –machine learning

30 juni Komende periode Hiërarchie in database, gekoppeld aan Web Hiërarchie inhoudelijk verder ontwikkelen –model voor entry (evaluatie) Auteurs uitnodigen (meer voorbeelden) Ondersteuningstools ontwikkelen –linkgeneratie –integratie WWW (bibl. database, zoekmachines)