DutchSemCor: van SoNaR naar WSD Attila Görög – Vrije Universiteit Amsterdam

Slides:



Advertisements
Verwante presentaties
‘Over taal en rekenen gesproken…’ September/oktober 2010.
Advertisements

1 Dependency Parsing by Inference over High-recall Dependency Predictions Sander Canisius Toine Bogers
Van primair onderwijs naar voortgezet onderwijs
Hoger onderwijs in Almere Frans Vos Rogier van der Wal Leertraject New Towns 6 juni 2011.
Dit is de start- en eindpagina
Korte schets van het Menzis GGZ inkoopbeleid 2013
Concept Cartoons Voor ondersteunend materiaal zie:
Kant-en-klare bouwstenen voor de CLARIN-infrastructuur
Ouderavond 6 vwo 25 September 2013 Informatieavond 6 vwo Welkom.
Masterintake 2014 normen en peildata
Digitale Studiemaatjes
Wat is goed onderwijsonderzoek?
Informatiekunde (UvA) Informatie, Multimedia & Management (VU)
Internet een link met uw doelpubliek Website als centrale toegangspoort.
Start de gehele presentatie
ouderavond 6 tvwo programma InleidingJaap Oudenaarden IBAnette van het Erve DecaanAlbert Wisgerhof.
Marco Ligtvoet MSc Aardrijkskunde IOL 14 mei 2010
Hergebruik van taal- en spraakdata in e-health Remco van Veenendaal projectleider TST-Centrale Ehealth4com Nijmegen 3 oktober 2013.
Ontwerpprojecten In de praktijk
Onderwijskwaliteit een discussiebijdrage Herman van den Bosch.
Vereniging FORUM voor Volkshuisvesting. Wat Waarom Wie Waar En verder Vereniging voor Volkshuisvesting Opgericht in 1988 door onder anderen: studenten.
© 2011 Graydon Nederland.
Deze presentatie Over het WERKbedrijf De arbeidsmarkt in de regio
Toekomst van de e-Infrastructuur
Biografie Boosheid onder vrienden bij autochtoon-Nederlandse kinderen en Marokkaans-Nederlandse kinderen.
Leer- werkplaats MPG aanpak
Van wie is de kwaliteit van het onderwijs?
Wiskunde D op de UvT Herbert Hamers.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
Informatiekunde ‘project Informatiewetenschappen’ 7 november F. de Vries Website Evaluatie.
MedMec Co-Creatie les 2 / Pia Terstroet P. M.
Media & Creativiteit / Pia Terstroet (wiki)
Media & Creativiteit / Pia Terstroet (wiki)
Presentatietitel: aanpassen via Beeld, Koptekst en voettekst 1 VOORLICHTING B3 KEUZERUIMTE maart 2014 Tineke Hoeksma, studieadviseur.
Testen upgrade Blackboard
van schoolopleiders en instituutsopleiders
Titel auteur oktober /10 Verbinden van Onderwijs en Onderzoek Ontwerpgerichte kennisontwikkeling, praktijkgericht onderzoek door studenten en docenten.
Ouderen op de arbeidsmarkt: werkt dat?
DANS is een instituut van KNAW en NWO Data Archiving and Networked Services DAI & NARCIS Chris Baars 14 Maart 2013 DANS is een instituut van KNAW en NWO.
Kleine kwaliteit CWZ Nijmegen, 14 oktober 2010 Margo Trappenburg.
KNOV WETENSCHAPSCOMMISSIE VERLOSKUNDE STAND VAN ZAKEN PER 11 DECEMBER 2008.
1 InternettechnologieRik Van de WalleGent, maart 2008 Reading Assignment Internettechnologie (ITech) Rik Van de Walle academiejaar
JobEvent 2 okt student bezoekers (68 onbekende hogeschool) 194 BI; 143 I; 62 TI; 44 CMD; 25 ? Algemene beoordeling: 56% goed; 84% redelijk Aanbod:
Dit is de start- en eindpagina
Ruim aanbod aan kavels unieke woonlocatie bossen en vennen op loopafstand dichtbij Mierlo centrum dichtbij Geldrop, Eindhoven en Helmond dichtbij.
Presentatie UKB Digitale Toets informatievaardigheden Marjolein Drent en Bert Boxem Bibliotheek & Archief, Universiteit Twente.
5S in Velsen.
EXCURSIE “WEET IK VEEL” S TUDIECOACHING ITEM 6 S ARAH B ARTHOLOMÉ CO2B Opnames 6 maart 2013.
1.
Risque professionel en risque social (en de toekomst van compensatie + preventie van arbeidsongevallen en beroepsziekten in Nederland) Wim Eshuis Research.
NMC 2003 De Waalbrug in wiskundig perspectief André Heck Amsterdam Mathematics, Science and Technology Education Laboratory.
Bijpraten over de Wmo
Vereniging Vlaamse Brandweervrijwilligers (VVB) Vereniging Vlaamse Brandweervrijwilligers “Onze vrije tijd, voor UW veiligheid!” Regiovorming in Nederland.
Bijeenkomst voor (G)MR passend onderwijs
Na de basisschool Presentatie Procedure naar het VO Mieke Staal Intern Begeleider 5 MW.
Nieuwjaarsevenement MVO ‘Van ambitie naar impact’ 20 januari 2015
April Slide 2"Insert" Date via Date & Time Sales product training Amsterdam, the Netherlands Lennart van Houwelingen Fallbrook Technologies.
E-Xperimenteren Plus Leendert van Gastel, UvA Jan Mulder, VU , NNV Landelijke Practicumdag.
Honoursprogramma voor propedeusestudenten
Functie-eisen / Competenties Afgeronde werktuigbouwkundige opleiding op HBO of academisch niveau; Minimaal vijf jaar ervaring in technische organisaties;
Selectie, Instroom en Overstap voor de Masteropleidingen Biomedische Wetenschappen BioMedisch Studenten Overleg.
LMSO Congres “Ba-Ma mobiliteit” BMSO Historie BMSO Ba-Ma mobiliteit Resultaten NVMO discussie Enquête master voorlichting.
E-Xperimenteren Plus Project van de Digitale Universiteit Leendert van Gastel, UvA Jan Mulder, VU , LabVIEW in Education.
Community Service Learning VU Amsterdam 2 december 2015.
Bio-medische wetenschappen aan de Science faculteit & het AMC van de Universiteit van Amsterdam Bachelordag 8 maart 2014 Prof. Dr. Stanley Brul BSc directeur.
MT Community Landelijk Goed Doel – Samen bouwen Partnerships met: –Stichting Pallieter (Landelijk goed doel) –Cordaid (Internationaal.
Functional Web Applications Implementation and Use of Client-Side Interpreters Jan Martin Jansen.
Digitale Verblijfsaanvragen Studie
Portfolio’s voor scripties en andere zelfwerkzaamheidsprojecten
Gedragsproblemen en stoornissen
Transcript van de presentatie:

DutchSemCor: van SoNaR naar WSD Attila Görög – Vrije Universiteit Amsterdam

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor Outline 1. DutchSemCor 2. Semantic Annotation Tool (SAT) 3. Sonar-1: probleem dekkingsgraad senses 4. Oplossingen

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor 1. DutchSemCor Subsidie:  NWO-investeringsproject Betrokken universiteiten:  VU  UvA  UvT

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor 1. DutchSemCor Team:  VU Piek Vossen Attila Görög 8 annotatoren (studenten)  UvA Maarten de Rijke Fons Laan  UvT Antal van den Bosch Maarten van Gompel

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor 1. DutchSemCor Doel: Nederlands tekstcorpus met betekenisaanduidingen uit het semantisch lexicon Cornetto.  WSD systemen ontwikkeld en getraind  Cornetto aangepast en aangevuld  Sonar verrijkt

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor 1. DutchSemCor Methodologie:  3000 meest frequente/polyseme woorden  25 tokens per betekenis (uit o.a. SoNaR)  250k tokens handmatig geannoteerd  750k tokens automatisch met co-training

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor 2. Semantic Annotation Tool (SAT)

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor Logfile

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor Loganalyser

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor 3. Sonar-1: probleem dekkingsgraad senses kandidaat:4  drager laagste academische graad (“kandidaat in de taalwetenschap”) crisis:2  kritieke fase in een ziekte ("Bij mensen met de ziekte van Addison kunnen zeer ernstige stressvolle situaties leiden tot een crisis”) bloem:2  top (“de bloem der natie”)

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor 4. Oplossingen Verdere releases SoNaR SoNaR aanvullen met andere corpora  CGN  OpenTaal  Internet snippets

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor Snippettool

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor Conclusie SoNaR-1: goede resultaten in DutchSemCor  Cornetto – aangevuld & aangepast  Ruim 1k tokens (grotendeels SoNaR-1) Dekkingsgraad laag bij een aantal senses  Aanvulling CGN, OpenTaal & Internet

Presentatie Stevin-dag, 14 oktober 2010, DutchSemCor Meer informatie Website  Contact  Attila Görög –  Vrije Universiteit Amsterdam