Combining pattern-based and machine learning methods to detect definitions for eLearning purposes Eline Westerhout & Paola Monachesi.

Slides:



Advertisements
Verwante presentaties
Defining a standard JSON-based exchange format for learning metadata Manon Haartsen.
Advertisements

Update on EduStandard: public-private platform in Dutch education Henk Nijstad, Kennisnet / november 2013.
Kwalificaties op EQF niveau 5
Een alternatief voorstel Naar aanleiding van bestudering van de IAASB voorstellen denkt de NBA na over een alternatief. Dit alternatief zal 26 september.
Deltion College Engels C1 Gesprekken voeren [Edu/002]/ subvaardigheid lezen thema: Order, order…. can-do : kan een bijeenkomst voorzitten © Anne Beeker.
Personal before business in requirements prior-IT-ization Johan F. Hoorn Vrije Universiteit Computer Science Information Management and Software Engineering.
MASTERPROJECT M1 · Groep Equilibrium Marieke Steenbeeke Rick van Veghel Tim de Veen MASTERPROJECT M1 ZERO ENERGY BUILDING Previous weeks · Zero.
Hoogwaardig internet voor hoger onderwijs en onderzoek Amsterdam, 23 November 2005 Walter van Dijk SURFnet Development of LCPM decision-making models and.
WETENSCHAPPELIJK EN TECHNISCH CENTRUM VOOR HET BOUWBEDRIJFHTTP:// A proposal for a test procedure for injection products against rising damp.
Scaling up testing and counselling as it looks from treatment data monitoring perspectives: The applied research outcomes and the policy implications it.
Vaardig? Een spectrum aan vaardigheden! Van informatie- naar media- naar exploratievaardig? Of e-Research & e-learning literate? Collaboration literate??
Accessible Instructional Materials. § Discussion: Timely access to appropriate and accessible instructional materials is an inherent component.
Nieuwe wegen in ontwerpen met CAD
Plus proche, pour aller plus loin dans LA VIE ACTIVE Dichterbij, om nog verder te gaan in HET ACTIEVE LEVEN WELCOME TO BRUSSELS Diverse partnerships: a.
© 2004 IBM Corporation Guts Wissema, OpenSource & Linux Sales, IBM Open Document Format.
IST Status Gerrit van Nieuwenhuizen IST-MIT meeting BNL, July 24, 2008
Beyond Big Grid – Amsterdam 26 september 2012 Enquette 77 ingevulde enquettes, waarvan 60 met gebruikservaring = Mainly Computer Science.
Identification Documents Port of Ghent All documents in this leaflet are copies of identification/legitimation documents that authorise persons to access.
PROJECTCOMPETENCE MANAGEMENT SCREENCompetenciesEdit1 DESCRIPTIONCompetencies in the “Competentie beheer” is a link to the editwizard for competencies.
SCENARIO BASED PRODUCT DESIGN
VRB ICT en AI 1 ICT: een uitdaging voor AI Richard Benjamins SWI, Universiteit van Amsterdam.
SQL injections en meer... PERU. web application vulnerabilities Cross Site Scripting (21.5%) SQL Injection (14%) PHP includes (9.5%) Buffer overflows.
Woensdag 23 juli 2014 volgende vorige algemeen ziekenhuis Sint-Jozef Malle Dementia pathway: a condition specific approach Patrick De Wit, MD Thierry Laporta,
“Drawing your Mobility Map” (cf. A. Gohard-Radenkovic) Meertalige competencies & interculturele mediation Utrecht 2010 M-C. Kok Escalle.
In samenwerking met het Europees Sociaal Fonds en het Hefboomkrediet The role of APEL in career coaching and competence management Competence navigation.
Software Engineering Sommerville, Ian (2001) Software Engineering, 6 th edition Ch.1-3
ontwik idee - keling dag 3 goals today Develop “criteria” to help you evaluate & select your ideas Some tools from Tassouls book to help you do this.
Enterprise Application Integration Walter Moerkerken Ilona Wilmont Integratie Software Systemen 8 mei 2006.
ERIC Combine search terms with Boolean operators Next = click.
Organisatie voor Economische Samenwerking en Ontwikkeling
IOP and Vrije Universiteit1 Example of bad interface  Windows: Use Start to Stop.
Netwerk Algorithms: Shortest paths1 Shortest paths II Network Algorithms 2004.
Blended Learning en digitale didactiek Valère Awouters lokaal 3.07 Blended learning is ontstaan door de evolutie van het internet en de.
De digitale coach Het verbeteren van een plan van aanpak Steven Nijhuis, coördinator projecten FNT Deze presentatie staat op:
De digitale coach Het verbeteren van een plan van aanpak Steven Nijhuis, coördinator projecten FNT Deze presentatie staat op:
1 Van Harvard naar MIPS. 2 3 Van Harvard naar MIPS Microprocessor without Interlocked Pipeline Stages Verschillen met de Harvard machine: - 32 Registers.
CAT: Phystrac bij CTS Julie Staals Sept 2007.
Vrije Universiteit amsterdamPostacademische Cursus Informatie Technologie Universal Modeling Language … why you need models? Models are necessary to communicate,
From computer power and human reason. Joseph Weizenbaum.
F REE R IDING IN P ROJECTS Recognize it today, Deal with it tomorrow, Prevent it in the next project Toine Andernach Focus Centre of Expertise on Education,
Clemens Duyvesteijn ExxonMobil Chemical / Refining
Geheugen, distributie en netwerken Netwerken: de basis voor distributie van gegevens en taken (processen) –bestaan zo’n 40 jaar, zeer snelle ontwikkeling.
ANTWOORDEN DIAGNOSTISCHE TOETS MODELOMGEVING. Syntaxis = Syntaxis (van het Oudgriekse συν- syn-, "samen", en τάξις táxis, "regeling") is binnen de theoretische.
Organizing Organization is the deployment of resources to achieve strategic goals. It is reflected in Division of labor into specific departments & jobs.
Motivation One secret for success in organizations is motivated and enthusiastic employees The challenge is to keep employee motivation consistent with.
Deltion College Engels C1 Schrijven [Edu/002] thema: CV and letter of application can-do : kan complexe zakelijke teksten schrijven © Anne Beeker Alle.
Deltion College Engels B1 Gesprekken voeren [Edu/005] thema: applying for a job can-do : kan een eenvoudig sollicitatiegesprek voeren © Anne Beeker Alle.
Deltion College Engels C1 Gesprekken voeren [Edu/004]/ thema: There are lies, damned lies and statistics... can-do : kan complexe informatie en adviezen.
Deltion College Engels C1 Luisteren [Edu/001] thema: It’s on tv can-do : kan zonder al te veel inspanning tv-programma’s begrijpen.
Deltion College Engels B1 En Spreken/Presentaties [Edu/007] Thema: Soap(s) can-do : kan met enig detail verslag doen van ervaringen, in dit geval, rapporteren.
Deltion College Engels En Projectopdracht [Edu/001] thema: research without borders can-do/gesprekken voeren : 1. kan eenvoudige feitelijke informatie.
Deltion College Engels B1 Schrijven [Edu/004]/ subvaardigheid lezen thema: reporting a theft can-do : kan formulieren waarin meer informatie gevraagd wordt,
Deltion College Engels C1 Gesprekken voeren [Edu/006] thema: ‘I was wondering what you think of…’ can-do : kan deelnemen aan de conversatie bij zeer formele.
25 juni 2003SPINE ontwerpaspecten1 SPINE: design aspects Willibrord Huisman, IOWO what is SPINE? types of usersSPINE?users 3 communitiescommunities MapMap.
Writing exercise This one goes into your language portfolio!!! You have until the end of the week to hand it in… (So you have a little longer than it says.
Telecommunicatie en Informatieverwerking UNIVERSITEIT GENT Didactisch materiaal bij de cursus Academiejaar
Telecommunicatie en Informatieverwerking UNIVERSITEIT GENT Didactisch materiaal bij de cursus Academiejaar
A PROMISE for improvement: the ProRail Management Information for Safety and Environment database Linda Wright ProRail.
All Right! 1 thv Unit 4 grammar 2.1 and 2.2.
Rational Unified Process RUP Jef Bergsma. Iterations –Inception –Elaboration –Construction –Transition De kernbegrippen (Phases)
Dutch ELP-project Development of Dutch ELP-project since last meeting 25 September 2004 Graz/Österreich.
Novel Technologies to assess Gut Health Claims for Carbohydrates Lubbert Dijkhuizen & Fons Voragen 14 juni 2011.
Ted Nelson (1937- ) A file structure for the Complex, the changing, and the Interdeterminate.
EML en IMS Learning Design
International Primary Curriculum
Deltion College Engels B1 Schrijven [Edu/003] thema: what have I done wrong…? can-do : kan s/ brieven schrijven over persoonlijke zaken © Anne Beeker.
Mavo 4.  Goal(s)  Letter Puzzle  Write a letter  Check the letters  Do assignments 4A, 5A, 6A & 7 in Student Book page 50  Evaluation.
Europeana Fashion edit-a-thons Faro, Wat is een edit-a-thon?
Today: Chapter 2 Discuss SO 2 What to study for your test?
Benevolence ENGLISH 12 – Quarter 1.
Transcript van de presentatie:

Combining pattern-based and machine learning methods to detect definitions for eLearning purposes Eline Westerhout & Paola Monachesi

Overview Extraction of definitions within eLearning Types of definitory contexts Grammar approach Machine learning approach Conclusions Future work Discussion

Extraction of definitions within eLearning Definition extraction: –question answering –building dictionaries from text –ontology learning Challenges within eLearning: –corpus –size of LOs

Types - I is_def: Gnuplot is een programma om grafieken te maken ‘Gnuplot is a program for drawing graphs’ verb_def: E-learning omvat hulpmiddelen en toepassingen die via het internet beschikbaar zijn en creatieve mogelijkheden bieden om de leerervaring te verbeteren. ‘eLearning comprises resources and applications that are available via the internet and provide creative possibilities to improve the learning experience’

punct_def Passen: plastic kaarten voorzien van een magnetische strip, [...] toegang krijgt tot bepaalde faciliteiten. ‘Passes: plastic cards equipped with a magnetic strip, that [...] gets access to certain facilities. ’ pron_def Dedicated readers. Dit zijn speciale apparaten, ontwikkeld met het exclusieve doel e-boeken te kunnen lezen. ‘Dedicated readers. These are special devices, developed with the exclusive goal to make it possible to read e- books.’ Types - II

Grammar approach General Example Results

Identification of definitory contexts Make use of the linguistic annotation of LOs (part- of-speech tags) Domain: computer science for non-experts Use of language specific grammars Workflow –Searching and marking definitory contexts in LOs (manually) –Drafting local grammars on the basis of these examples –Apply the grammars to new LOs

Een vette letter is een letter die zwarter wordt afgedrukt dan de andere letters. Grammar example

Een vette letter is een letter die zwarter wordt afgedrukt dan de andere letters.

Een vette letter is een letter die zwarter wordt afgedrukt dan de andere letters.

Een vette letter is een letter die zwarter wordt afgedrukt dan de andere letters.

Een vette letter is een letter die zwarter wordt afgedrukt dan de andere letters.

Een vette letter is <tok sp="n" msd="onbep,zijdofonzijd,neut" ctag="Art" base="een" id="t214.6">een letter... <tok sp="n" msd="onbep,neut,attr" ctag="Pron" base="andere" id="t214.14">andere letters.

Results (grammar)

Machine learning Features Configurations Results

Features Text properties: bag-of-words, bigrams, and bigram preceding the definition Syntactic properties: type of determiner within the defined term (definite, indefinite, no determiner) Proper nouns: presence of a proper noun in the defined term

Configurations

Results – is_def (ML)

Results – is_def (final)

Results – punct_def (ML)

Results – punct_def (final)

Final results precision   (50 % and 40 %) recall  (20 % and 30 %) f-score  (30 % and 25 %)

Related work Question answering: –Fahmi & Bouma (2006) –Miliaraki & Androutsopoulos (2004) Glossary creation: –Muresan & Klavans (2002) Ontology learning: –Storrer & Wellinghof (2006) –Walter & Pinkal (2006)

Future work try different features evaluate other classifiers extend to all types of definitions scenario based evaluation of the GCD

Discussion Good features? Apply filtering: yes or no? How to evaluate the performance? –scenario based? –compare with manual annotation? –...