Coherentierelaties annoteren

Slides:



Advertisements
Verwante presentaties
Marktonderzoek als proces
Advertisements

Risico’s en gevaren van techniek
Onzekerheidsreductie
How to tackle a text Vakgroep Engels.
De rol van aandachtsfocus in blootstelling aan bedreigende informatie
Fast and Effective Query Refinement B. Velez, R. Weiss, M.A. Sheldon, D.K. Gifford SIGIR 1997.
Onderzoeksmethode Oftewel: met welke specifieke onderzoeksmethode kan ik het best mijn onderzoeksvraag beantwoorden.
Hoofdstuk 11 Kwantitatieve gegevens analyseren Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian Thornhill, Marije.
Hoofdstuk 5 Onderhandelen over toegang en onderzoeksethiek Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian Thornhill,
Als we wisten wat we deden, heette het geen onderzoek.
LEESVAARDIGHEID Tips & Tricks.
The relevance of recall and precision in user evaluation Louise T. Su Journal of the American Society of Information Science 1994.
Gender en wiskunde Anja Jansen 2007.
MET DANK AAN COLLEGA’S IN DEN LANDE ! vee 2012
Onderzoek Mentorschap
Foutvrij Productontwerpen met IDOLLSS
''Maar dus ik denk dat...'' Een kwalitatieve studie van het gebruik van dus en maar door Franstalige leerders van het Nederlands Julien Perrez Facultés.
Ellen Govaerts, Two Roads
Psychologisch contract
Master in de Meertalige Professionele Communicatie Visualization of agreement and discussion processes during computer-supported collaborative learning.
Is dit onderzoek belangrijk? Is dit onderzoek onbelangrijk?
Overzicht ViP’s* ViP-1: structuur 1
De Invloed van Populaire leeftijdgenoten op de Bereidheid van Adolescenten om Alcohol te Drinken: Een Experimentele Chat Room Studie Hanneke Teunissen,
ANALYSE 3 INFANL01-3 WEEK CMI Informatica.
Gerald Riedstra STOEIEN TUSSEN VADER EN KIND Onderzoek naar de psychometrische kwaliteiten van de Nederlandse versie van Rough and Tumble Play-Quality.
RCT naar het effect van een online decision aid voor zelftesten Martine Ickenroth, Janaica Grispen, Gaby Ronda, Geert-Jan Dinant, Nanne de Vries, Trudy.
Quality Management: METHODEN TECHNIEKEN PROCESVERBETERIN G
Plancyclus, les 4  Actualiteit  Vragen naar aanleiding van vorige les  Vragen over hoofdstuk 4 en 5  Observeren met een plan; het verschil tussen observeren.
Een jaar later… Inclusief praktische ervaringen van leerkrachten Jan Engelen & Nicole Goossens.
Voorlichtingsavond TH Leren met plezier!. Welkom Sander ScholtenDavid Snoeij.
De lidwoorden Kleine woorden met grote gevolgen!! Welke ken je? (ne en fa du)
EXPERIENCES OF NURSES WORKING AT A STROKE UNIT ON THE TAILORED IMPLEMENTATION OF AN EVIDENCE-BASED GUIDELINE; A QUALITATIVE PROCESS EVALUATION Door Eline.
Effectiviteit van gedeelde besluitvorming in de huisartspraktijk bij diabetes type 2: OPTIMAAL studie Dr. R.C. (Rimke) Vos, Julius Centrum UMC Utrecht.
Vrouwen zijn veel meer waard !!! Sorry mannen, Maar het is nu echt bewezen…
De ultieme flexicurity tool? Deeltijd-WW Dimitris Pavlopoulos (VU) Katja Chkalova (CBS en UvA)
Functioneren en fysieke activiteiten van patiënten na chirurgie in verband met botsarcoom; resultaten van een lange termijn studie J.C. van Egmond-van.
Robby de Robot. Javascript Tot nu toe gebruikt: – document.write(" Hello World "); – alert("tekst") – Toon een waarschuwingsvenster – prompt("tekst",
Perspectieven op een gezond en gelukkig leven
Disclosure belangen NHG spreker
8 Samengestelde Redeneringen identificeren
Disclosure belangen Alike van der Velden
Meest voorkomende vragen bij examenteksten.
Verschil in telefonische triage bij mannen en vrouwen verdacht voor acuut coronair syndroom
Meest voorkomende vragen bij examenteksten.
Vakgroep Gezondheidswetenschappen
Disclosure belangen NHG spreker
Disclosure belangen NHG spreker
Bekkenpijn tijdens en na de zwangerschap
1. Kan je objectief kijken?
Eerder op niveau, wat heeft het opgeleverd?
De Kracht van Communicatie
1. Wanneer is een theorie wetenschappelijk?
Finding ways to promote STI testing among the Afro-Caribbean community
Pilot computers in examenzalen Eerste resultaten
Jongeren en seks Plaatje.
Problemen van mantelzorgers die zorgen voor een oudere naaste
Syntactische Annotatie CHILDES
GrETEL 4: Beter zoeken.
Disclosure belangen NHG spreker
Vormgeving van experimenten voor beter beleid
Disclosure belangen NHG spreker
Tool WD-2: Verbinden van opdrachten aan de beroepscontext
Disclosure belangen (Potentiële) belangenverstrengeling Geen
Delphi studie naar de zorgvraag van ouderen in de toekomst
Disclosure belangen NHG spreker
Financiële kengetallen
Acceptance and Action Questionnaire
Disclosure belangen NHG spreker
1. Wanneer is een theorie wetenschappelijk?
DEEL DRIE Evaluatie van de activiteiten uit het beroepsleven
Transcript van de presentatie:

Coherentierelaties annoteren Anncor-bijeenkomst 22-11-2017 Coherentierelaties annoteren Een methode voor naïeve annotatoren Laura Brands Work package Discourse Annotation

Work package Discourse Annotation Nina Sangers: completeren en in één format zetten van geannoteerde coherentierelaties uit het PhD-onderzoek van Jet Hoek (± 400 per type) additieve relaties (also, in addition) causale relaties (because, so) contrastieve relaties (but, although) conditionele relaties (if, unless) = Engelse bronteksten uit Europarl-corpus met vertalingen in het Nederlands, Duits, Frans en Spaans Laura Brands: annotatie-experiment dat gebruikmaakt van AnnCor-corpus van coherentierelaties

Introductie De meeste annotatiemethoden kosten veel tijd en vereisen veel voorkennis. Bijvoorbeeld Carlson et al. (2003): handleiding van 87 pagina’s en uitgebreide training voor ervaren annotatoren. Scholman et al. (2016) ontwikkelden een stapsgewijze methode voor het annoteren van coherentierelaties. Kost minder tijd Kan gebruikt worden door onervaren annotatoren.

Een stapsgewijze methode Coherentierelaties = betekenisrelaties tussen (deel)zinnen (bv. tegenstelling, oorzaak-gevolg) Coherentierelaties worden geanalyseerd met vier primitieven: Polariteit: positief, negatief Relatietype: causaal, conditioneel, temporeel, additief Coherentiebron: objectief, subjectief Volgorde: natuurlijk, omgekeerd, n.v.t.

Een stapsgewijze methode Primitieven kun je hiërarchisch ordenen: Scholman et al. 2016, p. 10

Een stapsgewijze methode Annoteren wordt gedaan m.b.v. parafrase- en substitutietesten. Substitutietest: Denk eventuele connectieven weg. Kun je de relatie markeren door… Polariteit: maar Relatietype: omdat/hoewel (causaal), als/tenzij (conditioneel), toen (temporeel), en (additief) Parafrasetest: Kun je de relatie parafraseren als… Coherentiebron: De segmenten beschrijven een situatie/feit/gebeurtenis (objectief); De segmenten beschrijven een mening/bewering/conclusie Volgorde: S1 is de oorzaak, S2 het gevolg (natuurlijk); S1 is het gevolg, S2 de oorzaak (omgekeerd)

Een stapsgewijze methode Veelbelovende resultaten bij Scholman et al., maar: Hiërarchie kan een negatief effect hebben gehad  fouten op eerdere primitieven leiden tot fouten op latere primitieven. Onderzoeksvraag: Leidt het verwijderen van de hiërarchie tot hogere agreement scores?

Annotatie-experiment - voorwerk Bureau-analyse: veranderingen aan handleiding en parafrase- en substitutietesten van Scholman et al. (2016). 20 fragmenten geannoteerd door vier experts om gouden standaard te bepalen. Polariteit niet geannoteerd: verlaagt de werkdruk en Scholman et al. (2016) tonen aan dat dit primitief nauwelijks problemen oplevert.

Participanten 40 in totaal, leeftijd variërend van 18-31 (gemiddeld 21,6). Alle participanten deden een aan taal gerelateerde studie. Verdeeld over twee groepen: hiërarchisch en niet- hiërarchisch. 20 participanten (3 mannen, 17 vrouwen) in elke groep.

Methode Handleiding op papier, annoteren via online vragenlijst. Relatietype: substitutietest voor volgende waarde verschijnt pas als de vorige is beantwoord.

Methode Niet-hiërarchische groep moet altijd elk primitief bepalen. Als relatietype temporeel, dan coherentiebron automatisch objectief. Als relatietype additief, dan volgorde automatisch n.v.t.

Resultaten Inter-annotator agreement (AC1 en Fleiss’ kappa)

Resultaten Kappa agreement met gouden standaard

Resultaten Recall, Precision en F-scores voor relatietype

Resultaten Recall, Precision en F-scores voor coherentiebron

Resultaten Recall, Precision en F-scores voor volgorde

Conclusie Over het algemeen leidt verwijderen hiërarchie tot hogere scores. Als de problemen kunnen worden opgelost, kan annoteren bijvoorbeeld via crowdsourcing gedaan worden. ‘Moeilijke’ fragmenten kunnen dan nog bekeken worden door experts. Dit scheelt al veel tijd en geld.

Referenties Carlson, L., Marcu, D. & Okurowski, M. E. (2003). Building a discourse-tagged corpus in the framework of Rhetorical Structure Theory. In J.C. J. van Kuppevelt & R. W. Smith (eds.), Current and new directions in discourse and dialogue (pp. 85-112). Dordrecht: Kluwer. Scholman, M. C. J., Evers-Vermeul, J., & Sanders, T. J. M. (2016). A step-wise approach to discourse annotation: Towards a reliable categorization of coherence relations. Dialogue and Discourse 7(2), 1-28.