Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdEmma Michiels Laatst gewijzigd meer dan 9 jaar geleden
1
Nederlandse Organisatie voor Wetenschappelijk Onderzoek A Common Multimedia Annotation Framework for Cross Linking Cultural Heritage Digital Collections LREC 2008, Marrakech, Morocco Hennie Brugman MPI for Psycholinguistics, Nijmegen, Netherlands Véronique Malaisé Free University, Amsterdam, Netherlands Laura Hollink Free University, Amsterdam, Netherlands
2
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Overview –The CATCH programme and its annotation requirements –Existing models –Annotation Meta Model (AMM) and its application to CATCH cases –Software and infrastructure –Conclusions
3
Nederlandse Organisatie voor Wetenschappelijk Onderzoek CATCH – Continuous Access To Cultural Heritage –Dutch research program funded by NWO –Apply state of the art methods to the construction and exploitation of digital collections of large Cultural Heritage institutions –Currently 10 projects, hosted by Cultural Heritage institutions –Rijksmuseum Amsterdam, Dutch National Archive, Dutch National Library, Netherlands Institute for Sound and Vision, etc –Results and software applicable across institutions and collections
4
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH Objectives: -Cross media, cross collection, cross institution annotation of digital objects and segments of objects -Add new layers of annotation to existing annotations -Centralize storage and exploitation of annotations generated by CATCH projects -Apply and showcase annotation recommendation modules/services from several CATCH projects
5
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “some text description” Resource Primitive value (string, date, number,…) http://www.beeldengeluid.nl/GTAA#Subject_kunst_ Semantic value property
6
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “Abraham van Beijeren” Resource complete resource catalog, metadata resource types images text html, xml audio video artist
7
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “very much” Resource segment – sound-video choral:transcription
8
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “roemer” Resource segment - image racm-glass:Shape
9
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “boven eener verloting te Amsterdam” Resource segment – scanned handwriting scratch:transcription
10
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “boven eener verloting te Amsterdam” Resource segment – text scratch:transcription http://geonames.org/NL/Amsterdam choice:location
11
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “boven eener verloting te Amsterdam” Resource segment – text http://geonames.org/NL/Amsterdam “bommenwerpers boven de hoofdstad”
12
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “boven eener verloting te Amsterdam” Resource segment – text http://geonames.org/NL/Amsterdam “bommenwerpers boven de hoofdstad” http://TGN/Amsterdam http://TGN/NL
13
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH –Further requirements for the annotation formalism –Project and media specific extensions –Predefined annotation schemes –Generic and specific queries possible –Expressive and simple –Reuse or include existing annotation models or vocabularies
14
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Existing annotation models –Semantic web community –Focus on (semantic) annotation values –Anchoring mainly to complete resources or web pages –Linguistic annotation community –Anchoring to text or time series –Usually no semantic values –Media industry (e.g. MPEG-7) –Objections –Not all media types covered –Too complex or specialized –Hardly ever annotation of annotations, and of segments of annotation values
15
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotation Meta Model (AMM) – why RDF? –RDF, RDFS and OWL seem good modeling languages for the domain of annotation - graphs versus hierarchies –Some of our requirements automatically met: –Class and property inheritance –Constraints (e.g. domains and ranges for properties) –Integration of semantic values –Classes and instances for annotation schemes and annotation resp. –General and specific queries
16
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model
17
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model
18
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model
19
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model
20
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model
21
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model AnnotatableObject Coordinates TimeSeriesObjectTextObjectImageObject TimeSegmentRegion2DTextSpan
22
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Scanned handwriting case ann
23
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Scanned handwriting case ann
24
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Scanned handwriting case ann
25
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Scanned handwriting case ann
26
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Scanned handwriting case ann
27
Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Other cases –Semantic annotations of segments of text documents –Manually annotated image regions –Complex linguistic annotation of co-occurring speech and gesture –Syntactic annotation of text
28
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Software and infrastructure –RDF repository, wrapped with AMM web service –Stores AMM model, project-specific annotation schemes and annotation data –Java API, defining and implementing this web service –Clients: –CHOICE@CATCH documentalist support system –Integrated multimedia and web based “Annotation and Recommendation” demonstrator for CATCH
29
Nederlandse Organisatie voor Wetenschappelijk Onderzoek CHOICE Documentalist Support System
30
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotation and Recommendation demonstrator
31
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Conclusions –All requirements seem to be met –Applicable to a wide range of very different cases –Repository works efficiently, however not yet tested with a large number of AnnotatableObjects (so far, approx. 50.000) –Highlights: –Layered annotation –All media types are or can be supported –Annotation with multimedia objects or object segments possible
32
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Thank you
33
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Instances: CHOICE text annotation “http://www.beeldengeluid.nl/Thesaurus/GTAASkosv7.owl# ” “Subject ” a1 addressesTextSpan partOf (n1, n2) “AndereTijdenGemmeker.txt” apoldaSubject apoldaOntology Subject_bevelhebbers_ apoldaIdentifier r1 dc:title
34
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Instances: video/audio annotation “dit is gesproken tekst” a1 addressesTimeInterval partOf t1 “gesturing_people.mpg” transcription textObject a2 partOf partOfSpeech (beginNode, endNode) http://www.isodatcats.org/part-of-speech#Noun t2 hasTime “3521” “4692” addressesTextSpan “some gesture description ” a3 addressesTimeInterval partOf t3 “gesturing_people.mpg” t4 hasTime “3854” “5290” handshape http://www.mpi.nl/myShapes#fist next dc:description dc:title
35
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Instances: syntax tree on text a1 addressesTextSpan partOf (n0, n3) “german sentence 1” r1 dc:title “Der Mann geht schnell” hasText a2 a3 a4 partOf “Der” hasText “Mann” hasText (n4, n8) (n9, n13) (n14, n21) addressesTS “geht” “schnell” syntax D N V Adv NP1 VP1 S1 anchorsTo NP S VP anchorsTo syntax
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.