De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Nederlandse Organisatie voor Wetenschappelijk Onderzoek A Common Multimedia Annotation Framework for Cross Linking Cultural Heritage Digital Collections.

Verwante presentaties


Presentatie over: "Nederlandse Organisatie voor Wetenschappelijk Onderzoek A Common Multimedia Annotation Framework for Cross Linking Cultural Heritage Digital Collections."— Transcript van de presentatie:

1 Nederlandse Organisatie voor Wetenschappelijk Onderzoek A Common Multimedia Annotation Framework for Cross Linking Cultural Heritage Digital Collections LREC 2008, Marrakech, Morocco Hennie Brugman MPI for Psycholinguistics, Nijmegen, Netherlands Véronique Malaisé Free University, Amsterdam, Netherlands Laura Hollink Free University, Amsterdam, Netherlands

2 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Overview –The CATCH programme and its annotation requirements –Existing models –Annotation Meta Model (AMM) and its application to CATCH cases –Software and infrastructure –Conclusions

3 Nederlandse Organisatie voor Wetenschappelijk Onderzoek CATCH – Continuous Access To Cultural Heritage –Dutch research program funded by NWO –Apply state of the art methods to the construction and exploitation of digital collections of large Cultural Heritage institutions –Currently 10 projects, hosted by Cultural Heritage institutions –Rijksmuseum Amsterdam, Dutch National Archive, Dutch National Library, Netherlands Institute for Sound and Vision, etc –Results and software applicable across institutions and collections

4 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH Objectives: -Cross media, cross collection, cross institution annotation of digital objects and segments of objects -Add new layers of annotation to existing annotations -Centralize storage and exploitation of annotations generated by CATCH projects -Apply and showcase annotation recommendation modules/services from several CATCH projects

5 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “some text description” Resource Primitive value (string, date, number,…) http://www.beeldengeluid.nl/GTAA#Subject_kunst_ Semantic value property

6 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “Abraham van Beijeren” Resource complete resource catalog, metadata resource types images text html, xml audio video artist

7 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “very much” Resource segment – sound-video choral:transcription

8 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “roemer” Resource segment - image racm-glass:Shape

9 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “boven eener verloting te Amsterdam” Resource segment – scanned handwriting scratch:transcription

10 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “boven eener verloting te Amsterdam” Resource segment – text scratch:transcription http://geonames.org/NL/Amsterdam choice:location

11 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “boven eener verloting te Amsterdam” Resource segment – text http://geonames.org/NL/Amsterdam “bommenwerpers boven de hoofdstad”

12 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH “boven eener verloting te Amsterdam” Resource segment – text http://geonames.org/NL/Amsterdam “bommenwerpers boven de hoofdstad” http://TGN/Amsterdam http://TGN/NL

13 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotations in CATCH –Further requirements for the annotation formalism –Project and media specific extensions –Predefined annotation schemes –Generic and specific queries possible –Expressive and simple –Reuse or include existing annotation models or vocabularies

14 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Existing annotation models –Semantic web community –Focus on (semantic) annotation values –Anchoring mainly to complete resources or web pages –Linguistic annotation community –Anchoring to text or time series –Usually no semantic values –Media industry (e.g. MPEG-7) –Objections –Not all media types covered –Too complex or specialized –Hardly ever annotation of annotations, and of segments of annotation values

15 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotation Meta Model (AMM) – why RDF? –RDF, RDFS and OWL seem good modeling languages for the domain of annotation - graphs versus hierarchies –Some of our requirements automatically met: –Class and property inheritance –Constraints (e.g. domains and ranges for properties) –Integration of semantic values –Classes and instances for annotation schemes and annotation resp. –General and specific queries

16 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model

17 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model

18 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model

19 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model

20 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model

21 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Core model AnnotatableObject Coordinates TimeSeriesObjectTextObjectImageObject TimeSegmentRegion2DTextSpan

22 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Scanned handwriting case ann

23 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Scanned handwriting case ann

24 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Scanned handwriting case ann

25 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Scanned handwriting case ann

26 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Scanned handwriting case ann

27 Nederlandse Organisatie voor Wetenschappelijk Onderzoek AMM – Other cases –Semantic annotations of segments of text documents –Manually annotated image regions –Complex linguistic annotation of co-occurring speech and gesture –Syntactic annotation of text

28 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Software and infrastructure –RDF repository, wrapped with AMM web service –Stores AMM model, project-specific annotation schemes and annotation data –Java API, defining and implementing this web service –Clients: –CHOICE@CATCH documentalist support system –Integrated multimedia and web based “Annotation and Recommendation” demonstrator for CATCH

29 Nederlandse Organisatie voor Wetenschappelijk Onderzoek CHOICE Documentalist Support System

30 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Annotation and Recommendation demonstrator

31 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Conclusions –All requirements seem to be met –Applicable to a wide range of very different cases –Repository works efficiently, however not yet tested with a large number of AnnotatableObjects (so far, approx. 50.000) –Highlights: –Layered annotation –All media types are or can be supported –Annotation with multimedia objects or object segments possible

32 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Thank you

33 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Instances: CHOICE text annotation “http://www.beeldengeluid.nl/Thesaurus/GTAASkosv7.owl# ” “Subject ” a1 addressesTextSpan partOf (n1, n2) “AndereTijdenGemmeker.txt” apoldaSubject apoldaOntology Subject_bevelhebbers_ apoldaIdentifier r1 dc:title

34 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Instances: video/audio annotation “dit is gesproken tekst” a1 addressesTimeInterval partOf t1 “gesturing_people.mpg” transcription textObject a2 partOf partOfSpeech (beginNode, endNode) http://www.isodatcats.org/part-of-speech#Noun t2 hasTime “3521” “4692” addressesTextSpan “some gesture description ” a3 addressesTimeInterval partOf t3 “gesturing_people.mpg” t4 hasTime “3854” “5290” handshape http://www.mpi.nl/myShapes#fist next dc:description dc:title

35 Nederlandse Organisatie voor Wetenschappelijk Onderzoek Instances: syntax tree on text a1 addressesTextSpan partOf (n0, n3) “german sentence 1” r1 dc:title “Der Mann geht schnell” hasText a2 a3 a4 partOf “Der” hasText “Mann” hasText (n4, n8) (n9, n13) (n14, n21) addressesTS “geht” “schnell” syntax D N V Adv NP1 VP1 S1 anchorsTo NP S VP anchorsTo syntax


Download ppt "Nederlandse Organisatie voor Wetenschappelijk Onderzoek A Common Multimedia Annotation Framework for Cross Linking Cultural Heritage Digital Collections."

Verwante presentaties


Ads door Google