Kennis uitwisselen met SKOS en OpenSKOS

Slides:



Advertisements
Verwante presentaties
HET DIGITALE ARBEIDSPLEIN Het Digitale Arbeidsplein is een website ontwikkeld in het kader van het project “Zelfmanagement van de eigen loopbaan” van MeijerConsult.
Advertisements

BUREAU VOOR i-COMMERCE
Kickoff Workspaces Hennie Brugman Technisch coordinator CATCHPlus.
De zin en onzin van escrow
Symbaloo is de leukste en makkelijkste start op internet
Multidisciplinaire gegevensdeling
Nederlab Laboratory for research on the patterns of change in the Dutch language and culture Kickoff, 25 januari, 2013 Meertens Instituut, Amsterdam.
1 Samenwerkend leren met Google Docs Werking en mogelijkheden van online tekstverwerken.
Livy BV Randstad BM Almere Introductie Livy Professional De online oplossing voor professionele woning transacties.
Bouw je eigen website met gratis software Je eigen website bouwen  Waarom?  Eigen zaak (  Vereniging (
Installatie & beheer Jonathan Mohnen Martijn Wolfs.
Samenwerking met MOSS 2007! Chris Hoppenbrouwers.
Fedora Content Model en XSLT Fedora op Klompen, Amsterdam, Egbert Gramsbergen TU Delft Library / Digital Product Development
E-RADEN Roadmap. AGENDA • Overzicht van nieuwe ontwikkelingen 2009 • Interfaces • Document Types : Meta-data • E-raden gratis ? • Perspectieven.
Metadata proces april 2009 train de trainers. Waar in het werkproces metadata Binnen de organisatie zal afgesproken moeten worden van welke data er metadata.
Electronic Resource Management (ERM) Els Schaerlaekens Anet Gebruikersdag 15 juni 2011.
Software Architectuur Over de samenhang der dingen = Over de connecties tussen componenten Over de afhankelijkheden tussen modules Over de belangen van.
Adviesraad – eenduidige parameters 1 Objecten catalogus 16 juni 2010, Oracle gebruikersgroep Huibert-Jan Lekkerkerk (IDsW)
Welkom.
01 van 06 Portal4U Loe Hameleers Twan Saleming Klanten: Wat kost dat artikel? Wanneer wordt geleverd? Die werkt hier niet meer.. Die factuur ken ik niet.
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Deze presentatie mag noch geheel, noch gedeeltelijk worden gebruikt of gekopieerd zonder de schriftelijke toestemming van Seniornet Vlaanderen VZW Mijn.
C-DSD: Curating the Dutch Song Database (Nederlandse Liederenbank) C-DSD Martine de Bruin.
Woensdag 24 juni 2009 Web 2.0 en Technologie Bram de Kruijff.
CLARIN: een introductie Ineke Schuurman Coördinator CLARIN-Vlaanderen.
Een strakke workflow als hulpmiddel voor online samenwerking. Jikke de Groot Universiteitsbibliotheek/ Universiteit Utrecht Sector Innovatie & Ontwikkeling.
1 Orientatie InformatieSystemen K.M.van Hee hgl. architectuur van informatiesystemen dir. Deloitte & Touche Bakkenist TU/e 2001.
Interaction diagrams: Sequence Diagram
Basic Web Services Technology Matthijs Smith & Roel Arents tbv ISS 2005/2006.
Sneeuwschuivers en leren sneeuwschuiven myResearch Portal en het belang van workflow data analyse Richard L. Zijdeman DAI: info:eu-repo/dai/nl/
Web 2.0 Social Software Toolkit 1/21 Introductie tot Social Software Patrick Klaassen RU
Werken aan Intergenerationele Samenwerking en Expertise.
DANS is een instituut van KNAW en NWO Data Archiving and Networked Services NARCIS: nationale portal van onderzoekinformatie Elly Dijk SURFacademy ‘CRIS.
1212 /b Ontwerpen en Presenteren met ICT dr.ir. Jos van Leeuwen Faculteit Bouwkunde cap.groep Ontwerp Systemen.
Peter Boot Clarin-3: Early Modern Images and Text – eXtended (EMIT-X)
Dia 1 Productencatalogus: technische sessie Samen beter informeren.
Dia 1 Productencatalogus: Infosessie provinciale en lokale besturen 24/11/11.
Wouter Jansweijer, 16 September, Literatuur zoeken Project informatiewetenschappen october 2002.
Een Module over Model Checking voor het VWO Frits Vaandrager1, David Jansen1 & Els Koopmans2 1Radboud Universiteit Nijmegen 2Olympus College Arnhem.
Your GateWay to the Finest Academic Research papers in the Netherlands Technische aspecten: de ARNO archive server Thomas Place KUB.
Metadata en Webstroom SURF SiX expertisegroep Pierre Gorissen SURF SiX / Fontys Hogescholen 16 november 2004.
Datasets, verrijkte publicaties …en de rol van DANS 1Maarten Hoogerwerf, , NVB.
Service Oriented Architecture
Minicollege Service Oriented Architecture
Introductie metadata april 2009 train de trainers.
BUREAU VOOR i-COMMERCE Mobiele Marketing (sms, mms, mobiel internet, bluetooth)
Open Standaarden in het onderwijs Holland Open Netwerk Borrel 19 december 2006 Jan Kees Meindersma
Naam van de Auteur 7 januari 2008 Kennisnet Videodienstverlening Open source, open content Pieter Varekamp November 2008.
OpenSKOS / VocabulaireBank Hennie Brugman Meertens Instituut Technisch coordinator CATCHPlus 1.
Repository-demonstratie Waar doen we het allemaal voor?
Technische Architectuur
PADS4 maakt het eenvoudig om informatie te verspreiden naar een specifiek publiek op de juiste plaats en het juiste moment PADS4 is een professionele oplossing.
Facet De beveiligde site en de beheerder Facet.
IA – LABELS Rogier van der Linde & Davy De Winne, 2014.
Eisenbheer module CROW
1 e-Books & i-Papers Rik Min researcher Centre for Telematics and Information Technology (CTIT) & Faculty of Educational Science and Technology (EDTE)
3/30/2015 | 1 Bibliotheekinstructie Nederlands 2014.
WapliX Webdatabases New generations of applications.
Beheer van Onderzoeksdata (RDM) Hannelore Vanhaverbeke – DOC Jan Ooghe, Kristel Hoydonckx – ICTS TOB project o.l.v. Hilde Van Kiel - UB.
Ontwerpen van E-modules. Inleiding Video en audio Deze e-module maakt gebruik van audio en video. Test hier je geluid en stel het juiste volume in. Als.
“IT’S THE DATA STUPID..!” WAGENINGEN UNIVERSITEIT EN RESEARCH CENTRE.
1 Waarom COINS en waarom “Redesign the Standard”? Dik Spekkink Clustermanager Proces & IT Wat is.
Gids door Doccle Doccle. De Cloud 2 1.Wat is de Cloud? 2.Voordelen van de Cloud 3.Nadelen van de Cloud 4.Doccle is geen cloudapplicatie.
Dataverse Network ‘Datalab’: software om onderzoeksdata tijdens het onderzoek op te slaan, te beheren en beschikbaar te stellen 1e stap in lange-termijnopslag.
WoordenlijstBeheer Terminologie centraal in de archiefsector
Lectora als ontwikkeltool voor interactieve multimedia programma’s
LOREnet feb
Transcript van de presentatie:

Kennis uitwisselen met SKOS en OpenSKOS Hennie Brugman Meertens Instituut

Overzicht Inleiding Ontstaansgeschiedenis Begrippen Functionele beschrijving Toepassingen in de praktijk Content en beschikbaarheid Stakeholders en toekomstige ontwikkelingen 0 inleiding probleemstelling algemene visie in 1 slide: wat is het? 1 ontstaansgeschiedenis rol van diverse partijen 2 "technische acronymen" SKOS, concept versus term-based linked data, RESTful web services 3 functionele beschrijving en demo API OAI-PMH Dashboard 4 toepassingen in de praktijk Memorix en GTAA-gebruik generieke browser clavas link naar DEN thesaurus-overzicht 5 content en beschikbaarheid (open source, open data) gtaa, aat, ... licenties 6 stakeholders en toekomstige ontwikkeling belangstellende en betrokken partijen thesaurus-editor Beeld en Geluid 7 basis/onderdeel van een (inter)nationaal platform? samenwerkingsverband RCE, Beeld en Geluid, Naturalis

Inleiding

Problemen mbt gebruik van vocabulaires Bouwen en beheren van thesauri is tijdrovend Liever hergebruik Hoe ontdek en evalueer je bestaande thesauri? Je software-tools moeten specifieke thesauri ondersteunen Nog vaak als browsable en doorzoekbare website gepubliceerd Niet als data, niet in standaardvorm Toolbouwers moeten veel maatwerk verrichten

OpenSKOS visie: een marktplaats voor SKOS vocabulaires Iedere knoop implementeert: Upload module RESTful API (autocomplete, find, CRUD) Linked Data toegang OAI-PMH data provider enharvester Editor voor management en curatie

OpenSKOS = SKOS formaat + Peer to peer architectuur + RESTful API + Linked Data + Publicatie dmv upload en OAI-PMH + Management mbv Interactief Dashboard + Ondersteuning voor alignment + Stimuleren van open database licenses Vocabulaire curatie mbv ingebouwde Editor

Voordelen aanbieders Anderen je vocabulaires aanbieden kan met een simpele upload actie Of via een eigen OpenSKOS instantie, of via OAI-PMH Het is mogelijk je eigen vocabulaire te gebruiken in andermans tools (al dan niet commercieel), als die tools OpenSKOS aanspreken Vocabulaires kunnen makkelijk en frequent door de bouwer/beheerder worden ge-update, zonder tussenkomst van derden Contextualiseren: et is eenvoudig concepten uit je eigen vocabulaires te koppelen aan andere vocabulaires

Nieuwe mogelijkheden tot browsen en zoeken Voordelen gebruikers Het is eenvoudig om vocabulaires te ontdekken, evalueren en te gebruiken Minder noodzaak ze zelf te construeren Nieuwe mogelijkheden tot browsen en zoeken In vocabulaires, in collectie-beschrijvingen Altijd up-to-date versies van vocabulaires beschikbaar

Voordelen toolbouwers Geen maatwerk per vocabulaire meer nodig, geen periodieke updates door te voeren Kunnen profiteren van werk van andere toolbouwers en vocabulaire-aanbieders Kunnen OpenSKOS gebruiken voor een reeks van nieuwe use cases

Ontstaansgeschiedenis

Eerste CATCHPlus versie Jarenlang stabiel gedraaid en toegepast voor gebruik Beeld en Geluid thesaurus door Nationaal Archief (via Pictura’s Memorix tool) Gedurende half jaar intensief overlegd door CATCHPlus, RCE, Adlib, Pictura, Trezorix Op initiatief van en gehost door RCE Doel: elkaars tools en omgevingen op elkaar aansluiten mbt vocabulaires/kennisstructuren Uitkomst: architectuur-concept en REST API specificatie OpenSKOS implementatie (door Picturae) is conform de uitkomsten van dit overleg OpenSKOS Editor toegevoegd in opdracht van Beeld en Geluid

Begrippen

SKOS, een ultrakorte primer SKOS kennisstructuren bestaan uit Concepten, onderverdeeld in ConceptSchemes Concepten hebben een URL ter identificatie Concepten hebben labels in 1 of meer talen Concepten kunnen worden gedocumenteerd met ‘notes’ Concepten hebben onderling semantische relaties broader, narrower, related OpenSKOS onderscheidt daarnaast nog Collections en Institutions

Term: Economic cooperation Used For: Economic co-operation Broader terms: Economic policy Narrower terms: Economic integration, European economic cooperation, European industrial cooperation, Industrial cooperation Related terms: Interdependence Scope Note: Includes cooperative measures in banking, trade, industry etc., between and among countries. Korte SKOS recapitulatie: Links: termgebaseerd Rechts: conceptgebaseerd (waarbij de termen labels zijn, gekoppeld aan concepten) Term-> prefLabel Used for -> altLabel Broader, narrower term -> broader, narrower concept etc

SKOS en Linked Data Concepten kunnen over grenzen van ConceptSchemes worden gelinkt exactMatch, closeMatch, broadMatch, narrowMatch, relatedMatch Mits een Concept een stabiele, resolvable http URI heeft kan er naar gelinkt worden Concepten kunnen zelf linken naar (Linked Open Data op) het web

Voor- en nadelen Standardisatie Eenvoudig en generiek data-model Web-gebaseerd Concept- versus term-gebaseerd Omvat ‘alignment’ Echter Bij transformatie gaat semantiek verloren Data deels niet op SKOS te mappen

RESTful web services Web service: RESTful: Software die interactie tussen machines over het web mogelijk maakt (“protocol mbt vragen en antwoorden”) RESTful: Gebruikt standaard protocollen van world wide web (http) Beschrijft resultaten zoveel mogelijk als (online) ‘resources’ Aan te roepen via gewone URLs In principe eenvoudig in gebruik en schaalbaar Voor gebruik vanuit software Dus primair voor gebruik door programmeurs Linked Data is een specifieke instantie van een RESTful web service

Functionele beschrijving

OpenSKOS Editor Upload module Interactieve management functies RESTful API OAI-PMH data provider en harvester

Stel, ik zoek een thesaurus om molens te beschrijven, of medicijnen, of krantenberichten, of … Dan kan ik naar openskos.org, waarop allerlei thesauri beschikbaar worden gemaakt

dan wil ik informatie over zo’n thesaurus en ik wil er online in browsen en zoeken

Stel, ik wil mijn thesaurus online opbouwen en beheren, eventueel met andere instellingen samen Dan kan ik de OpenSKOS Editor gebruiken, gebouwd voor Beeld en Geluid, als onderdeel van OpenSKOS

Stel, ik heb een thesaurus(-update) en wil die aanbieden aan de wereld of aan mijn partner-instelling, die een commerciële tool gebruikt (bv Memorix van Picturae), of een wetenschappelijke (bv Arbil uit CLARIN) Dan kan ik eenvoudig uploaden mbv OpenSKOS

Stel, ik wil een OpenSKOS node beheren, dan heb ik interactieve beheerfuncties ter beschikking

CRUD (create, retrieve, update, delete) Institutions Collections RESTful API Concept resolve API Find API Autocomplete CRUD (create, retrieve, update, delete) Institutions Collections Naar aanleiding van uitgebreide, gezamenlijk geprioriteerde lijst van use cases Lucene Query Parser Syntax Sommige endpoints: GET, PUT, POST, DELETE: lezen en schrijven

API voorbeelden Concept resolve { "tenant": "meertens", "collection": 4, .. "uri": "http://openskos.meertens.knaw.nl/Organisations/3ffbdaf6-d07f-4f04-8ea9-aba0c2749670", "uuid": "d921f9f9-f759-475a-cb9d-5f1dcfa00b49", "class": "Concept", "prefLabel@en": [ "UiL-OTS, Utrecht University" ], "LexicalLabels@en": [ "UiL-OTS, Utrecht University", "altLabel@en": [ "broader": [ "http://openskos.meertens.knaw.nl/Organisations/78d67e6a-0a2a-4ba3-8757-146eaf7fed7d" "SemanticRelations": [ "inScheme": [ "http://openskos.meertens.knaw.nl/Organisations" "xmlns": [ "rdf", "skos" "notation": [ "108950" ] } API voorbeelden Concept resolve api/concept?id=http://openskos.meertens.knaw.nl/Organisations/78d67e6a-0a2a-4ba3-8757-146eaf7fed7d&format=html RDF, JSON of html <rdf:RDF> <rdf:Description rdf:about="http://openskos.meertens.knaw.nl/Organisations/3f..70"> <rdf:type rdf:resource="http://www.w3.org/2004/02/skos/core#Concept"/> <skos:prefLabel xml:lang="en">UiL-OTS, Utrecht University</skos:prefLabel> <skos:altLabel xml:lang="en">UiL-OTS, Utrecht University</skos:altLabel> <skos:broader rdf:resource="http://openskos.meertens.knaw.nl/Organisations/78..7d"/ <skos:inScheme rdf:resource="http://openskos.meertens.knaw.nl/Organisations"/> </rdf:Description> </rdf:RDF>

API voorbeelden Find API api/find-concepts?q=crisis&format=rdf {"response": { "numFound": 4, "start": 0, "docs": [ … { "scopeNote": [ "veldrijder" ], "prefLabel": [ "Rutte, Marcel" "xmlns": [ "rdf", "skos", "dcterms" ] }, "minister-president VVD, fractievoorzitter VVD Tweede Kamer, staatssecretaris OCW en Sociale Zaken, voorzitter JOVD" "Rutte, Mark" } API voorbeelden Find API api/find-concepts?q=crisis&format=rdf api/find-concepts?q=crisis+collection:4&format=json api/find-concepts?q=crisis+tenant:rkd&format=json api/find-concepts?q=prefLabelText:rutte+collection:4+inScheme:http*Persoonsnamen&format=json&fl=prefLabel,scopeNote

API voorbeelden Autocomplete API api/autocomplete/politi?returnLabel=prefLabel api/autocomplete/speelf?returnLabel=prefLabel

Institutions, Collections API API voorbeelden Institutions, Collections API in RDF: /api/institutions in HTML: /api/institutions?format=html /api/collections/beng:gtaa.html

OAI-PMH voorbeelden

Toepassingen in de praktijk

OpenSKOS instanties Instantie(s) tbv intern gebruik, publicatie en beheer van de GTAA thesaurus van Beeld en Geluid Ongeveer 8 instanties tbv (internationale) klanten van Picturae Meertens instantie tbv CLARIN-NL CLAVAS project Experimentele instantie tbv CLARIN-EU bij Institute for Corpus Linguistics and Text Technology, Wenen Tbv thesaurus-constructie bij Cologne Center for eHumanities Test-installatie bij Europeana ihkv 1914-1918 project

Client tools OpenSKOS editor zelf Memorix (Picturae) Gepland: Arbil (CMDI metadata editor, CLARIN)

Content en beschikbaarheid

Vocabulaires GTAA (Beeld en Geluid) AAT-NED (RKD) Library of Congress Subject Headings CLAVAS ISO 639-3 language codes ISOcat metadata profile Organisatie-namen Getest met enkele andere bestaande SKOS thesauri Getest met versie van Thesaurus Nationaal Farmaceutisch Museum ?? Overkoepelende registry ontbreekt nog

Beschikbaarheid Broncode is onder Open source licentie en online beschikbaar (GitHub) Open Database licenties en Creative Commons aanbevolen We promoten vrij gebruik van services M.u.v. schrijf-acties via API en Editor, en management functies Iedereen kan eigen instantie van OpenSKOS draaien Picturae biedt 10 jaar hosting van OpenSKOS aan ihkv CATCHPlus contract

Stakeholders en toekomstige ontwikkelingen

Beeld en Geluid CLARIN-NL/Clavas, CLARIN-EU DARIAH (Task Force Reference Data and Controlled Vocabularies) Meertens Instituut Nationaal Archief Picturae RCE RKD Digitale Collectie NL (Europeana aggregator) Europeana ??

(Mogelijke) toepassingen in concrete projecten Toekomst (Mogelijke) toepassingen in concrete projecten OpenSKOS community in oprichting (werkgroep: Meertens, Picturae, Digitale Collectie NL, Beeld en Geluid, Europeana) Functionele wensen Vrij browsen en zoeken voor iedereen ‘discovery’ van thesauri Uitbouwen gedistribueerde opzet

Hartelijk dank. ???