CLARIN: een introductie Ineke Schuurman Coördinator CLARIN-Vlaanderen.

Slides:



Advertisements
Verwante presentaties
De Armeense Kwestie.
Advertisements

“Digitaal delen is het nieuwe hebben” 9 vragen over de toekomst van overheidsinformatie ICTU Café 11 februari 2014.
14 juni 2011 Infomoment georganiseerd door het Toelichting bij het aanvragen en afrekenen van creatie- en spreidingsdossiers door Machteld De Smedt (Vlaamse.
Voorbeelden van innoverende toekomstige techniek bij C-Leren?
Ontwikkeling van het Netwerk Naamkunde
Kennismakingsvergadering Standbeelden.be vzw Statua.
Methoden en technieken/veldwerk tweede jaar sociale geografie
Digitaal Depot. Waarom een Digitaal Depot •Overheden en particulieren werken steeds meer en soms alleen nog maar digitaal; •Gebruikers verwachten digitaal.
Mediatheek SSH, KHLeuven, associatie KULeuven Zoeken E-bibliotheken
20 jaar Open Monumentendagen 2008 RESULTATEN VAN PUBLIEKE OPINIEPEILING Nobody’s Unpredictable Oktober 2008 IPSOS BELGIUM Waterloo Office Park Drève Richelle,
“Zonder taal geen verhaal” .
Moderne stadsbibliotheek én Communicatiehuis van en voor de (Nederlandstalige) gemeenschapsvoorzieningen in Brussel Gemeenschappelijk initiatief van VGC.
Via BaTaVo en prioriteitenlijst op weg naar een (betere) TST-infrastructuur voor het Nederlands Helmer Strik en vele anderen.
Deze foto’s zijn genomen tijdens betoging in Londen. Men durfde ze niet te publiceren in kranten. Vertaling van de tekst. Toegekomen uit Madrid Onthoofden.
De nieuwe geluidsnormen
netwerk organisatiebeheersing
Visie, Missie, Speerpunten en Strategische doelstellingen
C-DSD: Curating the Dutch Song Database (Nederlandse Liederenbank) C-DSD Martine de Bruin.
Europass Vlaanderen Mobiel in Europa
1 LEDENVERGADERINGEN ACV-OPENBARE DIENSTEN STAD + OCMW ANTWERPEN 23/06/2009 en 25/06/2009 Auditorium – Nationalestraat 111 te Antwerpen.
Denktank van Nederland Krijn van Beek, dec
Concept Opdrachtgever: Agentschap Ondernemen (AO). In het kader van ondernemingsplanwedstrijd (OPW) Vlaanderen, dé officiële ondernemingsplanwedstrijd.
Leerkrediet
Landbouw een maatschappelijk gebeuren met onderzoek in steun BVLE 28 februari 2007.
Q-KENNIS Een kennis-systeem is veelal gebaseerd op het ontsluiten van aanwezige kennis en ter faciliterering van de ontwikkeling van nieuwe kennis. Het.
CLARIN en oude teksten: Taal- en spraakinfrastructuur voor onderzoekers in de humane en sociale wetenschappen Ineke Schuurman CCL, K.U.Leuven Coördinator.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Gebruikerscommissie 4 mei 2004 Patrick Wambacq.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
S1S1 S2S2 S3S3 Atranos Gebruikerscommissie 22 november 2001.
Katholieke Universiteit Leuven - ESAT, BELGIUM ATraNoS Workshop 17 september 2004 Patrick Wambacq.
DigiHist Oude teksten, moderne technologie: Geleerdenbrievenproject In eke Schuurman (K.U.Leuven) ism Jan Odijk (U.Utrecht)
CLARIN: TST-infrastructuur voor de humane en sociale wetenschappen Ineke Schuurman CCL, K.U.Leuven Studiedag ICT in de.
Verschilmetingen Geraldine Clarebout CIP&T / itec K.U.Leuven Studiedag OOF project: Didactische scenario’s voor een goed gebruik van webcolleges09/02/2010.
Primaire OnderzoeksData In Utrecht Makkelijk toegankelijk een podium voor uw waardevolle onderzoeksdata.
Onderwijsdag 19 maart 2010 eXplio, een online zelfstudiepakket voor talen Els Catry (JOUR) Bea Paelman (COM) Taallectoren.
Universal Design for Learning 24/09/2013 UGent Karen Leyman.
Onderzoeksdata in de Bibliotheek: Tijd voor een nieuw Informatie-specialisme? Ervaringen uit de praktijk Rob Grim Research Data Specialist/e-Science Coordinator.
Introductie 28/07/2014 Digitaal Archief Vlaanderen.
Opvoedingswinkel Gent WZO Sluizeken Tolhuis Ham 16/11.
Welzijnsoverleg Regio Gent vzw – Welzijnsoverleg Regio Gent vzw – Gezondheidsdienst Gent De Gezondheidsdienst van de Stad Gent.
Dutch Parallel Corpus Een multilinguaal & multifunctioneel corpus Accenta 2007 Donderdag 20 september.
Uitwisseling Ieper - Gliwice. Index Hoe het begon Bilateraal? Multilateraal? Ons project Help!
Jef Maes Hoofd Kenniscentrum Boek.be Stand van zaken Vlaams e-boek Platform (VEP) dd. 09/12/2010.
1 MPZ Project Veilig werken met gevaarlijke stoffen in de zorg.
Google WEB Services 6 oktober Wat zijn WEB services ? Google WEB Services Applicaties via het WEB Ruimte beschikbaar stellen op het WEB Communicatie.
Zorgbrede transparantie en keuze-informatie
Digitalisering Digitale duurzaamheid Hans Jansen 11 december 2008.
ScaldWIN, Internationale Scheldeweek 2011 De Schelde, rivierstroom als levensstroom.
1.Het Vlaams Netwerk van verenigingen waar armen het woord nemen , het Europees jaar in de strijd tegen armoede en sociale uitsluiting 3.Armoede.
Ecce ama! Is een EQUAL project van ESF: bijdragen tot de ontwikkeling van de werkgelegenheid door het bevorderen van inzetbaarheid, ondernemerschap, aanpasbaarheid.
Datasets, verrijkte publicaties …en de rol van DANS 1Maarten Hoogerwerf, , NVB.
Waarom een standaard Een norm of standaard is een procedure of een maat waarvan een groep mensen met elkaar heeft afgesproken dat ze hem zullen gebruiken.
Digitale duurzaamheid: (ook) een kwestie van organiseren Inge Angevaare, coördinator Nationale Coalitie Digitale Duurzaamheid DEN conferentie - 10 december.
Het KB e-Depot Waarom, wat en voor wie
Pesticidenvrij terreinbeheer Samenwerken tussen gemeentebestuur en bewoners.
INFOSESSIE CLUBBEGELEIDING Gent 2 december Inleiding door dhr Philippe Mees, voorzitter VLG vzw -Verwelkoming -Uitgangspunt: -Tevredenheidsenquête.
Student Advantage SLBdiensten & APS IT-diensten Charles Stork
1 Rol van de UB Pitch 2: Wageningen. Dienstverlening onderzoeksdata Gezamenlijke aanpak Juridisch, Bibliotheek en IT De Wageningen UR case: Data Management.
AARDRIJKSKUNDE Hoofdstuk 2 – les 2. DOELEN HOOFDSTUK 2 - Je leert wat het centrum van Europa is; - Je leert dat je in Europa verschillende centra hebt.
Taal- en Spraaktechnologie (TST) voor het Nederlands: Status 2015 Jan Odijk (UU) Taalcongres Brussel, 10 oktober
Beheer van Onderzoeksdata (RDM) Hannelore Vanhaverbeke – DOC Jan Ooghe, Kristel Hoydonckx – ICTS TOB project o.l.v. Hilde Van Kiel - UB.
De tijd is rijp voor Open Cultuur Data Door: Tom Kunzler Studiemiddag Archieven en Open Data (29 oktober 2015)
Betrouwbare iOverheid en het belang van duurzame toegankelijkheid André Plat – Projectcoördinator duto-DO - Nationaal Archief Erik Saaman– Projectleider.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 De GBIF Integrated Publishing Toolkit Alberto GONZÁLEZ-TALAVÁN Programme Officer for.
Smart Computer-Aided Translation Environment 31 maart 2016 Hasselt.
Film 1. Gebruiken 2. Vinden 3. Downloaden 4. Maken 5. Bewerken
Europa Mijn thuis.
HIVE-pilot: van LCMS naar Onderwijsrepository
DCAT-AP Vlaanderen voorlegging als standaard
Transcript van de presentatie:

CLARIN: een introductie Ineke Schuurman Coördinator CLARIN-Vlaanderen

2 Doel van CLARIN? WAT? Infrastructuur –digitale ‘resources’ (+ ‘tools’) VOOR WIE? Onderzoekers in de humane en sociale wetenschappen. WANNEER? voorbereiding constructie 2016-….. beschikbaar

3 Doel van CLARIN? WAAROM? Steeds meer digitale bronnen Leveren tal van (onvermoede) mogelijkheden voor onderzoek Moeten goed beheerd worden (en gedocumenteerd en toegankelijk gemaakt en opspoorbaar en ……..) → infrastructuur !

4 Probleemstelling Veel data in digitale archieven zijn’talig’ Enkel bekend bij een beperkt publiek Archieven staan op zich Elk archief hanteert eigen standaarden (opslag, metadata) Bevat vaak enkel gewone files (tekst, audio, video) SSH onderzoekers zijn geen taal- en/of spraaktechnologen Vaak zijn deze onderzoekers zich niet bewust van de mogelijkheden van TST in hun domein De beschikbare tools zijn niet altijd even gemakkelijk te gebruiken.

5 De CLARIN missie Wat: Creëren van een infrastructuur die resources en tools uit de wereld van de taal- en spraaktechnologie (TST) beschikbaar maakt voor andere wetenschappers Hoe: Virtueel samen- brengen van be- staande digitale archieven, toegan- kelijk via het web Ter beschikking stellen van TST-tools in de vorm van web- services die bv bewerkingen uit- voeren op data in de archieven.

6 Waarom Europees? Ieder (land) voor zich –te gefragmenteerd –lage zichtbaarheid –geen samenwerking –continuïteit niet gegarandeerd Nodige expertise is voorhanden, maar niet in elk land Taalonafhankelijke tools kunnen worden ‘gedeeld’ Taalafhankelijke tools kunnen vaak worden aangepast Financieel aantrekkelijker

7 Over CLARIN Europa CLARIN consortium: 22 partners (…, CCL, …) CLARIN community: 148 leden in 32 landen ( ) Vlaanderen CLIF: CCL Leuven CNTS Antwerpen ELIS Gent ESAT Leuven itec Kortrijk ETRO Brussel LIIR Leuven LT3 Gent

8 4-dimensionele aanpak gedurende eerste fase : ontwerp Techniek Hoe kan het? Talen Wat is er? Gebruiker Wat wil men? Overheden, IPR Wat kan/mag er?

9 Talen Alle talen die in de bij CLARIN betrokken landen worden gesproken en/of bestudeerd worden afgedekt Geen focus op ‘grote’ talen Er wordt een BLARK (Basic Language Resources Toolkit) gedefinieerd voor al deze talen Voor implementatie zijn fondsen van derden nodig

10 Wat is er al? (stand 02-09) Algemeen : Resources: 689 Tools: 119 Nederlands: Resources: 80 Tools: 5 Duits: Resources: 41 Tools: 5 Taalonafhankelijk Tools: 25

11 Gebruiker Onderzoek op gebied van “talige informatie” CLARIN: “Weten WIJ wat zij willen?” “Weten ZIJ wat ze zouden (kunnen) willen?” -corpusonderzoek -topic detection -neerslag in versch kranten van ‘Europees’ topic -Vergelijken van vertalingen van bepaald boek -…

12 Wensen? Vlaamse corpora met (ook) oudere teksten (“vorige spelling”) Meer digitale bronnen … Laat ons jullie noden en wensen weten!