Schets van het landschap Deel B Presentatie RDNL
Research Data Netherlands UKB Themabijeenkomst Research Datamanagement 17 september 2015
Wat bindt ons? Onze missie: het bevorderen van duurzame toegankelijkheid en verantwoord hergebruik van wetenschappelijke onderzoeksgegevens in alle fasen van het onderzoek. Door onze samenwerking kunnen uiteenlopende stakeholders onderzoeksgegevens archiveren, vinden en gebruiken. RDNL bestaat uit organisaties die primair back-office functies vervullen en die voldoen aan de richtlijnen van het Data Seal of Approval. De coalitie staat open voor andere organisaties die zich engageren voor data stewardship en aan deze voorwaarden voldoen, of bereid zijn daar binnen een gestelde termijn aan te voldoen.
Federatieve infrastructuur voor onderzoeksdata De meerwaarde van RDNL is dat de samenwerkende organisaties gezamenlijk een breder terrein kunnen bedienen dan ieder alleen. We zijn in diverse opzichten complementair, zowel door de vakgebieden die we bedienen, als door de diensten die we aanbieden en de variëteit aan soorten onderzoeksdata waarover we expertise hebben en die we beschikbaar stellen. Onze samenwerking biedt een praktische uitwerking van het collaborative data infrastructure model uit het ‘Riding the Wave’ rapport (2010). Huidige partners 3TU.DC, DANS en SURFsara met accent verschillen vnl. gericht op back-office en basis infrastructuur.
Front-office Back-office model
Doelen Versterken van transparante datadienstverlening aan onderzoek Samenhangende en efficiënte dienstverlening Gezamenlijke beleidsbeïnvloeding en ondersteuning op de randvoorwaarden voor goed data stewardship Gezamenlijk trainingsportfolio Gezamenlijke afstemming over langetermijnarchivering en daarbij behorende businessmodellen Uit visiedocument 5 doelen Waaraan wordt gewerkt in 4 (structurele) werkgroepen: Diensten, Techniek, Training en Communicatie en wanneer nodig in projectgroepen o.a. dataprijs. Zowel achter de schermen als zichtbaar voor de buitenwereld.
Wat hebben we te bieden? Data-archieven voor duurzame toegang Diensten voor het veilig transporteren, opslaan, delen en hergebruiken van onderzoeksdata Cursus “Essentials 4 Data Support” Advies inzake beleid en uitvoering van data stewardship O.a. ook: Nog dit jaar gezamenlijk overzicht van diensten Training 2x/jaar (najaar vandaag gestart) Voorbereiding dataprijs 2016 (mogelijk herziene opzet) Verkennen mogelijkheden voor centraal hosten DMP tool Gezamenlijk overzicht van diensten Voorbereiding dataprijs 2016 Verkennen mogelijkheden voor centraal hosten DMP tool
De organisatie van RDNL Directie Communicatie Diensten Techniek Training Dataprijs Stuurgroep Werkgroepen (structureel) Projectgroepen (ad hoc) Uit het werkplan…
Meer informatie? Algemeen: http://www.researchdata.nl/ of info@researchdata.nl Cursus: http://datasupport.researchdata.nl/ of cursus@researchdata.nl
3TU.Datacentrum www.datacentrum.3tu.nl www.data.3tu.nl 3TU.Datacentrum biedt onderzoekers een betrouwbare langetermijnbewaarplaats voor technisch-wetenschappelijke onderzoeksgegevens. Het Datacentrum creëert mogelijkheden om publicaties te koppelen aan onderliggende data en stimuleert een betere vindbaarheid en citeerbaarheid van onderzoeksdata. De onderzoeker kan in alle stadia van zijn onderzoek bij 3TU.Datacentrum terecht voor advies en ondersteuning met betrekking tot databeheer. Dit reikt van het opzetten van een datamanagementplan, het faciliteren van een data-lab (een veilige online omgeving om dynamische onderzoeksdata op te slaan, te bewerken, te visualiseren en te delen met collega-onderzoekers) tot het uiteindelijk deponeren van de data in het archief. De datasets worden automatisch voorzien van een Digital Object Identifier (DOI) waarmee de zichtbaarheid, vindbaarheid en citeerbaarheid wordt bevorderd. 3TU.Datacentrum is een initiatief van de drie technische universiteiten in Nederland (Delft, Eindhoven, Twente) en biedt bovengenoemde diensten tevens aan onderzoekers van andere instellingen. OpenEarth Datalab filmpje: https://www.youtube.com/watch?feature=player_embedded&v=qEMFZONslvU Contact 3TU.Datacentrum TU Delft Library Prometheusplein 1 2628 ZC Delft T +31 (0)15 27 88 600 E datacentrum@3tu.nl www.datacentrum.3tu.nl www.data.3tu.nl
DANS https://easy.dans.knaw.nl/ https://dataverse.nl/dvn/ DANS (Data Archiving and Networked Services) bevordert duurzame toegang tot digitale onderzoeksgegevens en stimuleert dat onderzoekers gegevens duurzaam archiveren en hergebruiken. DANS biedt hiervoor onder het online archiveringssysteem EASY aan en zorgt ervoor dat de gegevens in EASY ook op de lange termijn bruikbaar blijven. EASY bevat nu meer dan 30.000 datasets. Voor het opslaan en delen van gegevens tijdens het onderzoek is DataverseNL is gebruik. DANS beheert dit voor de Nederlandse instellingen; momenteel ongeveer tien instellingen. Tevens biedt DANS met het portal NARCIS toegang tot wetenschappelijke datasets, e-publicaties en andere onderzoeksinformatie in Nederland. Daarnaast verzorgt het instituut training en consultancy en doet het onderzoek naar duurzame toegang tot digitale informatie, in nationale en internationale samenwerkingen. DANS is een instituut van de Koninklijke Nederlandse Academie van Wetenschappen (KNAW) en van NWO. https://easy.dans.knaw.nl/ https://dataverse.nl/dvn/ http://www.narcis.nl/ DANS is an institute of KNAW and NWO.
Supporting the Research data life Cycle SURFsara Creating data Processing data Analysing data Preserving data Giving access to data Re-using data CREATING DATA: designing, planning consent, collection and management, capturing and creating metadata RE-USING DATA: for follow-ups, new research, research reviews, scrutinising, teaching & learning PROCESSING DATA: entering, transcribing, checking & validating, anonymising and describing Supporting the Research data life Cycle ACCESS TO DATA: distributing, sharing, controlling access, promoting Data services Are you trying to find ways to store data in an efficient manner, to make them easily accessible for use by you and your colleagues? For that purpose we provide an infrastructure that combines very fast data connections with a wealth of storage space on tape or disk, for short-term or long-term preservation. We work closely together with several partners in a wide range of national, European and global scientific projects (e.g. PRACE, WLCG/LHC, EUDAT, LOFAR) and support scientific communities or individual scientists in handling their growing data challenges. Petabytes of scientific data In the current era of Petascale supercomputers, in which scientific machines generate Petabytes of scientific data on a yearly basis, handling fast growing data sets is becoming a challenge for the scientific community. Scientists frequently use complex measuring tools that generate huge amounts of data. Examples include the experiments with the Large Hadron Collider at CERN and LOFAR, an astronomy research project using antennas. Research in life sciences also generates enormous data files (such as in DNA sequencing). Data storage and analysis The great challenge is to find ways of storing these Petabytes of data in an efficient manner so as to make them easily accessible for use by researchers. To that end we have set up an infrastructure that combines very fast data connections with a wealth of storage space on tape or disk. More and more data storage as well as analysis involve complex and/or unstructured data. For these types of data SURFsara also off ers interesting infrastructures. The Hadoop cluster for instance, which can be used for the fast analysis of extremely big data sets. The spectrum of applications is very broad, typically including indexation, storage and search functions. SURFsara's support SURFsara’s Data Services group provides services to the scientific user community in handling the scientific data explosion and long-term data preservation scientific data sets. We work closely together with all groups within SURFsara, participate in a wide range of national, European and global scientific projects (e.g. PRACE, WLCG, Lofar) and support scientific communities or individual scientists in handling their growing data challenges. Two facilities To manage all this data the Data Services group manages two facilities for long-term data preservation: HPC Central Data Archive Grid Permanent Data Storage ANALYSING DATA: interpreting, deriving, producing outputs & publishing, preparing for sharing PRESERVING DATA: migrating, backing-up, storing, creating metadata and documentation, archiving Ref: UK Data Archive: http://www.data-archive.ac.uk/create-manage/life-cycle