Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.




Transcript van de presentatie:

Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma

onderzoeksdata Line-up Data, wat is het? definitie, research life cycle, data life cycle, data formats, open data, jullie data Waarom is het ineens zo’n HOT issue? How to search 4 data repositories (waar vind ik ze?) Oefening: zoek een data repository op jouw vakgebied en vind een dataset Metadata en data citatie (linking research together) How to search IN data repositories/data portals (hoe vind ik data)? Oefening: zoek datasets in Narcis (data portal), DANS EASY, 3TU.Datacentrum, DANS Data Portal Wrap-up (waarom vond ik wat ik vond?) Staying up to data

“ Research data is defined as the recorded factual material, commonly accepted in the scientific community as necessary to validate research findings “

Alles wat van belang is voor het begrip/traceren van de publicatie. Niet alleen onderzoeksdata zelf, maar ook manier waarop data verzameld: Context, Metadata, Supplementary Material

DATA bij NATUURWETENSCHAPPEN – Observaties, nummers, meetpunten, coördinaten, frequenties, opgeslagen in b.v. spreadsheets en databases – Discipline-specifiek, b.v. Life-Sciences: genexpressies, DNA-to-RNA translations, protein sequences, eiwitstucturen, NMR data van biomoleculen Sterrenkunde: foto’s, mapping the universe …….

DATA bij SOCIALE WETENSCHAPPEN Survey-onderzoek – Interviews – Vragenlijstonderzoek Data uit experimenten (je brengt mensen in voorbeeldsituaties en noteert wat ze doen) Filmpjes/stimulusmateriaal bij deze experimenten Programmatuur, simulaties (gefingeerde data) Transcripts van rechtszaken, …..


Een data formaat of bestandsformaat is de vorm waarin informatie gecodeerd is. De informatie is op zo'n manier gecodeerd dat een programma of toepassing (application) de data kan herkennen, lezen en gebruiken “ “

OPEN FORMATS The safest option to guarantee long-term data access and usable data is to convert data to standard formats that most software are capable of interpreting, and that are suitable for data interchange and transformation “ “

OPEN FORMATS This typically means using open or standard formats - such as OpenDocument Format (ODF), ASCII, tab-delimited format, comma- separated values, XML - as opposed to proprietary ones. Some proprietary formats, such as MS Rich Text Format, MS Excel, SPSS, are widely used and likely to be accessible for a reasonable, but not unlimited, time “ “


DATA bij JULLIE ? Welke data worden in jullie instelling geproduceerd ? Van welke ruwe data maken jullie (onderzoekers) gebruik (of zouden ze gebruik van WILLEN maken) ?

Waarom is het ineens zo’n HOT issue?

“ In almost every laboratory, “born digital” data proliferate in files, spreadsheets, or data- bases stored on hard drives, digital notebooks, Web sites, blogs, and wikis. The management, curation, and archiving of these digital data are becoming increasingly burdensome for research scientists. “ Bell_Hey%20_Szalay_Science_March_2009.pdf


2011 Research misconduct includes fabrication, falsification, suppression, or inappropriate manipulation of data; inappropriate image manipulation; plagiarism; misleading reporting; redundant publication; authorship malpractice such as guest or ghost authorship; failure to disclose funding sources or competing interests; misreporting of funder involvement; and unethical Research _on_research_misconduct_in_the_UK.pdf “ “


_12_04_28_De_academische_lente.pdf 2012


Journals Data Availability Policy


Information Literacy has gone data In the 21st century, information literacy is a key attribute for everyone, irrespective of age or experience. Information literacy is evidenced through understanding the ways in which information and data is created and handled, developing skills in its management and use and modifying attitudes, habits and behaviours to appreciate the role of information literacy in learning and research


data paper data repository (institutional, domain specific (community supported)) research data directory of data repositories data portal (regional, national, …) Zoeken naar data repository zoeken naar data in meerdere data repositories

How to search 4 data repositories data paper data repository (institutional, domain specific (community supported)) research data directory of data repositories data portal (regional, national, …) Zoeken naar data repository zoeken naar data in meerdere data repositories

Directory of Research Data Repositories Discipline – Specifiek, b.v. Perspectief: (m.n. Overheidsinfo)

Directory of Research Data Repositories

Research Data Repositories - discipline

DATA bij JULLIE ? Welke data worden in jullie instelling geproduceerd ? Van welke ruwe data maken jullie (onderzoekers) gebruik (of zouden ze gebruik van WILLEN maken) ?

Oefening 1 Zoek (b.v. via een data repository op het vakgebied dat jij ondersteunt (of op één van de vakgebieden van jouw instelling) Kies er één uit en ga zoeken naar een dataset Hoe heb je de dataset gevonden?


“ Scientific metadata provide the information necessary for investigators separated by time, space, institution or disciplinary norm to establish common ground “ DataCite. (2011). DataCite MetaData Scheme for the Publication and Citation of Research Data. METADATA

The gray line separates medata from data


“ The practice of providing a reference to data in the same way as researchers routinely provide a bibliographic reference to articles “

DATA CITATION “ Getting credit through formal citation, obtaining copies of articles that use the data, and learning of products or publications that use the data are just some of the conditions that will help encourage data sharing “ ne

PERSISTENT Identifiers Een Persistent Identifier identificeert het object zélf onafhankelijk van de plaats waar deze staat

URN urn:nbn:nl:ui:13-7yu-x43urn:nbn:nl:ui:13-7yu-x43 =


DOI DOI stands for "Digital Object Identifier ( Gebaseerd op Handle, maar een handle maakt het niet uit WAT er geidentificeerd wordt terwijl een DOI gebaseerd is op een datamodel die uitgaat van relaties tussen objecten Resolve a DOI Meer over persistent identifiers? – ers/Table ers/Table – –



HOW 2 SEARCH 4 DATA data paper data repository (institutional, domain specific (community supported)) research data directory of data repositories data portal (regional, national, …) Zoeken naar data repository zoeken naar data in meerdere data repositories

Research Data Repository

Research Data Portal 3tudatacentrum-ook-in-narcis/

Research Data Portal

HOW 2 SEARCH 4 DATA data paper data repository (institutional, domain specific (community supported)) research data directory of data repositories data portal (regional, national, …) Zoeken naar data repository zoeken naar data in meerdere data repositories

Oefening 2 - Zoek in NARCIS de dataset met de titel: ‘Water Expenditure and Service Levels in Mozambique’ (afkomstig uit DANS EASY). Dit is jouw dataset 1 - Kijk of je deze dataset ook in DANS EASY kunt vinden - Wat is het verschil in getoonde velden tussen EASY en NARCIS? - Kies een trefwoord dat wel wordt getoond in de EASY omschrijving van de dataset en niet in de NARCIS omschrijving. Voer dit trefwoord vervolgens in in NARCIS. Wat gebeurt er?


ZOEKEN Alleen door goed naar je zoekresultaten te kijken en dit ook vanuit verschillende oogpunten te doen, kun je leren begrijpen hoe gemaakte keuzes je zoekresultaten zullen beïnvloeden.

Staying Up To Data

Staying Up To Data Cursus volgen Naslag

Staying Up To (Medical) Data Maak gebruik van je netwerk en/of begin met (sociaal) netwerken

Marina Noordegraaf ( Tot data De plaatjes zonder bronvermelding zijn gemaakt door Marina Noordegraaf