Vindbare data

Let op! Deze pagina is niet meer actueel.
Ga naar de nieuwe pagina Fair data and datamanagement (Engels)

Data vinden of vindbaar maken:

  • voor het vinden van dataverzamelingen bij de voorbereiding van een project
  • voor het vindbaar maken van een nieuwe dataverzameling aan het einde van een project (Findable volgens de FAIR-principles)

Dataverzamelingen zijn te vinden in online metadatacatalogi, webportals, of data-archief, waar ze zijn voorzien van beschrijvende informatie (metadata). De data zelf staan daar niet in. Die zijn opgeslagen in een archief (repository).

De kerngegevens over dit onderdeel die ZonMw aan het einde van een project controleert zijn:

  • de vindplaats van de dataverzameling
  • de persistent identifier, die de dataverzameling traceerbaar en citeerbaar maakt.

Enkele vindplaatsen zijn:

FAIR-data

Findable – Accessible – Interoperable - Reusable

Alle inspanningen op het gebied van datamanagement gaan om het resultaat aan het einde van het project: uw onderzoeksresultaten worden verifieerbaar en de onderliggende data herbruikbaar.

Bestaande databestanden benutten kan alleen wanneer de data FAIR zijn: Findable, Accessible, Interoperable, Reusable. Met andere woorden data moeten vindbaar, toegankelijk, interoperabel, herbruikbaar en duurzaam opgeslagen zijn.
FAIR data zijn gebaseerd op de FAIR-principles van FORCE11.

Het datamanagementplanformat van ZonMw helpt de onderzoeker om data FAIR te maken.

FAIR-principles

De FAIR-principles zijn geformuleerd door FORCE11

In Nederland worden de FAIR-principles in brede kring erkend.

In the FAIR Data approach, data should be:

  • Findable – Easy to find by both humans and computer systems and based on mandatory description of the metadata that allow the discovery of interesting datasets
  • Accessible – Stored for long term such that they can be easily accessed and/or downloaded with well-defined license and access conditions (Open Access when possible), whether at the level of metadata, or at the level of the actual data content
  • Interoperable – Ready to be combined with other datasets by humans as well as computer systems
  • Reusable – Ready to be used for future research and to be processed further using computational methods

De volledige FAIR-principles vindt u op de website van FORCE11

Dutch Techcentre for Life Sciences is actief in het toepassen en adviseren over FAIR-principles.

Duurzame opslag van data

Bij duurzame dataopslag worden data zo gearchiveerd dat ze – ook op lange termijn – toegankelijk blijven. Dit vergt bijvoorbeeld goede metadata en documentatie om de data begrijpelijk te houden en ook het converteren van bestanden naar een nieuw formaat voordat het oude formaat veroudert en mogelijk onleesbaar wordt.

Voor duurzame lange-termijnarchivering zijn internationale richtlijnen beschikbaar. De eenvoudigste set criteria is die van het internationale Data Seal of Approval (DSA). Deze criteria en het bijbehorende keurmerk zijn onafhankelijk van het vakgebied. Een archief dat data duurzaam opslaat, is een trusted digital repository. In Nederland hebben CentERdata, DANS en 4TU.Datacentrum dit certificaat en binnenkort ook SURF.

Toegankelijke data

Een dataverzameling is open access wanneer de data na registratie in een archief (repository) vrij toegankelijk zijn voor belangstellenden. ZonMw staat restricted access ook toe. In dat geval moeten de juridische positie van de licenties en de voorwaarden voor gebruik helder zijn om hergebruik van data ook werkelijk mogelijk te maken.

In overleg met ZonMw is een embargoperiode mogelijk waarin data niet volledig openbaar zijn. Bijvoorbeeld vanwege publicaties, openbare veiligheid, privacy, intellectueel eigendom dat berust bij betrokken bedrijven, of commerciële belangen die een rol spelen bij de exploitatie van onderzoeksresultaten.

Interoperabele data

Onderzoeksdata worden interoperabel (uitwisselbaar) door een ICT-standaard (of data-format) te gebruiken waarmee data zowel leesbaar zijn voor andere onderzoekers (eenheid van taal), als hun computers ('machine readable'). De keuze voor een standaard kan afhangen van wat gangbaar is binnen een vakgebied en wat een onderzoeksinstituut beschikbaar heeft.

Herbruikbare data

Voor hergebruik van onderzoeksgegevens en replicatie van onderzoek moet een 'replication package' gemaakt worden. Die bestaat uit de (ruwe, bewerkte) data en documentatie over onder meer de gehanteerde onderzoeksmethodologie, codeboeken, metadatering, machineinstellingen. Kortom, alles wat nodig is om “het spoor terug” te kunnen volgen.

Naar boven
Direct naar: InhoudDirect naar: NavigatieDirect naar: Onderkant website