Data vinden of vindbaar maken:
Dataverzamelingen zijn te vinden in online metadatacatalogi, webportals, of data-archief, waar ze zijn voorzien van beschrijvende informatie (metadata). De data zelf staan daar niet in. Die zijn opgeslagen in een archief (repository).
De kerngegevens over dit onderdeel die ZonMw aan het einde van een project controleert zijn:
Alle inspanningen op het gebied van datamanagement gaan om het resultaat aan het einde van het project: uw onderzoeksresultaten worden verifieerbaar en de onderliggende data herbruikbaar.
Bestaande databestanden benutten kan alleen wanneer de data FAIR zijn: Findable, Accessible, Interoperable, Reusable. Met andere woorden data moeten vindbaar, toegankelijk, interoperabel, herbruikbaar en duurzaam opgeslagen zijn.
FAIR data zijn gebaseerd op de FAIR-principles van FORCE11.
Het datamanagementplanformat van ZonMw helpt de onderzoeker om data FAIR te maken.
De FAIR-principles zijn geformuleerd door FORCE11
In Nederland worden de FAIR-principles in brede kring erkend.
In the FAIR Data approach, data should be:
De volledige FAIR-principles vindt u op de website van FORCE11
Dutch Techcentre for Life Sciences is actief in het toepassen en adviseren over FAIR-principles.
Bij duurzame dataopslag worden data zo gearchiveerd dat ze – ook op lange termijn – toegankelijk blijven. Dit vergt bijvoorbeeld goede metadata en documentatie om de data begrijpelijk te houden en ook het converteren van bestanden naar een nieuw formaat voordat het oude formaat veroudert en mogelijk onleesbaar wordt.
Voor duurzame lange-termijnarchivering zijn internationale richtlijnen beschikbaar. De eenvoudigste set criteria is die van het internationale Data Seal of Approval (DSA). Deze criteria en het bijbehorende keurmerk zijn onafhankelijk van het vakgebied. Een archief dat data duurzaam opslaat, is een trusted digital repository. In Nederland hebben CentERdata, DANS en 4TU.Datacentrum dit certificaat en binnenkort ook SURF.
Een dataverzameling is open access wanneer de data na registratie in een archief (repository) vrij toegankelijk zijn voor belangstellenden. ZonMw staat restricted access ook toe. In dat geval moeten de juridische positie van de licenties en de voorwaarden voor gebruik helder zijn om hergebruik van data ook werkelijk mogelijk te maken.
In overleg met ZonMw is een embargoperiode mogelijk waarin data niet volledig openbaar zijn. Bijvoorbeeld vanwege publicaties, openbare veiligheid, privacy, intellectueel eigendom dat berust bij betrokken bedrijven, of commerciële belangen die een rol spelen bij de exploitatie van onderzoeksresultaten.
Onderzoeksdata worden interoperabel (uitwisselbaar) door een ICT-standaard (of data-format) te gebruiken waarmee data zowel leesbaar zijn voor andere onderzoekers (eenheid van taal), als hun computers ('machine readable'). De keuze voor een standaard kan afhangen van wat gangbaar is binnen een vakgebied en wat een onderzoeksinstituut beschikbaar heeft.
Voor hergebruik van onderzoeksgegevens en replicatie van onderzoek moet een 'replication package' gemaakt worden. Die bestaat uit de (ruwe, bewerkte) data en documentatie over onder meer de gehanteerde onderzoeksmethodologie, codeboeken, metadatering, machineinstellingen. Kortom, alles wat nodig is om “het spoor terug” te kunnen volgen.