Eerste stappen richting FAIR-data in COVID-19-onderzoek

In maart 2020, aan het begin van de COVID-19-pandemie, werd voor ZonMw, GO FAIR Foundation en Health-RI duidelijk hoe belangrijk het is om onderzoeksprojecten en bijbehorende data vindbaar en herbruikbaar te maken, ook voor computerondersteunde online zoekopdrachten. De partijen realiseerden zich dat online transparantie over projecten en data onmisbaar is voor kennisontwikkeling voor snelle oplossingen voor de pandemie. Online transparantie kan alleen worden bereikt door de FAIR-principes te volgen om de data vindbaar, toegankelijk, interoperabel en herbruikbaar te maken, zowel voor mensen als voor computers (ofwel ‘machines’).

Unieke samenwerking

ZonMw organiseerde een unieke samenwerking met FAIR-data experts van GO FAIR Foundation en Health-RI om een werkwijze, tools en een dataportaal te ontwikkelen voor het produceren en gebruiken van FAIR-metadata en -data. De drie partijen organiseerden workshops voor onderzoekers en datastewards van de door ZonMw gefinancierde COVID-19-projecten. Daarin werd informatie verzameld over onderwerpen en termen gerelateerd aan COVID-19, maar ook standaarden en protocollen (etc.) die relevant zijn binnen dit onderzoeksdomein. Hieruit zijn (zoals hieronder beschreven) FAIR-metadataschema’s (M4M) ontstaan voor het vastleggen van informatie (=metadata) over projecten en data.

Zonder FAIR-metadata geen FAIR-data!

Voor het online bevragen van data (‘data visiting’ of data bezoeken) uit verschillende onderzoeken en bronnen over specifieke onderwerpen (zoals COVID-19) moet de computer de gegevens kunnen vinden, begrijpen en gebruiken. De FAIR-principes zijn de leidraad om dit mogelijk te maken. Een cruciale stap is het produceren van computer-bruikbare (‘machine-actionable’) metadata, die alle informatie bevatten die de computer daarvoor nodig heeft. We hebben nu instrumenten en instructies om computer-bruikbare metadata te produceren over de projecten en data in COVID-19-onderzoek.

Tools, diensten en infrastructuur: ‘metadata-for-machines’

ZonMw, GO FAIR Foundation en Health-RI hebben in 2020 een instrumenten en instructies ontwikkeld voor het produceren van FAIR-metadata, namelijk metadata-for-machines (M4M) voor COVID-19-onderzoeksprojecten en datasets. De metadata worden vastgelegd met CEDAR-formulieren. Deze formulieren kunnen worden gebruikt als vragenlijsten, en kunnen (1) de metadata computer-bruikbaarmaken, en (2) gebruik maken van (in dit geval COVID-19-specifieke) gecontroleerde terminologieën voor een gestandaardiseerde en computer-bruikbare beschrijving van het project en de data. Hier staan de richtlijnen, veel gestelde vragen, terminologieën en formulieren voor het produceren van M4M voor COVID-19-onderzoeksprojecten en hun databases.

Tools, diensten en infrastructuur: meerdere dataportalen

De computer-bruikbare metadata over COVID-19-projecten en -data, die zijn geproduceerd met de M4M-formulieren, worden in een voor mensen leesbaar formaat weergegeven op het COVID-19-dataportaal bij Health-RI. Het portaal ondersteunt het zoeken, vinden en opvragen van data. Sinds 2023 zijn de COVID-19-bronnen op het Health-RI-portaal ook te vinden op het Europese COVID-19 Data Platform. Zo worden Nederlandse onderzoekers, wanneer ze de informatie over hun projecten en databases in de CEDAR-formulieren invullen, vindbaar op Nationale en Europese platforms.

Tools, diensten en infrastructuur: VODAN

In 2020 heeft GO FAIR Foundation, mede gefinancierd door ZonMw, ook het Virus Outbreak Data Access Network (VODAN) geïnitieerd om het daadwerkelijk opvragen van data (‘data visiting’) mogelijk te maken. VODAN begon met het FAIR maken van het WHO Clinical Research Form (CRF). Dat betekent dat elk element in het formulier kan worden ingevuld met computer-bruikbare, gecontroleerde termen. Een formulier dat zo is ingevuld, kan door computers worden gevonden, begrepen en gebruikt. De VODAN-‘use case’ maakt gebruik van ‘FAIR datapoint’-software (FDP) om metadata vast te leggen en gegevensinvoer mogelijk te maken. Dit pakket voor het produceren en gebruiken van FAIR klinische data is ook beschikbaar voor andere gebruikers via de VODAN-in-a-Box toolset.

De VODAN-aanpak werd in Afrika in negen landen geïmplementeerd. Er waren veel ziekenhuizen en universiteiten betrokken, waardoor een internet van FAIR-data werd gerealiseerd die kunnen worden opgevraagd. Het kan worden beschouwd als de eerste succesvolle demonstratie van FAIR-‘data visiting’ (bezoek). Verdere implementaties vinden nu plaats in VODAN Afrika en Azië.

Meer over data FAIRiferen leest u op Achtergrondinformatie over FAIR-data, GO FAIR Foudantion en Health-RI, en in Spin-offs van COVID-19 data FAIRification.