Zijn onze data klaar voor de toekomst?

Data zijn de meest waardevolle grondstof van de 21e eeuw. Beter (her)gebruik van data is de sleutel tot snellere innovaties en beter beleid. Dat geldt zeker op het gebied van gezondheid en zorg. Maar hoe zorgen we dat data ook echt hergebruikt kunnen worden?

Bijeenkomst over het FAIR maken van data

Op 22 juni 2022 organiseerde ZonMw een bijeenkomst over FAIR-data. De bijeenkomst was bedoeld voor projectleiders, onderzoekers en datamanagers die zich bezighouden met onderzoek op het gebied van antimicrobiële resistentie en infectieziekten. Het doel van deze bijeenkomst was het informeren en het delen van ervaringen met het herbruikbaar maken van data en de toepassing daarbij van FAIR-metadataschema’s (M4M, metadata-for-machines) die voor deze thema’s zijn ontwikkeld. Lees hier het verslag van deze bijeenkomst en bekijk de video waarin onderzoekers vertellen over hun ervaringen met FAIR-data.

Data zijn sleutel voor effectieve aanpak infectieziekten

De coronapandemie heeft laten zien hoe belangrijk het is om snel over voldoende gegevens te beschikken voor bijvoorbeeld vaccinontwikkeling, inzicht in de verspreiding van het virus en welke maatregelen daartegen nodig zijn. Ook bij andere infecties zijn goede data de sleutel voor een effectieve aanpak. Om bijvoorbeeld te begrijpen hoe bacteriën ongevoelig worden voor antibiotica is heel veel genetische informatie van verschillende bacteriestammen nodig. Het is dan ook niet toevallig dat ZonMw juist op het gebied van infectieziekten is begonnen met extra aandacht voor FAIR-data. In de derde ronde van het ZonMw-programma Antibioticaresistentie (ABR) werden onderzoekers uitgedaagd om nieuwe projecten op te zetten met bestaande data. In het COVID-19 programma is van begin af aan met FAIR-data gewerkt.

Lees ook: 8 onderzoeken over antibioticaresistentie en FAIR-data

FAIR betekent dat de computer het kan lezen

De afkorting FAIR staat voor vindbaar, toegankelijk, interoperabel en herbruikbaar (Engels: findable, accessible, interoperable, reusable). Bij die woorden, ook wel FAIR-principes genoemd, denken we meestal aan mensen die iets moeten vinden, ergens bij moeten kunnen, ermee kunnen rekenen, etcetera. Maar in de praktijk van de 21e-eeuwse wetenschap is het vooral de computer die data moet kunnen vinden en er wat mee moet kunnen. Een andere uitleg van FAIR is dan ook ‘Fully AI Ready’ (helemaal klaar voor kunstmatige intelligentie).

De computer heeft meestal extra informatie nodig om de data ook echt te ‘begrijpen’. Het gaat er ondermeer om hoe data tot stand zijn gekomen en in welke context. Bij data over blaasontsteking bijvoorbeeld is het relevant of het kinderen betreft, zwangere vrouwen of ouderen in een verpleeghuis. Zulke achtergrondinformatie wordt opgeslagen in zogeheten 'metadata'. Het FAIR maken van bestaande data betekent vaak dat zulke metadata aan de dataverzameling worden toegevoegd. Welke metadata nodig zijn, hangt af van het vakgebied, het 'domein'. Daar moeten onderzoekers binnen dat domein afspraken over maken.

'Voor onderzoekers is het in het begin niet altijd gemakkelijk om te begrijpen wat FAIR precies betekent en waarom het belangrijk is', aldus Margreet Bloemers, projectleider FAIR data en datamanagement bij ZonMw. 'Onderzoekers zijn zelf vaak gericht op één specifieke onderzoeksvraag en zijn daardoor minder bezig met de waarde van hun data voor toekomstig onderzoek. Maar als het eenmaal gaat leven, wordt duidelijk wat de winst is, voor jezelf en voor andere onderzoekers'. In een filmpje dat Bloemers presenteerde, vertellen onderzoekers hun ervaringen met FAIR. Een terugkerende hartenkreet was dat zij hun datamanager steeds meer gingen waarderen. De datamanager kan helpen om data van begin af aan FAIR op te slaan.

Het is zeker bij gezondheidsdata vaak praktischer als de data zelf niet gedeeld hoeven te worden. Data die FAIR zijn opgeslagen, kunnen toegankelijk worden gemaakt voor analyse van buitenaf. De data worden dan bezocht door een computerprogramma (algoritme). Dat is beter voor de privacy en ook handiger.

Stel een onderzoeker wil weten hoeveel ziekenhuispatiënten met een longontsteking een bepaald antibioticum hebben gekregen en hoe snel zij herstelden. De onderzoeker kan dan een computeralgoritme op pad sturen dat in de data van een groot aantal ziekenhuizen bijvoorbeeld telt wie dat antibioticum kreeg en hoelang het duurde voor de lichaamstemperatuur weer normaal was. De patiëntgegevens blijven vertrouwelijk: er gaan een paar getallen terug naar de onderzoeker, maar de onderzoeksvraag kan worden beantwoord.

Uit de presentaties gedurende de hele bijeenkomst werd duidelijk wat FAIR in de praktijk betekent. Dankzij projecten van de Leidse universiteit worden data over infecties in een groot aantal Afrikaanse landen nu FAIR opgeslagen en op locatie bewaard. Vroeger verdwenen de data vaak naar onderzoeksinstellingen in andere landen, waardoor de lokale zorgverleners er niet meer bij konden. Dankzij het Virus Outbreak Data Network (VODAN) is het nu omgekeerd: onderzoekers sturen een computeralgoritme langs de data in de verschillende Afrikaanse ziekenhuizen en gezondheidscentra. Zo wordt geïnvesteerd in de lokale infrastructuur en kan er wereldwijd onderzoek worden gedaan met deze data. Uiteraard houdt men daarbij rekening met lokale wetten en afspraken op het gebied van data en met de ethiek van dergelijk onderzoek.

ZonMw ondersteunt onderzoekers en instellingen

ZonMw stimuleert al sinds 2013 dat data binnen het Nederlandse gezondheidsonderzoek herbruikbaar worden gemaakt. Iedereen die van ZonMw subsidie krijgt voor onderzoek, moet een datamanagementplan inleveren. Dat datamanagementplan is nog belangrijker geworden door de FAIR principes die in 2016 werden gepubliceerd. Goed datamanagement sluit ook aan bij de toenemende aandacht voor Open Science. Uit de verhalen van onderzoekers blijkt dat het wel helpt om van tevoren goed na te denken over het opslaan van data, maar dat dit nog niet genoeg is. Het plan moet ook worden uitgevoerd. Gelukkig bleek ook dat steeds meer onderzoeksinstellingen investeren in datamanagement. Beginnende onderzoekers worden vertrouwd gemaakt met FAIR en wat dat voor hun onderzoek betekent.

Steeds meer datamanagers en meer FAIR-data

Het aantal datamanagers groeit gestaag. Het landelijke Health-RI netwerk en het internationaal gerichte GO FAIR spelen daarbij een actieve rol samen met ZonMw. Ervaringen zoals met het COVID-19 Programma en het ABR-programma dragen weer bij aan slimmere manieren waarop onderzoekers ondersteund kunnen worden. Het is uiteindelijk immers in hun belang, en in het belang van preventie en gezondheidszorg, dat data (her)bruikbaar zijn voor onderzoek. Zeker nu er dankzij kunstmatige intelligentie steeds meer mogelijk wordt, wil ZonMw er alles aan doen om te zorgen dat alle data Fully AI Ready zijn. Klaar voor de toekomst dus.

Meer informatie

Heeft u vragen over FAIR data?

Voor meer informatie over FAIR-data klik hier. Of stuur een e-mail naar toegangtotdata@zonmw.nl ten aanzien van Margreet Bloemers.

Heeft u vragen over de bijeenkomst?

Voor vragen over de bijeenkomst kunt u een e-mail versturen naar abr@zonmw.nl of infectiousdisease@zonmw.nl. Het is ook mogelijk om het verslag van de bijeenkomst met de presentaties te ontvangen.

Meer informatie over de door ons gefinancierde onderzoeken op het gebied van antimicrobiële resistentie en infectieziekten is te vinden op de webpagina’s over antimicrobiële resistentie en infectieziekten.