De roep om transparantie groeit zowel binnen als buiten de wetenschap. Toch is het publiekelijk delen van onderzoeksdata nog niet vanzelfsprekend. Voorvechter van open science Anneke Zuiderwijk onderzoekt en ontwikkelt instrumenten die helpen bij het beter en eenvoudiger delen, beschikbaar maken en gebruiken van data. Hiermee hoopt ze dat de maatschappelijke waarde van open science nog beter benut gaat worden.

 “De coronacrisis heeft het belang van open science maar weer eens onderstreept.” zegt Anneke Zuiderwijk, associate professor Open Data aan de faculteit Techniek, Bestuur en Management. “Dankzij datadeling tussen partijen uit de wetenschap en medische industrie konden in relatief zeer korte tijd coronavaccins worden ontwikkeld.” Toch is van alle wetenschappelijke data die wereldwijd worden verzameld momenteel nog maar een fractie openbaar. Volgens de onderzoeker heeft dat verschillende oorzaken. “Een van de factoren die een rol speelt is tijd. Het goed structureren en beschikbaar maken van data vraagt behoorlijk veel werk. Terwijl de werkdruk voor onderzoekers al hoog is. Daarnaast worden onderzoekers – in tegenstelling tot voor publicaties – nauwelijks beloond voor het delen van datasets. Er ontbreekt dus een prikkel. Verder bestaat bij sommige onderzoekers de angst dat data verkeerd geïnterpreteerd worden of anderen ermee aan de haal gaan voordat het onderzoek of artikel is afgerond.”

Practice what you preach

Zuiderwijk herkent de worsteling van wetenschappers. “Ik was zelf bij mijn promotieonderzoek ook huiverig mijn data te delen. Mijn grootste angst was misinterpretatie van mijn datasets. Tegelijkertijd dacht ik wel: meer transparantie is ontzettend belangrijk. Het zorgt bijvoorbeeld voor meer samenwerking tussen wetenschappers en nauwkeurigere documentatie. Dat leidt weer tot kwalitatief beter onderzoek. Bovendien doe ik zelf onderzoek naar open science, dan moet ik ook het goede voorbeeld geven. Practice what you preach. Omdat ik alle data van m’n onderzoek goed gestructureerd had opgeslagen, kostte het bovendien maar relatief weinig moeite om het openbaar te maken. Uiteindelijk besloot ik dus om alle data te publiceren. Na die eerste keer werd het steeds makkelijker. Je moet dus even een horde over.”   

Barrières en stimulansen

Een van de uitdagingen bij haar onderzoek is te achterhalen welke factoren ervoor zorgen dat een onderzoeker zijn of haar data wel of niet deelt. Zuiderwijk: “Het kan zijn dat het vanuit een land of universiteit niet gebruikelijk is om data openbaar te maken, maar er kunnen ook persoonlijke motieven achter zitten. Bijvoorbeeld het vertrouwen in anderen. Zeker wanneer er veel persoonlijke data in het onderzoek zijn verwerkt, zijn onderzoekers vaak terughoudend. Dan wegen de barrières zwaarder dan de voordelen. Andersom geldt ook dat bepaalde factoren openbare datadeling juist kunnen stimuleren. Bijvoorbeeld eisen vanuit de financier of een beloning vanuit de universiteit, zoals een bedrag dat je jaarlijks mag uitgeven aan een conferentie. Ik wil achterhalen op welk niveau welke barrières en stimulansen een rol spelen bij open science en in hoeverre landen, universiteiten en onderzoekdisciplines daarin verschillen.”

Instrumenten voor betere datadeling

De inzichten die Zuiderwijk opdoet vormen de basis voor oplossingen voor het beter beschikbaar en bruikbaar maken van data. Voor haar promotieonderzoek ontwierp ze bijvoorbeeld – samen met een internationaal consortium – een infrastructuur en website waarop onderzoekers sneller en beter hun data kunnen verwerken. Momenteel onderzoekt ze hoe universiteiten hun data-infrastructuur kunnen verbeteren. “Universiteiten werken vaak met verschillende portalen en standaarden voor het verwerken van datasets. Dat maakt het voor onderzoekers lastig om data van andere kennisinstellingen te gebruiken en combineren. Ook worden onderzoekers niet altijd voldoende ondersteund door hun universiteit bij het openbaar maken van data.”

Data stewards

Zuiderwijk kijkt welke infrastructurele en institutionele instrumenten bijdragen aan het verbeteren van de data-infrastructuur. Daarbij ontwikkelt ze theorie voor specifieke behoeften en contexten. “Omdat open science nog niet bij elke universiteit even vanzelfsprekend is, moet je kijken naar wat waar past. Wanneer datadeling ergens bijvoorbeeld nog helemaal in de kinderschoenen staat, kun je beter beginnen met een generiek onderwijsarrangement, zodat onderzoekers algemene vaardigheden kunnen ontwikkelen. Als je al wat verder bent – zoals de TU Delft, waar de afgelopen tien jaar flink is geïnvesteerd in open science – kun je meer kijken naar instrumenten voor individuele ondersteuning, zoals data stewards. Zij geven advies over welke data je wel of juist niet beschikbaar moet stellen, waar je op moet letten en hoe je het beste je data kunt presenteren. Dat doen ze met voorlichting en training, maar ook met individuele begeleiding. Bij de TU Delft beschikt elke faculteit over een eigen data steward.”

Maatschappelijk waarde benutten

Naast het doen van onderzoek geeft Zuiderwijk online gratis cursussen (MOOCs) over open science. Hierbij laat ze onder meer de voordelen van datadeling voor onderzoekers zelf zien. “Bijvoorbeeld dat je tijdens je onderzoek netter gaat rapporteren. Of dat je er met open toegang tot data voor zorgt dat je artikelen beter vindbaar zijn en je laat zien dat je data betrouwbaar zijn. Maar de belangrijkste stimulans voor het delen van data is de bijdrage die je kunt leveren aan het oplossen van maatschappelijke vraagstukken. Denk aan de totstandkoming van coronavaccins. Zo’n succesverhaal werkt enorm inspirerend. Ik hoop de komende jaren met mijn onderzoek een wetenschappelijke doorbraak voor open science te realiseren, waardoor we de maatschappelijke waarde met z’n allen nog beter kunnen benutten.”

T4TU.ResearchData

In 2008 richtte TU Delft samen met TU Eindhoven, Universiteit Twente en Wageningen Universiteit de 4TU.ResearchData op, een internationale databank voor wetenschap, techniek en design. Haar diensten omvatten het samenstellen, delen, toegang op lange termijn en bewaren van onderzoeksdatasets. Deze diensten zijn beschikbaar voor iedereen over de hele wereld. Daarnaast biedt 4TU.ResearchData trainingen en middelen aan onderzoekers om hen te ondersteunen bij het vindbaar, toegankelijk, interoperabel en reproduceerbaar maken van onderzoeksdata.