DATA: vindbaar – toegankelijk – uitwisselbaar - opslag

DATA: vindbaar – toegankelijk – uitwisselbaar - opslag
1. Data verzamelen en analyseren
a.
b.
c.
d.
Hergebruik e/o koppelen; nieuwe data verzamelen
Gevoelige gegevens beschermen
Kwaliteit van de data
ICT standaarden, e-infrastructuren
2. Data opleveren (projectresultaten)
a.
b.
Metadata
Koppelingsvariabelen
3. Data bewaren tijdens, na afloop v.h. project:
a.
b.
c.
Opslagcapaciteit, beveiliging
Lange termijnarchivering
Kosten
4. Data beschikbaar stellen
a.
b.
Gebruiksvoorwaarden
Online catalogus, persistent identifier
In de break-outsessie over Datamanagement: een checklist voor onderzoekers hebben
we geconstateerd dat de activiteiten op iedere verdieping van het huis plaatsvinden.
Basis architectuurplaat NFU
•
•
•
•
Lobby / coordination around calls
International cooperation
Registers / cohorts (ZonMW and others)
UMD transcending infrastructures
Process
es
•
•
•
•
•
•
•
Service desks
Knowledge sharing / training
Cooperation
‘Technology hotels’
Catalogues
Access to data
Harmonization consents
Data
•
•
•
Pseudonimization / TTP
Data / metadata standards / ontologies
Data quality
Applicatio
n
•
•
•
•
Agreements about local implementations
Standards interfaces
Pipelines
Authentication / autorisation
Technics
•
•
•
High Performance Compute (HPC)
Storage (local and cloud)
Network (light paths)
Business
De onderzoeker zal zelf het datamanagement vooral moeten regelen op de niveaus van
proces en data, maar is tegelijk afhankelijk van wat zijn of haar instituut faciliteert op
het technische en applicatieniveau. Ook steun die hij ondervindt van bestuur en
management bepaalt in hoeverre hij of zij tijd en mogelijkheden ervoor heeft.
Randvoorwaarden
In de sessie zijn veel ideeën en ervaringen uitgewisseld. Geconstateerd wordt dat
onderzoeker en instituut weliswaar het erover eens zijn dat er afspraken moeten
worden gemaakt over datamanagement, maar dat het gesprek daarover nog
behoorlijk vertroebeld wordt door argumenten voor en tegen datasharing.
De vraag is verder of de individuele onderzoeker wel in staat is om het datamanagement
te organiseren. Ook is niet duidelijk wat datamanagement kost en wat in een
projectbegroting thuishoort en wat redelijkerwijs door het instituut geleverd moet
worden als basisinfrastructuur. De faciliteiten binnen instituten zijn nog in
ontwikkeling. Wil datamanagement goed van de grond komen, dan moet er meer
geïnvesteerd worden op systeemniveau, ofwel de basisinfrastructuur van het
instituut. De benodigde gelden daarvoor zullen uiteindelijk ook moeten komen van de
departementen (OCW, VWS, EZ en wellicht andere).
Terug naar de individuele onderzoeker wordt de beloning van de onderzoeker als
belangrijk aandachtspunt genoemd, waarover landelijke (of zelfs internationale)
afspraken moeten komen. Is er voldoende geld beschikbaar? Is er een “h-index” voor
het delen van data en zo ja, wanneer en hoe gaan we die zo optimaal mogelijk
inzetten om datasharing te bevorderen? Zo heeft 3TU-Datacentrum nu al een systeem
waarin wordt vastgelegd welke databestanden gedeeld worden. Zo’n systeem zou
ook algemeen erkend moeten worden. Bijv door VWS, ZonMw, en de umc’s. M.a.w.
de onderzoeker moet credit krijgen en erkend worden.
Laaghangend fruit
Op dit moment worden nog lang niet alle bestaande en relevante mogelijkheden benut.
Het werd bijvoorbeeld duidelijk dat er zelfs nog fysieke data opslagcapaciteit
beschikbaar is bij Surf en Surf kan ook helpen bij het op de juiste manier opzetten van
goed datamanagement. Er zijn bijvoorbeeld ook internationaal geaccepteerde
methoden beschikbaar om te toetsen hoever je bent als instituut met het
implementeren van datamanagement zoals de Data Seal of Approval (DSA) en meer
‘exploratief’ de Cardio-tool (Marjan Grootveld van DANS kan informatie geven
hierover). De DSA kan gefaseerd worden ingevoerd en ook wanneer de DSA niet
meteen behaald kan worden, biedt het een goede mogelijkheid en methodiek om
zeer gestructureerd te analyseren hoe het ervoor staat met datamanagement binnen
een instituut of ziekenhuis.
Tot slot: in de sessie zijn niet de items van datamanagement in praktische zin
doorgesproken. Sommige deelnemers hadden dat wel verwacht. De checklists staan
op de website van ZonMw www.zonmw.nl\ttd en voor vragen daarover kan men
contact opnemen.