Data stewardship

Werkpakket 8: Afstemming aanvragen en
belangenbehartiging in Den Haag en Brussel
Doel
• Meer middelen voor de onderzoeksdata infrastructuur bij de UMC’s uit Nederlandse en
EU fondsen
• Politieke besluiten in Den Haag als Brussel die bijdragen aan het verder ontwikkelen van
de onderzoeksdata infrastructuur
Resultaten
• Betere en meer consistente positionering van de UMC’s bij calls op het gebied van de
onderzoeksdata infrastructuur in de life sciences, zowel in Nederland als in Europa
• Actieve betrokkenheid bij de voorbereidingen van calls op het gebied van de
onderzoeksdata infrastructuur in Nederland en Europa
• Actieve lobby bij Nederlandse en Europese politiek
Aanpak
• Ondersteuning van toponderzoekers die actief zijn in het NL en EU netwerk door:
- actuele informatie over kansen, bedreigingen en relevante spelers in het nationale en
internationale speelveld;
- ondersteuning bij het schrijven van aanvragen, brieven en andere vormen van
communicatie;
- informatie over visie en beleidskeuzes in het kader van het programma
Onderzoeksdata infrastructuur;
- waar nodig partijen te stimuleren resp. te betrekken om aanvragen te doen of een
bijdrage te leveren aan de politieke discussie.
Financiering
Dit is een nieuwe activiteit, waarvoor nieuwe middelen gevonden zullen moeten worden.
De omvang van de kosten bedragen naar verwachten ca 160k per jaar, d.w.z. 240k voor
plateau 1
1
Surfen op de data golf
Onderzoeksdata infrastructuur voor biomedisch
onderzoek
25 juni 2014
2
Belangrijkste vraag aan de
adviescommissie
Op welke terreinen heeft het prioriteit om vanuit de NFU
samenwerking en afstemming tussen de huizen te
organiseren op het onderwerp van data infrastructuur, uit
oogpunt van
1. effectieve wetenschap,
2. kwaliteit en veiligheid en
3. kosten-efficiency?
3
Relevantie en urgentie
Relevantie
Relevant
» toename van onderzoeksdata;
» de internationale toppositie te behouden in het onderzoek;
» concurrentie wetenschappelijke gelden; Horizon2020 ‘research infrastructures’
» aansprakelijkheid: het niveau van data handling in de huizen moet omhoog om de risico’s van
misbruik, wetenschappelijke fraude en beveiligingslekken te verminderen
» Versnippering/verspilling: veel activiteiten vinden nu separaat en ongecoördineerd plaats
Urgentie
Urgent
» de beëindiging subsidies aan diverse grote projecten
» de komst nieuwe EU privacy richtlijn
» de implementatie van nieuwe EPDs
» hogere eisen aan kwaliteit van datamanagement en open access door belangrijke sponsors van
onderzoek (bijv. door NWO, ZonMW, KWF)
» nieuwe kansen: aanspreekpunt voor partijen als KWF en Achmea.
4
Ingewikkeld speelveld
Internationale community
Veel diverse partijen
Standaardisatie instituten
NEN
NICTIZ
Ziekenhuizen
Ministeries
OC&W
Funding anders dan ESFRI
VWS
EZ
ZonMW
Diverse collectezakfondsen
Partners in PPP
PSI/Life
Lines
Robijn
Diverse
patiëntenorganisaties
Overlegplatforms
BMS.NL
CRO’s
Pharma
MKB / Spin off
Diverse andere
ziekenhuizen
NFU projecten
NWO
Patiëntenorganisaties
FP7 / FP8
IMI
eScience
Center
Horizon
2020
DTL
LSH plaza
Topinstituten
UMC
Utrecht
LUMC
VUmc
AMC
NFU
Radboud
MC
Erasmus
MC
UMCG
NGI/NBIC
CTMM / TraIT
TI Pharma /
Mondriaan
BMM
MUMC
Platform Klinisch Onderzoek
VSNU - Beta
faculteiten
Kennisorganisaties
TNO
DICA e.a.
Leveranciers
SURF
EPD leveranciers
Vancis/SARA/CIT e.a.
IT bedrijven (IBM,
Oracle, SAS etc.)
Hubrecht
Institute
Diensten binnen de
UMC’s, zoals LUMCADM
TTP’s
NKI
Laboratorium tools /
software
Grootschalige
apparatuur (Philips e.a.)
Universiteiten
RIVM
NL Roadmap grootschalige
onderzoeksfaciliteiten / ESFRI
CBS
EATRISNL/EATRIS
- /ECRIN
NeCEN/
INSTRUCT
BioImagingNL/
Bioimaging
BBMRI-NL /
BBMRI
ELIXIR
5
Onderwerpen voor regie
Overzicht thema’s en framework
Data stewardship
1. Processen en architectuur onderzoeksdata
2. Benodigde IT infrastructuur
3. Benodigde expertise
6
Strategie - doelen
‘Data stewardship’
1
Onwikkel een beleidsdocument over de kwaliteitsborging van onderzoeksdata, dat een kader biedt aan de UMC’s en
onwikkel een gecoordineerde aanpak voor implementatie in de huizen
Thema 1: Processen en architectuur onderzoeksdata
2
Ontwikkel standaarden en architectuurprincipes voor het verzamelen, bewerken en uitgeven van data in nauwe
samenhang met het project Registratie aan de bron.
3
Draag zorg voor afstemming bij de realisatie van een (gedeelde) onderzoeksdata infrastructuur.
4
Draag zorg voor de afstemming van aanvragen bij calls op het gebied van de onderzoeksdata infrastructuur en zorg
voor een netwerk van deskundigen die de belangen van de UMC’s behartigd in Brussel.
Thema 2: Benodigde IT infrastructuur
5
Maak gezamenlijk afspraken met veldpartijen, waaronder SURF
Thema 3: Benodigde expertise
6
Draag zorg voor coördinatie en borging van expertise
7
Data stewardship
Patiënt
veiligheid /
privacy
bescherming
Betrouwbaarheid
van data / data
provenance
Betrokkenheid
patiënt
Compliancy
wet- en
regelgeving
Monitoring
kwaliteit
UMC’s en
universiteiten
Kennisinstituten
Review
processen
Incidenten en
afhandeling
Financiers
Bedrijven
8
Thema 1: Processen onderzoeksdata en
architectuur
Patient enters
medical center
4. Standaardisatie (meta) dataverzameling
& koppelvlakken
1. Dataverzameling
via de EPD’s
3. Kostbare
meetapparaatuur
19. Betrokkenheid patiënt
Clinical Procedures
2. Harmonisatie registratie/
digitalisering informed consent
Electronic
Health Record
Imaging
Samples
Experiments
Clinical database
Image database
Biobank database
Experimental data
5. Pseudomisering /
TTP’s
4. Standaardisatie (meta) dataverzameling
& koppelvlakken
Data
Integration
Downstream
analysis
Scientific Output
Intellectual
Property
7. Vereenvoudiging procedures
toegang data
6. Ontwikkeling gestandaardiseerde
en gekoppelde catalogi
8. Analyse Big Data in zorg en
research (Medical Intelligence)
Improved
Healthcare
9
Thema 2: Benodigde IT infrastructuur
10. High Performance Compute clusters
9. Ontwikkeling Storage clusters
Storage
Verwante
voorzieningen
(SARA /
Vancis, CIT,
TARGET, IT
bedrijven)
Compute
Authenticatie &
autorisatie
11. Eenduidig en
hoogwaardig
beveiligingsbeleid
12. Toegang tot andere netwerken en
overal toegang tot de eigen werkomgeving
Informatiebeveiliging &
privacybescherming
Storage
Computing
13. Snel
netwerk
SURFnet
netwerk /
lichtpaden
ErasmusMC
UMC Utrecht
LUMC
UMCG
VUMC
RadboudMC
MUMC
AMC
Storage
Storage
Storage
Storage
Storage
Storage
Storage
Storage
Computing
Computing
Computing
Computing
Computing
Computing
Computing
Computing
10
Thema 3: Expertise
16. Programmering
R&D en valorisatie
14. Schaarste in
specifieke kennis
Data
management
Bioinformatica /
text & data
mining
Bioinformatica /
artificial
analysis
15. Uitwisseling en
organisatie kennis /
trainingen
Kennisinstituten
Systeem
beheer
Financiers
Statistiek en
methodologie
Bioinformatica /
imaging
analysis
Medische
informatica
Bioinformatica /
-omics data
analysis
Bioinformatica /
systems biology
(wetenschappelijk)
programmeurs
UMC’s en universiteiten
Bedrijven
11
Akkoord NFU en Uitwerking advies najaar 2013
1. Opstellen beleidsdocument data stewardship
NFU getrokken door decaan ErasmusMC met brede schrijfgroep
2. Opstellen programma met uitwerking vd 3 thema’s
–
–
–
–
–
Marc Rietveld (UMCU)
Erik Flikkenschild (LUMC)
Morris Swertz (UMCG)
Jan-Willem Boiten (CTMM - TraIT)
Rob Hooft (DTL / NLeSC)
12
Denktank uit de umc’s
»
»
»
»
»
»
»
»
»
»
»
Remo Plantinga (AMC)
Rudy Scholte (AMC)
Bert van Ooijen (ErasmusMC)
Martin Kalshoven (LUMC)
Igor Schoonbrood (MUMC)
Arnoud van der Maas (RadboudUMC)
Michael van der Zel (UMCG)
Jan Jurjen Uitterdijk (UMCG)
René Oostergo (UMCG)
Harry Pijl (UMC Utrecht)
Ronald van Schijndel (VUMC)
13
Status Data Stewardship Policy
Schrijvers
» H1. Introductie Reden van beleidsdocument en beschrijving proces van data
» H2. Voorbereiding
»
»
§1. Soorten data
§2. Dataverzameling
§3. Meta data, definities, standaardisering inclusief EPD, ontologie en semantiek
H3. Uitvoering
§1. Data entry/ Databases, SURF
§2. Data kwaliteit
§3. Data integriteit audit trail
§4. Data storage, beveiliging inclusief gebruik van clouds, etc.
» H4. Uitgifte
§1. Data analyse incl. Provenance-beschrijving
§ 2. Hergebruik (Secundair gebruik data, Koppelen)
§ 3. Mining
14
Status Data Stewardship Policy
» H5. Toegang
§1. Data archiving
§2. Data access (incl. Open Access) (datacatalogus)
§2. Data ownership & sharing
§3. Data governance
§4. Data security, protection & confidentiality (privacy)
§5. Elektronisch Patiënten Dossier (EPD) en privacy (Registratie aan de bron, Onderzoekspaden,
Anonimisering)
» H6. Ethiek en integriteit
§1. Ethiek
§2. Wetenschappelijke integriteit
» H7. Verantwoording
§1. Vanuit het perspectief van de subsidieverstrekker – NWO, ZonMW (Open Access)
§2. Contract research
§3. Vanuit het perspectief van de patiënt/deelnemer – CRAZ lid/ Cor Oosterwijk (VSOP)
§4. Toekomst Perspectief
15
Werkprogramma- workpackages
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Harmonisatie van research IT infrastructuren (architectuur)
Biomedical data sharing & analysis
Vinden van en toegang tot data and samples (catalogi)
Gebruik van EPD in onderzoek
Good Research Practice: security, privacy protection en Informed
consent
Faciliteiten voor high-throughput data processing
Afstemming aanvragen en belangenbehartiging den haag en brussel
Coördinatie van toegang tot expertise en support
PR and communications
16
Programma Data4LSH
Stapsgewijze ontwikkeling
Zomer 2014
programmacommissie
Eind 2018
NFU programma, phase I
Harmonizatie en standaardisatie
Eind 2023
“ NFU programma” phase II
Integratie
Extra workpackage
Regie in fase II
17
Werkpakket 2: Harmonisatie van research IT
infrastructuren (architectuur)
Doel
Analyse en voorstel voor gewenste samenhang en ontwerp van de beoogde
onderzoeksdata infrastructuur. Dit vormt de basis voor keuzes nieuwe projecten en
afspraken met UMC’s en veldpartijen.
Resultaten
• Analyse bestaande onderzoeksdata infrastructuur en ontwikkelingen
• Ontwerp van de gewenste architectuur
• Overzicht van noodzakelijke en wenselijke aanpassingen
Aanpak
• Coördinatie door een werkgroep met specialisten uit de 8 UMC’s. De bestaande
architectuur werkgroep van CTMM / TraIT en de SURF Special Interest Group PRIMA
(waarin de architecten van de huizen deelnemen) kunnen hiertoe de basis vormen.
• Om de werkgroep formeren van een aantal interest groups, georganiseerd om
specifieke thema’s, zoals de ontwikkeling van datastandaarden en de problematiek van
de registers.. De stem van de onderzoeker zal hierin leidend zijn, maar ook andere
stakeholders zullen deelnemen.
 Er zal ruimte blijven voor het toevoegen van nieuwe thema’s resp. interest groups
rondom deze thema’s, die vanuit het onderzoeksveld worden aangereikt. Dit om
optimaal te blijven aansluiten op nieuwe ontwikkelingen.
18
Bijlage uitwerking werkpakketen
De volgende dia’s geven een globale uitwerking van de werkpakketten. De
werkpakketten zijn nog in concept.
19
Werkpakket 3: Biomedical data sharing & analysis
Doel
Een landelijk toegankelijke infrastructuur van gekoppelde lokale datavoorzieningen
voor het delen en analyseren van biomedische gegevens met koppelingen naar
zowel de onderliggende klinische zorgsystemen, als de research tools in de UMCs.
Resultaten
• Best practice oplossingen van lokale dataverzameling, data integratie, analyse,
workflows en koppeling van klinische data aan experimentele en sample gegevens..
• Eenduidig governance model dat toegang tot de lokale infrastructuren borgt voor
nationale onderzoeksprogramma's
• ‘Data sharing’ voorziening voor het aggregeren en delen van klinische gegevens,
beeldvorming en moleculaire profiel data voor onderzoek voor multicenter onderzoek
• Open interface die het onderzoekers mogelijk maakt eigen oplossingen te ontwikkelen
voor gedeelde gegevensverzamelingen.
Aanpak
• Projectorganisatie op basis van onder meer de huidige werkgroep "Medical Intelligence“
(project in de huizen)
• Integratie van de bestaande activiteiten en voorzieningen op dit gebied van de landelijke
programma’s zoals PSI, CTMM-TraIT, BBMRI-NL en Mondriaan resp. van de Europese
programma’s (m.n. ESFRI- en IMI-projecten BioMedBridges)
• Inventarisatie en daarna delen van lokale oplossingen en best practices bij de UMC's.
• Implementatie van data en metastandaarden zoals gedefinieerd in WP 2 (architectuur)
• Ontwikkeling van eenduidig en breed gedragen data governance model voor uitgifte en
gebruik van data.
20
Werkpakket 4: Vinden van en toegang tot data and
samples (catalogi)
Doel
Vindbaar maken van samples resp. gegevens voor onderzoek in de Nederlandse
biobanken en onderzoeksdatabases
Resultaat
•
•
•
•
Aanpak
• Verdere ontwikkeling catalogus software in nauwe samenwerking met NL en EU partner
projecten (zoals LifeLines , CTMM / TraIT, PSI, Mondriaan) .
• Uitbreiding van huidige BBMRI-NL Catalogus 2.0 tot een niveau 3 catalogus (d.w.z. met
inbegrip van de dataomschrijvingen en een geaggregeerd overzicht van beschikbare
data en samples)
• Inrichten data governance: standaard procedure(s ) voor verwerking, uitlevering en
gebruik van data.
• Ontwikkeling van interfaces om zoeken over meerdere catalogi mogelijk te maken (bijv.
op internationaal niveau)
• Ondersteuning van deelnemende biobanken bij het voeden van de catalogus
• Inventarisatie huidige aanvraagprocedures en ontwikkeling geharmoniseerde aanvraag ,
zodat één aanvraag bij meerdere biobanken tegelijk kan worden gedaan..
Bepalen van standaard model en formaat voor de inrichting van de catalogi
Bepalen van standaard software voor biobanken om de benodigde informatie te delen
SOP's voor en ondersteuning bij het laden van deze gegevens door biobanken
Harmonisatie van de aanvraag procedures voor het verkrijgen van gegevens
21
Werkpakket 5: Gebruik van EPD in onderzoek
Doelen
• Meer en effectiever onderzoek door toegang tot EPD gegevens
• Verminderen patiëntbelasting door de dataverzameling t.b.v. onderzoek
• Efficiëntere dataverzameling door het voorkomen van overtypen
Resultaten
• Afspraken over de inrichting van de EPD’s zodat:
• gegevens zo worden vastgelegd dat deze voor onderzoek bruikbaar zijn (in
samenhang met het programma ‘Registratie aan de bron’);
• Eisen en wensen van onderzoek worden meegenomen bij de modellering van data
en metadata (o.m. in de klinische bouwstenen)
• kwaliteitseisen aan gegevens uniform worden toegepast;
• processen rond data-uitlevering, terugkoppeling van toevalsbevindingen en
monitoring op elkaar zijn afgestemd.
• Uniform pakket van eisen, waarnaar leveranciers zich zouden moeten richten
• Klinische bouwstenen specifiek voor onderzoek
Aanpak
•
•
•
•
•
•
Inrichten projectorganisatie in nauw overleg met Registratie aan de bron
Analyse van eisen en wensen onderzoekers
Afstemming met stakeholders
Afspraken met huizen en leveranciers
Uitvoering van pilot projecten om best practices te ontwikkelen
Ontwikkeling klinische bouwstenen
22
Werkpakket 6: Good Research Practice: security,
privacy protection en Informed consent
Doelen
• Data-opslag en transport tussen de UMC's en projectleden van multi-center studies is
veilig: gegevens zijn gepseudonimiseerd / anoniem voor onderzoekers en zo nodig
herleidbaar via de behandelend arts
• Koppelen van datasets op Nederlandse en Europese schaal is mogelijk dankzij
gestandaardiseerde TTP diensten
Resultaten
• NEN-norm voor pseudonimisatie diensten
• TTP service voor multi-center studies, op basis van een integratie van de huidige TTP
diensten
• NFU Richtlijn Veiligheid, Veiligheid en Bescherming van de privacy
Aanpak
• Inrichting project team TTP’s vanuit de huidige teams van CTMM / TraIT, PSI en
Mondriaan
• Start en uitvoering NEN standaardisatietraject pseudonimisatiediensten.
• Inrichting project team Good Research Practice op basis van de huidige Special Interest
Group Informatiebeveiliging (NFU / SURF), uit te breiden met relevante specialisten op
het gebied van informatiebeveiliging en privacyaspecten
23
Werkpakket 7: Faciliteiten voor high-throughput data
processing
Doelen
•
•
•
•
Resultaten
• Toegang tot een landelijk netwerk van HPC clusters voor onderzoekers
• Opvang van pieken in rekenbehoefte door koppeling van de HPC clusters
• ‘Virtuele HPC clusters’ die ook voor privacy gevoelige informatie kunnen worden
gebruikt
Aanpak
• Projectorganisatie op basis van huidige werkgroepen bij BBMRI, DTL en AcZie / TacZie
• Ontwikkel procedures om de barrières weg te nemen bij het uitwisselen van data tussen
de HPC clusters
• Maak de HPC clusters toegankelijk voor onderzoekers uit andere instituten
• Koppel en deel de verschillende HPC clusters om pieken in rekenbehoefte op te vangen
en zorg voor failover capaciteit als HPC voorzieningen in onderhoud zijn
• Harmonisatie van bestaande virtuele omgevingen en technieken om te komen tot
‘virtuele clusters’ waarop ook privacy gevoelige informatie kan worden verwerkt
Mogelijkheid tot gebruik van elkaars HPC clusters voor het opvangen van piekbelasting
Hergebruik en delen van big data analyse protocollen voor onderzoek en diagnostiek
Delen van implementatie van best practices en SOP's
Schaalvoordelen van gezamenlijke inkoop van hardware
24
Werkpakket 8: Afstemming aanvragen en
belangenbehartiging in Den Haag en Brussel
Doel
• Meer middelen voor de onderzoeksdata infrastructuur bij de UMC’s uit Nederlandse en
EU fondsen
• Politieke besluiten in Den Haag als Brussel die bijdragen aan het verder ontwikkelen van
de onderzoeksdata infrastructuur
Resultaten
• Betere en meer consistente positionering van de UMC’s bij calls op het gebied van de
onderzoeksdata infrastructuur in de life sciences, zowel in Nederland als in Europa
• Actieve betrokkenheid bij de voorbereidingen van calls op het gebied van de
onderzoeksdata infrastructuur in Nederland en Europa
• Actieve lobby bij Nederlandse en Europese politiek
Aanpak
• Ondersteuning van toponderzoekers die actief zijn in het NL en EU netwerk door:
- actuele informatie over kansen, bedreigingen en relevante spelers in het nationale en
internationale speelveld;
- ondersteuning bij het schrijven van aanvragen, brieven en andere vormen van
communicatie;
- informatie over visie en beleidskeuzes in het kader van het programma
Onderzoeksdata infrastructuur;
- waar nodig partijen te stimuleren resp. te betrekken om aanvragen te doen of een
bijdrage te leveren aan de politieke discussie.
25
Werkpakket 9: Coördinatie van toegang tot expertise
en support
Doel
Onderzoekers worden optimaal ondersteund op het gebied van datamanagement
(waaronder methodologie, analyse, gebruik specifieke tools)
Resultaten
• Experts met relevante kennis over datamanagement zijn vindbaar en toegankelijk voor
onderzoekers
• Kennis over de nieuwste ontwikkelingen wordt actief getraind
• Ondersteuning van onderzoekers met gespecialiseerde kennis is een gerespecteerde
carrièrepad in de UMC’s
• Professionalisering van herbruikbare tools.
• Best practices in data management worden geïdentificeerd en gedeeld
Aanpak
• Identificeer de verschillende servicedesks in de UMC’s
• Creëer een landelijk team van coördinatoren, die deelnemen in het DTL | Data
programma
• Harmoniseer procedures en aanpak bij de diverse service desk
• Zorg dat doorverwijzing naar een specialist in een ander huis mogelijk wordt
• Identificeer trainingsbehoeftes en zorg dat hieraan wordt beantwoord in het
DTL|Learning program.
• Inventariseer best practices en faciliteer het delen daarvan binnen de service desks
• Identificeer relevante tools die van belang, zorg voor een professionele doorontwikkeling
en zorg dat onderzoekers deze kunnen vinden en gebruiken
• Meet het aantal en type van de aanvragen aan de servicedesks, zodat het mogelijk is de
behoefte op een continue basis te beoordelen en het netwerk van deskundigheid
dienovereenkomstig aan te passen.
26
Werkpakket 10: Public relations and
communications
Doel
Beïnvloeding van het publieke en politieke debat ten gunste van de ontwikkeling van
de onderzoeksdata infrastructuur voor biomedisch onderzoek
Resultaat
Meer kennis en een beter onderbouwde opinie bij publiek en politici over het gebruik van
gegevens in medisch-wetenschappelijk onderzoek.
Aanpak
• Ontwikkel een communicatiestrategie en –plan en creëer een team met
communicatiespecialisten uit de UMC’s
• Betrek daarbij patiëntenverenigingen en collectebusfondsen.
• Werk hierin samen met het programma ‘Registratie aan de bron’, die een vergelijkbaar
belang heeft.
• Voer het communicatieplan uit in nauwe afstemming met de betrokken partners
27