Dzaleyeumo

Partage des données à l’Inra et sciences de
l’information
Odile Hologne, Directrice déléguée à l’Information Scientifique et Technique
Esther Dzalé Yeumo – Chef de projet Informatique/IST Inra
ALIMENTATION
Rencontre Inra-Inria, 04 juillet 2014
AGRICULTURE
ENVIRONNEMENT
Agriculture, Alimentation, Environnement : de
grands enjeux de recherche
§ Des enjeux de société …. :
§
§
§
§
Nourrir 9 milliard d’hommes
Changement climatique
Agriculture durable, éco-responsable
Santé et nutrition
§ Dans un contexte de science numérique :
§ Big data, données hétérogènes
§ Data-driven science
§ Accès à des informations produites par d’autres (publications et données)
§ Avec différents points de vue :
§
§
§
§
§
§
§
Politique
Technique
Disciplines scientifiques
Juridique
Economique
Ethique
Citoyen
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
Libre accès aux publications : voie verte et dorée
§ Signature de la déclaration de Berlin en 2004
§ Voie verte
§ Archive institutionnelle :
§ Interconnectée à HAL
§ Et à d’autres portails
§ Archivage des revues sur HAL http://hal.archives-ouvertes.fr/ARINRA
§ Voie dorée
§
§
§
§
2 revues Inra chez Biomed Central
GIE éditions Quae : ouvrages en open access
Adhésion à PloS et Biomed Central -> réductions pour publier
12% des articles Inra dans le WoS sont publiés dans des revues « dorées »
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
Partage des données à l’Inra: chronologie
2009: le CS
s’interroge
2011-2012: le CS
instruit la question
• Politique BBSRC
• Domaine
biologie/bioinformatique
• Contexte production
massive de données
• Groupe de travail piloté
par D. Pontier
• 9 recommandations pour
l’Inra
Fin 2012:
élaboration d’une
politique
• 11 principes pour mieux
gérer et partager les
données de la recherche
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
Avril 2013:
lancement des
chantiers de mise en
œuvre
• 3 chantiers disciplinaires
• Chantier juridique
• Chantiers techniques
(méthodes et outils)
• Chantier compétences
Chantiers disciplinaires – exemple d’analyse
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
Développement d’une offre de service
v identifiants, DOI
v Annuaire des ressources Inra
v Entrepôts de données et interopérabilité
v Plan de gestion des données (standard et
disciplinaire)
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
6
Des infrastructures de recherche
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
7
Chantiers juridique et compétences
v Animé par l'Inra
ü un groupe inter-organismes
ü des livrables :
• Guide pratique
• Articles types pour les contrats
• Licences types
vCompétences : GPEC « Ingénierie de la
donnée à la connaissance »
ü informaticiens, chercheurs, IST
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
8
Ethique du partage des données
v Commande des présidents Inra et Cirad au
comité d’éthique
v calendrier : 2014-2015 (lancement 4/7/14)
v Quelques facettes :
ü anonymisation des données personnelles
ü éthique du partage
ü conséquences d’une « data-driven » science
ü crowdsourcing, citizen science : retour vers le
citoyen
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
9
Partage des données et sciences de
l’information
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
Créer et renforcer des synergies entre:
vCréateurs de données
ü Scientifiques ayant un domaine d’expertise conduisant à la
production de données
vModélisateur
ü Statistiticien, (bio-)informaticien, data scientist impliqués dans
le traitement et l’analyse des données, la modélisation
conceptuelle de bases de données
vGestionnaire de données
ü Ingénieurs en charge du stockage et de l’archivage
vCurateur de métadonnées
ü Venant plutôt de la documentation, en charge de la qualité des
métadonnées et de la maintenanceA Ldes
référentiels
IMENTATION
AGRICULTURE
ENVIRONNEMENT
Partage des données et IST
vGestion des données
üCurateur de métadonnées (data librarian): en charge
de la qualité des métadonnées, et de la maintenance
des référentiels
üData curator : data librarian + prise en charge du
stockage, de l’archivage et plus généralement de la
préservation des données, gestion des identifiants
üWeb de données : identification/évaluation de
ressources pertinentes, conception d’ontologies
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
Partage des données et IST
vValorisation des données
üDiffusion des métadonnées, promotion des
ressources produites, développement de
partenariats
vInformation/formation des chercheurs
üÉlaboration de plans de gestion des données
üPolitique des éditeurs
üStratégies de publication
• Data journals
• Intégration publications/données
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
Comment l’IST de l’Inra s’implique dans le
mouvement du partage des données
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
Publications : prendre en compte les
données
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
15
Du projet interne aux projets internationaux
v Axe technique : participation à
RDA « Research Data Alliance »
v Axe « Agro » : participation à GODAN
« Global Open Data for Agriculture and
Nutrition »
v Axe politique : participation à Science
Europe
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
16
Research Data Alliance
v Lancé en mars 2013 par Commission européenne, NSF, Australie
v Contribution à la création de 2 groupes (intérêt, travail)
The Research Data Alliance aims to accelerate
and facilitate research data sharing and
exchange
Co chair : E. Dzalé (IST Inra), R. Fulss (CYMMIT)
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
CIARD / GODAN
v GODAN « global open data for agriculture and nutrition »,
issu du G8+5 « open data for agriculture »
v CIARD et
v Meeting à la FAO en avril
ü projet de Data Journal
ü Global Acricultural Concept Scheme (alignement d’AGROVOC,
NALT, CABT)
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
18
Working group on Research
data
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
19
Pour conclure
v Rôle des financeurs : incitation au partage, bonnes pratiques (plan de gestion des données
…)
ü Commission Européenne : H2020
ü France : ANR, Investissements d’avenir …
v Situer notre action à différentes échelles :
ü
ü
ü
Institutionnelle : chantiers Inra
Nationale : juridique, bsn10, infrastructures (data centers, cloud)
Internationale : RDA (technique), GODAN (Agro), Science Europe (Politique)
v Enjeux « techno »: Articuler « Recherche en science information, infrastructures
informatiques et information scientifique (données et publi) »
v Prendre en compte le partage dés la conception des projets
v Besoin d’incitations (reconnaissance, évaluation) et de financements
v Besoin de « success stories », communication
v Développement des compétences pour une science numérique
v Ne pas oublier que les enjeux sont scientifiques : Accès et Analyse, transparence, qualité
….
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT
20
Merci!
ALIMENTATION
AGRICULTURE
ENVIRONNEMENT