Contexte :
Un des enjeux de la biologie végétale est d’étudier, voire de prédire la capacité des plantes à s’adapter à des stress en s’appuyant sur des données génétiques, génomiques et environnementales. Pour y parvenir les chercheurs étudient des collections de ressources génétiques représentant la diversité existante d’une espèce et souhaitent disposer de connaissances intégrées aussi exhaustives que possible sur chacune des accessions/ressources génétiques de ces collections.
L’URGI est une unité de recherche basée sur le centre INRAE de Versailles-Saclay, dont un agent est missionné au sein du CNRGV sur le centre INRAE de Toulouse. Elle développe des approches basées sur les graphes de connaissances permettant d’intégrer des données hétérogènes dans l’optique d’apporter un appui efficace et rapide en termes d’exploration de données à la communauté scientifique.
L’objectif du stage proposé sera de poursuivre le développement d’une base graphe débuté en 2025 et de l’enrichir avec des nouvelles données. Cet outil doit mettre en relation des ressources génétiques d’un large panel d’espèces de plantes d’intérêt (blé, vigne, peuplier, chêne …) avec des données de caractérisation provenant de jeux de données hétérogènes (génomique, génétique, phénomique, biblio ...).
La stage se déroulera en 3 temps :
Objectifs :
Intégration des données hétérogènes, dans une base de données NoSQL.
Ces données hétérogènes hébergées au laboratoire et dans des entrepôts publics devront être traitées pour être insérées dans une base pilote pour faciliter l’intégration, l’enrichissement des données et leur exploitation.
Le(a) candidat(e) devra enfin pouvoir proposer une automatisation de l’insertion des données en base et des visualisations permettant une interrogation accessible et reproductible.
Compétences techniques recherchées :
• Maîtrise des commandes UNIX (shell), de la programmation python, java et javascript.
• Connaissance en SGBD, connaissance du NoSQL sera un plus.
• Connaissance de la technologie Docker souhaitable
Références bibliographiques (facultatif) :
https://doi.org/10.3389/frai.2023.1191122
Ce sujet constitue un premier pas vers un travail de thèse : Non
Date de début du stage et durée estimée du stage :
A partir de début 2026 de 6 mois.
Montant (brut mensuel) de la rémunération proposée :
Indemnité de stage selon barème en vigueur (environ 550 euros net par mois)
Date de la proposition de stage et date limite de candidature :
Proposition de stage fin septembre 2025
Date limite fin décembre 2025