CONTACT  |  SITE MAP  |  ABOUT US  |  TEAM   
Go to GnpIS Go to WheatIS Go to faidare Go to repet tool Go to RepetDB
You are here : Home / Home URGI / About us / News / 2026 internship

News

13 Oct 2025 2026 internship position

Contexte :

 

Un des enjeux de la biologie végétale est d’étudier, voire de prédire la capacité des plantes à s’adapter à des stress en s’appuyant sur des données génétiques, génomiques et environnementales. Pour y parvenir les chercheurs étudient des collections de ressources génétiques représentant la diversité existante d’une espèce et souhaitent disposer de connaissances intégrées aussi exhaustives que possible sur chacune des accessions/ressources génétiques de ces collections. 

 

L’URGI est une unité de recherche basée sur le centre INRAE de Versailles-Saclay, dont un agent est missionné au sein du CNRGV sur le centre INRAE de Toulouse. Elle développe des approches basées sur les graphes de connaissances permettant d’intégrer des données hétérogènes dans l’optique d’apporter un appui efficace et rapide en termes d’exploration de données à la communauté scientifique. 

 

L’objectif du stage proposé sera de poursuivre le développement d’une base graphe débuté en 2025 et de l’enrichir avec des nouvelles données. Cet outil doit mettre en relation des ressources génétiques d’un large panel d’espèces de plantes d’intérêt (blé, vigne, peuplier, chêne …) avec des données de caractérisation provenant de jeux de données hétérogènes (génomique, génétique, phénomique, biblio ...).

La stage se déroulera en 3 temps : 

 

  • Deux outils NoSQL sont actuellement employés à l’URGI pour intégrer des données hétérogènes : ElasticSearch (orienté document) et Neo4J (orienté graphe). Déterminer l’outil le plus pertinent pour requêter les informations associées aux ressources génétiques et si oui, lequel ?
  • Intégrer les informations dans la solution validée
  • Développer une interface pour permettre l’interrogation des données et l’affichage des résultats.

 

 

Objectifs :

Intégration des données hétérogènes, dans une base de données NoSQL.

Ces données hétérogènes hébergées au laboratoire et dans des entrepôts publics devront être traitées pour être insérées dans une base pilote pour faciliter l’intégration, l’enrichissement des données et leur exploitation.

Le(a) candidat(e) devra enfin pouvoir proposer une automatisation de l’insertion des données en base et des visualisations permettant une interrogation accessible et reproductible.

 

Compétences techniques recherchées :

• Maîtrise des commandes UNIX (shell), de la programmation python, java et javascript.

• Connaissance en SGBD, connaissance du NoSQL sera un plus.

• Connaissance de la technologie Docker souhaitable

Références bibliographiques (facultatif) :

https://doi.org/10.3389/frai.2023.1191122  

 

Ce sujet constitue un premier pas vers un travail de thèse : Non 

 Date de début du stage et durée estimée du stage :

 

A partir de début 2026 de 6 mois.

 

Montant (brut mensuel) de la rémunération proposée :

Indemnité de stage selon barème en vigueur (environ 550 euros net par mois)

 

Date de la proposition de stage et date limite de candidature :

Proposition de stage fin septembre 2025

Date limite fin décembre 2025


Creation date: 13 Oct 2025