De nombreuses ressources génétiques, génomiques et -omiques sont disponibles chez Brachypodium distachyon. Pour autant il n’est pas aisé de croiser ces données pour identifier les mécanismes régulateurs de gènes et réseaux de gènes d’intérêts.
Croiser les connaissances fournies par les séquences des génomes de Brachypodium distachyon, avec celles fournies par des approches de génétique quantitative, de détection de polymorphismes (CNV), de données d’annotations (ETs, TFBS, facteur de transcription) et de transcriptomique, pourrait permettre de mettre en évidence les déterminants génétiques et moléculaires régulant des caractères d’intérêt.
Ce stage s’inscrit dans cette dynamique et plus particulièrement sur le rôle des éléments transposables dans l’adaptation de leur hôte à des conditions environnementales changeantes.
Objectifs : Intégration des données hétérogènes produites chez Brachypodium distachyon, dans une base de données de type « graphe » (Neo4j). Ces données générées au laboratoire et issues de bases publiques devront être traitées pour être insérées dans une base pilote sur la thématique de l’adaptation aux conditions environnementales fluctuantes. Le(a) candidat(e) devra enfin pouvoir proposer une automatisation de l’insertion des données en base et des visualisations permettant une interrogation accessible et reproductible.
Travail demandé :
Le(a) candidat(e) devra analyser des données -omiques pour différents génomes de Brachypodium distachyon disponibles pour notamment extraire des informations de co-localisation entre différentes sources de données.
Il(elle) travaillera à les insérer dans une base graphe et mettre en place un pipeline d'analyse et de formattage pour automatiser cette démarche pour d'autres organismes.
Le(a) stagiaire acquerra des compétences en développement de pipelines et d’annotation des génomes dans un contexte « big data » où plusieurs génomes sont à annoter simultanément ainsi que sur les systèmes de gestion de données basé sur les graphes.
Compétences techniques recherchées :
• Maitrise des commandes UNIX (shell) et de la programmation python.
• Connaissance en SGBD souhaitable notamment NoSQL.
• Connaissance de la technologie Docker souhaitable
Numéro(s) de téléphone où l’on peut la joindre : 01 30 83 38 03
Adresse électronique : nicolas.francillonne@inrae.fr
Autre(s) encadrant(s) : johann.confais@inrae.fr