Mise au point d’un pipeline bioinformatique de détection de méthylation de l’ADN chez deux espèces d’arbres : le peuplier & le chêne - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Mémoire D'étudiant Année : 2021

Mise au point d’un pipeline bioinformatique de détection de méthylation de l’ADN chez deux espèces d’arbres : le peuplier & le chêne

Résumé

Le peuplier et le chêne sont deux espèces d'arbres pérennes capables de s'adapter aux variations environnementales. Ils subissent le réchauffement climatique qui s'est amorcé il y a 180 ans. De nombreuses études ont montré que le phénotype d'un individu résulte à la fois de sa constitution génétique et de l'effet de son environnement. L'impact de l’environnement (température, sécheresse, etc.) sur l'expression des gènes se traduit notamment par des modifications des marques épigénétiques qui jouent ainsi un rôle dans la plasticité phénotypique des arbres. Aujourd'hui, grâce à des techniques de séquençage à haut débit devenues suffisamment accessibles, il est possible d'étudier les marques épigénétiques au niveau de génomes complets. Les techniques d'étude de la méthylation par séquençage telles que le WGBS (Whole Genome Sequencing Bisulfite) et le MC-Seq (Methylation Capture Sequencing) sont des applications récentes du séquençage NGS qui permettent la détection de la méthylation à un très haut niveau de résolution. Le traitement au bisulfite de sodium qui consiste en la conversion des cytosines non méthylées en uracile rend possible la détection différentielle des deux types de cytosine dans l'ADN. Le développement de ces nouvelles technologies de biologie moléculaire rend indispensable l'adaptation des outils bio-informatiques à l'analyse de données de séquençage de méthylation. Dans le cadre du projet ANR EpiTree portant sur l’étude de l’impact des variations environnementales sur le chêne et le peuplier, j'ai développé un pipeline bioinformatique de détection de méthylation de l'ADN. Ce pipeline comprend 6 étapes: (1) nettoyage des données brutes suivi d'un contrôle qualité, (2) alignement sur un génome de référence, (3) élimination des duplications, (4) détection des cytosines méthylées (mC) dans les trois contextes de méthylation, (5) extraction par contexte et (6) quelques analyses statistiques de base sur la détection des méthylations. Ce pipeline est implémenté sous snakemake et il est fonctionnel sur le cluster de calcul du CEA. Compte tenu du coût du séquençage bisulfite du génome complet (WGBS), j'ai testé la possibilité de limiter l'étude des taux de méthylations de l'ADN à un sous-ensemble du génome (MC-Seq) correspondant à des zones d'intérêt définies par les collaborateurs du projet Epitree. Pour ce faire, j'ai comparé les résultats obtenus après séquençage de ces zones d'intérêt par les 2 approches : 1 WGBS et 18 MC-Seq. Cette comparaison m'a permis de contribuer à l'identification des conditions expérimentales de MC-Seq les moins onéreuses qui seront utilisées pour étudier 500 individus de chêne et de peuplier. De même, les niveaux de méthylationdétectés à partir de séquençage MC-Seq chez ces individus seront obtenus à l'aide du pipeline que j'ai développé.
Fichier principal
Vignette du fichier
Rapport_Stage_M2_Abdeljalil_Senhaji-Rachik.pdf (3.17 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03278099 , version 1 (05-07-2021)

Identifiants

  • HAL Id : hal-03278099 , version 1

Citer

Abdeljalil Senhaji Rachik. Mise au point d’un pipeline bioinformatique de détection de méthylation de l’ADN chez deux espèces d’arbres : le peuplier & le chêne. Bio-Informatique, Biologie Systémique [q-bio.QM]. 2021. ⟨hal-03278099⟩
261 Consultations
306 Téléchargements

Partager

Gmail Facebook X LinkedIn More