Skip to Main content Skip to Navigation
Master thesis

Mise au point d’un pipeline bioinformatique de détection de méthylation de l’ADN chez deux espèces d’arbres : le peuplier & le chêne

Résumé : Le peuplier et le chêne sont deux espèces d'arbres pérennes capables de s'adapter aux variations environnementales. Ils subissent le réchauffement climatique qui s'est amorcé il y a 180 ans. De nombreuses études ont montré que le phénotype d'un individu résulte à la fois de sa constitution génétique et de l'effet de son environnement. L'impact de l’environnement (température, sécheresse, etc.) sur l'expression des gènes se traduit notamment par des modifications des marques épigénétiques qui jouent ainsi un rôle dans la plasticité phénotypique des arbres. Aujourd'hui, grâce à des techniques de séquençage à haut débit devenues suffisamment accessibles, il est possible d'étudier les marques épigénétiques au niveau de génomes complets. Les techniques d'étude de la méthylation par séquençage telles que le WGBS (Whole Genome Sequencing Bisulfite) et le MC-Seq (Methylation Capture Sequencing) sont des applications récentes du séquençage NGS qui permettent la détection de la méthylation à un très haut niveau de résolution. Le traitement au bisulfite de sodium qui consiste en la conversion des cytosines non méthylées en uracile rend possible la détection différentielle des deux types de cytosine dans l'ADN. Le développement de ces nouvelles technologies de biologie moléculaire rend indispensable l'adaptation des outils bio-informatiques à l'analyse de données de séquençage de méthylation. Dans le cadre du projet ANR EpiTree portant sur l’étude de l’impact des variations environnementales sur le chêne et le peuplier, j'ai développé un pipeline bioinformatique de détection de méthylation de l'ADN. Ce pipeline comprend 6 étapes: (1) nettoyage des données brutes suivi d'un contrôle qualité, (2) alignement sur un génome de référence, (3) élimination des duplications, (4) détection des cytosines méthylées (mC) dans les trois contextes de méthylation, (5) extraction par contexte et (6) quelques analyses statistiques de base sur la détection des méthylations. Ce pipeline est implémenté sous snakemake et il est fonctionnel sur le cluster de calcul du CEA. Compte tenu du coût du séquençage bisulfite du génome complet (WGBS), j'ai testé la possibilité de limiter l'étude des taux de méthylations de l'ADN à un sous-ensemble du génome (MC-Seq) correspondant à des zones d'intérêt définies par les collaborateurs du projet Epitree. Pour ce faire, j'ai comparé les résultats obtenus après séquençage de ces zones d'intérêt par les 2 approches : 1 WGBS et 18 MC-Seq. Cette comparaison m'a permis de contribuer à l'identification des conditions expérimentales de MC-Seq les moins onéreuses qui seront utilisées pour étudier 500 individus de chêne et de peuplier. De même, les niveaux de méthylationdétectés à partir de séquençage MC-Seq chez ces individus seront obtenus à l'aide du pipeline que j'ai développé.
Complete list of metadata

https://hal.inrae.fr/hal-03278099
Contributor : Odile Rogier <>
Submitted on : Monday, July 5, 2021 - 12:34:35 PM
Last modification on : Thursday, July 22, 2021 - 3:50:18 AM

File

Rapport_Stage_M2_Abdeljalil_Se...
Files produced by the author(s)

Identifiers

  • HAL Id : hal-03278099, version 1

Collections

Citation

Abdeljalil Senhaji Rachik. Mise au point d’un pipeline bioinformatique de détection de méthylation de l’ADN chez deux espèces d’arbres : le peuplier & le chêne. Bio-Informatique, Biologie Systémique [q-bio.QM]. 2021. ⟨hal-03278099⟩

Share

Metrics

Record views

31

Files downloads

22