SNP discovery and validation from RNA-seq data in black poplar - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Poster De Conférence Année : 2017

SNP discovery and validation from RNA-seq data in black poplar

Découverte et analyse de polymorphismes SNPs issus de RNA-seq chez le peuplier noir

Résumé

Le peuplier noir (Populus nigra) est une espèce majeure de la forêt alluviale en Europe occidentale et un support de la biodiversité écosystémique. Pour explorer les composantes de la variabilité génétique au sein de cette espèce parentale de peupliers hybrides commerciaux, nous avons initié une approche intégrative combinant des données génomiques, transcriptomiques et phénotypiques dans une vaste collection d'individus échantillonnés à partir de populations naturelles et évalués dans un même site expérimental. De par leur grande abondance et facilité d’accès par séquençage, les SNPs (Single Nucleotide Polymorphisms) sont des marqueurs moléculaires de choix pour les études de génétique quantitative (incluant les études d’association), de génétique des populations ou de sélection génétique. Chez le peuplier noir, si les premières études de polymorphismes de séquence se sont focalisées sur le reséquençage de quelques gènes candidats [1,2,3] ou sur l’identification de variants rares [4], des travaux plus récents se sont intéressés à une analyse plus globale avec le développement d’une puce de génotypage à partir de SNPs détectés par séquençage de génomes complets [5]. Nous rapportons ici l'analyse de polymorphismes SNPs dans des séquences transcrites produites par RNA-seq. Plus précisément, nous présentons un pipeline de détection et de typage de SNPs à partir de données RNA-seq ainsi que sa validation grâce à des données déjà existantes. L'ARN a été extrait à partir de jeune xylème et de cambium recueillis sur 24 arbres correspondant à 2 répétitions de 12 génotypes originaires de 6 populations naturelles représentatives de l’aire de distribution de l'espèce en Europe occidentale. Après quantification de l'ARN par tissu, les ARNs de xylème et de cambium du même arbre ont été mélangés et soumis à un séquençage à haut débit sur un HiSeq2000 d’Illumina (séquences pairées de 100 pb). Nous avons mis en place un pipeline de détection de SNPs à partir de données RNA-seq. Les séquences ont d'abord été nettoyées puis alignées sur le génome de référence (Populus trichocarpa). Ensuite, nous avons effectué un post-traitement des données d’alignement et nous avons lancé la découverte de variants à l’aide 3 outils en plusieurs modes, combinés à plusieurs paramètres de filtration. Les résultats obtenus par ces différentes techniques ont été comparés. Enfin, les SNPs détectés par les différents outils ont été annotés. Pour valider la technique, nous avons comparé les génotypes trouvés à des résultats de génotypage issus d’une puce Illumina Infinium 12k fournissant 7 903 SNPs polymorphes et qui avait été utilisée pour génotyper une collection de peupliers noirs incluant nos 12 génotypes étudiés [5]. Le taux moyen de similarité de génotypage aux positions communes entre les SNPs de la puce et ceux trouvés par RNA-seq (d’un même individu) est supérieur à 98%. Ces résultats démontrent la faisabilité et l’intérêt du RNA-seq pour la découverte et le typage de SNPs dans des populations naturelles.

Domaines

Biotechnologies
Fichier principal
Vignette du fichier
Actes Jobim 2017_1 (19.71 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-02737565 , version 1 (02-06-2020)

Licence

Paternité - Partage selon les Conditions Initiales

Identifiants

  • HAL Id : hal-02737565 , version 1
  • PRODINRA : 401000

Citer

Odile Rogier, Souhila Amanzougarene, Marie-Claude Lesage Descauses, Sandrine Balzergue, Véronique Brunaud, et al.. SNP discovery and validation from RNA-seq data in black poplar. JOBIM 2017 - Journées Ouvertes Biologie Informatique Mathématiques, Jul 2017, Lille, France. 2017, JOBIM 2017 Journées Ouvertes Biologie Informatique Mathématiques. Actes. ⟨hal-02737565⟩
48 Consultations
129 Téléchargements

Partager

Gmail Facebook X LinkedIn More