A high-resolution single-molecule sequencing-based Arabidopsis transcriptome using novel methods of Iso-seq analysis - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Article Dans Une Revue Genome Biology Année : 2022

A high-resolution single-molecule sequencing-based Arabidopsis transcriptome using novel methods of Iso-seq analysis

Runxuan Zhang
Richard Kuo
  • Fonction : Auteur
Max Coulter
  • Fonction : Auteur
Cristiane Calixto
  • Fonction : Auteur
Juan Carlos Entizne
  • Fonction : Auteur
Wenbin Guo
  • Fonction : Auteur
Yamile Marquez
  • Fonction : Auteur
Linda Milne
  • Fonction : Auteur
Stefan Riegler
  • Fonction : Auteur
Akihiro Matsui
  • Fonction : Auteur
Maho Tanaka
  • Fonction : Auteur
Sarah Harvey
  • Fonction : Auteur
Yubang Gao
  • Fonction : Auteur
Theresa Wießner-Kroh
  • Fonction : Auteur
Alejandro Paniagua
  • Fonction : Auteur
Katherine Denby
  • Fonction : Auteur
Asa Ben Hur
  • Fonction : Auteur
Enamul Huq
  • Fonction : Auteur
Michael Jantsch
  • Fonction : Auteur
Artur Jarmolowski
  • Fonction : Auteur
Tino Koester
  • Fonction : Auteur
Sascha Laubinger
  • Fonction : Auteur
Qingshun Quinn Li
  • Fonction : Auteur
Lianfeng Gu
  • Fonction : Auteur
Motoaki Seki
  • Fonction : Auteur
Dorothee Staiger
  • Fonction : Auteur
Ramanjulu Sunkar
  • Fonction : Auteur
Zofia Szweykowska-Kulinska
  • Fonction : Auteur
Shih-Long Tu
  • Fonction : Auteur
Andreas Wachter
  • Fonction : Auteur
Robbie Waugh
  • Fonction : Auteur
Liming Xiong
  • Fonction : Auteur
Xiao-Ning Zhang
  • Fonction : Auteur
Ana Conesa
  • Fonction : Auteur
Anireddy Reddy
  • Fonction : Auteur
Andrea Barta
  • Fonction : Auteur
Maria Kalyna
  • Fonction : Auteur
John Brown
  • Fonction : Auteur

Résumé

Abstract Background Accurate and comprehensive annotation of transcript sequences is essential for transcript quantification and differential gene and transcript expression analysis. Single-molecule long-read sequencing technologies provide improved integrity of transcript structures including alternative splicing, and transcription start and polyadenylation sites. However, accuracy is significantly affected by sequencing errors, mRNA degradation, or incomplete cDNA synthesis. Results We present a new and comprehensive Arabidopsis thaliana Reference Transcript Dataset 3 (AtRTD3). AtRTD3 contains over 169,000 transcripts—twice that of the best current Arabidopsis transcriptome and including over 1500 novel genes. Seventy-eight percent of transcripts are from Iso-seq with accurately defined splice junctions and transcription start and end sites. We develop novel methods to determine splice junctions and transcription start and end sites accurately. Mismatch profiles around splice junctions provide a powerful feature to distinguish correct splice junctions and remove false splice junctions. Stratified approaches identify high-confidence transcription start and end sites and remove fragmentary transcripts due to degradation. AtRTD3 is a major improvement over existing transcriptomes as demonstrated by analysis of an Arabidopsis cold response RNA-seq time-series. AtRTD3 provides higher resolution of transcript expression profiling and identifies cold-induced differential transcription start and polyadenylation site usage. Conclusions AtRTD3 is the most comprehensive Arabidopsis transcriptome currently. It improves the precision of differential gene and transcript expression, differential alternative splicing, and transcription start/end site usage analysis from RNA-seq data. The novel methods for identifying accurate splice junctions and transcription start/end sites are widely applicable and will improve single-molecule sequencing analysis from any species.

Domaines

Biotechnologies

Dates et versions

hal-04313162 , version 1 (29-11-2023)

Identifiants

Citer

Runxuan Zhang, Richard Kuo, Max Coulter, Cristiane Calixto, Juan Carlos Entizne, et al.. A high-resolution single-molecule sequencing-based Arabidopsis transcriptome using novel methods of Iso-seq analysis. Genome Biology, 2022, 23 (1), pp.149. ⟨10.1186/s13059-022-02711-0⟩. ⟨hal-04313162⟩
5 Consultations
0 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More