rANOMALY: AmplicoN wOrkflow for Microbial community AnaLYsis - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement
Article Dans Une Revue F1000Research Année : 2021

rANOMALY: AmplicoN wOrkflow for Microbial community AnaLYsis

Résumé

Bioinformatic tools for marker gene sequencing data analysis are continuously and rapidly evolving, thus integrating most recent techniques and tools is challenging. We present an R package for data analysis of 16S and ITS amplicons based sequencing. This workflow is based on several R functions and performs automatic treatments from fastq sequence files to diversity and differential analysis with statistical validation. The main purpose of this package is to automate bioinformatic analysis, ensure reproducibility between projects, and to be flexible enough to quickly integrate new bioinformatic tools or statistical methods. rANOMALY is an easy to install and customizable R package, that uses amplicon sequence variants (ASV) level for microbial community characterization. It integrates all assets of the latest bioinformatics methods, such as better sequence tracking, decontamination from control samples, use of multiple reference databases for taxonomic annotation, all main ecological analysis for which we propose advanced statistical tests, and a cross-validated differential analysis by four different methods. Our package produces ready to publish figures, and all of its outputs are made to be integrated in Rmarkdown code to produce automated reports.
Les outils bioinformatiques pour l'analyse des données de séquençage des gènes marqueurs évoluent continuellement et rapidement, ce qui rend difficile l'intégration des techniques et des outils les plus récents. Nous présentons un package R pour l'analyse des données du séquençage basé sur les amplicons 16S et ITS. Ce workflow est basé sur plusieurs fonctions R et effectue des traitements automatiques depuis les fichiers de séquence fastq jusqu'à la diversité et l'analyse différentielle avec validation statistique. L'objectif principal de ce package est d'automatiser l'analyse bioinformatique, d'assurer la reproductibilité entre les projets et d'être suffisamment flexible pour intégrer rapidement de nouveaux outils bioinformatiques ou méthodes statistiques. rANOMALY est un package R facile à installer et personnalisable, qui utilise le niveau des variants de séquence d'amplicon (ASV) pour la caractérisation de la communauté microbienne. Il intègre tous les atouts des dernières méthodes bioinformatiques, comme un meilleur suivi des séquences, la décontamination à partir d'échantillons de contrôle, l'utilisation de plusieurs bases de données de référence pour l'annotation taxonomique, toutes les principales analyses écologiques pour lesquelles nous proposons des tests statistiques avancés, et une analyse différentielle à validation croisée par quatre méthodes différentes. Notre package produit des chiffres prêts à publier, et toutes ses sorties sont conçues pour être intégrées dans le code Rmarkdown afin de produire des rapports automatisés.
Fichier principal
Vignette du fichier
2021_Theil_F1000_Res.pdf (3.86 Mo) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03536651 , version 1 (20-01-2022)

Licence

Identifiants

Citer

Sebastien Theil, Etienne Rifa. rANOMALY: AmplicoN wOrkflow for Microbial community AnaLYsis. F1000Research, 2021, 10, pp.7. ⟨10.12688/f1000research.27268.1⟩. ⟨hal-03536651⟩
124 Consultations
215 Téléchargements

Altmetric

Partager

More