FROGS: Find, Rapidly, OTUs with Galaxy Solution
Résumé
Motivation: Metagenomics leads to major advances in microbial ecology and biologists need user friendly tools to analyze their data on their own. Results: This Galaxy-supported pipeline, called FROGS, is designed to analyze large sets of amplicon sequences and produce abundance tables of Operational Taxonomic Units (OTUs) and their taxonomic affiliation. The clustering uses Swarm. The chimera removal uses VSEARCH, combined with original cross-sample validation. The taxonomic affiliation returns an innovative multi-affiliation output to highlight databases conflicts and uncertainties. Statistical results and numerous graphical illustrations are produced along the way to monitor the pipeline. FROGS was tested for the detection and quantification of OTUs on real and in silico datasets and proved to be rapid, robust and highly sensitive. It compares favorably with the widespread mothur, UPARSE and QIIME.
Avec le séquençage haut-débit (454, MiSeq), les pipelines de traitements de séquençage d'ARNr 16S actuels produisent de gros jeu de données. Le calcul des tables d'abondances d'OTU et leur affiliation taxonomique peinent à s'exécuter et les solutions les plus efficaces sont souvent dédiées aux spécialistes. Dans ce contexte, nous avons développé le pipeline "FROGS" : « Find Rapidly OTU with Galaxy Solution ». Développé sous environnement Galaxy, "FROGS" intègre un outil de prétraitement des données permettant le contigage de séquences, le nettoyage des données et la suppression des chimères. La déréplication des séquences se fait par un script python. L'étape de clusterisation s'effectue avec le logiciel SWARM. Un outil d'assignation retourne l’affiliation taxonomique de chaque OTU en utilisant à la fois l'algorithme RDPClassifier et NCBI blast+ sur la banque de données Silva SSU 119. Enfin, un outil de post-traitement permet aux utilisateurs de traiter la table d'abondance obtenue avec les filtres habituels, fournit des résultats statistiques et des illustrations graphiques. FROGS a été développé pour traiter de grandes quantités de données par l'utilisation d’outils innovants et une conception optimisée. De plus, il est portable sur toutes les plateformes Galaxy avec le minimum de dépendances informatiques et architecturales. FROGS a été testé sur plusieurs jeux de données simulées. L'outil se montre extrêmement rapide, robuste et hautement sensible pour la détection des OTU avec très peu de faux-positifs comparé aux autres pipelines largement utilisés par la communauté.
Origine | Fichiers produits par l'(les) auteur(s) |
---|
Loading...