Omnicrobe : une base de données d’habitats et de phénotypes microbiens
Résumé
Les phénotypes et les habitats microbiens ont été largement explorés au cours de ces 50 dernières années grâce à des inventaires d’espèces par des méthodes culturales ou impliquant du séquençage massif. Les phénotypes et les fonctionnalités assurés par les micro-organismes sont décrits aussi bien dans la littérature que dans des bases de données spécialisées. Ces données sont difficiles à atteindre et à croiser. Notre objectif était de (i) développer un pipeline bio-informatique (ii) de concevoir et d’implémenter une base de données - Omnicrobe- permettant un accès unifié à toutes ces données (iii) de valider biologiquement son usage.
Le pipeline extrait de l’ensemble du corpus PubMed, le nom vernaculaire des taxons microbiens (bactéries, levures, champignons, microalgues, virus), des habitats, des phénotypes, des fonctionnalités et des relations liant ces différentes entités, en utilisant des outils performants de fouille de texte automatisée. Les données des collections internationales du CIRM, de la DSMZ et de Genbank ont été ajoutées au jeu de données extraites. Les différentes entités ont été catégorisées en utilisant la taxonomie NCBI et une ontologie ad hoc des habitats et des phénotypes (http://agroportal.lirmm.fr/ontologies/ONTOBIOTOPE/, [1]). L’ensemble des données a été rassemblé, structuré et implémenté dans une base de données relationnelle publique (https://omnicrobe.migale.inrae.fr/) permettant des requêtes multi-critères sur mots clés via une interface graphique ainsi que l’accès direct aux résumés des articles dont est tirée l’information. Omnicrobe a été utilisé avec succès pour concevoir rapidement un ferment pour réaliser des yaourts à base de jus de soja [2], sur des critères d’innocuité et d’acidification. Outre son usage favorisant l’innovation alimentaire, Omnicrobe facilite la compréhension du fonctionnement des écosystèmes microbiens en affichant avec exhaustivité l’ensemble des phénotypes et des fonctionnalités des espèces présentes.
Origine | Fichiers produits par l'(les) auteur(s) |
---|