DeepOmics, a Digital Environnemental Engineering Platform for Omics data
DeepOmics, un système d'information pour ingénierie environnementale pour les données omiques
Résumé
DeePomics, for Digital Environmental Engineering Platform for Omics Data, is an information system (IS) that meets the needs for 1) storing and querying data from environmental bioprocesses (such as anaerobic digestion, activated sludge etc... ) at the scale of laboratory reactors, pilots or industrial installations, 2) compare and cross-reference these operational data (or metadata) with data characterizing the microbial communities involved and their dynamics, to produce knowledge and 3) promote the production of FAIR data and interoperability with EnviBIS another IS (see poster ?).
Since the presentation of its prototype poster [1] at JOBIM 2020, DeepOmics has been in production, available at deepomics.inrae.fr (an authentification is required). It has evolved considerably functionally, structurally and in terms of the quantity of data captured.
These changes include A) continuous integration of developments, automation of IS deployment using Docker-containment, implementation of user interface testing and use of a directory federation for user authentication, B) functional innovations range from the opening of the API and the "semantization" of Symfony entities and services for ontology-based dialog with the EnviBIS IS, to the acceptance of paired fastq files, C) the entry of 25 projects corresponding to 47/7 experiments/measurement campaigns and 423 sample sequence files, and D) the creation of a DeepOmics logo and visual with the information and documentation site. site d’information et de documentation.
The perspectives include the development of an intra- and inter-project data query module to enable users to answer biological questions, a connector for the automatic deposit of sequences and their metadata into ENA, the possibility of integrating shotgun sequencing or metabolomics data, and finally an improved description of additional process categories, such as bioelectrochemical processes.
DeepOmics, pour Digital Environmental Engineering Platform for Omics Data, est un système d’information (SI) qui répond aux besoins de 1) stockage et interrogation de données issues de bioprocédés environnementaux (tels que la digestion anaérobie, les boues activées etc…) à l’échelle de réacteurs de laboratoire, de pilotes ou d’installation industrielles, 2) confronter et croiser ces données opérationnelles (ou méta-données) avec les données caractérisant les communautés microbiennes en jeu et leur dynamique pour produire des connaissances et 3) favoriser la production de données FAIR et l’interopérabilité avec d’autres SI tel que EnviBIS (voir poster ??).
Depuis la présentation de son prototype en poster [1] à l’édition de JOBIM 2020, DeepOmics est en production, accessible à l’adresse deepomics.inrae.fr . Il a considérablement évolué fonctionnellement, structurellement et en quantité de données saisies.
Les évolutions portent notamment sur A) l’intégration continue des développements, l’automatisation du déploiement du SI en utilisant de la containérisation (utilisation des Docker), mise en place du testing de l’interface utilisateur et utilisation d’une fédération d’annuaire pour l’authentification des utilisateurs, B) les nouveautés fonctionnelles vont de l’ouverture de l’API et la « sémantisation » des entités et services Symfony pour dialoguer avec le SI EnviBIS par ontologies, à l’acceptation des fichiers fastq pairés, C) la saisie de 25 projets correspondants à 47/7 expérimentations/campagnes de mesure et 423 fichiers de séquences d’échantillons et D) la création d’un logo, d’un visuel DeepOmics avec le site d’information et de documentation.
De nombreuses perspectives sont envisagées comme l’élaboration d’un module de requêtes des données intra et inter projets pour que les utilisateurs puissent répondre à des questions biologiques, un connecteur pour le dépôt automatique des séquences et leur méta-données vers ENA, la possibilité d’intégrer des données de type séquençage shotgun ou métabolomique, et enfin une description améliorée de catégories additionnelles de procédés, tels que les procédés bioélectrochimiques.
Origine | Fichiers produits par l'(les) auteur(s) |
---|