Accelerating metabolic models evaluation with statistical metamodels: application to Salmonella infection models - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Proceedings/Recueil Des Communications ESAIM: Proceedings and Surveys Année : 2023

Accelerating metabolic models evaluation with statistical metamodels: application to Salmonella infection models

David Sherman
  • Fonction : Auteur

Résumé

Mathematical and numerical models are increasingly used in microbial ecology to model the fate of microbial communities in their ecosystem. These models allow to connect in a mechanistic framework species-level informations, such as the microbial genomes, with macro-scale features, such as species spatial distributions or metabolite gradients. Numerous models are built upon specieslevel metabolic models that predict the metabolic behaviour of a microbe by solving an optimization problem knowing its genome and its nutritional environment. However, screening the community dynamics with these metabolic models implies to solve such an optimization problem by species at each time step, leading to a significant computational load further increased by several orders of magnitude when spatial dimensions are added. In this paper, we propose a statistical framework based on Reproducing Kernel Hilbert Space (RKHS) metamodels that are used to provide fast approximations of the original metabolic model. The metamodel can replace the optimization step in the system dynamics, providing comparable outputs at a much lower computational cost. We will first build a system dynamics model of a simplified gut microbiota composed of a unique commensal bacterial strain in interaction with the host and challenged by a Salmonella infection. Then, the machine learning method will be introduced, and particularly the ANOVA-RKHS that will be exploited to achieve variable selection and model parsimony. A training dataset will be constructed with the original system dynamics model and hyper-parameters will be carefully chosen to provide fast and accurate approximations of the original model. Finally, the accuracy of the trained metamodels will be assessed, in particular by comparing the system dynamics outputs when the original model is replaced by its metamodel. The metamodel allows an overall relative error of 4.71% but reducing the computational load by a speed-up factor higher than 45, while correctly reproducing the complex behaviour occurring during Salmonella infection. These results provide a proof-of-concept of the potentiality of machine learning methods to give fast approximations of metabolic model outputs and pave the way towards PDEbased spatio-temporal models of microbial communities and host-microbiota-pathogen interactions.
Les modèles numériques et mathématiques sont de plus en plus utilisés en écologie microbienne pour modéliser le devenir de communautés microbiennes dans leur écosystème. Ces modèles permettent de coupler, dans des modèles mécanistiques, des informations à l’échelle de l’espèce microbienne, telles que le génome, avec des mécanismes à plus larges échelles, telles que des distributions spatiales ou des gradients de métabolites. De nombreux modèles sont construits à partir de modèles métaboliques qui prédisent le comportement métabolique d’un microbe en résolvant un problème d’optimisation basé sur son génome et son environnement nutritionnel. Cependant, l’analyse de la dynamique des communautés à l’aide de ces modèles métaboliques implique la résolution de ce problème d’optimisation par espèce à chaque pas de temps, ce qui entraîne une charge de calcul importante qui augmente encore de plusieurs ordres de grandeur lorsque des dimensions spatiales sont ajoutées. Dans cet article, nous proposons un cadre statistique basé sur des métamodèles RKHS (Reproducing Kernel Hilbert Space) qui sont utilisés pour fournir des approximations rapides du modèle métabolique original. Le métamodèle peut remplacer l’étape d’optimisation dans la dynamique du système, fournissant des résultats comparables à un coût de calcul beaucoup plus faible. Nous commencerons par construire un modèle de dynamique des systèmes d’un microbiote intestinal simplifié composé d’une souche bactérienne commensale unique en interaction avec l’hôte et confronté à une infection par Salmonella . Ensuite, la méthode d’apprentissage automatique sera présentée, basée sur la méthode ANOVA-RKHS qui permer de sélectionner des variables et d’assurer ainsi la parcimonie du modèle. Un ensemble de données d’entraînement sera construit avec le système dynamique original et les hyperparamètres seront soigneusement choisis pour fournir des approximations rapides et précises. Enfin, la précision de ces métamodèles sera évaluée, notamment en comparant les résultats du système dynamique lorsque le modèle original est remplacé par son métamodèle. Le métamodèle permet une erreur relative globale de 4.71% tout en réduisant la charge de calcul par un facteur d’accélération supérieur à 45, tout en reproduisant correctement le comportement complexe qui se produit pendant l’infection par Salmonella . Ces résultats fournissent une preuve de concept de la potentialité des méthodes d’apprentissage automatique pour donner des approximations rapides des sorties de modèles métaboliques et ouvrent la voie à des modèles spatio-temporels de communautés microbiennes basés sur les EDP, intégrant le métabolisme microbien et les interactions hôte-microbiote-pathogène.
Fichier principal
Vignette du fichier
main_final_version.pdf (1.55 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03635862 , version 1 (08-04-2022)
hal-03635862 , version 2 (30-08-2022)

Licence

Paternité

Identifiants

Citer

Clémence Frioux, Sylvie Huet, Simon Labarthe, Julien Martinelli, Thibault Malou, et al.. Accelerating metabolic models evaluation with statistical metamodels: application to Salmonella infection models. ESAIM: Proceedings and Surveys, 73, pp.187-217, 2023, CEMRACS 2021 - Data Assimilation and Reduced Modeling for High Dimensional Problems, ⟨10.1051/proc/202373187⟩. ⟨hal-03635862v2⟩
370 Consultations
182 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More