Intégration de données complexes et hétérogènes à partir de tableaux de tailles différentes - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Thèse Année : 2018

Intégration de données complexes et hétérogènes à partir de tableaux de tailles différentes

Résumé

Les avancées des nouvelles technologies de séquençage ont permis auxétudes cliniquesde produire des données volumineuses et complexes. Cette complexité se décline selon diverses modalités, notamment la grande dimension, l’hétérogénéité des données au niveaubiologique (acquises à différents niveaux de l’échelle du vivant et à divers moments del’expérience), l’hétérogénéité du type de données, le bruit (hétérogénéité biologique oudonnées entachées d’erreurs) dans les données et la présence de données manquantes (au niveau d’une valeur ou d’un individu entier). L’intégration de différentes données est donc un défi important pour la biologie computationnelle. Cette thèse s’inscrit dans un projet de recherche clinique sur l’obésité, DiOGenes, pour lequel nous avons fait des propositions méthodologiques pour l’analyse et l’intégration de données. Ce projet est basé sur une intervention nutritionnelle menée dans huit pays européens et vise à analyser les effets de différents régimes sur le maintien pondéral et sur certains marqueurs de risque cardio-vasculaire et de diabète, chez des individus obèses. Dans le cadre de ce projet, mes travaux ont porté sur l’analyse de données transcriptomiques (RNA-Seq) avec des individus manquants et sur l’intégration de données transcriptomiques (nouvelle technique QuantSeq) avec des données cliniques. La première partie de cette thèse est consacrée aux données manquantes et à l’inférence de réseaux à partir de données d’expression RNA-Seq. Lors d’études longitudinales transcriptomiques, il arrive que certains individus ne soient pas observés à certains pas de temps, pour des raisons expérimentales. Nous proposons une méthode d’imputation multiple hot-deck (hd-MI) qui permet d’intégrer de l’information externe mesurée sur les mêmes individus et d’autres individus. hd-MI permet d’améliorer la qualité de l’inférence de réseau. La seconde partie porte sur une étude intégrative de données cliniques et transcriptomiques (mesurées par QuantSeq) basée sur une approche réseau. Nous y montrons l’intérêt de cette nouvelle technique pour l’acquisition de données transcriptomiques et l’analysons par une approche d’inférence de réseau en lien avec des données cliniques d’intérêt.

Mots clés

Fichier principal
Vignette du fichier
AImbert-thesis_1.pdf (7.87 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-02786448 , version 1 (05-06-2020)

Licence

Paternité - Partage selon les Conditions Initiales

Identifiants

  • HAL Id : tel-02786448 , version 1
  • PRODINRA : 466834

Citer

Alyssa Imbert. Intégration de données complexes et hétérogènes à partir de tableaux de tailles différentes. Mathématiques [math]. Université Toulouse 1 Capitole, 2018. Français. ⟨NNT : ⟩. ⟨tel-02786448⟩
60 Consultations
75 Téléchargements

Partager

Gmail Facebook X LinkedIn More