Accéder directement au contenu Accéder directement à la navigation
Thèse

Process segmentation/clustering. Application to the analysis of CGH microarray data.

Résumé : Dans cette thèse nous proposons un nouveau modèle statistique pour l'analyse des problèmes de segmentation/classification dont l'objectif
est de partitionner des données en zones homogènes, et de regrouper ces zones en un nombre fini de classes. Les problèmes de segmentation/classification sont traditionnellement étudiés à l'aide
des modèles de chaînes de Markov cachées. Nous proposons un modèle alternatif qui combine un modèle de segmentation et un modèle de mélange.

Nous construisons notre modèle dans le cas gaussien et nous proposons une généralisation à des variables discrètes dépendantes. Les paramètres de ce modèle sont estimés par maximum de vraisemblance à l'aide d'un algorithme hybride fondé sur la programmation dynamique et sur l'algorithme EM. Nous abordons un nouveau problème de sélection de modèle qui est la sélection simultanée du nombre de groupes et du nombre de segments et proposons une heuristique pour ce choix.

Notre modèle est appliqué à l'analyse de données issues d'une nouvelle technologie, les microarrays CGH (Comparative Genomic Hybridization). Cette technique permet de compter le nombre de milliers de gènes le long du génome en une seule expérience. L'application de notre méthode à ces données permet de localiser des zones délétées ou amplifiées le long des chromosomes. Nous proposons également une application à l'analyse des séquences d'ADN pour l'identification de régions homogènes en terme de composition en nucléotides.
Type de document :
Thèse
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-00116025
Déposant : Franck Picard <>
Soumis le : vendredi 24 novembre 2006 - 13:33:10
Dernière modification le : vendredi 23 octobre 2020 - 16:33:48
Archivage à long terme le : : jeudi 20 septembre 2012 - 15:00:54

Identifiants

  • HAL Id : tel-00116025, version 1
  • PRODINRA : 252126

Collections

Citation

Franck Picard. Process segmentation/clustering. Application to the analysis of CGH microarray data.. Mathematics [math]. Université Paris Sud - Paris XI, 2005. English. ⟨tel-00116025⟩

Partager

Métriques

Consultations de la notice

546

Téléchargements de fichiers

232