Acquisition et traitements statistiques des données de génomique - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement
Article Dans Une Revue Cahier des Techniques de l'INRA Année : 2004

Acquisition et traitements statistiques des données de génomique

Résumé

Le développement des nouvelles technologies de génomique, en particulier celles permettant l’étude du transcriptome, soulèvent de nombreuses difficultés techniques pour l’acquisition et le traitement statistique des données. Ces difficultés sont notamment rencontrées par les biologistes moléculaires qui n’ont pas de formation spécifique en analyse d’images ou en analyse de données. Une première étape essentielle est en effet l’analyse des images résultant de l’hybridation moléculaire entre les gènes (représentés par des fragments d’ADNc préparés au laboratoire) et leurs produits d’expression dans les tissus étudiés. Après l’étape de localisation des spots, la segmentation des images (séparation des pixels en deux classes : bruit de fond non spécifique et signaux spécifiques) peut être effectuée selon différentes méthodes, puis les données caractéristiques à chaque spot (moyenne, médiane, écart-type) sont extraites. Plusieurs méthodes sont également disponibles pour le calcul de l’intensité de chaque spot (en retirant les signaux non spécifiques) mais aussi pour le filtrage des données de façon à ne conserver que les spots de qualité et d’intensité supérieure à celle du bruit de fond. Il existe également différentes méthodes de normalisation des données permettant d’éliminer toute variabilité technique et ainsi de comparer les données issues de différents échantillons, de différentes expériences d'hybridations ou de plusieurs réseaux. Enfin, les méthodes d’analyses statistiques classiquement utilisées en biologie doivent être adaptées à l’étude du transcriptome en raison du très grand nombre de gènes analysés de façon simultanée et compte tenu des caractéristiques des schémas expérimentaux et des facteurs de variabilité technique et biologique de ce type d’approche. Les choix méthodologiques de l’expérimentateur tout au long de cette chaîne de traitement dépendent des choix techniques préalables, interagissent entre eux et déterminent ensemble la fiabilité et la qualité des résultats obtenus.
Fichier principal
Vignette du fichier
CT52_art3_Bernard.pdf (589.77 Ko) Télécharger le fichier
Origine Fichiers éditeurs autorisés sur une archive ouverte
Licence

Dates et versions

hal-02670677 , version 1 (07-11-2024)

Licence

Identifiants

  • HAL Id : hal-02670677 , version 1
  • PRODINRA : 30448

Citer

Carine Bernard, Bruno Meunier, Isabelle Cassar-Malek, Jean-François J.-F. Hocquette. Acquisition et traitements statistiques des données de génomique. Cahier des Techniques de l'INRA, 2004, 52, pp.29-44. ⟨hal-02670677⟩
50 Consultations
4 Téléchargements

Partager

More