Acquisition et traitements statistiques des données de génomique
Résumé
Le développement des nouvelles technologies de génomique, en particulier celles permettant l’étude du transcriptome, soulèvent de nombreuses difficultés techniques pour l’acquisition et le traitement statistique des données. Ces difficultés sont notamment rencontrées par les biologistes moléculaires qui n’ont pas de formation spécifique en analyse d’images ou en analyse de données. Une première étape essentielle est en effet l’analyse des images résultant de l’hybridation moléculaire entre les gènes (représentés par des fragments d’ADNc préparés au laboratoire) et leurs produits d’expression dans les tissus étudiés. Après l’étape de localisation des spots, la segmentation des images (séparation des pixels en deux classes :
bruit de fond non spécifique et signaux spécifiques) peut être effectuée selon différentes méthodes, puis les données caractéristiques à chaque spot (moyenne, médiane, écart-type) sont extraites. Plusieurs méthodes sont également disponibles pour le calcul de l’intensité de chaque spot (en retirant les signaux non spécifiques) mais aussi pour le filtrage des données de façon à ne conserver que les spots de qualité et d’intensité supérieure à celle du bruit de fond. Il existe également différentes méthodes de normalisation des données permettant d’éliminer toute variabilité technique et ainsi de comparer les données issues de différents échantillons, de différentes expériences d'hybridations ou de plusieurs réseaux. Enfin, les méthodes d’analyses statistiques classiquement utilisées en biologie doivent être adaptées à l’étude du transcriptome en raison du très grand nombre de gènes analysés de façon simultanée et compte tenu des caractéristiques des schémas expérimentaux et des facteurs de variabilité technique et biologique de ce type d’approche. Les choix méthodologiques de l’expérimentateur tout au long de cette chaîne de traitement dépendent des choix techniques préalables, interagissent entre eux et déterminent ensemble la fiabilité et la qualité des résultats obtenus.
Origine | Fichiers éditeurs autorisés sur une archive ouverte |
---|---|
Licence |