Des étiquettes pour les gènes : Une revue - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Article Dans Une Revue Genetics Selection Evolution Année : 1998

Expressed sequence tags for genes: A review

Des étiquettes pour les gènes : Une revue

Résumé

Expressed sequence tags (ESTs) are partial sequences from the extremities of complementary DNA (CDNA) resulting from a single pass sequencing of clones from cDNA libraries, and different ESTs can be obtained from one gene. Sequence information from ESTs can be used for deciphering the function and the organisation of the genome. From a functional viewpoint, they allow the determination of the expression profiles of genes in any particular tissue, in different conditions or status, and thus the identification of regulated genes. In order to identify genes involved in particular processes one can select a specific group of mRNAs. For such a selection, classical techniques include subtraction or differential screening and new techniques, using polymerase chain reaction (PCR) amplification, are now available. For studies on the organisation of the genome the main use of ESTs is the determination of chromosomal localisation of the corresponding genes using a somatic hybrid cell panel. This chromosomal localisation information is needed to identify genes or quantitative trait loci, according to the ’positional candidate’ approach. ESTs also contribute to comparative genetics and they can help to decipher gene function by comparison between species, even genetically distant ones. Thus, combining sequence, functional and localisation data, ESTs contribute to an integrated approach to the genome.
Les « étiquettes » correspondent aux séquences des extrémités des ADN complémentaires, obtenues de manière systématique à partir d’une seule réaction de séquençage. Cependant, à partir d’un seul gène plusieurs étiquettes différentes peuvent être obtenues : celles qui correspondent aux deux extrémités de l’ADN complémentaire, aux ADN complémentaires de tailles différentes synthétisés à partir d’un même ARN messager, et aux différents ARN messagers issus d’une même séquence d’ADN génomique. L’identification des gènes correspondants est faite par comparaison avec les séquences nucléiques ou protéiques contenues dans les bases de données publiques (GenBank ou EMBL, SwissProt), en utilisant des logiciels d’alignement automatique tels que FASTA ou BLAST. Les séquences annotées des étiquettes sont stockées dans une base de données particulière, dbEST, et soumises régulièrement à des tests de comparaison avec les bases de données citées. En raison de la présence d’une longue région non codante à l’extrémité 3’ des ARN messagers, les étiquettes de l’extrémité 3’ sont souvent non informatives. La comparaison des étiquettes entre elles permet d’essayer de regrouper celles qui peuvent appartenir à un même gène et de déterminer ainsi une séquence consensus, plus longue et donc plus informative. Au niveau fonctionnel, les étiquettes permettent d’établir les profils d’expression des gènes d’un tissu donné dans différentes situations physiologiques ou expérimentales et donc d’identifier les gènes qui sont régulés. Ces profils sont établis en utilisant les étiquettes pour mesurer la fréquence des différents ADNc dans une génothèque préparée à partir de ce tissu dans les différentes conditions étudiées. Dans une nouvelle stratégie, la SAGE (Serial Analysis of Gene expression), des étiquettes d’une dizaine de nucléotides sont collectées, mises bout à bout et séquencées en série, ce qui permet d’accélérer l’acquisition de ces profils d’expression. Une autre approche est basée sur l’hybridation d’un grand nombre de clones déposés sur une même membrane en nylon «filtres haute densité », ou, dans un format miniature, sur une lame de verre, « microarrays». Pour identifier les gènes impliqués dans des processus bien définis, différentes stratégies de soustraction ou de comparaison permettent de sélectionner une population particulière d’ARN messagers ; les techniques les plus récentes utilisent l’amplification par PCR. Au niveau de l’organisation du génome, les étiquettes contribuent au développement de la cartographie génique : les gènes correspondants sont localisés en utilisant un panel d’hybrides somatiques, les amorces nécessaires pour amplifier l’ADN des hybrides sont choisies grâce aux informations de séquence fournies par les étiquettes. Cette information de localisation chromosomique est indispensable pour identifier les gènes responsables des caractères étudiés par une stratégie de gène candidat positionnel. L’utilisation d’étiquettes d’une autre espèce peut également permettre d’effectuer ces localisations et donc de développer des cartes comparées entre espèces qui mettent en évidence une certaine conservation de l’organisation des gènes sur les chromosomes. Enfin, la conservation des gènes n’est pas limitée à la séquence et à l’organisation : grâce aux étiquettes, des analogies fonctionnelles de gènes appartenant à des espèces génétiquement éloignées ont été décrites et sont recherchées systématiquement pour identifier la fonction des gènes. Ainsi, en permettant de combiner des données de séquence, d’expression et de localisation chromosomique, les étiquettes participent au développement d’une approche intégrée du génome.

Domaines

Génétique
Fichier principal
Vignette du fichier
52295_20070911091616639_1.pdf (1.43 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02685081 , version 1 (01-06-2020)

Identifiants

  • HAL Id : hal-02685081 , version 1
  • PRODINRA : 52295

Citer

François Hatey, Gwenola Tosser-Klopp, C. Clouscard-Martinato, Philippe Mulsant, F. Gasser. Des étiquettes pour les gènes : Une revue. Genetics Selection Evolution, 1998, 30 (6), pp.521-541. ⟨hal-02685081⟩
6 Consultations
17 Téléchargements

Partager

Gmail Facebook X LinkedIn More