Le projet « Mille Génomes Gallus » : partager les données de séquences pour mieux les utiliser - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Article Dans Une Revue INRAE Productions Animales Année : 2020

The “1 000 Gallus Genomes” project: sharing sequence data to better exploit them

Le projet « Mille Génomes Gallus » : partager les données de séquences pour mieux les utiliser

Résumé

The 1 000 Gallus Genomes project aims at gathering whole genome sequence data in chicken, produced by research projects. It allows increasing the power of analyses by increasing the number of genomes compared. Potential applications target a better knowledge of the chicken genome and of the genetic diversity of the species, the identification of causal mutations and a support to genomic selection. A pilot project has started in France with 207 individual genome sequences produced by eight publicly funded projects on a range of chicken populations (broilers, layers, local breeds, wild ancestors). Datasets are described by metadata for technical parameters, for the animal and its population of origin. Phenotypic data are not shared. Sequences have been compared to version 5 of the reference genome with a common pipeline that identified more than 40 millions SNP variants. A structure analysis led to group the 207 individuals in seven genetic clusters. The MC1R gene was chosen as an example showing how to detect a selection signature related to red plumage in brown-egg layers. Candidate genes for egg-shell quality are under study. Other data produced in Europe and China show that 1,000 chicken genomes have already been sequenced. The principles of a consortium agreement are presented in order to extend our project to a larger set of sequence data.
Le séquençage du génome entier est devenu abordable chez la poule. Le projet « Mille Génomes Gallus » a pour objectif de rassembler les séquences d’animaux du genre Gallus, produites dans des projets de recherche. L’intérêt est d’augmenter la puissance des analyses génomiques en augmentant le nombre de génomes comparés. Les applications possibles concernent l’analyse de la structure du génome, la caractérisation globale de la diversité de l’espèce, l’identification de mutations causales et l’aide à la sélection génomique. Cette synthèse décrit d’abord le contexte de la génomique de la poule avant de développer le concept de « Mille Génomes », de l’illustrer avec un projet pilote porté par des équipes françaises et de discuter les modalités de son extension. Le projet pilote français regroupe 207 séquences individuelles pour 8 projets de recherches financés par des fonds publics, sur une large gamme de populations (poulets de chair, poules pondeuses, races locales, espèces sauvages). Les jeux de données sont décrits par des métadonnées techniques et des métadonnées liées à l’animal et sa population d’origine. Aucune information phénotypique n’est partagée. La comparaison des séquences à la version 5 du génome de référence a permis de répertorier plus de 40 millions de variants SNP. L’analyse de structure des populations a identifié sept groupes génétiques. Le gène MC1R a été choisi comme exemple permettant de détecter une signature de sélection chez les pondeuses de plumage rouge et d’autres gènes candidats sont en cours d’étude sur la qualité de coquille. D’autres données produites en Europe et en Chine montrent que 1 000 génomes de poule ont déjà été séquencés. Les principes d’un accord de consortium sont exposés afin d’élargir notre projet à un plus grand nombre de données de séquence.
Fichier principal
Vignette du fichier
TIXIER-BOICHARD et al_2018_Le projet « Mille Génomes Gallus ».pdf (503.41 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03103324 , version 1 (08-01-2021)

Licence

Paternité

Identifiants

Citer

Michèle Tixier-Boichard, Frédéric Lecerf, Frédéric Herault, Philippe Bardou, Christophe C. Klopp. Le projet « Mille Génomes Gallus » : partager les données de séquences pour mieux les utiliser. INRAE Productions Animales, 2020, 33 (3), pp.189-202. ⟨10.20870/productions-animales.2020.33.3.4564⟩. ⟨hal-03103324⟩
180 Consultations
156 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More