Identification de biomarqueurs de la qualité de la semence bovine, modélisation statistique et hypothèses biologiques. - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Thèse Année : 2022

Identification of biomarkers for bovine semen quality, statistical modelling and biological hypotheses.

Identification de biomarqueurs de la qualité de la semence bovine, modélisation statistique et hypothèses biologiques.

Résumé

In the bovine industry, bull semen is widely used to carry out a large number of artificial inseminations in order to renew the bovine herds and to disseminate genetics of interest. The presence of subfertile bulls among the breeding stock causes economic losses for a large number of actors in the breeding industry. Identifying these subfertile animals is therefore an important issue for the breeding sector. The study of semen functional parameters does not allow the identification of all subfertile bulls. Furthermore, male fertility displays a weak heritability and is therefore difficult to select using genomic information; therefore, there is currently no routine evaluation of male fertility. DNA methylation is an epigenetic mark playing a major role in male fertility. Indeed, it undergoes extensive changes during the differentiation of male germ cells into spermatozoa, as well as after fertilization in the male pronucleus and during embryonic development. It could therefore reflect the differences in fertility that may exist between bulls. The first objective of this thesis was to study the potential of the sperm methylome as a source of fertility biomarkers. For this purpose, the semen of 120 Montbéliarde and 38 Holstein bulls was analyzed by RRBS (Reduced Representation Bisulfite Sequencing). By performing differential methylation analyses between fertile and subfertile bulls, differentially methylated sites (DMCs) could be identified. Some of these DMCs were associated with genes involved in sperm physiology and embryonic development, thus allowing us to make biological hypotheses about their link with fertility. From these DMCs and by using the random forest methodology, it was possible to build models that predicted fertility with an accuracy of 72 to 94% depending on the analyzed cohort. Nevertheless, DNA methylation is not the only important factor for male fertility, which is a complex phenotype. Taking into account several sources of biological information could increase the robustness of prediction models and improve knowledge of the molecular mechanisms regulating fertility. Therefore, the second objective of this thesis was to integrate DNA methylation data with small non-coding RNA expression data and semen functional parameters obtained on the same samples, as well as with the genotypes of the bulls. Prediction models with better performances when compared with DNA methylation only could be developed using 50 to 500 features from the different types of -omics, but never from semen functional parameters , which seemed to have little relationship with the fertility of the bulls. Few correlations could be observed between the different -omics datasets, which rather seem to act in a complementary way in the construction of male fertility, in accordance with the particular transcriptional status of the spermatozoa. Taken together, these results demonstrate that the use of epigenetic and genetic data allows the prediction of bull fertility with good accuracy from semen samples. These results, obtained on a relatively small cohort, can be regarded as encouraging, but need to be validated on larger populations. Nevertheless, these data offer interesting perspectives for the understanding of the molecular mechanisms underlying male fertility, and will allow in the short term to implement a tool for the evaluation of bull fertility. In the longer term, the analysis of the transmission of these fertility-related epigenetic variations from sperm to the offspring could lead to major advances in the field of breeding.
Dans les élevages la semence bovine est utilisée pour réaliser un grand nombre d’inséminations artificielles afin de renouveler le cheptel bovin et de diffuser des patrimoines génétiques d’intérêt. La présence de taureaux subfertiles parmi les reproducteurs entraîne des pertes économiques pour un grand nombre d’acteurs de l’élevage. Identifier ces animaux subfertiles est donc un enjeu important pour la filière. L’étude des paramètres fonctionnels de la semence ne permet pas d’identifier tous les taureaux subfertiles. De plus, la fertilité mâle est peu héritable et donc difficile à sélectionner à l’aide d’informations génomiques ; si bien qu’il n’existe aujourd’hui pas d’évaluation en routine de la fertilité mâle. La méthylation de l’ADN est une marque épigénétique jouant un rôle majeur dans la fertilité mâle. En effet, elle subit des remaniements d’ampleur au cours de la différenciation des cellules germinales mâles en spermatozoïdes, ainsi qu’après la fécondation dans le pronoyau mâle et au cours du développement embryonnaire. Elle pourrait donc être le témoin des différences de fertilité pouvant exister entre les taureaux. Le premier objectif de cette thèse a été d’étudier le potentiel du méthylome spermatique comme source de biomarqueurs de fertilité. Pour cela, la semence de 120 taureaux de race Montbéliarde et 38 de race Holstein a été analysée par RRBS (« Reduced Representation Bisulfite Sequencing »). En réalisant des analyses différentielles de méthylation entre des animaux fertiles et subfertiles, des sites différentiellement méthylés (DMC) ont pu être identifiés. Une partie de ces DMC était associée à des gènes impliqués dans la physiologie du spermatozoïde et dans le développement embryonnaire, permettant donc d’émettre des hypothèses biologiques quant à leur lien avec la fertilité. A partir de de ces DMC et en exploitant la méthodologie des forêts aléatoires, il a été possible de construire des modèles permettant de prédire la fertilité avec une précision de 72 à 94% en fonction de la cohorte analysée. Néanmoins, la méthylation de l’ADN n’est pas le seul facteur important pour la fertilité mâle qui est un phénotype complexe. Prendre en compte plusieurs sources d’informations biologiques pourrait permettre d’augmenter la robustesse des modèles et d’améliorer les connaissances sur les mécanismes moléculaires régulant la fertilité. C’est pourquoi le deuxième objectif de cette thèse a consisté à intégrer les données de méthylation de l’ADN avec des données d’expression des petits ARN non codants et des paramètres fonctionnels de la semence obtenue sur les mêmes échantillons, ainsi qu’avec le génotype des taureaux. Des modèles de prédiction plus performants ont pu être élaborés à partir de 50 à 500 variables issues des différents types d’-omiques, mais jamais des paramètres fonctionnels de la semence qui semblaient peu liés à la fertilité des taureaux. Peu de corrélations ont pu être observées entre les différentes données –omiques, qui semblent plutôt agir de manière complémentaire dans la construction de la fertilité mâle, en conformité avec le statut transcriptionnel particulier du spermatozoïde. Dans leur ensemble, ces résultats démontrent que l’utilisation de données épigénétiques et génétiques permet de prédire avec une bonne précision la fertilité des taureaux à partir d’un échantillon de semence. Ces résultats, obtenus sur des cohortes de dimensions relativement modestes, peuvent être considérés comme des résultats encourageants, mais nécessitent d’être validés sur des populations plus larges. Néanmoins, ces données offrent des perspectives intéressantes pour la compréhension des mécanismes moléculaires de la fertilité mâle, et permettront à court terme d’implémenter un outil d’évaluation de la fertilité des reproducteurs. A plus long terme, l’étude de la transmission de ces variations de l’épigénome spermatique à la descendance pourrait entrainer des avancées majeures dans le domaine de l’élevage.
Fichier principal
Vignette du fichier
109609_COSTES _2022_archivage.pdf (63.49 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-04534626 , version 1 (05-04-2024)

Licence

Domaine public

Identifiants

  • HAL Id : tel-04534626 , version 1

Citer

Valentin Costes. Identification de biomarqueurs de la qualité de la semence bovine, modélisation statistique et hypothèses biologiques.. Sciences du Vivant [q-bio]. Université Paris Saclay, 2022. Français. ⟨NNT : ⟩. ⟨tel-04534626⟩
2 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More