Estimation bayesienne empirique de parametres relatifs a n caracteres binaires polygeniques - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Article Dans Une Revue Génétique sélection évolution Année : 1987

Empirical Bayes estimation of parameters for n polygenic binary traits

Estimation bayesienne empirique de parametres relatifs a n caracteres binaires polygeniques

Résumé

The conditional probability of an observation in a subpopulation i (a combination of levels of explanatory variables) falling into one of 2n mutually exclusive and exhaustive categories is modelled using a normal integral in n-dimensions. The mean of subpopulation i is written as a linear combination of an unknown vector θ which can include « fixed » effects (e.g., nuisance environmental effects, genetic group effects) and « random » effects such as additive genetic value or producing ability. Conditionally on θ, the normal integral depends on an unknown matrix R comprising residual correlations in a multivariate standard normal conceptual scale. The random variables in θ have a dispersion matrix G X A, where usually A is a known matrix of additive genetic relationships, and G is a matrix of unknown genetic variances and covariances. It is assumed a priori that θ follows a multivariate normal distribution f (θ | G), which does not depend on R, and the likelihood function is taken as product multinomial. The point estimator of θ is the mode of the posterior distribution f (θ | Y, G = G*, R = R*) where Y is data, and G* and R* are the components of the mode of the marginal posterior distribution f (G, R | Y) using « flat » priors for G and R. The matrices G* and R* correspond to the marginal maximum likelihood estimators of the corresponding matrices. The point estimator of θ is of the empirical Bayes types. Overall, computations involve solving 3 non-linear systems in θ, G and R. G* can be computed with an expectation-maximization type algorithm ; an estimator of R* is suggested, and this is related to results published elsewhere on maximum likelihood estimation in contingency tables. Problems discussed include non-linearity, size of the system to be solved, rate of convergence, approximations made and the possible use of informative priors for the dispersion parameters.
La probabilité conditionnelle qu’une observation d’une sous-population donnée (combinaison de niveaux de facteurs) se trouve dans l’une des 2" catégories possibles de réponse (exclusives et exhaustives) est modélisée par une intégrale normale à n-dimensions. La moyenne de la ﺎe sous population s’écrit comme une combinaison linéaire d’un vecteur θ de paramètres inconnus qui peuvent comprendre des effets « fixes » (effets de milieu parasites, effets de groupe génétique) et des effets aléatoires (valeur génétique additive ou aptitude à la production). Sachant θ, l’intégrale normale dépend d’une matrice inconnue R fonction des corrélations résiduelles entre les n variables normales sous-jacentes standardisées. Les effets aléatoires de θ présentent une matrice de dispersion de la forme G X A où A est généralement une matrice connue de parenté et G une matrice inconnue de variances et covariances génétiques. On suppose qu’a priori θ suit une loi multinormale de densité f (θ | G) qui ne dépend pas de R. La vraisemblance s’exprime alors comme un produit de multinomiales. L’estimateur de position de θ est défini comme le mode de la distribution a posteriori f (θ | Y, G = G*, R = R*) où Y est le vecteur des données, G* et R* sont les composantes du mode de la distribution marginale f (G, R | Y) avec des a priori uniformes pour G et R. G* et R* correspondent alors aux estimateurs du maximum de vraisemblance marginale et θ à un estimateur de type bayésien empirique. Les calculs impliquent la résolution de 3 systèmes non-linéaires en θ, G et R. G* se calcule selon un algorithme de type E.M. Une approximation de R* est suggérée en relation avec des résultats antérieurs publiés à propos d’une estimation du maximum de vraisemblance pour les tables de contingence. Divers problèmes sont abordés en discussion tels que la non-linéarité, la taille du système à résoudre, la vitesse de convergence, le degré d’approximation et l’emploi possible d’a priori informatifs pour les paramètres de dispersion.
Fichier principal
Vignette du fichier
83339_20080117021217812_1.pdf (1.17 Mo) Télécharger le fichier
Origine Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02720780 , version 1 (01-06-2020)

Identifiants

  • HAL Id : hal-02720780 , version 1
  • PRODINRA : 83339

Citer

Jean Louis J. L. Foulley, S. Im, Daniel Gianola, I. Hoschele. Estimation bayesienne empirique de parametres relatifs a n caracteres binaires polygeniques. Génétique sélection évolution, 1987, 19 (2), pp.197-224. ⟨hal-02720780⟩
6 Consultations
27 Téléchargements

Partager

Gmail Mastodon Facebook X LinkedIn More