A gradient approximation with importance sampling for dimension reduction in natural exponential families
Résumé
Les données de comptage en grande dimension sont difficiles à analyser telles quelles, et les approches fondées sur des modèles statistiques à variable latente restent efficaces et appropriées, tout en préservant l'explicabilité. Nous considérons plus particulièrement ici le cadre de modèles où les données discrètes sont guidées par une variable gaussienne latente décrivant la structure de dépendances des comptages dans un espaces de faible dimension, puis envoyées dans un espace de grande dimension via une distribution de Poisson ou Binomiale. Comme la loi de la variable latente conditionnement aux données reste inconnue, l'inférence variationnelle s'est révélée efficace pour inférer un tel modèle. Cependant, elle ne maximise qu'une borne inférieure de la vraisemblance et les estimateurs correspondant souffrent d'un manque de garanties théoriques. De plus, un grand nombre de paramètres variationnels est nécessaires. Dans ce travail en cours, nous utilisons l'échantillonnage préférentiel pour estimer les gradients de la log-vraisemblance. Nous contrôlons le biais de l'estimateur et nous appuyons sur des théorèmes d'optimisation pour assurer la convergence d'un schéma de gradient stochastique, s'adaptant facilement à un grand nombre d'échantillons.
Origine | Fichiers produits par l'(les) auteur(s) |
---|