Estimation du paramètre de dispersion de la distribution binomiale négative : a priori, effort d'échantillonnage, et information - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement
Communication Dans Un Congrès Année : 2010

Estimation du paramètre de dispersion de la distribution binomiale négative : a priori, effort d'échantillonnage, et information

Résumé

The negative binomial distribiution is frequently used to model overdispersed count data. Adjusting the negative binomial and estimating its parameters is thus a major concern in ecology, epidemiology, actuaries, etc. that often deal with that type of data. However, the estimation of the parameters of the negative binomial, and the estimation of its dispersion parameter in particular, are often a problematic issue because available estimators are biased and have low efficiency. In particular, if samples are small, if the expected value of the distribution is low, or if its variance is high, the estimators are particularly unreliable. In this study, we try to identify the reasons behind these estimation problems. To do this, we use entropy (Shannon, 1949) to quantify the information about dispersion that the samples provide. Entropy depends on the characteristics of the samples (size, mean) and of the real values of the parameters of the negative binomial. We show that the total number of individuals observed in a sample is a key driver of estimation quality. We also highlight the fact that for a given sampling effort the estimation of dispersion is likely to be really unreliable if the real value of dispersion lies in extremes ranges of values (notably, high values).
La distribution binomiale négative est fréquemment utilisée pour modéliser la distribution des données d'abondance surdispersées. De ce fait, l'ajustement de la binomiale négative aux données d'abondance et l'estimation de ses paramètres est un enjeu majeur pour de très nombreuses études en écologie, épidémiologie, actuariat, etc. qui reposent sur des données de ce type. L'estimation des paramètres de la binomiale négative, et en particulier de son paramètre de dispersion est néanmoins problématique, car les estimateurs disponibles sont biaisés et peu efficaces, notamment lorsque les échantillons sont petits, que l'espérance de l'abondance est faible, et que sa variance est forte. Dans cette étude, nous tentons d'identifier la source de ces problèmes d'estimation. Pour ce faire, nous utilisons l'entropie (Shannon, 1949) pour quantifier l'information qu'apportent les échantillons sur la dispersion, en fonction des caractéristiques de ces échantillons (taille, moyenne), et des valeurs réelles des paramètres de la binomiale négative. On montre ainsi que le nombre total d'individus observés est un facteur clé de la qualité de l'estimation, et que pour un effort d'échantillonnage donné l'estimation de la dispersion est vraisemblablement très peu fiable si la dispersion réelle se situe dans des gammes de valeurs extrêmes (notamment des valeurs fortes).
Fichier non déposé

Dates et versions

hal-02593973 , version 1 (15-05-2020)

Identifiants

Citer

L. Vaudor, Nicolas Lamouroux. Estimation du paramètre de dispersion de la distribution binomiale négative : a priori, effort d'échantillonnage, et information. 42èmes Journées Françaises de Statistiques, May 2010, Marseille, France. pp.1. ⟨hal-02593973⟩
13 Consultations
0 Téléchargements

Partager

More