Les modèles statistiques classiques d’analyse des données binaires, source de biais d’estimation importants? - Unité de Recherche Ecosystèmes forestiers Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Les modèles statistiques classiques d’analyse des données binaires, source de biais d’estimation importants?

Ugoline Godeau
Frédéric Gosselin

Résumé

La modélisation statistique de la biodiversité est un enjeu fort pour mieux éclairer les choix de gestion ou suivre l’évolution de la biodiversité par exemple avec des indicateurs. Des outils développés récemment permettent de modéliser la biodiversité spécifique de manière hiérarchique, c’est-à-dire à la fois au niveau espèce, groupe écologique et communauté d’espèces, permettant de partager l’information environnementale entre espèces tout en prenant en compte les corrélations entre espèces. Ces outils utilisent le plus souvent des données de présence-absence d’espèces et utilisent un modèle statistique avec fonction de lien probit qui permet une simplification numérique. S’il est relativement bien établi que le choix entre une fonction de lien logit, probit voire cloglog n’a d’effet que dans des cas où les données sont très nombreuses, nous voulons ici attirer l’attention sur d’autres formes de fonctions de lien, avec asymptotes estimées, qui peuvent grandement changer les résultats. Nous expliquons pourquoi tel devrait être le cas et montrons par un travail de simulation qu’utiliser les fonctions de lien « classiques » peut entrainer des biais importants dans l’estimation de l’importance des effets. Nous illustrerons ce résultat sur un cas réel. Ces résultats ont une portée beaucoup plus générale que celui de notre cadre d’étude.
Fichier principal
Vignette du fichier
Présentation_JSA2020_SIGMA01_HAL.pdf (2.11 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03080332 , version 1 (17-12-2020)

Identifiants

  • HAL Id : hal-03080332 , version 1

Citer

Ugoline Godeau, Frédéric Gosselin. Les modèles statistiques classiques d’analyse des données binaires, source de biais d’estimation importants?. Premières Journées Scientifiques Annuelles des sites INRAE du Loiret, Nov 2020, Orléans, France. ⟨hal-03080332⟩
64 Consultations
99 Téléchargements

Partager

Gmail Facebook X LinkedIn More