Accéder directement au contenu Accéder directement à la navigation
Rapport

Explication géométrique du résultat dans les arbres de décision

Résumé : Cet article s'intéresse au problème de l'explication des résultats fournis par un arbre de décision (AD) quand celui-ci est utilisé en tant que système d'aide à la décision. On s'intéresse au résultat prédit par l'arbre de décision pour chaque vecteur particulier de données d'entrée, c'est à dire à la classe associée à ce vecteur, et on cherche à apporter une information supplémentaire qui permette d'expliquer ou de qualifier le résultat. Deux types principaux d'information sont actuellement disponibles : la trace du classement, c'est à dire le chemin parcouru dans l'arbre, et une estimation du taux d'erreur ou d'un risque associé à un mauvais classement. Nous proposons ici deux nouvelles méthodes de qualification du résultat, basées sur une étude géométrique de la frontière de l'image inverse des différentes classes (la surface de décision). La première méthode consiste à identifier les séparateurs les plus déterminants pour expliquer le résultat, en effectuant une analyse de sensibilité, c'est à dire en projetant les données initiales sur la surface de décision. La deuxième méthode consiste à caractériser la distribution des erreurs relatives à la surface de décision, en calculant la distance à cette surface pour un ensemble de données.
Mots-clés : CEMAGREF LISC
Type de document :
Rapport
Liste complète des métadonnées

https://hal.inrae.fr/hal-02581081
Déposant : Migration Irstea Publications <>
Soumis le : jeudi 14 mai 2020 - 20:52:58
Dernière modification le : vendredi 15 mai 2020 - 02:33:08

Identifiants

  • HAL Id : hal-02581081, version 1
  • IRSTEA : PUB00011114

Collections

Citation

I. Alvarez. Explication géométrique du résultat dans les arbres de décision. irstea. 2002, pp.18. ⟨hal-02581081⟩

Partager

Métriques

Consultations de la notice

13