Ranking Cases with Decision Trees: a Geometric Method that Preserves Intelligibility

I. Alvarez; S. Bernard

Communication Dans Un Congrès Année : 2005

Ranking Cases with Decision Trees: a Geometric Method that Preserves Intelligibility

Ranger des cas avec des arbres de décision : une méthode géométrique qui préserve l'intelligibilité

(1) , (1)

I. Alvarez

Fonction : Auteur
PersonId : 10684
IdHAL : isabelle-alvarez
ORCID : 0000-0002-5268-8666
IdRef : 169009394

Laboratoire d'ingénierie pour les systèmes complexes

S. Bernard

Fonction : Auteur
PersonId : 185013
IdHAL : stephan-bernard
ORCID : 0000-0001-9694-1443

Laboratoire d'ingénierie pour les systèmes complexes

Résumé

This paper proposes a new method to rank the cases classified by a decision tree. The method applies a posteriori without modification of the tree and doesn't use additional training cases. It consists in computing the distance of the cases to the decision boundary induced by the decision tree, and to rank them according to this geometric score. When the data are numeric it is very easy to implement and efficient. The distance-based score is a global assess, contrary to other methods that evaluate the score at the level of the leaf. The distance-based score gives good results even with pruned tree, so if the tree is intelligible this property is preserved with an improved ranking ability. The main reason for the efficacity of the geometric method is that in most cases when the classifier is sufficiently accurate, errors are located near the decision boundary.

Cet article propose une nouvelle méthode pour ordonner des exemples classés par un arbre de décision. Cette méthode s'applique à posteriori sans modification de l'arbre et sans utiliser d'exemples d'apprentissage supplémentaires. Elle consiste à calculer la distance de chaque cas à la frontière de décision crée par l'arbre de décision, puis à ranger les cas suivants ce score géométrique. Quand les données sont numériques, cette méthode est facile à implémenter et très efficace. Le score basé sur la distance est évalué globalement, contrairement à d'autres scores calculés au niveau de chaque feuille. Le score géométrique donne de bons résultats même sur des arbres élagués, donc l'intelligibilité de l'arbre est préservée. La raison principale de l'efficacité de cette méthode géométrique vient du fait que si le classifieur est suffisamment bon, les erreurs sont localisées principalement près de la surface de décision.

Mots clés

DECISION TREE RANKING

LISC LIP6

Domaines

Sciences de l'environnement

Migration Irstea Publications : Connectez-vous pour contacter le contributeur

https://hal.inrae.fr/hal-02587170

Soumis le : vendredi 15 mai 2020-11:51:28

Dernière modification le : mardi 12 mars 2024-10:45:28

Dates et versions

hal-02587170 , version 1 (15-05-2020)

Identifiants

HAL Id : hal-02587170 , version 1
IRSTEA : PUB00018580

Citer

I. Alvarez, S. Bernard. Ranking Cases with Decision Trees: a Geometric Method that Preserves Intelligibility. Actes de Nineteenth International Joint Conference on Artificial Intelligence, Edinbourgh, GBR,30/07-05/08/2005, 2005, pp.635-641. ⟨hal-02587170⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

IRSTEA INRAE MATHNUM

8 Consultations

0 Téléchargements

Ranking Cases with Decision Trees: a Geometric Method that Preserves Intelligibility

Ranger des cas avec des arbres de décision : une méthode géométrique qui préserve l'intelligibilité

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager