QuickNorm, une méthode rapide et peu coûteuse pour la normalisation d'entité
Abstract
Introduction : De nombreuses informations d’intérêt sont disséminées dans la littérature des domaines de spécialité, en particulier dans les publications scientifiques. L’extraction d’information vise à extraire ces informations et à les structurer de façon à les rendre exploitables. Nous aborderons ici une des étapes de l’extraction d’information : la tâche de normalisation d’entité.
Problématique : Les performances n’ont pas arrêté de croître, proportionnellement au nombre de paramètres à entraîner et donc aux besoins en puissance et en temps de calcul. Cela pose de plus en plus de problèmes en termes d’accessibilité, de reproductibilité, ainsi qu’en termes écologiques.
Résultats : La méthode a été évaluée sur un jeu de données standard d’évaluation, celui de Bacteria Biotope 4 [Bossy et al. 2019]. Comparée à des méthodes de l’état de l’art, la méthode réussit à ne pas être trop consommatrice de RAM et à s’exécuter (chargement des données, entraînement et prédiction) au moins 10 fois plus rapidement sur CPU que les méthodes état de l’art performantes sur GPU.
Origin | Files produced by the author(s) |
---|