Statistical approach versus linguistical approach in semantic indexing for multilingual documents
Approche statistique versus approche linguistique pour l'indexation sémantique des documents multilingues
Résumé
Dans cet article nous présentons une approche statistique d'indexation sémantique des documents multilingues. L'approche que nous proposons est composée de trois étapes : extraction des termes, détection des concepts et détection des relations à partir des couples de concepts. Notre approche est validée par un ensemble d'expérimentations sur la collection ImageCLEFmed 2007 et une comparaison avec une approche linguistique. Nous montrons ainsi que l'approche statistique obtient des résultats équivalents à l'approche linguistique sans adapter la phase d'indexation à la langue du document.