Delineation of the genomics field by hybrid citation-lexical methods: interaction with experts and validation process - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Article Dans Une Revue Scientometrics Année : 2010

Delineation of the genomics field by hybrid citation-lexical methods: interaction with experts and validation process

Délimitation du champ de la génomique par méthodes hybrides citations-lexique: Interaction avec experts et validation

Résumé

In advanced methods of delineation and mapping of scientific fields, hybrid methods open a promising path to the capitalisation of advantages of approaches based on words and citations. One way to validate the hybrid approaches is to work in cooperation with experts of the fields under scrutiny. We report here an experiment in the field of genomics, where a corpus of documents has been built by a hybrid citation-lexical method, and then clustered into research themes. Experts of the field were associated in the various stages of the process: lexical queries for building the initial set of documents, the seed; citation-based extension aiming at reducing silence; final clustering to identify noise and allow discussion on border areas. The analysis of experts' advices show a high level of validation of the process, which combines a high-precision and low-recall seed, obtained by journal and lexical queries, and a citation-based extension enhancing the recall. This findings on the genomics field suggest that hybrid methods can efficiently retrieve a corpus of relevant literature, even in complex and emerging fields.
Parmi les méthodes avancées de délimitation et de cartographie des champs scientifiques, les méthodes hybrides ouvrent une voie prometteuse pour capitaliser les avantages des approches par le lexique et les citations. Une voie pour valider les approches hybrides consiste à travailler en coopération avec les experts des champs étudiés. Nous retraçons ici une expérimentation dans le champ de la génomique, où un corpus de documents a été bâti par une méthode hybride citation-lexique, et ensuite décomposé en thèmes de recherches par classification. Des experts du domaine ont été associés aux étapes successives du processus: requêtes lexicales pour construire le jeu initial de documents, le germe; extension basée sur les citations pour réduire les silences ; et finalement classification pour identifier les zones de bruit et alimenter la discussion sur les zones frontières. L'analyse des avis d'experts permet de corroborer le processus d'extension. Ces résultats sur le champ de la génomique suggèrent que les méthodes hybrides peuvent retrouver un corpus de littérature pertinente de manière performante, même dans des champs complexes et émergents.

Dates et versions

hal-02659785 , version 1 (30-05-2020)

Identifiants

Citer

Patricia Laurens, Michel Zitt, Elise Bassecoulard Zitt. Delineation of the genomics field by hybrid citation-lexical methods: interaction with experts and validation process. Scientometrics, 2010, 82 (3), pp.647-662. ⟨10.1007/s11192-010-0177-9⟩. ⟨hal-02659785⟩

Collections

INRA INRAE
12 Consultations
0 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More