Delineating complex scientific fields by an hybrid lexical-citation method: an application to nanosciences - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Article Dans Une Revue Information Processing and Management Année : 2006

Delineating complex scientific fields by an hybrid lexical-citation method: an application to nanosciences

La délimitation de champs scientifiques complexes par une méthode hybride citation-lexique : une application aux nanosciences

Résumé

Relevance of bibliometric indicators on scientific areas critically depends on the quality of their delineation. Macro-level studies, often based on a selection of list of journals, accept a high degree of fuzziness. Micro-level studies rely on sets of individual articles in order to reduce noise and enhance precision of retrieval. The most usual information retrieval process is based on lexical queries with various levels of sophistication. In the experiment on Nano-sciences reported here, this process was used in a first step, to delineate a 'seed' of literature. It has strong limitations, especially for emerging or transversal fields. In a second step, the alternative way of citation linkages, was used to expand the bibliography starting from lexical seed. The process of extension presented is ruled by three parameters, two parameters deal with the cited side (threshold on citation score, and specificity towards the field), one with the citing side (threshold on the number of relevant references) interplaying in the 'referencing structure' function (RSF) previously introduced. This type of combination proves effective for delineating the transversal field of Nanosciences. Further improvements of the method are discussed.
La délimitation des champs scientfiques est une opération cruciale pour la pertinence des indicateurs bibliomètriques à l'échelle méso ou micro. Les études au niveau macro, souvent basées sur la sélection d'un panier de journaux, tolèrent un certain degré de flou. Pour les études à l'échelle micro, la sélection s'opère au niveau de la publication individuelle pour réduire le bruit et accroître la précision de l'information. Le processus le plus courant en recherche d'information repose sur des requêtes lexicales plus ou moins sophistiquées. Elles ont été employées dans la première étape de l'expérimentation sur les nanosciences rapportée ici pour délimiter une littérature "germe". Cette méthode présente de sérieuses limites, en particulier pour les champs émergents ou transversaux. Dans une seconde étape on a utilisé les liens de citation pour étendre le corpus à partir de la littérature "germe". Le processus d'extension est règlé par trois paramètres. Deux paramètre concernent les références citées pertinentes (seuil sur le score de citation et seuil de spécificité par rapport au champ étudié), le troisième la littérature citante (seuil sur le nombre de références citées pertinentes). Ces paramètres interagissent dans la fonction de "structure de références" (RSF) introduite dans des travaux antérieurs. Cette combinaison de méthodes a montré son efficacité pour la délimitation du champ transversal "nanosciences". On présente en conclusion les améliorations envisagées.

Dates et versions

hal-02659506 , version 1 (30-05-2020)

Identifiants

Citer

Michel Zitt, Elise Bassecoulard. Delineating complex scientific fields by an hybrid lexical-citation method: an application to nanosciences. Information Processing and Management, 2006, 42 (6), pp.1513-1531. ⟨10.1016/j.ipm.2006.03.016⟩. ⟨hal-02659506⟩

Collections

INRA INRAE
11 Consultations
0 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More