Interrogation de bases de données biologiques publiques par reformulation de requêtes et classement des résultats avec ConQuR-Bio - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Access content directly
Conference Poster Year : 2015

Interrogation de bases de données biologiques publiques par reformulation de requêtes et classement des résultats avec ConQuR-Bio

Abstract

L’analyse d'expériences bioinformatiques comprend la comparaison des nouveaux résultats obtenus aux données existantes. Durant ces trente dernières années, les scientifiques ont du faire face à une avalanche de données, de différents types, et présentes dans une multitude de bases de données publiques. L’accès aux données publiques se fait par l’interrogation de portails (tels que le portail Entrez du NCBI) au moyen de mots clés. Cependant, deux requêtes très similaires peuvent fournir des ensembles de réponses différents conduisant l’utilisateur à devoir tester différentes reformulations de ses requêtes (termes synonymes, variantes orthographiques, abréviations).... Les résultats obtenus doivent ensuite être filtrés, comparés... En outre, chaque ensemble de résultats est classé par le portail (en utilisant le nombre d'occurrences du mot-clé dans chaque résultat). Cependant, lorsque plusieurs reformulations sont considérées, il n'est pas simple de produire un classement triant par ordre de pertinence l'ensemble des résultats recueillis séparément, d'autant que ces résultats peuvent être fournis par centaines. Dans cette démonstration, nous présentons ConQuR-Bio (http://conqur-bio.lri.fr) qui permet aux utilisateurs d'interroger les bases de données publiques du NCBI tout en générant automatiquement toutes les reformulations possibles et fournit des réponses triées en utilisant des techniques de consensus de classement (ou agrégation de classements). Notre démonstration montrera l’intérêt de notre approche pour des requêtes biomédicales, lors de la recherche de gènes issus d’EntrezGene et impliqués dans des maladies.
No file

Dates and versions

hal-01167840 , version 1 (01-12-2015)

Identifiers

  • HAL Id : hal-01167840 , version 1
  • PRODINRA : 312420

Cite

Bryan Brancotte, Bastien Rance, Alain Denise, Sarah Cohen-Boulakia. Interrogation de bases de données biologiques publiques par reformulation de requêtes et classement des résultats avec ConQuR-Bio. JOBIM: Journées Ouvertes Biologie Informatique Mathématiques, Jul 2015, Clermont-Ferrand, France. , pp.35 slides, 2015. ⟨hal-01167840⟩
574 View
2 Download

Share

Gmail Facebook X LinkedIn More