ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 10/1 - 2007  - pp.131-151  - doi:10.3166/dn.10.131-151
TITRE
Recherche d'information dans MEDLINE

RÉSUMÉ
Cet article décrit la banque documentaire MEDLINE depuis laquelle une collection test comprenant environ 4,5 million de documents structurés a été construite à partir des campagnes d'évaluation TREC. Dans une deuxième partie, nous évaluons et comparons l'efficacité du dépistage de l'information de dix modèles (probabiliste, modèle de langue, approches vectorielles). Cette évaluation est complétée par l'analyse de l'efficacité de trois enracineurs (stemmers) pour la recherche d'information oeuvrant dans un contexte spécifique. L'impact des descripteurs MeSH, manuellement sélectionnés pour chaque article, complète cette analyse. Enfin nous avons conçu deux nouvelles approches d'expansion automatique des requêtes, l'une générale l'autre spécifique et nous les avons évaluées en les comparant au modèle proposé par Rocchio.

ABSTRACT

In this paper we describe the MEDLINE collection from which a test-collection containing around 4.5 million of structured documents have been built from the past TREC evaluation campaigns. Second this paper evaluates and compares ten different IR models (probabilistic, language model and vector-space approaches) on the one hand, and on the other we also compare three different stemming strategies used in a domain-specific IR. The impact that manually assigned descriptors (MeSH headings) have on retrieval effectiveness is also evaluated. Finally, we propose both a new general blind-query expansion and a domain-specific query expansion scheme and compare them with the more classic Rocchio approach.

AUTEUR(S)
Samir ABDOU, Patrick RUCH, Jacques SAVOY

MOTS-CLÉS
recherche d'information, évaluation, modèle probabiliste, modèle de langue, expansion automatique de requêtes, indexation manuelle, enracineur.

KEYWORDS
information retrieval, evaluation, probabilistic model, language model, blind query expansion, biomedical IR, manually indexing, stemming.

LANGUE DE L'ARTICLE
Français

 PRIX
GRATUIT
   
ACCÉDER A L'ARTICLE COMPLET  (296 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier