ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 16/2 - 2013  - pp.11-30  - doi:10.3166/dn.16.2.11-30
TITRE
Modèles d’information pour la recherche multilingue

TITLE
Information-based models for cross-language information retrieval

RÉSUMÉ

Nous présentons dans cet article plusieurs extensions multilingues des modèles d’information, en particulier le modèle log-logistique (LL) et le modèle Smoothed Power Law (SPL), récemment introduits en recherche d’information. Ces extensions sont fondées sur (a) une généralisation de la notion d’information utilisée dans ces modèles, (b) une généralisation des variables aléatoires utilisées et (c) une expansion de la requête utilisant l’ensemble des traductions de chaque mot. Nous analysons ensuite ces extensions d’un point de vue théorique, par l’intermédiaire d’une condition que doivent satisfaire les systèmes de recherche d’information multilingue. Les résultats expérimentaux, obtenus sur trois collections et trois couples de langue, sont en accord avec l’analyse théorique et montrent que le modèle LL fournit les meilleurs résultats en recherche d’information multilingue. Nous montrons enfin comment enrichir des dictionnaires bilingues de langue générale et dans quelle mesure cet enrichissement améliore la qualité du système de recherche multilingue.



ABSTRACT

We present in this paper well-founded cross-language extensions of the recently introduced models in the information-based family for information retrieval, namely the LL (log-logistic) and SPL (smoothed power law) models. These extensions are based on (a) a generalization of the notion of information used in the information-based family, (b) a generalization of the random variables also used in this family, and (c) the direct expansion of query terms with their translations. We then review these extensions from a theoretical point-of-view, prior to assessing them experimentally. We finally show how to enrich existing general, bilingual dictionaries with lexicons extracted from the collection queried, and how this impacts a cross-lingual information retrieval system.



AUTEUR(S)
Bo LI, Eric GAUSSIER

MOTS-CLÉS
recherche d’information multilingue, modèles d’information

KEYWORDS
cross-language information retrieval, information models

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (256 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier