ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 19/2-3 - 2016  - pp.53-73  - doi:10.3166/dn.19.2-3.53-73
TITRE
Un modèle probabiliste pour la détection de l’incertitude dans le langage naturel

TITLE
Uncertainty detection in natural laguage: a probabilistic model

RÉSUMÉ

Parce qu’elle conditionne la confiance que l’on peut avoir dans certaines affirmations, la détection de l’incertitude dans le langage naturel constitue l’un des enjeux majeurs du développement de systèmes exploitant l’analyse de textes e.g. questions-réponses, raisonnement approché, enrichissement de bases de connaissances. Après une synthèse des différentes classifications de l’incertitude et des méthodes de détection correspondantes, cet article introduit une approche supervisée et générique de détection de l’incertitude. Celle-ci se base sur une analyse statistique de différentes caractéristiques lexicales et syntaxiques afin de construire une représentation vectorielle d’une phrase utilisée ensuite dans un processus de classification. L’évaluation que nous proposons tient compte des différentes dimensions de l’incertitude et de la nature des textes. Les résultats obtenus sur différents jeux de validation soulignent la performance globale de la méthode proposée et permettent d’envisager l’utilisation de cette méthode dans un contexte plus global d’extraction et d’inférence de connaissances.



ABSTRACT

Uncertainty influences the confidence that we have in some affirmations. That is why uncertainty detection is a cornerstone of the development of Natural Language Processing applications e.g. question-answering, approximate reasoning, knowledge bases population. This article proposes an overview of several contributions and classifications defining the concept of uncertainty expressions in natural language, and their related detection methods that have been proposed so far. A new supervised and generic approach is next introduced for this specific task; it is based on the statistical analysis of multiple lexical and syntactic features used to characterize sentences through vector-based representations that can be analyzed by proven classification methods. The global performance of our approach is demonstrated and discussed with regard to various dimensions of uncertainty and text specificities.



AUTEUR(S)
Pierre-Antoine JEAN, Sébastien HARISPE, Sylvie RANWEZ, Patrice BELLOT, Jacky MONTMAIN

MOTS-CLÉS
détection de l’incertitude linguistique, classification binaire, modèle supervisé.

KEYWORDS
uncertainty detection in natural language, bianary classification, supervised model.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (189 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier