ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 8/3 - 2004  - pp.11-34
TITRE
Extraction de connaissances à partir de textes structurés

RÉSUMÉ

Cet article propose un schéma général d'extraction de connaissances à partir de textes et situe la fouille de textes comme une étape particulière d'un processus complexe. Notre position est que tout processus de fouille de textes doit nécessairement exploiter un modèle de connaissances et qu'il est essentiel d'extraire des textes des informations structurées auxquelles peut être associée une sémantique. De ce fait, nous nous intéressons tout particulièrement à la structure des textes, structure devant être prise dans un sens très général qui va d'une structuration physique (hiérarchique) à une structuration cognitive ou sémantique. Nous montrons comment ces différentes dimensions du document et du texte peuvent ou pourraient être prises en compte pour que le processus dans son ensemble soit incrémental, c'est-à-dire qu'il soit initialisé avec un ensemble de connaissances réduit qui augmente au fur et à mesure des boucles de traitement.

ABSTRACT

This paper proposes a global schema for Knowledge Discovery in Texts and presents Text Mining as a specific step of the overall process. We argue that any text mining process should rely on a knowledge model, and that it is crucial for the information extracted to be structured and semantically described. We investigate the different document dimensions and show how they contribute or could contribute to the process. Our goal is to define a process which is able to incrementally build upon a small of knowledge, augmenting it little by little at each processing loop.

AUTEUR(S)
Yannick TOUSSAINT

MOTS-CLÉS
extraction de connaissances à partir de textes, fouille de textes, structure du document, traitement automatique de la langue, extraction d'information, modèle de connaissances.

KEYWORDS
knowledge extraction from texts, text mining, document structure, natural language processing, information extraction, knowledge model.

LANGUE DE L'ARTICLE
Français

 PRIX
GRATUIT
   
ACCÉDER A L'ARTICLE COMPLET  (196 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier