ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 4/1-2 - 2000  - pp.59-84  - doi:10.3166/dn.4.1-2.59-84
TITRE
Fragmentation et enrichissement de textes scientifique sus forme électronique

RÉSUMÉ

Les documents scientifiques électroniques sont fortement structurés dans leur organisation discursive par des contraintes rédactionnelles non totalement explicitées. Nous présentons ici une méthode exploratoire visant à développer une expertise dans la reconnaissance d’'indices textuels et d'’indices de mise en forme caractéristiques d’'une revue ou d'’un type de support. Cette expertise sera exploitée à des fins d'’identification d'’éléments utiles pour caractériser le document au travers de métadonnées exploitables par des nonspécialistes du domaine (profession de l’'auteur, communauté de l’'auteur…) et pour permettre le repérage de fragments caractéristiques du discours scientifique sur des critères non relatifs aux thèmes abordés dans les documents (résumé, objectif du travail, présentation de la méthode, expérimentation…). Le découpage et l’'enrichissement sont réalisés par le couplage d'’une méthode d'’analyse statistique de données textuelles (Alceste) qui identifie des indices textuels et les structures en classes stables, et d’'une analyse de la structure logique des documents.



ABSTRACT

Electronic scientific documents are strongly structured in their discursive organization by editorial constraints not completely clarified. We present here an exploratory method aiming at developing an expertise in the recognition of textual indices, and indices incoming from the layout of a review or a type of support. This expertise will be exploited at ends of identification of useful elements to characterize the document through metadata exploitable by non-specialists of the field (profession of the author, community of the author...) and to allow the location of fragments characteristic of the scientific speech, on criteria not relating to the topics of the documents (abstract, objective of work, presentation of the method, experimentation...) Cutting and enrichment are carried out by the coupling of a method of Statistical Analysis of Textual Data (Alceste) which organizes in stable classes the textual indices located, and of an analysis of the logic design of the documents.



AUTEUR(S)
Sylvie LAINÉ-CRUZEL, Eric GUINET

MOTS-CLÉS
information scientifique et technique, document électronique, structure logique,

KEYWORDS
scientific information, electronic document, logic design, non thematic indexing,metadata, textual data analysis.

LANGUE DE L'ARTICLE
Français

 PRIX
GRATUIT
   
ACCÉDER A L'ARTICLE COMPLET  (792 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier