ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 20/2-3 - 2017  - pp.11-30  - doi:10.3166/dn.2017.00011
TITRE
Méthodologie pour identifier les terrains d’étude dans des corpus scientifiques

RÉSUMÉ

Le projet interdisciplinaire TERRE-ISTEX a pour objectif d’identifier l’évolution des fronts de recherche en relation avec les territoires d’études, les croisements disciplinaires ainsi que les modalités concrètes de recherche à partir des contenus numériques hétérogènes disponibles dans les corpus scientifiques. Le projet se décompose en trois actions principales : (1) identifier les périodes et les lieux qui ont fait l’objet d’études empiriques et dont rendent compte les publications issues des corpus analysés, (2) identifier les thématiques traitées dans le cadre de ces études et enfin (3) développer un démonstrateur web de recherche d’information géographique (RIG). Les deux premières actions font intervenir des approches combinant des patrons du traitement automatique du langage naturel à des méthodes de fouille de textes. En croisant les trois dimensions (spatial, thématique et temporel) dans un moteur de RIG, il sera ainsi possible de comprendre quelles recherches ont été menées sur quels territoires et à quel moment. Dans le cadre du projet, les expérimentations sont menées sur un corpus hétérogène constitué de thèses électroniques et d’articles scientifiques provenant des bibliothèques numériques d’ISTEX et du centre de recherche CIRAD.



ABSTRACT

The TERRE-ISTEX project aims at identifying the evolution of research working relation to study areas, disciplinary crossings and concrete research methods based on the heterogeneous digital content available in scientific corpora. The project is divided into three main actions : (1) to identify the periods and places which have been the subject of empirical studies, and which reflect the publications resulting from the corpus analyzed, (2) to identify the thematics addressed in these works and (3) to develop a web-based geographical information retrieval tool (GIR). The first two actions involve approaches combining Natural languages processing patterns with text mining methods. By crossing the three dimensions (spatial, thematic and temporal) in a GIR engine, it will be possible to understand what research has been carried out on which territories and at what time. In the project, the experiments are carried out on a heterogeneous corpus including electronic thesis and scientific articles from the ISTEX digital libraries and the CIRAD research center.



AUTEUR(S)
Eric KERGOSIEN, Marie-Noelle BESSAGNET, Maguelonne TEISSEIRE, Joachim SCHÖPFEL, Amin FARVARDIN, Stéphane CHAUDIRON, Bernard JACQUEMIN, Annig LE PARC-LACAYRELLE, Mathieu ROCHE, Christian SALLABERRY, J.-P. TONNEAU

MOTS-CLÉS
fouille de textes, traitement automatique du langage, recherche d’information géographique, scientométrie, analyse de documents. KEYWORDS: text mining, natural language processing, geographical information retrieval, scientometrics, document analysis. DOI: 10.3166/dn.2017.00011 © 2017 Lavoisier

KEYWORDS
text mining, natural language processing, geographical information retrieval, scientometrics, document analysis.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (1,26 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier