ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 20/2-3 - 2017  - pp.31-78  - doi:10.3166/dn.2017.00012
TITRE
Le corpus NLP4NLP pour l’analyse bibliométrique de 50 années de recherches en traitement automatique de la parole et du langage naturel

RÉSUMÉ

Nous avons constitué le corpus NLP4NLP pour étudier le contenu des publications scientifiques dans le domaine du traitement automatique de la parole et du langage naturel. Il contient les articles publiés dans 34 conférences et revues principales du domaine, sur une période de 50 ans (1965-2015), comprenant 65 000 documents, rassemblant 50 000 auteurs, incluant 325 000 références et représentant environ 270 millions de mots. Nous avons conduit différentes études sur ces données : évolution au fil du temps du nombre d’articles et d’auteurs, collaborations entre auteurs, citations entre papiers et entre auteurs, évolution des thèmes de recherche et identification des auteurs qui les ont introduits, détection des innovations et des ruptures épistémologiques, utilisation des ressources linguistiques, réutilisation des articles et plagiat, tout ceci dans le cadre d’une analyse globale ou comparative entre sources.



ABSTRACT

We have created the NLP4NLP corpus to study the content of scientific publications in speech and natural language processing. It contains articles published in 34 major conferences and journals in this field over a period of 50 years (1965-2015), comprising 65,000 documents, gathering 50,000 authors, including 325,000 references and representing approximately 270 million words. We have conducted various studies on this data: evolution over time of the number of articles and authors, collaborations between authors, citations between papers and authors, evolution of research topics and identification of the authors who introduced them, detection of innovations and epistemological ruptures, use of language resources, reuse of articles and plagiarism, all this in the context of a global or comparative analysis between sources.



AUTEUR(S)
Joseph MARIANI, Gil FRANCOPOULO, Patrick PAROUBEK

MOTS-CLÉS
traitement de la parole, traitement du langage naturel, analyse de textes, bibliométrie, scientométrie.

KEYWORDS
speech processing, natural language processing, text analytics, bibliometrics, scientometrics.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (2,86 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier