ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 21/3 - 2018  - pp.33-53  - doi:10.3166/dn.21.3.33-53
TITRE
Qualité de l’information dans les réseaux sociaux : une méthode collaborative pour détecter les spams dans les tweets

TITLE
Quality of information in the social networks: a collaborative method to detect spam in tweets

RÉSUMÉ

Détecter les actions des utilisateurs mal intentionnés dits "spammeurs" est un réel défi pour maintenir un haut niveau de performance dans les applications mises en œuvre dans les réseaux sociaux. Les méthodes conventionnelles de détection de spams imposent des délais de traitement importants et inévitables, allant jusqu’à des mois pour traiter de grandes collections de tweets. Ces méthodes entièrement dépendantes de l’approche d’apprentissage supervisé pour la classification, requièrent un ensemble de données vérité terrain qui n’est pas disponible pour ce type d’applications. Nous proposons donc une méthode basée sur un modèle linguistique non supervisé qui effectue une collaboration avec d’autres réseaux sociaux pour détecter les tweets spam à partir des hashtags utilisés. Notre méthode a été expérimentée sur plus de 6 millions de tweets postés dans 100 "thématiques tendances". Facebook est utilisé en parallèle comme vérité terrain permettant ainsi la collaboration de deux réseaux sociaux différents. Nos expérimentations démontrent une efficacité en ce qui concerne le temps de traitement et la performance de classification, par rapport aux méthodes classiques de détection de spam dans les tweets.



ABSTRACT

Detecting the actions of malicious users called "spammers" is a real challenge to maintain a high level of performance in applications implemented in social networks. Conventional spam detection methods impose large and unavoidable processing time, for example up to months for processing large collections of tweets. These methods entirely depend on the supervised learning approach for classification, and require a set of ground truth data that is not available for this type of applications. We propose a method based on an unsupervised linguistic model that collaborates with other social networks to detect spam tweets from used hashtags. Our method has been experimented on more than 6 million tweets posted on 100 trending topics. Facebook is used in parallel as the ground truth allowing the collaboration of two different social networks. Our experiments show an efficiency with regard to processing time and classification effectiveness, compared to the conventional methods for detecting spams in tweets.



AUTEUR(S)
Mahdi WASHHA, Manel MEZGHANI, Florence SÈDES

MOTS-CLÉS
spam social, réseaux sociaux, collaboration, thématiques tendances.

KEYWORDS
social spam, social networks, collaboration, trending topics.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (762 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier