L'importance des annotations - Application à la classification des documents du web
L'usager du web se retrouve perdu dans son propre espace d'information, matérialisé en général par des signets ou bookmarks. Une classification automatique des documents semble à cet égard intéressante. Nous proposons un outil d'annotation permettant à l'utilisateur de personnaliser les documents. Nous montrons que le Document Object Model et Dynamic HTML sont nécessaires pour construire des outils d'annotation performants. Nous comparons ensuite des algorithmes de classification automatique utilisant d'une part les annotations, et d'autre part le texte intégral des documents. Nos résultats montrent que les classifications basées sur les annotations sont à la fois plus rapides et plus justes que celles basées sur le texte intégral des documents.
Users are lost in their own information space when they use current bookmark programs and automatic classification becomes important. Our approach is to use a web annotation tool so that users can personalise the documents they read. We show how the Document Object Model and Dynamic HTML are required to build efficient annotation tools. We then compare clustering algorithms when using the annotations or the fulltext of the documents. Our results show that annotation-based clustering is faster and provides better clusters than fulltext-clustering.
Laurent DENOUE, Laurence VIGNOLLET
annotation de documents, création de métadonnées, indexation automatique, classification automatique non supervisée.
document annotation, metadata creation, automatic indexing, clustering.
dn.revuesonline.com/revues/20/citation/309.html
Français
|