ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 8/3 - 2004  - pp.35-54
TITRE
Un modèle de mixture de modèles génératifs pour les documents structurés multimédias. Application à la classification de documents XML et HTML

RÉSUMÉ

Nous présentons un modèle général permettant la classification supervisée de documents structurés multimédias. Nous proposons un modèle génératif basé sur les réseaux bayésiens afin de modéliser les documents de type XML ou HTML. Nous étudions une extension de ce modèle génératif en modèle discriminant à l'aide du formalisme des noyaux de Fisher. Enfin, nous testons notre modèle sur trois grands corpus de documents.

ABSTRACT

We present a general model for the supervised classification of multimedia structured documents. We propose a generative model based on the belief network formalism in order to model XML or HTML documents. We transform our generative model into a discriminant one using the Fisher Kernel method. Then, we test this model using three information retrieval documents databases

AUTEUR(S)
Ludovic DENOYER, Patrick GALLINARI

MOTS-CLÉS
classification, documents structurés, XML, documents multimédias, réseaux bayésiens, apprentissage.

KEYWORDS
classification, structured documents, XML, multimedia documents, belief networks, machine learning.

LANGUE DE L'ARTICLE
Français

 PRIX
GRATUIT
   
ACCÉDER A L'ARTICLE COMPLET  (620 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier