ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 16/2 - 2013  - pp.49-68  - doi:10.3166/dn.16.2.49-68
TITRE
Un modèle neuro markovien profond pour l’extraction de séquences dans des documents manuscrits

TITLE
A deep neuro markovian model for keyxord spotting in handwritten documents

RÉSUMÉ

Dans cet article, nous proposons un système d’extraction de mots clés dans des documents manuscrits. Notre approche est basée sur la reconnaissance des lignes de texte à l’aide d’un modèle HMM capable de rejeter les mots n’appartenant pas à un lexique prédéfini. Afin d’être plus discriminant, nous avons remplacé les mélanges de gaussiennes des HMM par un réseau de neurones profond pour calculer les probabilités a posteriori des observations. Nous montrons sur la base de documents des compétitions ICDAR 2009 l’intérêt de notre approche d’extraction d’information par rapport à une stratégie basée sur la reconnaissance intégrale du document. Les résultats montrent également l’apport de l’architecture profonde par rapport aux mélanges de gaussiennes.



ABSTRACT

In this paper, we propose a keyword extraction system able to extract keywords in handwritten documents. The base system rely on a HMM line model made of an Out-Of-KeyWord Vocabulary model and keywords model. In order to be more discriminant at the local level (the frame level), the standard gaussian mixture of the HMM are replaced by a deep neural network (DNN) for computing the observations probabilities. Experimentations are carried out on an unconstrained handwritten document database used for the 2009 ICDAR handwriting recognition competitions. The results demonstrate the interest of the keyword extraction system as opposed to the sequential integration strategy of full text recognition prior to the detection of keywords. We also show the benefit from using the deep architecture instead of the gaussian mixtures.



AUTEUR(S)
Simon THOMAS, Clément CHATELAIN, Thierry PAQUET, Laurent HEUTTE

MOTS-CLÉS
reconnaissance de l’écriture, keyword spotting, HMM, modèle hors lexique, architectures profondes, modèle hybride

KEYWORDS
offline handwriting recognition, keyword spotting, HMM, out-of-vocabulary model, deep neural network, neuro markovian model

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (2,24 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier