ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 19/2-3 - 2016  - pp.95-115  - doi:10.3166/dn.28.2-3.95-115
TITRE
Exploitation de l’échelle d’écriture pour améliorer la reconnaissance automatique des textes manuscrits arabes

TITLE
Writing scale exploitation to improve automatic recognition of arabic handwritten texts

RÉSUMÉ

Plusieurs facteurs inhérents à l’écriture augmentent la complexité de la reconnaissance automatique de documents manuscrits, comme la taille de l’écriture. Dans ce travail nous nous intéressons à la prise en compte de tels facteurs dans la modélisation afin d’améliorer la performance des systèmes automatiques. Les expérimentations ont été conduites sur des textes manuscrits arabes extraits de l’une des plus grandes bases étiquetées de documents manuscrits arabes, la base de données NIST-OpenHaRT qui inclut de grandes variabilités dans la taille du texte inter et intra mots et lignes. Nous proposons plusieurs approches pour faire face à ces variations lors des deux phases d’apprentissage et de reconnaissance. Les premières expérimentations montrent que la reconnaissance est largement affectée par la taille d’écriture. Pour prendre en compte ce paramètre nous proposons de classifier les données en trois classes selon la taille. En phase de reconnaissance, nous avons redimensionné chaque donnée de test à plusieurs tailles prédéfinies, puis nous avons combiné les scores de reconnaissance associés à chacune des tailles. Cette approche a permis des gains notables de performance de deux systèmes de reconnaissance, HMM et BLSTM. De plus, nous avons intégré des données artificiellement redimensionnées pour adapter les modèles HMM à différentes échelles. Nous avons aussi obtenu des gains de performance par deux méthodes différentes de combinaison (ROVER, treillis) des résultats des modèles adaptés. Nous fournissons les résultats de reconnaissance obtenus qui montrent les avantages de l’exploitation de la taille d’écriture.



ABSTRACT

Several inherent factors increase the complexity of automatic recognition of handwritten documents, such as the size of writing. In this work we are interested in considering such factors in modeling, to improve the performance of automatic systems. The experiments were conducted on Arabic handwritten documents from one of the largest labeled Arabic handwriting databases, NIST-OpenHaRT. The database includes large inter- and intra- variability in the text size. We propose several approaches to deal with these changes in both training and recognition phases. The first experiments show that the recognition is largely affected by the writing size. To account for this parameter, we propose to classify data into three classes ac- cording to the writing size. In the recognition phase, we have resized each text-line image into several versions of predefined sizes, then we combined the recognition scores for each size. This approach has significant performance gains for both a HMM-based and a BLSTM-based re- cognition systems. In addition, we integrated synthetic data to adapt HMM models at different scales. We also obtained performance gains by two different combination methods (ROVER, trellis) on the adapted models results. We provide the obtained recognition results showing the benefits of exploiting the writing size



AUTEUR(S)
Edgard CHAMMAS, Chafic MOKBEL, Laurence LIFKORMAN-SULEM

MOTS-CLÉS
base de données OpenHaRT, reconnaissance de l’écriture arabe, échelle de l’écriture, données synthétiques, adaptation. KEYWORDS: OpenHaRT database, arabic handwriting recognition, writing scale, synthetic data, adaptation.

KEYWORDS
OpenHaRT database, arabic handwriting recognition, writing scale, synthetic data, adaptation.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (566 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier