ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 19/2-3 - 2016  - pp.117-134  - doi:10.3166/dn.19.2-3.117-134
TITRE
Un modèle syllabique du français et de l’anglais pour la reconnaissance de l’écriture

TITLE
Syllabic model for french and english hanwriting recognition

RÉSUMÉ

Dans cet article nous introduisons une nouvelle méthode de modélisation du texte pour la reconnaissance de l’écriture. Une méthode de syllabation orthographique supervisée est proposée pour la construction d’un vocabulaire de syllabes. Un modèle de langage statistique en n-gram combinant syllabes et caractères est appris sur un corpus Wikipédia. Le système de reconnaissance d’écriture fondé sur des modèles optiques HMM de caractères procède alors à un décodage en deux passes en exploitant le modèle syllabique proposé. L’évaluation est réalisée pour le français et l’anglais, sur les bases RIMES et IAM respectivement, en analysant les performances pour différents taux de couverture des modèles syllabiques. Nous comparons le modèle proposé à un modèle lexical ainsi qu’à un modèle de caractères. L’approche proposée permet d’atteindre des performances intéressantes grâce à sa capacité à couvrir une proportion importante des mots hors lexique en travaillant avec un lexique de syllabes de taille limitée combiné à un modèle de n-gram d’ordre raisonnable.



ABSTRACT

In this paper, we introduce a new modeling method of texts for handwriting recognition. We propose a supervised syllabification approach for building a vocabulary of syllables. A statistical n-gram language model of syllables is trained on a Wikipedia corpus. The handwriting recognition system, based on optical HMM character models, performs a two pass decoding, integrating the proposed syllabic model. Evaluation is carried out for French and English using the RIMES and IAM datasets respectively, and by analysing the performance for various coverages of the syllable model. We also compare the model with lexicon and character n-gram models. The proposed approach achieves interesting performance thanks to its capacity to cover a large amount of out of vocabulary words while working with a limited amount of syllables combined with statistical n-gram of reasonable order.



AUTEUR(S)
Wassim SWAILEH, Thierry PAQUET

MOTS-CLÉS
syllabe, syllabation, reconnaissance de l’écriture manuscrite, modèle de langage.

KEYWORDS
syllable, syllabification, handwriting recognition, language model.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (456 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier