ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 7/3-4 - 2003  - pp.61-84  - doi:10.3166/dn.7.3-4.61-84
TITRE
Accès par le contenu aux documents manuscrits d'archives numérisés

RÉSUMÉ

Cet article présente l'accès par le contenu aux documents d'archives manuscrits. Cet accès doit s'appuyer sur des informations (annotations) associées aux images de documents. Nous proposons deux manières complémentaires de produire ces annotations : automatiquement en utilisant la reconnaissance de documents, et collectivement sur internet par une saisie manuelle effectuée par les lecteurs eux-mêmes. Une plate-forme de gestion de ces annotations est présentée, ainsi que des exemples d'annotations automatiques sur des registres paroissiaux et d'état civil, des formulaires militaires (registres matricules) et des décrets de naturalisation, en utilisant une méthode générique de reconnaissance de documents. Cette méthode a été validé sur plus de 60 000 pages de documents. Des exemples d'annotations collectives construites sur des annotations automatiques sont donnés.



ABSTRACT

This paper presents handwritten archives document retrieval by content. This retrieval is build on information (annotations) associated to document images. We propose two complementary ways of producing those annotations : automatically by using optical document recognition and collectively by using internet and a manual input by users. A platform for managing those annotations is presented as well as examples of automatic annotations on civil status registers, military forms and naturalization decrees, using a generic document recognition method. This method has been tested on more than 60,000 pages of documents. Examples of collective annotations built on automatic annotations are also given.



AUTEUR(S)
Bertrand COÜASNON, Jean CAMILLERAPP

MOTS-CLÉS
annotations, accès par le contenu, documents manuscrits, reconnaissance de documents, généricité, tableaux, formulaires, gestion des connaissances a priori, grammaire, reconnaissance de l'écriture manuscrite.

KEYWORDS
annotations, content retrieval, handwritten documents, documents analysis, genericity, table-form, a priori knowledge, grammar, handwriting recognition.

LANGUE DE L'ARTICLE
Français

 PRIX
GRATUIT
   
ACCÉDER A L'ARTICLE COMPLET  (1,31 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier