Documents manuscrits et recherche d'information
Nous présentons un modèle de recherche d'information visuelle adapté à la navigation et l'interrogation de bases de documents manuscrits numérisés. Nous considérons ces documents du point de vue de leur contenu graphique, ce qui inscrit cette problématique dans un cadre d'identification du scripteur. Un certain nombre de travaux ont abordé ce problème d'identification du scripteur, le plus souvent en s'appuyant sur des techniques d'analyse de textures pour caractériser les écritures. L'originalité des travaux que nous présentons tient au fait que nous fondons notre démarche sur une technique de recherche d'information en utilisant une description spécifique à l'écriture manuscrite. L'approche est évaluée sur deux bases de documents manuscrits : une base créée au laboratoire et une base du patrimoine littéraire constituée des correspondances de Zola.
We present a Visual Information Retrieval model dedicated to the browsing and the query in large databases of handwritten document images. As we consider these documents from their graphical content point of view, our problem comes obviously within the framework of writer identification. The writer identification problem has given rise to numerous studies, most often based on texture analysis to characterise handwritings. The originality of our work lies in the use of an information retrieval technique and a particular description of cursive handwritings. Our approach has been evaluated on two handwritten document databases : one is a self-created database, the other is a literary heritage database which consists of Zola's correspondences.
Ameur BENSEFIA, Thierry PAQUET, Laurent HEUTTE
documents manuscrits, patrimoine littéraire, identification du scripteur, recherche d'information, modèle vectoriel, requête graphique.
Handwritten documents, literary heritage, writer identification, information retrieval, vector space model, graphical query.
Français
|