ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 7/3-4 - 2003  - pp.127-142  - doi:10.3166/dn.7.3-4.127-142
TITRE
Numérisation et codage des caractères de livres anciens

RÉSUMÉ

La numérisation des livres anciens n'a pas été abordée aussi bien que celle des ouvrages manuscrits anciens, du moins en ce qui concerne les caractères. Or, avant de faire de la reconnaissance de caractères, encore faut-il avoir un certaine connaissance de ceux-ci. Par ailleurs, restituer un ouvrage avec ses caractéristiques typographiques peut induire des recherches qui sinon seraient impossibles. Nous présentons alors le projet Cassetin dont le but est de faire un inventaire des caractères d'imprimerie utilisés depuis le XVe siècle et de proposer une normalisation de leur codage (sous forme d'entités ou de caractères au sens d'Unicode) de façon à rendre portables les sorties d'OCR.



ABSTRACT

Digitalization of ancient books is far less concerned with characters than digitalization of ancient manuscripts. However, before recognition you need cognition. Furthermore, new researches may be launched from texts marked with typographic tags and would be quite impossible without the actually used types. The Cassetin project is proposed to make the inventory of types used from the 15th century and to establish an encoding (either as entities or as Unicode codes when available). This is a way to make OCRs' output more portable.



AUTEUR(S)
Jacques ANDRÉ

MOTS-CLÉS
caractère, codage, glyphe, ligatures, livres anciens, normes, OCR, projet Cassetin, typographie, Unicode.

KEYWORDS
ancient books, Cassetin project, characters, encoding, glyph, ligature, OCR, standard, Unicode.

LANGUE DE L'ARTICLE
Français

 PRIX
GRATUIT
   
ACCÉDER A L'ARTICLE COMPLET  (362 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier