ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Document Numérique

1279-5127
 

 ARTICLE VOL 17/1 - 2014  - pp.37-60  - doi:10.3166/dn.17.1.37-60
TITRE
Nommage non supervisé des personnes dans les émissions de télévision. Utilisation des noms écrits, des noms prononcés ou des deux ?

TITLE
Unsupervised naming of persons in broadcast TV. Using written names, pronounced names or both?

RÉSUMÉ

L’identification de personnes dans les émissions de télévision est un outil précieux pour l’indexation de ce type de vidéos mais l’utilisation de modèles biométriques n’est pas une option viable sans connaissance a priori des personnes présentes dans les vidéos. Les noms prononcés ou écrits peuvent nous fournir une liste de noms hypothèses. Nous proposons une comparaison du potentiel de ces deux modalités (noms prononcés ou écrits) afin d’extraire le nom des personnes parlant et/ou apparaissant. Les noms prononcés proposent un plus grand nombre d’occurrences de citation mais les erreurs de transcription et de détection de ces noms réduisent de moitié le potentiel de cette modalité. Les noms écrits bénéficient d’une amélioration croissante de la qualité des vidéos et sont plus facilement détectés. Par ailleurs, l’affiliation aux locuteurs/visages des noms écrits reste plus simple que pour les noms prononcés.



ABSTRACT

Persons identification in TV broadcast is a valuable tool for indexing these videos but the use of biometric models is an unsustainable option without a priori knowledge of people present in the videos. The names pronounced or written on the screen can provide us a list of hypotheses names. We propose a comparison of the potential of these two modalities (names pronounced or written) to extract the true names of the speakers and/or faces. The names pronounced offer many instance of citation but transcription and detection errors of these names halved the potential of this modality. The names written benefits of the video quality improvement and they are easy to find. Moreover, the affiliation to speakers/faces of names written is simpler than for names pronounced.



AUTEUR(S)
Johann POIGNANT, Laurent BESACIER, Georges QUÉNOT

MOTS-CLÉS
identification des personnes, multi-modalité, ROC1, RAP.2

KEYWORDS
person identification, multi-modality, OCR1, ASR2.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (8,11 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier