L’École nationale des chartes (Paris) lance un appel à communication pour le colloque « Documents anciens et reconnaissance automatique des écritures manuscrites » qui aura lieu les 23 et 24 juin 2022. Cette manifestation scientifique se déroulera selon des modalités mixtes avec une diffusion prévue sur Youtube.
Nombre de projets incluent aujourd’hui une étape d’acquisition automatique du texte dans leur chaîne de production ou d’exploitation des données. Plusieurs plateformes de transcription et différents moteurs HTR sont maintenant disponibles. L’intégration de cette technologie dans des chaînes de traitement de plus en plus efficaces a entraîné une automatisation des tâches qui remet en question la place du chercheur dans le processus d’établissement du texte. Cette nouvelle pratique, gourmande en données, rend pressant le besoin de rassembler, et donc d’harmoniser les corpus nécessaires à la constitution de corpus d’entraînement, mais aussi leur mise à disposition pour améliorer la qualité des résultats de l’HTR.
Organisé par l’École nationale des chartes (centre Jean Mabillon), en partenariat avec le LAMOP et le LabEX Hastec, ce colloque associera questions philologiques et techniques pour faire un état des lieux scientifique de l’HTR pour les documents anciens. Cela sera l’occasion de faire le point sur l’HTR et ses outils, ses résultats, ses apports et les nouvelles pratiques qu’induit son utilisation dans les projets d’édition et d’exploitation des documents.
Pour aborder ces problématiques, trois axes sont proposés :
— Axe 1 : Constitution des données d’entraînement et de modèles d’HTR (segmentation, transcription, constitution de corpus, partage, etc.)
— Axe 2 : Apprentissage machine, technologies, plateformes de transcription (présentation d’outils HTR et de leurs performances, présentation d’outils d’aide à la transcription)
— Axe 3 : Projet ou chaînes éditoriales utilisant l’HTR ; exploitations de données issues de l’HTR.
Les organisateurs du colloque espèrent que les communications et les échanges lors de cette rencontre pourront aboutir à la publication des Actes de ces journées.
Comité d’organisation : Ariane Pinche et Florianne Chiffoleau
Comité scientifique : Jean-Baptiste Camps, Alix Chagué, Thibault Clérice, Frédéric Duval, Vincent Jolivet, Benjamin Kiessling, Nicolas Perreaux, Ariane Pinche, Laurent Romary, Peter Stokes
Soumettre une proposition de communication
Les propositions de communication devront comprendre entre 750 et 1000 mots (hors bibliographie et illustrations). Elles pourront être faites en français ou en anglais et devront être envoyées jusqu’au 28 février 2022.
Pour toute demande de renseignement, vous pouvez écrire à l’adresse suivante : dahtr@sciencesconf.org