L’océrisation : technologie 2.0 et lecture de textes anciens

Publié le 09/01/2019 par Claire Loup
Catégorie

Encore peu connue du grand public, l’OCR, pour Optical Character Recognition – Reconnaissance optique de caractères, en français - est un procédé informatique qui vise à transformer un fichier d’images de textes imprimés ou dactylographiés en un fichier texte. 

Le logiciel d’OCR permet donc une recherche plein texte par mots-clés comme on le ferait dans un fichier Word, mais sur du matériel brut numérisé (presse ancienne, almanachs…) 

Ce précieux dispositif a été pensé pour que chercheurs, étudiants et curieux de tout poil puissent avoir accès à la lecture de textes anciens imprimés sur des papiers d’une extrême fragilité et dont la manipulation n’est plus possible. On retrouve son utilisation dans des domaines variés comme l’édition, la généalogie ou encore l’exploration d’anciens registres religieux. L’océrisation (néologisme qui vient donc d'OCR, "océère"...) permet également aux bibliothèques ou services d’archives de mettre en valeur leurs collections de textes anciens.

 

Les Archives Départementales de Loire Atlantique – ADLA - font ainsi l’objet depuis 2010 d’un vaste chantier de reconnaissance optique de la presse ancienne régionale (antérieure à 1940), qui a permis à ce jour la mise en ligne de 380 titres de journaux, soit plus d’un million de pages consultables numérisées en très haute qualité. 
Ce projet a pris la forme d’une collaboration régionale et a donné lieu à des partenariats avec les archives et la bibliothèque municipales de Nantes, le Centre d’Histoire du Travail – CHT- l’Écomusée de Saint-Nazaire et quelques associations, rendant possible entre eux de nombreux prêts de fragments de collections numérisés, océrisés et archivés sous formes de fichiers numériques précieusement conservés par les uns et les autres. 

Si le CHT a réuni une presse axée sur l’histoire sociale et ouvrière de la région, laissant le soin à la bibliothèque et aux archives municipale de Nantes de mettre en avant des titres spécifiquement nantais, les ADLA ont pour leur part constitué un corpus plus large dédié à la presse départementale. 

Ainsi, par le biais d’un outil de publication pensé pour rendre la consultation de ces articles aussi fluide qu’efficace (recherche par titre, par date, possibilité de se créer un album pour conserver ses lectures…) les ADLA rendent possible la lecture de nombreux journaux portant notamment sur l’économie sociale et commerciale – le plus ancien d’entre eux date de 1760 et porte sur l’activité portuaire de Nantes. 

De nombreux titres concernent par ailleurs le début du XXe siècle, période qui correspond historiquement au développement de la presse. 

Ainsi, dans l’onglet presse Politique et opinions du site internet des ADLA des journaux républicains comme L’Ami de la charte ou Le travailleur de l’Ouest rivalisent avec leurs adversaires politiques et idéologiques, représentés par des journaux très conservateurs - voire royalistes - comme L’Union bretonne ou l’Ami de la vérité. (À noter que dans cette catégorie de presse, le célèbre Phare de la Loire, principal quotidien nantais de 1852 à 1944 sera très prochainement en ligne.)

 

(Re)découvrir des pans entiers de notre patrimoine et de notre histoire, avoir accès à ces lectures rares est, grâce à l’océrisation, désormais possible pour toutes et tous.