top of page
Traits de lumière abstraits

Comment la BnF valorise les illustrations de son patrimoine Gallica grâce à l’IA

Problématiques client

La BnF devait relever un défi majeur : exploiter et valoriser un immense volume de données patrimoniales issues de Gallica, tout en facilitant leur accès et leur exploration pour le monde de la recherche et le grand public. Les méthodes traditionnelles d’indexation manuelle ou semi-automatique ne permettaient pas de traiter efficacement la diversité et le volume des contenus, ni de générer une base d’illustrations riche et facilement exploitable.

Le défi : transformer les données massives et hétérogènes des collections numérisées en informations structurées et accessibles, tout en automatisant l’extraction et l’indexation, et en garantissant une exploitation fluide par les équipes internes et par les utilisateurs externes.

Objectifs

Qualifier les contenus

Améliorer le signalement des documents et enrichir les métadonnées existantes pour faciliter la recherche et l’exploitation des fonds.

Assister l’extraction des illustrations

Identifier automatiquement les illustrations présentes dans les documents numérisés et les isoler pour leur indexation.

Créer une base de données accessible

Structurer et rendre disponible une base d’illustrations via une API grand public, pour la recherche scientifique et l’exploration culturelle.

Automatiser l’indexation

Garantir un traitement rapide et standardisé de millions de pages, avec une indexation descriptive fiable et exploitable.

Les contraintes du projet

Notre approche pour BnF

01

Analyse exploratoire et extraction documentaire

Utilisation de techniques avancées d’OCR, de détection et segmentation d’images pour identifier les illustrations et extraire les informations pertinentes à partir des documents numérisés.

02

Indexation intelligente et descriptive

Application de modèles d’IA pour enrichir automatiquement les métadonnées, créer des tags descriptifs et organiser les illustrations selon des critères thématiques, temporels et stylistiques.

03

Création de la base accessible via API

Développement d’une infrastructure de base de données permettant un accès rapide et sécurisé, avec API publique pour chercheurs et grand public, et interfaces internes pour les équipes BnF.

Contactez-nous

Faisons de votre projet une réussite!
Discutons-en. 

bottom of page