Venice Time Machine : les bases du projet sont posées

Reconstitution 3D du quartier du  Rialto © EPFL / Venice Time Machine

Reconstitution 3D du quartier du Rialto © EPFL / Venice Time Machine

Des archives comptant parmi les plus anciennes et les plus complètes du monde sont en voie de digitalisation. La Fondation Lombard Odier devient partenaire financier du projet Venice Time Machine, lui donnant ainsi une impulsion décisive.


Un héritage culturel de plus d’un millénaire sera transformé en archives numériques ouvertes. Cette opération va non seulement préserver ce patrimoine mais également fournir un exceptionnel outil virtuel de navigation à travers l’histoire vénitienne. Nommé Venice Time Machine, ce projet réunit des chercheurs de l’EPFL et de l’Université Ca’Foscari, chargés de développer l’infrastructure et les technologies nécessaires pour convertir en un gigantesque système d’information l’énorme quantité de manuscrits administratifs des Archives d’Etat vénitiennes. Aujourd’hui, à Venise, la Fondation Lombard Odier a décidé de rejoindre le projet en tant que funding partner. Elle a sélectionné Venice Time Machine pour sa combinaison exemplaire entre art, histoire et science, et soutiendra les chercheurs dans leurs efforts pour le développement des outils de numérisation et d’exploitation de données.

Le projet a été lancé il y a une année dans le cadre d’un partenariat avec l’Université Ca’Foscari et les Archives d’Etat portant sur les Humanités digitales. Il a à ce jour impliqué plus d’une centaine de chercheurs et d’étudiants. Ceux-ci ont oeuvré d’arrache-pied pour développer son infrastructure générale, trier et regrouper les archives en fonction de leur format et définir une chaîne de travail adaptée à la digitalisation de masse. Venice Time Machine est soutenu par un comité international, composé d’experts renommés issus des universités de Stanford, Columbia, Princeton et Oxford. Ces experts supervisent les efforts menés pour faire du projet un outil fondamental dédié à l’étude de l’histoire de Venise, ancien empire méditerranéen.

L’HÉRITAGE: 80 kilomètres de documents interconnectés
Les Archives d’Etat vénitiennes contiennent une énorme quantité de documents rédigés à la main et dans des langues datant de l’époque médiévale au XXe siècle. On estime ces archives à environ 80 km de rayonnages, où reposent un millénaire de documents administratifs, allant de certificats de décès et de déclarations d’impôts à des cartes géographiques et des plans urbanistiques. Ces pièces sont souvent très délicates et parfois dans un état de conservation préoccupant.

La quantité, la diversité et la précision des documents de l’administration vénitienne sont uniques dans l’histoire du monde occidental. Recouper cette masse d’informations permet de reconstituer des pans entiers du passé de la cité, tels que des biographies complètes, les dynamiques politiques, voire même l’apparence de certains bâtiments ou de quartiers. « Ces documents sont intriqués de manière complexe, de sorte qu’une fois que l’on croise leurs références, on peut leur faire raconter une histoire beaucoup plus riche, explique Raffaele Santoro, directeur des Archives d’Etat de Venise. Tous les documents que nous avons ici sont en quelque sorte interconnectés. »

LA VISION : Venice Time Machine dans le cloud
Les historiens du monde entier doivent se déplacer physiquement à Venise pour consulter un nombre restreint de documents. Sera-t-il possible à l’avenir d’accéder à ces archives depuis n’importe quel ordinateur ? Pourrons-nous les parcourir en utilisant des mots-clés extraits de manière automatique, sachant que la plupart sont écrites à la main ? Pourra-t-on croiser les données de plans architecturaux de différentes périodes pour recomposer l’image des rues et canaux vénitiens tels qu’ils étaient il y a des centaines d’années ?

Avec Venice Time Machine, les archives trouveront sur le web une nouvelle existence virtuelle. Le passé de la cité sera réactualisé, que ce soit par la reconstitution d’arbres généalogiques et des organisations sociales d’autrefois, ou par la possibilité de visualiser son développement urbain. La numérisation de tous ces trésors ouvrira également de nouveaux champs de recherches. « Ce projet nous permet d’étudier des sujets jusque-là pratiquement inaccessibles », raconte Dorit Raines, historienne de l’Université Ca’Foscari, qui a entrepris de parcourir et recouper quelque 300'000 testaments, afin de retracer l’histoire de la propriété des biens précieux à travers les siècles.

LA TECHNOLOGIE : les données massives au service des archives
De nombreux défis technologiques doivent être relevés pour convertir cet exceptionnel héritage culturel en archives numériques. Il s’agit d’établir une chaîne de travail optimale pour une reconnaissance au plus juste des millions de documents. Pratiquement, la numérisation de masse implique non seulement de scanner systématiquement tous les anciens manuscrits, mais aussi de trouver le moyen de traiter automatiquement différents styles d’écriture et d’analyser plusieurs langues, dont le latin, qui ont sensiblement évolué au fil du temps.

Etant donné l’énorme quantité d’informations en présence, des techniques de gestion, d’extraction et de classification de données massives sont donc essentielles. C’est pourquoi Venice Time Machine a été conçu. Les algorithmes de reconnaissance automatique de textes sont par exemple continuellement adaptés et améliorés au fur et à mesure que la numérisation avance, et que s’enrichit la banque de données sur les Vénitiens et leur lieu de vie.

« Le but est de transformer tous ces dossiers en une base numérique du passé, dit Frédéric Kaplan, professeur à l’EPFL et responsable du projet. La bonne nouvelle, c’est que la masse de données ne représente pas un problème, mais au contraire une partie de la solution. »
La Fondation Lombard Odier est fière de rejoindre le projet Venice Time Machine en tant que funding partner. Ce soutien s’inscrit dans le cadre du programme « Fondation Lombard Odier – EPFL venture fund », dont le but est d’initier, financer et développer des initiatives stratégiques ambitieuses de l’Ecole. « Ce projet fait écho à notre histoire et à ce que nous souhaitons transmettre aux générations futures en tant qu’institution fondée en 1796, déclare Thierry Lombard, président de la fondation. Il fait oeuvre de pionnier dans le domaine des données massives et offre des opportunités extraordinaires et significatives pour notre civilisation ». Selon le président de l’EPFL, Patrick Aebischer, « cette collaboration est née d’une envie partagée de rendre hommage à la mémoire, passée ou à venir, grâce à la numérisation et à la gestion des Big Data. »