De la préservation à l'ouverture : données du bâti et Open Science

© 2025 EPFL

© 2025 EPFL

Le congrès « Digitalizza la cultura 2025 » a permis aux ACM de partager leur expérience autour de la préservation et de la mise en valeur des archives numériques d’architecture.
En écho à l’EPFL Data Week et à la Journée mondiale de la préservation numérique, ces réflexions poursuivent leur chemin entre recherche, technologie et pratiques numériques.

Créées à la fin des années 1980 au sein de ce qui est aujourd’hui la Faculté ENAC de l’EPFL, les Archives de la construction moderne (ACM) ont pour mission de collecter, conserver et rendre accessibles les fonds d’architectes, d’ingénieurs et d’autres acteurs du monde de la construction. Situées à l’intersection entre mémoire patrimoniale et recherche scientifique, elles assument une double fonction : préserver un patrimoine technique et culturel de grande valeur, tout en traduisant les exigences de conservation en formes d’accès et de réutilisation compatibles avec les pratiques de la recherche contemporaine.

Du papier au numérique : relever le défi de la transformation et de la gestion de 4 téraoctets de données

Ce travail s’inscrit dans un contexte de profonde transformation numérique touchant l’ensemble de la société et, plus particulièrement, les domaines de l’architecture et de l’ingénierie. Alors que les archives reçues jusqu’à récemment étaient presque exclusivement sur support papier, l’acquisition de fonds provenant d’une nouvelle génération de professionnels ayant travaillé dans l’environnement numérique et aujourd’hui en fin de carrière a marqué un tournant : depuis 2020, les versements sont souvent hybrides, mêlant documents analogiques et fichiers numériques. Pour accompagner cette transformation, une étude menée dans le cadre d’un travail de Bachelor en Information documentaire à la HEG de Genève a donné lieu à une analyse de ces nouveaux fonds, laquelle a révélé plus de 4 téraoctets de données répartis entre serveurs et 430 CD-R/DVD-R.

Cette analyse a fourni un diagnostic concret et les premières recommandations pour une stratégie durable de préservation numérique adaptée aux archives d’architecture.

Dimensions de la préservation numérique : obsolescence et instabilité, intégrité des données et accès

L’une des principales difficultés rencontrées concerne l’obsolescence des formats numériques. Contrairement aux documents sur papier, lisibles pendant des décennies s’ils sont bien conservés, les fichiers numériques dépendent entièrement du matériel et des logiciels utilisés pour les créer. Les formats et programmes évoluent rapidement, rendant les anciens fichiers parfois illisibles. Pour garantir leur accessibilité dans le temps, il est donc nécessaire de migrer régulièrement les données vers des formats ouverts et durables. À cette instabilité s’ajoute la fragilité des supports : serveurs, CD ou disques durs peuvent se détériorer ou devenir obsolètes, d’où la nécessité d’un contrôle constant, de copies de sécurité et d’une vérification systématique de l’intégrité des données.

Préserver un fichier numérique ne consiste donc pas uniquement à en sauvegarder le contenu, mais aussi à conserver son contexte interprétatif – l’ensemble des métadonnées qui en décrivent la structure, la provenance et la logique de visualisation – afin d’en garantir l’intelligibilité et la valeur documentaire dans le temps.

Archives numériques d’architecture : complexité, formats et dépendances technologiques

Aujourd’hui, les archives numériques d’architecture rassemblent une grande diversité de formats : fichiers techniques, modèles 3D, images, PDF, documents bureautiques, etc. L’analyse de deux fonds hybrides récents – Renato Salvi (402 Go, 144 000 fichiers) et Rodolphe Luscher (516 Go, 151 000 fichiers) – illustre cette complexité, soulignant la nécessité de préserver non seulement les fichiers eux-mêmes, mais aussi leur contexte interprétatif et leurs métadonnées. Avec la diffusion des logiciels de conception assistée par ordinateur (CAO/CAD) et, plus récemment, des systèmes de modélisation des bâtiments (BIM), la production architecturale s’est en effet profondément transformée. Chaque fichier CAO, par exemple, peut contenir de multiples layers (structures, installations, finitions, mobilier), souvent liés à des bibliothèques externes ou à des références croisées, ce qui complique l’identification d’une version originale ou définitive. Cette évolution a offert de nouvelles capacités de simulation et d’analyse, mais aussi de fortes dépendances technologiques, qui posent problème pour la survie des fichiers.

Le projet CA–O–RD: Contemporary Architecture – Open Research Data

C’est dans ce contexte qu’a été lancé, en 2024, le projet CA–O–RD, soutenu par le programme ORD du Conseil des EPF et par l’unité ENAC-IT4Research, qui assure le soutien technique et informatique nécessaire au développement et à la mise en œuvre de l’infrastructure numérique. Il repose sur deux outils complémentaires : Morphé/AtoM, plateforme de description archivistique conforme aux standards internationaux adoptée en 2018, et Archivematica, solution de préservation numérique à long terme fondée sur le modèle international OAIS (Open Archival Information System, ISO 14721), qui définit les principes garantissant dans le temps l’authenticité, la lisibilité et l’accessibilité des contenus numériques. Ce logiciel open source met en œuvre ces principes au moyen d’une chaîne de traitements automatisés : chaque fichier entrant est vérifié, son format identifié et, si nécessaire, converti vers une version stable et ouverte. Le processus se conclut par la création d’un paquet d’archivage (AIP) contenant le fichier et ses métadonnées, puis d’un paquet de diffusion (DIP) relié aux descriptions archivistiques dans Morphé/AtoM, assurant ainsi la cohérence, la traçabilité et l’intelligibilité des documents conservés.

Les métadonnées comme ressource pour la recherche : pratiques et perspectives

Avec l’intégration complète d’Archivematica et de Morphé, le projet CA–O–RD entre dans une nouvelle phase, centrée sur la valorisation des métadonnées comme ressource pour la recherche. Dans la continuité des principes de l'open science, les ACM s’inspirent aux principes FAIR (Findable, Accessible, Interoperable, Reusable) pour structurer et ouvrir leurs données numériques. L’objectif est de rendre les métadonnées plus cohérentes, lisibles et exploitables : éliminer les redondances, harmoniser le langage descriptif, extraire les entités clés et les relier à des vocabulaires contrôlés, afin de renforcer leur interopérabilité sémantique et leur lisibilité par les machines, condition préalable à leur intégration dans les écosystèmes de données de la recherche.

L'institution se dote ainsi d’un outil durable pour la gestion, la structuration et la valorisation du patrimoine numérique de l’architecture contemporaine. Au-delà de la conservation, ce dispositif ouvre la voie à de nouvelles formes de recherche interdisciplinaire et de production de savoir, fondées sur la qualité et la réutilisabilité des données.

.

« Digitalizza la cultura 2025 : Partecipazione, diversità e patrimoni digitali », Manno (TI), 30 octobre 2025
sur initiative du Dipartimento dell'educazione, della cultura e dello sport (DECS) du Canton du Tessin, Divisione della cultura e degli studi universitari (DCSU) et réalisée par le Ufficio dell’analisi e del patrimonio culturale digitale (UAPCD)
en collaboration avec le Bachelor en Leisure Management de la Scuola universitaria professionale della Svizzera italiana (SUPSI)

CA-O-RD
Un projet des Archives de la construction moderne (ACM) de la faculté ENAC, en collaboration avec l'unité ENAC-IT4Research
Team :
– Salvatore Aprea (2024-08.2025), directeur - ACM ; Cyril Veillon (09.2025-), directeur - ACM/Archizoom
– Yonathan Seibt (2024), Kethsana Muong (2025), Barbara Galimberti (2024-), archivistes - ACM ;
– Hugo Solleder (2024-), ingénieur en logiciel de recherche - ENAC-IT4R ; Nicolas Dubois (2024-), ingénieur ETS/HES - ENAC-IT