Les données numériques pour analyser les épidémies du passé
Des chercheurs de l’EPFL se sont servis d’archives historiques numérisées pour offrir de nouvelles perspectives sur la propagation de la peste bubonique à Venise.
La pandémie de COVID-19 a été marquée par la peur et l’incertitude, dues au fait que les données fiables nécessaires à la prise de décisions importantes en matière de santé et de politique sont souvent difficiles à obtenir et coûteuses. Néanmoins, les données qui sont disponibles ont aidé les pays à comprendre et à gérer la propagation du nouveau coronavirus, à un degré qui serait inimaginable pour les populations de l’époque de la « deuxième pandémie » de peste bubonique.
C’est la dynamique de l’une des épidémies de cette « deuxième pandémie » à Venise que les chercheurs du Laboratoire des humanités digitales (DHLab) du Collège des Humanités de l’EPFL, dirigé par Frédéric Kaplan, et du Digital Epidemiology Lab de la Faculté des sciences de la vie, dirigé par Marcel Salathé, ont choisi d’étudier. Il se sont basés sur des registres de décès quotidiens (ou nécrologies) nouvellement collectés et numérisés, provenant des archives patriarcales de la ville. Ils ont utilisé des techniques de sciences des données pour analyser la propagation de la peste bubonique, causée par la bactérie Yersinia pestis, dans la ville italienne entre 1630 et 1631.
« Il aura fallu plus de cinq ans pour recueillir, annoter et modéliser les données, mais les résultats montrent que de précieuses données scientifiques peuvent être extraites de documents d’archives centenaires. Ces « Big Data du passé » peuvent changer notre point de vue sur les phénomènes étudiés actuellement», indique Frédéric Kaplan.
Les chercheurs ont notamment identifié deux pics de décès distincts, qu’ils expliquent en se basant sur des modèles computationnels de la dynamique des maladies. Leur travail a été publié en octobre dans Scientific Reports, la revue en libre-accès de Nature Research.
Un pic et une traîne
Les chercheurs ont découvert que les nécrologies de Venise (qui représentent sans doute juste une partie des registres mortuaires complets de l’époque) indiquent plus de 43'000 décès, probablement causés en majorité par la peste, en seulement deux ans. Des chiffres cohérents avec le taux de mortalité de près de 35% de l’époque. Les chercheurs ont utilisé des techniques de sciences des données et de modèles de calculs pour simuler la propagation rapide de la maladie au sein de la population.
Plus intéressant encore, l’équipe de chercheurs a remarqué que les décès semblaient suivre un schéma nouveau : un premier pic en 1630 avec plus de 400 décès par jour à son paroxysme, suivi d’un pic moins élevé mais plus long en 1631. Ils notent que c’est la première fois qu’une si « longue traîne de mortalité élevée » est observée dans la littérature touchant à ce domaine.
L’hypothèse qu’ont fait les chercheurs est que ce phénomène “en deux temps” pourrait être dû soit à un nombre de décès faussement attribués à la peste, soit à deux épidémies de peste distinctes (l’une bubonique et l’autre pneumonique par exemple). Ils notent également que le modèle observé découle peut-être du comportement changeant des habitants de Venise en réaction à l’épidémie, qui pourrait avoir influencé le taux de transmission de la maladie.
Les chercheurs concluent que ce travail d’investigation souligne l’importance à la fois des archives numérisées pour la compréhension de l’impact social des phénomènes historiques, ainsi que celle de la collecte de données numériques en tant qu’outil pour étudier les modèles globaux de propagation des maladies et les dynamiques locales.
« C’est absolument fascinant d’observer des courbes épidémiques datant d’il y a plusieurs centaines d’années » réagit Marcel Salathé. Ce travail de recherche est un premier pas vers une compréhension épidémiologique plus détaillée de ces épidémies. »
Lazzari, G., Colavizza, G., Bortoluzzi, F. et al. A digital reconstruction of the 1630–1631 large plague outbreak in Venice. Sci Rep 10, 17849 (2020). https://doi.org/10.1038/s41598-020-74775-6