La médecine de précision progresse grâce à la cryptographie
La médecine personnalisée devrait révolutionner les soins de santé. Une nouvelle plate-forme cryptographique permet l'agrégation et l'analyse d'énormes bases de données, sans compromis sur la préservation des informations personnelles. Elle est décrite dans Nature Communications.
La médecine prédictive, préventive, personnalisée et participative, connue sous le nom de P4, représente les soins de santé de demain. Afin d’accélérer son adoption et de maximiser son potentiel, les données cliniques concernant de nombreux individus doivent être partagées efficacement entre tous les intervenants. Mais les données sont difficiles à rassembler. Elles sont cloisonnées dans les hôpitaux, les cabinets et les cliniques du monde entier. Les risques pour la vie privée liés à la divulgation de données médicales sont également très préoccupants. En l’absence de technologies efficaces de protection de la vie privée, ils sont devenus un obstacle aux progrès de la médecine P4.
Les approches actuelles n’offrent qu’une protection limitée de la vie privée des patients en obligeant les institutions à partager les résultats intermédiaires, d’où le risque de fuite de données sensibles sur les patients, ou bien elles sacrifient la précision des résultats en introduisant du bruit dans les données pour limiter les fuites potentielles
Aujourd’hui, des chercheurs du Laboratoire de protection des données de l’EPFL, en collaboration avec des collègues du Centre hospitalier universitaire vaudois (CHUV), du MIT CSAIL et du Broad Institute du MIT et de Harvard, ont mis au point «FAMHE». Ce système d’analyse fédéré permet à différents prestataires de soins de santé de procéder à des analyses statistiques et de développer des modèles d’apprentissage machine selon une approche collaborative, sans avoir à échanger les ensembles de données sous-jacents. FAHME est un bon compromis entre la protection des données, la précision des résultats de recherche et le temps de calcul pratique – trois critères essentiels dans le domaine de la recherche biomédicale.
Dans un article qui vient d’être publié dans Nature Communications, l’équipe de recherche explique que la différence fondamentale entre FAMHE et les autres approches qui tentent de surmonter les problèmes de confidentialité et de précision est que FAMHE fonctionne à grande échelle et que sa sécurité a été mathématiquement prouvée, ce qui est indispensable en raison du caractère sensible des données.
Efficacité démontrée
Dans deux déploiements prototypiques, FAMHE a reproduit avec précision et efficacité deux études multicentriques publiées – qui reposaient sur la centralisation des données dans un cadre légal sur mesure –, notamment l’analyse de survie Kaplan-Meier en oncologie et les études d’association pangénomique en génétique médicale. Autrement dit, FAHME a démontré que les mêmes résultats scientifiques auraient pu être obtenus même si les ensembles de données n’avaient pas été transférés ni centralisés.
«Jusqu’à présent, personne n’a été capable de reproduire des études montrant que l’analyse fédérée fonctionne à grande échelle. Nos résultats sont précis et ont été obtenus avec un temps de calcul raisonnable. FAMHE utilise le cryptage homomorphe multipartite, c’est-à-dire la possibilité d’effectuer des calculs sur les données sous leur forme cryptée via différentes sources sans centraliser les données et sans qu’aucune partie ne puisse voir les données des autres parties», explique Jean-Pierre Hubaux, professeur de l’EPFL et auteur principal de l’étude.
«Cette technologie va non seulement révolutionner les études de recherche clinique multisites, mais aussi permettre et renforcer les collaborations autour des données sensibles dans de nombreux domaines tels que les assurances, les services financiers et la cyberdéfense», ajoute Juan Troncoso-Pastoriza, maître de recherche à l’EPFL.
La confidentialité des données des patients est une préoccupation majeure du CHUV. «La plupart des patients sont prêts à partager leurs données médicales pour faire progresser la science et la médecine, mais il est essentiel de garantir la confidentialité de ces données sensibles. FAMHE permet d’effectuer des recherches collaboratives sécurisées sur les données des patients à une échelle sans précédent», déclare Jacques Fellay, professeur de l’Unité médecine de précision du CHUV.
«Cela change la donne en matière de médecine personnalisée, car tant que ce type de solution n’existe pas, l’alternative est de mettre en place des accords bilatéraux de transfert et d’utilisation des données. Mais ces derniers sont ponctuels et il faut des mois de discussion pour s’assurer que les données vont être correctement protégées au moment venu. FAHME fournit une solution définitive qui permet de s’accorder sur les outils à utiliser et à déployer», déclare Bonnie Berger, professeure du MIT, du CSAIL et du Broad Institute.
«Ces recherches établissent une base essentielle sur laquelle des algorithmes d’apprentissage fédérés pour une série d’études biomédicales pourraient être élaborés de manière évolutive. C’est passionnant de réfléchir aux développements futurs d’outils et de flux de travail rendus possibles par ce système pour répondre à divers besoins analytiques en biomédecine», déclare Hyunghoon Cho, docteur du Broad Institute.
À quel rythme et jusqu’où les chercheurs pensent-ils que cette nouvelle solution va s’étendre? «Nous sommes à un stade avancé de discussions avec des partenaires du Texas, des Pays-Bas et d’Italie pour déployer FAMHE à grande échelle. Nous voulons que cela soit intégré dans les activités normales de la recherche médicale», conclut Jean Louis Raisaro, docteur du CHUV et l’un des chercheurs principaux de l’étude.
David Froelicher, Juan R. Troncoso-Pastoriza, Jean Louis Raisaro, Michel A. Cuendet, Joao Sa Sousa, Hyunghoon Cho, Bonnie Berger, Jacques Fellay and Jean-Pierre Hubaux. Truly Privacy-Preserving Federated Analytics for Precision Medicine with Multiparty Homomorphic Encryption. Nature Communications, October 11 2021