Un cryptage qui cacherait à Uber vos données de mobilité
Des chercheurs de l’EPFL et de l’UNIL ont mis au point un protocole de cryptage qui permettrait de mettre en relation un client et un chauffeur tout en préservant leurs données privées.
L’application d’Uber – et celle de ses concurrents – est une plateforme numérique qui met en relation des particuliers pour satisfaire un besoin de mobilité. Mais à cette fin elles collectent des données personnelles, aussi bien sur les chauffeurs que sur les clients. Multiplié par les millions d’utilisateurs quotidiens, cela représente une manne non négligeable à l’heure du Big Data. Des chercheurs de l’EPFL et de la Faculté des HEC de l’UNIL ont étudié comment assurer le service avec la même performance, tout en préservant les données privées des protagonistes. Baptisé ORide - «O» pour oublieux-, ce logiciel prototype permet d’organiser une course dont seuls le chauffeur et son client connaissent le point de départ, la destination et le parcours.
«L’arrivée de plateformes comme Uber a provoqué beaucoup de vagues et de résistances. Mais la question de la protection des données a été peu débattue», justifie Jean-Pierre Hubaux, professeur à la Faculté Informatique et Communications. Quelques dérapages ont été relatés par la presse: une faille de sécurité qui a divulgué les données de centaines de chauffeurs ou, plus grave, la menace d’un des directeurs d’enquêter sur les journalistes «inamicaux»… Et pour ces chercheurs, experts de la sphère privée, le défi de voir s’il était techniquement possible de préserver des données privées était trop tentant. Ils présenteront cet été leur travail, lors de deux conférences spécialisées outre-Atlantique.
Discret mais pratique et rapide
ORide se base sur un système cryptographique proche du chiffrement homomorphe. Schématiquement, celui-ci permet de réaliser des opérations sur des données chiffrées, et aboutit au même résultat que si les données n’étaient pas cryptées. Par exemple, en additionnant 2 + 2 sous forme chiffrée, on obtient (aussi) 4 (sous forme chiffrée). Ainsi, quand un client cherche un chauffeur, le logiciel reçoit les données cryptées de localisation du client et des chauffeurs disponibles. Il identifie sur cette base le chauffeur le plus proche. Toujours avec des données cryptées, l'application permet au client de sélectionner un chauffeur. Une fois le binôme établi, ORide révèle aux smartphones des deux utilisateurs leur localisation mutuelle.
L’itinéraire emprunté est aussi codé dans les smartphones des deux partenaires. Seuls la distance parcourue et le prix de la course sont connus de l’application – le moyen pour la société de prélever son pourcentage sur la course ou pour le client de justifier ses frais. En outre, ORide conserve le confort de l’application avec le paiement par carte de crédit et la possibilité d’évaluer son chauffeur. «Le but du protocole n’est pas l’anonymat complet, mais l’impossibilité de localiser le trajet du client et du chauffeur», précise le chercheur. Il faut aussi qu’un client puisse retrouver un objet oublié ou donner suite à un différend avec un chauffeur. Dans ce dernier cas, l’application peut réidentifier les données, mais uniquement avec l’accord de la partie plaignante.
La confidentialité: un argument marketing
Afin de tester leur modèle et surtout de s’assurer que l’opération de cryptage ne ralentit pas le processus de recherche d’un véhicule, les scientifiques ont utilisé des données publiques des chauffeurs de taxi de New York. Dans cette ville, pour une population équivalente à celle de la Suisse, il y a environ autant de taxis que de véhicules gérés par Uber et son concurrent Lyft. «L’opération de cryptage avec une clé de sécurité élevée n’ajoute que quelques millisecondes au temps de recherche d’une course et ne demande pas une vitesse de connexion supplémentaire. En revanche, avec ORide, l’application ne va pas forcément trouver le véhicule le plus proche, ce qui peut coûter une ou deux minutes au client», admet Jean-Pierre Hubaux.
Aux sociétés comme Uber de décider si elles sont intéressées. D’autant que les chercheurs n’ont volontairement déposé aucun brevet. «Au sein de cette industrie compétitive, la confidentialité peut être un argument marketing ou un moyen de ne pas se trouver en conflit avec les services secrets quand il s’agit de partager des données auxquelles ces entreprises ont potentiellement accès», justifie Jean-Pierre Hubaux.