Des nanopores bactériens pour le stockage de données

Des pores bactériens modifiés peuvent coder les informations numériques stockées dans des polymères sur mesure. Crédit: Matteo Dal Peraro (structure de l’aérolysine) / iStock (fond).

Des pores bactériens modifiés peuvent coder les informations numériques stockées dans des polymères sur mesure. Crédit: Matteo Dal Peraro (structure de l’aérolysine) / iStock (fond).

Les bio-ingénieurs de l’EPFL ont mis au point un système de nanopores capable de lire les données codées dans des macromolécules synthétiques avec une précision et une résolution supérieures à celles des méthodes similaires du marché. Ce système permettrait de dépasser les limites des dispositifs de stockage de données classiques.

Illustration: Des pores bactériens modifiés (aérolysine, toxine formant des pores issue de A. hydrophila en jaune) peuvent coder les informations numériques stockées dans des polymères sur mesure (illustrés ici dans une représentation atomique: blocs de phosphate de n-propyle coiffés de terminaisons didéoxyadénosine). Crédit: Matteo Dal Peraro (structure de l’aérolysine) / iStock (fond).

En 2020, chaque individu produit environ 1,7 mégaoctet de données toutes les secondes. En une seule année, cela revient à 418 zettaoctets, soit 418 milliards de disques durs d’une capacité de 1 téraoctet.

Nous stockons actuellement les données sous forme de 1 et de 0 dans des systèmes magnétiques ou optiques qui ont une durée de vie inférieure à un siècle. Parallèlement, les centres de données consomment de grandes quantités d’énergie et ont une empreinte carbone très élevée. En bref, notre façon de stocker les données toujours plus importantes n’est pas durable.

L’ADN comme moyen de stockage des données

Il existe une alternative: le stockage des données dans des molécules biologiques comme l’ADN. À l’état naturel, l’ADN code, stocke et rend des quantités massives d’informations génétiques lisibles dans des espaces minuscules (cellules, bactéries, virus), de manière très sûre et reproductible.

Par rapport aux dispositifs de stockage de données classiques, l’ADN est plus durable et comprimé. Il peut conserver dix fois plus de données, a une densité de stockage 1 000 000 fois plus élevée et consomme 100 millions de fois moins d’énergie pour stocker la même quantité de données qu’un disque dur. De plus, un dispositif de stockage de données ADN serait minuscule: les données produites en un an à l’échelle mondiale peuvent être stockées dans seulement quatre grammes d’ADN.

Mais le stockage de données avec l’ADN implique également des coûts exorbitants, des mécanismes de lecture et d’écriture extrêmement lents, et est sujet aux lectures erronées.

Les nanopores à la rescousse

Une méthode consiste à utiliser les nanopores – des trous de taille nanométrique – dont les bactéries perforent souvent d’autres cellules pour les détruire. Les bactéries attaquantes sécrètent des protéines spécialisées appelées «toxines formant des pores», qui s’accrochent à la membrane de la cellule et y forment un canal tubulaire.

En bio-ingénierie, les nanopores sont utilisés pour détecter les biomolécules comme l’ADN ou l’ARN. La molécule traverse le nanopore tel une chaîne, dirigée par une tension, et ses différentes composantes produisent des signaux électriques distincts (une «signature ionique») qui peuvent servir à les identifier. En raison de leur précision élevée, les nanopores sont également expérimentés pour la lecture d’informations codées par l’ADN.

Cependant, les nanopores sont encore limités par des lectures de faible résolution, ce qui pose un véritable problème si les systèmes de nanopores doivent un jour être utilisés pour stocker et lire des données.

Les nanopores d’aérolysine

Le potentiel des nanopores a amené les scientifiques de la Faculté des sciences de la vie de l’EPFL à explorer les nanopores produits par l’aérolysine, toxine formant des pores fabriquée par la bactérie Aeromonas hydrophila. Sous la direction de Matteo Dal Peraro à la Faculté des sciences de la vie de l’EPFL, les chercheurs ont montré que les nanopores d’aérolysine peuvent servir à décoder les informations binaires.

En 2019, le laboratoire de Matteo Dal Peraro a révélé que les nanopores peuvent être utilisés pour détecter des molécules plus complexes, comme les protéines. Dans cette étude publiée dans Science Advances, l’équipe a collaboré avec le laboratoire d’Alexandra Radenovic (EPFL) et a adapté l’aérolysine pour détecter les molécules conçues précisément pour être lues par ce pore. Un brevet a été déposé pour cette technologie.

Connues sous le nom de «polymères numériques», les molécules ont été développées dans le laboratoire de Jean-François Lutz à l’Institut Charles Sadron du CNRS à Strasbourg. Ces molécules sont une combinaison de nucléotides d’ADN et de monomères non biologiques conçus pour traverser les nanopores d’aérolysine et donner un signal électrique qui pourrait être lu comme un «bit».

Les chercheurs ont utilisé des mutants de l’aérolysine pour concevoir systématiquement des nanopores pour la lecture de signaux de leurs polymères informationnels. Ils ont optimisé la vitesse des polymères traversant le nanopore de sorte qu’il peut donner un signal identifiable de manière unique. « Mais contrairement aux lectures de nanopores classiques, ce signal a permis une lecture numérique avec une résolution à un seul bit, sans restreindre la densité des informations, » dit Dr Chan Cao, l’auteure principale de l’article.

Pour décoder les signaux de lecture, l’équipe a utilisé l’apprentissage profond, ce qui lui a permis de décoder jusqu’à 4 bits d’informations des polymères avec une précision élevée. Elle a également utilisé l’approche consistant à identifier à l’aveugle les mélanges de polymères et à déterminer leur concentration relative.

Le système est beaucoup moins cher que l’ADN pour le stockage de données, et offre une plus longue durée de vie. De plus, il est «miniaturisable», ce qui signifie qu’il pourrait être facilement intégré dans des dispositifs de stockage de données portables.

«Nous travaillons sur plusieurs améliorations pour transformer cette plateforme bio-inspirée en un produit réel pour le stockage et la récupération des données», déclare Matteo Dal Peraro. «Mais ces travaux indiquent clairement qu’un nanopore biologique peut lire des analytes d’ADN-polymère hybrides. Nous sommes ravis car cela ouvre de nouvelles perspectives prometteuses pour les mémoires de polymères, avec des avantages importants pour l’ultra haute densité, le stockage à long terme et la portabilité des dispositifs.»

Autres collaborateurs

Université de Strasbourg

Financement

Fonds national suisse de la recherche scientifique

EPFL

Horizon 2020 (subvention Marie Skłodowska-Curie)

CNRS

ITN Euro-Sequences

Références

Chan Cao, Lucien F. Krapp, Abdelaziz Al Ouahabi, Niklas F. König, Nuria Cirauqui, Aleksandra Radenovic, Jean-François Lutz, Matteo Dal Peraro. Aerolysin nanopores decode digital information stored in tailored macromolecular analytes. Science Advances 6(50):eabc2661, 09 December 2020. DOI: 10.1126/sciadv.abc2661