L'EPFL et DeepMind ont recours à l'IA pour contrôler les plasmas
Des scientifiques du Swiss Plasma Center de l’EPFL et de DeepMind ont mis au point une nouvelle méthode permettant de contrôler les configurations de plasma pour une utilisation en recherche sur la fusion nucléaire.
Le Swiss Plasma Center (SPC) de l’EPFL possède une expérience de plusieurs décennies en physique des plasmas et méthodes de contrôle des plasmas. DeepMind est une société de découverte scientifique acquise par Google en 2014 qui se situe à la pointe de la recherche et du développement de l'intelligence artificielle avancée. Ensemble, ils ont développé une nouvelle méthode de contrôle magnétique des plasmas reposant sur l’apprentissage par renforcement profond. Ils l’ont appliquée à un plasma du monde réel pour la première fois dans le “tokamak” du SPC. Leur étude vient d’être publiée dans la revue Nature.
Les tokamaks sont des installations en forme d’anneau (ou «tore») destinées à la recherche en fusion nucléaire. Le SPC est l’un des rares centres de recherche au monde à posséder un tokamak en fonctionnement. Ces appareils utilisent un puissant champ magnétique pour confiner le plasma à des températures extrêmement élevées – centaines de millions de degrés Celsius, plus chaud que le noyau solaire – de sorte que la fusion nucléaire puisse se produire entre les atomes d’hydrogène. L’énergie libérée lors de la fusion est actuellement étudiée pour une utilisation dans la production d’électricité. Le tokamak du SPC est unique car il permet diverses configurations de plasma, d’où son nom: tokamak à configuration variable (TCV). Autrement dit, les scientifiques peuvent l’utiliser pour étudier de nouvelles approches de confinement et de contrôle des plasmas. Une configuration de plasma est liée à sa forme et à sa position dans la chambre de recherche.
Contrôler une substance aussi chaude que le soleil
Les tokamaks forment et maintiennent les plasmas par un ensemble de bobines magnétiques dont les réglages, notamment la tension, doivent être soigneusement contrôlés. Sinon, le plasma pourrait entrer en collision avec les parois de la chambre et la détériorer. Pour éviter cela, les chercheuses et chercheurs du SPC testent d’abord leurs systèmes de contrôle sur un simulateur avant de les utiliser dans le tokamak TCV. «Notre simulateur est le fruit de plus de 20 années de recherche et est sans cesse amélioré», déclare Federico Felici, scientifique au SPC et co-auteur de l’étude. «Malgré cela, de fastidieux calculs sont encore nécessaires pour déterminer la valeur correcte de chaque variable du système de contrôle. C’est là qu’intervient notre projet de recherche commun avec DeepMind.»
Les expertes et experts de DeepMind ont mis au point un algorithme IA qui peut créer et maintenir des configurations de plasma spécifiques, et l’ont entraîné sur le simulateur du SPC. Cela impliquait d’abord de faire essayer à l’algorithme de nombreuses stratégies de contrôle différentes en simulation et d’acquérir des connaissances. Sur la base de l’expérience acquise, l’algorithme a généré une stratégie de contrôle pour produire la configuration de plasma demandée. Une fois entraîné, le système IA était capable de créer et de maintenir un vaste ensemble de formes de plasma et de configurations avancées, dont une dans laquelle deux plasmas distincts sont maintenus simultanément dans la chambre. Enfin, l’équipe de recherche a testé son nouveau système directement sur le tokamak pour voir son fonctionnement en conditions réelles.
La collaboration entre le SPC et DeepMind remonte à 2018 lorsque Federico Felici a rencontré pour la première fois les scientifiques DeepMind lors d’un hackathon au siège londonien de l’entreprise. Là-bas, il a expliqué le problème de contrôle magnétique du tokamak auquel était confrontée son équipe de recherche. «DeepMind a été immédiatement intéressée par la perspective de tester sa technologie IA dans un domaine tel que la fusion nucléaire, notamment sur un système réel comme un tokamak», explique Federico Felici. Martin Riedmiller, responsable d’équipe de contrôle chez DeepMind et co-auteur de l’étude, ajoute que «la mission de notre équipe est de rechercher une nouvelle génération de systèmes IA – des contrôleurs à boucle fermée – capables d’apprendre dans des environnements dynamiques complexes à partir de rien. Le contrôle d’un plasma de fusion dans le monde réel offre des opportunités fantastiques, même si elles sont extrêmement difficiles.»
Une collaboration gagnante-gagnante
Après avoir échangé avec Federico Felici, DeepMind lui a proposé de travailler avec le SPC pour développer un système de contrôle IA pour son tokamak. «Nous avons tout de suite adhéré à cette idée car nous y avons vu l’immense potentiel d’innovation», confie Ambrogio Fasoli, directeur du SPC et co-auteur de l’étude. «Tous les scientifiques DeepMind avec lesquels nous avons collaboré étaient très enthousiastes et avaient de vastes connaissances sur l’application de l’IA dans les systèmes de contrôle». Pour sa part, Federico Felici a été impressionné par les performances incroyables que DeepMind peut faire en un court laps de temps quand elle concentre ses efforts sur un projet donné.
La collaboration avec le SPC nous encourage à améliorer nos algorithmes d’apprentissage par renforcement.
Le projet de recherche commun a aussi beaucoup apporté à DeepMind, ce qui souligne les avantages d’une approche pluridisciplinaire pour les deux parties. Brendan Tracey, ingénieur principal de recherche chez DeepMind et co-auteur de l’étude, affirme: «La collaboration avec le SPC nous encourage à améliorer nos algorithmes d’apprentissage par renforcement, et au final elle peut accélérer la recherche sur la fusion des plasmas.»
Pour l’EPFL, ce projet devrait ouvrir la voie à la recherche d’autres opportunités R&D communes avec des entreprises externes. «Nous sommes toujours ouverts aux collaborations gagnantes-gagnantes innovantes où nous pouvons partager des idées et explorer de nouvelles perspectives, accélérant ainsi le rythme du développement technologique», conclut Ambrogio Fasoli.
https://www.nature.com/articles/s41586-021-04301-9
Degrave, J., Felici, F., Buchli, J. et al. Magnetic control of tokamak plasmas through deep reinforcement learning. Nature 602, 414–419 (2022). https://doi.org/10.1038/s41586-021-04301-9