L'IA améliore l'analyse chimique à l'échelle nanométrique
Des scientifiques de l’EPFL ont mis au point une technique basée sur l’IA pour améliorer l’analyse chimique des nanomatériaux, ce qui permet de surmonter les difficultés liées aux données bruitées et aux signaux mixtes.
Le mot «nanomatériaux» est un terme général qui désigne les substances ou matériaux chimiques dont une seule unité a une taille comprise entre 1 et 100 nanomètres (un nanomètre équivaut à un milliardième de mètre). Il s’agit de matériaux exotiques tels que les nanotubes de carbone, les nanoparticules d’argent (utilisées comme antimicrobiens), les matériaux nanoporeux et de nombreux types de catalyseurs servant à mener les réactions chimiques de manière efficace.
Aujourd’hui, les nanomatériaux sont utilisés dans de nombreux domaines, allant de la médecine à l’électronique, ce qui signifie que la capacité à déterminer leur composition chimique exacte est essentielle. Mais cette tâche est difficile car les méthodes traditionnelles d’analyse des nanomatériaux ont tendance à être sensibles aux faibles rapports signal sur bruit.
Par exemple, l’une des méthodes très répandues est la spectroscopie de rayons X à dispersion d’énergie (EDX), combinée à la microscopie électronique à transmission et à balayage. Cette technique fournit des cartes détaillées de l’emplacement des différents éléments dans un échantillon. Mais elle produit souvent des données bruitées, en particulier sur des objets petits, et des signaux mixtes lorsque différents matériaux se chevauchent, d’où la difficulté à obtenir une analyse chimique précise.
Les données bruitées sont généralement «nettoyées» à l’aide de diverses techniques, allant du simple filtrage spatial à des approches d’apprentissage machine plus sophistiquées telles que l’analyse en composantes principales, qui permet de séparer les signaux du bruit. Toutefois, ces techniques ont aussi leurs inconvénients. Par exemple, elles peuvent introduire des erreurs ou ne pas parvenir à distinguer les signaux chimiques très similaires.
Trois scientifiques de l’EPFL, Hui Chen, Duncan Alexander et Cécile Hébert, viennent de développer une méthode d’apprentissage machine, le PSNMF ou «affinage panchromatique basé sur la factorisation en matrices non négatives», qui améliore la clarté et la précision des données EDX. Cette méthode facilite ainsi l’identification et la quantification des différents éléments chimiques dans les nanomatériaux.
L’équipe a commencé par exploiter une caractéristique particulière de ses données appelée «bruit de grenaille». Ce type de bruit est dû au fait que la détection des photons de rayons X est aléatoire. Lorsque le faisceau d’électrons frappe l’échantillon, il produit des photons de rayons X, mais le nombre détecté varie de manière aléatoire à chaque fois, créant un modèle bruyant et granuleux surnommé bruit de grenaille.
Afin d’améliorer la clarté de leurs données, les chercheuses et chercheurs ont combiné des données provenant de pixels proches, ce qui a permis d’optimiser le rapport signal sur bruit dans le spectre au détriment de la résolution spatiale.
Ils ont ensuite appliqué une méthode d’apprentissage machine, la NMF ou «factorisation en matrices non négatives», à cet ensemble de données plus claires. La NMF est une technique mathématique qui décompose un grand ensemble de données en parties plus simples et plus petites, en veillant à ce que toutes les parties soient non négatives, ce qui permet d’identifier des modèles dans les données. Cette approche leur a permis d’obtenir des données spectrales de qualité au prix d’images floues avec de gros pixels.
Ensuite, ils ont répété le processus NMF sur l’ensemble de données original à haute résolution afin de préserver les informations spatiales détaillées, mais en initialisant la factorisation avec les composantes spectrales précédemment identifiées. Enfin, ils ont combiné les résultats des deux étapes pour produire un ensemble de données de haute qualité, qui présente à la fois une grande fidélité spectrale et une haute résolution spatiale.
Les chercheuses et chercheurs ont validé le PSNMF en utilisant des données synthétiques, calculées grâce à un algorithme de modélisation développé au laboratoire. Ces données ont reproduit les défis du monde réel comme l’analyse d’échantillons de minéraux formés dans des conditions extrêmes. La méthode s’est avérée très efficace, identifiant et séparant avec précision les différents matériaux, même en quantités infimes.
Appliquée à de vrais échantillons, notamment un nanominéral et un nanocatalyseur, le PSNMF a réussi à séparer et à quantifier des matériaux qui se chevauchaient. Cette analyse précise est indispensable pour comprendre et développer de nouvelles technologies qui reposent sur ces nanostructures complexes.
Le PSNMF représente une amélioration majeure de l’analyse chimique à l’échelle nanométrique. En fournissant des résultats précis malgré des données bruitées et des signaux qui se chevauchent, cette méthode améliore notre capacité à étudier et à utiliser les nanomatériaux dans divers domaines, de l’électronique de pointe aux dispositifs médicaux.
EPFL
Hui Chen, Duncan T.L. Alexander, Cécile Hébert. Leveraging machine learning for advanced nanoscale X-ray analysis: Unmixing multicomponent signals and enhancing chemical quantification. NanoLetters 06 août 2024. DOI: 10.1021/acs.nanolett.4c02446