L'IA aide les chimistes à concevoir des molécules étape par étape

Illustration conceptuelle illustrant le développement de Synthegy. Crédit : Ella Maru Studio.
Une étude menée par l'EPFL montre comment les modèles linguistiques peuvent guider la synthèse chimique et expliquer les réactions à l'aide d'instructions rédigées en langage naturel.
La conception de molécules est l’un des défis les plus complexes de la chimie. Des médicaments vitaux aux matériaux de pointe, chaque composé nécessite une séquence précise de réactions. La planification de ces étapes exige à la fois des connaissances techniques et une vision stratégique, ce qui en fait une tâche qui repose souvent sur des années d’expérience.
Deux problèmes affectent une grande partie de la chimie moderne. Le premier est la rétrosynthèse : les chimistes partent d’une molécule cible et travaillent à rebours pour identifier des éléments constitutifs plus simples et des voies de réaction viables. La rétrosynthèse implique d’innombrables décisions, du choix des matières premières à la détermination du moment où former des cycles ou protéger des groupes fonctionnels sensibles. Si les ordinateurs peuvent explorer de vastes « espaces chimiques », ils ont souvent du mal à saisir le raisonnement stratégique utilisé par les experts humains.
Le deuxième problème concerne les mécanismes de réaction. Ceux-ci décrivent comment les réactions chimiques se déroulent étape par étape à travers les mouvements d’électrons. La compréhension des mécanismes aide les scientifiques à prédire de nouvelles réactions, à améliorer l’efficacité et à réduire les coûteux essais et erreurs. Les méthodes de calcul existantes peuvent générer de nombreuses voies possibles, mais manquent souvent de l’intuition chimique nécessaire pour identifier les plus plausibles.
Une étude menée par Philippe Schwaller à l’EPFL a désormais développé une nouvelle approche qui utilise des modèles linguistiques à grande échelle (LLM) comme moteurs de raisonnement pour la chimie. Au lieu de générer directement des structures chimiques, les modèles évaluent et guident les outils computationnels traditionnels.
Le cadre, appelé Synthegy, combine des algorithmes de recherche éprouvés avec une intelligence artificielle capable d’interpréter des stratégies chimiques exprimées en langage naturel.
« Lors de la création d’outils pour les chimistes, l’interface utilisateur est très importante, et les outils précédents s’appuyaient sur des filtres et des règles fastidieux », explique Andres M Bran, premier auteur de l’article sur Synthegy publié dans Matter. « Avec Synthegy, nous donnons aux chimistes la possibilité de simplement parler, ce qui leur permet d’itérer beaucoup plus rapidement et d’explorer des idées de synthèse plus complexes. »
Synthegy et la rétrosynthèse
Synthegy part d’une molécule cible et d’une instruction en langage naturel fournie par l’utilisateur. Par exemple, un chimiste peut demander la formation précoce d’un cycle spécifique ou demander d’éviter les groupes protecteurs inutiles. Un logiciel de rétrosynthèse traditionnel génère alors de nombreuses voies de synthèse potentielles. Chaque voie est traduite en texte et analysée par un modèle linguistique.
Synthegy évalue dans quelle mesure chaque voie correspond aux objectifs de l’utilisateur, attribue des notes et explique son raisonnement. Ce processus permet aux chercheurs de classer et de filtrer efficacement les voies candidates. En orientant les recherches computationnelles à l’aide de requêtes en langage naturel, les chimistes peuvent se concentrer sur les stratégies qui répondent le mieux à leurs objectifs.
Synthegy et les mécanismes de réaction
Synthegy aborde les mécanismes de réaction de manière similaire : il décompose les réactions en mouvements élémentaires d'électrons et explore de multiples possibilités. Le LLM évalue chaque étape, orientant la recherche vers des mécanismes chimiquement plausibles. Des informations supplémentaires, telles que les conditions de réaction ou les hypothèses d'experts, peuvent également être intégrées sous forme de texte.
Dans la planification de la synthèse, Synthegy a réussi à identifier des voies correspondant à des demandes stratégiques complexes. Dans une étude d'experts en double aveugle, 36 chimistes ont fourni 368 évaluations valides, et leurs jugements concordaient avec les évaluations du système dans 71,2 % des cas en moyenne. Le cadre permet de détecter les étapes de protection inutiles, d'évaluer la faisabilité des réactions et de hiérarchiser les voies efficaces.
Synthegy démontre que les LLM peuvent analyser la chimie à plusieurs niveaux. Ils peuvent interpréter les groupes fonctionnels, évaluer des réactions individuelles et analyser des voies de synthèse complètes. Les modèles plus grands et plus avancés affichent les meilleures performances, tandis que les modèles plus petits présentent des capacités limitées.
Ces travaux redéfinissent la manière dont l'IA peut soutenir la chimie. En positionnant les LLM comme des évaluateurs plutôt que comme des générateurs, l'approche de Synthegy permet aux chimistes d'exprimer leurs objectifs en langage clair et d'obtenir des solutions stratégiquement pertinentes. Cette technologie pourrait accélérer la découverte de médicaments, améliorer la conception des réactions et rendre les outils computationnels avancés plus accessibles aux chercheurs.
« Le lien entre la planification de la synthèse et les mécanismes est très intéressant : nous utilisons généralement les mécanismes pour découvrir de nouvelles réactions qui nous permettent de synthétiser de nouvelles molécules », explique Andres M Bran. « Nos travaux comblent ce fossé sur le plan computationnel grâce à une interface unifiée en langage naturel. »
Autres contributeurs
- Centre national de compétence en recherche sur la catalyse (NCCR Catalysis)
- b12 Labs
Fondation nationale suisse pour la science
NCCR Catalysis
Programme AWASES d'Intel et Merck KGaA
Andres M Bran, Théo A. Neukomm, Daniel Armstrong, Zlatko Jončev, Philippe Schwaller. Chemical reasoning in LLMs unlocks strategy-aware synthesis planning and reaction mechanism elucidation. Matter 24 avril 2026. DOI: 10.1016/j.matt.2026.102812