L'IA révolutionne la synthèse chimique
Des scientifiques de l’EPFL présentent ChemCrow, un système d’IA qui facilite et optimise la recherche en chimie en intégrant des outils avancés pour effectuer des tâches telles que la synthèse organique et la découverte de médicaments.
Avec ses processus complexes et son vaste potentiel d’innovation, la chimie a toujours été un défi pour l’automatisation. Malgré leurs capacités avancées, les outils de calcul traditionnels restent souvent sous-utilisés en raison de leur complexité et des connaissances spécialisées requises pour les utiliser.
Des chercheuses et chercheurs de l’équipe de Philippe Schwaller de l’EPFL ont mis au point ChemCrow. Il s’agit d’une IA qui intègre 18 outils conçus par des expertes et experts, ce qui lui permet de naviguer et d’effectuer des tâches dans le domaine de la recherche chimique avec une efficacité sans précédent. «On pourrait se demander pourquoi cette référence au corbeau (crow en anglais), interroge Philippe Schwaller. Parce que les corbeaux sont réputés pour bien utiliser les outils.»
ChemCrow a été développé par les doctorants Andres Bran et Oliver Schilter (EPFL, NCCR Catalysis) en collaboration avec Sam Cox et le professeur Andrew White (FutureHouse et Université de Rochester).
ChemCrow repose sur un grand modèle de langage (LLM) comme GPT-4, amélioré par LangChain pour l’intégration d’outils, afin d’effectuer des tâches de synthèse chimique de manière autonome. Les scientifiques ont complété le modèle de langage par un ensemble d’outils logiciels spécialisés déjà utilisés en chimie, notamment WebSearch pour la recherche d’informations sur Internet, LitSearch pour l’extraction de la documentation scientifique et divers outils moléculaires et réactionnels pour l’analyse chimique.
En intégrant ChemCrow à ces outils, les chercheuses et chercheurs lui ont permis de planifier et d’exécuter des synthèses chimiques en autonomie, par exemple la création d’un insectifuge et de divers organocatalyseurs, et même de contribuer à la découverte de nouveaux chromophores, substances fondamentales pour les industries des colorants et des pigments.
ChemCrow se distingue par sa capacité à adapter et à appliquer un processus de raisonnement structuré à des tâches chimiques. «Le système est similaire à une experte ou un expert humain ayant accès à un calculateur et à des bases de données qui non seulement améliorent l’efficacité de l’experte ou de l’expert, mais le rendent aussi plus factuel – dans le cas de ChemCrow, en réduisant les hallucinations», explique Andres Camilo Marulanda Bran, principal auteur de l’étude.
ChemCrow reçoit un prompt de l’utilisatrice ou de l’utilisateur, planifie la manière de résoudre la tâche, sélectionne les outils adaptés et affine sa stratégie de façon itérative sur la base du ou des résultats de chaque étape. Cette approche méthodique garantit que ChemCrow ne se limite pas à la théorie, mais qu’il repose également sur des applications pratiques pour l’interaction entre le monde réel et les environnements de laboratoire.
En démocratisant l’accès aux connaissances et aux processus chimiques complexes, ChemCrow réduit les obstacles pour les personnes novices tout en augmentant le nombre d’outils disponibles pour les chimistes chevronnés. Cela peut accélérer la recherche et le développement dans divers domaines dont les produits pharmaceutiques et la science des matériaux, en rendant la procédure plus efficace et plus sûre.
L’équipe de Philippe Schwaller fait partie du nouveau Centre IA de l’EPFL, avec plus de quarante autres laboratoires, ouvrant la voie à une IA fiable, accessible et inclusive.
Autres contributeurs
- Université de Rochester
- FutureHouse
Fonds national suisse de la recherche scientifique (NCCR Catalysis)
Fonds national de la recherche scientifique (NSF)
National Institutes of Health (National Institute of General Medical Sciences)
Andres M. Bran, Sam Cox, Oliver Schilter, Carlo Baldassari, Andrew D. White, Philippe Schwaller. Augmenting large language models with chemistry tools. Nature Machine Intelligence, 8 mai 2024. DOI: 10.1038/s42256-024-00832-8