Vers une nouvelle ère pour la recherche thérapeutique
L’application de méthodes d’intelligence artificielle générative au domaine de la conception de protéines bouleverse profondément la recherche de nouvelles molécules thérapeutiques. Un consortium se profile à l’EPFL pour explorer cette voie.
Le vivant est fait de protéines. Elles structurent les cellules, les alimentent, les soignent ou au contraire les rendent malades. Elles jouent aussi un rôle clé dans les interactions entre les médicaments et l’organisme.
Aujourd’hui, les planètes s’alignent pour qu’une toute nouvelle ère de la recherche puisse voir le jour. Dans les premiers rôles : l’intelligence artificielle générative, susceptible d’imaginer de nouvelles formes de protéines ; mais aussi de nouvelles techniques d’imagerie telles que la cristallographie aux rayons X ou la cryomicroscopie électronique, qui permettent d’observer avec un degré de précision inégalé la forme et la composition des protéines du monde réel. Mis en interaction, ces progrès récents permettent d’imaginer de nouveaux processus menant à la création — entre autres choses — de médicaments biologiques innovants.
Très gros plan sur les biomolécules
La connaissance des interactions entre les protéines et les cellules repose aujourd’hui beaucoup sur des données empiriques, obtenues au terme d’années de recherche biomédicale. L’on connaît assez bien, pour ne donner qu’un exemple, le rôle de l’insuline dans la métabolisation du glucose dans l’organisme.
Mais d’innombrables autres interactions entre protéines et cellules restent encore mystérieuses. Ou sont la cause de maladies en cas de dysfonctionnement, sans que l’on sache avec précision comment ni pourquoi.
Les connaissances progressent toutefois, de façon exponentielles grâce à de nouveaux outils et technologies. La cryomicroscopie électronique, pratiquée et développée au Centre d’imagerie Dubochet sur le campus UNIL–EPFL, a ainsi permis d’observer par exemple in vitro la façon dont la protéine Spike du variant Omicron du SARS-CoV-2 interagissait avec le récepteur humain à la surface des cellules, permettant de comprendre à la fois la rapide propagation du virus dans l’organisme et son immunité face aux vaccins développés pour les précédents variants.
Spike est une glycoprotéine: elle est recouverte de sucres. Ces sucres sont d’origine humaine: s’il y en a beaucoup, ils forment comme une cape d’invisibilité pour le virus et lui permettent d’échapper à notre système immunitaire.
Spike reste quand même une cible de choix pour notre système immunitaire pour lutter contre l’infection. Les vaccins permettent de renforcer cette lutte.
Plusieurs méthodes ont été utilisées pour produire un vaccin contre le SARS-CoV-2. Dans l’une des approches, les scientifiques ont synthétisé la protéine Spike du virus, puis l’ont purifiée. Ils ont ensuite assemblé ces protéines Spike sur une nanoparticule. Administré de manière sous-cutanée, le vaccin permet à notre système immunitaire de fabriquer des anticorps contre la protéine Spike, reconnue comme un agent étranger. Dans le cas des vaccins ARNm, ce n’est pas la protéine Spike elle-même, mais son plan de construction sous forme d’ARNm qui est administré. Les cellules produisent ensuite elles-mêmes la protéine Spike, et notre système immunitaire réagit en produisant les anticorps spécifiques.
L’apprentissage profond appliqué au vivant
Or ces progrès de l’imagerie avancent de pair avec ceux de l’apprentissage automatique appliqué aux biosciences. Les travaux liés au protein design viennent d’ailleurs d’obtenir leurs lettres de noblesse en recevant le Prix Nobel 2024 de chimie. David Baker, pionnier américain de la biologie computationnelle, partage cet honneur avec Demis Hassabis (docteur honoris causa de l’EPFL) et John M. Jumper, cofondateurs d’AlphaFold. Ce logiciel fait figure de référence en la matière et a été plusieurs fois distingué dans des compétitions internationales portant sur la prédiction de la structure des molécules.
Générateurs de biomolécules
L’EPFL est elle aussi fortement investie dans le domaine de la conception de protéines. Depuis plus de cinq ans, le Laboratoire de conception de protéines et d’immuno-ingénerie de Bruno Correia utilise des techniques d’analyse automatique afin de prédire les capacités d’interaction des protéines et de leurs récepteurs. «L’application de l’apprentissage profond au champ de l’ingénierie biologique a permis d’entrer dans une nouvelle ère», explique-t-il.
Mais si ces travaux permettent de mieux comprendre le fonctionnement du vivant, ils composent aussi la matière première d’une révolution pharmaceutique en train de démarrer. L’intelligence artificielle générative façon ChatGPT peut en effet, si elle se nourrit des protéines et des interactions moléculaires révélées par AlphaFold et ses contreparties académiques, concevoir d’innombrables formes de molécules non encore existantes, les modéliser et simuler leurs interactions avec les cellules. Et ce à l’échelle de milliards de calculs par seconde, jusqu’à trouver des modèles théoriquement pertinents pour des applications thérapeutiques. «C’est tout le champ de la biotechnologie qui profitera de ce nouveau paradigme», assure Bruno Correia.
C’est tout le champ de la biotechnologie qui profitera de ce nouveau paradigme.
Des plans à la réalité
Or il existe des moyens de produire «à la demande» des protéines déjà connues ou encore inédites. C’est ce que fait Florence Pojer, à la tête de la Plateforme de production et de structures des protéines de l’EPFL (PTPSP). Dans les armoires vitrées de ce centre, des flacons au contenu rougeâtre sont agités pendant plusieurs heures. «Ceux-ci par exemple sont des cellules HEK de rein humain – immortalisées et cultivées depuis des décennies. Nous les utilisons pour produire des protéines, telles que des anticorps, après les avoir transfectées avec des plasmides contenant la séquence souhaitée», précise Florence Pojer. D’autres «soupes» cellulaires ou bactériennes peuvent être utilisées aussi en fonction des résultats que l’on recherche. Puis les productions sont purifiées afin d’isoler les protéines cibles. «En principe, il est possible de produire n’importe quelle protéine à partir de sa séquence génétique ; mais actuellement, seule une infime partie des protéines conçues in silico par ordinateur peuvent être réellement produites et fonctionnelles, explique Florence Pojer. De nouvelles approches biotechnologiques cherchent à élargir le catalogue de ce que l’on pourra produire à l’avenir.»
Plusieurs de ces techniques innovantes sont appliquées ou développées à l’EPFL. C’est le cas chez Bruno Correia, déjà cité, mais aussi chez Sebastian Maerkl, dont l’approche s’éloigne des processus biologiques en cellules vivantes pour fonctionner in vitro, sur la base de la trentaine d’enzymes véritablement nécessaires à la production de protéines. Chez Matteo Dal Peraro, on s’intéresse aux grands complexes moléculaires et à leurs capacités d’action que déterminent leur structure et leur composition, en associant observation, modélisation et simulation.
Un vaste consortium dans le viseur
Bruno Correia et Beat Fierz, de l’EPFL, travaillent à la construction d’un consortium destiné à faire entrer la recherche pharmaceutique dans une nouvelle ère, accélérée par l’apprentissage automatique. Fédérer les nombreux travaux complémentaires en cours dans les hautes écoles du pays permettra non seulement de faire de la Suisse un pôle d’excellence en la matière, mais aussi de favoriser l’émergence rapide de nouvelles protéines efficaces, pour le bien des patients. Il s’agira de soutenir le développement d’intelligences artificielles destinées à la conception de molécules, d’imaginer de nouveaux concepts d’interactions entre médicaments et cellules vivantes, de créer de nouvelles bases de données pour améliorer encore l’efficacité des outils de design, et préparer la nouvelle génération de scientifiques aux nouvelles opportunités de recherche et de valorisation. Tout un programme qui ne manquera pas de passionner des générations de scientifiques.