Vers une nouvelle ère pour la recherche thérapeutique

iStock

iStock

L’application de méthodes d’intelligence artificielle générative au domaine de la conception de protéines bouleverse profondément la recherche de nouvelles molécules thérapeutiques. Un consortium se profile à l’EPFL pour explorer cette voie.

Le vivant est fait de protéines. Elles structurent les cellules, les alimentent, les soignent ou au contraire les rendent malades. Elles jouent aussi un rôle clé dans les interactions entre les médicaments et l’organisme.

Aujourd’hui, les planètes s’alignent pour qu’une toute nouvelle ère de la recherche puisse voir le jour. Dans les premiers rôles : l’intelligence artificielle générative, susceptible d’imaginer de nouvelles formes de protéines ; mais aussi de nouvelles techniques d’imagerie telles que la cristallographie aux rayons X ou la cryomicroscopie électronique, qui permettent d’observer avec un degré de précision inégalé la forme et la composition des protéines du monde réel. Mis en interaction, ces progrès récents permettent d’imaginer de nouveaux processus menant à la création — entre autres choses — de médicaments biologiques innovants.

Très gros plan sur les biomolécules

La connaissance des interactions entre les protéines et les cellules repose aujourd’hui beaucoup sur des données empiriques, obtenues au terme d’années de recherche biomédicale. L’on connaît assez bien, pour ne donner qu’un exemple, le rôle de l’insuline dans la métabolisation du glucose dans l’organisme.

Mais d’innombrables autres interactions entre protéines et cellules restent encore mystérieuses. Ou sont la cause de maladies en cas de dysfonctionnement, sans que l’on sache avec précision comment ni pourquoi.

Les connaissances progressent toutefois, de façon exponentielles grâce à de nouveaux outils et technologies. La cryomicroscopie électronique, pratiquée et développée au Centre d’imagerie Dubochet sur le campus UNIL–EPFL, a ainsi permis d’observer par exemple in vitro la façon dont la protéine Spike du variant Omicron du SARS-CoV-2 interagissait avec le récepteur humain à la surface des cellules, permettant de comprendre à la fois la rapide propagation du virus dans l’organisme et son immunité face aux vaccins développés pour les précédents variants.

Spike
© Emphase / EPFL
Beaucoup ont découvert le nom de cette protéine lors de l’épidémie de Covid-19. La protéine Spike, c’est le fer de lance qui permet au virus SARS-CoV-2 de pénétrer dans certaines de nos cellules. La protéine Spike se lie à une protéine appelée ACE2 présente sur la membrane de certaines cellules (en particulier les cellules de notre système respiratoire), ce qui permet au virus d’y pénétrer. Spike est composée de trois chaînes identiques qui forment des protubérances sur l’enveloppe du virus.
Spike est une glycoprotéine: elle est recouverte de sucres. Ces sucres sont d’origine humaine: s’il y en a beaucoup, ils forment comme une cape d’invisibilité pour le virus et lui permettent d’échapper à notre système immunitaire.
Spike reste quand même une cible de choix pour notre système immunitaire pour lutter contre l’infection. Les vaccins permettent de renforcer cette lutte.
Plusieurs méthodes ont été utilisées pour produire un vaccin contre le SARS-CoV-2. Dans l’une des approches, les scientifiques ont synthétisé la protéine Spike du virus, puis l’ont purifiée. Ils ont ensuite assemblé ces protéines Spike sur une nanoparticule. Administré de manière sous-cutanée, le vaccin permet à notre système immunitaire de fabriquer des anticorps contre la protéine Spike, reconnue comme un agent étranger. Dans le cas des vaccins ARNm, ce n’est pas la protéine Spike elle-même, mais son plan de construction sous forme d’ARNm qui est administré. Les cellules produisent ensuite elles-mêmes la protéine Spike, et notre système immunitaire réagit en produisant les anticorps spécifiques.

L’apprentissage profond appliqué au vivant

Or ces progrès de l’imagerie avancent de pair avec ceux de l’apprentissage automatique appliqué aux biosciences. Les travaux liés au protein design viennent d’ailleurs d’obtenir leurs lettres de noblesse en recevant le Prix Nobel 2024 de chimie. David Baker, pionnier américain de la biologie computationnelle, partage cet honneur avec Demis Hassabis (docteur honoris causa de l’EPFL) et John M. Jumper, cofondateurs d’AlphaFold. Ce logiciel fait figure de référence en la matière et a été plusieurs fois distingué dans des compétitions internationales portant sur la prédiction de la structure des molécules.

Générateurs de biomolécules

L’EPFL est elle aussi fortement investie dans le domaine de la conception de protéines. Depuis plus de cinq ans, le Laboratoire de conception de protéines et d’immuno-ingénerie de Bruno Correia utilise des techniques d’analyse automatique afin de prédire les capacités d’interaction des protéines et de leurs récepteurs. «L’application de l’apprentissage profond au champ de l’ingénierie biologique a permis d’entrer dans une nouvelle ère», explique-t-il.

Mais si ces travaux permettent de mieux comprendre le fonctionnement du vivant, ils composent aussi la matière première d’une révolution pharmaceutique en train de démarrer. L’intelligence artificielle générative façon ChatGPT peut en effet, si elle se nourrit des protéines et des interactions moléculaires révélées par AlphaFold et ses contreparties académiques, concevoir d’innombrables formes de molécules non encore existantes, les modéliser et simuler leurs interactions avec les cellules. Et ce à l’échelle de milliards de calculs par seconde, jusqu’à trouver des modèles théoriquement pertinents pour des applications thérapeutiques. «C’est tout le champ de la biotechnologie qui profitera de ce nouveau paradigme», assure Bruno Correia.

Bruno Correia. © Emphase/EPFL

C’est tout le champ de la biotechnologie qui profitera de ce nouveau paradigme.

Bruno Correia

Des plans à la réalité

Or il existe des moyens de produire «à la demande» des protéines déjà connues ou encore inédites. C’est ce que fait Florence Pojer, à la tête de la Plateforme de production et de structures des protéines de l’EPFL (PTPSP). Dans les armoires vitrées de ce centre, des flacons au contenu rougeâtre sont agités pendant plusieurs heures. «Ceux-ci par exemple sont des cellules HEK de rein humain – immortalisées et cultivées depuis des décennies. Nous les utilisons pour produire des protéines, telles que des anticorps, après les avoir transfectées avec des plasmides contenant la séquence souhaitée», précise Florence Pojer. D’autres «soupes» cellulaires ou bactériennes peuvent être utilisées aussi en fonction des résultats que l’on recherche. Puis les productions sont purifiées afin d’isoler les protéines cibles. «En principe, il est possible de produire n’importe quelle protéine à partir de sa séquence génétique ; mais actuellement, seule une infime partie des protéines conçues in silico par ordinateur peuvent être réellement produites et fonctionnelles, explique Florence Pojer. De nouvelles approches biotechnologiques cherchent à élargir le catalogue de ce que l’on pourra produire à l’avenir.»

Plusieurs de ces techniques innovantes sont appliquées ou développées à l’EPFL. C’est le cas chez Bruno Correia, déjà cité, mais aussi chez Sebastian Maerkl, dont l’approche s’éloigne des processus biologiques en cellules vivantes pour fonctionner in vitro, sur la base de la trentaine d’enzymes véritablement nécessaires à la production de protéines. Chez Matteo Dal Peraro, on s’intéresse aux grands complexes moléculaires et à leurs capacités d’action que déterminent leur structure et leur composition, en associant observation, modélisation et simulation.

Un vaste consortium dans le viseur

Bruno Correia et Beat Fierz, de l’EPFL, travaillent à la construction d’un consortium destiné à faire entrer la recherche pharmaceutique dans une nouvelle ère, accélérée par l’apprentissage automatique. Fédérer les nombreux travaux complémentaires en cours dans les hautes écoles du pays permettra non seulement de faire de la Suisse un pôle d’excellence en la matière, mais aussi de favoriser l’émergence rapide de nouvelles protéines efficaces, pour le bien des patients. Il s’agira de soutenir le développement d’intelligences artificielles destinées à la conception de molécules, d’imaginer de nouveaux concepts d’interactions entre médicaments et cellules vivantes, de créer de nouvelles bases de données pour améliorer encore l’efficacité des outils de design, et préparer la nouvelle génération de scientifiques aux nouvelles opportunités de recherche et de valorisation. Tout un programme qui ne manquera pas de passionner des générations de scientifiques.

AlphaFold – propriété de Google DeepMind– permet, à partir de la liste des acides aminés composant une protéine, d’imaginer avec une grande précision la façon dont elle est «repliée» sur elle-même – un paramètre qui déterminera ses fonctions et capacités d’interaction avec son entourage. Depuis sa troisième version, publiée en mai 2024, le logiciel peut même modéliser la structure et les interactions des brins d’ADN et d’ARN, permettant d’identifier précisément des mécanismes cellulaires cruciaux pour le développement de nouveaux médicaments. Il a été mis à disposition de la communauté sur un mode open source, permettant à d’innombrables scientifiques de s’en servir pour le développement de nouvelles molécules thérapeutiques.

Auteur: Emmanuel Barraud

Source: EPFL

Ce contenu est distribué sous les termes de la licence Creative Commons CC BY-SA 4.0. Vous pouvez reprendre librement les textes, vidéos et images y figurant à condition de créditer l’auteur de l’œuvre, et de ne pas restreindre son utilisation. Pour les illustrations ne contenant pas la mention CC BY-SA, l’autorisation de l’auteur est nécessaire.