IA: «Le prochain grand saut viendra de la diversité des sources»

Emmanuel Barraud; Mélissa Anchisi

IA: «Le prochain grand saut viendra de la diversité des sources»

Responsable du Laboratoire de traitement du langage naturel de l’EPFL, Antoine Bosselut suit de près l’évolution des outils d’intelligence artificielle générative tels que ChatGPT. Il commente leur évolution depuis deux ans et évoque des pistes pour l’avenir.

Nous nous étions parlé il y a deux ans, lorsque ChatGPT venait tout juste d’être rendu public. Avec le recul, est-ce que vous confirmez que c’était le début d’une nouvelle ère?

Oui, on peut dire que le «moment ChatGPT» a marqué un changement de paradigme dans le domaine de l’intelligence artificielle, et ce sur deux plans. D’abord d’un point de vue technique : nous sommes passé d’outils orientés sur des tâches à des outils orientés par les instructions. Les modèles préalables étaient limités à des domaines et des fonctions précis, et leur interrogation nécessitait des connaissances spécifiques. ChatGPT a changé la donne, non seulement en démultipliant la portée de ses connaissances, mais surtout en offrant à tout un chacun la possibilité de lui donner des instructions. Partant de là, c’est surtout du point de vue de la perception que ce changement a été radical : le grand public a compris que les IA allaient pouvoir s’intégrer dans bien des aspects de la vie quotidienne.

La concurrence n’a pas tardé à lancer ses propres agents conversationnels. Est-ce qu’OpenAI était vraiment en avance sur son temps?

Beaucoup d’entreprises travaillaient déjà sur des approches similaires. Notez qu’Anthropic, par exemple, qui a créé Claude, avait été fondée un an plus tôt par des anciens de chez OpenAI… Chez Google, on suivait plusieurs pistes en parallèle, mais on a réalisé que le modèle de ChatGPT fonctionnait mieux — et surtout qu’OpenAI a transformé une technologie en un produit dont les performances dépassaient les attentes. Cela a donné la mesure de la maturité de cette approche et déclenché un changement de perspective de la part de tous les grands acteurs de la tech.

Est-ce que DeepSeek, lancé fin 2024, est vraiment différent?

Il est encore trop tôt pour dire s’il est vraiment meilleur et s’il a vraiment été moins coûteux. C’est son prétendu faible coût de développement, plus que ses nouvelles capacités, qui a provoqué le buzz… Or ses concepteurs n’ont donné que le chiffre de la dernière phase d’entraînement. On ne sait pas ce qu’avaient coûté les phases précédentes. Quant au fait qu’il soit «open source», c’est également discutable. On peut certes utiliser son code pour l’intégrer dans des applications ou le développer encore, mais on ne sait pas vraiment sur quoi il se base car ses sources n’ont pas été dévoilées. On ne sait pas sur quoi l’on construit.

On observe une gigantesque course aux investissements dans l’IA: 500 milliards aux États-Unis, 200 milliards en Europe… À quoi va servir tout cet argent?

Mon appréciation est que si on n’investit pas cet argent maintenant, on le dépensera plus tard pour acheter les mêmes services, mais ailleurs… L’utilisation des IA génératives va se généraliser dans énormément de domaines et son usage deviendra quotidien. Si l’Europe ne parvient pas à développer des solutions convaincantes, les utilisateurs se tourneront vers des services américains ou chinois, avec tous les risques que cela comporte en termes de souveraineté.

le grand public a compris que les IA allaient pouvoir s’intégrer dans bien des aspects de la vie quotidienne.
Antoine Bosselut, Responsable du Laboratoire de traitement du langage naturel de l’EPFL

Et la Suisse, là-dedans?

Les Écoles polytechniques fédérales sont performantes pour former les spécialistes de demain, développer des bases théoriques solides et mettre le tout à disposition de la communauté afin de lui donner une alternative à laquelle elle pourra faire confiance. Dans ce secteur, c’est exactement ce que fait la Swiss AI Initiative et le Swiss National AI Institute — former ces jeunes et les rendre visibles lorsque les sociétés auront besoin de leur talent.

Revenons au fonctionnement des grands modèles. La pollution des données d’entraînement — notamment par des données elles-mêmes générées par IA – risque-t-elle de détériorer leur qualité?

Il y a un risque théorique. Mais paradoxalement, grâce aux filtres et au nettoyage des résultats qui se développent en parallèle, les données synthétiques qui servent de sources sont plutôt de très bonne qualité. À l’inverse, beaucoup de contenus générés sans filtres par des humains peuvent être faux ou biaisés. Difficile donc d’affirmer que cette crainte est justifiée.

Quels sont les principaux secteurs dans lesquels les IA génératives vont s’imposer ces prochaines années?

Je crois qu’il est plus simple de réfléchir aux domaines où elles ne le feront pas... Il y a des domaines — santé, technologies militaires, informations confidentielles — où les données sont si sensibles qu’on ne peut pas nécessairement les lâcher dans les serveurs où ces outils sont installés. La question de la confiance envers les outils et leurs détenteurs occupera encore les responsables pendant bien quelques années.

On observe dans ce domaine un saut technologique tous les deux à trois ans. Quel sera le prochain?

Malgré l’accélération continue des capacités des modèles, ceux-ci restent fondamentalement basés sur du texte. Concrètement, tout se fait aujourd’hui sur un vocabulaire de 50’000 mots environ. Certes, cela peut suffire à donner l’impression aux humains qui s’en servent que la machine est capable de raisonnement. Mais la pensée humaine est bien plus complexe, elle utilise aussi d’autres perceptions — sons, images ou même odeurs. Je pense que la prochaine grande évolution surviendra quand les modèles parviendront eux aussi à intégrer directement d’autres types de contenus tels que les images, les sons et les vidéos. Cette «IA multimodale» s’approchera alors encore davantage d’une «pensée» artificielle — même si sa définition reste plus philosophique que technique.

Références

Cet article a été publié dans l'édition de mars 2025 du magazine Dimensions, qui met en avant l’excellence de l’EPFL par le biais de dossiers approfondis, d’interviews, de portraits et d’actualités. Publié 4 fois par an, en français et en anglais, il est envoyé aux membres Alumni contributeurs ainsi qu’à toute personne qui souhaite s’abonner. Le magazine est aussi distribué gratuitement sur les campus de l’EPFL.

27.05.25

Mots-clés

Données IA intelligence artificielle

Actualités

Abonnement

Recevez un e-mail à chaque publication

Partager sur