Les machines ne comprennent pas la notion de mouillé

© 2021 EPFL

© 2021 EPFL

Antoine Bosselut, professeur assistant à l’EPFL depuis septembre, a été classé par le magazine Forbes dans la liste «30 under 30 Europe in Science and Healthcare» pour ses recherches en traitement du langage naturel, à savoir si les systèmes d’intelligence artificielle apprennent le bon sens à partir du langage.

Il y a dix-huit mois, Antoine Bosselut a accepté un poste au sein de la Faculté Informatique et Communications (IC) de l’EPFL pour diriger le nouveau groupe NLP (traitement du langage naturel), un transfert de l’Université de Stanford en Californie retardé par la pandémie de Covid-19. Il confie que c’est un plaisir de travailler sur le campus hors des quatre murs de son appartement et que c’est très passionnant de créer un environnement axé NLP à l’université.

«Le NLP consiste tout simplement à faire comprendre le langage humain aux machines afin qu’elles l’utilisent pour nous comprendre ou communiquer avec nous, comme dans les systèmes interactifs comme Alexa ou Siri ou les outils tels que Google Translate. Il s’agit en fait de l’étude de tout problème impliquant la compréhension du langage humain afin d’augmenter les capacités humaines ou d’acquérir des connaissances sur la façon dont les êtres humains pensent et expriment leur ressenti.»

Aujourd’hui, les recherches d’Antoine Bosselut se concentrent sur ce qui existe en dehors du langage explicite, c’est-à-dire les connaissances de base à l’origine de ce que nous avons tendance à dire. Ses recherches sont également axées sur la manière de donner aux machines ce même ensemble d’hypothèses, de conditions préalables et postérieures, cette même compréhension du monde qui les entoure, afin qu’elles puissent comprendre plus précisément ce que les êtres humains leur disent et produire un langage qui a du sens.

«Si je dis simplement: “Il va neiger ce soir. Je vais devoir me réveiller une demi-heure plus tôt demain”, vous pouvez immédiatement créer différents récits expliquant pourquoi cela a un sens. Il se peut que vous deviez déneiger votre voiture. Si vous prenez les transports en commun, ils seront peut-être un peu plus lents. Il peut y avoir du verglas sur les trottoirs et vous devrez être plus prudent. Vous êtes conscient de toutes ces conditions possibles et sensées qui existent sur la base de la première affirmation», déclare Antoine Bosselut.

Mais les machines n’ont pas encore ces hypothèses humaines innées. «Elles peuvent savoir que lorsqu’il pleut, l’eau tombe du ciel, et séparément que les gens sont mouillés. Mais elles n’apprendront pas que les gens sont mouillés parce que l’eau tombe du ciel. Mes recherches tentent de combler les lacunes de ce récit ou de trouver des moyens qui permettent aux machines d’apprendre à combler les lacunes pour détecter ces connexions en premier lieu», poursuit-il.

«Nous avons fait des progrès considérables dans ce domaine au cours des dernières années. L’un des éléments que nous avons pu montrer dans nos recherches est que plus ces systèmes NLP à grande échelle lisent, plus ils sont capables d’apprendre ces informations de base. Si vous lisez 1 000 fois qu’il pleut et qu’à chaque fois un peu plus d’informations sont données – des gouttes tombent, il pleut à verse, j’ai mis mon imperméable, j’ai ouvert mon parapluie – cela permet aux machines d’acquérir une compréhension beaucoup plus large des types de situations qu’elles lisent.»

Malgré ces progrès, ce n’est que récemment que le traitement du langage naturel en tant que domaine s’est très rapidement généralisé. Selon Antoine Bosselut, au cours de la prochaine décennie, de nombreuses études s’intéresseront à certaines des capacités négatives qu’il a libérées, souvent provoquées par une mauvaise compréhension de la façon dont les algorithmes font leurs prédictions et comment ils relient les points.

«Parfois, les capacités de ces systèmes dépassent notre compréhension de ceux-ci. Par exemple, tout le monde ignore le fonctionnement en interne du modèle GPT-3, un très grand système NLP. Pour des raisons de propriété intellectuelle, il fonctionne derrière un pare-feu. Ainsi, on ne peut pas étudier ce qu’il fait, mais on l’utilise pour concevoir de futurs produits. Doit-on partager ces produits avec d’autres personnes si l’on ne comprend pas le modèle qui les soutient?», s’interroge Antoine Bosselut.

«Il y a aussi des dangers», poursuit-il, «car certaines personnes sont malveillantes. J’espère qu’au moins, si nous parvenons à savoir comment ces machines comprennent les choses, nous pourrons créer des réglementations plus nombreuses et plus efficaces pour éviter le pire dont les êtres humains sont capables.»

«Je pense que le changement climatique est une analogie parfaite car la stratégie autour de certains contre-récits concernant les dangers de l’intelligence artificielle est similaire. Nous ne comprenons pas comment cela se produit, alors pourquoi faire des changements pour atténuer quelque chose que nous ne comprenons pas? Je me dis que, dans dix ans peut-être, nous regarderons en arrière et penserons qu’une certaine ignorance, volontaire ou non, a permis de donner un démenti plausible à certaines des pires choses que ces technologies peuvent provoquer», déclare-t-il.

Récemment, grâce à ses travaux, Antoine Bosselut a rejoint les rangs du prestigieux classement «30 under 30 Europe in Science and Healthcare» du magazine Forbes, qui le considère comme l’un des chercheurs les plus brillants et les plus influents du continent. Il s’agit d’une belle récompense pour la recherche et le leadership intellectuel qu’Antoine Bosselut entreprenait déjà. Mais ce dernier est déjà tourné vers l’avenir: «Même si je peux imaginer les opportunités que cette récompense va créer, j’aimerais penser qu’il s’agit d’un effet plutôt que d’une cause et que c’est vraiment une validation de la recherche que j’essaie de faire ici, aux côtés de personnes exceptionnelles».


Author: Tanya Petersen

Source: People