«Quand l'imagerie progresse, la science progresse»

Image composite des restes de la supernova 1181 © NASA/CHANDRA/WISE. ESA/XMM, MDM/R.Fessen (Dartmouth College), PAN-STARRS

Image composite des restes de la supernova 1181 © NASA/CHANDRA/WISE. ESA/XMM, MDM/R.Fessen (Dartmouth College), PAN-STARRS

En presque 40 ans, la spécialiste de la photographie scientifique Sabine Süsstrunk a vu de l’intérieur les progrès fulgurants de l’imagerie scientifique. Sans compter l’arrivée bouleversante de l’intelligence artificielle.

Professeure au Laboratoire d’imagerie et de représentation visuelle de l’EPFL depuis 1999, l’informaticienne est aussi membre du comité de pilotage du Centre d’imagerie de l’EPFL et présidente du Conseil suisse de la science.

Sabine Süsstrunk - 2024 EPFL / Jamani Caillet - CC-BY-SA 4.0

Qu’est-ce que l’on n’arrive pas encore à voir aujourd’hui avec l’imagerie?

En imagerie, tout est une question d’échelle. De l’infiniment grand — le spatial — à l’infiniment petit — l’atome– en passant par la structure des matériaux ou les diagnostics médicaux, on attend des progrès au niveau des résolutions spatiale, temporelle et radiométrique. Avec des instruments plus sensibles dans ces trois dimensions, on pourrait détecter encore davantage de choses.

Par exemple?

Dans le cas de la télédétection, les appareils d’acquisition deviennent de plus en plus puissants et permettent de faire des analyses de plus en plus précises de la composition des sols et de la teneur en eau. Ça nous aide à mieux modéliser l’impact des cultures, par exemple, et à développer des solutions pour l’agriculture durable.

On voudrait aussi détecter des cancers à des stades plus précoces, mieux comprendre les interactions au cœur des cellules, percer les mystères du Big Bang et trouver des traces de vie sur les exoplanètes. Des progrès dans la dimension temporelle, avec une vitesse de mille images/seconde ou plus, nous aideront à mieux décrypter les mouvements et le comportement de certains animaux.

En quoi l’intelligence artificielle est-elle déterminante pour la génération d’images?

Dans le domaine de l’espace typiquement, dès que l’on met en service un nouveau télescope, on découvre davantage de choses. Mais si l’on a pu prendre la première image d’un trou noir, c’est grâce à l’IA. C’est le fruit d’un processus itératif : les instruments prennent de nouvelles images qui permettent d’entraîner l’IA, l’IA peut ensuite reconstruire, puis on améliore les instruments, on entraîne l’IA avec les nouvelles images et ainsi de suite. L’un ne va pas sans l’autre.

La quantité d’images est déterminante, pour l’IA. Il nous faut donc des appareils qui peuvent prendre une grande quantité d’images.

Et pour l’analyse?

Dans l’analyse, quand l’IA est bien entraînée, elle est déjà meilleure que l’humain. Aujourd’hui, le cancer du sein est mieux détecté par l’IA que par des radiologues. On a une telle quantité de mammographies que le système est extrêmement bien entraîné. Mais c’est aussi précisément le problème : si l’image présente un cancer qui n’est pas très récurrent ou si le système n’a pas été entraîné avec assez d’exemples, l’IA ne le trouvera probablement pas. La diversité des images est aussi fondamentale pour que l’IA fonctionne bien. La fiabilité maximale dépend de l’application et de la façon dont l’humain et l’IA sont entraînés. Ni l’une ni l’autre ne sont 100% fiables.

La simulation pourrait-elle remplacer l’imagerie?

Grâce à l’IA, on peut compenser les limites des captures physiques. On reconstruit des images qui sont meilleures que celles des instruments physiques. Avec la super-résolution par exemple, on capture spatialement avec une certaine résolution, et avec l’IA on peut atteindre une résolution 2, 4 voire 8 fois plus fine. Le système se base sur l’information la plus probable qui va suivre. Même si c’est une simulation ou une imitation, avec assez de données, on peut avoir une probabilité assez forte qu’autour d’un pixel que l’on a capturé telle information va venir.

On arrive ainsi à simuler pour voir ce qu’on ne peut pas encore voir avec l’imagerie, mais il y a un danger, du fait qu’on n’a aucune preuve que c’est correct.

L’IA peut-elle se tromper complètement?

Certainement. L’IA crée une imitation avec une grande probabilité qu’elle soit correcte, mais ce n’est pas une information physique — une telle image ne devrait donc pas être utilisée dans une recherche qui entend capturer de vrais signaux physiques. On peut avoir le même genre d’erreurs que celles que rencontre le public avec ChatGPT. L’IA fonctionne sur l’entraînement : si elle n’a pas été entraînée à reconnaitre un type d’information ou un type d’image, elle ne va pas la trouver. Elle ne fait qu’imiter ce qu’elle a déjà vu. Or le problème est que l’IA va toujours créer une image ou une réponse. Elle ne dira jamais: «Je ne sais pas». Donc plus on est hors domaine, moins fiable est la réponse du système, que ce soit la génération, la reconstruction ou l’analyse.

Appliquer l'IA à l'imagerie scientifique requiert de la transparence et de la probité.

Sabine Süsstrunk

L’IA met-elle en danger la qualité et la crédibilité des publications scientifiques?

Il est clair que la génération d’images peut faciliter les faux. Cela dit, on n’a pas attendu l’IA pour tricher. Pendant très longtemps, il n’y avait pas d’open science ni de question de reproductibilité. Il en va de l’éthique du chercheur ou de la chercheuse.

Comment déterminez-vous que des résultats sont fiables?

Je suis méfiante quand il n’y a pas de code disponible et que le genre de données utilisées n’est pas clair. Ce sont les critères de la reproductibilité. Je ne crois d’ailleurs pas à la moitié des résultats des grandes entreprises. Je fais une exception pour les résultats en médecine, car ce n’est pas toujours possible avec des données sensibles de les publier. Même quand il y a le code, souvent on ne peut pas reproduire les résultats. On trouve quelques points de pourcentage de moins…

Peut-il y avoir une tricherie involontaire en appliquant l’IA sur ses données?

L’imagerie prend une place croissante dans les sciences en général, car les outils d’analyse deviennent de plus en plus puissants et de moins en moins chers. Mais pour bien utiliser l’IA, il faut une bonne connaissance de l’imagerie et connaître les limites de l’outil. Un profane peut se faire avoir. Il en va de sa responsabilité professionnelle de se former. Le Centre d’imagerie de l’EPFL est précisément aussi là pour aider en proposant des formations et des cours d’été.

L’imagerie a permis de voir l’invisible à toutes les échelles, l’IA crée-t-elle l’inexistant avec les deepfakes?

C’est une question d’application. En soi les deepfakes ne sont pas un danger, c’est la façon dont on les utilise qui peut l’être, à l’instar de la «viralisation» des deepfakes sur les réseaux sociaux. La photo n’a pas attendu l’IA pour être manipulée et générer des images de ce qui n’existe pas. La photo est là pour plaire et tout y est permis. Elle doit seulement être visuellement plausible. En revanche, l’imagerie scientifique doit aussi être physiquement réaliste, car elle sert à mesurer ou visualiser une quantité physique de façon objective. L’image scientifique ne doit pas plaire, mais permettre d’apporter des connaissances dans un domaine.

Finalement, seule l’imagerie optique peut-elle créer une image vraie?

Oui, même si l’image optique peut être fausse, si l’on fait par exemple une erreur dans l’acquisition des données. De plus, le problème de l’image optique est qu’il y a du bruit. Donc il faut toujours procéder à une reconstruction, et si l’on ne fait pas correctement cette reconstruction, l’image optique peut être corrompue. Mais la fiabilité de l’image optique est meilleure que celle générée par l’IA.

La puissance de calcul est-elle un frein?

Construire des modèles d’IA prend beaucoup de temps, il y a des milliards de paramètres qu’il faut entraîner, ce qui requiert une puissance de calcul énorme. Voilà pourquoi seuls les géants comme OpenAI ou Meta peuvent se le permettre. Toutefois, les modèles qu’ils utilisent sont des modèles de fondation (foundation models) qui peuvent tout générer, du texte, de l’image, du son, de la vidéo… Mais dans la recherche, nous nous concentrons sur des modèles monotâches qui peuvent par exemple uniquement détecter le cancer du sein ou reconstruire des images IRM. C’est beaucoup moins lourd. SwissAI nous permettra de faire de tels modèles spécifiques.

Comment améliorer l’IA?

Le besoin d’annotation des données constitue un réel problème. Quand on a montré trois photos de chats à un bébé, il sait reconnaître un chat. Pour un algorithme, il en faut des milliers et l’humain doit lui dire ce que représente l’image pour qu’il apprenne de façon fiable. Aujourd’hui, si l’on entraîne un système sans annoter les données, les performances sont trois fois moins bonnes que quand les données sont annotées. On a vraiment besoin de progrès dans cet apprentissage autosupervisé, car cela exclut nombre d’applications pour lesquelles on n’a pas beaucoup de données. Ce n’est pas pour tout de suite, mais on va y arriver.

Que nous réserve l’avenir?

Si je voyais l’avenir, j’aurais déjà fondé ma start-up! L’IA va nous aider à développer de meilleures technologies d’acquisition. C’est vraiment ce processus itératif entre la technologie et l’IA: un meilleur capteur permet une meilleure analyse, une meilleure analyse permet d’améliorer les capteurs… Cette relation symbiotique nous permettra d’avancer dans toutes les dimensions, spatiales et temporelles. Quand l’imagerie progresse, la science progresse.


Auteurs: Anne-Muriel Brouet, Cécilia Carron

Source: EPFL

Ce contenu est distribué sous les termes de la licence Creative Commons CC BY-SA 4.0. Vous pouvez reprendre librement les textes, vidéos et images y figurant à condition de créditer l’auteur de l’œuvre, et de ne pas restreindre son utilisation. Pour les illustrations ne contenant pas la mention CC BY-SA, l’autorisation de l’auteur est nécessaire.