«Il faut être un peu visionnaire»
Touradj Ebrahimi, professeur à l’EPFL, recevra le 27 octobre à Los Angeles, la médaille SMPTE « progress », prix le plus prestigieux dans le domaine du traitement de l’image. Interview de ce chercheur visionnaire qui aurait tout aussi bien pu être roboticien.
Élaboré en 1994, JPEG s’est imposé rapidement comme un format d’images incontournable pour le web et les réseaux sociaux. Des milliards d’images transitent chaque jour par ce format. Ces algorithmes de compression sont tellement rentrés dans les mœurs que personne ne se pose la question de savoir qui s’en occupe. Il est pourtant régulièrement dépoussiéré et adapté aux évolutions technologiques et sociétales par un comité d’experts internationaux. Plusieurs normes ont par exemple été mises en place ces dernières années. À la tête du comité de pilotage depuis 2014, Touradj Ebrahimi, professeur de traitement du signal multimédia à l’EPFL (Faculté STI), sera récompensé le 27 octobre par la médaille SMPTE Progress pour ses travaux décisifs dans la mise au point de nouvelles normes telles que l’intégration de l’intelligence artificielle et le stockage sur l’ADN. La récompense, la plus prestigieuse du domaine, est remise annuellement depuis 1935.
Vous attendiez-vous à recevoir cette médaille ? Comment avez-vous appris la nouvelle ?
Je ne m’y attendais vraiment pas. Contrairement à d’autres prix, il n’y a pas de nomination par des pairs : le choix est fait uniquement par le comité d’organisation et rien n’a filtré. Pour être honnête, j’ai même failli manquer l’information. Je consultais mes mails en marchant dans la rue et j’ai cru à un spam. J’ai heureusement regardé quand-même un peu plus attentivement et quelques éléments m’ont fait penser que l’expéditeur devait quand même bien connaitre mes travaux…
Vous êtes à la tête du comité de pilotage de l’organisation JPEG depuis 2014. En quoi consiste votre travail ?
Depuis le début de ma carrière, trois thématiques très liées sont au cœur de mon travail : le codage de l’information visuelle, particulièrement les différents formats JPEG et MPEG, la sécurité (protection des droits, filigrane, authentification, intégrité des données, stéganographie -message dissimulé) et la qualité, c’est-à-dire la mesure de la perte d’information liée à la compression. Au cœur de la norme JPEG -Joint Photographic Experts Group-, se trouvent des algorithmes de compression avec perte : jusqu’à maintenant, avant que l’intelligence artificielle ne s’en mêle, le principe reposait sur le fait qu’une partie, non essentielle pour l’œil humain, soit détruite. Mais les normes doivent toutes être définies afin que ce soit fluide d’un bout à l’autre de la chaine : caméras, applications, utilisateurs. Par exemple les machines ne comprennent pas automatiquement à quoi correspond la notion de « qualité » pour un œil humain, il faut donc le préciser par des algorithmes. Concernant la sécurité : comment peut-on avertir le grand public lorsqu’une image a été modifiée. Comment permettre à tout un chacun de savoir que les informations qu’il voit dans le cadre de JPEG sont des informations qui ont été manipulées ou traitées par un ordinateur d’intelligence artificielle, etc. Il s’agit aussi d’anticiper l’essor des nouvelles technologies et d’adapter le format.
Justement, la norme JPEG IA sortira d’ici la fin de l’année. Que va-t-elle permettre d’améliorer ?
Embarquée dans les voitures, dans les smartphones, la sécurité… Depuis moins d’une dizaine d’années, un autre monde se dessine avec l’apparition à large échelle de l’intelligence artificielle. Tout ce qu’on faisait depuis plus de trente ans était destiné à l’humain. La performance de l’intelligence artificielle est sous-optimale d’un bout à l’autre de la chaîne, en commençant par les caméras. Le paradigme a donc changé : l’objectif est de faire des systèmes qui permettent d’utiliser aussi toute la capacité des machines. On ne peut pas séparer humain et machine, car dans de nombreux cas, le même système est utilisé par les deux : dans un téléphone mobile, la même caméra permet de prendre des selfies et sert à la reconnaissance faciale. Nous avons donc dû trouver une astuce algorithmique pour avoir les deux en même temps : une compression améliorée qui garde l’essentiel pour l’œil humain et reste efficace en même temps pour la vision par des machines. La norme JPEG AI va sortir en effet d’ici fin 2023. Les normes doivent prévenir ce qui va arriver. Elles mettent trois à quatre ans à se mettre en place, il faut donc anticiper. C’est cela qui est intéressant : il faut être un peu visionnaire. Créer une norme, c’est créer un écosystème qui ouvre des opportunités aux utilisateurs avant que la technologie ne se répande. La norme JPEG initiale a été élaborée bien avant que ces applications existent. C’est grâce à ce format que ces applications ont pu voir le jour.
La norme pour intégrer l’intelligence artificielle sera prête d’ici un an, quel est votre prochain cheval de bataille ?
Le défi est toujours le même :la quantité d’informations est de plus en plus importante, mais pour des raisons de place et d’économie des coûts, on ne peut pas multiplier la taille des batteries et des systèmes de stockage. Il faut donc compresser, mais on ne peut pas aller au-delà d’un certain seuil sinon l’image n’est plus de bonne qualité. Nous développons en ce moment la norme JPEG DNA pour un nouveau type de stockage sur l’ADN : un format de codage d'images très dense sur molécules artificielles.
Comment se fait-il que la norme JPEG et ses dérivées se soient imposées de façon presque monopolistique dans certains domaines comme le web et les réseaux sociaux, alors qu’il s’agit d’une organisation publique et non lucrative ?
Un avantage certain a été d’être le premier format normalisé au niveau international, en 1994, et que celui-ci soit contemporain de l’apparition du web. Ce dernier a naturellement adopté JPEG. D’autre part, le fait qu’il soit entièrement gratuit est apprécié. Finalement, et j’aurais peut-être dû citer cet avantage en premier : la qualité est son atout principal. J’ai passé toute ma carrière à améliorer des algorithmes de compression et on peut bien sûr faire encore mieux, mais l’ algorithme de compression utilisé dans le format JPEG est avant-gardiste : même après 30 ans, les spécialistes ont du mal à le battre. Certains experts affirment en rigolant que le format JPEG a été conçu par « des extraterrestres qui viennent du futur ».
Comment se fait-il qu’une norme soit largement adoptée par le public ? Pensez-vous que ce sera le cas avec JPEG Pleno, la norme destinée à la réalité virtuelle et immersive ?
Aujourd’hui peu de monde se promène avec des lunettes de réalité augmentée, mais de la même façon que des développeurs ont créé Facebook ou Instagram, le jour où des applications dans le monde immersif seront couramment utilisées, le format est prêt. Un grand atout qui fait que les nouvelles normes sont en général adoptées est de ne pas mettre les intérêts économiques avant le reste et de fonctionner sur tous les appareils et systèmes d’exploitation. Les grands groupes internationaux décideront s’ils l’utilisent ou pas. Mais il y a une certaine pression des consommateurs qui ne souhaitent pas être emprisonnés par un système fermé. Ils veulent pouvoir changer de marque d’appareil tout en pouvant continuer à lire leurs contenus. Des organismes de protection des consommateurs comme la Commission européenne ont d’ailleurs déjà agi dans ce sens contre de grandes compagnies comme Apple ou Microsoft qui créaient des applications fermées.
Finalement pourquoi le domaine du traitement de l’image, qui en était encore à ses balbutiements, vous a-t-il attiré au début de votre carrière ?
C’est un hasard : j’aurais tout aussi bien pu travailler dans un autre domaine, ce n’était pas une passion d’enfance. Quand j’ai fait mon diplôme à l’EPFL, j’hésitais entre la robotique, domaine dans lequel j’avais aussi de bonnes compétences, et le traitement des signaux. Un poste de doctorant était libre dans ce dernier, j’ai donc postulé et je n’ai pas regretté. Il me semble que lorsqu’on est jeune il n’est pas forcément facile d’être sûr de son choix tant qu’on n’a pas pratiqué et investi vraiment le domaine.
Un nouveau JPEG pour la réalité virtuelle et les voitures autonomes
Un logiciel pour démasquer les deepfake prend forme à l'EPFL