Un cadre d'apprentissage machine qui code les images comme une rétine

© iStock

© iStock

Des scientifiques de l’EPFL ont mis au point une méthode d’apprentissage machine pour compresser les données d’images avec une plus grande précision que les méthodes de calcul sans apprentissage. Elle pourrait être utile pour les implants rétiniens et d’autres prothèses sensorielles.

L’un des principaux défis à relever pour développer de meilleures prothèses neuronales est le codage sensoriel. Il s’agit de transformer les informations prélevées dans l’environnement par des capteurs en signaux neuronaux qui peuvent être interprétés par le système nerveux. Mais le nombre d’électrodes d’une prothèse étant limité, ce volume d’informations doit être réduit. Dans le même temps, la qualité des données transmises au cerveau doit être préservée.

Demetri Psaltis (Laboratoire d’optique) et Christophe Moser (Laboratoire de dispositifs photoniques appliqués) ont travaillé avec Diego Ghezzi de l’Hôpital ophtalmique Jules-Gonin – Fondation Asile des Aveugles (auparavant Chaire Medtronic en neuro-ingénierie de l’EPFL) pour appliquer l’apprentissage machine au problème de la compression de données d’images à dimensions multiples, comme la couleur ou le contraste. Dans leur cas, l’objectif de la compression était le sous-échantillonnage, ou la diminution du nombre de pixels d’une image à transmettre via une prothèse rétinienne.

«Le sous-échantillonnage pour les implants rétiniens est aujourd’hui réalisé en calculant la moyenne des pixels, ce qui revient en fait à ce que font les logiciels de création graphique quand on souhaite réduire la taille d’un fichier. Mais en fin de compte, c’est un processus mathématique. Aucun apprentissage n’est nécessaire», explique Diego Ghezzi.

«Nous avons remarqué que l’application d’une approche basée sur l’apprentissage permettait d’obtenir de meilleurs résultats en termes d’optimisation du codage sensoriel. Mais le plus surprenant, c’est que lorsque nous avons utilisé un réseau neuronal non contraint, ce dernier a appris à imiter par lui-même certains aspects du traitement rétinien.»

Plus précisément, l’approche d’apprentissage machine des scientifiques, appelée «cadre de modèle d’acteur», s’est avérée particulièrement efficace dans la recherche d’un «point idéal» pour le contraste de l’image. Diego Ghezzi cite Photoshop comme exemple. «Si vous déplacez le curseur de contraste trop loin dans un sens, il est plus difficile de voir l’image. Notre réseau a développé des filtres pour reproduire certaines des caractéristiques du traitement rétinien.»

Les résultats viennent d'être publiés dans la revue Nature Communications.

Comparaison entre l'image originale (à gauche), l'image traitée par calcul sans apprentissage (au milieu) et l'image traitée à l'aide du cadre de modèle d’acteur © EPFL CC BY SA

Validation in silico et ex vivo

Dans le cadre du modèle d’acteur, deux réseaux neuronaux fonctionnent de manière complémentaire. La partie modèle, ou modèle avant, fait office de jumeau numérique de la rétine: elle est d’abord entraînée à recevoir une image haute résolution et à produire un code neuronal binaire aussi proche que possible du code neuronal généré par une rétine biologique. Le réseau d’acteurs est ensuite entraîné à sous-échantillonner une image à haute résolution qui peut déclencher un code neuronal à partir du modèle avant, celui-ci étant aussi proche que possible du modèle produit par la rétine biologique en réponse à l’image d’origine.

À l’aide de ce cadre, les scientifiques ont testé des images sous-échantillonnées à la fois sur le jumeau numérique de la rétine et sur des rétines de cadavres de souris qui avaient été enlevées (explantées) et placées dans un milieu de culture. Ces deux expériences ont révélé que l’approche du modèle d’acteur produisait des images déclenchant une réponse neuronale plus proche de la réponse de l’image d’origine qu’une image générée par une approche de calcul sans apprentissage, comme le calcul de la moyenne des pixels.

Malgré les défis méthodologiques et éthiques liés à l’utilisation de rétines explantées de souris, c’est cette validation ex vivo de leur modèle qui fait de leur étude une véritable innovation dans le domaine, selon Diego Ghezzi.

«Nous ne pouvons pas nous fier uniquement au modèle informatique in silico. C’est pourquoi l’objectif de ces expériences était de valider notre approche.»

Autres horizons sensoriels

L’équipe a déjà travaillé sur des prothèses rétiniennes, mais c’était la première fois qu’elle utilisait le cadre du modèle d’acteur pour le codage sensoriel. Diego Ghezzi voit un potentiel d’élargissement des applications du cadre dans le domaine du recouvrement de la vision et au-delà. Il ajoute qu’il sera important de déterminer dans quelle mesure le modèle, qui a été validé avec des rétines de souris, s’applique à l’être humain.

«La prochaine étape évidente est de voir comment on peut compresser plus largement une image, au-delà de la diminution des pixels, afin que le cadre puisse jouer avec plusieurs dimensions visuelles en même temps. Une autre possibilité est de transposer ce modèle rétinien à des sorties d’autres aires cérébrales. Ce modèle pourrait même être associé à d’autres dispositifs, tels que des prothèses auditives ou des prothèses de membres», conclut Diego Ghezzi.

Références

Leong, F., Rahmani, B., Psaltis, D. et al. An actor-model framework for visual sensory encoding. Nat Commun 15, 808 (2024). https://doi.org/10.1038/s41467-024-45105-5


Auteur: Celia Luterbacher

Source: EPFL

Ce contenu est distribué sous les termes de la licence Creative Commons CC BY-SA 4.0. Vous pouvez reprendre librement les textes, vidéos et images y figurant à condition de créditer l’auteur de l’œuvre, et de ne pas restreindre son utilisation. Pour les illustrations ne contenant pas la mention CC BY-SA, l’autorisation de l’auteur est nécessaire.