Un robot quadrupède révèle pourquoi les animaux changent d'allure
Entraîné à l’aide de l’apprentissage machine par des scientifiques de l’EPFL, un robot quadrupède a changé spontanément de démarche – le pas, le trot et le stotting – dans le but d’éviter les chutes. C’est une étape importante pour les spécialistes en robotique et les biologistes qui s’intéressent à la locomotion animale.
À l’aide d’une forme d’apprentissage machine appelée apprentissage par renforcement profond (DRL), le robot de l’EPFL a notamment appris à passer du trot au stotting – un comportement dans lequel des animaux comme les springboks et les gazelles bondissent en ayant le dos arqué – pour se déplacer sur un terrain difficile comportant des trous. Dirigée par le Laboratoire de biorobotique de la Faculté des sciences et techniques de l’ingénieur de l’EPFL, cette étude permet de mieux comprendre pourquoi et comment interviennent de tels changements de démarche chez les animaux.
«Selon les recherches antérieures, les animaux changent d’allure pour économiser leur énergie et éviter des blessures musculo-squelettiques. Plus récemment, des biologistes ont affirmé que la stabilité sur terrain plat pourrait être un facteur plus important. Mais des expérimentations avec des animaux et des robots ont montré que ces hypothèses ne sont pas toujours valables, en particulier sur des sols irréguliers», rapporte Milad Shafiee, doctorant et principal auteur d’un article publié dans la revue Nature Communications.
Milad Shafiee et les co-auteurs Guillaume Bellegarda et Auke Ijspeert, responsable du Laboratoire de biorobotique, se sont donc intéressés à un nouveau paramètre qui pourrait expliquer ces changements d’allure: la viabilité, ou la prévention des chutes. Pour tester cette hypothèse, ils ont entraîné un robot quadrupède à traverser divers terrains au moyen de l’apprentissage par renforcement profond. Sur terrain plat, ils ont constaté que chaque démarche présentait des niveaux de robustesse différents face aux poussées aléatoires et que le robot passait du pas au trot pour maintenir sa viabilité, comme le font les animaux quadrupèdes lorsqu’ils accélèrent. Et lorsqu’il a été confronté à des trous successifs de 14 à 30 cm dans la surface expérimentale, le robot est passé spontanément du trot au stotting pour éviter les chutes. De plus, la viabilité est le seul facteur qui a été amélioré par ces changements d’allure.
«Nous avons montré que sur un terrain plat et sur un terrain difficile, la viabilité entraîne des changements d’allure, mais que l’économie d’énergie n’est pas nécessairement meilleure, explique Milad Shafiee. Il semble donc que l’économie d’énergie, qui était auparavant considérée comme un facteur expliquant ces changements, pourrait en être davantage la conséquence. Lorsqu’un animal se déplace sur un terrain difficile, il est probable que sa priorité soit de ne pas tomber. Économiser son énergie arriverait ensuite.»
Une architecture d’apprentissage bio-inspirée
Pour modéliser le contrôle des mouvements de leur robot, les scientifiques ont pris en compte les trois éléments en interaction qui commandent les mouvements des animaux: le cerveau, la moelle épinière et la rétroaction sensorielle du corps. Ils ont eu recours à l’apprentissage par renforcement profond pour entraîner un réseau neuronal à imiter la transmission des signaux cérébraux de la moelle épinière au corps pendant que le robot parcourait un terrain expérimental. Ensuite, l’équipe a attribué différentes pondérations à trois objectifs d’apprentissage possibles: l’économie d’énergie, la diminution de la force et la viabilité. Une série de simulations informatiques a révélé que, parmi ces trois objectifs, la viabilité était le seul qui amenait le robot à modifier automatiquement son allure, sans instruction de la part des scientifiques.
L’équipe souligne que ces observations représentent le premier cadre de locomotion basé sur l’apprentissage dans lequel les changements d’allure apparaissent spontanément au cours du processus d’apprentissage, ainsi que le franchissement le plus dynamique de trous consécutifs aussi grands pour un robot quadrupède.
«Notre architecture d’apprentissage bio-inspirée a démontré l’agilité d’un robot quadrupède ultramoderne sur un terrain difficile», indique Milad Shafiee.
Les scientifiques souhaitent approfondir leurs travaux en menant d’autres expériences qui placent différents types de robots dans une plus grande variété d’environnements difficiles. Ils espèrent qu’à terme, leurs travaux permettront non seulement de comprendre la locomotion animale, mais aussi de généraliser l’utilisation de robots pour la recherche biologique, en diminuant le recours aux modèles animaux et les problèmes éthiques qui y sont associés.
Shafiee, M., Bellegarda, G. & Ijspeert, A. Viability leads to the emergence of gait transitions in learning agile quadrupedal locomotion on challenging terrains. Nat Commun 15, 3073 (2024). https://doi.org/10.1038/s41467-024-47443-w