La révolution de la perception 3D

Alexandre Alahi et Damien Matti  © photo: Alain Herzog

Alexandre Alahi et Damien Matti © photo: Alain Herzog

Un doctorant de l’EPFL a intégré son propre algorithme patenté dans la nouvelle caméra de détection 3D de Microsoft, la Kinect. Il est parvenu ainsi à connecter plusieurs caméras pour une détection en temps réel sous tous les angles et indépendante des conditions de lumière.

La tendance du moment, qui a mis toute la communauté des hackers de haut vol en ébullition, c’est le détournement de la nouvelle caméra révolutionnaire de Microsoft, la Kinect.

Lancée sur le marché pour révolutionner le jeu vidéo, en permettant la capture de mouvement en 3D grâce à un projecteur infrarouge couplé à un senseur monochrome, son protocole a été hacké et publié en ligne, en quelques jours.

Après le hacking du protocole, il restait encore une étape à franchir: coupler plusieurs Kinects. C’est désormais chose faite, notamment grâce à un nouvel algorithme patenté par Alexandre Alahi, doctorant à l’EPFL.

L’avantage ? Plusieurs Kinects permettent de reconstruire les angles de vue non perçus par une seule caméra.

«J’ai été fasciné par les premières vidéos sur YouTube du détournement de la Kinect, j’ai voulu aller plus loin en « mergeant » plusieurs caméras», s’enthousiasme Alexandre Alahi, «j’ai réussi à faire tourner mon algorithme sur un laptop, et les caméras sont simplement connectées via les ports USB». La robustesse de l’algorithme d’Alexandre Alahi permet aussi de diminuer le « bruit » (profondeur floue ou pixels noirs) que génère le rassemblement de plusieurs caméras 3D.

L’application de ce nouvel algorithme permet de détecter en temps réel plusieurs personnes, comme une foule très dense, sans que des informations parasites soient prises en compte (ombres, personnes figées). Le protocole parvient même à différencier les formes (voiture, humain, vélo, etc.)

Alexandre Alahi voit déjà de nombreuses applications pour ce nouvel algorithme dans différents domaines:

  • - Pour optimiser les flux de personnes en apportant une information statistique précise ou repérer un comportement suspect automatiquement dans les gares et les aéroports.
  • - Pour la détection automatique de piétons dans la sécurité routière.
  • - Pour « traquer » de multiples personnes sur un terrain de sport et de donner des informations statistiques sur le jeu.

Détournée de son utilisation d'origine, la Kinect n'a pas fini de faire parler d'elle, d'autant plus que la start-up israëlienne à l'origine de cette caméra a maintenant décidé de mettre son protocole en open source. De quoi susciter d'autres détournements et améliorations possibles.


Auteur: Didier Bonvin

Source: EPFL