Samy Bengio: de l'IDIAP à Google

Samy Bengio

Samy Bengio

RENCONTRE: Lors d'un séjour en Californie chez Elaine McMurray, la précédente responsable du KIS (services web EPFL), Natalie Meystre a eu la chance d'interviewer son mari, Samy Bengio, chercheur en informatique chez Google depuis février 2007.

Samy Bengio, vous avez travaillé de 1999 à 2007 à l'IDIAP. De quoi s'occupe cet institut?
Basé à Martigny, l'IDIAP est une fondation qui mène, en collaboration avec l'EPFL, des recherches en traitement de la parole, vision par ordinateur, recherche d'information, authentification biométrique, interactions multimodales et apprentissage automatique.

Qu'y faisiez vous?
Le travail habituel d'un chercheur: encadrer des doctorants, monter des projets et chercher des financements. J'ai également donné des cours de «Machine Learning» à l'EPFL.

Quelles sont vos recherches?
Je suis spécialisé en «Machine Learning». Pratiquement, il s'agit de trouver un moyen pour apprendre à une machine à résoudre des tâches dont on ne sait exprimer formellement la solution (à l'aide d'une équation ou d'un algorithme, par exemple), mais pour lesquelles on dispose de beaucoup de cas. Les exemples sont plus parlants: en reconnaissance d'écriture, il est facile pour une personne d'identifier des lettres écrites à la main, mais on ne sait pas faire un programme qui en est capable. En reconnaissance de la parole, c'est pareil: on comprend ce que disent les gens et qui l'a dit, mais il est difficile d'écrire un algorithme qui peut le faire. Idem pour la reconnaissance de l'image_: comment identifier un objet ou une personne sur une photo? Les approches «Machine Learning» essaient donc de déduire une représentation statistique du monde à partir des exemples disponibles, afin de prendre les décisions les plus appropriées (de quel caractère s'agit-il, qui se trouve sur telle photo, etc.).

Qu'est-ce qui intéressait les gens de Google dans votre profil?
La mission première de Google est d'organiser l'information et de la rendre universellement accessible et utile. Google récolte une quantité gigantesque de données, mais comment les classer? Les techniques de «Machine Learning» sont au cœur de cette problématique. Parmi les instituts spécialisés dans ce domaine, l'IDIAP regroupe dans un même lieu des chercheurs en «Machine Learning», vision, parole et recherche d'information.

Pouvez-vous en dire plus sur votre travail?
Google m'a laissé carte blanche. J'ai consacré mes premiers mois à étudier les projets en cours, puis j'ai choisi un thème proche des mes recherches précédentes: l'ordonnancement des image à partir de requêtes textuelles. Tous les moteurs de recherche d'images actuels utilisent les métadonnées et le contexte où apparaissent ces images, afin de déterminer l'ordre de présentation des résultats. Mon défi est de travailler sur les images elles-mêmes, en dehors de tout contexte.

Quels sont les avantages à travailler chez Google?
Principalement la quantité de ressources disponibles, et ceci sur tous les plans: machines, personnes, données. Les ordres de grandeur sont largement supérieurs à un milieu académique. Il m'est également possible de publier mes travaux.

Quel est votre environnement quotidien?
La Silicon Valley est un lieu mythique, un véritable creuset d'innovations. On peut assister à des présentations scientifiques de très haut niveau, que ce soit à Google ou ailleurs. Puis, il y a la culture Google, la moyenne d'âge est basse, les collègues sont jeunes et motivés. Une fois par an, une évaluation de ton travail est mené par tes pairs, que tu choisis toi-même parmi des collègues proches intellectuellement et physiquement, pas forcément parmi les chefs de projet. Les bonus sont attribués sur la base de ces évaluations.

Qu'est-ce qui vous a le plus frappé en arrivant?
Il suffit d'appuyer sur un bouton pour accéder à toutes les ressources de Google. Sans barrières administratives, on dispose automatiquement d'une grande puissance de calcul et de térabytes de stockage. Tout le code de Google est complètement ouvert à l'interne, évidemment avec une clause de confidentialité très forte vers l'externe. Chaque vendredi, les boss présentent l'évolution des projets lors d'un meeting ouvert à chacun des 10'000 employés du site (''Thanks God it's Friday'').

Pour l'anecdote, avez-vous réussi votre examen de code?
Oui, bien sûr. En effet, chaque nouvel employé qui a envie de participer à l'écriture du code doit passer un examen sur sa lisibilité. Il ne s'agit pas de tester la qualité de code, mais sa capacité a être lu par tous. C'est essentiel pour que 10'000 personnes puissent collaborer sur les mêmes projets.

Quelle est enfin votre condition de travail la plus marquante?
L'esprit d'entraide et non de compétition qui règne entre collègues

Plus d'informations sur Samy Bengio: http://bengio.abracadoudou.com/