Les scientifiques des données s'affrontent sur la plateforme crowdAI
crowdAI est une plate-forme destinée à des concours de science des données en libre accès, développée par l'EPFL. Elle accueille des concours d'apprentissage automatique (machine learning), et a reçu l’équivalent de 100'000 dollars d'Amazon et Nvidia pour son dernier défi, «Apprendre à courir».
Le projet CrowdAI est une plate-forme ouverte pour des concours en science des données. Elle a été développée à l'EPFL et a été fondée par Marcel Salathé, connu pour ses travaux innovants dans le domaine de l'apprentissage automatique appliqué (machine learning), de la détection des maladies des cultures à l'évaluation de la composition de macronutriments par des images d'aliments.
L'idée qui sous-tend crowdAI est d'offrir une plate-forme en libre-accès pour héberger des concours en science des données ouvertes, et inviter la communauté des scientifiques des données dans le monde entier à développer des algorithmes d'apprentissage automatique pour des problèmes de science des données spécifiques. Pour citer la plate-forme web: «crowdAI connecte des experts en science des données, des enthousiastes des données ouvertes pour résoudre des problèmes spécifiques, par le biais de défis.»
Les défis couvrent un large spectre, comme d'utiliser le deep learning (apprentissage profond) pour diagnostiquer les maladies des plantes sur la base d'images de feuilles symptomatiques (PlantVillage), de prédire la taille d’une personne à partir de son génotype, ou d’apprendre à un squelette virtuel mais anatomiquement exact comment marcher et courir.
Les deux derniers défis ont été initiés par le Stanford’s Neuromuscular Biomechanics Lab, et leur but ultime se situe au-delà des simples simulations informatiques: l'objectif du défi est de trouver de meilleurs moyens pour aider les enfants infirmes moteur cérébral à répondre à la chirurgie myorelaxante. Il s'agit d'un type d'intervention auquel les médecins ont souvent recours pour améliorer la marche des patients. Cependant, cela ne réussit pas toujours.
«La question essentielle est de pouvoir prédire comment le patient marchera après l'opération», dit Lukasz Kidziński, le post-doctorant en bio-ingénierie de Stanford qui a remporté le défi crowdAI. «C'est une grande question, dont l'approche est extrêmement difficile».
Le défi «Apprendre à marcher», qui est maintenant terminé, a suscité beaucoup d'intérêt au cours de son déroulement, avec 199 participants et 200 propositions différentes. Mais la version «Apprendre à courir», qui se poursuit, a fait mieux encore, avec presque 1'400 propositions émanant de 391 participants. Ce concours fait partie de la conférence 2017 Neural Information Processing Systems (NIPS), l'une des plus grandes conventions au monde sur l'intelligence artificielle (du 4 au 9 décembre et déjà complète).
Mais ce n'est pas tout: «Apprendre à courir» a aussi éveillé l'intérêt de géants de l'industrie qui ont offert deux prix pour les gagnants: Amazon a offert l'équivalent de 30'000 dollars de crédits AWS Cloud, tandis que Nvidia offre une DGX Station™, le premier superordinateur GPU personnel d'une valeur de 70'000 dollars, parmi d'autres prix.
Bien sûr, celui-ci ne sera pas le dernier défi de crowdAI: «Nous sommes en discussions avancées avec le Blue Brain Project, deux ONG, une conférence sur la recherche documentaire, et divers laboratoires de l'EPFL pour organiser d'autres défis en science des données ouvertes», dit Marcel Salathé. «Je suis très emballé par le potentiel de cette plate-forme en vue d'accélérer la transition de la recherche vers une science complètement ouverte, et je suis très fier de ce que nous avons accompli jusqu'ici. Notre prochaine étape sera de convaincre d'autres universités de contribuer à la plate-forme, et de convertir cela en un effort multi-institutionnel.»