Sotchi : nos émotions tweetées seront décryptées en temps réel

© 2014 EPFL

© 2014 EPFL

Des chercheurs de l’EPFL vont traquer les émotions du public pendant les Jeux Olympiques de Sotchi. Via les réseaux sociaux, ils vont montrer en temps réel ce que les internautes ressentent lors des compétitions.

Les discussions en ligne sont une manne extraordinaire d’informations. Ce sont des données libres et gratuites que les scientifiques étudient de manière toujours plus pointue. En extrayant des mots-clés des tweets, il est notamment possible de reconstituer un évènement. Partant de ce principe, l’équipe du Human Computer Interaction Group a décidé de mettre à profit les prochains Jeux d’hiver afin d’éprouver un logiciel de reconnaissance des émotions. Quels sont les émotions les plus fortes et comment se transforment-elles pendant la compétition, quel athlète préfèrent les internautes ?

Pour réaliser cette performance en temps réel, les chercheurs ont mis au point une application sous forme de diagramme, ayant la forme d’un disque coloré. Ils l’ont baptisé «EmotionWatch». Cette montre virtuelle affiche sur l’écran de l’ordinateur les tendances les plus fortes, le disque change ainsi de couleur suivant l’intensité des sentiments. Car chacune des 20 émotions considérées a sa propre couleur, le jaune pour la joie, le rouge pour la colère et le bleu pour l’inquiétude.

Un projet de semestre pour lancer l’idée
Tout a commencé par un projet de semestre. Le laboratoire cherchait à utiliser et valoriser une manne considérable de conversations échangées sur la toile lors des JO de 2012. Renato Kempter, étudiant, était intéressé par les interactions humaines sur Internet. Pendant 3 mois le jeune chercheur et deux doctorants se sont attelés à décrypter et codifier quelques 50 millions de Tweets postés aux JO de Londres. «Ce qui était intéressant, c’est que l’on pouvait parfaitement suivre l’évènement rien qu’en lisant les tweets. Le temps de réactions était incroyablement rapide. Les gens décrivaient leur fierté, leur tristesse…. il y a même eu un scandale avec le badminton et cela est ressortis dans les tweets.»



EmotionWatch

Pour comprendre et classer les opinions des internautes, Renato Kämpfer a dû imaginer la façon de les interpréter et de les représenter. «Je me suis appuyé sur une roue des émotions imaginée par les étudiants en psychologie de l’Université de Genève.» Sur la base de ce travail, le jeune chercheur a ensuite amélioré cet outil en ajoutant un élément visuel supplémentaire, la couleur. Il a ainsi développé un disque entouré de 20 points colorés représentant chacun une émotion particulière. Grâce aux mots-clés détectés dans les conversations, le logiciel dispatche les émotions et affiche la couleur du sentiment le plus intense. «Cela devenait de plus en plus complexe car je devais aussi prendre en compte le facteur temps et la fréquence des tweets.»
Le langage Tweeter et les émoticônes chinois.

Parallèlement au développement du logiciel, les chercheurs ont extrait les mots les plus significatifs que l’on trouve dans le vocabulaire sportif. Ils ont ainsi créé un lexique de 20 émotions et y ont associé des valeurs positives et négatives. Pearl Pu Faltings, qui dirige le projet, s’est également penchée sur les échanges effectués sur Sina.com - le twitter chinois. Les informaticiens ont ainsi ajouté une difficulté supplémentaire au décryptage des opinions: «Les chinois adorent ponctuer leur messages d’émoticônes, ils en utilisent plus de 70. Nous en avons donc dû en choisir 20 auxquels nous avons associé une émotion en rapport avec les mots déjà intégrés à notre logiciel, tels que fierté, joie, tristesse ou désappointement.»



Le défi : capturer les tweets en live

Le défi majeur sera, sans nul doute, la capture et le stockage de tous ces messages avec sous-jacente la peur du crash, car dans une telle opération il n’y a pas de deuxième chance. Entre-temps, la précision du logiciel a été améliorée. Il doit pouvoir trier les tweets par mots-clés afin de reconnaître tous les sports: «l’application ne doit pas seulement être jolie ou, ludique. Pour nous scientifiques, il est important que notre système soit opérationnel sur d’autres compétions et fiables dans la reconnaissance du vocabulaire Tweeter», précise Pearl Pu Faltings.

La doctorante Valentina Sintsova, s’attache à l’affinage des données: «le programme a été conçu pour reconnaître l’anglais et les émoticônes chinois, maintenant il doit pouvoir également accepter les contractions et le vocabulaire spécifique utilisé sur Tweeter tels que love u ou 4 you etc. et même pouvoir séparer les émotions vis-à-vis de deux joueurs d’un match de tennis par exemple.»

Après le test live des JO de Sotchi, l’application pourrait être utilisée à des fin commerciales ou marketing en permettant de voir la réaction des consommateurs face au lancement d’un nouveau produit, ou celle des électeurs lors de la présentation de candidats dans une élection politique.

Suivre les émotions dans le tweets: hci.epfl.ch/EmotionWatch-Sochi2014

Vidéo de présentation http://hci.epfl.ch/videos/2013-emotionWatch-ijcai