La saga Star Wars livre des secrets grâce aux maths

© K.Benzi LTS2/EPFL. Réseau des 7563 principaux personnages de Star Wars.

© K.Benzi LTS2/EPFL. Réseau des 7563 principaux personnages de Star Wars.

Grâce à un nouvel outil informatique, des chercheurs de l’EPFL offrent une nouvelle perspective sur l’univers de la célèbre série, qui compte pas moins de 20'000 personnages répartis en 640 communautés sur une période de 36‘000 ans.

Ceux qui pensent bien connaître le monde de Star Wars pourraient bien se raviser d’ici la fin de cet article. Grâce à un nouvel outil informatique, des chercheurs de l’EPFL ont pu obtenir des informations inédites sur la célèbre saga. En utilisant une méthode basée sur la théorie des graphes - qui fait essentiellement appel à l'informatique et aux calculs mathématiques -, ils ont analysé des centaines de pages internet consacrées à la mythique série créée dans les années 1970 par le réalisateur Georges Lucas. Mais au-delà de cette belle performance de «geeks», la démarche se révèle potentiellement intéressante pour l’analyse et l’extraction de données dans de très nombreux domaines scientifiques.

L’univers Star Wars est gigantesque. En plus des sept longs métrages, il comprend également de nombreux documents moins connus du grand public, tels que des livres, des jeux vidéo et d’autres supports, qui ont progressivement ajouté des épisodes et complété la saga. Cette étude, menée au Laboratoire de traitement des signaux 2 de l’EPFL (LTS2), permet d’en prendre la mesure.

80% d’êtres humains

«Les fans apprendront par exemple avec surprise que l’on a recensé au total plus de 20’000 personnages», relève Kirell Benzi, doctorant et auteur principal du projet. Parmi eux, 7’500 ont un rôle de premier plan. On compte également 1367 Jedis et 724 Siths. Tous ces individus se répartissent dans quelque 640 communautés différentes sur 294 planètes. L’analyse des dix communautés principales dévoile d’ailleurs une aberration: près de 80% de la population de la galaxie serait des humains…

Le programme permet non seulement de quantifier les protagonistes et d’identifier leur appartenance tribale, mais également de les situer dans le temps. Un temps très long, puisque l’histoire se déroule sur pas moins de 36'000 ans, segmentés en six périodes principales: avant la république, l’ancienne république, l’empire, la rébellion, la nouvelle république, l’ordre des Jedis.

«Pour défricher cette impressionnante forêt de données, nous nous basons sur l’analyse des réseaux, c’est-à-dire sur toutes les connexions qu’un personnage entretient avec les autres, explique Xavier Bresson, chercheur au LTS2. Grâce à ces recoupements, on arrive à déterminer son époque presque à coup sûr et avec une grande précision, sans que cette information soit directement fournie dans les livres ni dans les films.»

Ici, le réseau des personnages est coloré par ère. Dans la figure 1, les noeuds noirs représentent les données manquantes. Noeuds rouges: soulèvement de l'Empire (épisode 1,2,3). Noeuds bleus: ère de la Rebellion (épisode 4, 5, 6). Noeuds verts: appartiennent aux deux ères. La figure 2 montre le résultat de l’algorithme: les nœuds noirs ont été colorés par l’ère qui s’adapte au mieux à la structure des nœuds voisins.

Des chemins dans la jungle

Par cette étude, les chercheurs souhaitent avant tout démontrer les potentialités de cet outil en termes d’extraction et d’analyse de données numériques. «Il permet de tracer des chemins dans la masse d’informations qui s’offre en vrac sur le net», résume Kirell Benzi.

En présence d’une quantité importante de données, les algorithmes développés par les chercheurs du LTS2 offrent un service inégalable par des êtres humains. Ils sont capables non seulement d’extraire des éléments selon des critères extrêmement précis, mais aussi de générer des liens entre eux, de les trier, de les quantifier, d’en dégager le sens et de trouver des informations manquantes. Le tout à très grande vitesse. Enfin, finalisé sous forme de graphes interactifs, ce travail est rendu plus lisible et aisément compréhensible.

À long terme, cet outil pourrait être appliqué dans de nombreux domaines. «Le jour où suffisamment de documents et archives seront numérisés, cette méthode pourrait s’avérer très utile pour combler certaines lacunes dans le registre des connaissances historiques, sociologiques ou d’autres branches scientifiques», conclut Xavier Bresson.

Les résultats de l'étude peuvent être consultés sur le blog de Kirell Benzi, qui compte poursuivre l'analyse, notamment en observant la transmission de la «force» entre maîtres et disciples Jedis et Siths.

http://kirellbenzi.com/blog/exploring-the-star-wars-expanded-universe/

http://kirellbenzi.com/blog/exploring-the-star-wars-expanded-universe-part-2/

Autre exemple d’application de la théorie des graphes: les artistes du Montreux Jazz.

http://kirellbenzi.com/blog/montreux-jazz-festival-artists-map/



Images à télécharger

© K.Benzi LTS2/EPFL. Réseau des 20 personnages de Star Wars les plus connectés.
© K.Benzi LTS2/EPFL. Réseau des 20 personnages de Star Wars les plus connectés.
© K.Benzi LTS2/EPFL. Réseau des 7563 principaux personnages de Star Wars.
© K.Benzi LTS2/EPFL. Réseau des 7563 principaux personnages de Star Wars.

Partager sur