"L'informatique change la façon dont nous percevons le monde."

© 2013 EPFL

© 2013 EPFL

Frédéric Kaplan reçoit un Courtesy Appointment de la Faculté Informatique et Communications et se réjouit des synergies entre son domaine de recherche, les "humanités digitales" et les travaux des autres professeurs de la faculté IC. Zoom sur un domaine en pleine expansion.


Frédéric Kaplan, les "humanités digitales"… Comment démarre l’aventure ?
« Cette dénomination est apparue il y a une dizaine d’années aux USA, pour désigner un domaine à la croisée des sciences humaines et des sciences de l’information. Cela fait plus de cinquante ans que des recherches interdisciplinaires ont lieu dans ce domaine, mais le développement des premiers grands projets de numérisation a amplifié cette tendance. Nous entrons d’ailleurs maintenant dans une nouvelle phase avec des projets plus ambitieux, regroupant de grands groupes de chercheurs et qui se basent sur la gestion massive d’informations grâce à des bases de données performantes. C’est une évolution un peu similaire à celle qu’ont connue les sciences de la vie dans les dernières décennies.
À Lausanne, l’aventure a commencé de manière informelle il y a quelques années autour d’un petit groupe de chercheurs de l’EPFL et l’UNIL, avec la création de mon laboratoire à l’EPFL, le Laboratoire d'humanités digitales, puis du Laboratoire de cultures et humanités digitales de l'Université de Lausanne LADHUL, nos recherches sont maintenant reconnues internationalement. Signe de cette reconnaissance, nous organisons conjointement Digital Humanities 2014 la plus grande conférence du domaine, du 7 au 11 juillet 2014. »

Vous venez de recevoir un Courtesy Appointement de la Faculté Informatique et Communications…
« Je travaille déjà régulièrement avec Sabine Süsstrunk pour toutes les questions de numérisation. Ensemble nous avions écrit l’an dernier une partie d’un NCCR sur le sujet des humanités digitales. Dans les dernières années, j’ai aussi interagi régulièrement avec Pascal Fua. Nous allons travailler ensemble sur des d’algorithmes pour analyser la structure des façades de bâtiments présents sur des tableaux ou des gravures. J’ai eu récemment des échanges passionnants avec Patrick Thiran et Matthias Grossglauser concernant l’analyse des réseaux sociaux du passé et les phénomènes de propagation des épidémies comme la peste au Moyen-Âge. Avec Anastasia Ailamaki, nous discutons de la meilleure manière de constituer de grandes bases de données à partir des informations contenues dans les documents historiques. Enfin, avec Babak Falsafi nous allons explorer la pertinence d’architectures dédiées au Text Mining (extraction automatique d’informations dans les documents textuels), un grand défi pour les humanités digitales. Je me réjouis de toutes ces collaborations et de celles à venir. Je me réjouis de toutes ces collaborations et de celles à venir. »

Vous aimez à dire que certains des défis de l’informatique de demain se trouvent du côté des sciences humaines. Expliquez-nous…
« Lorsque l’on tente de faire du "Big Data" pour les sciences humaines, le défi scientifique central est de trouver des solutions pour qualifier, quantifier et représenter l’incertitude. Un document historique peut contenir des imprécisions, des erreurs (volontaires ou non) ou tout simplement une orientation idéologique qui conduit à une certaine manière de présenter des "faits". Par ailleurs le document peut-être abimé, partiellement illisible ou indéchiffrable. Faute de connaître parfaitement son contexte, il peut être mal interprété. Les processus de numérisation, de transcription et d’indexation ajoutent à leur tour toute une autre famille d’erreurs. Il est donc crucial de développer des manières de formaliser non seulement l’information contenue dans un document, mais aussi toutes les métadonnées caractérisant le processus d’extraction de cette information. Puis de trouver une approche pour mettre ensemble ces informations venant de sources potentiellement très différentes de manière à constituer de grandes bases de données. »

Comment allez-vous procéder ?
« Nous avons développé le concept d’espaces fictionnels associé à un document ou à un corpus de documents. Il s’agit de l’ensemble des informations qui peuvent être extraites de ce document. Ces informations sont caractérisées par des formes d’incertitudes variées. Nous formulons ensuite un cadre pour permettre la « jointure » de plusieurs espaces fictionnels et former ainsi des espaces contenant plus d’informations. Lors de la jointure, nous pouvons détecter d’éventuelles incohérences (un événement impliquant une personne déjà morte par exemple). À toutes ces étapes, il est cependant possible de revenir en arrière en excluant par exemple les données provenant d’un certain auteur ou utilisant une technique de numérisation particulière. Au final, il n’y a pas une version reconstituée du passé, mais de multiples passés probables correspondant à certains ensembles de documents et certaines hypothèses de travail. C’est ce type de flexibilité qui manque aujourd’hui aux techniques du web sémantique. Aussi le passage par les "Big Data" issues du passé pourrait conduire à des innovations que nous pourrions ensuite redéployer pour les "Big Data" d’aujourd’hui. »

Comment ensuite naviguer dans ces informations ?
« Dans la dernière décennie, nous avons assisté à un développement spectaculaire d’outils pour naviguer dans l’espace. Il me semble que le grand défi est d’intégrer aujourd’hui la dimension temporelle à ces outils. Ainsi, pouvons-nous ajouter un "slider" ou curseur de défilement à Google Maps, pour voir à quoi ressemblait une ville il y a plusieurs centaines d’années ? Pouvons reconstituer des réseaux sociaux du passé avec la même densité d’informations que les réseaux sociaux actuels ? Pouvons-nous créer des moteurs de recherche qui ne nous donnent pas la meilleure réponse à une question, mais qui nous permettent de voir l’évolution des réponses au fil des âges en fonction des informations disponibles à ces époques ? Voici les types d’outils que nous tentons de développer au Laboratoire d'humanités digitales. »

Selon vous, quel va être l’impact de l’informatique sur les sciences humaines ?
« L’informatique ne fait pas que transformer les sciences humaines, ce sont toutes les sciences qui sont profondément bouleversées par les outils et les méthodes des sciences de l’information. Les bases de données, les simulations, les algorithmes d’apprentissage peuvent modifier les pratiques et les processus de travail. La possibilité de mettre en place des projets de grande ampleur change l’organisation des équipes. Mais il y a aussi quelque chose de plus profond, une transformation épistémologique. L’informatique change la façon dont nous percevons le monde. C’est une manière particulière d’aborder les problèmes. Nous cherchons toujours à construire des outils tendant vers une certaine généralité, à proposer des modèles adaptables à des situations multiples, à identifier le commun dans la diversité. Cette tendance vers la généralité et l’abstraction s’oppose à une certaine culture des particularismes dans les sciences humaines. C’est dans l’équilibre entre ces deux tendances que les projets les plus intéressants verront le jour ».

Frédéric Kaplan est Professeur au Collège des humanités CDH de l’EPFL et dirige le Laboratoire d'humanités digitales DHLAB.