Interpréter la musique au prisme de la linguistique

© 2024 EPFL  - CC-BY-SA 4.0

© 2024 EPFL - CC-BY-SA 4.0

Dans sa thèse de doctorat intitulée « Hearing Structure in Music », Gabriele Cecchetti du Digital and Cognitive Musicology Lab du CDH a étudié, à l’aide de concepts linguistiques, notre capacité à interpréter structurellement la musique que nous entendons.

Lorsque nous écoutons de la musique, nous sommes nombreux et nombreuses à nous sentir immergé·es dans l’instant, pleinement présent·es. Cependant, dans les coulisses de notre cerveau, nous sommes peut-être en train de construire des structures synthétiques, de prédire ce qui va suivre et de réajuster nos attentes et nos souvenirs au fur et à mesure que le morceau se poursuit. Pour sa thèse de doctorat, Gabriele Cecchetti s’est penché sur les méthodes cognitives sous-jacentes qui sous-tendent ce processus et a exploré les parallèles entre la façon dont nous interprétons la musique et la façon dont nous interprétons le langage.

Connecter des « accords virtuellement non connectés »

La question centrale de Gabriele Cecchetti porte sur les processus cognitifs qui sous-tendent l'interprétation structurelle de la musique, cherchant à comprendre si les auditeurs et auditrices forment spontanément des structures mentales reflétant les relations entre les moments musicaux.

Il distingue deux façons d'entendre un passage musical : l'audition superficielle et l'interprétation structurelle. La première consiste simplement à entendre les sons bruts tels qu'ils résonnent dans l'air à l’extérieur de nous : dans l’audition superficielle, l'auditeur est un récepteur passif. L’audition structurelle, en revanche, se produit dans l’esprit de l'auditeur et implique la construction active de structures synthétiques basées sur les relations perçues entre les différents « événements » ou moments musicaux. C’est ce type d’audition qui l’intéresse.

« Comment les auditeurs et auditrices peuvent-ils passer de l’écoute d'une série d'accords pratiquement sans lien entre eux à l’écoute d'un réseau de relations ? » s’interroge-t-il. Pour répondre à cette question, il a utilisé une approche de modélisation et a divisé cette interprétation structurelle en deux composantes. D’une part, il y a le problème de la transformation de la musique brute (accords, mélodies, rythmes) en structures significatives ; d'autre part, il y a le problème de l’analyse, qui est le processus en temps réel par lequel les auditeurs et auditrices construisent et naviguent dans le réseau complexe de relations musicales en étant exposé·es à un morceau de musique.

La complexité survient lorsque les auditeurs et auditrices passent de l’écoute d’accords isolés à la perception de ce réseau complexe. Gabriele Cecchetti s’est attaqué à plusieurs questions, telles que : quels processus mentaux permettent de relier des accords apparemment sans rapport entre eux en une structure cohérente ; quand ces opérations cognitives se produisent-elles pendant l’écoute de la musique ; et à quel point ces opérations sont-elles exigeantes ?

« Heureusement pour nous, nous ne sommes pas les seuls à nous pencher sur ces questions », explique-t-il. « Il s'agit également d'une préoccupation centrale de la linguistique. »

Parallèles avec la linguistique

Dans ses travaux, Gabriele Cecchetti a établi des parallèles avec la linguistique, en se référant à la Dependency Locality Theory (DLT) qui suggère que l’intégration structurelle – la connexion d'un mot avec un mot précédent – entraîne un coût cognitif dû à la récupération de la mémoire, qui est entravée par l'interférence de mots intermédiaires, et à l'attente de ce qui reste à venir dans une phrase. Les auditeurs et auditrices doivent maintenir ces attentes dans leur esprit jusqu'à ce que la cible attendue soit finalement rencontrée.

Dans le domaine de la musique, Gabriele Cecchetti imagine un algorithme qui associe les séquences d'accords à leur structure, comparant cela à une infrastructure informatique comprenant un système de mémoire tampon et un système d’empilement. La mémoire tampon lit les nouveaux événements un par un, tandis que l’empilement remplit les emplacements de mémoire, ce qui entraîne une augmentation des coûts de stockage de la mémoire. Finalement, lorsqu’une correspondance est possible entre la mémoire tampon et la pile, l’intégration structurelle se produit, combinant deux structures partielles en une plus grande.

Bien que cette analogie fonctionne à un niveau formel, « on ne sait toujours pas dans quelle mesure la musique et le langage se comportent de la même manière », ajoute-t-il.

La musique se comporte-t-elle comme le langage ?

Gabriele Cecchetti a mené trois expériences pour étudier les parallèles entre la linguistique et la musique. Dans la première, qui s’intéresse aux représentations syntaxiques, il a créé des progressions d’accords dotées de leur propre structure syntaxique. Des auditeurs et auditrices ont été exposé·es à une progression d’accords principaux, suivi par du bruit, puis d’une progression d’accords cibles. Il leur a été demandé si la tige de la cible était la même que celle de l’accord principal. Les résultats ont montré une nette amélioration des performances lorsque l’accord principal et l’accord cible partageaient la même structure sous-jacente, indiquant que les auditeurs et auditrices se représentent bien la structure de progression des accords tout comme la structure des phrases dans le langage.

Dans sa deuxième expérience, l’analyse incrémentale, les auditeurs et auditrices devaient écouter un rythme ponctué par un bref flash lumineux. Leur tâche consistait à indiquer à quel moment du rythme le flash s’était produit. Les erreurs concernant le placement de l’éclair étaient influencées par le coût cognitif du traitement de la structure des rythmes.

Il a finalement exploré dans un troisième temps la réanalyse rétrospective, en comparant des « interprétations préférées » avec des interprétations inattendues « en chemin » dans des mélodies ambigües. Au cours de cette expérience, les auditeurs et auditrices devaient écouter un morceau de musique et essayer de prédire ce qui suivait en se fondant sur des morceaux similaires qu’ils et elles avaient écouté précédemment. De la même manière que les lecteurs et lectrices sont surpris·es par l’ambigüité au milieu d’une phrase telle que « Lorsque le groupe a joué la chanson a plu aux clients », les auditeurs et auditrices ont été amené·es à revoir leur interprétation des mélodies ambigües dans le cadre de l’expérience.

« Les résultats de ces expériences confirment la pertinence d’un modèle syntaxique incrémentiel pour l’expérience en temps réel de l’écoute de la musique », explique Cecchetti, « et nous pouvons donc passer à la construction d’un modèle algorithmique similaire à ceux utilisés en linguistique ».

À l'avenir, le défi méthodologique consistera à trouver des paradigmes permettant aux auditeurs et auditrices d'écouter les stimuli plus d'une fois et, d’un point de vue théorique, à trouver un moyen de caractériser l’interaction entre la manière entièrement subconsciente et automatique d’écouter et les manières plus actives de s'engager dans la musique : après tout, l’écoute de la musique s’apparente davantage à un processus de découverte qu’à une perception passive. Selon Cecchetti, ces actes conscients de découverte devront être pris en compte à l'avenir.

« Pour moi, le plus intéressant dans tout cela, c'est ce qui va suivre. »

Traduit de l'anglais par Yohann Guffroy


Auteur: Stephanie Parker

Source: Institut des humanités digitales

Ce contenu est distribué sous les termes de la licence Creative Commons CC BY-SA 4.0. Vous pouvez reprendre librement les textes, vidéos et images y figurant à condition de créditer l’auteur de l’œuvre, et de ne pas restreindre son utilisation. Pour les illustrations ne contenant pas la mention CC BY-SA, l’autorisation de l’auteur est nécessaire.