Gamme de Shepard

L’escalier de Penrose ou encore la chute d’eau d’Escher sont deux célèbres illusions visuelles qui remettent en cause les perceptions visuelles et créent des boucles infinies. La gamme de Shepard est leur équivalent sonore.

L’escalier de Penrose

Qu’est ce que la gamme de Shepard ?

En 1964, Roger Shepard, un scientifique américain spécialisé dans la psychologie cognitive, a l’idée de créer une gamme qui donne l’illusion de “monter indéfiniment”, une gamme étant une série de notes. Cette illusion est formée d’une superposition de notes séparées chacune d’un octave qui sont jouées simultanément. Après un certain laps de temps, la fréquence de chaque note augmente. Les notes deviennent donc de plus en plus aiguës. Cependant ce phénomène ne peut être infini, sinon le son atteindrait la limite des ultrasons, inaudibles par l’oreille humaine. Ainsi, la gamme de Shepard est une boucle donnant l’impression que les notes deviennent de plus en plus aiguës, jusqu’à l’infini, ce qui n’est physiquement pas possible.

Le mot “illusion” prend donc tout son sens.

Explication:

Cette gamme est entièrement synthétique. Shepard l’a créée uniquement dans un but expérimental. Pour la comprendre, il faut d’abord assimiler la notion de sons harmoniques et de fréquence fondamentale. Une note est constituée d’une fréquence fondamentale et de plusieurs harmoniques qui sont des multiples de cette fréquence.

Shepard décide de faire un son particulier: il retire les quintes et les tierces de la note do et ne conserve que la fréquence fondamentale et ses multiples qui correspondent aux octaves: il s’agit de la fréquence fondamentale notée f0, deux fois la fréquence fondamentale 2f0, quatre fois la fréquence fondamentale 4f0, huit fois la fréquence fondamentale 8f0 etc. Il crée 12 notes de cette manière. De plus, il utilise une enveloppe d’intensité spéciale, en forme de cloche qui permet l’illusion.

Représentation de la fréquence en fonction de l’amplitude de la gamme de Shepard

Threshold of audibility est le seuil d’audibilité: l’oreille entend les fréquence dont l’amplitude se trouve au dessus de ce seuil.

Chaque note comporte douze harmoniques. Les sons ayant des fréquences basses ou très élevées ont une amplitude faible contrairement aux sons médiums qui ont une amplitude importante comme on peut le voir sur le schéma. Dans cette gamme, lorsque l’on passe d’une note à l’autre, la fréquence de toutes les harmoniques qui composent cette note est augmentée. En parallèle, l’amplitude des harmoniques élevées diminue et l’amplitude des harmoniques basses augmente. Ainsi, une fois la gamme terminée, c’est-à-dire lorsque le son constitué de la combinaison des fréquences formant la note si est produit, la fréquence la plus aiguë de la note disparaît : sa fréquence et son intensité sont telles que l’oreille humaine ne peut plus l’entendre. En parallèle, une fréquence fondamentale du do est insérée dans le son, mais n’est que très faiblement audible par l’oreille. Cette dernière se concentre en effet sur les sons médiums qui ont une forte amplitude et qui se décalent petit à petit vers l’aigu. C’est ce qui donne cette impression d’aigus infinis.

 

Le glissando de Risset (explication et utilisations) :

Jean-Claude Risset, musicien et chercheur (né en 1945 et mort en 2016) était un grand ami de Shepard. Il s’est intéressé à cette illusion et a ainsi créé une version continue de celle-ci, un glissando qui monte indéfiniment. Dans sa pièce pour bande magnétique de sons synthétisés la plus connue, Mutations (1969), Risset utilise ce fameux glissando durant les deux dernières minutes. Il a aussi été utilisé dans de nombreux films, comme Dunkerque de Christophe Nolan, pour faire monter la pression. Effectivement, l’illusion d’une gamme montante indéfiniment tient en haleine le spectateur et procure un résultat troublant voire angoissant. Il attend la fin du son qui n’arrive jamais. Ce procédé se trouve aussi dans les jeux vidéo et notamment dans le célèbre jeu “Super Mario 64” où un escalier infini est accompagné de cette gamme.

Sur cette vidéo, on observe une représentation de la gamme enregistrée à l’aide du logiciel Ableton live et du plugin Voxengo Spam qui sert d’analyseur de spectre. Cela permet d’observer l’enveloppe d’intensité des fréquences en forme de cloche. De plus, le mouvement de glissement est retrouvé : les pics d’intensités représentants les fréquences deviennent de plus en plus aiguës et finissent par disparaître.