E S P A C E S . . .

 

 

 

 

Espaces ?

Pour celui qui écoute, l'espace des sons ne constitue pas un type de perception particulier, mais, de même que pour les notions de hauteur ou de timbre, une interprétation par notre système nerveux central des données sonores globales qui atteignent principalement notre oreille (une simple variation de pression acoustique...). Dans ce cas précis, et contrairement aux autres interprétations, il est par contre utile de posséder deux oreilles pour que certaines caractéristiques des sons transmis dans le milieu soient reconnues. *

Direction de la provenance de la "source sonore", informations sur sa distance, renseignements sur les caractéristiques acoustiques du lieu de sa production, les conditions de sa transmission, tout cela arrive sous la forme d'une masse spectrale complexe qui fait que "l'espace sonore" ne peut être dissocié de la globalité du phénomène sonore, ou autrement dit, qu'un son ne peut exister sans "espace" (même le son brut d'un oscillateur projeté dans une chambre "sourde" (chambre anéchoïque) est caractérisé par un espace particulier).

Pour celui qui crée des œuvres sonores à partir de haut-parleurs, la problématique est un peu différentes.
Selon son style, son projet artistique, la
technique de projection qu'il a choisie, il a à faire à plusieurs catégories d'espaces :
- des images d'espaces, capturées lors d'enregistrements microphoniques ou synthétisées avec des machines, sortes d'empreintes acoustiques faisant partie de la complexité spectrale du son ;
- des espaces projetés, ceux qu'il obtient en définissant, consciemment ou non, l'espace de projection, le lieu, les haut-parleurs, la place et l'attitude du public et en organisant le signal sur les différents canaux du support ;
- des espaces mentaux, ce que se représente l'auditeur à l'audition de la combinaison des espaces précédents avec tous les autres aspects des sons, qui constituent le propos même de la composition...

Parler "d'espace sonore" devrait toujours se faire en indiquant le référant : le point de vue du son, de celui qui crée ou de celui qui écoute. 

 

Espaces projetés 

Le rôle du haut-parleur.
Il y a deux manières extrêmes de considérer le haut-parleur et, par le fait, son statut de producteur de son :
- soit comme élément d'un instrument, où il constitue LA source sonore, à la manière de n'importe quel instrument acoustique ou corps vibrant, avec ses caractéristiques particulières de timbre, de dispersion etc. (Theremin, Ondes Martenod, Orgue Hammond, amplis guitare, transducteurs spéciaux...)
- soit comme moyen de reproduction de l'image d'une réalité acoustique pré-existante ou co-existante (enregistrements, HiFi, sonorisation, projections simulées...).

La frontière entre ces deux conceptions est évidemment assez floue, et il y a toujours un peu de l'un dans l'autre... notamment en acousma où l'on joue en permanence et à des degrés divers sur les deux tableaux. Cette dualité est la source de toute la richesse des "arts haut-parlants", mais également l'origine de beaucoup de confusions que j'essaie de clarifier dans ces pages.

La projection du son.
Il y a aujourd'hui deux grandes manières de considérer techniquement la création d'espaces sonores au moyen de haut-parleurs (voir dans la section
Techniques) :
- par
projection directe (avec éventuelle possibilité de codage Ambisonic ou de matriçage pour réduire le nombre de canaux du support -projection indirecte-, ou par transformation de l'espace fixé -projection interprétée-) ;
- par
projection simulée par la modélisation de la perception (HRTF) ou de la transmission acoustique (WFS).

On ne peut parler d'espace projeté sans se référer à une technique de projection particulière.
En l'absence de précision, l'ensemble des notions et techniques présentées sur ce site relèvent toujours de la projection directe.

 

Espaces mentaux

Historiquement, la faculté d'analyser certains aspects des sons perçus nous a permis d'obtenir des renseignements vitaux sur l'émetteur d'un son : il est grand ou petit, doux ou agressif, proche ou lointain, devant ou au-dessus etc...
Aujourd'hui, la localisation ou en général l'analyse fine des sons n'est plus un aspect important dans nos vies. Saturée de pollutions sonores de tous types - machines, circulation, médias... - notre ouïe tend à la paresse et à se focaliser sur les critères les plus émergents.

L'acousma, en prenant sens de TOUT ce qui fait la vie des sons (voir la citation du texte de Michel Chion en introduction du site) nécessite des situations d'écoute qui permettent la perception de ces caractères et leur intégration mentale.
Dès qu'un son, même le plus "abstrait" et apparement le plus "a-spatial", est produit par un haut-parleur et écouté pour lui même, il donne lieu à une représentation mentale chez l'auditeur qui le plonge dans un lieu imaginaire généralement indéfini, en fonction de la convergence de tous les aspects du son. «... sur "l'écran de contrôle" de l'écoute attentive les formes sonores se découpent et se développent dans un espace aux "bords flous", creusé par les effets de zoom du grossissement, les jeux du "prisme" électroacoustique, qui ajoutent aux catégories des morphologies naturelles celles des dimensions de transformation du son converti en tension électrique, duson à la vitesse-lumière» (François Bayle, Musique acousmatique, propositions... positions, p. 56).
L'espace projeté et les images d'espaces constituent bien sûr des éléments importants des espaces mentaux, mais sont combinés de manière complexe et certainement assez personnelle du point de vue de l'auditeur avec les critères de masse (spectrale), d'
image de causalité etc...
Des recherches sur la manière dont se créent ces espaces mentaux, et surtout comment ils sont reliés aux espaces composés seraient certainement d'un grand intérêt.

Étudier comment sont perçus les espaces sonores, quelle que soit la manière dont ils sont réalisés, produit et transmis, n'entre pas dans le cadre de ce site, tout du moins pas pour l'instant.
Ma préoccupation est ici plus pragmatique, mais pourra sembler du coup manquer de rigueur, puisque je suis amené à naviguer sans cesse entre le pôle du faire et de l'entendre, entre la description de ce qui est entendu et de ce qui est fixé.
C'est pour moi la seule attitude réaliste et utile (!), et si en tant qu'acousmate c'est bien des espaces mentaux que je façonne en maniant mes outils les yeux fermés, j'en laisse l'analyse à ceux qui voudront bien s'y coller...

 

 

Les Quatre Espaces * 

Quelle que soit la technique que l'on utilise pour créer et reproduire des espaces sonores à partir de haut-parleurs (espaces projetés), l'espace entendu résulte toujours de la combinaison des différents niveaux suivants :
- le signal fixé sur le support, "avant" qu'il ne soit produit par les haut-parleurs ;
- le signal projeté par les haut-parleurs, selon leurs caratéristiques et leur emplacement ;
- le milieu de transmission entre les haut-parleurs et l'auditeur, le lieu avec ses propres caractéristiques acoustiques ;
- l'auditeur lui même, c'est à dire ses capacités perceptives, analytiques et associatives (ce qu'il entend, ce qu'il comprend et ce qu'il imagine...), sa projection spatiale mentale personnelle.
Compte tenu de la variabilité de cette dernière composante, de l'impossibilité de la maîtriser totalement (!) et de mon incompétence dans le domaine cognitif, ce dernier niveau sera généralement mis de côté ou traité séparément...

* Le titre "Les quatre espaces" fait référence à l'article de Michel Chion "Les deux espaces" sur lequel cette présentation s'appuie en partie.

 

Les trois niveaux

En dehors du cas particulier de l'écoute au casque, le milieu de transmission (air ou éventuellement eau) est indispensable et inévitable (dans "l'espace" il n' y a pas de son !).
Par rapport au problème de la composition sonore, son importance ne dépend pas tant de ses caractéristiques acoustiques particulières que de son adéquation avec l'œuvre. Petit ou grand lieu, intérieur ou extérieur, acoustique sèche ou réverbérante, air ou eau... tout est possible lorsque cela coïncide avec le propos artistique.
Même si certaines techniques "d'acoustique virtuelle" permettent, dans une certaine mesure, le contrôle de l'acoustique des salles et peuvent dans ce cas, pourquoi pas, faire partie de la composition, dans tous les cas, cet espace acoustique s'ajoute à, modifie celui qui est projeté par les haut-parleurs.
 

Le haut-parleur est un élément non seulement indispensable, mais aussi actif : c'est lui qui façonne la sonorité du son projeté et qui détermine en partie comment il sera projeté dans le milieu de transmission acoustique.
Selon la technique choisie -projection simulée ou projection directe- sa position, absolue par rapport au lieu, relative par rapport à celui qui écoute, son orientation et bien sûr ses caractéristiques spectrales (sa courbe de réponse fréquentielle) et sa directivité sont autant d'éléments qui façonnent l'espace entendu, dans des proportions très variables.
Le choix de leur nombre, de leur emplacement et de leurs caractéristiques peut être dicté par le support et le dispositif de projection implicite (formats domestiques), pris en charge plus ou moins précisément par le compositeur (espace composé reproductible en projection directe) ou laissés au libre arbitre des personnes qui souhaitent faire entendre l'œuvre en public (formule habituelle du
concert en projection interprétée).

Peu d'auteurs cependant ont mis le doigt sur le rôle crucial, charnière, du dispositif et de la technique de projection, soit parce qu'ils considèrent généralement comme  "évident et nécessaire" qu'il s'agisse d'un support stéréophonique devant être "diffusé" dans le cas de projections publiques (voir le concert), ou au contraire parce qu'ils recherchent une "reproduction d'un environnement acoustique naturel" dans lequel le dispositif ne représente que l'intermédiaire permettant de faire entendre les sons et qui doit s'effacer devant l'espace modélisé (voir les projections simulées).
Les haut-parleurs (et même les sons !!!) sont donc très souvent "oubliés" lorsqu'on parle de "spatialisation" ou de "composition spatiale". À méditer...
 

Le signal avant qu'il ne soit projeté contient bien sûr également des informations spatiales, liées au dispositif et à la technique de projection choisie, essentiellement sous la forme de caractéristiques spectrales que l'auditeur analysera en tant qu'images d'espaces (distance, lieu supposé...) et, s'il y a plusieurs pistes/canaux, sous la forme de corrélations (intensité, phase, spectre...) entre ces différents canaux, pouvant être représentées mentalement comme positions, mouvements etc...
Selon le rapport qui existe entre ce signal et le
dispositif de projection, l'espace qui est fixé sur le support peut représenter la part la plus importante de l'espace entendu (espace composé où le dispositif correspond au signal fixé), ou une part beaucoup plus faible s'il y a modification du signal par un tiers (espace composé complété par l'espace interprété).
Mais "le signal" c'est également toutes les caractéristiques du son, sa masse spectrale, son animation et son éventuelle "image de causalité", qui interfèrent constamment avec les aspects plus directement responsables de la perception spatiale. Penser l'espace sans connaître le son est aussi illusoire et vain qu'écrire une mélodie pour un ensemble de caisses claires : la partition est peut-être belle, mais ça ne s'entend pas...


Note : en projection indirecte ou simulée, le système de (re)production (décodeurs, logiciels...) peut permettre des modifications du signal pour s'adapter au dispositif de projection (
Ambisonic) ou à l'acoustique de la salle et au public (WFS). Dans certains cas, ces systèmes de traitement du signal peuvent être considérés comme faisant partie du "signal fixé". 

 

Les quatre Espaces

L'existence du haut-parleur suffit à bouleverser complètement les rapports qui existent entre les sons et leur perception, si on la compare avec celle de "l'écoute naturelle" de sources acoustiques (et non électro-acoustiques).
Même avec les techniques de
projection simulée qui tentent de créer des espaces acoustiques d'où le projecteur semble absent, il y a toujours un en-deça et un au-delà de la membrane...

Le haut-parleur délimite deux champs fondamentalement étrangers, mais leur permet aussi de communiquer : dans le sens du signal fixé vers l'auditeur bien sûr - la projection -, mais aussi dans le sens du milieu vers le signal, car l'acousmate, à moins qu'il ne compose pas avec des sons mais uniquement des "idées de sons", le fait en fonction de ce qu'il entend - ce qui est projeté dans son studio - et de ce qu'il imagine - les conditions d'écoute "finales" domestiques ou publiques -.
Ces deux espaces constituent ce qu'on pourrait appeler les deux espaces de la projection (
l'espace intrinsèque et l'espace extrinsèque).

Mais il y en a également deux autres, fixés sur le support et déterminés par le dispositif de projection, qui possèdent cette même dualité, quoique plus subtile, due à la présence du haut-parleur : les indices spectraux et les rapports inter-canaux.
On pourrait les nommer cette fois les deux espace du son (
les critères d'empreinte et de masse spatiale).

 

 

 

Espace Intrinsèque et Espace Extrinsèque  

Plusieurs auteurs (Patrick Ascione, Michel Chion, Denis Smalley... voir la bibliographie) ont mis en évidence depuis longtemps les deux pôles qui constituent les "espaces de la projection" : en gros, d'une part celui qui est constitué par ce que le compositeur détermine et réalise lors de son travaille en studio, et d'autre part ce qui lui échappe et qui transforme son œuvre de manière minime ou importante lors de son écoute ultérieure, lorsqu'elle se fait dans d'autres conditions. 

 

Terminologie

Je propose de nommer Espace Extrinsèque la partie de l'espace entendu qui varie d'une présentation à une autre d'une manière significative, et Espace Intrinsèque celle qui est permanente, reproductible à l'intérieur de la marge définie par l'auteur (voir la fixation), et que l'on peut assimiler à l'œuvre composée  (voir ci-dessous les termes voisins d'espace externe et d'espace interne).


fig. 1 : on propose à l'auditeur un "espace composé" plus ou moins adapté aux conditions matérielles et acoustiques
(écoute domestique radio, CD, DVD, installations, projection publique n-phonique directe)

L'Espace Intrinsèque, c'est donc l'espace qui est voulu, déterminé, composé par l'acousmate et fixé sur un support sous la forme d'une bande, d'un DVD, de fichiers sur un disque dur, d'un programme informatique etc.
Pour pouvoir être reproductible, celui ci doit également intégrer la configuration du dispositif de projection (voir
la fixation) d'une manière implicite (formats domestiques) ou explicite (tout les autres cas ! voir la section sur les dispositifs) ainsi bien sûr que la technique de projection utilisée.
On peut parler dans ce cas d'un espace composé-projeté, puisqu'il n'y a pas de dissociation signifiante entre les deux.
L'ensemble du site porte sur les possibilités compositionnelles permises à l'intérieur de cet espace intrinsèque.

L'Espace Extrinsèque, se définit alors par la différence entre l'espace intrinsèque et ce que perçoit l'auditeur (l'espace entendu).
Dans le cas d'un espace composé-projeté, celui-ci est généralement limité aux particularités acoustiques du lieu et aux caractéristiques précises des projecteurs sonores (œuvres multiphoniques, installations, supports domestiques). Il peut même, dans certains cas, être totalement absent si l'œuvre est réalisée exclusivement pour un dispositif et un lieu particuliers (voir
la fixation). On pourrait parler dans ce cas précis de composition de l'espace "intégrale".
Par contre, si le dispositif de projection est différent de celui de la composition, si de nouvelles informations spatiales sont apportées par un tiers (interprète), ou si le type même de diffusion de l'œuvre suppose une utilisation "libre" du support (supports domestiques), la part de l'espace extrinsèque peut aller jusqu'à dépasser ou occulter la part de l'espace intrinsèque.  

 

Cas particuliers

Dans le cas particulier de la modification active du rendu de supports pocophoniques en concert sur acousmoniums ou, plus généralement, de la "spatialisation" de musiques instrumentales ou "mixtes", le place et le rôle du dispositif de projection peut basculer du côté de l'espace extrinsèque :


fig. 2 : on propose à l'auditeur la combinaison d'un "espace composé" et d'un "espace interprété" intégrant les conditions matérielles et acoustiques (concerts lorsque le format de la projection est différent de celui de la composition)

Par rapport à la figure 1 précédente, on voit qu'une grande partie de l'information spatiale perçue par l'auditeur est déplacée de l'espace composé vers l'espace interprété, notamment à cause de la dissociation des masses spatiales entre l'espace initial (celui qui est composé/fixé sur le support) et l'espace projeté (celui qui est ajouté pendant la lecture).
En fonction de l'écart qui existe entre le nombre de canaux du support (stéréo, tétra, penta, octo...) et celui du dispositif de projection, et bien sûr des choix qui sont faits au moment de la diffusion (implantation particulière dans le lieu, partis-pris artistiques de l'interprète), le rapport entre les deux niveaux de masses spatiales peut changer dans des proportions extrêmement importantes.

La cas des projections simulées, principalement celui de la Wave Field Synthesis est ici plus ambigü, puisqu'il n'y a pas de différence entre le dispositif technique utilisé lors de la composition et de la projection publique, que les calculs doivent être effectués sur le signal à chaque fois, la distinction entre un espace qui serait composé et un espace qui serait réalisé lors de la projection n'est ici pas pertinente.

Note : à moins que le compositeur ne pense dès le départ ce qu'il fixe sur le support comme devant nécessairement faire l'objet d'une projection interprétée, et qu'il fournisse donc une partition détaillée des actions à effectuer par rapport à un dispositif de projection particulier, on peut dire que la composition acousmatique s'effectue toujours selon le schéma général de la figure 1. Le cas particulier de la projection interprétée constituant une étape externe à la composition, il n'offre pas d'intérêt dans le cadre de ce site, en dehors de certaines sections d'ordre général (techniques de projection, formules de présentation, historique).

 

Termes voisins

Les termes d'espace interne et d'espace externe introduits par Patrick Ascione, que Michel Chion a développés dans plusieurs textes (dans le n°1 de L'Espace du Son ainsi que dans le chapitre "Les deux espaces" dans "L'art des sons fixés"), et qui sont proches de ceux proposés par Denis Smalley ("composed space" et "listening space"), sont maintenant assez répandus dans le milieu électro-acoustique.
J'aurais d'ailleurs préféré les utiliser moi même plutôt que de devoir encore ajouter des nouveaux néologismes à la liste déjà longue de ceux proposés dans ces pages...
Il y a quelques années, j'avais bien tenté de généraliser l'usage des termes "espace interne / externe", pour les appliquer à la composition acousmatique dans son ensemble, mais cela constituait alors soit une distorsion du sens que Chion avait donné à ces termes, soit présentait le risque qu'ils soient mal compris.

Car ce qui manque aux définitions proposées par ces auteurs pour qu'elles soient généralisables, c'est de prendre en compte le rôle du haut-parleur dans la composition et d'observer comment il peut changer de statut selon le mode projection.

Je prendrai comme exemple un passage de L'art des sons fixés de Michel Chion, page 50 (c'est moi qui ajoute les annotations entre crochets) :
« Pour une pièce de musique de sons fixés, il existe deux niveaux d'espace - l'espace interne à l'œuvre elle-même, fixé sur le support d'enregistrement (et caractérisé par des traits tels que les plans de présence des différents sons [les empreintes spatiales], la répartition fixe ou variable des éléments sur les différentes pistes [les masses spatiales], les degrés et qualités diverses de la réverbération autour de ceux-ci, allant jusqu'à son absence totale [les empreintes spatiales également], etc.), et d'autre part, l'espace externe, lié aux conditions d'écoute à chaque fois particulières de l'œuvre [lorsque le format de réalisation est différent de celui de la projection] : profil acoustique du lieu d'écoute ; nombre, nature et disposition des haut-parleurs [le dispositif de projection] ; utilisation ou non de filtres en cours de concert ; intervention à la régie du son d'un interprète humain ou d'un système automatique de diffusion [il s'agit donc ici de projection interprétée] etc. Comme on l'a vu, le propre de la musique des sons fixés est justement d'offrir au compositeur, par l'enregistrement, la disposition et la maîtrise d'un espace interne à l'œuvre. »

Cette définition ressemble beaucoup à celle des espaces intrinsèque et extrinsèque présentée sur cette page, mais l'amalgame qui est fait entre ce qui est réalisé en studio, le choix du dispositif de projection, les conditions de projection, la possibilité de modifier la projection en cours, ainsi que l'oubli ou l'ignorance des autres rapports qui existent entre ce qui est fixé et ce qui est finalement entendu, font qu'elle ne peut s'appliquer qu'au cas particulier de la projection interprétée en concert.

 

.
 

Empreintes et Masses spatiales


Au sein de l'espace composé - l'espace intrinsèque -, l'acousmate joue d'une manière complexe avec les deux espaces du son. C'est au minimum des traces, des indices que l'auditeur peut se représenter comme des images d'espaces, c'est aussi des choix de projection, pouvant être plus ou moins riches et inventifs en fonction du nombre de projecteurs dont il dispose et du choix de leur emplacement

 

Le son fixé

À partir du moment ou il est possible de répéter "un son" à l'identique, par quelque moyen de fixation que ce soit, « il devient un objet externe qui possède sa propre réalité spatio-temporelle », il est possible de pratiquer sur lui l'exercice de "l'écoute réduite" et de l'intégrer dans une démarche de composition dans laquelle cette fixation constitue à la fois le moyen et la finalité.
Pour ma part, cela fait bientôt vingt ans que je pratique cette écoute sur des sons qui intègrent leur projection, dans lesquels il n'y a pas de dissociation significative (voir
la fixation) entre ce que je crée et compose et ce que je propose ensuite au public (artistiquement réussi ou raté, c'est une autre histoire !).
Il n'y a là rien d'extraordinaire en soi : chaque acousmate fait de même lorsqu'il réalise une œuvre stéréophonique qui est ensuite diffusée sous la forme d'un CD ou à la radio et écoutée grâce à deux haut-parleurs. La seule différence, riche en implications, consiste simplement à considérer que toutes les situations d'écoute peuvant suivre cette démarche, même celles qui nécessitent plus de haut-parleurs...

Ayant été formé à "l'école mixte" Schaeffer / Reibel par l'enseignement de Denis Dufour - la notion d'objet sonore, la séquence-jeu et la pratique de l'écoute réduite -, et étant naturellement enclin à une certaine exigeance de pensée, l'analyse à la fois perceptive et pragmatique de ce que je faisais m'a conduit à considérer les objets que je façonnais comme des entités, des "touts" dont l'espace que je donnais à entendre n'était pas exclu.
Je capturais, organisais les plans et les mouvements exactement comme je le faisais des hauteurs, des matières, des "images de causalité", globalement, perceptivement, profitant continuellement des deux grands cadeaux de la sono-fixation : la possibilité de saisir et de conserver les plus infimes variations des sons (le risque), et celle de pouvoir prendre le temps de les observer, de prendre des décisions et de les fixer définitivement (la responsabilité).
L'espace du son est quelque chose d'indissociable de ses autres aspects, représente un critère particulier complémentaire de ceux que Schaeffer a défini *, pouvant être tous traités conjointement, que l'œuvre soit conçue pour les écoutes domestiques ou les projections publiques (voir les
formules).

 

Le son réduit

Une autre approche, issue de la représentation symbolique du geste instrumental - nécessaire si l'on recherche la ré-exécution de compositions musicales -, consiste à réduire les aspects du sonore à des paramètres pouvant s'intégrer dans des échelles linéaires et facilement donner lieu à des représentations visuelles.
Par la dissociation entre le son et sa "spatialisation", il est possible de réduire l'espace des sons aux notions de "position" et de "trajectoire", de la même manière que les autres aspects des sons peuvent être réduits à celles de "hauteur" et de "mélodie". Dans ce cas, le rôle des "images d'espace" est généralement réduit à la simulation de la distance et à l'acoustique virtuelle (voir le
Spat de l'IRCAM).
Les trois dimensions de la géométrie euclidienne peuvent ainsi se prêter à une certaine formalisation sous la forme de paramètres, et une abstraction qui rend possible la notation pour la transmission de gestes.
Plutôt que de "son réduit", il conviendrait de parler ici de "conception réduite", car le son, s'il est produit par un instrument acoustique, bénéficie heureusement de la complexité que l'instrumentiste ajoute à la notation (et on sait ce que cela peut donner lorsque le son électronique ne bénéficie pas de cet apport...).
Les techniques de projection comme l'
Ambisonic ou la WFS sont particulièrement adaptée à cette conception car elles sont basées sur des algorithmes numériques et offrent également "l'avantage" d'être relativement indépendantes des moyens de production sonore (les haut-parleurs).

 

Critères ou paramètres ?

L'approche paramétrique telle que décrite précédemment peut être efficace dans le cadre qui est le sien : permettre à un musicien d'effectuer des actions sur un instrument qui génère ou traite des sons. Mais elle a également montré son impuissance à rendre compte de la réalité sonore. On sait en effet depuis Schaeffer que la paramétrisation du son en hauteur, timbre et intensité ne coïncide partiellement avec les sons que lorsque ceux-ci sont réduits à des espèces très simples ou lorsqu'on laisse leur complexité en dehors de la sphère compositionnelle, comme une décoration qui apporte un surcroit d'intérêt perceptif mais qui ne participe pas à l'écriture de l'œuvre.

Aborder la complexité des espaces sonores au moyen du système de critères Schaefferiens apporte au contraire un ensemble d'outils conceptuels basés avant tout sur l'écoute, seule méthode qui s'accorde à mon sens avec les ambiguïtés spatiales, et permettent d'éviter un bon nombre de pièges et de confusions...

Malheureusement, le domaine est complexe et subtile, et les catégorisations que j'ai été amené à faire peuvent paraître, au minimum, discutables.
Le problème majeur, déjà évoqué sur ces pages, est que ces critères, contrairement à ceux qui ont été définis par Schaeffer *, ne sont pas seulement des critères d'écoute mais aussi nécessairement des critères de facture et de production.

 

Les deux critères d'espace

Je propose de nommer Empreintes Spatiales les informations spectrales perçues comme images d'espaces, pouvant éventuellement être produites avec un seul haut-parleur, et Masses Spatiales les informations constituées par les rapports des signaux répartis sur plusieurs canaux et projetés avec au moins deux haut-parleurs.
Ces deux termes définissent les deux critères d'espace de l'objet sonore, auxquels il convient d'ajouter ceux correspondant à leurs variations.
Ces termes, et les notions auxquelles ils se rapportent, n'ont de sens qu'en
projection directe ou dans les variantes indirecte et interprétée, et ne peuvent a priori pas s'appliquer aux cas de la projection simulée de type HRTF ou WFS. Il conviendrait d'ajouter dans ce cas une nouvelle notion : celle de "masse-empreinte".

La dissociation entre masses et empreintes peut paraître "gênante" : elle ne correspond pas à la réalité acoustique "naturelle" (point de vue du son, voir les applications) et oblige à intégrer d'une manière ou d'une autre des informations qui sont externes au support (la méthode de projection et surtout le dispositif de projection).
Mais elle correspond bien par contre à la manière dont notre système nerveux analyse différemment la position angulaire et la distance d'une source sonore (point de vue de l'auditeur), et surtout confère à l'empreinte spatiale un statut et un rôle proche de ce que pourrait être un "
critère d'image", ce qui est cohérent avec l'utilisation qui en est faite généralement en acousmatique (point de vue du compositeur) **.

Que la masse spatiale ait été absente du solfège de l'objet sonore n'est pas étonnant, compte tenu de la quasi impossibilité à l'époque de capturer, fixer et reproduire plus de deux canaux.
Plus étrange par contre est l'impasse faite sur le critère d'empreinte spatiale, et les confusions auxquelles il donne lieu.
Mais, comme l'écrit Michel Chion dans "
Le Son" (p 261) : « En résumé, l'objet sonore selon Schaeffer est défini comme hors-espace. Un choix qui peut sembler d'autant plus paradoxal que c'est à partir de sons fixés sur support, sur lesquels le son peut être porteur d'un espace particulier enfermé avec lui sur la bande magnétique [l'empreinte spatiale], que l'auteur du Traité à pu le construire. Cette scotomisation chez Schaeffer de la dimension spatiale dans le son témoigne bien que celui-ci a décidé d'oublier que le son est «fixé», alors même que cette fixation reste sa seule garantie concrète d'avoir affaire au même objet sonore, et son seul moyen pour le décrire et l'observer en écoute réduite... Tels sont les détours de la découverte. »
Je que je vais essayer, bien modestement, de faire dans les pages qui suivent, c'est d'aider à combler cet "oubli"... 

 

 

* Les sept critères morphologiques de l'Objet Sonore définis par Schaeffer sont : la masse, le timbre harmonique, la dynamique, le grain, l'allure, le profil mélodique et le profil de masse.
Le danger de cette référence à la terminologie Schaefferienne peut être de sembler mal interpréter les définitions "originales", d'autant que mon approche n'est pas délimitée à la notion initiale de l'Objet Sonore mais à une conception étendue qu'on pourrait appeler "objet compositionnel".
Mais le Traité lui même, s'il reste l'ouvrage de référence, comporte de nombreuses notions "risquées" et n'est pas exempt d'incohérences. Je ne saurais trop conseiller au lecteur de lire ou relire le "
Guides des Objets Sonores" de  Michel Chion et bien sûr le "Traité des Objets Musicaux", ne serait-ce que pour prendre la mesure des différences...
Les références aux travaux de Schaeffer que l'on peut trouver tout au long de ces pages concernent plus la démarche et la méthode que la classification du Traité proprement dite, et je rappelle encore une fois que les propositions de ces pages sont loin d'être figées et sont amenées à évoluer, à se préciser, et qu'elles constituent avant tout des outils d'investigation pour la "révélation" de zones sonores longtemps laissées dans l'obscurité.
La discussion est ouverte. 
** Je rappelle que la projection par haut-parleurs n'a rien de "naturel" : tout comme la fixation sur support délimite un avant et un après du temps, le haut-parleur délimite un "en-deçà" et un "au-delà" de l'espace. En multiphonie (telle que définie sur ce site), cet "en-deçà" et cet "au-delà" contribuent tous deux à former l'espace de l'objet sonore, chacun étant responsable d'un de ses aspects complémentaires.

 

 

 

Des masses-empreintes ?

Est-ce que les critères de masse spatiale et d'empreinte spatiale peuvent avoir un sens en dehors de la composition et de la projection acousmatique en projection directe ?
Est-ce qu'ils peuvent s'appliquer à d'autres techniques de création d'espaces à partir de haut-parleurs ?
Est-ce que leur définition apporte quelque chose à ce que pourraient être des "critères d'espace entendu" pouvant s'intégrer dans les espaces mentaux et faisant totalement abstraction des moyens de leur production, transmission et projection ?

 

Objets entendus

Une "théorie unifiée de l'espace sonore" me semble aujourd'hui impossible à défaut d'être impensable, en tout cas si elle tient compte de la multiplicité de la réalité sonore, perceptive et artistique.

Ce que m'ont apprises les années passées à jouer avec le son dans toutes ses dimensions, c'est en effet qu'il s'agit d'un domaine où l'hétérogénéité est la règle, où le sens peut se trouver partout, où le son est fatalement "impure" car dépendant de la manière dont il est projeté et des conditions de son écoute.

Une relative "faiblesse" des deux critères d'espace que je propose dans ces pages, masses et empreintes spatiales, peut provenir de ce que contrairement aux autres critères sonores décris par Schaeffer ou ceux restant encore à définir (critère d'images ?), ils ne peuvent pas s'incrire dans l'écoute seule, mais doivent intégrer en partie les circonstances de la production nécessaire à cette écoute, le rôle du haut-parleur ne peut être négligé.

Mais si l'on ne s'intéresse qu'au son perçu, en enfermant dans une "boîte noire conceptuelle" tout ce qui a trait au support et au dispositif de projection, peut-on appliquer quand même les notions de masse et d'empreintes spatiales pour décrire ce qui est entendu ou faut-il alors définir de nouvelles catégories de critères ?

En ce qui concerne les empreintes spatiales, il semble indéniable qu'elles représentent bien une catégorie de perception et de représentation particulière et forte.
Mais c'est malgré tout une catégorie aux contours très flous, avec une extrémité qu'on pourrait qualifier "d'acoustique" - l'interprétation par le cerveau de la distance d'une source sonore - et une autre qui se confond avec les "images de causalité", indices de l'origine matérielle de l'objet sonore, réels ou supposés, pouvant dans certains cas aboutir à des représentations mentales "visuelles" de la cause présumée.
En ce qui concerne le critère de
masse spatiale, il faut évidemment renoncer à certains attributs comme la densité, la résolution ou même la forme, qui sont directement liés à la masse-canal, mais le site et l'aire semblent être des notions suffisamment générales pour pouvoir s'appliquer également dans ce cas.

 

Tentative de décryptage

Je suis actuellement dans mon "bureau".
L'élément quantitativement le plus important dans la sphère de ma perception auditive est constitué par une masse spectrale constante, dont l'origine est le ruisseau grossi par les pluies récentes qui coule à une trentaine de mètres, dont je perçois le son par l'ouverture du vasistas de la cuisine et qui me parvient par la porte ouverte entre la cuisine et mon bureau à ma gauche. Cette masse stable est envahissante sur le plan spectral car proche du bruit filtré, et elle se présente lorsque je ferme les yeux comme une masse spatiale aux contours flous mais au site nettement localisable "à 10 heures" sur le plan azimuthal, à peu près à la même hauteur que moi. Je suis bien incapable de la situer mentalement à une quelconque distance, mais une chose est sûre : elle n'est pas située dans la cuisine. Sa sonorité très brouillée, feutrée me la fait placer dans un vaste espace, signature connue dans ma mémoire "d'une certaine distance". L'aire de cette masse finalement assez étroite est contradictoire avec l'image de causalité associée à l'empreinte spatiale.

De temps à autres, des phénomènes ponctuels se superposent à cette masse sur le plan spectral, et en sont plus ou moins détachés sur le plan spatial :
- des sons très brefs, de masse spectrale très fine et aigue, d'intensité très faible, qui n'apparaissent qu'assez rarement (quelques mésanges) ;
- des morphologies curieuses, presque mélodiques mais pas vraiment mélodieuses (des oies !) ;
- quelques apparitions en fondus, étroites et graves, presque toniques, aux profils mélodiques assez simples (des autos qui passent sur la route au loin).
Le caractère lointain de ces trois types d'évènements ne fait pas de doute : les indices principaux en sont la faible intensité et un certain halo qui les entoure, signature mémorisée de la diffusion du son dans un espace acoustique assez vaste.

En ce qui concerne leur positionnement sur mon écran sphérique mental, les pointillés sonores produits par les mésanges se placent apparement n'importe où, comme quelques étoiles filantes qui éclosent dans un ciel nocturne d'août, sans corrélation apparente avec l'endroit où ils sont vraissemblablement produits ni avec l'ouverture du vasistas. Il y a un paradoxe entre le site spectral de chacun qui est très précis et qui me fait représenter ces sons sous la forme de points, et leur site spatial que j'ai beaucoup de mal à localiser si je fais l'effort de me concentrer sur ce critère : dans ma représentation spatiale mentale le critère de masse spectrale est ici largement prédominant sur celui de masse spatiale.

Les cris des oies se placent par contre assez précisément au sein de la masse floue du ruisseau, avec un site à dix heures (alors que je sais pertinemment qu'elles se trouvent à ma droite), comme des pépites de chocolat sur un cookie. Une réverbération importante les entoure les situant dans un lointain hypothétique, comme un lieu dans un lieu.
Les sons filés des autos s'étalent quant à eux mollement devant moi, comme une nappe à l'aire indistincte mais quand même plutôt située "en bas", certainement pour les mêmes raisons psycho-acoustiques qui me fait placer les petits cris de mésanges "en haut" de ma sphère de projection où la correspondance aigu/haut et grave/bas semble prédominer sur ce qui serait une "juste" projection mentale de l'espace perçu.

À ces objets lointains, se superposent quelques objet au contraire très proches, notamment les petits évènements causés par les touches de mon ordinateur portable. Dans ce crépitement irrégulier qui se place sous mon nez, je peux sans peine déceler des différences de site de l'odre de quelques degrés sur le plan horizontal (lorsque je ferme les yeux pour les situer je me retrouve évidemment avec quelques lignes que je dois ensuite effacer...). De même pour les quelques clics de ma souris, encore plus précis où je peux même apprécier la légère différence de position du site dans le plan vertical (elle est situé un peu plus bas que le clavier). Si je tape vite (n'importe quoi !), l'ensemble des petits évènements générés par le clavier devient un phénomène global itératif qui se projète sous la forme d'un nuage de points à l'aire concentrée mais où les micro évènements qui constituent son organisation son bien perceptibles.

Le dernier objet qui s'inscrit dans ma sphère auditive est assez rare car son origine est constituée par les grincements du dossier de ma chaise de bureau. Comme je suis assez concentré à tapper ce texte je bouge assez peu, d'où la rareté des grincements. Mais bon, pour le bien de l'expérience et de mon dos je remue un peu de temps en temps, ce qui fait apparaître des petites virgules sonores aux itérations serrées, extrêment précises dans leur contour comme dans leur position spatiale : un site quelque part juste en-dessous de moi, très proche, à l'aire très étroites.

Que retirer de cette tentative de description des images mentales spatiales "naturelles" ?

 

Des espaces autonomes ?

La relative indépendance entre le nombre et la position des enceintes et les masses spatiales perçues en Wave Field Synthesis ou encore la possibilité d'effectuer le rendu d'un espace fixé par des dispositifs comportant un nombre de canaux différents en Ambisonic laisse penser qu'il est possible de réaliser des "espaces autonomes" qui puissent être conçus indépendants de la disposition des projecteurs sonores.

Ceci représente pour beaucoup le saint Graal de la spatialisation puisqu'il permettrait de s'affranchir de la contrainte que semble présenter la multitude des dispositions de projecteurs possible, et peut être surtout rendrait enfin l'espace librement quantifiable...

Cependant, lorsqu'on lit la littérature consacrée à ce sujet (par exemple ceci et celà sur le site de Jérôme Daniel) il n'y est jamais question d'objets sonores mais de sources sonores. La distinction est d'importance, car cette conception est effectivement prévue pour fonctionner avec des sources ponctuelles telles que l'on peut les avoir avec des instruments de musique, ou des champs diffus telles les "ambiances" acoustiques capturées lors de prises de sons microphoniques ou synthétisées.
Lorsque l'on travaille avec des objets aux masses spatiales variées et souvent complexes et mobiles (densité, organisation, variations...), avec des dispositifs tant soient peu développés dans les trois dimensions, les choses sont loin d'être aussi simples.

Mais dans de nombreuses circonstances - jeux vidéo, surround domestique ou cinéma, installations immersives, concerts de musiques "mixtes" - lorsque l'espace composé est considéré comme une sphère centrée sur l'auditeur, cette approche est effectivement cohérente.

 

Un critère unifié ?

Dans tous ces cas, écoute "naturelle" (sans haut-parleurs), projection simulées et descriptions spatiales paramétrables, la distinction entre masses spatiales et empreintes spatiales peut éventuellement être remplacée par un critère unique de "masse-empreinte".

Sur le plan pratique et compositionnel, je ne suis par contre pas sûr que cette apparente "réunification" de la masse et de l'empreinte soit très bénéfique. Elle risque en effet de rendre l'utilisation des images d'espaces problématique, car celles-ci interfèrent fortement avec les calculs opérés sur le signal en WFS.