De nos jours, nous pouvons écouter du son sur une grande variété de systèmes de restitution. Entre le casque où nous écouterons de la stéréo ou du binaural et les systèmes multicanaux les plus complexes des salles de cinéma, se situent les barres de son, les home-cinema 5.1, etc.

Pour bénéficier au mieux de l’expérience sonore, il faut dans l’idéal créer autant de mixages qu’il existe de systèmes de restitution.
Autre alternative : créer un mixage unique qui s’adaptera à l’équipement de réception. C’est la notion de mixage orienté objets (OBA pour Object-Based Audio), où on ne raisonne plus en matière de pistes mais d’objets sonores. Chaque objet sera positionné dans l’espace par le mixeur et des métadonnées associées permettront aux différents équipements de restituer au mieux le paysage sonore voulu selon ses caractéristiques.

Un groupe de travail dédié étudie ce sujet sous l’égide de l’Union Européenne de Radio-télévisions (UER/EBU), ce groupe a déjà produit le format de métadonnées ADM (Audio Definition Model), aujourd’hui recommandé par l’Union Internationale des Télécommunications (ITU) pour décrire les contenus audio orienté objets. Le groupe de travail est constitué de NHK (Japon), BBC (Royaume-Uni), IRT (Allemagne), RAI (Italie), B<>Com, Radio France, France Télévisions (France). L’aboutissement de ces travaux réside dans un moteur de rendu sonore, le BTF-renderer, véritable pierre angulaire d’une production audio orienté objets puisqu’il permet à l’ingénieur du son de simuler ce que les utilisateurs entendront. Le principe : à partir d’un mixage orienté objets associé à des métadonnées, le moteur de rendu affecte tel ou tel objet sonore sur les haut-parleurs disponibles.
Nous en sommes maintenant au stade de l’évaluation qualitative. Pendant les trois premières semaines de février, au Japon, au Royaume-Uni, en Allemagne et en France (à France Télévisions) ont eu lieu des tests perceptifs. Il s’agit pour des experts audio de qualifier le rendu sonore d’un mixage unique OBA décliné sur 4 systèmes d’écoute : stéréo (2.0), multicanal 5.0 et multicanal en 3 dimensions : 11.0 et 22.0. Plusieurs critères sont évalués comme la clarté, la localisation, la couleur tonale, l’enveloppement…