Audio spaziale tramite cuffie: come la scienza stipa 9 altoparlanti e un subwoofer nella tua testa

L'audio spaziale sta vivendo un momento. Sebbene l’obiettivo di offrire un’esperienza di ascolto più coinvolgente, simile al 3D, possa essere nato nei cinema, gran parte della conversazione sull’audio spaziale si è spostata sulla musica, in particolare sulla disponibilità relativamente nuova di brani Dolby Atmos Music tramite servizi di streaming musicale.
Il fascino dell'audio spaziale non è un mistero. Quando combini uno dei primi nuovi modi di ascoltare la musica dai tempi dello stereo, unito alla prodigiosa potenza di marketing di Apple , ottieni molte persone che vogliono provarlo.
Qualcosa di misterioso, tuttavia, è se esista una differenza tra l'audio spaziale da un servizio di streaming a un altro. Ad esempio, su Apple Music rispetto ad Amazon Music. E per quanto riguarda le tue cuffie: influenzano il suono dell'audio spaziale?
Le risposte sono sì e sì, ma forse non per i motivi che pensi. Per spiegarlo, diamo uno sguardo più approfondito a cosa succede dietro le quinte quando ascolti l'audio spaziale utilizzando le cuffie.
Prima di continuare, ecco un'introduzione all'audio spaziale che spiega di cosa si tratta e i vari modi in cui puoi sperimentarlo.
Una stanza piena di altoparlanti nella tua testa

I formati audio spaziali come Dolby Atmos sono estensioni del suono surround multicanale (si pensi a Dolby Digital), progettati per un'esperienza di ascolto al cinema tramite altoparlanti posizionati in una stanza. Questa stanza teorica ha una parte anteriore, una parte posteriore, due lati e un soffitto.
La musica creata in Dolby Atmos inizia con un "letto" di 9.1 canali, solitamente configurato in un layout 7.1.2 che corrisponde agli altoparlanti nella parte anteriore (sinistro, centrale, destra), ai lati (surround sinistro/destro), nella parte posteriore (sinistra/destra), il soffitto (altezza sinistra/destra), più un canale per effetti a bassa frequenza (LFE) inviato a un subwoofer. Oltre a questi nove canali, che possono produrre quantità variabili di suono, Dolby Atmos aggiunge fino a 118 “oggetti” sonori che possono muoversi liberamente ovunque nell’emisfero coperto da questi nove altoparlanti.
Quando ascolti l'audio spaziale tramite le cuffie, senti la stessa colonna sonora a 9.1 canali e 118 oggetti, il che sembra un paradosso. Come possono due piccoli altoparlanti attaccati alla tua testa fare la stessa cosa di nove altoparlanti disposti intorno a te?
Ingannare il tuo cervello

La risposta può essere trovata nella psicoacustica, il campo della scienza che studia come il cervello interpreta e reagisce alle informazioni sonore. Ciò include un processo noto come localizzazione del suono: il modo in cui il cervello utilizza segnali uditivi per capire da quale direzione proviene un suono e quanto vicina o lontana può essere la fonte del suono.
Localizziamo il suono sintetizzando altezza e volume. Ma l’indizio più importante è il modo in cui il suono raggiunge ciascuna delle nostre orecchie. Siamo estremamente sensibili anche alle più piccole differenze di tempistica. Se un suono raggiungesse il nostro orecchio sinistro solo un millisecondo prima di raggiungere il nostro orecchio destro, il nostro cervello lo saprebbe e reagirebbe di conseguenza.
Utilizzando modelli psicoacustici (e un set di cuffie stereo), possiamo simulare la direzione e la distanza dei suoni del mondo reale controllando attentamente il modo in cui questi suoni raggiungono ciascun orecchio.
Rendering binaurale

Il processo di prendere un formato audio spaziale come Dolby Atmos e trasformarlo utilizzando i principi della psicoacustica in un insieme di suoni che possono essere trasmessi tramite cuffie è noto come rendering binaurale.
Se hai mai ascoltato Dolby Atmos, DTS:X o Sony 360 Reality Audio (360RA) utilizzando le cuffie, a un certo punto della catena di riproduzione è stato utilizzato un algoritmo software di rendering binaurale per creare quell'esperienza. Lo stesso vale per i videogiochi con colonne sonore 5.1 o 7.1: queste possono essere riprodotte in modo binaurale da tecnologie come THX Spatial Audio o Immerse Gaming Hive .
La parte interessante del rendering binaurale è che funziona su qualsiasi set di cuffie o auricolari stereo. Che siano cablate o wireless e che tu abbia speso $ 10 o $ 1.000, tutte le cuffie stereo sono compatibili con l'audio spaziale con rendering binaurale. Un set di cuffie può pubblicizzare specificamente che "funziona con l'audio spaziale", ma è un po' come dire che un set di quattro pneumatici per auto "funziona con le strade asfaltate" – lo fanno tutti.
Audio spaziale: è tutto fuori dalla tua testa?

Quindi, ora che ho appena spiegato che il rendering binaurale può ingannare il cervello facendogli credere che sta ascoltando un sistema audio completo a 7.1.2 canali utilizzando qualsiasi vecchio paio di cuffie – in altre parole, è tutto nella tua testa – vado contraddirmi. Parzialmente.
Il modo in cui ognuno di noi interpreta i segnali di localizzazione del suono ha molto a che fare con la forma della nostra testa. Nello specifico, la forma e la posizione delle nostre orecchie. La fisiologia della nostra testa crea un'impronta digitale unica (impronta audio?) sui suoni che raggiungono i nostri timpani: non ne esistono due uguali. Fin dalla prima infanzia, quando il nostro cervello sviluppa la capacità di localizzare il suono, utilizza questa impronta audio come modello.
Quando descritta matematicamente e utilizzata per filtrare i suoni in entrata in ciascun orecchio, questa impronta audio è nota come " funzione di trasferimento correlata alla testa " (HRTF).
Gli HRTF sono la chiave

Affinché il rendering binaurale risulti quanto più realistico possibile, l'audio spaziale viene elaborato utilizzando un profilo HRTF.
Come probabilmente avrai intuito, tutti noi abbiamo profili HRTF unici. In un mondo ideale, eseguiremo la scansione 3D della testa e della parte superiore del torace e caricheremmo il profilo HRTF risultante su Apple Music o Amazon Music (o qualsiasi altra app che supporti l'audio spaziale). L'algoritmo di rendering binaurale di ciascuna app utilizzerebbe quindi quel profilo HRTF per creare una serie di suoni che il nostro cervello interpreta con un alto grado di realismo.
Non siamo ancora arrivati al punto. In assenza di HRTF personalizzabili e caricabili, ciascuna app audio spaziale utilizza un HRTF generico. Come suggerisce il nome, questi HRTF generici sono compilati da centinaia di HRTF individuali per creare un'approssimazione di come i suoni entrano nelle nostre orecchie. Più il tuo HRTF personale si avvicina a questo HRTF medio, più realistico sarà l'audio spaziale.
Gli HRTF generici vengono utilizzati anche per spazializzare il contenuto stereo o migliorare l'audio spaziale con tracciamento della testa. Se l'app musicale, le cuffie wireless o gli auricolari wireless dispongono di una modalità audio spaziale, è possibile utilizzarla per conferire maggiore profondità al suono stereo. E se le tue cuffie sono dotate di sensori integrati per monitorare i movimenti della testa, possono generare un audio spaziale con tracciamento della testa per un'esperienza di ascolto ancora più realistica, simile a quella di una stanza.
Chi ha il miglior HRTF?
Curiosamente, sebbene ogni renderer binaurale utilizzi un HRTF generico, non tutti utilizzano lo stesso HRTF generico. Alcuni, come Amazon Music e Tidal, utilizzano un HRTF generico fornito da Dolby – è incorporato nel motore di rendering binaurale Dolby Atmos incluso in queste app – mentre Apple Music utilizza un HRTF generico proprietario sviluppato da Apple.
Per definizione, ogni HRTF generico sarà più adatto ad alcune persone rispetto ad altre, allo stesso modo in cui un set di auricolari wireless si adatterà meglio ad alcune persone rispetto ad altre. Se l'HRTF di Apple ti suona meglio di quello di Dolby dipenderà da quanto li abbini. L'unico modo per saperlo è provarli entrambi.
Un passo avanti verso la realtà: HRTF personalizzati

Sebbene le scansioni anatomiche 3D complete siano il Santo Graal degli HRTF personalizzati, alcune aziende hanno individuato un passaggio intermedio che ci offre un modo semplice per andare oltre gli HRTF generici. Apple chiama la sua versione “audio spaziale personalizzato”. "Se hai un iPhone X o più recente (esclusi i modelli SE), con iOS 16 o successivo, puoi utilizzare la fotocamera selfie TrueDepth integrata nel telefono per scattare foto 3D della parte anteriore del tuo viso e di ciascun orecchio. È la stessa tecnologia che Apple utilizza per scansionare il tuo viso quando usi FaceID per sbloccare il telefono.
Sfortunatamente, l'HRTF personalizzato creato può essere utilizzato solo insieme a cuffie e auricolari wireless Apple AirPods o Beats selezionati: non influirà sul modo in cui ascolti l'audio spaziale quando utilizzi altri dispositivi.
Sony fa qualcosa di simile all'interno dell'app Sony Headphones. Se acquisti un set di cuffie o auricolari Sony compatibili con 360RA, puoi scattare foto di ciascun orecchio e caricarle nell'app.
Le foto vengono valutate e utilizzate per creare un HRTF personalizzato, che viene trasferito alle app musicali sul telefono che riproducono in streaming i brani Sony 360RA. A partire da marzo 2024, ciò include Amazon Music, Tidal, Nugs.net e PeerTracks.
Creazione di uno studio audio spaziale virtuale

Per quanto sia interessante utilizzare il rendering binaurale come modo di ascoltare l'audio spaziale con le cuffie, per molti musicisti e altri creatori è diventato una parte essenziale della creazione di audio spaziale.
Come notato nella sezione “Una stanza piena di altoparlanti nella tua testa”, i formati audio spaziali come Dolby Atmos sono creati per l’ascolto dagli altoparlanti. Ma creare uno studio 7.1.2 o superiore, completo di trattamenti acustici adeguati per eliminare gli echi e altri effetti indesiderati, può costare migliaia.
Se sei un artista emergente o qualcuno che vuole sperimentare con l'audio spaziale come hobby, questo può essere un investimento proibitivo. Ma grazie al rendering binaurale, tutto ciò di cui hai bisogno è un buon set di cuffie e il software giusto e avrai uno studio virtuale direttamente sul tuo computer.
Un esempio di software di studio virtuale è Immerse Virtual Studio Signature Edition di Embody. Funziona con qualsiasi workstation audio digitale (DAW), come ProTools, o come modo autonomo per sperimentare audio spaziale con rendering binaurale da una varietà di altre fonti.
Immerse ti consente di simulare cosa vuol dire mixare l'audio spaziale all'interno di alcuni dei più prestigiosi studi professionali Dolby Atmos, tra cui lo studio 7.1.6 di Alan Myerson, dove Hans Zimmer ha masterizzato molte delle sue iconiche colonne sonore, e Lurssen Mastering, un Grammy e un Oscar. -studio 7.1.4 vincitore.

La chiave per ascoltare questi spazi di registrazione come faresti se lavorassi fisicamente al loro interno è la combinazione dell'HRTF personalizzato di Immerse, che puoi creare utilizzando quasi tutti gli smartphone, con profili di cuffie dedicati per decine di popolari cuffie consumer e professionali cablate e wireless. e auricolari.
Questi elementi offrono agli artisti un ambiente ottimizzato per lo sviluppo di contenuti audio spaziali. Tuttavia, come discusso in precedenza, la maggior parte delle persone non dispone di ambienti ottimizzati per l'ascolto dell'audio spaziale. Il software di Embody ti consente di passare a diversi renderer binaurali, con e senza HRTF personalizzati, in modo da poter ascoltare le tue registrazioni come potrebbero fare gli ascoltatori medi. Il software include il renderer binaurale proprietario di Apple Music e può anche essere utilizzato per monitorare Dolby binaurale con lo stesso HRTF generico utilizzato in Tidal e Amazon Music.
Puntare all'oro
In generale, quando un'etichetta musicale fornisce una traccia in Dolby Atmos a un servizio di streaming come Apple Music o Tidal, si tratta di un'unica versione. Ciò crea un dilemma per gli artisti.
Quella versione sarà probabilmente stata masterizzata in uno studio fisico con una configurazione di altoparlanti Atmos o utilizzando un software che virtualizza uno spazio simile. Tuttavia, come abbiamo discusso in precedenza, variabili come gli HRTF e gli specifici renderer binaurali utilizzati possono influenzare profondamente il modo in cui suonano queste tracce quando le ascolti su piattaforme diverse.
Un artista potrebbe essere tentato di modificare il proprio mix in modo che suoni meglio quando viene trasmesso in streaming tramite Amazon Music e reso binaurale con un HRTF generico, soprattutto se crede che sia così che la maggior parte del suo pubblico finirà per ascoltare.
Ma ciò comprometterebbe il suono su un sistema audio Dolby Atmos 7.1.4 completo o anche su Apple Music con un HRTF personalizzato.
Poiché la maggior parte degli artisti non ha il tempo o i soldi per tornare in studio per rimasterizzare le proprie tracce una volta pubblicate, devono prendere una decisione: creare una versione ottimizzata per la migliore esperienza di ascolto 7.1.4 possibile. e confidiamo che, nel tempo, man mano che aziende come Apple e Amazon migliorano i loro rendering binaurali e il supporto per HRTF personalizzati, l'esperienza con le cuffie semplicemente migliorerà sempre di più o, creerà una versione che non è all'altezza di come potrebbe suonare, per creare un mix di cuffie ottimizzato per gli ascoltatori di oggi.
Ovviamente, questa decisione spetterà interamente all'artista e/o alla sua etichetta. Tuttavia, temo che programmi comeSpace Audio Bounty di Apple creeranno un incentivo per tutti nel mondo della musica ad affrettare i propri mix spaziali semplicemente per ottenere la ricompensa finanziaria promessa.
Tuttavia, siamo all'inizio di un'era entusiasmante per l'audio. Ridefinirà il modo in cui viene creata la musica e come suona quando la ascoltiamo, con o senza l'uso delle cuffie.