In che modo Shazam riconosce la musica in modo accurato?

Ti sei mai chiesto come Shazam “sente” la musica che stai suonando e la identifica con tanta precisione? Beh, non sei solo.

La tecnologia che alimenta il servizio di riconoscimento musicale è un mistero per molti, soprattutto da quando il servizio è stato lanciato anni prima che gli smartphone e l’apprendimento automatico diventassero una cosa.

In questo articolo vedremo come funziona Shazam e come può riconoscere la musica in modo accurato.

Cos’è Shazam?

Shazam è una popolare app di riconoscimento musicale che puoi utilizzare per trovare informazioni su una nuova canzone che ami ma non conosci il titolo o il nome dell’artista.

Supponiamo che ti trovi in ​​un bar o che cammini in un negozio all’angolo e senti una nuova canzone che vorresti avere nella tua libreria musicale. Shazam ti aiuta a trovare la canzone con facilità. Tutto quello che devi fare è registrare alcuni secondi del brano sull’app.

L’app Shazam utilizza una sofisticata tecnologia di riconoscimento audio per identificare la musica che senti in pochi secondi in modo da poter scoprire il nome dell’artista e della traccia, guardare video e persino acquistare o riprodurre in streaming la canzone sul tuo dispositivo.

Scarica: Shazam per iOS | Android (gratuito)

Come funziona Shazam?

Galleria di immagini (4 immagini)

Shazam utilizza una tecnologia proprietaria sviluppata da Avery Lin-Chun Wang, cofondatore dell'app e chief data scientist, per identificare le corrispondenze per le canzoni interrogate sulla sua piattaforma. La tecnologia crea impronte digitali per le registrazioni audio, che è la salsa segreta dietro le fantastiche capacità di riconoscimento di Shazam.

Shazam crea e archivia le impronte digitali audio costituite da raccolte di dati numerici per ciascuna oltre 15 miliardi di brani. Quando un utente "Shazam" una canzone, Shazam crea rapidamente un'impronta digitale audio del suono ricevuto dallo smartphone o dal microfono del PC.

Una volta completata la creazione dell'impronta digitale audio per la registrazione, Shazam carica l'impronta digitale audio (non l'audio) sul suo server, dove esegue una ricerca nel database per le corrispondenze. Se viene trovata una corrispondenza, restituisce le informazioni sul brano con le opzioni su dove trasmetterlo in streaming o acquistarlo, insieme alle informazioni di identificazione.

Cos'è un'impronta digitale audio?

Un'impronta digitale audio è un riepilogo digitale condensato dei segnali audio. Vengono utilizzati per identificare un campione audio o per individuare elementi simili in un database audio.

La tecnologia di fingerprinting audio di Shazam può abbinare parti di contenuto audio senza etichetta alle corrispondenze corrispondenti nel suo database audio. Shazam identifica il titolo della canzone che hai registrato (un contenuto audio senza etichetta) facendo corrispondere l'impronta digitale della canzone con l'impronta digitale delle canzoni nel suo database.

Shazam crea impronte digitali uniche per le canzoni sul suo database utilizzando determinati punti dati identificati con l'aiuto di uno spettrogramma.

Cos'è uno spettrogramma?

Uno spettrogramma è un grafico tridimensionale utilizzato come rappresentazione del suono. Lo spettrogramma mostra la variazione delle frequenze in un periodo tenendo conto anche dell'ampiezza o del volume. La foto sotto è un esempio di lettura dello spettrogramma.

In un'intervista del 2003 con Scientific American , Avery Wang ha rivelato che l'algoritmo di Shazam utilizza punti spettrogrammi che rappresentano note con la massima energia per generare impronte digitali audio.

Ignorando la maggior parte delle informazioni in una canzone e concentrandosi solo sulle poche note che definiscono, Shazam può cercare nel suo database e fornire corrispondenze accurate per le query sui brani a una velocità incredibile.

In che modo Shazam è in grado di identificare le canzoni in luoghi rumorosi?

Shazam utilizza registrazioni di brani prive di rumori di fondo e distorsioni per creare impronte digitali per il suo database. Quando registri una canzone con l'app in un luogo rumoroso, crea un'impronta digitale audio della tua registrazione identificando le note con la massima energia nella registrazione.

Quindi cerca nel database una corrispondenza per le impronte digitali audio della registrazione, a condizione che il livello di rumore di fondo non fosse abbastanza alto da distorcere i dati utilizzati per creare l'impronta digitale audio.

Tempi in cui Shazam non può aiutarti a identificare una canzone

Shazam è bravissimo ad abbinare le canzoni, anche la musica oscura che pensi possa non avere nel suo database. Ma ci sono momenti in cui Shazam non riesce a identificare una traccia?

Registrazione distorta

Quando fai Shazam di una canzone in un punto in cui il livello di rumore di fondo è troppo alto, il rumore distorce i dati sullo spettrogramma. Per questo motivo, l'impronta digitale audio della registrazione sarà diversa da quella della canzone originale.

Quando ciò accade, Shazam restituisce il dialogo Song not Known perché non riesce a trovare una corrispondenza per l'impronta digitale audio.

Musica dal vivo

Shazam non è in grado di identificare la musica dalle esibizioni dal vivo. Questo perché l'audio che registri nelle esibizioni dal vivo spesso differisce dalla versione originale della canzone che Shazam usa per creare impronte audio.

L'unico modo in cui Shazam può identificare una canzone durante un'esibizione dal vivo è se la band è abbastanza abile da eseguire la canzone esattamente come è stata registrata. Buona fortuna con la band che cerca di farlo ...

La tua registrazione vocale

"Potrei far riconoscere a Shazam una canzone che stavo cantando se fossi un bravo cantante?"

In breve, no.

L'algoritmo Shazam può identificare solo musica preregistrata. Affinché Shazam identifichi una canzone che stai cantando, dovresti avere la stessa voce con le parti strumentali al tempo esatto con la registrazione originale della canzone.

Il tuo ronzio

Shazam non è in grado di identificare le corrispondenze per i ronzii perché il suo algoritmo utilizza frequenze e ampiezze esatte per creare impronte digitali audio per le canzoni nel suo database.

Quando canticchi una canzone, Shazam crea un'impronta digitale per essa. Ma poiché un ronzio è solo un tentativo di risintetizzare una canzone, l'algoritmo non riuscirà ad abbinare la registrazione.

Shazam è l'unica app di identificazione musicale?

Shazam è stato il primo servizio di identificazione musicale ed è attualmente l'app per l'identificazione di brani più utilizzata. Tuttavia, ci sono altre app che puoi utilizzare per identificare una canzone che suona intorno a te. Alcuni possono persino identificare una canzone che stai cantando o canticchiando.

Tre delle alternative Shazam più popolari sono SoundHound, Musixmatch Lyrics e Genius. Musixmatch e Genius ti aiutano principalmente a identificare i testi per la musica che suona intorno a te, mentre SoundHound è il concorrente più vicino di Shazam.

Correlati: le migliori app di riconoscimento musicale per trovare canzoni in base alla loro melodia

Puoi utilizzare l'app SoundHound per fare praticamente tutto ciò che fa Shazam. Il suo principale vantaggio rispetto a Shazam è che ha la funzionalità aggiuntiva di identificare le canzoni che canti o canticchi.

Credito immagine: Sulastri Sulastri / Shutterstock.com