Alexa potrebbe presto essere una cosa del passato

I ricercatori della Carnegie Mellon University hanno sviluppato un sistema per interagire con altoparlanti intelligenti e altri dispositivi con assistenza vocale senza utilizzare parole di attivazione.

Il sistema, che si basa sull'apprendimento automatico, potrebbe essere la base per un'alternativa sicura agli assistenti domestici sempre attivi.

Come funziona il nuovo sistema?

Le nuove scoperte sono state pubblicate in un documento di ricerca [PDF] da un gruppo di ricerca di quattro persone, che ha anche fornito un video che spiega come potrebbe funzionare il nuovo modello.

La ricerca si concentra sulla direzione della voce , una tecnica che determina sia la posizione che l'angolazione da cui proviene il discorso. Ciò differisce dai dispositivi intelligenti odierni, che tendono a concentrarsi solo sulla posizione di origine di un suono.

L'approccio attuale si basa anche su una parola di attivazione specifica, motivo per cui cambiare la parola di attivazione di Alexa in qualcos'altro ti offre solo una o due opzioni in più.

Quando una persona parla, la sua voce crea echi nella stanza, che arrivano tutti a un altoparlante intelligente in momenti diversi. Analizzando la tempistica, il volume e lo spettro di frequenza del suono prodotto da ogni eco riflessa, il nuovo sistema può prevedere se un utente sta parlando nella direzione dell'oggetto intelligente o se è rivolto dall'altra parte di esso.

Oltre al documento di ricerca, il team ha anche fornito un collegamento GitHub al set di dati utilizzato per addestrare la rete neurale. Le 11.520 frasi uniche nel set di dati sono state sufficienti per addestrare un oratore intelligente a prevedere l'angolo che un utente stava affrontando con una precisione di 90 gradi.

I calcoli necessari per determinare la direzione sono abbastanza leggeri da essere eseguiti sul dispositivo in locale senza connettersi a un server remoto. Il team di ricerca dietro le nuove scoperte spera che questo approccio consentirà interazioni più fluide con i dispositivi intelligenti e offrirà maggiore privacy agli utenti rispetto alle alternative basate su cloud.

Non esiste una tempistica su quando questa tecnologia potrebbe apparire per uso pubblico, ma le basi sono lì per abolire la necessità di parole di attivazione alla fine. Quando non hai più bisogno di chiamare per nome un oratore intelligente, ne hai davvero bisogno? Forse Alexa conosce la risposta.

La fine degli assistenti domestici personalizzati?

Sebbene questa ricerca apra nuove entusiasmanti possibilità per interagire con dispositivi intelligenti, è improbabile che sostituisca completamente le parole di attivazione. Dopotutto, uno dei principali vantaggi degli altoparlanti intelligenti è che puoi interagire con loro con la sola voce mentre esegui altre attività.

Forse promette un futuro in cui più dispositivi intelligenti possono essere utilizzati nello stesso spazio. Invece di riattivare ogni dispositivo intelligente a portata d'orecchio, potresti chiedere a un singolo dispositivo di darti il ​​bollettino meteorologico in silenzio.

È ancora agli inizi, ma una tecnologia come questa potrebbe rendere le interazioni umane e informatiche senza soluzione di continuità della fantascienza una realtà in un futuro non troppo lontano.