Questa IA ha clonato la mia voce usando solo tre minuti di audio
C’è una scena in Mission Impossible 3 che potresti ricordare. In esso, il nostro eroe. Ethan Hunt (Tom Cruise). affronta il cattivo del film, lo tiene sotto tiro e lo costringe a leggere ad alta voce una bizzarra serie di frasi.
“ Il piacere della compagnia di Busby è ciò che mi piace di più” , legge con riluttanza . «Ha messo una puntina sulla sedia della signorina Yancy e lei lo ha definito un ragazzo orribile. Alla fine del mese lanciava due gattini per tutta la larghezza della stanza… ».
Nonostante suonino casuali e poco importanti, diventa subito chiaro che le parole che sta leggendo non sono affatto casuali: sono deliberatamente progettate per aiutare un programma software a clonare la sua voce. Una volta terminato il passaggio, il software analizza l’audio e dà immediatamente a Hunt la capacità di parlare e suonare esattamente come il cattivo, l’ultimo pezzo del suo travestimento quasi perfetto.
Ora, se prendi quella scena e sottrai tutto lo spionaggio, le armi e la tensione drammatica, ti rimane un esempio piuttosto solido di ciò che ho vissuto oggi al CES durante una demo di My Own Voice , un “voice banking” basato sull’intelligenza artificiale. servizio di una startup francese chiamata Acapela Group.
La ragion d’essere dell’azienda è aiutare le persone che alla fine perderanno la capacità di parlare. Questo è in genere qualcosa che accade a seguito di lesioni, malattie o malattie come la SLA, la malattia di Huntington e il cancro della laringe. Qualunque sia la causa, la piattaforma My Own Voice dell’azienda consente a una persona di clonare sinteticamente la propria voce e preservare il tono, il timbro e la personalità unici che la rendono propria – qualcosa che in genere si perde con la maggior parte dei software di sintesi vocale (si pensi a Stephen Hawking).
Ora, per essere onesti, la tecnologia di clonazione vocale non è necessariamente nuova o tecnologicamente rivoluzionaria a questo punto. Tali servizi esistono da anni e, grazie in parte all’avvento dei deepfake , attualmente ci sono dozzine di altre società che possono fare la stessa cosa che fa Acapela Group. Ma ci sono due grandi cose che distinguono My Own Voice dal resto del pacchetto: velocità e scopo.
My Own Voice è incredibilmente veloce. A differenza di altri servizi, che spesso richiedono ore di audio di riferimento per creare un clone dal suono realistico, l’intelligenza artificiale di My Own Voice può creare un sintetico sorprendentemente buono dopo aver ascoltato solo 50 brevi frasi o circa 3 minuti di audio registrato. Fondamentalmente è proprio come quella scena di Mission Impossible; hanno sviluppato una serie semplificata di frasi di riferimento che rendono più facile per la loro intelligenza artificiale imparare come suoni, quindi invece di registrare manualmente ogni parola immaginabile, tutto ciò che devi fare è parlare attraverso una manciata di frasi facili.
Probabilmente più importante della velocità del software, tuttavia, è il suo scopo. Ancora una volta, questa tecnologia non è particolarmente nuova o nuova. Ci sono state una manciata di startup degne di nota che hanno creato una simile tecnologia di clonazione vocale, come la startup canadese Lyrebird o la società londinese Sonantic, per esempio. Ma entrambe queste startup sono state rapidamente acquisite e la loro tecnologia di clonazione vocale è stata utilizzata per la sovraincisione AI nei film e nel software di editing video .
Questo non vuol dire che quelli non siano buoni usi della tecnologia di clonazione vocale. Lo sono assolutamente, e probabilmente sono abbastanza redditizi da avviare, ma è proprio questo che rende My Own Voice così bello. Non capita spesso di incontrare una tecnologia così potente che, invece di essere costruita per l’intrattenimento o la produttività, è stata sviluppata appositamente per aiutare le persone svantaggiate e dare loro letteralmente voce.