I ricercatori usano A.I. fare foto di animali domestici sorridenti – ed è inquietante come sembra

nvidia ganimal ai research
Ricerca NVIDIA

Non riesci a far sorridere il tuo cane o quella tigre allo zoo per il tuo Instagram? Un nuovo programma artificialmente intelligente sviluppato dai ricercatori di Nvidia può prendere l'espressione di un animale e metterlo sulla foto di un altro animale. Chiamato GANimal – dopo reti generative contraddittorie, un tipo di AI – il software consente agli utenti di caricare un'immagine di un animale per ricreare l'espressione dell'animale e posarlo su un altro animale.

I programmi GAN sono progettati per convertire un'immagine in modo che assomigli a un'altra, ma in genere si concentrano su compiti più ristretti come trasformare i cavalli in zebre. GANimal, tuttavia, applica diverse modifiche all'immagine, regolando l'espressione, la posizione della testa dell'animale e, in molti casi, anche lo sfondo, dall'ispirazione all'immagine sorgente. A differenza della maggior parte dei GAN, il programma è progettato per funzionare con qualsiasi animale.

Tuttavia, quanto funziona bene è in discussione. Una delle immagini di esempio condivise dai ricercatori fa sembrare un carlino più simile a un mastino e una volpe più simile a una lince. Mentre alcune delle immagini di esempio hanno un aspetto piuttosto inquietante, la ricerca potrebbe avere importanti implicazioni sulla futura ricerca sull'IA.

Come spiega Nvidia, i programmi precedenti avevano bisogno di diverse immagini dell'animale bersaglio per funzionare, mentre il nuovo programma ne aveva bisogno solo una. I ricercatori chiamano la variazione un FUNIT – un algoritmo di traduzione da immagine a immagine non supervisionato da pochi scatti. Il bersaglio, o animale a cui aggiungere la nuova espressione, viene specificato con una manciata di immagini invece del numero di massa normalmente richiesto per addestrare programmi di intelligenza artificiale.

Il programma ha imparato a mescolare quelle espressioni su un nuovo animale nello stesso modo in cui molte persone imparano: la pratica. "In questo caso, formiamo una rete per risolvere congiuntamente molte attività di traduzione in cui ogni attività consiste nel tradurre un animale di origine casuale in un animale bersaglio casuale sfruttando alcune immagini di esempio dell'animale bersaglio", ha detto Ming-Yu Liu, uno dei i principali ricercatori del progetto. "Attraverso la pratica di risolvere diversi compiti di traduzione, alla fine la rete impara a generalizzare per tradurre animali conosciuti in animali mai visti prima."

Il lavoro potrebbe portare a usi del mondo reale con ulteriori ricerche, suggerisce Nvidia, inclusa la creazione di film d'azione dal vivo usando cani facilmente addestrabili, quindi usando l'IA per trasformare quei cani in tigri. Ma il lavoro è anche una parte costante dell'obiettivo del ricercatore Liu di utilizzare le reti neurali per dare al software una "immaginazione" più umana.

Il programma è disponibile per provare le tue foto sul Nvidia's AI Playground .