Questo modello video unico nel suo genere di un’azienda cinese di intelligenza artificiale in grado di controllare accuratamente i personaggi a livello minuto è qui | WAIC 2024
SenseTime ha fatto ancora una volta qualcosa di eccezionale e può generare un video di un minuto solo con una foto.
Il 4 luglio, Vimi, il primo modello di generazione di video con personaggi controllabili di grandi dimensioni per utenti di fascia C creato da SenseTime, è stato selezionato come "Tesoro della Sala", il più alto onore per la mostra espositiva della World Artificial Intelligence Conference (WAIC). mostra più innovativa della conferenza.
Basato sul nuovo modello di grandi dimensioni di SenseTime, Vimi può generare un video del personaggio coerente con l'azione target semplicemente attraverso una foto di qualsiasi stile e supporta una varietà di metodi di guida, che possono utilizzare video di personaggi, animazioni, suoni, testo, ecc. esistenti. Spinto da più elementi.
Con il rapido sviluppo di modelli di grandi dimensioni e della tecnologia AI generativa, non è più difficile rendere “vive” le foto fisse.
Tuttavia, i prodotti esistenti sul mercato presentano ancora molti problemi nelle applicazioni pratiche, come il controllo impreciso del movimento e dell’espressione, la scarsa stabilità degli effetti e la durata limitata dei video, che limitano lo spazio creativo dei creatori di video.
Per superare questi colli di bottiglia, SenseTime ha lanciato un modello di generazione di video con personaggi controllabili di grandi dimensioni: Vimi.
A differenza della tecnologia di controllo dell'espressione delle immagini che può controllare solo i movimenti di espressione della testa, Vimi non solo può ottenere un controllo preciso dell'espressione dei personaggi, ma anche controllare i cambiamenti naturali del corpo dei personaggi nelle foto nell'area di metà corpo e generare automaticamente capelli, capelli e capelli che si abbinano ai cambiamenti di costume e sfondo.
Allo stesso tempo, Vimi può anche generare ragionevolmente cambiamenti di luci e ombre, rendendo i movimenti dei personaggi e gli effetti visivi fluidi e naturali e l'immagine armoniosa e bella.
Ancora più importante, Vimi può generare stabilmente video di personaggi a ripresa singola fino a 1 minuto senza deterioramento o distorsione nel tempo, soddisfacendo pienamente la domanda di video stabili a lungo termine in scenari di intrattenimento e interazione.
Ririxin ha dichiarato ufficialmente che Vimi sarà completamente aperto agli utenti di fascia C, in particolare per soddisfare le esigenze di intrattenimento e creazione degli utenti di sesso femminile.
Gli utenti devono solo caricare immagini ad alta definizione di persone da diverse angolazioni e possono essere generati automaticamente avatar digitali e video fotografici di stili diversi.
I personaggi video generati da Vimi non sono più solo noiosi movimenti facciali, ma sono abbinati a gesti, arti, capelli, ecc. per formare movimenti dei personaggi più completi e unificati, consentendo ai creatori di modificare e ricreare in base ai materiali video generati.
Per gli utenti che amano farsi selfie, Vimi supporta una varietà di scenari di intrattenimento e interattivi come chattare, cantare, ballare, ecc.; per gli utenti che amano le emoticon, Vimi può generare una varietà di emoticon di personaggi interessanti attraverso una singola foto; con vari modi di giocare e raggiungere la libertà creativa.
Inoltre, Vimi offre anche una varietà di stili di generazione come lo stile fotografico estetico e lo stile fantasy, consentendo agli utenti di viaggiare attraverso dimensioni diverse e godere di effetti visivi coinvolgenti simili a quelli di un film di successo.
Attualmente, l'80% dei video del settore hanno personaggi come contenuto principale. Allo stesso tempo, con l'esplosione di brevi video e piattaforme di trasmissione in diretta, la domanda di video con personaggi come contenuto principale è aumentata in modo esponenziale.
Tuttavia, sul mercato mancano prodotti AIGC in grado di controllare la generazione di video dei personaggi, il che porta all’urgente necessità di migliorare l’efficienza dei creatori di contenuti.
Si può dire che l'avvento di Vimi ha appena colmato questa lacuna, fornendo uno strumento di creazione semplice e facile da usare per la maggior parte dei creatori di video del lato C, che può essere ampiamente utilizzato nella creazione di brevi video di personaggi.
Maggiori dettagli su Vimi saranno svelati al forum sull'intelligenza artificiale "Love Without Boundaries·Xiang Xinli" ospitato da SenseTime il 5 luglio. L'APPSO darà seguito anche alle relazioni.
Attualmente, Vimi ha aperto le prenotazioni sul sito ufficiale di SenseTime e tu sei il benvenuto a provarlo.
In allegato è riportato il portale degli indirizzi di prenotazione: https://vme-int.softsugar.com/questionnaire/
# Benvenuti a seguire l'account pubblico WeChat ufficiale di Aifaner: Aifaner (ID WeChat: ifanr) Ti verranno forniti contenuti più interessanti il prima possibile.
Ai Faner |. Link originale · Visualizza commenti · Sina Weibo