I volti CGI saranno presto indistinguibili da quelli reali. Ecco come
Non molto tempo fa, Andy Wood, il presidente di una società britannica di computer grafica chiamata Cubic Motion , era in riunione per aiutare a presentare la sua tecnologia a un importante studio di giochi a Los Angeles. Per mostrare ciò di cui erano capaci, il team di Cubic Motion aveva creato un filmato animato usando una delle proprietà del marchio dello studio di gioco: un personaggio femminile stilizzato metà umano e metà animale.
La demo era andata bene, il filmato pre-renderizzato forniva in modo convincente la sceneggiatura dello studio. Quindi il team di Cubic Motion eseguì il suo colpo da maestro concordato; l'acrobazia che speravano avrebbe guadagnato loro il contratto.
Dopo aver pronunciato le sue linee pre-scritte, il personaggio della scena ha rotto la quarta parete. Si voltò verso la telecamera, sembrando scrutare i dirigenti della stanza e cominciò a rivolgersi a loro individualmente. Neanche questo era un trucco pre-programmato. Il filmato pre-renderizzato, è emerso, non è stato pre-renderizzato affatto. È stato recitato dal vivo da un artista a Manchester, dall'altra parte del mondo, che si stava trasformando in tempo reale nel personaggio dello studio di gioco. Quando il personaggio è diventato "off-script" e ha iniziato a interagire con le persone nella stanza, l'effetto è stato sconcertante.
"Non ho mai visto una reazione del genere", ha detto Wood a Digital Trends. “C'è stato un sussulto udibile da parte di tutti nella stanza. Qualcuno mi ha afferrato per il braccio perché non riusciva a credere a quello che stava succedendo. ”Cubic Motion ha vinto il contratto.
Per capire perché questo è così significativo, è necessario conoscere un po 'il modo in cui i personaggi di motion capture vengono generalmente catturati. Gli attori di motion capture vengono normalmente registrati con largo anticipo. Indossano tute aderenti che sono coperte da dozzine di piccoli punti, LED o cose che assomigliano a palline da ping-pong in miniatura. Questi sono chiamati marcatori e sono usati per fornire agli animatori punti di riferimento per tracciare il movimento di un corpo nel tempo e nello spazio tridimensionali. Una volta eseguito questo processo, gli animatori possono iniziare a lavorare completando la grafica finita: unendo letteralmente i punti fino a quando non hanno qualcosa che assomiglia a qualsiasi personaggio che sperano di creare.
L'approccio di Cubic Motion è diverso. La società ha sviluppato una tecnologia senza marker per il monitoraggio in tempo reale dei modelli; progettato per trasformarli istantaneamente in rendering completi e robusti, funzionanti a 60 fotogrammi lisci come la seta. Ciò comporta alcuni impressionanti algoritmi di apprendimento automatico, che sono in grado di acquisire un'immagine di una faccia e separarne le parti componenti, contrassegnare digitalmente i diversi elementi e consentire che vengano catturati in una quantità di dettagli quasi senza precedenti.
"Per quanto ne sappiamo, non c'è nessuno al mondo in grado di ottenere la cattura del viso attraverso la visione computerizzata nel modo in cui lo facciamo al livello di fedeltà in tempo reale di Cubic Motion", ha continuato Wood.
Sebbene ci sia una buona probabilità che tu non abbia mai sentito il nome Cubic Motion prima, quasi sicuramente conoscerai il suo lavoro. La sua tecnologia di animazione facciale da battere il mondo è stata utilizzata in giochi come God of War , Insomniac's Spider-Man , Anthem e Blood & Truth . E c'è molto di più a venire.
Il problema con Gollum
Per molte persone che leggono questo, Gollum della trilogia del film Lord of the Rings, vincitore del premio Oscar di Peter Jackson, rimane un punto culminante per le performance catturate dal movimento. È una delle prime volte in cui il pubblico ha visto un personaggio CGI che ha recitato in una performance tanto emotivamente carica quanto uno dei personaggi più riconoscibili nella trilogia cinematografica.
"Uso spesso Gollum [dalla trilogia de Il Signore degli Anelli ] come punto di riferimento di un personaggio credibile, che ha ricevuto la motion capture", ha dichiarato Wood. “Ma quando Andy Serkis ha interpretato Gollum, è stato rintracciato usando la motion capture che gli ha richiesto di indossare più marcatori sul viso. Il team ha svolto un lavoro straordinario, ma ci sono delle limitazioni. Ad esempio, non puoi mettere punti per i marcatori sugli occhi delle persone. Non puoi tenere traccia delle lingue e così via. Per ottenere l'effetto finale, era necessaria un'enorme squadra di artisti per fare cose come la mano animare i suoi movimenti oculari perché questi non potevano essere rintracciati. Con il nostro tracciamento senza marcatore, ogni espressione da un battito di ciglia a una dilatazione della pupilla può essere registrata – e, inoltre, in tempo reale. ”
Cubic Motion non fa tutto questo da solo, ovviamente. Funziona con altre aziende leader del settore come Epic Games, Tencent, 3Lateral e Vicon, che hanno sviluppato qualsiasi cosa, dagli scanner ad alta definizione al motore di gioco Unreal. Ma il contributo di Cubic Motion è profondo. La sua tecnologia fornisce le basi abilitanti che riuniscono tutte le altre parti. Nessuna quantità di fossette ad alta definizione, pelle perfettamente ombreggiata o fuzz di pesca splendidamente resa su un volto umano potrebbe compensare movimenti che sembrano rigidi e innaturali.
"Se riesci a catturare l'essenza di un essere umano e trasferirlo digitalmente su un personaggio digitale o doppio, è come un transfert dell'anima", ha continuato Wood. "Ti permette di prendere tutte le caratteristiche di un essere umano e trasferirlo su qualcosa di non umano in un modo irresistibile e assolutamente riconoscibile."
L'anima è un concetto che emerge in modo sorprendente quando si tratta di riproduzion
e tecnologica. Ci sono rapporti di antropologi sulle tribù indigene, che hanno incontrato per la prima volta esploratori occidentali, che non volevano essere fotografati a causa della loro convinzione che questo processo fotografico avrebbe in qualche modo rubato la loro anima. Non devono essersi preoccupati, poiché centinaia di anni dopo stiamo ancora lottando con la tecnologia per farlo. Cubic Motion ritiene che sia sulla strada giusta per aiutare. La possibilità di tracciare istantaneamente il movimento di un volto umano e trasferirlo immediatamente su un personaggio CGI, fotorealistico o meno, è un punto di svolta. Permette di catturare le performance incredibilmente sfumate di un attore in un modo inimmaginabile solo pochi anni fa.
Nel 2018, la società ha mostrato la sua tecnologia debuttando una riproduzione fotorealistica di una giovane donna cinese, chiamata Siren, i cui veri tratti del viso sono stati rintracciati in oltre 200 posizioni e riprodotti in digitale senza alcun ritardo percepibile. Potresti smettere di chiamarlo transfert dell'anima, ma non c'è dubbio che i risultati abbiano un'energia realistica per loro. Non sono richiesti animatori per disegnare gli occhi.
Come sarà usato?
Tuttavia, non si tratta solo dei vantaggi in termini di costi del risparmio di tempo degli animatori. Indica un futuro in cui tutti noi possiamo essere scansionati e riprodotti in una sorprendente fedeltà e collocati in mondi digitali con livelli di dettaglio senza pari. Questo potrebbe essere usato per funzionalità di gioco che consentono ai giocatori di essere scansionati e inseriti in un gioco con livelli di precisione fotografica fino ad allora inimmaginabili.
Ma ci sono molti altri scenari in cui questa tecnologia potrebbe trovare una casa. Considera, ad esempio, la possibilità di interagire con un avatar virtuale del tuo dottore, magari attraverso la realtà aumentata o virtuale, per un appuntamento virtuale. O immagina di avere un bambino di 8 anni che lotta con la matematica. E se potessero ricevere un tutoraggio aggiuntivo per gentile concessione di un avatar sullo schermo che assomigli a una versione fotorealistica di se stessi a 12 anni, avendo ceduto e preso confidenza con l'argomento? Diamine, noi adulti potremmo accedere a un'app di fitness presentata da un avatar realistico simile a noi in 18 mesi, se solo prendessimo sul serio mangiando sano e colpendo la palestra tre giorni alla settimana. "Potresti creare una profezia che si autoavvera per darti fiducia", ha detto Wood.
Sembrano cose della fantascienza in questo momento, ma non sono così futuribilmente sgradevoli come potrebbe sembrare. Ad esempio, una società giapponese chiamata Gatebox commercializza dispositivi non dissimili da Amazon Echo o Google Home, con solo piccoli animatori animati progettati per interagire con i loro proprietari. In effetti, sono stati studiati anche gli effetti della creazione di avatar ispiratori modellati sugli utenti. Alla New York University, uno studio sul processo decisionale a lungo termine ha scoperto che gli utenti che interagivano con un avatar personalizzato, invecchiato artificialmente per sembrare più vecchi, pensavano più attentamente alle decisioni che avrebbero avuto un impatto sul loro futuro. Erano più propensi a risparmiare denaro per la pensione rispetto a quelli che vedevano un avatar della stessa età di se stessi.
Naturalmente, tali avatar non devono ricordarci la mano strisciante della morte sulla nostra spalla. Una tecnologia come questa potrebbe facilmente trasformarci in una versione più giovane e più bella di noi stessi. O in una persona di un altro genere – o persino in un'altra specie, reale o immaginata. Il cielo è il limite.
La tecnologia di acquisizione del viso in tempo reale di Cubic Motion è attualmente lontana dalle mani dei consumatori di tutti i giorni. Lo stesso Wood dispone di una scansione facciale 3D completa, acquisita utilizzando la tecnologia di scansione all'avanguardia a 360 gradi dell'azienda, che mostra alle dimostrazioni dei prodotti. (In qualche modo in modo inopportuno, questo significa che deve radersi la barba prima di ogni demo per assicurarsi che il proprio sé umano corrisponda perfettamente alla fedeltà del suo doppio digitale. Tali sono i sacrifici che i pionieri devono fare.) Ma per la maggior parte di noi questo non è un opzione. L'impianto fotografico che Cubic Motion utilizza, che è solo una parte del pacchetto complessivo, costerebbe te o io centinaia di migliaia di dollari.
Tuttavia, la tecnologia di auto-scansione, con una fedeltà molto più bassa, si trova sugli smartphone di oggi. I modelli della serie X di iPhone, ad esempio, vantano qualcosa di non dissimile per rendere possibili Animojis e Memojis basati sul movimento dei volti dell'utente. Cubic Motion ha anche recentemente lanciato Persona , il suo sistema proprietario di acquisizione e montaggio su casco, che ora può essere concesso in licenza da altre società. Persona dispone di tutta la tecnologia, come l'illuminazione a infrarossi integrata, per consentire agli altri di fare questo lavoro da soli.
Come ha sottolineato lo scrittore di fantascienza William Gibson: il futuro è qui, non è ancora distribuito in modo molto uniforme. Ma man mano che i componenti diventano più economici e la tecnologia continua ad avanzare, dovremmo aspettarci che cambi. Probabilmente più veloce di quanto ci aspettiamo.
Attraversando la valle misteriosa
Nel 1970, il professore giapponese di robotica Masahiro Mori fece l'osservazione che ora chiamiamo "valle misteriosa". È l'idea che, mentre costruiamo robot o sviluppiamo animazioni al computer 3D che assomigliano molto agli umani, una leggera divergenza rispetto al la cosa reale può causare sentimenti di inquietudine o persino repulsione negli spettatori. C'è una buona ragione per questo. Gran parte del nostro cervello è dedicato alla codifica dei volti. I bambini di tre mesi imparano a classificare i volti, molto prima che possano distinguere tra altre categorie di oggetti. Di conseguenza, una faccia che non assomiglia molto a una faccia ci innervosisce più di una foglia generata dal computer che non sembra del tutto accurata.
Il lavoro incredibilmente realistico di Cubic Motion significa che ha colmato questo straordinario effetto valle? Il legno è ottimista, ma non è ancora pronto a proclamare la vittoria. "Se siamo effettivamente arrivati dall'altra parte della misteriosa valle, spetta al pubblico decidere", ha detto.
Parafrasare una linea (forse apocrifa) del saggista americano Ralph Waldo Emerson, attraversare la valle misteriosa è più un viaggio che una destinazione. Come l'obiettivo dei ricercatori dell'intelligenza artificiale di replicare "l'intelligenza" in un computer, la creazione di un essere umano digitale totalmente realistico è un punto di riferimento impegnativo e non obiettivo da raggiungere. "Qualunque cosa che consideriamo digitalmente reale ora, probabilmente guarderemo indietro con occhi diversi tra qualche anno e saremo in grado di individuare le cose su cui possiamo migliorare", ha spiegato Wood. “Se torni a film come Jason e gli Argonauti o King Kong , quando la gente li ha vissuti per la prima volta sembravano abbastanza credibili. La gente se ne andò pensando che gli effetti speciali fossero notevoli. "
Nonostante tutto il fascino dell'animazione in stop-motion, nessuno di questi effetti oggi sembra del tutto convincente. Né, potremmo obiettare, fare molti dei metodi fotografici che abbiamo per registrare le somiglianze umane. Il ritratto in bianco e nero ammorbidito di un attore in un film degli anni '40, con tutti i difetti caratteristici della celluloide, sembra positivamente astratto accanto all'inesorabile HD di una moderna trasmissione televisiva. E un HD moderno, per quanto folle, sembrerà un giorno anche datato; molto probabilmente di fronte all'intrattenimento completamente tridimensionale.
"Ma il viaggio è così avanzato ora che è molto ovvio che ci arriverà", ha detto Wood. E quando lo facciamo, Cubic Motion spera moltissimo di essere sul traguardo. Presumibilmente con i nostri doppelgängers umani digitalizzati che incoraggiano.