Fotorealistico A.I. lo strumento può riempire gli spazi vuoti nelle immagini, compresi i volti

16 Luglio 2019

Immagine a reticolo per immagini a retino netto 2019 07 16 at 05 19 53

Devi solo andare a vedere l'ultimo film di Hollywood o raccogliere un nuovo titolo di gioco AAA per ricordare che la grafica computerizzata può essere utilizzata per creare delle immagini abbaglianti ultraterrene quando richiesto. Ma alcuni degli esempi più impressionanti di immagini generate dalla macchina non sono necessariamente paesaggi alieni o mostri giganti, sono modifiche delle immagini che nemmeno notiamo .

Questo è il caso di una nuova dimostrazione AI creata da scienziati informatici in Cina. Una collaborazione tra l'Università Sun Yat-sen di Guangzhou e il laboratorio di ricerca Microsoft di Pechino, hanno sviluppato un'intelligenza artificiale intelligente che può essere utilizzata per riempire con precisione aree vuote in un'immagine: se si tratta di un volto mancante o di un edificio.

Chiamata reintegrazione, la tecnica utilizza la tecnologia di deep learning per riempire questi spazi copiando le patch di immagini sul resto dell'immagine o generando nuove aree che appaiono in modo convincente. Lo strumento, a cui fanno riferimento i suoi creatori come PEN-Net (Network Encoder a contesto piramidale), esegue il ripristino dell'immagine "codificando la semantica contestuale da input a piena risoluzione e decodificando le caratteristiche semantiche apprese nelle immagini." L'attenzione risultante Le immagini della rete di trasferimento (ATN) non sono solo straordinariamente realistiche, ma lo strumento è anche molto rapido da apprendere.

"[In questo lavoro, abbiamo proposto] un profondo modello generativo per i compiti di immagine di alta qualità," Yanhong Zeng , uno dei principali autori del progetto, che è associato con la Scuola di dati e informatica della Sun Yat-sen University Laboratorio di Machine Intelligence e Advanced Computing, ha dichiarato a Digital Trends. "Il nostro modello colma le regioni mancanti da profonde a superficiali a tutti i livelli, sulla base di un meccanismo di attenzione a strati incrociati, in modo che sia la struttura che la coerenza della trama possano essere garantite nei risultati di verniciatura. Siamo entusiasti di vedere che il nostro modello è in grado di generare trame più chiare e strutture più ragionevoli rispetto ai lavori precedenti. "

Come nota Zeng, questa non è la prima volta che i ricercatori hanno sviluppato strumenti per eseguire la pittura. Tuttavia, il sistema PEN-Net del team dimostra risultati impressionanti accanto al metodo classico PatchMatch e anche ad altri approcci allo stato dell'arte.

"La pittura di immagini ha una vasta gamma di applicazioni nella nostra vita quotidiana", ha continuato Zeng. "Ora stiamo pianificando di applicare la nostra tecnologia all'editing delle immagini, in particolare per la rimozione di oggetti e il restauro di vecchie foto".

Un documento che descrive il lavoro, intitolato "Learning Encoder Pyramid-Context Network for Imagefighting Image di alta qualità", è disponibile per la lettura sul repository di carta preprint Arxiv .