Non fermandosi alla “Grand Graphics Card”, NVIDIA ha rilasciato il modello Perfusion “Vincent graph” per apprendere nuove tecnologie

Le schede grafiche NVIDIA sono vendute così tanto che è quasi trascurato che è anche un gigante dell’IA generativa.

Di recente, l’ultimo documento pubblicato da NVIDIA ha rivelato una tecnologia di apprendimento personalizzata chiamata modello “Vincent graph” di Perfusion.

Secondo il sito ufficiale, la tecnologia Perfusion è stata sviluppata congiuntamente da NVIDIA e dall’Università di Tel Aviv in Israele. La tecnologia di perfusione offre la libertà di creare oggetti più personalizzati, ottenere risultati più vividi, avere una migliore corrispondenza di cue e sono meno sensibili alle caratteristiche di sfondo dell’immagine originale.

Aaron Lefohn, vicepresidente della ricerca grafica di NVIDIA, una volta descrisse la tecnologia Perfusion come “una tecnologia estremamente compatta… che consente agli utenti di combinare più elementi personalizzati, come orsacchiotti e teiere specifici, in un’unica immagine generata dall’intelligenza artificiale”.

Tra questi, NVIDIA utilizza un nuovo meccanismo chiamato “key lock”.

La spiegazione popolare è che divide il meccanismo di attenzione nel modello di generazione dell’immagine in due parti: la parte della posizione e la parte del contenuto. La parte della posizione determina quale oggetto disegnare e la parte del contenuto determina lo stile di aspetto dell’oggetto.

Il “meccanismo chiave” fissa la parte di posizione e impedisce all’oggetto di cambiare arbitrariamente.Ad esempio, la posizione di un orsacchiotto specifico è coerente con tutti gli orsacchiotti modificati. Allo stesso tempo, la parte del contenuto consente all’aspetto dell’oggetto di cambiare liberamente, come cambiare dal nulla l’abito dell’orsacchiotto.

Inoltre, la tecnologia Perfusion può scegliere di controllare il grado di cambiamento dell’oggetto nel processo del diagramma di Vincent, che può essere più simile all’oggetto originale o più in linea con la descrizione dell’utente. Diversi oggetti generati da documenti storici possono anche essere combinati nella stessa immagine.

Grazie alla natura avanzata del meccanismo di “key lock”, il funzionario afferma che la qualità dell’immagine generata dalla tecnologia Perfusion è paragonabile a quella della versione Stability Diffusion v1.5.

Tuttavia, la tecnologia Perfusion è più personalizzata, con la capacità di imparare rapidamente a gestire nuovi concetti senza riaddestrare l’intero modello, che non è disponibile in Stability Diffusion.

Inoltre, la tecnologia Perfusion offre un maggiore controllo, che può facilmente bilanciare la qualità visiva e il controllo semantico e può combinare più concetti nuovi (come avere il modello che genera contemporaneamente un orsacchiotto specifico e una teiera specifica).

In generale, la tecnologia di perfusione innova principalmente nell’apprendimento e nel controllo personalizzati, rendendo la generazione del sistema del diagramma di Vincent più facile da personalizzare.

Ciò che molte persone potrebbero non sapere è che la discreta NVIDIA ha effettivamente ottenuto molti risultati nel campo dell’IA generativa e ha apportato contributi pionieristici a molteplici attività generative come la super-risoluzione dell’immagine e la stima della profondità.

Nel maggio di quest’anno, il fondatore di NVIDIA, Jensen Huang, ha coraggiosamente predetto: “L’industria dei computer sta attraversando due trasformazioni simultanee: calcolo accelerato e intelligenza artificiale generativa”. l’infrastruttura verrà aggiornata all’elaborazione accelerata per prodotti, servizi e processi aziendali”.

L’IA generativa addestra reti neurali su larga scala, che richiedono una potenza di calcolo estremamente complessa. La GPU è più versatile, più adatta per il calcolo parallelo su larga scala e il processo di progettazione e produzione è relativamente maturo.Questa è precisamente la zona di comfort per NVIDIA per padroneggiare la “porta della vita” dei grandi modelli di intelligenza artificiale.

In termini di quota di mercato, NVIDIA detiene l’84% del mercato delle GPU. Secondo i dati rilasciati da TrendForce, un’agenzia di ricerche di mercato, se si utilizza la potenza di elaborazione della scheda grafica NVIDIA A100, saranno necessarie 30.000 GPU NVIDIA per eseguire ChatGPT, il che significa che NVIDIA sarà in grado di guadagnare più di 300 milioni di dollari USA .

Tuttavia, l’esclusiva NVIDIA non è solo soddisfatta del “venditore di pentole e acqua d’oro”, ma ha completamente liberato il “talento innato” delle proprie risorse nel campo dello sviluppo della tecnologia del modello generativo.

Nel 2018, i ricercatori NVIDIA hanno preso l’iniziativa di proporre la rete di confronto generativo StyleGAN, che è il primo modello GAN in grado di generare immagini di volti di alta qualità.Un anno dopo, NVIDIA ha rilasciato ufficialmente il primo modello GAN in grado di generare direttamente immagini realistiche. .

Ci sono molti “primati” simili Oggi, la tecnologia Perfusion è uno dei risultati dell’ultima IA generativa di NVIDIA.

Il rilascio della tecnologia Perfusion, da un lato, può continuare a dimostrare le capacità tecniche di NVIDIA nel campo dell’IA generativa e stabilire pienamente la leadership e l’influenza di NVIDIA nel campo dell’IA generativa.Futura integrazione nei prodotti e servizi NVIDIA.

Vale la pena notare che al momento NVIDIA ha pubblicato solo articoli pertinenti sul sito Web ufficiale e che presto verranno lanciate dimostrazioni specifiche del codice.A quel punto, gli utenti avranno scelte più diversificate per i requisiti funzionali dei grafici Vincent.

#Benvenuti a prestare attenzione all’account pubblico WeChat ufficiale di Aifaner: Aifaner (ID WeChat: ifanr), altri contenuti interessanti ti verranno presentati il ​​prima possibile.

Ai Faner | Link originale · Visualizza i commenti · Sina Weibo