Nvidia RTX 4080: cosa abbiamo imparato da GTC 2022

Il CEO di Nvidia Jensen Huang ha appena concluso il suo primo keynote GTC del 2022 e, durante questo, il dirigente ha annunciato l’architettura Hopper di nuova generazione di Nvidia. Viene lanciata nell’H100, una potente GPU limitata all’uso del data center, ma l’annuncio contiene anche alcuni suggerimenti per l’ RTX 4080 e le schede grafiche consumer di nuova generazione di Nvidia.

Nvidia non ha parlato dell’RTX 4080 al GTC e non utilizzerà l’architettura Hopper, almeno in base alle voci. Un paio di anni fa, prima del lancio delle schede grafiche della serie RTX 30, le voci suggerivano che Nvidia avrebbe utilizzato l’architettura Hopper per le sue schede grafiche della serie RTX 40. Ora, sembra che Nvidia rilascerà due generazioni nel 2022: Hopper per il data center e Ada Lovelace per i consumatori. Ma questo non significa che non possiamo raccogliere informazioni dagli annunci.

Architetture doppie

Due schede grafiche sovrapposte.

Questa è solo la seconda volta che Nvidia divide i suoi prodotti consumer e data center. Tra Pascal e Turing, Nvidia ha introdotto l’architettura Volta per i data center. È stato un po’ un rimpiazzo, consentendo a Nvidia di passare a un piccolo processo di produzione dei suoi prodotti per data center in preparazione per la prossima generazione di prodotti di consumo.

Ciò è cambiato con la serie RTX 30, dove Nvidia ha unificato entrambe le sue gamme di prodotti sotto l’architettura Ampere. Tutto questo per dire che non ci sono molti precedenti per ciò che Nvidia sta facendo qui. Questa è la prima volta che vediamo davvero due architetture di Nvidia dal vivo fianco a fianco.

Per Hopper, abbiamo appreso che utilizzerà il processo di produzione N4 di TSMC e che Nvidia punta all’efficienza. La cosa interessante è che si dice che Nvidia utilizzi il processo N5 di TSMC per il 4080, non il processo più piccolo ed efficiente utilizzato dalle GPU Hopper.

N5 e N4 vivono nella stessa famiglia, ma N4 è leggermente più efficiente di N5. Sulla base delle voci che abbiamo visto sugli enormi requisiti di alimentazione per le schede grafiche della serie RTX 40, l’N5 sembra più probabile per la fascia consumer. Ciò si basa sul suggerimento dei leaker secondo cui l’RTX 4080 avrà grossi problemi di efficienza .

Nvidia RTX 2080 Super in un PC da gioco.

Potremmo assistere a una ripetizione della situazione Pascal/Volta/Turing. Nvidia sembra essere in testa con Hopper, caratterizzato da un’architettura più efficiente, al fine di configurare la generazione dopo l’RTX 4080. È possibile che a quel punto si passi a un processo più piccolo, ma sembra che le schede consumer siano ancora in ritardo rispetto ai dati quelli centrali.

Il processo di produzione è lo sviluppo più grande, ma Hopper contiene anche un paio di altri indizi.

Interconnessione NVLink

Scheda grafica Hopper H100.

Nvidia si è concentrata sulla scalabilità con la quarta generazione di NVLink. Questa è un’interconnessione rilevante solo oggi nel data center di Nvidia, ma Huang ha annunciato che arriverà a clienti e partner.

Con l’apertura di NVLink, Nvidia afferma che l’obiettivo è fare in modo che altre aziende progettino chip semi-personalizzati che funzionino con i prodotti Nvidia. Questo potrebbe essere rilevante per le prossime schede grafiche consumer di Nvidia. Le voci suggeriscono che AMD stia adottando un design a modulo multichip (MCM) per le schede grafiche RX 7000 , combinando essenzialmente più cluster di calcolo separati su un singolo chip.

L’apertura di NVLink potrebbe gettare le basi per Nvidia per fare qualcosa di simile. Le voci suggeriscono che AMD, per la prima volta, supererà Nvidia con le sue schede grafiche RX 7000, e ciò potrebbe essere dovuto al design MCM. Non è chiaro se l’RTX 4080 utilizzerà un design MCM, ma il lancio di Hopper suggerisce che non lo farà.

L’ultimo suggerimento viene dall’H100 CNX, che è una versione della GPU H100 accoppiata con un Nvidia ConnectX-7 SmartNIC. Questo serve a ridurre la latenza e migliorare il throughput della GPU, eliminando i colli di bottiglia della CPU nei server.

Questo non è rilevante per una GPU desktop, ma potremmo vedere un approccio simile con l’RTX 4080. Nvidia e IBM hanno collaborato per migliorare la larghezza di banda della memoria e il throughput collegando un SSD direttamente alla GPU. Abbiamo ipotizzato che si trattasse di una tecnologia lontana, ma GTC suggerisce che potrebbe apparire prima piuttosto che dopo.

In definitiva, tuttavia, l’RTX 4080 è ancora un grande punto interrogativo. Abbiamo fughe di notizie su prestazioni ed efficienza, oltre ad alcuni suggerimenti da Hopper, ma dovremo aspettare fino al lancio della carta per sapere tutto al riguardo. Attualmente si dice che verrà lanciato questo autunno, anche se Nvidia non ha confermato quella sequenza temporale.