Nvidia annuncia Blackwell, la nuova architettura per l’IA generativa

da | 19 Mar 2024 | IA, Tech

Nvidia, leader indiscusso nel settore dei chip per l’intelligenza artificiale, poche ore fa ha svelato il suo nuovo fiore all’occhiello nel campo dei chip dedicati all’IA generativa, il B200, e il “superchip” GB200.

Durante la conferenza annuale per sviluppatori, tenutasi in un’arena di hockey nel cuore della Silicon Valley. Jensen Huang, CEO di Nvidia, ha fatto una serie di annunci mirati a mantenere l’azienda in una posizione dominante nell’industria dell’intelligenza artificiale. Tra le novità presentate, il B200 spicca per essere 30 volte più veloce in alcuni compiti rispetto al suo predecessore, benché Huang non abbia fornito dettagli specifici sul prezzo del chip.

Parallelamente, Nvidia ha introdotto NIM (Nvidia Inference Microservice), un software pensato per incentivareo la scelta dei suoi chip in un mercato altamente competitivo. Questo passaggio segna la trasformazione di Nvidia da semplice produttore di chip a fornitore di piattaforme integrate, permettendo alle aziende di creare soluzioni software su misura.

Huang ha sottolinea questo cambiamento strategico, evidenziando il nuovo focus sul software come elemento centrale dell’offerta commerciale. Manuvir Das, VP Enterprise di Nvidia, ha invece dichiarato a CNBC che NIM, complementare alle GPU, arricchisce l’offerta e facilita l’uso dei modelli precedenti delle GPU Nvidia.

L’introduzione di NIM mira a rendere più accessibile l’adozione di tecnologie avanzate, offrendo un significativo valore aggiunto e permettendo un risparmio sui costi di aggiornamento hardware. Questa mossa strategica incoraggia anche l’iscrizione al programma Nvidia Enterprise, con una licenza che ha un costo di 4.500 dollari per GPU all’anno.

Il nuovo B200 offre fino a 20 petaflops di potenza di calcolo grazie ai suoi 208 miliardi di transistor. Il GB200, che combina due di queste GPU con un singolo CPU Grace, promette di offrire 30 volte la performance per carichi di lavoro di inferenza LLM, con una riduzione dei costi e del consumo energetico fino a 25 volte rispetto all’H100.

La nuova architettura Blackwell non solo accelera significativamente le prestazioni ma introduce anche miglioramenti chiave come un motore trasformatore di seconda generazione che raddoppia il calcolo, la larghezza di banda e la dimensione dei modelli di IA. Un altro avanzamento tecnologico è rappresentato dal nuovo commutatore NVLink di prossima generazione, che permette a 576 GPU di comunicare tra loro con una larghezza di banda bidirezionale di 1,8 terabyte al secondo.

Nvidia sta inoltre spingendo per l’adozione di queste tecnologie su larga scala, proponendo soluzioni come il rack GB200 NVL72 raffreddato a liquido, che integra 36 CPU e 72 GPU per un totale di 720 petaflops di performance di addestramento AI. Queste innovazioni posizionano Nvidia in modo unico per rispondere alle esigenze delle aziende di cloud computing come Amazon, Google, Microsoft e Oracle, che stanno già pianificando di offrire i rack NVL72 nei loro servizi cloud.

Nonostante l’entusiasmo per queste innovazioni, l’annuncio non ha fornito nuovo slancio a Nvidia in borsa, le cui azioni sono cresciute del 240% negli ultimi 12 mesi. Il titolo ha registrato un calo dell’1,4% nelle contrattazioni after-hours, un segnale che forse gli investitori si aspettavano annunci ancora più rivoluzionari.

Tuttavia, con le sue recenti innovazioni nel campo dei chip IA e delle infrastrutture di rete, Nvidia sembra ben posizionata per mantenere e potenzialmente espandere il suo dominio nel settore.

 

POTREBBE INTERESSARTI

Apple rinvierà il lancio di Apple Intelligence nell'UE
,

Apple rinvierà il lancio di Apple Intelligence nell’UE

Il gigante tecnologico indica il Digital Markets Act come la causa di questa decisione.

Netflix scommette sui negozi fisici con le "Netflix Houses"

Netflix scommette sui negozi fisici con le “Netflix Houses”

Dopo Amazon con Whole Foods, un nuovo ritorno al passato di un gigante tech.

TikTok prova a rivoluzionare l'ADV ma inciampa clamorosamente

TikTok prova a rivoluzionare l’ADV ma inciampa clamorosamente

I Symphony Digital Avatars, il nuovo strumento di TikTok per la creazione di contenuti generati dall’IA, finiscono nel mirino dopo che una falla ha consentito la...
Dell, il ritorno in ufficio fallisce

Dell: il ritorno in ufficio fallisce, il 50% dei dipendenti rimane remoto

Dell impone restrizioni sulle promozioni per chi sceglie di lavorare da casa. Ma molti lavoratori preferiscono rimanere in remoto per i benefici personali.

Ecco PillBot, la pillola robotica che rivoluzionerà la gastroenterologia

Ecco PillBot, la pillola robotica che rivoluzionerà la gastroenterologia

Fondata nel 2019, Endiatx lavora per realizzare l’idea di robot miniaturizzati che navigano nel corpo umano per scopi diagnostici e terapeutici. Oggi vi parliamo...
Starlink Mini porta l'internet satellitare dentro gli zaini

Starlink Mini porta l’internet satellitare dentro gli zaini

Starlink Mini pesa un chilo e mezzo di peso, è grande come un laptop, offre velocità superiori ai 100 Mbps e consuma meno dei terminali precedenti.

Ecco come di comporta Claude 3.5 Sonnet rispetto agli altri modelli.

Più veloce e intelligente: ecco Claude 3.5 Sonnet

Claude 3.5 Sonnet è il modello più avanzato di Anthropic, e promette prestazioni superiori a GPT-4 e Gemini

L’antivirus Kaspersky sarà vietato negli USA

L’antivirus Kaspersky sarà vietato negli USA per via dei legami col governo russo

L’antivirus Kaspersky sarà vietato a partire da giovedì negli USA da Biden per via dei legami troppo stretti col governo russo.

Il produttore di chip TSMC vola in borsa

La valutazione di TSMC vola alle stelle trascinata di Nvidia

TSMC si sta avvicinando alla valutazione di mille miliardi di dollari a Wall Street trascinata da Nvdia e dall’esplosione dell’IA.

L'IA non è in grado di prendere ordini da McDonald's

McDonald’s: l’IA non è ancora in grado di prendere gli ordini al drive-in

McDonald’s, la famosa catena di fast food, negli Stati Uniti ha deciso di disabilitare un sistema basato sull’intelligenza artificiale utilizzato nei...
Share This