Nvidia annuncia Blackwell, la nuova architettura per l’IA generativa

da | 19 Mar 2024 | IA, Tecnologia

Nvidia, leader indiscusso nel settore dei chip per l’intelligenza artificiale, poche ore fa ha svelato il suo nuovo fiore all’occhiello nel campo dei chip dedicati all’IA generativa, il B200, e il “superchip” GB200.

Durante la conferenza annuale per sviluppatori, tenutasi in un’arena di hockey nel cuore della Silicon Valley. Jensen Huang, CEO di Nvidia, ha fatto una serie di annunci mirati a mantenere l’azienda in una posizione dominante nell’industria dell’intelligenza artificiale. Tra le novità presentate, il B200 spicca per essere 30 volte più veloce in alcuni compiti rispetto al suo predecessore, benché Huang non abbia fornito dettagli specifici sul prezzo del chip.

Parallelamente, Nvidia ha introdotto NIM (Nvidia Inference Microservice), un software pensato per incentivareo la scelta dei suoi chip in un mercato altamente competitivo. Questo passaggio segna la trasformazione di Nvidia da semplice produttore di chip a fornitore di piattaforme integrate, permettendo alle aziende di creare soluzioni software su misura.

Huang ha sottolinea questo cambiamento strategico, evidenziando il nuovo focus sul software come elemento centrale dell’offerta commerciale. Manuvir Das, VP Enterprise di Nvidia, ha invece dichiarato a CNBC che NIM, complementare alle GPU, arricchisce l’offerta e facilita l’uso dei modelli precedenti delle GPU Nvidia.

L’introduzione di NIM mira a rendere più accessibile l’adozione di tecnologie avanzate, offrendo un significativo valore aggiunto e permettendo un risparmio sui costi di aggiornamento hardware. Questa mossa strategica incoraggia anche l’iscrizione al programma Nvidia Enterprise, con una licenza che ha un costo di 4.500 dollari per GPU all’anno.

Il nuovo B200 offre fino a 20 petaflops di potenza di calcolo grazie ai suoi 208 miliardi di transistor. Il GB200, che combina due di queste GPU con un singolo CPU Grace, promette di offrire 30 volte la performance per carichi di lavoro di inferenza LLM, con una riduzione dei costi e del consumo energetico fino a 25 volte rispetto all’H100.

La nuova architettura Blackwell non solo accelera significativamente le prestazioni ma introduce anche miglioramenti chiave come un motore trasformatore di seconda generazione che raddoppia il calcolo, la larghezza di banda e la dimensione dei modelli di IA. Un altro avanzamento tecnologico è rappresentato dal nuovo commutatore NVLink di prossima generazione, che permette a 576 GPU di comunicare tra loro con una larghezza di banda bidirezionale di 1,8 terabyte al secondo.

Nvidia sta inoltre spingendo per l’adozione di queste tecnologie su larga scala, proponendo soluzioni come il rack GB200 NVL72 raffreddato a liquido, che integra 36 CPU e 72 GPU per un totale di 720 petaflops di performance di addestramento AI. Queste innovazioni posizionano Nvidia in modo unico per rispondere alle esigenze delle aziende di cloud computing come Amazon, Google, Microsoft e Oracle, che stanno già pianificando di offrire i rack NVL72 nei loro servizi cloud.

Nonostante l’entusiasmo per queste innovazioni, l’annuncio non ha fornito nuovo slancio a Nvidia in borsa, le cui azioni sono cresciute del 240% negli ultimi 12 mesi. Il titolo ha registrato un calo dell’1,4% nelle contrattazioni after-hours, un segnale che forse gli investitori si aspettavano annunci ancora più rivoluzionari.

Tuttavia, con le sue recenti innovazioni nel campo dei chip IA e delle infrastrutture di rete, Nvidia sembra ben posizionata per mantenere e potenzialmente espandere il suo dominio nel settore.

 

POTREBBE INTERESSARTI

Brad Smith, presidente di Microsoft

Microsoft promette: i nostri data center non peseranno sulle bollette degli americani

L’azienda si impegna a non chiedere sgravi fiscali e a formare i residenti. Brad Smith: “Non chiediamo ai contribuenti di sovvenzionarci”.

Matthew McConaughey

McConaughey registra sé stesso come marchio contro i deepfake

Otto trademark approvati negli USA trasformano l’immagine dell’attore in un asset legale. Nel vuoto normativo sui deepfake, Hollywood ricorre...
Google AI Overviews

Google rimuove le AI Overviews per alcune ricerche mediche

Un’indagine del Guardian documenta errori potenzialmente letali nei riassunti sanitari del motore di ricerca. Il tempismo col lancio di ChatGPT Health solleva...
Google agente

Google entra nello shopping con gli agenti IA per i retailer

Con Gemini Enterprise for Customer Experience, Big G offre strumenti per costruire assistenti virtuali proprietari. Ma il commercio agentico è davvero dietro...
Apple Intelligence Siri

Siri parlerà con la voce di Gemini: Apple sceglie Google per l’IA

Annunciata ieri una partnership che riscrive gli equilibri del mercato. E anche una svolta storica che solleva domande sul futuro della privacy di Cupertino.

Giancarlo Calzetta Security Info

Giancarlo Calzetta: “La cyberguerra non è il futuro, è già qui”

Hacker di Stato, agenti AI, infrastrutture fragili: il direttore di Security Info racconta la cyberguerra in corso che nessuno vuole vedere.

Nvidia CES 2026 Jensen Huag

Al CES 2026 la Silicon Valley ha scelto Trump

La Genesis Mission, Nvidia e il nuovo asse Washington-Silicon Valley: al Consumer Electronics Show è andata in scena la fine della neutralità tech.

Harry Potter e la Pietra Filosofale

I ricercatori sono riusciti a estrarre Harry Potter (quasi per intero) dai principali LLM

Una ricerca di Stanford dimostra che Claude, GPT-4.1, Gemini e Grok hanno memorizzato interi libri protetti da copyright. E possono riprodurli quasi parola per...
Grok

Grok, la risposta di Musk ai deepfake è farli pagare

Dall’Indonesia al Regno Unito, i governi reagiscono ai deepfake di Grok. Musk attacca gli inglesi: “Fascisti”. Ma intanto le immagini abusive...
Meta reattore nucleare

Meta sigla accordi con tre società nucleari per oltre 6 GW di potenza

Dietro gli algoritmi dell’IA si nasconde una fame energetica senza precedenti che sta riabilitando il nucleare negli Stati Uniti.

Share This