Nvidia annuncia Blackwell, la nuova architettura per l’IA generativa

da | 19 Mar 2024 | IA, Tecnologia

Tempo di lettura: 2 minuti

Nvidia, leader indiscusso nel settore dei chip per l’intelligenza artificiale, poche ore fa ha svelato il suo nuovo fiore all’occhiello nel campo dei chip dedicati all’IA generativa, il B200, e il “superchip” GB200.

Durante la conferenza annuale per sviluppatori, tenutasi in un’arena di hockey nel cuore della Silicon Valley. Jensen Huang, CEO di Nvidia, ha fatto una serie di annunci mirati a mantenere l’azienda in una posizione dominante nell’industria dell’intelligenza artificiale. Tra le novità presentate, il B200 spicca per essere 30 volte più veloce in alcuni compiti rispetto al suo predecessore, benché Huang non abbia fornito dettagli specifici sul prezzo del chip.

Parallelamente, Nvidia ha introdotto NIM (Nvidia Inference Microservice), un software pensato per incentivareo la scelta dei suoi chip in un mercato altamente competitivo. Questo passaggio segna la trasformazione di Nvidia da semplice produttore di chip a fornitore di piattaforme integrate, permettendo alle aziende di creare soluzioni software su misura.

Huang ha sottolinea questo cambiamento strategico, evidenziando il nuovo focus sul software come elemento centrale dell’offerta commerciale. Manuvir Das, VP Enterprise di Nvidia, ha invece dichiarato a CNBC che NIM, complementare alle GPU, arricchisce l’offerta e facilita l’uso dei modelli precedenti delle GPU Nvidia.

L’introduzione di NIM mira a rendere più accessibile l’adozione di tecnologie avanzate, offrendo un significativo valore aggiunto e permettendo un risparmio sui costi di aggiornamento hardware. Questa mossa strategica incoraggia anche l’iscrizione al programma Nvidia Enterprise, con una licenza che ha un costo di 4.500 dollari per GPU all’anno.

Il nuovo B200 offre fino a 20 petaflops di potenza di calcolo grazie ai suoi 208 miliardi di transistor. Il GB200, che combina due di queste GPU con un singolo CPU Grace, promette di offrire 30 volte la performance per carichi di lavoro di inferenza LLM, con una riduzione dei costi e del consumo energetico fino a 25 volte rispetto all’H100.

La nuova architettura Blackwell non solo accelera significativamente le prestazioni ma introduce anche miglioramenti chiave come un motore trasformatore di seconda generazione che raddoppia il calcolo, la larghezza di banda e la dimensione dei modelli di IA. Un altro avanzamento tecnologico è rappresentato dal nuovo commutatore NVLink di prossima generazione, che permette a 576 GPU di comunicare tra loro con una larghezza di banda bidirezionale di 1,8 terabyte al secondo.

Nvidia sta inoltre spingendo per l’adozione di queste tecnologie su larga scala, proponendo soluzioni come il rack GB200 NVL72 raffreddato a liquido, che integra 36 CPU e 72 GPU per un totale di 720 petaflops di performance di addestramento AI. Queste innovazioni posizionano Nvidia in modo unico per rispondere alle esigenze delle aziende di cloud computing come Amazon, Google, Microsoft e Oracle, che stanno già pianificando di offrire i rack NVL72 nei loro servizi cloud.

Nonostante l’entusiasmo per queste innovazioni, l’annuncio non ha fornito nuovo slancio a Nvidia in borsa, le cui azioni sono cresciute del 240% negli ultimi 12 mesi. Il titolo ha registrato un calo dell’1,4% nelle contrattazioni after-hours, un segnale che forse gli investitori si aspettavano annunci ancora più rivoluzionari.

Tuttavia, con le sue recenti innovazioni nel campo dei chip IA e delle infrastrutture di rete, Nvidia sembra ben posizionata per mantenere e potenzialmente espandere il suo dominio nel settore.

 

POTREBBE INTERESSARTI

Border Security Expo
• ⏱ 5 min

Negli USA c’è una fiera per la tecnologia anti-migranti

Al Border Security Expo di Phoenix, aziende e agenzie federali trattano droni, simulatori, telecamere e software per trasformare il contrasto all’immigrazione...
Sundar Pichai. Foto: Sanjay Rawat
, , • ⏱ 3 min

Soci e rivali: Google e SpaceX trattano per i data center in orbita

Google è azionista di SpaceX da anni. Ora le due aziende potrebbero diventare partner sui lanci (e concorrenti nello spazio).

Trump USA Xi Jinping Cina
, , • ⏱ 4 min

Trump e Xi parlano di IA, ma il dialogo resta difficile

A Pechino l’intelligenza artificiale entra per la prima volta nell’agenda bilaterale USA-Cina. Le aspettative però sono basse: troppa rivalità, troppa...
sam altman reuters
, • ⏱ 4 min

Altman in aula: “Musk voleva il 90% di OpenAI”

Il CEO di OpenAI testimonia su donazioni, equity e metodi manageriali che “hanno devastato la cultura” del laboratorio.

amazon logo
• ⏱ 3 min

I dipendenti Amazon usano l’IA anche quando non serve, per sembrare efficienti

Con 200 miliardi di investimenti da giustificare, Amazon vuole dati sull’utilizzo. E i suoi dipendenti glieli danno (ma non nel modo atteso).

nadella sutskever altman
, • ⏱ 3 min

Musk vs. Altman: le testimonianze di Nadella e Sutskever

Il CEO di Microsoft definisce “roba da dilettanti” il tentativo di rimozione del 2023; l’ex chief scientist di OpenAI conferma che Altman sabotava i...
nhs england palantir
• ⏱ 3 min

La sanità britannica concede a Palantir “accesso illimitato” ai dati dei pazienti

Un documento interno riservato rivela che l’NHS ha aperto l’accesso ai dati identificativi dei pazienti a contractor privati, tra cui Palantir. Perché...
OpenAI
, • ⏱ 2 min

OpenAI vuole ingegneri nelle aziende: nasce la Deployment Company

L’acquisizione di Tomoro porta 150 specialisti pronti al lavoro. Sullo sfondo, la corsa con Anthropic per conquistare il mercato enterprise.

lavoratori cina
• ⏱ 2 min

In Cina non si licenzia più per colpa dell’IA

Un tribunale di Hangzhou stabilisce che l’automazione non è una causa legale di licenziamento. E le imprese devono fare i conti con una giurisprudenza in...
pannelli solari cina
• ⏱ 3 min

Pechino lancia il piano per l’energia verde nei data centre IA: 29 misure entro il 2030

Il governo cinese vara un piano coordinato tra quattro ministeri per allineare l’espansione dell’IA agli obiettivi climatici. Ma i numeri raccontano una...
Share This