Davanti a una platea di oltre trentamila persone al SAP Center di San Jose, Jensen Huang ha annunciato ieri quello che ha definito l’inizio di una nuova era per l’intelligenza artificiale.
Il risultato è che Nvidia si aspetta ricavi da chip per IA pari ad almeno mille miliardi di dollari entro la fine del 2027. Una cifra che aggiorna la precedente previsione di 500 miliardi entro fine 2026, raddoppiando l’obiettivo in un colpo solo. “Sono certo che la domanda si rivelerà ancora più alta”, ha detto Huang.
Il mercato ha risposto freddamente. Le azioni Nvidia hanno guadagnato brevemente più del 2% durante il discorso, per poi cedere terreno e chiudere la giornata sotto i livelli precedenti alla presentazione.
Non è la prima volta che le previsioni di Huang faticano a entusiasmare Wall Street: da mesi gli investitori sono più attenti ai ritorni concreti degli enormi investimenti in infrastrutture IA che alle proiezioni di lungo periodo.
Alle preoccupazioni sui rendimenti si aggiungono due variabili strutturali: le tensioni in Medio Oriente, che minacciano la catena di approvvigionamento dei semiconduttori, e la carenza di chip di memoria su cui i prodotti Nvidia fanno affidamento.
Il divario con le stime degli analisti è rilevante. L’anno fiscale di Nvidia non coincide con l’anno solare, in quanto il suo esercizio termina a fine gennaio. Sommando le stime aggregate degli analisti per i prossimi due anni fiscali, fino a gennaio 2028, si arriva a circa 835 miliardi di dollari di ricavi totali.
Huang invece parla di mille miliardi entro fine 2027 riferendosi ai soli chip per IA. Non sta insomma aggiornando una stima: sta proponendo una narrativa.
Nvidia e l’era dell’inferenza
Al centro del keynote c’è una svolta strategica precisa. Per anni Nvidia ha dominato il mercato vendendo GPU, ossia le unità di elaborazione grafica usate per addestrare i grandi modelli di IA.
Ma nell’ultimo anno qualcosa è cambiato: le aziende che sviluppano IA vogliono sempre più monetizzare i propri modelli, e con questo sono arrivate richieste di chip ottimizzati non più per il training ma per l’inferenza, ovvero la fase in cui il modello elabora una domanda e genera una risposta.
Le GPU tradizionali non sono ideali per questo compito: consumano troppa energia e non dispongono di memoria sufficiente per accedere rapidamente ai dati su cui i modelli sono stati addestrati. “L’inflection point dell’inferenza è arrivato”, ha detto Huang. “Questo è il futuro dell’IA. È lì che l’IA vuole andare.”
La domanda di inferenza è già concreta. Huang ha citato Claude Code di Anthropic come esempio di strumento che sta trainando la richiesta di potenza di calcolo, un segnale che l’inferenza non è più una questione teorica ma un mercato in crescita.
Il nuovo rack e l’accordo con Groq
La risposta hardware di Nvidia si chiama Groq 3 LPX, un sistema server che combina 72 server di nuova generazione Vera Rubin con 256 unità di un nuovo tipo di chip, l’LPU (Language Processing Unit), sviluppato da Groq.
Nvidia ha acquisito l’intero team di vertice della startup a dicembre, nell’ambito di un accordo da 20 miliardi di dollari in licenze tecnologiche. Il fondatore di Groq, Jonathan Ross, che in precedenza aveva contribuito a sviluppare il chip per IA di Google, è ora parte di Nvidia.
Le prestazioni dichiarate sono notevoli: il nuovo sistema sarebbe in grado di generare 700 milioni di token al secondo, una velocità 350 volte superiore rispetto alla generazione Hopper, fino a poco fa il punto di riferimento di Nvidia.
Il collo di bottiglia della memoria viene affrontato direttamente: il rack Groq 3 LPX dispone di 500 volte più memoria ad alta larghezza di banda rispetto a Hopper. “Questo è il segreto”, ha detto Huang. La produzione è già avviata; le spedizioni sono previste nel terzo trimestre del 2026.
La mossa segnala qualcosa di più ampio: Nvidia sta abbandonando il modello del chip unico (la GPU per tutto), per costruire un’architettura differenziata, con prodotti specifici per carichi di lavoro specifici. È un cambio di paradigma per un’azienda che ha costruito la sua fortuna su un solo tipo di chip.
Ecosistema, partnership e il robot di Disneyland
Huang non si è limitato all’hardware. Al GTC ha annunciato una coalizione di aziende software (tra cui Cursor, Mistral e Perplexity), con l’obiettivo di accelerare lo sviluppo di modelli di IA open source di frontiera.
La visione dichiarata è trasformare l’industria del software aziendale in un settore basato su agenti IA autonomi. Nscale, startup britannica di cloud computing sostenuta da Nvidia, ha annunciato parallelamente la costruzione di un cluster di data center da 1,35 gigawatt in West Virginia, basato sui nuovi server Vera Rubin.
Sul fronte della guida autonoma, Nvidia ha aggiunto quattro nuovi partner al suo sistema per robotaxi: BYD, Geely Auto, Hyundai e Nissan. Verso la fine della presentazione, un robot a forma di Olaf, il pupazzo di neve di Frozen, sviluppato in collaborazione con DeepMind e Disney, è salito sul palco e ha scambiato qualche battuta con Huang sulla divisione Omniverse di Nvidia, che sviluppa prodotti di IA fisica per applicazioni robotiche.
L’immagine è volutamente spettacolare. Ma il messaggio sottostante è industriale: Nvidia non vuole essere solo il fornitore di chip. Vuole essere l’infrastruttura dell’intera economia dell’IA, dall’hardware ai server, dal software agli agenti, dalle auto autonome ai robot.
Fonti: Financial Times, Wall Street Journal


