L’IA è affamata di energia: ecco i nuovi chip pronti a sfidare Nvidia

da | 28 Lug 2025 | IA

Tempo di lettura: 3 minuti

Il futuro dell’IA, la tecnologia che dovrebbe spingere l’umanità verso traguardi inimmaginabili, rischia di incepparsi… per mancanza di corrente.

Secondo il World Economic Forum, il fabbisogno energetico dell’intelligenza artificiale è infatti destinato a crescere del 50% ogni anno fino al 2030. Un tasso esponenziale che, se non gestito, potrebbe rendere economicamente e ambientalmente insostenibile la traiettoria di crescita attuale.

La sfida all’egemonia di Nvidia

Una soluzione al problema potrebbe arrivare da una nuova generazione di microchip, progettati non per l’addestramento dei modelli (che resterà dominio di Nvidia ancora a lungo) ma per l’inferenza, cioè l’elaborazione delle risposte dell’IA a partire dai prompt degli utenti. È qui che si gioca la partita più delicata, ossia quella dell’efficienza.

Cloudflare sta testando i chip della startup Positron, fondata nel 2023, e finora le prestazioni promettono bene. Se i risultati verranno confermati, spiega  Andrew Wee (veterano della Silicon Valley ed esperto in data center), l’azienda è pronta a distribuirli su larga scala.

La scommessa è semplice: offrire un’alternativa concreta a Nvidia, la cui architettura oggi domina il mercato ma impone un “prezzo da monopolista” (il Wall Street Journal parla di “tassa Nvidia”) e richiede una quantità enorme di energia.

Positron però non è sola. Anche Groq (con la ‘q’), fondata da un ex responsabile del programma chip IA di Google, promette inferenze a una velocità superiore e con consumi ridotti fino a sei volte rispetto agli standard Nvidia. Il segreto? Un’architettura completamente ripensata, che integra la memoria direttamente all’interno del chip invece di mantenerla separata.

Una scelta che consente di velocizzare drasticamente l’elaborazione e ridurre i colli di bottiglia energetici. L’obiettivo dichiarato è quello di offrire una soluzione su misura per l’IA generativa contemporanea, senza compromessi ereditati da architetture nate per altri scopi.

Vera Rubin vs Positron: la sfida del watt

Nvidia, naturalmente, non resta a guardare. I suoi nuovi sistemi Blackwell promettono miglioramenti fino a 30 volte in termini di efficienza per watt rispetto alla generazione precedente. Ma la vera sfida si giocherà con la prossima generazione, già annunciata sulla roadmap ufficiale e battezzata “Vera Rubin”. Ed è proprio con questa linea futura che Positron intende competere.

Secondo l’azienda, i suoi chip di nuova generazione avranno da due a tre volte migliori prestazioni per dollaro rispetto a Vera Rubin, e da tre a sei volte migliori prestazioni per ogni watt di energia consumato. Una promessa ambiziosa, che Cloudflare sta prendendo sul serio: oltre a test approfonditi già in corso, l’azienda si dice pronta a distribuire i chip Positron su scala globale se le performance dichiarate saranno confermate.

Dal punto di vista di Nvidia, però, non è solo questione di efficienza o potenza bruta. La flessibilità, la compatibilità con modelli emergenti e la capacità di adattarsi a casi d’uso in continua evoluzione, restano fattori decisivi. «I nostri clienti non si lasciano facilmente sedurre da soluzioni troppo di nicchia», ricorda un dirigente dell’azienda.

Il collo di bottiglia dell’IA è l’energia, non i chip

Wee è convinto che la concorrenza, spingendo verso la standardizzazione dell’hardware IA e offrendo alternative più efficienti a Nvidia, potrebbe contribuire a frenare l’impennata nel consumo energetico dell’IA. “C’è troppa corsa all’oro in questo momento ma prima o poi la ragione si riapproprierà della realtà”, ha dichiarato.

C’è però una costante nella storia dell’informatica: ogni volta che gli ingegneri riescono a ottenere maggiore efficienza, gli sviluppatori (e i consumatori) trovano sempre il modo di sfruttarla tutta. E anche di più.

Secondo Mark Lohmeyer, vicepresidente di Google Cloud per l’infrastruttura IA, la rapida adozione di modelli IA sempre più esigenti da parte di consumatori e imprese implica che, anche migliorando l’efficienza, la domanda non smetterà mai di crescere.

Come altri big dell’IA, anche Google sta esplorando soluzioni energetiche radicalmente nuove, tra cui la fusione nucleare, per alimentare i propri modelli.

Sebbene i nuovi chip possano aiutare le singole aziende a rendere l’IA più efficiente, l’industria nel suo complesso continua dunque a muoversi verso un consumo crescente di energia. E come ha sottolineato un recente report di Anthropic, il vero collo di bottiglia dello sviluppo dell’IA potrebbe non essere l’hardware ma la produzione di energia.

POTREBBE INTERESSARTI

Sundar Pichai. Foto: Sanjay Rawat
, , • ⏱ 3 min

Soci e rivali: Google e SpaceX trattano per i data center in orbita

Google è azionista di SpaceX da anni. Ora le due aziende potrebbero diventare partner sui lanci (e concorrenti nello spazio).

Trump USA Xi Jinping Cina
, , • ⏱ 4 min

Trump e Xi parlano di IA, ma il dialogo resta difficile

A Pechino l’intelligenza artificiale entra per la prima volta nell’agenda bilaterale USA-Cina. Le aspettative però sono basse: troppa rivalità, troppa...
sam altman reuters
, • ⏱ 4 min

Altman in aula: “Musk voleva il 90% di OpenAI”

Il CEO di OpenAI testimonia su donazioni, equity e metodi manageriali che “hanno devastato la cultura” del laboratorio.

amazon logo
• ⏱ 3 min

I dipendenti Amazon usano l’IA anche quando non serve, per sembrare efficienti

Con 200 miliardi di investimenti da giustificare, Amazon vuole dati sull’utilizzo. E i suoi dipendenti glieli danno (ma non nel modo atteso).

nadella sutskever altman
, • ⏱ 3 min

Musk vs. Altman: le testimonianze di Nadella e Sutskever

Il CEO di Microsoft definisce “roba da dilettanti” il tentativo di rimozione del 2023; l’ex chief scientist di OpenAI conferma che Altman sabotava i...
OpenAI
, • ⏱ 2 min

OpenAI vuole ingegneri nelle aziende: nasce la Deployment Company

L’acquisizione di Tomoro porta 150 specialisti pronti al lavoro. Sullo sfondo, la corsa con Anthropic per conquistare il mercato enterprise.

lavoratori cina
• ⏱ 2 min

In Cina non si licenzia più per colpa dell’IA

Un tribunale di Hangzhou stabilisce che l’automazione non è una causa legale di licenziamento. E le imprese devono fare i conti con una giurisprudenza in...
Fairwater IA data center Microsoft compute tax
, • ⏱ 4 min

La “compute tax”: ecco perché si torna a parlare di tassare l’IA

Tra redistribuzione e fuga di capitali, il dibattito sulla tassazione dell’IA scalda la campagna elettorale americana.

SpaceX Anthropic
• ⏱ 3 min

Anthropic affitterà i server di Musk

Colossus 1, il data center da centinaia di migliaia di chip Nvidia, cambia inquilino. E la corsa alla potenza di calcolo di Anthropic aggiunge un tassello...
Shivon Zilis Elon Musk
, • ⏱ 5 min

Secondo Shivon Zilis, Musk voleva fondere OpenAI in Tesla

Le testimonianze della compagna di Musk, Shivon Zilis, insieme a quelle di Brockman e Murati, ricostruiscono i sei mesi del 2017-2018 in cui il fondatore di Tesla tentò...
Share This