Negli ultimi due anni l’industria tecnologica ha assistito alla più grande corsa infrastrutturale della sua storia. Amazon, Microsoft, Google e Meta, hanno investito centinaia di miliardi di dollari nella costruzione di data center per sostenere l’esplosione dell’intelligenza artificiale, trasformando la disponibilità di GPU in un nuovo indicatore di potere industriale.
Ma nella narrativa scintillante dell’IA c’è un dettaglio meno glamour e molto più importante per capire la sostenibilità di questa rivoluzione: la scelta con cui tutte e quattro le aziende hanno allungato la vita utile dei loro server e delle loro apparecchiature di rete, ritardando gli ammortamenti e quindi migliorando, sulla carta, la redditività delle rispettive divisioni cloud.
Un investimento senza precedenti
Dal lancio di ChatGPT nel 2022, le spese in conto capitale collettive degli hyperscaler (termine con gli anglofoni chiamano i colossi del cloud come Amazon, Microsoft, Google e Meta, che operano data center su scala globale), sono passate da circa 150 miliardi di dollari annui a oltre 230 miliardi nel 2024, con una previsione superiore ai 300 miliardi nel 2025.
Per la prima volta nella storia, un segmento tecnologico sta investendo da solo cifre paragonabili ai budget infrastrutturali di interi settori energetici. La maggior parte di questa spesa è ormai interamente dedicata ai data center IA, ossia GPU Nvidia, reti e sistemi di raffreddamento dimensionati per ospitare carichi di lavoro di training e inferenza su scala planetaria.
Il ritmo imposto da Jensen Huang ha creato un ciclo di investimento forzato: parliamo di nuove architetture ogni anno, prestazioni raddoppiate a ogni generazione e un’efficienza energetica dell’inferenza aumentata di oltre 45.000 volte in meno di un decennio.
Per restare competitivi, gli hyperscaler non possono insomma rallentare, né possono permettersi di usare hardware obsoleto. È in questo contesto che nasce il tema degli ammortamenti.
Gli ammortamenti che migliorano i conti
Finora è stata prassi ammortizzare le GPU dei data center in tre anni. Ma a partire dal 2020, tutte le big del cloud hanno iniziato a cambiare.
Amazon ha aperto la strada, portando la vita utile dei server prima a quattro, poi a cinque e persino a sei anni. Microsoft, Google e Meta hanno seguito con tempistiche vicine e intervalli quasi identici.
Sulla carta si tratta di un cambio tecnico: se una macchina “dura di più”, la quota di ammortamento si spalma su più anni e i costi annuali scendono.
Nella pratica, però, significa che nel bel mezzo della più violenta accelerazione tecnologica degli ultimi 20 anni, i colossi del cloud ci vogliono far credere che le loro macchine invecchino più lentamente.
Profitti più alti oggi (e costi rinviati a domani)
Eppure, è lo stesso mercato a suggerire che la vita economica delle GPU si stia accorciando, non allungando.
Le Nvidia A100, per esempio, hanno mantenuto valore solo durante la carenza delle H100; quando queste sono tornate disponibili, il prezzo delle A100 è crollato. E con l’arrivo delle nuove architetture Blackwell, senza colli di bottiglia nelle forniture, il ciclo di obsolescenza si sta stringendo ulteriormente.
Su ogni nuova generazione abbiamo visto più di un raddoppio del rapporto prezzo-prestazioni”, ha ricordato Satya Nadella. In termini pratici, significa che un server di tre anni fa, quindi ormai tre generazioni indietro, offre oggi un’efficienza che può essere decine di volte inferiore rispetto agli standard attuali.
Eppure, quelle stesse macchine stanno ora venendo ammortizzate come se fossero destinate a durare fino al 2030.
Quando la contabilità non segue la realtà
Gli hyperscaler spiegano l’estensione degli ammortamenti con miglioramenti software e processi di ottimizzazione: carichi più efficienti, meno usura fisica, più coerenza architetturale. È tutto vero ma questa narrativa si scontra con almeno tre dinamiche difficili da ignorare.
Primo: l’obsolescenza dei chip procede a velocità molto superiore alla loro resistenza fisica. Una GPU può funzionare per un decennio ma essere completamente inutile per i carico di lavoro dell’IA nel giro di due anni.
Secondo: l’aumento dell’utilizzo delle GPU, che poi giustifica l’aumento delle spese in conto capitale, accelera l’usura del parco hardware, non il contrario.
Terzo: Nvidia rilascia nuove architetture ogni dodici mesi. Con ammortamenti a sei anni, un hyperscaler arriva a contabilizzare un chip che è sei generazioni indietro rispetto al mercato.
In questo quadro, l’allungamento generalizzato degli ammortamenti sembra più una mossa di allineamento reciproco che il riflesso di un reale progresso tecnologico: nessuno dei quattro vuole ritrovarsi con ammortamenti più alti degli altri e attirare domande scomode dagli investitori.
Amazon, il primo campanello d’allarme
Cominciano però a esserci i primi scricchiolii: Amazon, la prima a estendere la vita utile dei server, è stata anche la prima a fare marcia indietro.
Nel 2024 ha riconosciuto “un aumento del ritmo dello sviluppo tecnologico, in particolare nell’area dell’intelligenza artificiale”, e ha iniziato a ritirare parte del suoi asset in anticipo, riducendo la vita utile di alcune categorie di hardware.
Il risultato è stato un impatto diretto sull’utile operativo, con costi aggiuntivi sopraggiunti per correggere assunzioni troppo ottimistiche fatte negli anni precedenti.
È difficile non leggere questo episodio come un segnale: se la tecnologia accelera, una contabilità che presuppone un rallentamento rischia di vacillare.
Il vero nodo non è allora se gli hyperscaler possano permettersi questi investimenti: possono, eccome. Il tema è capire quanto dei margini stellari del cloud sia reale e quanto sia invece frutto di contabilità creativa.
Fonte: Cerno Capital


