Amazon accelera sugli agenti IA e si allea con Nvidia

da | 3 Dic 2025 | IA

Foto: Marv Watson/AWS RE:INVENT
Tempo di lettura: 3 minuti

Al re:Invent di Las Vegas, Amazon Web Services ha mostrato la versione più ambiziosa della propria strategia sull’intelligenza artificiale.

Il CEO Matt Garman ha infatti presentato gli agenti di nuova generazione, descritti come sistemi in grado di svolgere compiti complessi per ore o addirittura giorni senza bloccarsi e senza tornare continuamente dall’utente per chiedere istruzioni.

“È su questo che abbiamo lavorato duramente nell’ultimo anno: come costruire un cervello davvero robusto che possa gestire flussi di lavoro complessi”, ha spiegato Garman, definendo gli agenti come il passaggio da semplici esecutori di prompt a strumenti capaci di portare avanti obiettivi ampi e prolungati.

Garman ha riconosciuto che AWS aveva fatto “mezzo passo indietro” all’inizio del boom dell’IA per costruire una piattaforma scalabile per le imprese, ma rivendica che è proprio l’ascesa degli agenti a stare riportando il gruppo “al centro della scena”, grazie al fatto che questi sistemi richiedono accesso continuo ai dati aziendali, alle applicazioni e alle infrastrutture dove AWS è più radicata.

L’addestramento privato di Nova Forge

La seconda grande novità è Nova Forge, il servizio che consente alle aziende di addestrare istanze private dei modelli Nova sui propri dati proprietari.

Garman ha spiegato che il limite tradizionale del fine-tuning sta nella perdita delle capacità di ragionamento, perché “se si esagera con il post-training, molti modelli dimenticheranno parte del ragionamento di base e di altri elementi che conoscono”.

Nova Forge affronta il problema a monte, permettendo alle aziende di creare versioni specializzate dei modelli Nova senza incorrere nel cosiddetto model forgetting.

Accanto a Nova Forge arriva l’effettiva disponibilità del chip Trainium3, parte della strategia di AWS per competere non solo sulla potenza dei modelli ma anche sul rapporto prezzo-prestazioni.

In parallelo, Amazon ha introdotto nuovi modelli: Nova 2, più veloce e reattivo, capace di rispondere tramite testo, immagini e video; e Sonic, progettato per interazioni vocali simili a quelle umane.

L’alleanza con Nvidia e il passo verso Trainium4

Il tassello più rilevante sul fronte hardware arriva invece dalla notizia diffusa da Reuters, che riguarda il futuro della linea Trainium. AWS adotterà infatti la tecnologia NVLink Fusion di Nvidia nel prossimo chip Trainium4, ancora senza una data di rilascio.

NVLink è la tecnologia che permette a migliaia di chip di comunicare come un’unica macchina, un requisito essenziale per addestrare modelli di intelligenza artificiale sempre più estesi. “Insieme, Nvidia e AWS stanno creando il tessuto computazionale per la rivoluzione industriale dell’IA”, ha dichiarato Jensen Huang, confermando la portata strategica dell’accordo.

Questa scelta si innesta su un percorso che, nel presente, si traduce nell’arrivo della nuova generazione di server basati su Trainium3, già disponibile per i clienti. Ogni server integra 144 chip e offre oltre quattro volte la potenza della generazione precedente, riducendo al tempo stesso del 40% il consumo energetico.

È il versante più immediato e concreto della strategia hardware di AWS: mentre il Trainium4 prepara il terreno all’infrastruttura di domani, il Trainium3 definisce le prestazioni e i costi dell’offerta attuale, un fattore decisivo nelle valutazioni dei grandi clienti.

Il posizionamento di Amazon nella corsa all’IA

Amazon ha faticato a ottenere un’adozione ampia dei modelli Nova rispetto a ChatGPT, Claude e Gemini, ma la divisione cloud resta il motore dell’azienda, con una crescita del 20% nell’ultimo trimestre.

La nuova strategia punta a rafforzare proprio questo ruolo, intrecciando modelli proprietari, agenti autonomi e chip specializzati.

Anche il contesto del re:Invent, l’evento di Las Vegas in cui AWS concentra ogni anno i suoi annunci più importanti, contribuisce a collocare queste novità in un quadro più ampio.

L’obiettivo non è solo recuperare terreno ma modellare la prossima fase dell’infrastruttura IA, in cui gli agenti e i carichi di lavoro sono il baricentro delle strategie aziendali.

Fonti: The Wall Street Journal, Reuters

POTREBBE INTERESSARTI

Papa Leone XIV
• ⏱ 2 min

Magnifica Humanitas: il Papa pubblica la sua prima enciclica sull’IA insieme al co-fondatore di Anthropic

Papa Leone XIV presenterà la sua prima enciclica sull’IA; tra i relatori anche Christopher Olah, responsabile della ricerca sull’interpretabilità...
OpenAI Elon Musk
, • ⏱ 2 min

Musk perde contro OpenAI: accuse prescritte

Un tribunale federale USA archivia il caso dopo un mese di processo. Altman e OpenAI escono vincitori contro Musk, arrivato in ritardo con le accuse.

JPMorgan
• ⏱ 4 min

La causa JPMorgan e i video (falsi) che milioni hanno visto

Bastano pochi minuti e un chatbot per costruire una storia falsa su chiunque. Il caso della banca americana mostra come uno scandalo giudiziario possa diventare materia...
Eric Schmidt Google
• ⏱ 3 min

Eric Schmidt fischiato dai neolaureati: l’IA non entusiasma i giovani

L’ex CEO di Google e un’altra dirigente hanno provato a vendere l’IA come futuro luminoso a chi sta per entrare in un mercato del lavoro in crisi. Non...
Agenti IA
• ⏱ 3 min

Troppi agenti IA: le grandi aziende corrono ai ripari

Gartner stima 150.000 agenti per azienda Fortune 500 entro due anni. Solo il 13% delle organizzazioni si dice pronta a gestirli.

Elon Musk vs Sam Altman OpenAI
, • ⏱ 3 min

Musk in Cina, Altman in aula: il processo dell’anno ai titoli di coda

Altman accusato di mentire, Musk di amnesia selettiva: mentre la giudice prepara la sentenza finale, OpenAI difende il suo primato.

Jensen Huang Nvidia
, , • ⏱ 3 min

Trump porta Huang a Pechino: gli H200 sono approvati ma la Cina non li compra

Gli Stati Uniti hanno dato il via libera ma la Cina blocca i propri acquirenti. E nel mezzo c’è Nvidia, che ha visto la propria quota di mercato cinese...
Sundar Pichai. Foto: Sanjay Rawat
, , • ⏱ 3 min

Soci e rivali: Google e SpaceX trattano per i data center in orbita

Google è azionista di SpaceX da anni. Ora le due aziende potrebbero diventare partner sui lanci (e concorrenti nello spazio).

Trump USA Xi Jinping Cina
, , • ⏱ 4 min

Trump e Xi parlano di IA, ma il dialogo resta difficile

A Pechino l’intelligenza artificiale entra per la prima volta nell’agenda bilaterale USA-Cina. Le aspettative però sono basse: troppa rivalità, troppa...
sam altman reuters
, • ⏱ 4 min

Altman in aula: “Musk voleva il 90% di OpenAI”

Il CEO di OpenAI testimonia su donazioni, equity e metodi manageriali che “hanno devastato la cultura” del laboratorio.

Share This