Al re:Invent di Las Vegas, Amazon Web Services ha mostrato la versione più ambiziosa della propria strategia sull’intelligenza artificiale.
Il CEO Matt Garman ha infatti presentato gli agenti di nuova generazione, descritti come sistemi in grado di svolgere compiti complessi per ore o addirittura giorni senza bloccarsi e senza tornare continuamente dall’utente per chiedere istruzioni.
“È su questo che abbiamo lavorato duramente nell’ultimo anno: come costruire un cervello davvero robusto che possa gestire flussi di lavoro complessi”, ha spiegato Garman, definendo gli agenti come il passaggio da semplici esecutori di prompt a strumenti capaci di portare avanti obiettivi ampi e prolungati.
Garman ha riconosciuto che AWS aveva fatto “mezzo passo indietro” all’inizio del boom dell’IA per costruire una piattaforma scalabile per le imprese, ma rivendica che è proprio l’ascesa degli agenti a stare riportando il gruppo “al centro della scena”, grazie al fatto che questi sistemi richiedono accesso continuo ai dati aziendali, alle applicazioni e alle infrastrutture dove AWS è più radicata.
L’addestramento privato di Nova Forge
La seconda grande novità è Nova Forge, il servizio che consente alle aziende di addestrare istanze private dei modelli Nova sui propri dati proprietari.
Garman ha spiegato che il limite tradizionale del fine-tuning sta nella perdita delle capacità di ragionamento, perché “se si esagera con il post-training, molti modelli dimenticheranno parte del ragionamento di base e di altri elementi che conoscono”.
Nova Forge affronta il problema a monte, permettendo alle aziende di creare versioni specializzate dei modelli Nova senza incorrere nel cosiddetto model forgetting.
Accanto a Nova Forge arriva l’effettiva disponibilità del chip Trainium3, parte della strategia di AWS per competere non solo sulla potenza dei modelli ma anche sul rapporto prezzo-prestazioni.
In parallelo, Amazon ha introdotto nuovi modelli: Nova 2, più veloce e reattivo, capace di rispondere tramite testo, immagini e video; e Sonic, progettato per interazioni vocali simili a quelle umane.
L’alleanza con Nvidia e il passo verso Trainium4
Il tassello più rilevante sul fronte hardware arriva invece dalla notizia diffusa da Reuters, che riguarda il futuro della linea Trainium. AWS adotterà infatti la tecnologia NVLink Fusion di Nvidia nel prossimo chip Trainium4, ancora senza una data di rilascio.
NVLink è la tecnologia che permette a migliaia di chip di comunicare come un’unica macchina, un requisito essenziale per addestrare modelli di intelligenza artificiale sempre più estesi. “Insieme, Nvidia e AWS stanno creando il tessuto computazionale per la rivoluzione industriale dell’IA”, ha dichiarato Jensen Huang, confermando la portata strategica dell’accordo.
Questa scelta si innesta su un percorso che, nel presente, si traduce nell’arrivo della nuova generazione di server basati su Trainium3, già disponibile per i clienti. Ogni server integra 144 chip e offre oltre quattro volte la potenza della generazione precedente, riducendo al tempo stesso del 40% il consumo energetico.
È il versante più immediato e concreto della strategia hardware di AWS: mentre il Trainium4 prepara il terreno all’infrastruttura di domani, il Trainium3 definisce le prestazioni e i costi dell’offerta attuale, un fattore decisivo nelle valutazioni dei grandi clienti.
Il posizionamento di Amazon nella corsa all’IA
Amazon ha faticato a ottenere un’adozione ampia dei modelli Nova rispetto a ChatGPT, Claude e Gemini, ma la divisione cloud resta il motore dell’azienda, con una crescita del 20% nell’ultimo trimestre.
La nuova strategia punta a rafforzare proprio questo ruolo, intrecciando modelli proprietari, agenti autonomi e chip specializzati.
Anche il contesto del re:Invent, l’evento di Las Vegas in cui AWS concentra ogni anno i suoi annunci più importanti, contribuisce a collocare queste novità in un quadro più ampio.
L’obiettivo non è solo recuperare terreno ma modellare la prossima fase dell’infrastruttura IA, in cui gli agenti e i carichi di lavoro sono il baricentro delle strategie aziendali.
Fonti: The Wall Street Journal, Reuters


