Troppo intelligenti per controllarle: OpenAI cambia strategia sulle IA

da | 16 Apr 2025 | IA

Illustrazione: OpenAI
Tempo di lettura: 2 minuti

Ottobre 2027. L’umanità si trova a un bivio. Da un lato, rallentare lo sviluppo dell’intelligenza artificiale per contenerne i potenziali rischi. Dall’altro, accelerare per non perdere terreno rispetto alla Cina.

È questo il cuore di uno studio appena pubblicato, dal titolo AI 2027, che sotto forma di racconto distopico – ma nemmeno troppo – immagina un futuro in cui una singola intelligenza artificiale diventa più capace del più brillante tra gli esseri umani.

A firmare il documento, ripreso anche dal Corriere della Sera, troviamo Daniel Kokotajlo, ex ricercatore di OpenAI che nel 2024 aveva lasciato l’azienda perché convinto che non stesse più agendo in modo responsabile.

Forse allora non è un caso che, proprio mentre quel tipo di scenario torna a far discutere, OpenAI annunci il primo aggiornamento al proprio framework di sicurezza da quando, nel dicembre 2023, ha deciso di dotarsi di uno strumento ufficiale per valutare i rischi delle sue IA.

Un cambio di paradigma per OpenAI

La nuova versione del preparedness framework, così si chiama il sistema adottato da OpenAI per determinare se un modello è sicuro, introduce alcune modifiche sostanziali.

La più evidente è che scompare la distinzione tra rischio “basso” e “medio”. D’ora in poi conterà solo una cosa: se un sistema presenta rischi “alti” o “critici”.

La la vera svolta è però l’aggiunta di nuove categorie pensate per tenere conto dei comportamenti più imprevedibili e sfuggenti.

Come ad esempio la capacità di un modello di replicarsi da solo, di eludere le misure di sicurezza, di nascondere le proprie vere potenzialità o addirittura di opporsi a uno spegnimento forzato.

L’IA come agente autonomo

Il rischio, insomma, non è più solo quello di un uso malevolo da parte dell’uomo, per esempio nella creazione di armi biologiche, ma anche quello che un sistema sempre più “agentico”, come si dice in gergo, cominci a prendere decisioni autonome e imprevedibili.

«Siamo sull’orlo di sistemi capaci di fare nuova scienza», ha dichiarato OpenAI nel documento di aggiornamento. «E che potranno presto generare rischi concreti e gravi. Per questo servono misure di salvaguardia affidabili e solide».

L’idea di fondo, confermata dalla ricercatrice Sandhini Agarwal in un’intervista a Axios, è che tutto il lavoro sull’affidabilità debba ora concentrarsi sui rischi “catastrofici”.

Modelli sempre più abili nel mascherarsi

Uno dei motivi di allarme è che i modelli di ultima generazione stanno dimostrando di essere molto più abili nel mascherare le proprie capacità.

Una recente ricerca di Anthropic, ad esempio, ha suggerito che alcuni modelli linguistici sono in grado di pianificare azioni complesse in modo non visibile e di simulare processi di ragionamento fuorvianti.

Detto altrimenti: un modello potrebbe comportarsi in un modo nei test di laboratorio e in un altro – molto meno sicuro – nel mondo reale.

Ed è proprio questo il tipo di rischio che, con il nuovo framework, OpenAI dice di voler affrontare in maniera prioritaria.

POTREBBE INTERESSARTI

Sundar Pichai. Foto: Sanjay Rawat
, , • ⏱ 3 min

Soci e rivali: Google e SpaceX trattano per i data center in orbita

Google è azionista di SpaceX da anni. Ora le due aziende potrebbero diventare partner sui lanci (e concorrenti nello spazio).

Trump USA Xi Jinping Cina
, , • ⏱ 4 min

Trump e Xi parlano di IA, ma il dialogo resta difficile

A Pechino l’intelligenza artificiale entra per la prima volta nell’agenda bilaterale USA-Cina. Le aspettative però sono basse: troppa rivalità, troppa...
sam altman reuters
, • ⏱ 4 min

Altman in aula: “Musk voleva il 90% di OpenAI”

Il CEO di OpenAI testimonia su donazioni, equity e metodi manageriali che “hanno devastato la cultura” del laboratorio.

amazon logo
• ⏱ 3 min

I dipendenti Amazon usano l’IA anche quando non serve, per sembrare efficienti

Con 200 miliardi di investimenti da giustificare, Amazon vuole dati sull’utilizzo. E i suoi dipendenti glieli danno (ma non nel modo atteso).

nadella sutskever altman
, • ⏱ 3 min

Musk vs. Altman: le testimonianze di Nadella e Sutskever

Il CEO di Microsoft definisce “roba da dilettanti” il tentativo di rimozione del 2023; l’ex chief scientist di OpenAI conferma che Altman sabotava i...
OpenAI
, • ⏱ 2 min

OpenAI vuole ingegneri nelle aziende: nasce la Deployment Company

L’acquisizione di Tomoro porta 150 specialisti pronti al lavoro. Sullo sfondo, la corsa con Anthropic per conquistare il mercato enterprise.

lavoratori cina
• ⏱ 2 min

In Cina non si licenzia più per colpa dell’IA

Un tribunale di Hangzhou stabilisce che l’automazione non è una causa legale di licenziamento. E le imprese devono fare i conti con una giurisprudenza in...
Fairwater IA data center Microsoft compute tax
, • ⏱ 4 min

La “compute tax”: ecco perché si torna a parlare di tassare l’IA

Tra redistribuzione e fuga di capitali, il dibattito sulla tassazione dell’IA scalda la campagna elettorale americana.

SpaceX Anthropic
• ⏱ 3 min

Anthropic affitterà i server di Musk

Colossus 1, il data center da centinaia di migliaia di chip Nvidia, cambia inquilino. E la corsa alla potenza di calcolo di Anthropic aggiunge un tassello...
Shivon Zilis Elon Musk
, • ⏱ 5 min

Secondo Shivon Zilis, Musk voleva fondere OpenAI in Tesla

Le testimonianze della compagna di Musk, Shivon Zilis, insieme a quelle di Brockman e Murati, ricostruiscono i sei mesi del 2017-2018 in cui il fondatore di Tesla tentò...
Share This