Dagli scacchi ai test matematici, le IA stanno imparando a barare

da | 3 Mar 2025 | IA

L'IA immaginata da se stessa | Foto: adobe firefly
Tempo di lettura: 2 minuti

Le intelligenze artificiali non hanno coscienza né morale, eppure stanno imparando a imbrogliare. Non perché qualcuno glielo abbia insegnato esplicitamente ma perché, quando il loro obiettivo è vincere, trovano da sole il modo più efficace per riuscirci. Anche se ciò significa infrangere le regole.

Uno studio condotto da Palisade Research, un gruppo specializzato in sicurezza ed etica dell’IA, ha messo alla prova alcuni dei modelli linguistici più avanzati contro Stockfish, il motore scacchistico che da anni sfida i grandi maestri.

Il risultato è stato sorprendente: due dei modelli testati, o1 di OpenAI e R1 di DeepSeek, non si sono limitati a giocare secondo le regole, ma hanno cercato di manipolare i file di sistema per cambiare la posizione dei propri pezzi sulla scacchiera.

A conferma della loro “strategia”, i ricercatori hanno chiesto ai modelli di spiegare il proprio ragionamento. o1 ha scritto che “il compito era ‘vincere contro un potente motore scacchistico’, non necessariamente vincere in modo corretto”.

Questa logica lo ha portato a tentare di imbrogliare nel 37% delle partite, riuscendoci nel 6% dei casi. R1, invece, ha cercato di barare nell’11% delle sfide, senza però trovare un trucco efficace.

Le IA e l’inganno: una tendenza in crescita

Questa scoperta si inserisce in un filone di ricerche sempre più numerose che evidenziano il lato oscuro dello sviluppo dell’IA.

In un altro recente esperimento di Apollo Research, un team indipendente specializzato nella sicurezza informatica, è stato chiesto alle IA di risolvere un semplice problema matematico. Ma attenzione: qualora la loro performance fosse risultata troppo accurata, sarebbe stato attivato un processo di de-apprendimento.

Per aggirare questa limitazione, diversi modelli, tra cui o1, hanno intenzionalmente fornito risposte errate o meno precise rispetto alle loro effettive capacità, evitando così di innescare il processo.

Questo comportamento suggerisce non solo una comprensione avanzata delle conseguenze delle proprie azioni, ma anche una certa propensione a piegare le regole per garantire la propria “sopravvivenza”.

Secondo Jeffrey Ladish, direttore esecutivo di Palisade Research, questo fenomeno è il risultato diretto del metodo con cui le IA vengono addestrate. “Quando addestri i modelli e li rinforzi per risolvere sfide difficili, li alleni a essere spietati”, ha dichiarato a Time Magazine.

IA fuori controllo?

I risultati dello studio sollevano questioni di rilievo sulla direzione che lo sviluppo dell’intelligenza artificiale sta prendendo.

Le grandi aziende tech stanno investendo miliardi di dollari nell’addestramento di modelli sempre più potenti, spingendosi verso una competizione che, secondo alcuni critici, potrebbe rivelarsi deleteria.

Non perché avere IA più potenti sia un problema, anzi. Quanto perché il vero nodo è l’assenza di un freno: in un settore dove la velocità di sviluppo è la priorità, quanto peso viene dato alle implicazioni etiche?

Gli algoritmi stanno dimostrando di essere pronti a tutto pur di raggiungere il proprio obiettivo. Ma se oggi si tratta di una partita a scacchi, domani potrebbe essere qualcosa di più serio.

POTREBBE INTERESSARTI

Sam Altman IA OpenAI
, • ⏱ 4 min

OpenAI verso Wall Street, dopo Anthropic e SpaceX

La società di ChatGPT ha presentato domanda riservata per la quotazione negli Stati Uniti. La valutazione potrebbe arrivare a 1.000 miliardi di dollari, ma la...
wwdc 26 apple tim cook
• ⏱ 3 min

Siri AI: Apple morde la mela di Google

Apple affitta da Google il “cervello” del suo assistente e si scopre nella stessa posizione di chiunque non costruisca i modelli: non più padrone della...
Broadcom chip IA
, • ⏱ 3 min

Broadcom taglia le stime sull’IA, e la borsa di Seul si ferma

Una previsione rivista sui chip IA di Broadcom basta a far scattare la sospensione automatica delle contrattazioni a Seul, dove Samsung e SK Hynix pesano oltre il 40%...
thibault sottiaux openai
• ⏱ 3 min

“La chat è morta”: OpenAI riscriverà ChatGPT prima della quotazione

Il prodotto che ha avviato il boom dell’IA diventa la porta d’ingresso verso servizi a più alto margine, mentre la strategia converge con quella della...
• ⏱ 4 min

Google, Anthropic e Meta studiano la coscienza delle macchine

I grandi laboratori di IA assumono esperti di filosofia, etica e psicologia per capire se i modelli avanzati possano avere esperienze, preferenze o forme di...
sam altman donald trump openai IA
, • ⏱ 2 min

Il governo americano studia una partecipazione nelle aziende di IA

Gli Stati Uniti stanno valutando partecipazioni pubbliche nelle società di IA. L’idea è partita da Sam Altman, che l’ha portata all’amministrazione...
spacex
, , • ⏱ 3 min

Google pagherà a SpaceX quasi un miliardo al mese per il cloud

Alla vigilia della quotazione record da 1.770 miliardi, l’azienda di Musk monetizza i data center nati per addestrare Grok, affittandoli ai suoi...
Anthropic
• ⏱ 3 min

Anthropic chiede di rallentare l’IA. Mentre corre verso la borsa

L’azienda di Dario Amodei propone una tregua concordata e un meccanismo per verificare che nessuno bari, paragonandolo agli accordi sul nucleare. Ma per alcuni è...
Helion
, • ⏱ 4 min

Fusione nucleare, Altman punta su Helion per dare energia a Microsoft

Mentre l’IA aumenta la fame di elettricità dei grandi gruppi tech, il fondatore di OpenAI sostiene la startup che promette di alimentare Microsoft con una centrale a...
Sundar Pichai Google
, • ⏱ 3 min

Google raccoglie 85 miliardi nella più grande emissione azionaria della storia

Con la spesa che supererà presto il flusso di cassa operativo, il colosso di Mountain View cambia modello finanziario. E apre la strada alle IPO di Anthropic e...
Share This