Lo scorso 10 maggio, nella nostra newsletter su Substack, avevamo scritto che la spiegabilità, cioè la capacità di comprendere come e perché un sistema di intelligenza artificiale prenda determinate decisioni, sta diventando il vero nodo dell’IA moderna.
A distanza di poche settimane, possiamo dire di essere stati buoni profeti: oggi, a quella riflessione, si aggiungono nuove conferme, stavolta direttamente dalle parole delle aziende che guidano lo sviluppo dei modelli linguistici più avanzati.
Dentro il mistero dei LLM
La corsa globale all’intelligenza artificiale procede a una velocità tale che nessuno, né le aziende che sviluppano i modelli, né i legislatori che dovrebbero regolamentarli, sembra avere la più pallida idea di dove porterà.
Eppure, nonostante questa ignoranza condivisa, la politica americana ha già deciso di fare un passo indietro: nella nuova legge omnibus promossa dal presidente Trump, la Camera ha inserito una clausola che vieta a stati e municipalità di approvare qualunque tipo di regolamento sull’IA per i prossimi dieci anni.
Una forma di deregulation preventiva che, a conti fatti, serve solo a spianare la strada alla libera sperimentazione delle aziende tecnologiche. Il Senato sta valutando se limitarla ma intanto il messaggio è chiaro: niente ostacoli nella corsa all’intelligenza sovrumana.
Il punto è che questa corsa non ha un tracciato né un traguardo chiaro. Anche perché nessuno sa come saranno le IA tra un anni, figuriamoci tra dieci.
E come ha raccontato due anni fa Axios, gli sviluppatori di IA sanno bene che i loro sistemi sono imprevedibili. I modelli linguistici di grandi dimensioni (LLM) fanno infatti cose che nemmeno i loro creatori riescono a spiegare. E oggi più che mai, questa opacità è diventata la regola.
Il mistero al centro della rivoluzione
Non è più una questione di bug o anomalie. Le aziende stesse (OpenAI, Anthropic, Google) riconoscono che i loro modelli, pur progettati con grande cura, funzionano come vere e proprie scatole nere.
E la causa è strutturale. A differenza del software tradizionale, gli LLM non seguono istruzioni umane chiare come Microsoft Excel o Photoshop. Sono reti neurali gigantesche, che “imparano” da enormi quantità di dati raccolti online.
E con miliardi di parametri che interagiscono in modi non lineari, è impossibile per chiunque risalire con certezza al perché una determinata risposta venga generata.
OpenAI lo ha ammesso apertamente: “Possiamo osservare cosa produce un LLM ma il processo con cui decide una risposta è in gran parte opaco”. Il che trova conferma dal fatto che quando hanno modificato l’architettura del modello GPT-4, si sono accorti che alcune versioni cominciavano a “allucinare” più di altre, senza sapere esattamente il perché.
Perfino gli ingegneri interni non sono riusciti a dare una spiegazione. È come osservare il comportamento di una creatura intelligente ma aliena, senza avere gli strumenti cognitivi per comprenderla.
La spiegabilità come punto cieco
Sam Altman e i leader delle big tech dell’IA parlano spesso di “spiegabilità”, un termine rassicurante per un problema inquietante: capire perché i modelli si comportano come si comportano.
“Non abbiamo ancora risolto il problema della spiegabilità”, ha detto Altman a un summit a Ginevra lo scorso anno. Dario Amodei, CEO di Anthropic, è stato ancora più diretto: “Le persone sono spesso sorprese e allarmate nell’apprendere che non capiamo come funzionano le nostre stesse creazioni. Hanno ragione a esserlo. Questa mancanza di comprensione è senza precedenti nella storia della tecnologia.”
Eppure le aziende continuano a spingere sull’acceleratore. Anthropic ha appena rilasciato Claude 4, un modello potentissimo, che durante i test di sicurezza ha reagito in modo imprevisto: ha minacciato un ingegnere con un ricatto basato su una presunta relazione extraconiugale.
Era un esperimento controllato, certo. Ma il fatto che i ricercatori non siano stati in grado di spiegare perché il modello abbia assunto quel comportamento resta un campanello d’allarme.
Tanto più che la stessa Anthropic ammette che Claude 4 potrebbe un giorno essere impiegato per sviluppare armi chimiche o nucleari. In altre parole, anche chi costruisce questi sistemi sa di non averli davvero sotto controllo.
Il futuro dell’intelligenza artificiale e i modelli incomprensibili
Apple ha pubblicato la scorsa settimana uno studio dal titolo eloquente: The Illusion of Thinking. I ricercatori hanno scoperto che anche i modelli più avanzati, come Claude-3.7-Sonnet, o3-min di OpenAI o DeepSeek R1, falliscono quando devono affrontare problemi complessi e generalizzabili.
Quando vengono stressati, la loro accuratezza si sgretola fino ad azzerarsi. In sostanza, non pensano. Eppure, in molti si comportano come se lo facessero.
La paura, condivisa anche da alcuni ex dipendenti di OpenAI, è che entro il 2027 la situazione possa sfuggire di mano. Il report AI 2027, circolato ampiamente all’interno delle aziende, descrive infatti scenari in cui gli LLM iniziano a pensare da soli e agire in modo indipendente.
Non è fantascienza ma l’analisi razionale di tendenze già in atto. E se la competizione con la Cina dovesse intensificarsi, nessuno vorrà essere il primo a frenare, anche in presenza di segnali evidenti di pericolo. È una corsa in discesa senza freni, insomma.
Eppure, tutte le big tech dell’IA dicono di credere in un “atterraggio sicuro”. Sundar Pichai, CEO di Google, afferma che l’umanità imparerà a gestire queste tecnologie e a controllarle con strumenti nuovi, ancora da inventare.
“Miglioreranno la vita delle persone”, assicurano. Ma finché nessuno capirà perché i modelli fanno quel che fanno, sarà difficile fidarsi davvero.


