Trovare una vulnerabilità in un sistema informatico è un’operazione identica, tecnicamente, sia che la faccia un difensore che cerca di correggerla, sia che la faccia un attaccante che vuole sfruttarla. È il problema fondamentale della cybersecurity nell’era dell’IA: i modelli più capaci sono utili esattamente nella misura in cui sono pericolosi.
OpenAI ha presentato martedì la sua risposta a questo problema con il lancio di GPT-5.4-Cyber, un modello progettato specificamente per il lavoro di sicurezza difensiva, e con l’espansione del programma Trusted Access for Cyber.
La premessa è semplice. I precedenti modelli GPT creavano attriti per i professionisti della sicurezza legittimi. Ad esempio rifiutandosi di rispondere a query tecniche che, fuori contesto, potevano sembrare offensive.
GPT-5.4-Cyber riduce queste restrizioni ma solo per chi supera un processo di verifica. Il modello è strutturato su livelli: il livello più alto, con le capacità più avanzate, è riservato a fornitori di sicurezza, ricercatori e organizzazioni che abbiano completato verifiche più stringenti.
Due filosofie per lo stesso problema
L’approccio di OpenAI sembra speculare a quello di Anthropic, che circa una settimana fa ha presentato il Progetto Glasswing e il suo modello Claude Mythos Preview, come abbiamo raccontato su queste pagine.
Anthropic ha scelto la strada opposta: accesso ristrettissimo, circa 40 organizzazioni selezionate, e una giustificazione esplicita. Il modello, ha avvertito l’azienda di Amodei, è così efficace nell’individuare e sfruttare falle di sicurezza da essere semplicemente troppo pericoloso per una distribuzione ampia.
OpenAI, davanti agli stessi rischi, sceglie la direzione contraria: distribuire il più possibile, ma filtrare chi accede. “Questo è uno sport di squadra”, ha dichiarato Fouad Matin, ricercatore cyber di OpenAI. “Nessuno dovrebbe essere nel business di scegliere vincitori e perdenti quando si tratta di cybersecurity.”
L’obiettivo dichiarato è rendere gli strumenti “il più ampiamente disponibili possibile, prevenendo al contempo gli abusi”. E il contrasto con la filosofia di Anthropic non potrebbe essere più netto: uno punta sul cosa il modello può fare, l’altro sul chi può usarlo.
Come funziona la verifica
Il sistema si articola su tre livelli. I singoli utenti verificano la propria identità con documento d’identità governativo e controllo biometrico affidato a un fornitore terzo. Le aziende ottengono accesso esteso tramite un rappresentante OpenAI. I ricercatori che necessitano delle capacità più avanzate accedono a un programma su invito.
A questo si aggiungono classificatori automatici che monitorano l’attività in tempo reale, cercando segnali di uso anomalo o offensivo.
Il rollout sarà graduale e per ora esclude le agenzie governative statunitensi, con cui OpenAI dice di essere in trattativa. L’onboarding richiederà tempo: l’azienda dovrà esaminare e verificare ogni richiedente singolarmente.
La domanda che il sistema non risolve
Qui però nasce il problema che l’articolo sorgente lascia sullo sfondo, e che vale la pena portare in primo piano. La verifica biometrica lega l’accesso a un’identità reale ma non garantisce nulla sulle intenzioni di chi quella carta d’identità la possiede davvero.
Un attore sufficientemente motivato può costruire una copertura credibile: un’azienda di sicurezza formalmente registrata, ricerche pubblicate, certificazioni reali. OpenAI non ha pubblicato i criteri specifici di valutazione, e non ha reso noti i processi di appello per i casi di diniego.
Il modello di sicurezza, nei fatti, non punta sull’impermeabilità della verifica iniziale. Punta sulla deterrenza: chi accede con un’identità reale lascia tracce collegabili a una persona fisica, il che crea responsabilità legale e reputazionale.
È una scommessa pragmatica e la domanda su quanto sia sufficiente nei confronti di attori statali o gruppi ben organizzati, resta aperta. Tanto per OpenAI quanto per Anthropic, che ha scelto di limitare il modello ma non può garantire che le 40 organizzazioni selezionate non vengano a loro volta compromesse.
Fonte: Axios


