Doveva essere il salto in avanti più importante nella storia di OpenAI, e invece il debutto di GPT-5 si sta rivelando più accidentato del previsto.
Presentato in diretta streaming come il modello “più intelligente, veloce e utile di sempre” e accompagnato dalla promessa di una “modalità di pensiero” capace di passare automaticamente da un’elaborazione standard a una più profonda, il nuovo sistema è arrivato nelle mani degli utenti con aspettative altissime. Peccato che, dopo i primi test, molti abbiano segnalato comportamenti al di sotto delle attese.
Sono infatti emersi diversi problemi in ambito matematico, con errori su calcoli elementari e dimostrazioni logiche che modelli precedenti. Problemi che invece Grok 4 di Elon Musk ha risolto senza difficoltà.
Alcuni utenti hanno evidenziato anche prestazioni altalenanti nella programmazione, settore in cui GPT-5 era stato descritto come imbattibile. Nei test pratici, invece, il modello Claude Opus 4.1 di Anthropic sembra avere la meglio su specifici compiti “one-shot”, ovvero lo sviluppo di un’applicazione completa al primo tentativo seguendo le specifiche dell’utente.
A complicare il quadro, un’analisi della società di sicurezza SPLX ha rilevato falle significative nei meccanismi di protezione del modello, in particolare rispetto alla resistenza ad attacchi di tipo prompt injection e “obfuscated logic attacks”, espressione che indica attacchi che sfruttano istruzioni, comandi o prompt deliberatamente offuscati per bypassare i filtri di sicurezza e ingannare così il modello di IA.
Questi difetti, comprensibilmente, alimentano un sentiment tiepido tra i primi utilizzatori: nei sondaggi informali, molti giudizi si fermano a un “nella media”, ben lontano dall’entusiasmo che aveva accompagnato i lanci di GPT-4 o delle più recenti varianti GPT-4o e o3.
GPT-5 e il ‘router’ sotto accusa
Tra le novità più pubblicizzate di GPT-5 c’è il cosiddetto “router” automatico di ChatGPT, ossia il sistema che decide se attivare la modalità di pensiero profondo in base alla complessità della richiesta.
Nelle intenzioni, doveva essere un vantaggio per l’utente, evitando tempi di elaborazione inutili. Nella pratica, però, molti segnalano che il modello tende a rimanere bloccato nella modalità standard, con un calo di accuratezza nelle risposte.
Anche la strategia di OpenAI di ridurre l’accesso ai modelli precedenti per gli utenti della versione consumer di ChatGPT sta generando malcontento. GPT-4o e o3 restano disponibili via API per sviluppatori, ma la platea generalista, ossia quella che più alimenta il brand ChatGPT, si trova a dover usare un modello che non convince del tutto.
This is concerning. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) August 8, 2025
La concorrenza avanza (soprattutto in Cina)
Le difficoltà di GPT-5 arrivano in un momento in cui la competizione nel settore dei modelli linguistici è più serrata che mai. Negli Stati Uniti, Google e Anthropic spingono con aggiornamenti sempre più frequenti, mentre dall’altra parte del Pacifico emergono modelli open source cinesi capaci di offrire funzionalità inedite e, in alcuni casi, prestazioni competitive a costi molto inferiori.
Emblematico l’ultimo aggiornamento del Qwen 3 di Alibaba, che ora può gestire un contesto di un milione di token, consentendo scambi di dati quasi quattro volte più ampi rispetto a GPT-5. Una mossa che sottolinea quanto rapidamente si stia alzando l’asticella in termini di capacità e versatilità.
E proprio la Cina offre un termometro interessante per capire l’impatto di GPT-5. Nonostante ChatGPT e gli altri servizi OpenAI non siano ufficialmente disponibili nella Cina continentale, il lancio è stato seguito con attenzione dalla comunità tech locale.
Secondo Zhang Linfeng, professore associato di intelligenza artificiale alla Shanghai Jiao Tong University, il nuovo modello “non è significativamente avanti rispetto ai modelli cinesi” e “non porta con sé rivoluzionarie innovazioni”.
La funzione di pensiero profondo, presentata come grande novità, non è peraltro inedita: colossi come Alibaba l’hanno già integrata nei loro sistemi. Nel frattempo, startup come DeepSeek e MoonshotAI, insieme ai big tech nazionali, stanno guadagnando terreno grazie a soluzioni open source che uniscono costi contenuti e caratteristiche innovative.
Ciò non significa che GPT-5 sia privo di meriti: anche in Cina gli esperti riconoscono progressi nella riduzione delle “allucinazioni” e nella capacità di programmazione. Ma nel complesso, il giudizio rimane prudente e per nulla intimorito: per Zhang, il nuovo modello non mette sotto pressione ricercatori e sviluppatori locali.
Una sfida aperta per il futuro
OpenAI, sostenuta da Microsoft, conta di integrare GPT-5 in un’ampia gamma di prodotti e servizi, dai tool di sviluppo di GitHub Copilot a Visual Studio Code. È una strategia che punta a radicare il modello nell’uso quotidiano, anche se l’adozione reale dipenderà dalla capacità di risolvere i problemi segnalati e di convincere un’utenza sempre più esigente.
Il debutto di GPT-5 dimostra però che il primato tecnologico non è mai garantito. Parafrasando il baseball, se la promessa iniziale era quella di un “fuoricampo”, la partita è ancora tutta da giocare. E e gli avversari sembrano pronti al contrattacco.


