Per anni, il testo è stato la prova del nove che smascherava un’immagine generata dall’IA. Menu di ristoranti con piatti dall’ortografia impossibile, insegne con parole inventate, loghi illeggibili: chiunque sapeva dove guardare per scoprire l’inganno.
Il problema non era estetico, era tecnico. I modelli di diffusione, quelli che hanno dominato la generazione di immagini fino a poco tempo fa, ricostruiscono un’immagine a partire dal “rumore”, pixel per pixel. Provando a spiegarlo in parole più semplici, lavoravano affinando progressivamente un’immagine confusa fino a renderla nitida.
Le scritte occupano una porzione minuscola di ogni immagine, e il modello imparava a riprodurre i pattern visivi più frequenti, non le logiche degli un alfabeti. Il risultato erano lettere plausibili ma sbagliate, parole che sembravano parole senza esserlo.
Con Images 2.0, OpenAI sostiene di aver risolto il problema. Il nuovo modello non si limita a migliorare la resa estetica: gestisce testi in piccolo, icone, elementi di interfaccia, composizioni dense e vincoli stilistici fini, il tutto fino a una risoluzione di 2K.
Supporta inoltre la resa di alfabeti non latini (come giapponese, coreano, hindi e bengalese), un’espansione che allarga notevolmente il bacino di utenti professionali a cui il prodotto si rivolge.
Ragionamento integrato
La novità tecnica più rilevante di Images 2.0 è la cosiddetta modalità “thinking”, un livello di ragionamento integrato che consente al modello di cercare informazioni sul web, generare più varianti da un unico prompt e verificare autonomamente le proprie creazioni prima di restituirle all’utente.
In pratica, significa poter produrre materiali di marketing in formati diversi o strisce a fumetti a più pannelli, in pochi minuti. Non è la rapidità di una risposta testuale ma i tempi rimangono contenuti anche per le richieste più complesse.
La modalità thinking è riservata agli abbonati paganti. Gli utenti della versione gratuita accedono al modello standard, che mantiene comunque le nuove capacità di resa testuale. Il modello è disponibile anche via API per gli sviluppatori, con prezzi variabili in base a qualità e risoluzione degli output.
OpenAI non ha però voluto rivelare, nemmeno durante il briefing con la stampa, quale architettura stia alla base di Images 2.0. Una reticenza che non è casuale: in un mercato dove ogni annuncio tecnico viene analizzato dai concorrenti, scegliere il silenzio sull’architettura è una precisa decisione strategica.
ChatGPT Images 2.0: un assistente professionale
Il lancio di Images 2.0 è un aggiornamento tecnico ma soprattutto un riposizionamento. OpenAI punta dichiaratamente al mercato creativo professionale (pubblicità, poster, mock-up, materiali di comunicazione) e lo dice senza giri di parole. “Non è solo uno strumento per creare belle immagini”, ha dichiarato Adele Li, product manager di OpenAI, durante il briefing con i giornalisti. «È un assistente creativo.»
È una distinzione che vale la pena sottolineare. Fino a poco tempo fa, i generatori di immagini IA erano percepiti come strumenti per il grande pubblico, utili per sfondi, illustrazioni, esperimenti visivi. Images 2.0 cerca di spostare quella percezione verso un uso professionale quotidiano, dove la precisione nella resa del testo, la gestione di formati multipli e la coerenza stilistica non sono optional ma requisiti minimi.
Il limite di conoscenza del modello, fissato a dicembre 2025, resta un fattore da tenere presente per chi lavora su contenuti legati all’attualità: immagini che richiedono riferimenti recenti potrebbero risentirne.
Alla ricerca del momento virale
OpenAI sa che il vantaggio competitivo in questo settore si misura in mesi, non in anni. Google ha attirato grande attenzione con Nano Banana 2, il suo modello visivo integrato in Gemini, che offre funzionalità simili di editing e generazione. La stessa OpenAI aveva registrato un’impennata di utenti qualche mese fa, quando le immagini in stile Studio Ghibli generate dal predecessore di Images 2.0 erano diventate virali in poche ore.
Quella viralità è parte della strategia. “Crediamo che avremo un altro momento così”, ha detto Li. OpenAI costruisce attorno ai propri lanci un’aspettativa esplicita di ‘contagio social’, sapendo che un’ondata di immagini condivise vale più di qualsiasi campagna pubblicitaria. Ma i momenti virali, per definizione, non si pianificano.
Fonti: TechCrunch, Axios


