Nell’industria dell’IA, per anni la gara si è giocata sui modelli linguistici: ogni nuova release (più veloce, più preciso, più capace di ragionare) portava con sé un’ondata di download e copertura mediatica. Quell’epoca è finita.
Secondo un’analisi di Appfigures, società specializzata in dati sul mercato delle app, i lanci di modelli di generazione di immagini producono oggi 6,5 volte più download rispetto agli aggiornamenti tradizionali dei modelli linguistici. La capacità di trasformare un testo in un’immagine o di modificare una foto con un’istruzione in linguaggio naturale si è rivelata il vettore di acquisizione utenti più potente dell’intero settore.
Il cambio di passo è visibile nei numeri. ChatGPT ha registrato oltre 12 milioni di installazioni aggiuntive nei 28 giorni successivi al lancio del suo modello GPT-4o Image, nel marzo del 2024. È un risultato che supera di 4,5 volte quello generato dai rilasci puramente linguistici, inclusi GPT-4.5 e GPT-5.

Immagine: Appfigures via TechCrunch.
Gemini di Google ha fatto ancora meglio in termini assoluti: il lancio di Nano Banana, il modello di generazione di immagini basato su Gemini 2.5 Flash, ha portato oltre 22 milioni di download nello stesso arco temporale di 28 giorni, moltiplicando per quattro il ritmo ordinario di installazioni dell’app.
Anche Meta, con Vibes ha raccolto circa 2,6 milioni di download aggiuntivi, confermando che il fenomeno non è circoscritto a un singolo operatore.
La direzione è chiara: nelle app di IA generativa, i contenuti visivi attraggono utenti in misura che il testo non è mai riuscito a replicare.
La domanda è cosa succede dopo l’installazione.
Download e ricavi: due storie diverse
Appfigures mette subito in guardia da una lettura troppo ottimistica dei dati. I download aggiuntivi generati dai lanci di modelli di generazione di immagini non si traducono automaticamente in entrate. Offrono agli utenti un motivo per scaricare l’app e sperimentare le nuove funzionalità visive ma questo non implica che decidano di pagare un abbonamento.
Il caso di Nano Banana è emblematico. Nonostante abbia prodotto un picco di installazioni superiore a quello di ChatGPT, il modello di Google ha generato appena 181.000 dollari di spesa stimata nei 28 giorni successivi al lancio.
Un risultato che, rapportato ai 22 milioni di download, è marginale. Vibes di Meta ha seguito uno schema analogo: download aggiuntivi, entrate trascurabili.
Tra i tre principali operatori analizzati, uno solo ha trasformato l’attenzione in denaro reale.
L’eccezione OpenAI
Il modello GPT-4o Image di OpenAI ha generato circa 70 milioni di dollari di spesa stimata nei 28 giorni successivi al lancio, rispetto ai livelli precedenti. È un ordine di grandezza che separa nettamente OpenAI da Google e Meta, e che non dipende dalla qualità del modello in sé ma da qualcosa di più strutturale.
OpenAI può contare su un ecosistema di abbonamenti già consolidato, su un brand associato nella percezione pubblica all’IA generativa tout court, e su una base di utenti abituata a pagare per funzionalità premium.
Quando arriva una novità rilevante, una quota significativa di chi scarica l’app ha già una carta di credito collegata o è propensa ad associarla. Google e Meta operano in un contesto diverso: le loro app di IA si inseriscono in ecosistemi dove la gratuità è la norma storica, e convincere l’utente a pagare richiede un salto culturale che i lanci di modelli, da soli, non bastano a compiere.
La distanza tra 181.000 dollari e 70 milioni dice meno sulla qualità dei modelli e più sulla struttura commerciale in cui ciascun operatore è inserito.
DeepSeek: viralità senza immagini
L’analisi di Appfigures include anche DeepSeek, ma lo tratta come un caso a parte e a ragione. Il rilascio di DeepSeek R1, a gennaio 2025, ha prodotto 28 milioni di download.
Non si trattava però di un lancio di modello visivo, né di un aggiornamento di funzionalità: era un evento di rottura. In poche settimane, DeepSeek era passato dall’anonimato a protagonista del dibattito globale sull’IA, dopo che il settore aveva scoperto le tecniche con cui l’azienda cinese aveva addestrato modelli competitivi a una frazione del costo dei concorrenti occidentali.
Quella viralità era alimentata dalla curiosità (geopolitica, tecnica, competitiva), non da una funzionalità specifica. È una leva diversa, non replicabile su comando, e per questo non comparabile con i lanci ordinari dei modelli di generazione di immagini.
Appfigures lo isola giustamente dal resto dell’analisi: serve a ricordare che la crescita delle app di IA può essere guidata anche da fattori esterni al prodotto, quando il contesto è abbastanza dirompente.
Fonte: TechCrunch


