Google ha pubblicato la versione più recente del suo modello di generazione di immagini a partire da testo, chiamato Imagen 3. Lo potete trovare a questo indirizzo.
Presentato inizialmente a maggio durante il Google I/O, questo modello rappresenta l’avanguardia della tecnologia di intelligenza artificiale di Google e si pone come un concorrente diretto di altri modelli noti come Midjourney, DALL-E 3 e Grok-2 di X, messo a disposizione degli abbonati dell’ex-Twitter giusto qualche giorno fa.
Una delle differenze principali tra Imagen 3 e Grok-2 riguarda l’approccio alla sicurezza e all’eticità. Mentre il modello di Elon Musk è stato criticato per la generazione di immagini coperte da copyright e deepfake di figure pubbliche, Google ha adottato un metodo più rigoroso, implementando filtri estensivi e una rigorosa etichettatura dei dati per ridurre i contenuti dannosi e minimizzare la possibilità di output inappropriati.
Inoltre, tutte le immagini generate da Imagen 3 sono dotate di un watermark digitale, SynthID, che permette di identificarne la provenienza.
Oltre agli aspetti legati alla sicurezza, Google sostiene che Imagen 3 offra una maggiore versatilità e comprensione dei prompt, produca immagini di qualità superiore e una resa migliore del testo, una sfida comune a tutti i modelli di generazione di immagini basati su AI.
Attualmente, è possibile sperimentare Imagen 3 tramite ImageFX e VertexAI, e presto sarà integrato in altri strumenti di Google AI, come Workspace e Gemini, sia su web che su dispositivi mobili.


