Ecco Veo, la risposta di Google a Sora di OpenAI

da | 15 Mag 2024 | IA

Che Google e OpenAI/Microsoft ormai si marchino a uomo, è cosa nota. D’altronde, l’abbiamo scritto anche in apertura dell’articolo dedicato ad AI Overviews.

La conferma, qualora ce ne fosse bisogno, arriva da uno dei tanti annunci fatti ieri al Google I/O di ieri. Ci riferiamo a Veo, nuovo modello text-to-video progettato per competere con Sora di OpenAI e altri modelli di generazione video quali Pika, Runway e Irreverent Labs.

È capace di catturare diversi stili visivi e cinematografici, inclusi paesaggi e time-lapse, e può anche modificare filmati già generati. Demis Hassabis, capo del laboratorio di ricerca AI di Google, DeepMind, ha sottolineato i progressi compiuti nel campo dei video, affermando che sono in corso di studio funzionalità quali lo storyboarding e la generazione di scene più lunghe.

Veo si basa sul lavoro preliminare di Google nella creazione dei video, presentato ad aprile, che utilizzava la famiglia di modelli di generazione di immagini Imagen 2 per realizzare videoclip in loop. A differenza però dello strumento basato su Imagen 2, che poteva creare solo video a bassa risoluzione e di pochi secondi, Veo si presenta sul mercato come un modello molto più competitivo.

Douglas Eck, responsabile delle ricerche sui media generativi presso DeepMind, ha mostrato in quel di Mountain View alcuni esempi delle capacità di Veo. Un video particolarmente impressionante è stato quello che mostrava la vista aerea di una spiaggia affollata, che ha messo in mostra la capacità di Veo di gestire dettagli complessi e numerosi personaggi in movimento.

Eck ha descritto Veo come “molto controllabile”, capace cioè di comprendere i movimenti della telecamera e gli effetti visivi dai prompt, oltre ad avere una certa comprensione della fisica, come la dinamica dei fluidi e la gravità. Veo supporta anche l’editing attraverso maschere per apportare modifiche a specifiche aree di un video e può generare video a partire da un’immagine fissa. Inoltre, datagli in pasto una sequenza di prompt che raccontano una storia, Veo può generare video più lunghi di un minuto.

Google Veo

Tuttavia, agli occhi di chi l’ha visto in azione, Veo non è esente da difetti. Gli oggetti presenti nei video possono scomparire e riapparire senza spiegazione o coerenza, e spesso sbaglia la fisica, come nel caso di alcune auto che si muovevano in modo irrealistico. Per questo motivo, Veo sarà inizialmente disponibile su Google Labs solo in lista d’attesa, all’interno di una nuova interfaccia per la creazione e l’editing di video generati da intelligenza artificiale chiamata VideoFX. Google prevede di portare alcune capacità del modello su YouTube Shorts e altri prodotti in futuro.

Veo è stato addestrato su una vasta quantità di filmati, seguendo il consueto approccio dei modelli di intelligenza artificiale generativa, che apprendono i pattern nei dati per generare nuovi contenuti. Eck ha confermato che alcuni di questi filmati potrebbero provenire da YouTube, ma sempre in conformità con gli accordi con i creatori di contenuti.

Questa affermazione, sebbene tecnicamente vera, solleva alcuni questioni etiche, considerando che i creator su YouTube non hanno molte alternative se vogliono raggiungere il pubblico più vasto possibile. Un articolo del New York Times ha rivelato infatti che l’anno scorso Google ha allentato le restrizioni sui dati di YouTube, ampliandone i termini di servizio, proprio per consentire l’utilizzo di più dati per l’addestramento dei modelli di intelligenza artificiale.

Google ha già reso Veo disponibile ad alcuni creator, tra cui Donald Glover (alias Childish Gambino) e la sua agenzia Gilga, posizionando Veo come uno strumento per i creativi. Tuttavia, a differenza di alcuni concorrenti, Google non offre un meccanismo per permettere ai creator di rimuovere il proprio lavoro dai set di dati di addestramento dopo la raccolta.

In sintesi, al netto delle questioni etiche e tecniche che abbiamo appena discusso, e che dovranno essere affrontate nel tempo, Veo senz0altro rappresenta un importante passo avanti per Google nel campo della generazione di video tramite intelligenza artificiale.

E con Sam Altman che nei mesi scorsi ha fatto il giro delle major hollywoodiane per mostrare il proprio Sora, siamo sicuri che in futuro ne vedremo (è proprio il caso di dirlo), delle belle.

POTREBBE INTERESSARTI

ByteDance e Broadcom avviano una collaborazione strategica per l'IA
,

ByteDance e Broadcom: al via una collaborazione per l’IA

L’azienda americana produrrà un chip da 5nm per la casa madre di TikTok, che lo scorso anno avrebbe già investito 2 miliardi di dollari in chip Nvidia.

Apple rinvierà il lancio di Apple Intelligence nell'UE
,

Apple rinvierà il lancio di Apple Intelligence nell’UE

Il gigante tecnologico indica il Digital Markets Act come la causa di questa decisione.

TikTok prova a rivoluzionare l'ADV ma inciampa clamorosamente

TikTok prova a rivoluzionare l’ADV ma inciampa clamorosamente

I Symphony Digital Avatars, il nuovo strumento di TikTok per la creazione di contenuti generati dall’IA, finiscono nel mirino dopo che una falla ha consentito la...
Ecco come di comporta Claude 3.5 Sonnet rispetto agli altri modelli.

Più veloce e intelligente: ecco Claude 3.5 Sonnet

Claude 3.5 Sonnet è il modello più avanzato di Anthropic, e promette prestazioni superiori a GPT-4 e Gemini

Il produttore di chip TSMC vola in borsa

La valutazione di TSMC vola alle stelle trascinata di Nvidia

TSMC si sta avvicinando alla valutazione di mille miliardi di dollari a Wall Street trascinata da Nvdia e dall’esplosione dell’IA.

L'IA non è in grado di prendere ordini da McDonald's

McDonald’s: l’IA non è ancora in grado di prendere gli ordini al drive-in

McDonald’s, la famosa catena di fast food, negli Stati Uniti ha deciso di disabilitare un sistema basato sull’intelligenza artificiale utilizzato nei...
Jen-Hsun Huang durante una presentazione di Nvidia

Nvidia batte Microsoft ed è la società che vale di più al mondo

Spinta dal crescente interesse nel comparto dell’intelligenza artificiale, Nvidia ha infranto un nuovo record in borsa, superando anche Microsoft.

Il segretario della NATO Jens Stoltenberg

La NATO investe mille miliardi di euro in IA, robot e spazio

La NATO investe mille miliardi di euro in 4 aziende specializzate in tecnologia per lo sviluppo di IA, robotica e ingegneria spaziale.

I robots di Ex-Robots

In Cina stanno costruendo robot con espressioni facciali umane

L’ultima frontiera della tecnologia fonde la robotica con l’intelligenza artificiale. L’obiettivo è quello di usare l’IA per dare ai robot...
Sam Altman potrebbe trasformare OpenAI in una società benefit foto: Joel Saget/AFP/Getty Images

OpenAI potrebbe diventare una società benefit (e perseguire il profitto)

OpenAI, per competete al meglio contro Anthropic e xAI, potrebbe cessare di essere una no-profit. E c’è già chi come passo successivo s’immagina...
Share This