Ecco Veo, la risposta di Google a Sora di OpenAI

da | 15 Mag 2024 | IA

Tempo di lettura: 3 minuti

Che Google e OpenAI/Microsoft ormai si marchino a uomo, è cosa nota. D’altronde, l’abbiamo scritto anche in apertura dell’articolo dedicato ad AI Overviews.

La conferma, qualora ce ne fosse bisogno, arriva da uno dei tanti annunci fatti ieri al Google I/O di ieri. Ci riferiamo a Veo, nuovo modello text-to-video progettato per competere con Sora di OpenAI e altri modelli di generazione video quali Pika, Runway e Irreverent Labs.

È capace di catturare diversi stili visivi e cinematografici, inclusi paesaggi e time-lapse, e può anche modificare filmati già generati. Demis Hassabis, capo del laboratorio di ricerca AI di Google, DeepMind, ha sottolineato i progressi compiuti nel campo dei video, affermando che sono in corso di studio funzionalità quali lo storyboarding e la generazione di scene più lunghe.

Veo si basa sul lavoro preliminare di Google nella creazione dei video, presentato ad aprile, che utilizzava la famiglia di modelli di generazione di immagini Imagen 2 per realizzare videoclip in loop. A differenza però dello strumento basato su Imagen 2, che poteva creare solo video a bassa risoluzione e di pochi secondi, Veo si presenta sul mercato come un modello molto più competitivo.

Douglas Eck, responsabile delle ricerche sui media generativi presso DeepMind, ha mostrato in quel di Mountain View alcuni esempi delle capacità di Veo. Un video particolarmente impressionante è stato quello che mostrava la vista aerea di una spiaggia affollata, che ha messo in mostra la capacità di Veo di gestire dettagli complessi e numerosi personaggi in movimento.

Eck ha descritto Veo come “molto controllabile”, capace cioè di comprendere i movimenti della telecamera e gli effetti visivi dai prompt, oltre ad avere una certa comprensione della fisica, come la dinamica dei fluidi e la gravità. Veo supporta anche l’editing attraverso maschere per apportare modifiche a specifiche aree di un video e può generare video a partire da un’immagine fissa. Inoltre, datagli in pasto una sequenza di prompt che raccontano una storia, Veo può generare video più lunghi di un minuto.

Google Veo

Tuttavia, agli occhi di chi l’ha visto in azione, Veo non è esente da difetti. Gli oggetti presenti nei video possono scomparire e riapparire senza spiegazione o coerenza, e spesso sbaglia la fisica, come nel caso di alcune auto che si muovevano in modo irrealistico. Per questo motivo, Veo sarà inizialmente disponibile su Google Labs solo in lista d’attesa, all’interno di una nuova interfaccia per la creazione e l’editing di video generati da intelligenza artificiale chiamata VideoFX. Google prevede di portare alcune capacità del modello su YouTube Shorts e altri prodotti in futuro.

Veo è stato addestrato su una vasta quantità di filmati, seguendo il consueto approccio dei modelli di intelligenza artificiale generativa, che apprendono i pattern nei dati per generare nuovi contenuti. Eck ha confermato che alcuni di questi filmati potrebbero provenire da YouTube, ma sempre in conformità con gli accordi con i creatori di contenuti.

Questa affermazione, sebbene tecnicamente vera, solleva alcuni questioni etiche, considerando che i creator su YouTube non hanno molte alternative se vogliono raggiungere il pubblico più vasto possibile. Un articolo del New York Times ha rivelato infatti che l’anno scorso Google ha allentato le restrizioni sui dati di YouTube, ampliandone i termini di servizio, proprio per consentire l’utilizzo di più dati per l’addestramento dei modelli di intelligenza artificiale.

Google ha già reso Veo disponibile ad alcuni creator, tra cui Donald Glover (alias Childish Gambino) e la sua agenzia Gilga, posizionando Veo come uno strumento per i creativi. Tuttavia, a differenza di alcuni concorrenti, Google non offre un meccanismo per permettere ai creator di rimuovere il proprio lavoro dai set di dati di addestramento dopo la raccolta.

In sintesi, al netto delle questioni etiche e tecniche che abbiamo appena discusso, e che dovranno essere affrontate nel tempo, Veo senz0altro rappresenta un importante passo avanti per Google nel campo della generazione di video tramite intelligenza artificiale.

E con Sam Altman che nei mesi scorsi ha fatto il giro delle major hollywoodiane per mostrare il proprio Sora, siamo sicuri che in futuro ne vedremo (è proprio il caso di dirlo), delle belle.

POTREBBE INTERESSARTI

Sundar Pichai. Foto: Sanjay Rawat
, , • ⏱ 3 min

Soci e rivali: Google e SpaceX trattano per i data center in orbita

Google è azionista di SpaceX da anni. Ora le due aziende potrebbero diventare partner sui lanci (e concorrenti nello spazio).

Trump USA Xi Jinping Cina
, , • ⏱ 4 min

Trump e Xi parlano di IA, ma il dialogo resta difficile

A Pechino l’intelligenza artificiale entra per la prima volta nell’agenda bilaterale USA-Cina. Le aspettative però sono basse: troppa rivalità, troppa...
sam altman reuters
, • ⏱ 4 min

Altman in aula: “Musk voleva il 90% di OpenAI”

Il CEO di OpenAI testimonia su donazioni, equity e metodi manageriali che “hanno devastato la cultura” del laboratorio.

amazon logo
• ⏱ 3 min

I dipendenti Amazon usano l’IA anche quando non serve, per sembrare efficienti

Con 200 miliardi di investimenti da giustificare, Amazon vuole dati sull’utilizzo. E i suoi dipendenti glieli danno (ma non nel modo atteso).

nadella sutskever altman
, • ⏱ 3 min

Musk vs. Altman: le testimonianze di Nadella e Sutskever

Il CEO di Microsoft definisce “roba da dilettanti” il tentativo di rimozione del 2023; l’ex chief scientist di OpenAI conferma che Altman sabotava i...
OpenAI
, • ⏱ 2 min

OpenAI vuole ingegneri nelle aziende: nasce la Deployment Company

L’acquisizione di Tomoro porta 150 specialisti pronti al lavoro. Sullo sfondo, la corsa con Anthropic per conquistare il mercato enterprise.

lavoratori cina
• ⏱ 2 min

In Cina non si licenzia più per colpa dell’IA

Un tribunale di Hangzhou stabilisce che l’automazione non è una causa legale di licenziamento. E le imprese devono fare i conti con una giurisprudenza in...
Fairwater IA data center Microsoft compute tax
, • ⏱ 4 min

La “compute tax”: ecco perché si torna a parlare di tassare l’IA

Tra redistribuzione e fuga di capitali, il dibattito sulla tassazione dell’IA scalda la campagna elettorale americana.

SpaceX Anthropic
• ⏱ 3 min

Anthropic affitterà i server di Musk

Colossus 1, il data center da centinaia di migliaia di chip Nvidia, cambia inquilino. E la corsa alla potenza di calcolo di Anthropic aggiunge un tassello...
Shivon Zilis Elon Musk
, • ⏱ 5 min

Secondo Shivon Zilis, Musk voleva fondere OpenAI in Tesla

Le testimonianze della compagna di Musk, Shivon Zilis, insieme a quelle di Brockman e Murati, ricostruiscono i sei mesi del 2017-2018 in cui il fondatore di Tesla tentò...
Share This