Deepmind, l’intelligenza artificiale di Google, è in grado di creare dialoghi e colonne sonore

da | 19 Giu 2024 | IA

Tempo di lettura: 2 minuti

DeepMind, la divisione impegnata a sviluppare innovazioni legate all’intelligenza artificiale di Google, afferma di essere al lavoro su una tecnologia I.A. in grado di generare suoni sincronizzati coi i video.

In un post sul blog ufficiale, DeepMind afferma di aver creato una tecnologia in grado di superare uno dei limiti più comuni dei modelli IA attualmente più diffusi, anche quello creato dalla stessa divisione di Google: l’I.A. può generare video, ma non può creare effetti sonori sincronizzati con le immagini generate.

“I modelli di generazione video stanno avanzando a un ritmo incredibile, ma molti sistemi attuali possono generare solo output silenziosi”, scrive DeepMind. “La tecnologia V2A potrebbe diventare uno strumento promettente per dare vita a interi film generati dall’IA”.

La tecnologia V2A è in grado di partire da una descrizione e da un video (ad es. “meduse pulsanti sott’acqua, vita marina, oceano”) e creare musica, effetti sonori e persino dialoghi a tono con le immagini.

“Allenandosi su video, audio e annotazioni aggiuntive la nostra tecnologia impara ad associare specifici eventi audio con varie scene visive, rispondendo alle informazioni fornite nelle annotazioni o nelle trascrizioni”, si legge nel blog DeepMind.

Apparentemente quella presentata da DeepMind non è una novità. Sono diverse le startup che nelle settimane scorse hanno provato a proporre qualcosa di simile. La divisione di Google, però, sostiene che la tecnologia V2A è unica nel suo genere in quanto può comprendere i pixel grezzi di un video e sincronizzare automaticamente i suoni generati con le immagini.

Si tratta, però, solo del primo passo. V2A non è perfetto e persino DeepMind lo riconosce. È ancora in fase di “addestramento” e sono tanti i tipi di audio che non è in grado di riprodurre in maniera convincente. Inoltre quello che crea per il momento viene definito “stereotipato” da chi lo ha sentito.

Anche per questo motivo DeepMind afferma che per il momento non renderà pubblica la tecnologia e forse non lo farà mai. Nonostante gli utilizzi concreti, il pericolo di IA generative di questo tipo è quello di sconvolgere l’industria del cinema e della TV. Il pericolo, quindi, è quello sia di perdere migliaia di posti di lavoro, sia quello di infrangere diverse proprietà intellettuali.

POTREBBE INTERESSARTI

amazon logo
• ⏱ 3 min

I dipendenti Amazon usano l’IA anche quando non serve, per sembrare efficienti

Con 200 miliardi di investimenti da giustificare, Amazon vuole dati sull’utilizzo. E i suoi dipendenti glieli danno (ma non nel modo atteso).

nadella sutskever altman
, • ⏱ 3 min

Musk vs. Altman: le testimonianze di Nadella e Sutskever

Il CEO di Microsoft definisce “roba da dilettanti” il tentativo di rimozione del 2023; l’ex chief scientist di OpenAI conferma che Altman sabotava i...
OpenAI
, • ⏱ 2 min

OpenAI vuole ingegneri nelle aziende: nasce la Deployment Company

L’acquisizione di Tomoro porta 150 specialisti pronti al lavoro. Sullo sfondo, la corsa con Anthropic per conquistare il mercato enterprise.

lavoratori cina
• ⏱ 2 min

In Cina non si licenzia più per colpa dell’IA

Un tribunale di Hangzhou stabilisce che l’automazione non è una causa legale di licenziamento. E le imprese devono fare i conti con una giurisprudenza in...
Fairwater IA data center Microsoft compute tax
, • ⏱ 4 min

La “compute tax”: ecco perché si torna a parlare di tassare l’IA

Tra redistribuzione e fuga di capitali, il dibattito sulla tassazione dell’IA scalda la campagna elettorale americana.

SpaceX Anthropic
• ⏱ 3 min

Anthropic affitterà i server di Musk

Colossus 1, il data center da centinaia di migliaia di chip Nvidia, cambia inquilino. E la corsa alla potenza di calcolo di Anthropic aggiunge un tassello...
Shivon Zilis Elon Musk
, • ⏱ 5 min

Secondo Shivon Zilis, Musk voleva fondere OpenAI in Tesla

Le testimonianze della compagna di Musk, Shivon Zilis, insieme a quelle di Brockman e Murati, ricostruiscono i sei mesi del 2017-2018 in cui il fondatore di Tesla tentò...
atlas
• ⏱ 3 min

Atlas di Boston Dynamics ora fa ginnastica

L’azienda, posseduta da Hyundai, spinge la robotica per il lavoro in fabbrica. Lo schieramento negli stabilimenti partirà dal 2028.

Dario Amodei Anthropic Claude
, • ⏱ 3 min

Anthropic lancia dieci agenti finanziari e si allea con Goldman e Blackstone

Dario Amodei e Jamie Dimon sul palco insieme: la finanza è il nuovo fronte della guerra tra Anthropic e OpenAI?

Greg Brockman
, • ⏱ 3 min

OpenAI a processo: i 30 miliardi di Brockman sono un problema

Il processo Musk entra nella seconda settimana con un’arma inattesa: le pagine del diario di Greg Brockman scritte durante la lotta per il controllo del...
Share This