Voice Engine: a OpenAI bastano 15 secondi di una voce per clonarla

da | 30 Mar 2024 | IA

Tempo di lettura: 2 minuti

OpenAI, la startup più famosa al mondo nel campo dell’intelligenza artificiale, ha recentemente fatto un altro annuncio di quelli dirompenti. Ieri, infatti, ha presentato Voice Engine, una tecnologia rivoluzionaria capace di ricreare con precisione le voci umane con appena 15 secondi di parlato. Questo nuovo strumento arriva subito dopo l’annuncio di Sora, una tecnologia in grado di generare immagini digitali e video in movimento a partire da semplici descrizioni testuali.

Voice Engine, che si trova attualmente in fase di test presso un ristretto gruppo di aziende selezionate, promette di leggere qualsiasi testo venga fornito utilizzando una voce sintetica che assomiglia sorprendentemente a quella della persona registrata.

È da notare che il testo da leggere non deve necessariamente essere nella lingua madre dell’utente; Voice Engine è infatti capace di riprodurre la voce registrata in una vasta gamma di lingue, tra cui spagnolo, francese e cinese, aprendo così nuove possibilità.

L’impiego di questa tecnologia spazia dalla generazione di audiolibri alla voce per chatbot online, fino alla creazione di DJ radiofonici robottizzati. Crediamo che neanche il doppiaggio resterà immune a questa nuova rivoluzione introdotta da Sam Altman, il cui impatto sulla società comincia a essere degno dei libri di storia.

OpenAI, che già utilizza una tecnologia simile per alimentare la versione parlante di ChatGPT, si avventura dunque in territori ancora più ambiziosi. Tuttavia, la potenziale pericolosità di tale tecnologia non passa inosservata. A tal proposito OpenAI dichiara di voler procedere con cautela, conscia dei rischi che un generatore di voci così avanzato potrebbe comportare, dalla diffusione di disinformazione all’impersonificazione di individui online o attraverso chiamate telefoniche.

In particolare, è palpabile la preoccupazione che Voice Engine possa essere utilizzato per violare sistemi di autenticazione vocale, mettendo a rischio conti bancari online e altre applicazioni personali. “Questo è un aspetto delicato e importante da gestire correttamente”, ha affermato Jeff Harris, product manager di OpenAI, sottolineando l’importanza di un approccio responsabile nello sviluppo e nella distribuzione di tale tecnologia.

L’azienda sta valutando soluzioni come l’inserimento di watermark sulle voci sintetiche e il rafforzamento dei controlli per prevenire usi impropri. Sospettiamo che ciò non sarà sufficiente ma vogliamo comunque ricordare che questa tecnologia ha dimostrato di avere applicazioni positive. Come nel caso di una donna che, grazie a una registrazione di quando era liceale, ha potuto riavere una voce dopo che un tumore al cervello l’aveva compromessa.

La strada da percorrere è senz’altro lunga e ricca di sfide, soprattutto in un contesto elettorale dove il rischio di abusi aumenta significativamente, come dimostrato dalle robocall con la voce di Joe Biden ricevute dai residenti del New Hampshire lo scorso novembre.

Un po’ come con Sora, OpenAI al momento non pare intenzionata a monetizzare affrettatamente questa tecnologia. E afferma di voler esplorare il suo potenziale per migliorare la vita delle persone in modi ancora da immaginare, rimanendo vigile sui possibili pericoli che essa comporta. Ci riuscirà?

POTREBBE INTERESSARTI

amazon logo
• ⏱ 3 min

I dipendenti Amazon usano l’IA anche quando non serve, per sembrare efficienti

Con 200 miliardi di investimenti da giustificare, Amazon vuole dati sull’utilizzo. E i suoi dipendenti glieli danno (ma non nel modo atteso).

nadella sutskever altman
, • ⏱ 3 min

Musk vs. Altman: le testimonianze di Nadella e Sutskever

Il CEO di Microsoft definisce “roba da dilettanti” il tentativo di rimozione del 2023; l’ex chief scientist di OpenAI conferma che Altman sabotava i...
OpenAI
, • ⏱ 2 min

OpenAI vuole ingegneri nelle aziende: nasce la Deployment Company

L’acquisizione di Tomoro porta 150 specialisti pronti al lavoro. Sullo sfondo, la corsa con Anthropic per conquistare il mercato enterprise.

lavoratori cina
• ⏱ 2 min

In Cina non si licenzia più per colpa dell’IA

Un tribunale di Hangzhou stabilisce che l’automazione non è una causa legale di licenziamento. E le imprese devono fare i conti con una giurisprudenza in...
Fairwater IA data center Microsoft compute tax
, • ⏱ 4 min

La “compute tax”: ecco perché si torna a parlare di tassare l’IA

Tra redistribuzione e fuga di capitali, il dibattito sulla tassazione dell’IA scalda la campagna elettorale americana.

SpaceX Anthropic
• ⏱ 3 min

Anthropic affitterà i server di Musk

Colossus 1, il data center da centinaia di migliaia di chip Nvidia, cambia inquilino. E la corsa alla potenza di calcolo di Anthropic aggiunge un tassello...
Shivon Zilis Elon Musk
, • ⏱ 5 min

Secondo Shivon Zilis, Musk voleva fondere OpenAI in Tesla

Le testimonianze della compagna di Musk, Shivon Zilis, insieme a quelle di Brockman e Murati, ricostruiscono i sei mesi del 2017-2018 in cui il fondatore di Tesla tentò...
atlas
• ⏱ 3 min

Atlas di Boston Dynamics ora fa ginnastica

L’azienda, posseduta da Hyundai, spinge la robotica per il lavoro in fabbrica. Lo schieramento negli stabilimenti partirà dal 2028.

Dario Amodei Anthropic Claude
, • ⏱ 3 min

Anthropic lancia dieci agenti finanziari e si allea con Goldman e Blackstone

Dario Amodei e Jamie Dimon sul palco insieme: la finanza è il nuovo fronte della guerra tra Anthropic e OpenAI?

Greg Brockman
, • ⏱ 3 min

OpenAI a processo: i 30 miliardi di Brockman sono un problema

Il processo Musk entra nella seconda settimana con un’arma inattesa: le pagine del diario di Greg Brockman scritte durante la lotta per il controllo del...
Share This