Voice Engine: a OpenAI bastano 15 secondi di una voce per clonarla

da | 30 Mar 2024 | IA

OpenAI, la startup più famosa al mondo nel campo dell’intelligenza artificiale, ha recentemente fatto un altro annuncio di quelli dirompenti. Ieri, infatti, ha presentato Voice Engine, una tecnologia rivoluzionaria capace di ricreare con precisione le voci umane con appena 15 secondi di parlato. Questo nuovo strumento arriva subito dopo l’annuncio di Sora, una tecnologia in grado di generare immagini digitali e video in movimento a partire da semplici descrizioni testuali.

Voice Engine, che si trova attualmente in fase di test presso un ristretto gruppo di aziende selezionate, promette di leggere qualsiasi testo venga fornito utilizzando una voce sintetica che assomiglia sorprendentemente a quella della persona registrata.

È da notare che il testo da leggere non deve necessariamente essere nella lingua madre dell’utente; Voice Engine è infatti capace di riprodurre la voce registrata in una vasta gamma di lingue, tra cui spagnolo, francese e cinese, aprendo così nuove possibilità.

L’impiego di questa tecnologia spazia dalla generazione di audiolibri alla voce per chatbot online, fino alla creazione di DJ radiofonici robottizzati. Crediamo che neanche il doppiaggio resterà immune a questa nuova rivoluzione introdotta da Sam Altman, il cui impatto sulla società comincia a essere degno dei libri di storia.

OpenAI, che già utilizza una tecnologia simile per alimentare la versione parlante di ChatGPT, si avventura dunque in territori ancora più ambiziosi. Tuttavia, la potenziale pericolosità di tale tecnologia non passa inosservata. A tal proposito OpenAI dichiara di voler procedere con cautela, conscia dei rischi che un generatore di voci così avanzato potrebbe comportare, dalla diffusione di disinformazione all’impersonificazione di individui online o attraverso chiamate telefoniche.

In particolare, è palpabile la preoccupazione che Voice Engine possa essere utilizzato per violare sistemi di autenticazione vocale, mettendo a rischio conti bancari online e altre applicazioni personali. “Questo è un aspetto delicato e importante da gestire correttamente”, ha affermato Jeff Harris, product manager di OpenAI, sottolineando l’importanza di un approccio responsabile nello sviluppo e nella distribuzione di tale tecnologia.

L’azienda sta valutando soluzioni come l’inserimento di watermark sulle voci sintetiche e il rafforzamento dei controlli per prevenire usi impropri. Sospettiamo che ciò non sarà sufficiente ma vogliamo comunque ricordare che questa tecnologia ha dimostrato di avere applicazioni positive. Come nel caso di una donna che, grazie a una registrazione di quando era liceale, ha potuto riavere una voce dopo che un tumore al cervello l’aveva compromessa.

La strada da percorrere è senz’altro lunga e ricca di sfide, soprattutto in un contesto elettorale dove il rischio di abusi aumenta significativamente, come dimostrato dalle robocall con la voce di Joe Biden ricevute dai residenti del New Hampshire lo scorso novembre.

Un po’ come con Sora, OpenAI al momento non pare intenzionata a monetizzare affrettatamente questa tecnologia. E afferma di voler esplorare il suo potenziale per migliorare la vita delle persone in modi ancora da immaginare, rimanendo vigile sui possibili pericoli che essa comporta. Ci riuscirà?

POTREBBE INTERESSARTI

Nvidia CES 2026 Jensen Huag

Al CES 2026 la Silicon Valley ha scelto Trump

La Genesis Mission, Nvidia e il nuovo asse Washington-Silicon Valley: al Consumer Electronics Show è andata in scena la fine della neutralità tech.

Harry Potter e la Pietra Filosofale

I ricercatori sono riusciti a estrarre Harry Potter (quasi per intero) dai principali LLM

Una ricerca di Stanford dimostra che Claude, GPT-4.1, Gemini e Grok hanno memorizzato interi libri protetti da copyright. E possono riprodurli quasi parola per...
Grok

Grok, la risposta di Musk ai deepfake è farli pagare

Dall’Indonesia al Regno Unito, i governi reagiscono ai deepfake di Grok. Musk attacca gli inglesi: “Fascisti”. Ma intanto le immagini abusive...
Character

Google e Character.AI, accordi milionari per evitare il processo

Le famiglie ottengono risarcimenti per i suicidi legati al chatbot, ma il vuoto normativo sulla responsabilità dell’IA generativa resta intatto.

Andreessen Horowitz

Il secolo americano di Andreessen Horowitz: 15 miliardi per blindare il futuro tech

Dalla difesa all’intelligenza artificiale: come il colosso di Menlo Park sta puntando a riscrivere il rapporto tra capitale privato, sovranità e potere.

data center

La corsa all’IA accende il mercato dei bond per i data center europei

L’Europa importerà i modelli finanziari americani per recuperare il terreno perduto rispetto a USA e Cina, trasformando i data center in asset...
Dario Amodei Anthropic

Anthropic tratta un nuovo finanziamento a una valutazione da 350 miliardi

La start-up di intelligenza artificiale, in competizione con OpenAI, mira a raccogliere circa 10 miliardi mentre prende forma l’ipotesi di una quotazione in...
ChatGPT Health

OpenAI annuncia ChatGPT Health (ma non in Europa)

Negli Stati Uniti 230 milioni di persone già usano il chatbot di Sam Altman per parlare di salute. Ma non mancano le sfide in termini di sensibilità dei dati e le...
giustizia giudici IA

Negli USA i giudici iniziano a usare l’IA per decidere i processi

Dagli Stati Uniti arriva la spinta per l’IA in tribunale: non più solo ricerca legale ma bozze di sentenze e decisioni automatizzate.

Elon Musk xAI

xAI raccoglie 20 miliardi in meno di due anni: è record per Musk

La società di intelligenza artificiale di Elon Musk supera i 42 miliardi totali di finanziamenti dal 2023 e punta a una valutazione oltre i 230 miliardi. Ma Grok...
Share This