L’email di un ex collega arriva nell’autunno 2024 con una domanda apparentemente innocua: “Probabilmente sono la 148esima persona a chiederlo, ma hai dato in licenza la tua voce a Google?”.
David Greene, veterano della radio pubblica americana e per anni conduttore di Morning Edition su NPR, il programma radiofonico di notizie più ascoltato negli Stati Uniti con 13 milioni di ascoltatori, non aveva mai sentito parlare di NotebookLM.
Greene cerca lo strumento, ascolta i due conduttori virtuali che conversano e resta paralizzato. “Ero completamente sconvolto,” ha raccontato al Washington Post. “In quel momento mi sembrava di stare ascoltando me stesso.”
La voce maschile replica tutto: cadenza, intonazione, persino quegli occasionali intercalare che Greene ha passato anni a minimizzare senza mai eliminarli del tutto.
Quando arrivano messaggi da amici, familiari e colleghi, tutti per chiedere se quella voce sia la sua, Greene decide di agire. Ora Google è in tribunale, accusata di aver violato i diritti di un professionista replicandone la voce senza permesso né compenso.
NotebookLM, il successo inaspettato di Mountain View
NotebookLM è uno strumento di intelligenza artificiale sviluppato da Google che permette, tra le altre cose, di trasformare documenti di testo in podcast riassuntivi.
La funzione “Audio Overviews” genera due conduttori virtuali (uno maschile, uno femminile) che analizzano e riassumono contenuti anche complessi con un tono colloquiale, sostituendo decine di pagine con una conversazione apparentemente spontanea.
Il prodotto è emerso come un successo inaspettato per Mountain View nella corsa contro rivali come OpenAI:persino Spotify lo ha integrato nella sua funzione annuale “Wrapped”, offrendo a ciascun utente un podcast personalizzato sulle proprie abitudini di ascolto.
La voce come identità (e il precedente Johansson)
Per Greene, la questione va oltre il mancato compenso economico. “La mia voce è la parte più importante di chi sono,” spiega. Quella voce calda, dal timbro baritono capace di trasmettere fiducia ed empatia, è stata il risultato di decenni di perfezionamento professionale.
Dal 2012 al 2020 è stata la voce con cui milioni di americani si sono svegliati ogni mattina, un asset riconoscibile che definisce la sua carriera e la sua identità pubblica. Ma c’è un aspetto ancora più inquietante: il rischio che quella voce venga utilizzata per finalità che Greene non condividerebbe mai.
“Ho letto un articolo sul Guardian su come questo strumento possa essere usato per diffondere teorie del complotto e dare credibilità alle cose più sgradevoli della nostra società,” ha dichiarato. “Che qualcosa che suona come me venga usato al servizio di ciò, è davvero preoccupante.”
Il caso richiama inevitabilmente quello di Scarlett Johansson, che nel 2024 aveva accusato OpenAI di aver creato per ChatGPT una voce femminile straordinariamente simile alla sua, nonostante l’attrice avesse rifiutato esplicitamente la richiesta di collaborazione.
È un pattern che si ripete: giganti tecnologici che sviluppano voci sintetiche sorprendentemente somiglianti a quelle di professionisti riconoscibili, senza mai chiedere autorizzazione.
La battaglia legale con Google
La causa depositata presso la Corte Superiore della contea di Santa Clara si muove su un terreno giuridico complesso.
Greene non deve necessariamente provare che Google abbia addestrato NotebookLM direttamente sulla sua voce, nonostante un’azienda forense specializzata in IA abbia confrontato la voce sintetica con quella di Greene, ottenendo una valutazione di confidenza tra il 53 e il 60 percento, considerata “relativamente alta” per un confronto tra voce umana e artificiale.
Il precedente legale su cui invece Greene fa leva, il caso Bette Midler contro Ford Motor Company del 1988, stabilisce un principio diverso: la cantante vinse la causa dimostrando che una pubblicità aveva usato un imitatore per replicare il suo distintivo mezzosoprano, ingannando il pubblico.
Greene dovrà quindi dimostrare che un numero sufficiente di ascoltatori assume che quella sia effettivamente la sua voce, al punto da danneggiare la sua reputazione o le sue opportunità professionali.
Google nega categoricamente ogni addebito: “Queste accuse sono infondate, il suono della voce maschile nelle Audio Overview di NotebookLM si basa su un attore professionista pagato assunto da Google”. Sarà il tribunale a stabilire se la somiglianza sia abbastanza inquietante da costituire violazione.
Il vuoto normativo
Al di là dell’esito specifico, la causa Greene solleva una questione che attraversa l’intera industria dell’intelligenza artificiale generativa. I modelli linguistici alla base di strumenti come NotebookLM vengono addestrati su immense biblioteche di testi e registrazioni audio prodotte da esseri umani reali, a cui non è mai stato chiesto il consenso per questo utilizzo.
È una tensione a esplosa più volte, e il tribunale dovrà stabilire quanto strettamente una voce sintetica debba assomigliare all’originale per costituire violazione, e se la notorietà di Greene sia sufficiente perché il pubblico la riconosca.
Per doppiatori e professionisti audio meno noti, la battaglia è ancora più ardua: molti hanno contratti che licenziano le loro voci per usi amplissimi, e mancano della celebrità necessaria per invocare i diritti di pubblicità riservati ai personaggi pubblici.
Diversi stati americani e il Congresso hanno proposto leggi per regolamentare l’uso delle voci umane negli strumenti di IA, ma il quadro normativo rimane frammentato e incerto. Greene, da parte sua, chiarisce di non essere “un pazzo attivista anti-IA” e di non volere leggi che possano soffocare l’innovazione.
La sua richiesta è più semplice e diretta: “Google avrebbe dovuto chiedere il mio permesso prima di rilasciare un prodotto basato su una voce che credo sia essenzialmente la mia.”
Fonte: The Washington Post


