OpenAI cancella ‘per sbaglio’ prove nella causa col New York Times

da | 23 Nov 2024 | Legal

Fossimo a Roma, commenteremmo la notizia su OpenAI, riportata da The Verge, con un “ma che, davvero”? Invece no, è tutto accaduto realmente.

E a noi italiani, abituati alla massima di Giulio Andreotti che “a pensare male si fa peccato, ma spesso ci si azzecca”, un po’ viene da sorridere.

Il pregresso

Tutto inizia nel dicembre 2023, quando il New York Times accusa OpenAI e il suo partner Microsoft di aver utilizzato milioni dei suoi articoli per addestrare i modelli di intelligenza artificiale di Sam Altman, senza autorizzazione.

Secondo il Times, ciò viola i diritti di copyright e porta ChatGPT a competere direttamente coi contenuti editoriali del giornale.

Per suffragare queste tesi, nel corso di quest’anno i legali del NYT hanno analizzato oltre 150 ore di dati d’addestramento del modello di intelligenza artificiale, cercando prove che dimostrassero l’utilizzo non autorizzato dei loro articoli.

Whoopsie!

Arriviamo così alla news di oggi. Avete presente tutte quelle faticose ore di lavoro? Ebbene, sono state inutili dal momento che è emerso che OpenAI ha accidentalmente cancellato i relativi dati, compromettendo così quanto raccolto dal New York Times.

A raccontare l’episodio è un documento presentato in tribunale pochi giorni fa, nel quale l’azienda di Sam Altman ammette l’errore, definendolo un “problema tecnico”, pur non spiegando come sia avvenuto questo errore né cosa contenessero esattamente i dati.

“Sto facendo seguito alla questione sollevata nella mia email del 15 novembre”, si legge a cavallo di pagina 2 e 3, “relativa al fatto che i contenuti dell’SSD di una delle macchine virtuali dedicate che stavamo utilizzando per l’ispezione dei dati di addestramento sono stati cancellati da OpenAI. Dopo aver parlato questa mattina con i nostri consulenti, abbiamo appreso che, sebbene una quantità significativa dei dati cancellati da OpenAI sia stata recuperata, la struttura delle cartelle e i nomi dei file sono stati irrimediabilmente persi, il che purtroppo rende i dati recuperati inutilizzabili.”

Dal documento si apprende quindi che OpenAI avrebbe tentato di recuperare i dati eliminati. Purtroppo, e immaginiamo il rammarico di Sam Altman in questo difficile momento, quanto è stato recuperato risulta incompleto e dunque inutilizzabile. Il che rende impossibile dimostrare con precisione l’eventuale utilizzo degli articoli del quotidiano da parte di OpenAI per addestrare i ChatGPT.

I legali di OpenAI definiscono a pagina 4 la cancellazione accidentale un “glitch,” mentre gli avvocati del Times dimostrano un grande fairplay affermando di non avere motivo di sospettare intenzionalità da parte dell’azienda di Sam Altman.

Va notato che OpenAI ha scelto di non presentare l’aggiornamento congiunto in tribunale col New York Times. La dichiarazione è stata pertanto firmata dall’avvocato Jennifer Maisel, rappresentante della testata giornalistica, per notificare formalmente l’accaduto.

OpenAI, attraverso il suo portavoce Jason Deutrom, ha annunciato che presenterà una propria versione dei fatti nei prossimi giorni. Il Times ha rifiutato di commentare ulteriormente.

La battaglia miliardaria del Times

La richiesta di risarcimento di New York Times Company è gigantesca: si parla infatti di “miliardi di dollari” in danni legali e reali per l’uso non autorizzato dei suoi articoli.

Finora, lo scontro legale è costato oltre un milione di dollari al Times. Un prezzo irrisorio per il celebre quotidiano americano, ma difficile da sostenere per molti altri editori. Il che pone una domanda: chi può permettersi di sfidare giganti tecnologici come OpenAI?

Non è un caso, pertanto, che grandi gruppi editoriali come Axel Springer, Conde Nast e Vox Media abbiano preferito adottare un’altra strategia, siglando accordi proprio con OpenAI.

La partnership con l’azienda californiana è senza dubbio una scelta più sicura e remunerativa, rispetto a una costosa disputa legale. Tanto più se le informazioni più importanti possono sparire dall’oggi al domani, per errore.

POTREBBE INTERESSARTI

Nato nel 1985, Ilya Sutskever è un informatico di origine russa che lavora nel campo dell'apprendimento automatico

“Caos e bugie”: la testimonianza di Sutskever inguaia Sam Altman

La causa legale di Elon Musk contro OpenAI fa emergere i retroscena della cacciata di Sam Altman nel 2023, tra manipolazioni, rivalità e dossier segreti.

Aravind Srinivas Perplexity

Amazon contro Perplexity: chi gioca sporco nell’era degli agenti IA?

Amazon accusa Perplexity di accessi non autorizzati agli account dei clienti. La quale si difende parlando di “bullismo tecnologico”. Il confine tra innovazione e...
Sam Altman OpenAI Miyazaki

Studio Ghibli sfida OpenAI: “Basta addestrare l’IA sulle nostre opere”

Gli editori giapponesi chiedono a OpenAI di fermare l’uso dei loro contenuti per l’addestramento dei modelli generativi. Altman risponde con un post ironico su...
Sam Altman IA

Ecco come Sam Altman si è preso gioco di Hollywood

Promesse, ambiguità e versioni discordanti: OpenAI ha giocato con le regole, lasciando Hollywood nel caos. Attori e agenzie si sentono ingannati, mentre le major...
meta facebook

L’Unione Europea contro Meta per contenuti illegali e moderazione

La Commissione UE contesta a Facebook e Instagram carenze nella segnalazione dei contenuti illegali e nel diritto d’appello degli utenti. È la prima volta che Bruxelles...
OpenAI SB 53

OpenAI e la guerra legale alle no-profit che chiedono regole per l’IA

“Usano avvocati, donazioni politiche e lobbisti perché possono. E a volte funziona”.

deepfake

Deepfake, in Italia scatta la legge: fino a cinque anni di carcere

Tra obblighi di trasparenza e sfide tecniche, l’Italia diventa apripista nella lotta ai falsi generati da intelligenza artificiale.

chat control

L’Europa rinvia il Chat Control

Milioni di falsi positivi, backdoor permanenti e rischio di sorveglianza di massa: il rinvio non chiude il caso ma lo trasforma in un test per la democrazia tecnologica...
Elon Musk

Musk chiude la causa da 128 milioni con gli ex dirigenti di Twitter

Dopo i licenziamenti e le accuse di cattiva condotta, Musk sembra aver vinto la partita dei costi. Ma non quella della crescita.

Sam Altman ChatGPT

Lo schiaffo di Sam Altman al copyright: Sora 2 userà materiale protetto (salvo opt-out)

La nuova versione dello strumento video di OpenAI includerà contenuti protetti a meno di una richiesta di esclusione esplicita da parte del titolare del copyright. Un...
Share This