Fossimo a Roma, commenteremmo la notizia su OpenAI, riportata da The Verge, con un “ma che, davvero”? Invece no, è tutto accaduto realmente.
E a noi italiani, abituati alla massima di Giulio Andreotti che “a pensare male si fa peccato, ma spesso ci si azzecca”, un po’ viene da sorridere.
Il pregresso
Tutto inizia nel dicembre 2023, quando il New York Times accusa OpenAI e il suo partner Microsoft di aver utilizzato milioni dei suoi articoli per addestrare i modelli di intelligenza artificiale di Sam Altman, senza autorizzazione.
Secondo il Times, ciò viola i diritti di copyright e porta ChatGPT a competere direttamente coi contenuti editoriali del giornale.
Per suffragare queste tesi, nel corso di quest’anno i legali del NYT hanno analizzato oltre 150 ore di dati d’addestramento del modello di intelligenza artificiale, cercando prove che dimostrassero l’utilizzo non autorizzato dei loro articoli.
Whoopsie!
Arriviamo così alla news di oggi. Avete presente tutte quelle faticose ore di lavoro? Ebbene, sono state inutili dal momento che è emerso che OpenAI ha accidentalmente cancellato i relativi dati, compromettendo così quanto raccolto dal New York Times.
A raccontare l’episodio è un documento presentato in tribunale pochi giorni fa, nel quale l’azienda di Sam Altman ammette l’errore, definendolo un “problema tecnico”, pur non spiegando come sia avvenuto questo errore né cosa contenessero esattamente i dati.
“Sto facendo seguito alla questione sollevata nella mia email del 15 novembre”, si legge a cavallo di pagina 2 e 3, “relativa al fatto che i contenuti dell’SSD di una delle macchine virtuali dedicate che stavamo utilizzando per l’ispezione dei dati di addestramento sono stati cancellati da OpenAI. Dopo aver parlato questa mattina con i nostri consulenti, abbiamo appreso che, sebbene una quantità significativa dei dati cancellati da OpenAI sia stata recuperata, la struttura delle cartelle e i nomi dei file sono stati irrimediabilmente persi, il che purtroppo rende i dati recuperati inutilizzabili.”
Dal documento si apprende quindi che OpenAI avrebbe tentato di recuperare i dati eliminati. Purtroppo, e immaginiamo il rammarico di Sam Altman in questo difficile momento, quanto è stato recuperato risulta incompleto e dunque inutilizzabile. Il che rende impossibile dimostrare con precisione l’eventuale utilizzo degli articoli del quotidiano da parte di OpenAI per addestrare i ChatGPT.
I legali di OpenAI definiscono a pagina 4 la cancellazione accidentale un “glitch,” mentre gli avvocati del Times dimostrano un grande fairplay affermando di non avere motivo di sospettare intenzionalità da parte dell’azienda di Sam Altman.
Va notato che OpenAI ha scelto di non presentare l’aggiornamento congiunto in tribunale col New York Times. La dichiarazione è stata pertanto firmata dall’avvocato Jennifer Maisel, rappresentante della testata giornalistica, per notificare formalmente l’accaduto.
OpenAI, attraverso il suo portavoce Jason Deutrom, ha annunciato che presenterà una propria versione dei fatti nei prossimi giorni. Il Times ha rifiutato di commentare ulteriormente.
La battaglia miliardaria del Times
La richiesta di risarcimento di New York Times Company è gigantesca: si parla infatti di “miliardi di dollari” in danni legali e reali per l’uso non autorizzato dei suoi articoli.
Finora, lo scontro legale è costato oltre un milione di dollari al Times. Un prezzo irrisorio per il celebre quotidiano americano, ma difficile da sostenere per molti altri editori. Il che pone una domanda: chi può permettersi di sfidare giganti tecnologici come OpenAI?
Non è un caso, pertanto, che grandi gruppi editoriali come Axel Springer, Conde Nast e Vox Media abbiano preferito adottare un’altra strategia, siglando accordi proprio con OpenAI.
La partnership con l’azienda californiana è senza dubbio una scelta più sicura e remunerativa, rispetto a una costosa disputa legale. Tanto più se le informazioni più importanti possono sparire dall’oggi al domani, per errore.


