Reddit dichiara guerra a chi usa i suoi contenuti senza pagare. E secondo il New York Times, la piattaforma social ha intentato una causa contro Anthropic, la società di San Francisco che sviluppa il chatbot Claude, accusandola di aver “ottenuto accesso” o “tentato di farlo oltre 100.000 volte”, violando apertamente le regole sui contenuti.
Nel testo depositato presso la Superior Court della California, Reddit sostiene che Anthropic abbia deliberatamente evitato qualsiasi trattativa per ottenere una licenza, scegliendo invece di continuare a raccogliere conversazioni pubbliche per addestrare i propri modelli di intelligenza artificiale.
Un comportamento che, secondo Reddit, non è solo scorretto ma profondamente lesivo dei diritti degli utenti: “Le aziende di IA non dovrebbero avere il diritto di fare scraping di informazioni e contenuti delle persone senza limiti chiari su come possono utilizzare quei dati”, ha dichiarato Ben Lee, chief legal officer di Reddit.
Reddit, un archivio prezioso
Reddit è una miniera d’oro di dati conversazionali, e le big tech lo sanno. Il sito, fondato vent’anni fa e sbarcato in borsa l’anno scorso, raccoglie ogni giorno centinaia di milioni di righe di contenuti generati dagli utenti. Sono discussioni spesso genuine, articolate, non filtrate: perfette per addestrare chatbot e modelli linguistici. Proprio per questo Reddit ha scelto di difendere il proprio patrimonio con un approccio commerciale.
Nei mesi scorsi, il CEO Steve Huffman ha avviato trattative con aziende come Google e OpenAI, portando a casa accordi di licenza che prevedono un pagamento per l’accesso ai dati pubblici. Il principio è semplice: se vuoi usare Reddit per addestrare la tua IA, paghi. E soprattutto, rispetti le condizioni di utilizzo e la privacy degli utenti.
Anthropic, però, avrebbe fatto l’esatto contrario. Secondo Reddit, la startup guidata da Dario Amodei avrebbe sistematicamente ignorato la possibilità di un’intesa, continuando invece a “rubare” i contenuti della piattaforma senza autorizzazione.
Una battaglia sempre più centrale per l’IA
La causa di Reddit si inserisce in una crescente ondata di contenziosi legati all’uso dei dati digitali da parte delle aziende di IA. Il caso più noto resta quello del New York Times, che nel 2023 ha citato in giudizio OpenAI e Microsoft per violazione del copyright, accusandole di aver usato milioni di articoli per addestrare ChatGPT senza autorizzazione.
La stessa testata, però, ha recentemente stretto un accordo con Amazon per la concessione in licenza dei propri contenuti, destinati alle piattaforme IA del colosso tech.
Il messaggio che emerge da queste azioni legali è chiaro: il tempo del “prendi e scappa” con i dati di internet è finito. E le aziende che hanno costruito archivi digitali di valore, come Reddit, non hanno più intenzione di lasciarli sfruttare gratuitamente, né di restare a guardare mentre altri monetizzano.


