Il New York Times intensifica la sua battaglia legale contro le aziende di intelligenza artificiale.
Dopo aver citato in giudizio OpenAI alla fine dello scorso anno, accusandola di aver utilizzato milioni di articoli del quotidiano senza autorizzazione per addestrare il suo chatbot, ora il gigante dei media ha inviato una diffida alla startup Perplexity AI.
La nuova contestazione segna l’ultimo capitolo in un conflitto crescente tra il mondo dell’informazione e le società che sviluppano modelli di AI generativa.
Chi è Perplexity
Ne abbiamo già scritto in passato ma, per chi andasse di fretta, ecco un veloce riassunto. Perché non parliamo della solita startup specializzata in intelligenza artificiale, quanto dell’azienda che ha mostrato la strada per detronizzare Google.
Perplexity, infatti, usa l’IA generativa per migliorare l’esperienza di ricerca. A differenza dei motori tradizionali come Google, che restituiscono una lista di link e frammenti di testo in risposta a una richiesta dell’utente, Perplexity dà risposte sintetiche e dirette, basate su dati raccolti da varie fonti online.
Questo approccio rivoluziona il modo in cui gli utenti accedono alle informazioni, riducendo il tempo necessario per trovare risposte pertinenti e precise.
Il vantaggio principale di Perplexity risiede nella sua capacità di combinare la ricerca web col ‘ragionamento’ dell’intelligenza artificiale. Anziché costringere gli utenti a cliccare su vari link per raccogliere dati frammentati (e frammentari), la piattaforma genera un riepilogo completo delle informazioni disponibili.
Questa immediatezza, unita alla trasparenza delle fonti utilizzate, offre un‘esperienza di ricerca più semplice e intuitiva, attraendo utenti che desiderano risposte veloci senza dover navigare in decine di pagine.
Cotanta efficienza rappresenta anche una minaccia per il modello di business di Google, che si basa in gran parte sulla visualizzazione di pubblicità nei risultati di ricerca.
Ecco perché nei mesi scorsi il colosso di Mountain View ha introdotto Overview, una funzione progettata per competere proprio coi sistemi come Perplexity. E che non è andata subito bene come forse qualcuno s’aspettava…
Le cause del New York Times
Non credendo sia necessario spiegare chi e cosa sia il New York Times, ora abbiamo ben chiara chi sia l’altra parte in causa che sta per scendere nell’arena (quella legale, s’intende). Un’arena che il quotidiano americano ben conosce, visto il precedente importante rappresentato dalla causa in corso con OpenAI.
Il New York Times sostiene che l’azienda di Sam Altman abbia sfruttato il vasto archivio di articoli del quotidiano senza alcun permesso per addestrare il proprio modello linguistico. E, sostanzialmente, nella diffida della quale abbiamo appreso ieri, in realtà datata 2 ottobre, accusa Perplexity della stessa cosa.
Nella lettera, il quotidiano accusa infatti la startup di violare le leggi sul copyright, utilizzando i suoi contenuti per creare riassunti e altri risultati senza autorizzazione.
Nonostante Perplexity abbia assicurato in precedenza di non fare uso di tecnologie di “crawling” per raccogliere dati, il quotidiano sostiene che i suoi articoli continuano a essere utilizzati dalla piattaforma.
“Non stiamo raccogliendo dati per costruire modelli di base, ma piuttosto indicizzando pagine web e utilizzando contenuti fattuali come citazioni per informare le risposte quando un utente pone una domanda”, ha dichiarato Perplexity a Reuters.
Tradotto, intendono che non stanno prendendo enormi quantità di informazioni da internet per “addestrare” i loro modelli di intelligenza artificiale, come fa OpenAI per ChatGPT, ad esempio. Invece, starebbero semplicemente “indicizzando” le pagine web per poi usarle come fonti di fatto (“contenuti fattuali”).
Tuttavia, il New York Times ha chiesto alla startup di fornire informazioni dettagliate entro il 30 ottobre su come acceda ai contenuti del sito, nonostante i tentativi di bloccarne l’estrazione.
Il problema dell’addestramento delle IA
Questo episodio non è un caso isolato. Da tempo gli editori, non solo negli Stati Uniti ma in tutto il mondo, stanno sollevando preoccupazioni sul fatto che i chatbot, come ChatGPT, stanno utilizzando i loro contenuti senza alcun compenso.
Alcune testate, come Forbes e Wired, hanno accusato Perplexity di plagio, un’accusa che la startup ha cercato di mitigare con l’introduzione di un programma di condivisione dei ricavi con gli editori, in un tentativo di pacificazione in un contesto sempre più teso.
La battaglia tra i colossi dell’informazione e le aziende di AI generativa mette comunque in luce uno dei dilemmi più complessi dell’era digitale: come bilanciare l’innovazione tecnologica con la tutela dei diritti d’autore e il giusto compenso per i contenuti creativi.
Le cause in corso potrebbero gettare le basi per una regolamentazione più rigida, definendo le linee guida per l’uso dei dati da parte dei modelli di intelligenza artificiale.
Per ora, ciò che è chiaro è che l’era dell’intelligenza artificiale dovrà fare i conti con la necessità di rispettare il lavoro e i diritti degli editori.


