Nightshade e Glaze: ecco come gli artisti possono proteggersi dal data scraping

da | 22 Gen 2024 | IA

Tempo di lettura: 3 minuti

Il data scraping, processo di raccolta automatizzata di grandi quantità di dati da svariate fonti online, è diventato uno strumento indispensabile nell’addestramento delle intelligenze artificiali. Questa pratica si basa sull’estrazione di informazioni da siti web, social media, forum e altre piattaforme digitali, spesso senza il consenso esplicito dei proprietari dei contenuti. Se, da un lato, il data scraping facilita la raccolta di dati necessari per alimentare e affinare algoritmi complessi, dall’altro pone importanti interrogativi sul rispetto dei diritti d’autore.

Questi diritti, garantiti a livello internazionale da trattati come la Convenzione di Berna, conferiscono agli autori il controllo esclusivo sulla pubblicazione, distribuzione e utilizzo delle proprie opere. Nel contesto del data scraping, le IA possono finire per utilizzare materiale protetto da diritto d’autore per il loro addestramento, senza l’autorizzazione dei detentori dei diritti. Questo non solo contravviene alle leggi sul copyright ma solleva anche questioni etiche sul giusto compenso e riconoscimento degli autori originali.

Un esempio notevole è quello dei modelli di apprendimento automatico per il riconoscimento visivo e la generazione di testo. Questi modelli, per essere efficaci, richiedono vasti dataset che spesso includono opere d’arte, fotografie e scritti pubblicati online. Se questi contenuti venissero raccolti e utilizzati senza permesso, gli algoritmi potrebbero beneficiare illegalmente del lavoro creativo altrui.

Inoltre, la natura automatizzata e di ampia scala del data scraping, rende difficile per i creatori individuare e contestare l’uso non autorizzato delle loro opere. Ciò significa che molte violazioni dei diritti d’autore potrebbero passare inosservate, privando gli autori della possibilità di difendere i loro diritti.

La sfida, quindi, è duplice: da un lato, c’è la necessità di nutrire le IA con dati sufficienti per il loro sviluppo e funzionamento ottimale; dall’altro, è imperativo salvaguardare i diritti e gli interessi degli autori. Questi ultimi, però, ora hanno un modo in più per difendersi: Nightshade.

Questo strumento, sviluppato per “contrastare l’asimmetria di potere” nel campo dell’addestramento dei dati, trasforma le immagini in dei campioni velenosi. In pratica, se un modello di IA viene addestrato su queste immagini senza consenso, imparerà risultati imprevedibili e inaccurati. Per esempio, un modello che richieda l’immagine di una mucca, potrebbe generare invece una borsetta nello spazio.

Nightshade non punta a distruggere i modelli di IA, bensì a incrementare il costo dell’addestramento su dati non autorizzati, rendendo più conveniente l’utilizzo di immagini licenziate. Si differenzia da Glaze, un analogo strumento difensivo, dimostrandosi un mezzo più offensivo, volto a distorcere le rappresentazioni all’interno dei modelli generativi.

Glaze opera analizzando i modelli di IA che si addestrano sull’arte creata dall’uomo e, attraverso l’uso di algoritmi di machine learning, determina una serie di lievi modifiche alle opere. Questo fa sì che agli occhi umani sembrino inalterate, mentre per i modelli di IA appare con uno stile artistico radicalmente diverso. Per esempio, ciò che per gli esseri umani è un ritratto realistico a carboncino, agli occhi di un modello di IA “distratti” da Glaze potrebbe apparire come un’opera di arte astratta moderna, nello stile di Jackson Pollock.

Nightshade invece altera più aggressivamente l’interpretazione dell’immagine da parte del modello di IA. Questo metodo è resistente alle comuni modifiche dell’immagine e rimane efficace anche se l’immagine stessa viene manipolata o catturata da uno schermo.

Nightshade e Glaze, entrambi realizzati da team capitanati dal Prof. Ben Zhao, sono strumenti complementari: Glaze per la difesa individuale degli artisti e Nightshade come approccio collettivo per disturbare i modelli che usano immagini senza consenso. Gli sviluppatori raccomandano l’uso congiunto di entrambi gli strumenti.

Tuttavia, ci sono alcune limitazioni. Nightshade al momento funziona meglio su immagini con colori piatti e sfondi uniformi, e potrebbe non rimanere efficace indefinitamente, richiedendo aggiornamenti continui per rimanere al passo con le potenziali contromisure. Cosa più facile a dirsi che a farsi, essendo i creatori di Nightshade concentrati sulla ricerca e non sul profitto.

Nightshade, attualmente in versione standalone, è in fase di test per la compatibilità con Glaze. Presto, gli utenti di WebGlaze potranno applicare Nightshade e Glaze insieme, ottenendo una doppia protezione per le loro opere d’arte online.

POTREBBE INTERESSARTI

Elon Musk vs Sam Altman OpenAI
, • ⏱ 3 min

Musk in Cina, Altman in aula: il processo dell’anno ai titoli di coda

Altman accusato di mentire, Musk di amnesia selettiva: mentre la giudice prepara la sentenza finale, OpenAI difende il suo primato.

Jensen Huang Nvidia
, , • ⏱ 3 min

Trump porta Huang a Pechino: gli H200 sono approvati ma la Cina non li compra

Gli Stati Uniti hanno dato il via libera ma la Cina blocca i propri acquirenti. E nel mezzo c’è Nvidia, che ha visto la propria quota di mercato cinese...
Sundar Pichai. Foto: Sanjay Rawat
, , • ⏱ 3 min

Soci e rivali: Google e SpaceX trattano per i data center in orbita

Google è azionista di SpaceX da anni. Ora le due aziende potrebbero diventare partner sui lanci (e concorrenti nello spazio).

Trump USA Xi Jinping Cina
, , • ⏱ 4 min

Trump e Xi parlano di IA, ma il dialogo resta difficile

A Pechino l’intelligenza artificiale entra per la prima volta nell’agenda bilaterale USA-Cina. Le aspettative però sono basse: troppa rivalità, troppa...
sam altman reuters
, • ⏱ 4 min

Altman in aula: “Musk voleva il 90% di OpenAI”

Il CEO di OpenAI testimonia su donazioni, equity e metodi manageriali che “hanno devastato la cultura” del laboratorio.

amazon logo
• ⏱ 3 min

I dipendenti Amazon usano l’IA anche quando non serve, per sembrare efficienti

Con 200 miliardi di investimenti da giustificare, Amazon vuole dati sull’utilizzo. E i suoi dipendenti glieli danno (ma non nel modo atteso).

nadella sutskever altman
, • ⏱ 3 min

Musk vs. Altman: le testimonianze di Nadella e Sutskever

Il CEO di Microsoft definisce “roba da dilettanti” il tentativo di rimozione del 2023; l’ex chief scientist di OpenAI conferma che Altman sabotava i...
OpenAI
, • ⏱ 2 min

OpenAI vuole ingegneri nelle aziende: nasce la Deployment Company

L’acquisizione di Tomoro porta 150 specialisti pronti al lavoro. Sullo sfondo, la corsa con Anthropic per conquistare il mercato enterprise.

lavoratori cina
• ⏱ 2 min

In Cina non si licenzia più per colpa dell’IA

Un tribunale di Hangzhou stabilisce che l’automazione non è una causa legale di licenziamento. E le imprese devono fare i conti con una giurisprudenza in...
Fairwater IA data center Microsoft compute tax
, • ⏱ 4 min

La “compute tax”: ecco perché si torna a parlare di tassare l’IA

Tra redistribuzione e fuga di capitali, il dibattito sulla tassazione dell’IA scalda la campagna elettorale americana.

Share This