Apple, Nvidia e Anthropic hanno usato migliaia di video di YouTube “rubati” per addestrare le IA

da | 19 Lug 2024 | Tecnologia

Tempo di lettura: 2 minuti

Apple, Nvidia, Anthropic e Salesforce sono tra le aziende accusate di aver utilizzato illegalmente i sottotitoli di migliaia di video di YouTube per addestrare i loro sistemi di intelligenza artificiale.

A dirlo è l’indagine di Proof News, che ha messo in luce come i sottotitoli di 173.536 video di YouTube, sottratti da più di 48.000 canali educativi, di intrattenimento e di apprendimento online, sono stati utilizzati senza il consenso dei rispettivi creator.

Il problema nasce dal fatto che gli autori non sono stati risarciti per l’utilizzo del loro materiale e molti sono preoccupati per come tali dati potrebbero essere utilizzati in futuro.

Dal canto loro, le aziende coinvolte nella querelle si difendono sostenendo che i sottotitoli sono pubblicamente disponibili e che il loro utilizzo rientra nel cosiddetto fair use. Tuttavia, questa affermazione è contestata da molti, che sottolineano come l’utilizzo di questi dati per scopi commerciali sia tutt’altro che lecito.

I rappresentanti di EleutherAI, i creatori del set di dati, non hanno risposto alle richieste di commento sui risultati dell’inchiesta, comprese le accuse secondo cui i video sarebbero stati utilizzati senza autorizzazione.

Il sito web dell’azienda afferma che il suo obiettivo generale è quello di abbassare le barriere allo sviluppo dell’intelligenza artificiale per coloro che si trovano al di fuori del cerchio della Big Tech. Peccato che in questo caso si parli di aziende quali appunto Apple, Nvidia, Anthropic e Salesforce…

Secondo un documento di ricerca pubblicato da EleutherAI, comunque, il set di dati fa parte di una raccolta pubblicata dall’organizzazione no-profit chiamata Pile. La maggior parte dei set di dati del Pile sono accessibili e aperti a chiunque su Internet disponga di spazio e potenza di calcolo sufficienti per accedervi. Tra questi figurano i succitati colossi, che hanno sfruttato questo lavoro per addestrare i loro sistemi di intelligenza artificiale.

“The Pile include un sottoinsieme molto piccolo di sottotitoli YouTube”, ha detto Jennifer Martinez, portavoce di Anthropic, in una dichiarazione in cui conferma l’uso di Pile nell’assistente AI generativo della compagnia, Claude. “I termini di YouTube coprono l’uso diretto della sua piattaforma, che è distinto dall’uso del set di dati creati da Pile. Per quanto riguarda le potenziali violazioni dei termini di servizio di YouTube, dovremmo indirizzarvi pertanto a loro“.

I sottotitoli di YouTube e altri tipi di dati di sintesi vocale sono potenzialmente una “miniera d’oro”, perché possono aiutare ad addestrare modelli per replicare il modo in cui le persone parlano e conversano, ma restano ancora irrisolte le questioni relative all’autorizzazione e al pagamento.

POTREBBE INTERESSARTI

ICE
, • ⏱ 4 min

Ecco la tecnologia con cui ICE scheda i manifestanti e traccia i migranti

Con un budget triplicato a 28 miliardi di dollari, l’agenzia federale ha acquisito un arsenale di strumenti: da Clearview AI a Palantir, fino a software...
Fairwater AI data center Microsoft
, • ⏱ 3 min

Microsoft e il costo dell’IA: il consumo d’acqua raddoppierà entro il 2030

L’espansione dei data center per l’intelligenza artificiale sta trasformando le tech company in colossi industriali ad alto consumo di risorse. E nessuno è...
solitudine cina
• ⏱ 3 min

“Sei morto?”: ecco l’app che svela l’economia della solitudine cinese

Un’applicazione di check-in per amici e familiari accende il dibattito su un cambiamento strutturale in Cina, che presto riguarderà anche l’Europa.

cina droni swarm
• ⏱ 4 min

La Cina sta addestrando droni killer studiando falchi e coyote

Pechino produce l’80% dei droni mondiali e vuole usarli in guerra. Washington prova a recuperare ma entrambe le superpotenze rifiutano regole per l’IA...
Mark Zuckerberg Meta Hyperion
• ⏱ 2 min

Meta sperimenterà abbonamenti premium su Instagram, Facebook e WhatsApp

Il colosso di Zuckerberg esplorerà nei prossimi mesi formule a pagamento per sbloccare funzionalità esclusive e strumenti di intelligenza artificiale.

Tibet
• ⏱ 4 min

Pechino collega il Tibet alle fabbriche del sud: nasce la mega-rete dell’energia verde

Una linea ultra-alta tensione energia dalle montagne tibetane ai data center e alle fabbriche della costa. Nel frattempo, negli USA inizia a mancare l’elettricità...
Microsoft BitLocker
• ⏱ 3 min

Microsoft ha passato le chiavi BitLocker all’FBI per accedere ai laptop di alcuni sospettati

Il caso riaccende i dubbi sulla cifratura che vive nel cloud e sull’effettiva sicurezza delle informazioni personali.

Kangerlussuaq Airport Groenlandia
, • ⏱ 3 min

Groenlandia: degli ex trumpiani vogliono costruire un mega data center

L’iniziativa è guidata da ex funzionari dell’amministrazione Trump ma servono permessi, energia e il disgelo diplomatico con la Danimarca. E ora della sua...
tiktok usa
, • ⏱ 3 min

Nasce la versione a stelle e strisce di TikTok

Tra investitori miliardari e questioni di sicurezza irrisolte, l’app sopravvive al ban ma deve accettare un nuovo destino politico.

Elon Musk protezione
• ⏱ 4 min

Le aziende statunitensi potenziano la protezione dei propri leader

Tra minacce social e instabilità politica, la tutela dei CEO diventa una priorità di bilancio. I dati ISS-Corporate confermano l’impennata dei costi per i profili...
Share This