Apple, Nvidia e Anthropic hanno usato migliaia di video di YouTube “rubati” per addestrare le IA

da | 19 Lug 2024 | Tecnologia

Tempo di lettura: 2 minuti

Apple, Nvidia, Anthropic e Salesforce sono tra le aziende accusate di aver utilizzato illegalmente i sottotitoli di migliaia di video di YouTube per addestrare i loro sistemi di intelligenza artificiale.

A dirlo è l’indagine di Proof News, che ha messo in luce come i sottotitoli di 173.536 video di YouTube, sottratti da più di 48.000 canali educativi, di intrattenimento e di apprendimento online, sono stati utilizzati senza il consenso dei rispettivi creator.

Il problema nasce dal fatto che gli autori non sono stati risarciti per l’utilizzo del loro materiale e molti sono preoccupati per come tali dati potrebbero essere utilizzati in futuro.

Dal canto loro, le aziende coinvolte nella querelle si difendono sostenendo che i sottotitoli sono pubblicamente disponibili e che il loro utilizzo rientra nel cosiddetto fair use. Tuttavia, questa affermazione è contestata da molti, che sottolineano come l’utilizzo di questi dati per scopi commerciali sia tutt’altro che lecito.

I rappresentanti di EleutherAI, i creatori del set di dati, non hanno risposto alle richieste di commento sui risultati dell’inchiesta, comprese le accuse secondo cui i video sarebbero stati utilizzati senza autorizzazione.

Il sito web dell’azienda afferma che il suo obiettivo generale è quello di abbassare le barriere allo sviluppo dell’intelligenza artificiale per coloro che si trovano al di fuori del cerchio della Big Tech. Peccato che in questo caso si parli di aziende quali appunto Apple, Nvidia, Anthropic e Salesforce…

Secondo un documento di ricerca pubblicato da EleutherAI, comunque, il set di dati fa parte di una raccolta pubblicata dall’organizzazione no-profit chiamata Pile. La maggior parte dei set di dati del Pile sono accessibili e aperti a chiunque su Internet disponga di spazio e potenza di calcolo sufficienti per accedervi. Tra questi figurano i succitati colossi, che hanno sfruttato questo lavoro per addestrare i loro sistemi di intelligenza artificiale.

“The Pile include un sottoinsieme molto piccolo di sottotitoli YouTube”, ha detto Jennifer Martinez, portavoce di Anthropic, in una dichiarazione in cui conferma l’uso di Pile nell’assistente AI generativo della compagnia, Claude. “I termini di YouTube coprono l’uso diretto della sua piattaforma, che è distinto dall’uso del set di dati creati da Pile. Per quanto riguarda le potenziali violazioni dei termini di servizio di YouTube, dovremmo indirizzarvi pertanto a loro“.

I sottotitoli di YouTube e altri tipi di dati di sintesi vocale sono potenzialmente una “miniera d’oro”, perché possono aiutare ad addestrare modelli per replicare il modo in cui le persone parlano e conversano, ma restano ancora irrisolte le questioni relative all’autorizzazione e al pagamento.

POTREBBE INTERESSARTI

cover manageengine
, • ⏱ 5 min

Cyber resilience: la survey di ManageEngine indica un’Italia a metà del guado

Presentata a Milano insieme ai numeri del Clusit, la ricerca fotografa aziende italiane brave a rilevare gli incidenti entro 24 ore ma lente a ripristinare...
Rheinmetall panther difesa
• ⏱ 3 min

Dai carri armati ai droni: la Borsa volta le spalle alla difesa europea

Leonardo, Rheinmetall e Thales: “Vecchia scuola, vecchia economia”. Dopo anni di rialzi, il mercato s’accorge che gli ordini non diventano profitti...
data center amazon
, • ⏱ 3 min

Amazon dice di consumare 9 miliardi di litri d’acqua. Ma il conto è parziale

L’azienda rivela il consumo idrico dei suoi server e si dichiara più efficiente di Microsoft. La trasparenza, però, arriva sotto la pressione di moratorie...
NSO Group Pegasus Whatsapp
• ⏱ 3 min

WhatsApp riporta NSO in tribunale: “Pegasus colpisce ancora, nonostante il divieto”

Un anno dopo il risarcimento da 168 milioni e il divieto permanente, Meta sostiene che il gruppo israeliano abbia ripreso a infettare gli utenti con un nuovo...
cybersecurity
• ⏱ 3 min

Riscatti, dighe e passaporti: il conto della cybersecurity nel 2026

Energia, acqua, scuole e ospedali: gli attacchi non rubano più solo dati, fermano i servizi e mettono a rischio le persone.

Elon Musk terafab
• ⏱ 2 min

ASML prende sul serio Terafab e invita Musk a parlare ai suoi dipendenti

Dopo Intel, il colosso olandese è il secondo pilastro dell’industria dei chip a mostrare interesse per Terafab, il progetto con cui Musk vuole emanciparsi da...
satelliti militari ucraina
• ⏱ 4 min

Satelliti, IA e droni: così Kiev accorcia i tempi dell’attacco

Un’indagine del Wall Street Journal mostra come le immagini satellitari commerciali finiscano ormai quasi in tempo reale sui dispositivi dei soldati ucraini....
Helion
, • ⏱ 4 min

Fusione nucleare, Altman punta su Helion per dare energia a Microsoft

Mentre l’IA aumenta la fame di elettricità dei grandi gruppi tech, il fondatore di OpenAI sostiene la startup che promette di alimentare Microsoft con una centrale a...
Peter Thiel Palantir
• ⏱ 3 min

Peter Thiel sceglie l’Argentina: Milei e la fuga dalla California e dall’Anticristo

Il venture capitalist di destra trova in Milei un alleato ideologico, mentre i critici temono per i dati personali degli argentini e il ruolo di Palantir.

Enhanced Games
• ⏱ 4 min

Enhanced Games, il doping come spettacolo a Las Vegas

Ormoni, testosterone e telemedicina. Dietro gli Enhanced Games sostenuti da Peter Thiel e Donald Trump Jr. c’è molto più di una gara sportiva: c’è il tentativo di...
Share This