Ventiquattromila account falsi. Sedici milioni di conversazioni generate di nascosto. È questo, secondo Anthropic, il metodo con cui tre aziende cinesi di intelligenza artificiale (DeepSeek, Moonshot AI e MiniMax) avrebbero sistematicamente estratto conoscenza dai suoi modelli Claude per migliorare i propri.
Il laboratorio americano ha pubblicato lunedì un post in cui descrive l’operazione nei dettagli: DeepSeek avrebbe generato oltre 150.000 conversazioni mirate sulle capacità di ragionamento di Claude, Moonshot circa 3,4 milioni focalizzate sulla programmazione, MiniMax addirittura 13 milioni su funzioni diverse.
Le tre aziende non hanno risposto alle richieste di commento. Zhang Yu, ricercatore di Moonshot, si è limitato a ripostare il comunicato di Anthropic su X con un’emoji con gli occhi al cielo.
La tecnica al centro dell’accusa si chiama distillazione o, più formalmente, knowledge distillation. Consiste nel trasferire le capacità di un modello grande e costoso a uno più piccolo e leggero, facendogli “studiare” gli output del primo.
Non è una pratica nuova né clandestina: nel 2015, tre ricercatori tra cui Geoffrey Hinton, il cosiddetto “padrino dell’IA”, premio Nobel per la fisica nel 2024, pubblicarono il paper fondativo “Distilling the Knowledge in a Neural Network”, mostrando come fosse possibile comprimere l’intelligenza di sistemi complessi in architetture più agili.
Da allora, la tecnica è diventata uno strumento standard dello sviluppo di modelli in tutto il mondo.
Anthropic e la zona grigia
Anthropic è chiara su un punto: la distillazione in sé non è illegale. Il problema, secondo l’azienda, è un altro: i suoi termini di servizio vietano esplicitamente ai concorrenti di usare i modelli di Claude per addestrare i propri sistemi, e limitano l’accesso dalla Cina per ragioni di sicurezza nazionale.
Non è una questione di brevetti o diritto d’autore, dunque, ma di contratto violato… e di geopolitica.
Questa distinzione, però, non convince tutti. Alcuni esperti del settore fanno notare che la pratica è talmente diffusa da rendere difficile persino dimostrarne l’assenza.
“Non riesco a immaginare come gli autori avrebbero potuto dimostrare di non aver distillato GPT”, ha dichiarato Huan Sun, professore associato di informatica alla Ohio State University. Il punto non è solo tecnico: è che i confini tra ispirazione, imitazione e copia sono, nel campo dell’IA, strutturalmente labili.
Le difese cinesi e i precedenti
Moonshot non è nuova a questo tipo di accuse. Il mese scorso, durante una discussione su Reddit seguita al rilascio del suo modello Kimi K2.5, alcuni utenti avevano notato che il modello si identificava occasionalmente come Claude.
Il fondatore e CEO Yang Zhilin aveva attribuito l’episodio alla presenza di “dati di programmazione da internet” finiti nel sistema di addestramento, una spiegazione che, nella sua vaghezza, dice molto sulle opacità del processo. Yang ha anche rivendicato che il K2.5 supera Claude in diversi benchmark.
Anche DeepSeek si trova in una posizione già nota. All’inizio di febbraio, OpenAI ha inviato un memorandum alla Commissione speciale della Camera dei rappresentanti sulla Cina, accusando la startup di aver usato tecniche di distillazione su modelli americani. È la seconda volta: la prima risale al gennaio del 2024.
DeepSeek non pubblica i propri dati di addestramento, e i suoi ricercatori sostengono che il modello R1 sia stato addestrato sul web. Il che, paradossalmente, lo esporrebbe ai contenuti generati da altri sistemi di IA senza che nessuno possa controllare esattamente cosa sia entrato nel processo.
Il boomerang
È qui che la storia si complica. Elon Musk, il cui laboratorio xAI compete direttamente con Anthropic, ha colto l’occasione per attaccare: “Anthropic è colpevole di aver rubato dati di addestramento su scala massiccia e ha dovuto pagare accordi multimiliardari per i suoi furti”.
È un’accusa che va letta con attenzione al contesto: Musk ha interessi diretti a indebolire Anthropic, e la sua posizione riflette un conflitto di interessi evidente.
Ma il punto che solleva merita una precisazione. Tutti i grandi laboratori occidentali (Anthropic inclusa, come OpenAI, Google e Meta) hanno addestrato i propri modelli su enormi quantità di testo raccolto da internet, spesso senza il consenso esplicito degli autori originali. Cause legali da parte di editori, scrittori e artisti sono in corso su entrambe le sponde dell’Atlantico.
La domanda, allora, diventa scomoda: dov’è esattamente il confine tra il lecito scraping di dati altrui e la distillazione non autorizzata dei modelli di un concorrente? La risposta onesta è che quel confine non è mai stato tracciato con chiarezza. E questa vicenda lo dimostra.
Nel frattempo, i mercati guardano altrove. Le azioni di MiniMax, sbarcata in borsa a gennaio, hanno chiuso martedì in rialzo di quasi il 5%, con un +155% rispetto al prezzo di quotazione. Quelle di Zhipu AI, un’altra azienda cinese già finita nel mirino per pratiche simili, sono salite del 12%, quasi triplicando dalla quotazione del mese scorso. Gli investitori, evidentemente, scommettono sulla traiettoria di crescita dei modelli cinesi.
Le questioni di compliance, per ora, gli interessano poco.
Fonte: South China Morning Post


