A Stanford replicano un modello IA avanzato con 50 dollari!

da | 6 Feb 2025 | IA

Neanche una settimana fa scrivevamo della ‘distillazione’, una tecnica che consente a un modello di intelligenza artificiale più piccolo di apprendere da uno più avanzato ponendogli centinaia di migliaia di domande e analizzando le risposte.

In quell’occasione abbiamo scritto di un team dell’Università di Berkeley, che ha sviluppato un modello di IA paragonabile aOpenAI con un budget di soli 450 dollari, distillando un modello open-source dell’azienda cinese Alibaba.

Ma i record, si sa, sono fatti per essere battuti.

L’exploit di Stanford

Quello che non ci immaginavamo è che a distanza di una settimana un gruppo di ricercatori di Stanford e dell’Università di Washington riuscisse a batterlo. Rafforzando così l’idea che l’innovazione nell’intelligenza artificiale non è esclusiva delle grandi aziende con budget miliardari.

Con meno di 50 dollari di crediti per il cloud computing, sono infatti riusciti ad addestrare un modello AI di “ragionamento” capace di competere con le soluzioni più avanzate di OpenAI e DeepSeek.

Il loro modello, chiamato s1, è disponibile su GitHub, insieme al codice e ai dati utilizzati per la sua formazione.

Quando pochi pagano per tutti

L’elemento chiave dell’impresa dei ricercatori di Stanford è la succitata distillazione, alla base del successo di DeepSeek. In questo caso, i ricercatori hanno distillato s1 partendo da uno dei modelli di ragionamento di Google, il Gemini 2.0 Flash Thinking Experimental.

Il successo di s1 solleva nuovamente interrogativi sulle strategie miliardarie dei big della Silicon Valley. Se un piccolo team può replicare le capacità di modelli che hanno richiesto investimenti milionari con poche risorse, quale sarà il futuro del settore?

Non è un caso che le grandi aziende del settore non vedano di buon occhio queste evoluzioni.

OpenAI ha già accusato DeepSeek di aver sfruttato in modo improprio i dati della sua API per distillare un modello concorrente. Anche Google potrebbe non essere entusiasta dell’utilizzo del suo Gemini 2.0 Flash Thinking Experimental, visto che i suoi termini di servizio vietano espressamente l’ingegneria inversa dei modelli per lo sviluppo di prodotti concorrenti.

Soli 30 minuti e un dataset di 1.000 domande

Il team di Stanford ha seguito un approccio pragmatico per ottenere il massimo delle capacità di ragionamento con il minimo sforzo.

Per addestrare s1, ha utilizzato un piccolo modello AI open-source sviluppato dal laboratorio cinese Qwen, di proprietà di Alibaba, e ha costruito un dataset di sole 1.000 domande accuratamente selezionate, ciascuna accompagnata da risposte e dal “processo di pensiero” generato da Gemini 2.0.

L’addestramento ha richiesto meno di 30 minuti su 16 GPU Nvidia H100.

Un dettaglio interessante riguarda una soluzione inaspettata adottata dai ricercatori per migliorare la precisione delle risposte del modello: hanno semplicemente detto all’AI di “aspettare”.

Inserire la parola “wait” nelle istruzioni di ragionamento ha permesso a s1 di ottenere risultati leggermente più accurati, suggerendo che il tempo di elaborazione possa influire sulle prestazioni di un modello.

Ma le copie non creano nulla

Mentre colossi come Meta, Google e Microsoft si preparano a investire centinaia di miliardi di dollari per addestrare la prossima generazione di intelligenze artificiali, il caso di s1 dimostra che l’innovazione può anche seguire strade più economiche.

Tuttavia, sebbene la distillazione si sia rivelata un metodo efficace per riprodurre le capacità di un modello esistente, non sembra ancora in grado di generare sistemi significativamente più avanzati rispetto a quelli attuali.

La domanda quindi è aperta: basteranno modelli a basso costo come s1 per cambiare le regole del gioco, o il futuro dell’intelligenza artificiale resterà in mano ai grandi player del settore in grado di innovare realmente?

POTREBBE INTERESSARTI

Grok Elon Musk

Grok, la California ordina lo stop: “Materiale pedopornografico, tolleranza zero”

Il procuratore generale Bonta invia una diffida a Musk mentre l’amministrazione Trump continua a integrare Grok nei flussi di lavoro federali.

Elon Musk OpenAI causa

Causa OpenAI: Musk chiede 134 miliardi di risarcimento

Sam Altman aveva avvisato di “prepararsi al peggio da Musk”, così è stato. La richiesta poggia sul concetto dei “profitti indebiti”.

Trump Chip

Trump firma il dazio del 25% sui chip H200, ma Nvidia ringrazia

La Casa Bianca impone dazi sui semiconduttori di fascia alta in transito verso la Cina. Ma per Nvidia è una vittoria: finalmente può vendere ai clienti cinesi...
Sam Altman OpenAI Elon Musk

Sam Altman avvisa gli investitori: “Preparatevi al peggio da Musk”

In vista del processo di aprile, OpenAI prepara partner e finanziatori: aspettatevi “sparate a effetto” e “dichiarazioni fuori da ogni...
Mira Murati Thinking Machines

Il saccheggio di Thinking Machines: OpenAI si riprende tre co-fondatori

In meno di un anno la startup di Mira Murati perde quattro figure chiave. A quanto pare i soldi non comprano la lealtà neppure nell’industria...
pubblicità IA

La pubblicità bussa alla porta dei chatbot: Google apre, gli altri seguiranno

Il colosso di Mountain View sperimenta annunci in AI Mode. OpenAI e Perplexity osservano, Meta si prepara. E chi non vorrà spot dovrà probabilmente pagare

Brad Smith, presidente di Microsoft

Microsoft promette: i nostri data center non peseranno sulle bollette degli americani

L’azienda si impegna a non chiedere sgravi fiscali e a formare i residenti. Brad Smith: “Non chiediamo ai contribuenti di sovvenzionarci”.

Matthew McConaughey

McConaughey registra sé stesso come marchio contro i deepfake

Otto trademark approvati negli USA trasformano l’immagine dell’attore in un asset legale. Nel vuoto normativo sui deepfake, Hollywood ricorre...
Google AI Overviews

Google rimuove le AI Overviews per alcune ricerche mediche

Un’indagine del Guardian documenta errori potenzialmente letali nei riassunti sanitari del motore di ricerca. Il tempismo col lancio di ChatGPT Health solleva...
Google agente

Google entra nello shopping con gli agenti IA per i retailer

Con Gemini Enterprise for Customer Experience, Big G offre strumenti per costruire assistenti virtuali proprietari. Ma il commercio agentico è davvero dietro...
Share This