Cos’è Gemma, il nuovo chatbot “open-weights” gratuito di Google

da | 23 Feb 2024 | IA

Tempo di lettura: 2 minuti

Nell’ambito dell’intelligenza artificiale e più specificatamente dei modelli linguistici, il termine “open-weights” indica una categoria che rende pubblicamente accessibili e fruibili la sua struttura e i pesi (cioè i parametri che ha acquisito durante il suo addestramento) a ricercatori, sviluppatori e al vasto pubblico.

È però fondamentale distinguere il concetto di “open-weights” da quello di “open source”. Mentre “open source” implica l’accesso non solo ai pesi ma anche al codice sorgente, con una licenza che ne permette una più ampia modifica e condivisione, i modelli “open-weights” si concentrano principalmente sulla disponibilità dei pesi. In questo caso, il codice sorgente può non essere del tutto aperto o liberamente modificabile.

Ora che abbiamo fatto questa precisazione, è più facile passare alla notizia vera e propria, che vede Google aver recentemente annunciato il lancio di Gemma. Si tratta di una serie di innovativi modelli di LLM gratuiti e di tipo open-weights (ora sappiamo che significa), basati su tecnologie simili ai modelli Gemini, noti per la loro potenza ma di natura chiusa.

La caratteristica distintiva di Gemma è la sua capacità di funzionare direttamente su computer desktop o portatili e i modelli sono offerti in due versioni: Gemma 2B, con 2 miliardi di parametri, e Gemma 7B, con 7 miliardi di parametri.

In passato, i modelli LLM open-weights di dimensioni ridotte sono stati per lo più considerati come dimostrazioni tecnologiche, a causa delle loro limitate capacità. Tuttavia, recentemente alcuni modelli più grandi hanno iniziato a raggiungere livelli prestazionali paragonabili a quelli di GPT-3.5. Gli esperti ritengono che i modelli con codice sorgente e pesi accessibili siano fondamentali per garantire trasparenza e privacy nei chatbot.

Google Gemma, che come abbiamo spiegato non è classificabile come “open source” nel senso tradizionale del termine, sembra essere una risposta a Meta, che ha destato attenzione nel rilasciare modelli open-weights come LLaMA e Llama 2, in contrasto con modelli come GPT-4 Turbo di OpenAI, non eseguibili localmente.

Google afferma che il modello 7B di Gemma supera i modelli Llama 2 7B e 13B di Meta in vari benchmark, tra cui compiti di matematica, generazione di codice Python, conoscenza generale e ragionamento di senso comune. È già disponibile su Kaggle, una piattaforma per il machine learning, e su Hugging Face.

POTREBBE INTERESSARTI

amazon logo
• ⏱ 3 min

I dipendenti Amazon usano l’IA anche quando non serve, per sembrare efficienti

Con 200 miliardi di investimenti da giustificare, Amazon vuole dati sull’utilizzo. E i suoi dipendenti glieli danno (ma non nel modo atteso).

nadella sutskever altman
, • ⏱ 3 min

Musk vs. Altman: le testimonianze di Nadella e Sutskever

Il CEO di Microsoft definisce “roba da dilettanti” il tentativo di rimozione del 2023; l’ex chief scientist di OpenAI conferma che Altman sabotava i...
OpenAI
, • ⏱ 2 min

OpenAI vuole ingegneri nelle aziende: nasce la Deployment Company

L’acquisizione di Tomoro porta 150 specialisti pronti al lavoro. Sullo sfondo, la corsa con Anthropic per conquistare il mercato enterprise.

lavoratori cina
• ⏱ 2 min

In Cina non si licenzia più per colpa dell’IA

Un tribunale di Hangzhou stabilisce che l’automazione non è una causa legale di licenziamento. E le imprese devono fare i conti con una giurisprudenza in...
Fairwater IA data center Microsoft compute tax
, • ⏱ 4 min

La “compute tax”: ecco perché si torna a parlare di tassare l’IA

Tra redistribuzione e fuga di capitali, il dibattito sulla tassazione dell’IA scalda la campagna elettorale americana.

SpaceX Anthropic
• ⏱ 3 min

Anthropic affitterà i server di Musk

Colossus 1, il data center da centinaia di migliaia di chip Nvidia, cambia inquilino. E la corsa alla potenza di calcolo di Anthropic aggiunge un tassello...
Shivon Zilis Elon Musk
, • ⏱ 5 min

Secondo Shivon Zilis, Musk voleva fondere OpenAI in Tesla

Le testimonianze della compagna di Musk, Shivon Zilis, insieme a quelle di Brockman e Murati, ricostruiscono i sei mesi del 2017-2018 in cui il fondatore di Tesla tentò...
atlas
• ⏱ 3 min

Atlas di Boston Dynamics ora fa ginnastica

L’azienda, posseduta da Hyundai, spinge la robotica per il lavoro in fabbrica. Lo schieramento negli stabilimenti partirà dal 2028.

Dario Amodei Anthropic Claude
, • ⏱ 3 min

Anthropic lancia dieci agenti finanziari e si allea con Goldman e Blackstone

Dario Amodei e Jamie Dimon sul palco insieme: la finanza è il nuovo fronte della guerra tra Anthropic e OpenAI?

Greg Brockman
, • ⏱ 3 min

OpenAI a processo: i 30 miliardi di Brockman sono un problema

Il processo Musk entra nella seconda settimana con un’arma inattesa: le pagine del diario di Greg Brockman scritte durante la lotta per il controllo del...
Share This