Cos’è Gemma, il nuovo chatbot “open-weights” gratuito di Google

da | 23 Feb 2024 | IA

Nell’ambito dell’intelligenza artificiale e più specificatamente dei modelli linguistici, il termine “open-weights” indica una categoria che rende pubblicamente accessibili e fruibili la sua struttura e i pesi (cioè i parametri che ha acquisito durante il suo addestramento) a ricercatori, sviluppatori e al vasto pubblico.

È però fondamentale distinguere il concetto di “open-weights” da quello di “open source”. Mentre “open source” implica l’accesso non solo ai pesi ma anche al codice sorgente, con una licenza che ne permette una più ampia modifica e condivisione, i modelli “open-weights” si concentrano principalmente sulla disponibilità dei pesi. In questo caso, il codice sorgente può non essere del tutto aperto o liberamente modificabile.

Ora che abbiamo fatto questa precisazione, è più facile passare alla notizia vera e propria, che vede Google aver recentemente annunciato il lancio di Gemma. Si tratta di una serie di innovativi modelli di LLM gratuiti e di tipo open-weights (ora sappiamo che significa), basati su tecnologie simili ai modelli Gemini, noti per la loro potenza ma di natura chiusa.

La caratteristica distintiva di Gemma è la sua capacità di funzionare direttamente su computer desktop o portatili e i modelli sono offerti in due versioni: Gemma 2B, con 2 miliardi di parametri, e Gemma 7B, con 7 miliardi di parametri.

In passato, i modelli LLM open-weights di dimensioni ridotte sono stati per lo più considerati come dimostrazioni tecnologiche, a causa delle loro limitate capacità. Tuttavia, recentemente alcuni modelli più grandi hanno iniziato a raggiungere livelli prestazionali paragonabili a quelli di GPT-3.5. Gli esperti ritengono che i modelli con codice sorgente e pesi accessibili siano fondamentali per garantire trasparenza e privacy nei chatbot.

Google Gemma, che come abbiamo spiegato non è classificabile come “open source” nel senso tradizionale del termine, sembra essere una risposta a Meta, che ha destato attenzione nel rilasciare modelli open-weights come LLaMA e Llama 2, in contrasto con modelli come GPT-4 Turbo di OpenAI, non eseguibili localmente.

Google afferma che il modello 7B di Gemma supera i modelli Llama 2 7B e 13B di Meta in vari benchmark, tra cui compiti di matematica, generazione di codice Python, conoscenza generale e ragionamento di senso comune. È già disponibile su Kaggle, una piattaforma per il machine learning, e su Hugging Face.

POTREBBE INTERESSARTI

ByteDance e Broadcom avviano una collaborazione strategica per l'IA
,

ByteDance e Broadcom: al via una collaborazione per l’IA

L’azienda americana produrrà un chip da 5nm per la casa madre di TikTok, che lo scorso anno avrebbe già investito 2 miliardi di dollari in chip Nvidia.

Apple rinvierà il lancio di Apple Intelligence nell'UE
,

Apple rinvierà il lancio di Apple Intelligence nell’UE

Il gigante tecnologico indica il Digital Markets Act come la causa di questa decisione.

TikTok prova a rivoluzionare l'ADV ma inciampa clamorosamente

TikTok prova a rivoluzionare l’ADV ma inciampa clamorosamente

I Symphony Digital Avatars, il nuovo strumento di TikTok per la creazione di contenuti generati dall’IA, finiscono nel mirino dopo che una falla ha consentito la...
Ecco come di comporta Claude 3.5 Sonnet rispetto agli altri modelli.

Più veloce e intelligente: ecco Claude 3.5 Sonnet

Claude 3.5 Sonnet è il modello più avanzato di Anthropic, e promette prestazioni superiori a GPT-4 e Gemini

Il produttore di chip TSMC vola in borsa

La valutazione di TSMC vola alle stelle trascinata di Nvidia

TSMC si sta avvicinando alla valutazione di mille miliardi di dollari a Wall Street trascinata da Nvdia e dall’esplosione dell’IA.

L'IA non è in grado di prendere ordini da McDonald's

McDonald’s: l’IA non è ancora in grado di prendere gli ordini al drive-in

McDonald’s, la famosa catena di fast food, negli Stati Uniti ha deciso di disabilitare un sistema basato sull’intelligenza artificiale utilizzato nei...
Jen-Hsun Huang durante una presentazione di Nvidia

Nvidia batte Microsoft ed è la società che vale di più al mondo

Spinta dal crescente interesse nel comparto dell’intelligenza artificiale, Nvidia ha infranto un nuovo record in borsa, superando anche Microsoft.

Il segretario della NATO Jens Stoltenberg

La NATO investe mille miliardi di euro in IA, robot e spazio

La NATO investe mille miliardi di euro in 4 aziende specializzate in tecnologia per lo sviluppo di IA, robotica e ingegneria spaziale.

I robots di Ex-Robots

In Cina stanno costruendo robot con espressioni facciali umane

L’ultima frontiera della tecnologia fonde la robotica con l’intelligenza artificiale. L’obiettivo è quello di usare l’IA per dare ai robot...
Sam Altman potrebbe trasformare OpenAI in una società benefit foto: Joel Saget/AFP/Getty Images

OpenAI potrebbe diventare una società benefit (e perseguire il profitto)

OpenAI, per competete al meglio contro Anthropic e xAI, potrebbe cessare di essere una no-profit. E c’è già chi come passo successivo s’immagina...
Share This