Cos’è Groq e perché non va confuso con Grok (di Elon Musk)

da | 25 Feb 2024 | IA

Negli ultimi tempi, un nuovo protagonista si è fatto strada nel panorama dell’intelligenza artificiale. Ci riferiamo al modello IA di Groq Inc., che sta rapidamente guadagnando attenzione sui social media e sfidando la supremazia di modelli come ChatGPT.

Groq, alimentato da chip progettati specificamente per modelli di linguaggio di grandi dimensioni (LLM), ha dimostrato di essere eccezionalmente veloce, superando ChatGPT-3.5 con una capacità di generare circa 500 token al secondo, un balzo significativo rispetto ai 40 token al secondo del chatbot di Sam Altman.

Groq Inc., attiva dal 2016, ha introdotto nel settore il primo Language Processing Unit (LPU), superando così la dipendenza dai costosi GPU. Ma cos’è una LPU? Si tratta di un motore di inferenza progettato per gestire applicazioni computazionalmente intensive con una componente sequenziale, come i LLM.

Questi motori superano i due principali colli di bottiglia degli LLM: la quantità di calcolo e la larghezza di banda della memoria. Con prestazioni nettamente superiori alle GPU di Nvidia, l’LPU promette una generazione di sequenze di testo più rapida e un’esperienza a bassa latenza capace di restituire testo istantaneamente, il tutto in un pacchetto energeticamente efficiente.

Nonostante la recente popolarità, la società dietro Groq non è nuova. Fondata nel 2016, ha attirato l’attenzione quando Elon Musk ha lanciato un modello di IA chiamato Grok, con una grafica leggermente diversa, sollevando questioni sul nome. Groq Inc. ha prontamente risposto con un post sul blog, chiedendo a Musk di scegliere un altro nome.

L’ascesa di Groq sui social media ha stimolato confronti tra il modello LPU e altri modelli basati su GPU. Un utente che lavora nello sviluppo dell’AI ha definito Groq un “game changer” per prodotti che richiedono bassa latenza, mentre un altro ha suggerito che gli LPU di Groq potrebbero offrire un “enorme miglioramento” rispetto alle GPU, specialmente per le esigenze future delle applicazioni IA, proponendosi come alternativa agli hardware di alta gamma come i chip A100 e H100 di Nvidia.

Questo sviluppo arriva in un momento in cui i principali attori delle intelligenze artificiali cercano di sviluppare chip interni per non dipendere esclusivamente dai modelli di Nvidia. Sam Altman, ad esempio, vuole creare una rete globale di fabbriche di chip per l’IA e superare i problemi di scalabilità dei suoi prodotti. E lo stesso vale per Mark Zuckerberg.

Groq Inc. dunque non solo sfida i giganti esistenti nel campo dell’IA ma apre anche la strada a nuove metodologie e tecnologie nel trattamento dei dati. Se sarà una svolta nel settore dell’intelligenza artificiale, lo scopriremo col tempo.

POTREBBE INTERESSARTI

adolescenti

Gli adolescenti americani e la nuova dipendenza dai chatbot IA

Dati, divari sociali e rischi emotivi nella fotografia del Pew Research Center sull’utilizzo dell’IA tra gli adolescenti USA.

Donald Trump Nvidia

Trump apre all’H200 verso la Cina (ma chiede a Nvidia un ‘pizzo’ del 25%

Il presidente degli Stati Uniti autorizza l’export del chip di fascia alta di Nvidia in cambio di una quota senza precedenti: un compromesso tra geopolitica, mercato e...
Cina qwen deepseek

La Cina accelera sull’open source: ora vale il 30% dell’utilizzo dell’IA

Un report di OpenRouter mostra l’ascesa dei modelli cinesi nonostante le restrizioni USA su Nvidia e AMD.

Arvind Krishna IBM

Il CEO di IBM avverte: “la corsa ai data center non potrà ripagarsi”

Secondo Arvind Krishna i costi attuali dell’infrastruttura rendono impossibile rientrare dai trilioni investiti nella potenza di calcolo.

silicon valley agenti ia

La Silicon Valley clona Amazon e Gmail per addestrare gli agenti IA

Start-up finanziate dai big del venture capital ricostruiscono i siti più usati al mondo per insegnare agli agenti digitali a navigare, prenotare, compilare e...
Zuckerberg Meta glasses

Meta valuta tagli fino al 30% al budget del Metaverso per il 2026

Meta starebbe considerando di ridurre del 30% il budget assegnato ai suoi sforzi per il metaverso nel 2026, così da allocare più risorse all’IA.

Cristiano Ronaldo e il CEO di Perplexity

Cristiano Ronaldo investe in Perplexity AI

Cristiano Ronaldo ha deciso di investire in Perplexity AI e di entrare a gamba tesa nel business dell’intelligenza artificiale.

WhatsApp

UE avvia un’indagine antitrust su Meta per l’uso dell’IA in WhatsApp

La Commissione Europea ha avviato un’indagine antitrust su Meta riguardo all’integrazione di funzionalità IA all’interno di WhatsApp.

Jensen Huang Nvidia

Nvidia risponde a Google: “siamo una generazione avanti nei chip IA”

In un recente tweet, Nvidia risponde alla sfida lanciata da Google coi suoi Tensor: “siamo una generazione avanti nei chip IA”.

Anthropic

Anthropic avvia i preparativi per una possibile IPO nel 2026

Anthropic ha incaricato lo studio legale Wilson Sonsini di avviare le attività preliminari per una possibile quotazione in borsa a partire dal 2026.

Share This