Dobbiamo ammetterlo, Google ci ha confuso. E non una ma due volte. Poco più di una settimana fa, il colosso di Mountain View annunciava Gemini Ultra 1.0, definendolo il non plus ultra dei suoi modelli linguistici IA. Aggiungeva anche che sarebbe stato integrato in Gemini, precedentemente conosciuto come Bard. Ma è di queste ore l’annuncio di Gemini Pro 1.5, con prestazioni equiparabili a quelle del modello Ultra 1.0, che però raggiunge richiedendo un’inferiore capacità di calcolo.
Sebbene Ultra 1.0 possa ancora essere considerato superiore a Pro 1.5, la sua presentazione come elemento centrale dell’offerta “Gemini Advanced” nel servizio di abbonamento Google One, ora appare perdere un po’ di forza. A ciò si aggiunge una serie di cambiamenti nei nomi dei prodotti Google, che crea una certa confusione. Per capirci, la versione gratuita di Bard/Gemini attualmente impiega il modello Pro 1.0.
Google sostiene che Gemini 1.5 rappresenta la nuova frontiera nel campo dei Large Language Models, essendo capace di una comprensione approfondita di contesti estesi e gestendo fino a 1 milione di token. Il che rappresenta un netto miglioramento rispetto alle capacità precedenti, visto che Gemini 1.0 si fermava a un massimo di 32.000 token.
I “token” sono le unità di base utilizzate dai modelli per comprendere e generare testo. Un token può essere una parola, una parte di una parola o addirittura un singolo carattere, a seconda di come il modello è stato addestrato e della lingua che sta elaborando. Quindi più sono i token che vanta un LLM, più lunghi sono i testi che gli si possono dare in pasto. Ecco spiegato allora perché Google afferma che Gemini 1.5 sia in grado di eseguire ragionamenti complessi su grandi quantità di informazioni, e cita l’esempio dell’analisi di un verbale di 402 pagine della missione Apollo 11.
Tornando a Gemini 1.5, Google lascia intendere che, al pari del 1.0 (che includeva le versioni Nano, Pro e Ultra), anche questo sarà offerto in diverse varianti. Al momento, però, Pro 1.5 è l’unica versione annunciata.
Google ha pubblicato un rapporto tecnico su Gemini 1.5, che sembra indicare prestazioni superiori rispetto a GPT-4 Turbo di OpenAI in diverse aree. Il rapporto fornisce anche dati quantitativi sul miglioramento di 1.5, con un incremento del 28,9% in “Matematica, Scienza e Ragionamento” rispetto a 1.0 Pro e del 5,2% rispetto a 1.0 Ultra.
Gemini 1.5 è attualmente disponibile per gli sviluppatori in una versione limitata a 128.000 token, accessibile tramite AI Studio e Vertex AI, due strumenti di Google Cloud per lo sviluppo e l’implementazione di modelli di intelligenza artificiale e machine learning. Non è però ancora stato integrato nel chatbot Gemini, precedentemente noto come Bard.
Come dicevamo in apertura, nel riportare questa news abbiamo avvertito alcune perplessità. La prima è di marketing, a riguarda i nomi delle varie versioni di Google: sarà senz’altro un limite nostro ma nel leggere le notizie da cui ricavare questa, abbiamo avuto una certa difficoltà a raccapezzarci tra tutte le versioni e i nomi adottati da Google.
La seconda perplessità riguarda la decisione di Google di lanciare questo specifico modello a ridosso di quello che, qualche giorno fa, sembrava essere la proposta definitiva nell’ambito degli LLM. Sia chiaro, sappiamo tutti che nulla è per sempre e che la tecnologia corre veloce, soprattutto di questi tempi. Ma la nostra news sul lancio di Gemini Ultra 1.0news risale pur sempre al 9 febbraio, e questa (ahinoi) avremmo potuto riportarla già ieri.
Sempre che, suggerisce qualcuno, Google non sappia che nella pentola di OpenAI sta bollendo qualcosa di grosso, e non abbia voluto bruciare sul tempo il rivale. Il che è preferibile all’imputare questa confusione a un semplice cortocircuito tra lo sviluppo e il marketing di Google.


