La corsa all’innovazione nell’intelligenza artificiale continua a ritmo serrato. E dopo il lancio a marzo di Claude 3 Opus da parte di Anthropic, cui è seguita la risposta di OpenAI con GPT-4o, tocca nuovamente ad Anthropic rilanciare con Claude 3.5 Sonnet.
Il modello è già disponibile per gli utenti sul web e su iOS, e presto sarà accessibile anche agli sviluppatori. Si posiziona come un prodotto intermedio nella gamma di Anthropic, collocandosi tra il modello più piccolo, Haiku, e il modello di fascia alta, Opus.
Nonostante il suo posizionamento, Claude 3.5 Sonnet supera significativamente 3 Opus e, secondo i benchmark di Anthropic che vedete qui sotto, offre prestazioni migliori in sette dei nove test complessivi e in quattro dei cinque test di visione rispetto a GPT-4, Gemini 1.5 Pro e Llama 3 400B di Meta.
Anthropic afferma che Claude 3.5 Sonnet è notevolmente migliorato nella scrittura e nella traduzione del codice, nella gestione di flussi di lavoro multistep, nell’interpretazione di grafici e tabelle e nella trascrizione di testi da immagini. Inoltre, il nuovo modello è anche più performante nella comprensione dell’umorismo e nella produzione di testi dal tono più umano.
Insieme al lancio del nuovo modello, Anthropic ha introdotto una nuova funzione, chiamata Artifacts, che permette agli utenti di vedere e interagire con i risultati delle loro richieste fatte a Claude. Ad esempio, se si chiede al modello di progettare qualcosa, è ora possibile visualizzare il progetto e modificarlo direttamente nell’app. Se Claude scrive un’email, questa può essere modificata nell’app senza doverla copiare in un editor di testo separato.

Ecco come di comporta Claude 3.5 Sonnet rispetto agli altri modelli.
Questa funzionalità rappresenta un passo significativo verso la trasformazione dei chatbot in strumenti di lavoro più integrati e interattivi. E potrebbe non essere un passo casuale, dato che Anthropic che punta a fare di Claude uno strumento fondamentale per le aziende.
La compagnia ha infatti dichiarato che il suo obiettivo è permettere alle imprese di “centralizzare in modo sicuro le loro conoscenze, documenti e lavoro in corso in uno spazio condiviso”, avvicinandosi più a piattaforme come Notion o Slack piuttosto che a chatbot tradizionali come ChatGPT.
Sebbene Claude non riceva la stessa attenzione mediatica di Gemini o ChatGPT, è un serio contendente nella corsa agli armamenti dell’intelligenza artificiale. E mentre OpenAI e Google continuano a migliorare i loro modelli, Anthropic pare essere in grado di ritagliarsi un suo personalissimo posto al sole.


