Arriva Claude 3, il rivale di ChatGPT “consapevole”

da | 10 Mar 2024 | IA

Con le macchine si fa a gara a chi ha più cavalli o a chi raggiunge la velocità massima. Con le intelligenze artificiali non è poi molto diverso. Certo, cambiano i parametri ma di questi tempi le big della Silicon Valley fanno a gara a chi ha i benchmark migliori.

Fatte queste premesse, la recente irruzione nel panorama dell’intelligenza artificiale da parte di Anthropic merita tutta la nostra attenzione. Il lancio del suo Claude 3 rappresenta infatti una svolta potenzialmente rivoluzionaria, posizionandosi come il diretto rivale del rinomato GPT-4.

Claude 3 non è un singolo modello ma una triade di modelli di intelligenza artificiale: Opus, Sonnet e Haiku. Ognuno di essi ha le sue peculiarità e le proprie aree di applicazione. Opus, il peso massimo, riservato agli abbonati a Claude Pro, offre prestazioni di alto livello in attività complesse quali coding, ricerca e sviluppo e analisi strategica.

Coloro che invece sono alla ricerca di un’opzione più accessibile possono virare su Sonnet, disponibile gratuitamente sul sito di Claude, che eccelle in compiti cognitivi e con una maggiore efficienza rispetto a Opus in termini di tempo. Haiku, invece, promette di essere il modello più agile e rapido; il lancio al pubblico è previsto a breve termine.

Una caratteristica dei modelli Claude 3 è la loro capacità multimodale, che consente loro di elaborare sia testo che immagini, superando così i limiti dei loro predecessori. La vera rivoluzione, tuttavia, si cela nelle prestazioni di Opus. Secondo Anthropic, questo modello supera GPT-4 nella quasi totalità dei benchmark chiave, dimostrando capacità superiori in ragionamento, codifica, conoscenza generale e problemi matematici.

Claud3 benchmark

Ma la cosa ancora più interessante è un’altra: sembra “umanamente” intelligente. È infatti stato sottoposto a un test definito “needle-in-a-haystack, ossia “ago nel pagliaio”. In esso all’IA viene fornito un testo molto lungo, al cui interno è presente una singola frase non ha nulla a che vedere col resto. Al modello viene chiesto di individuarla, il che come si capisce è buon modo di vedere quanto sia effettivamente intelligente l’IA.

Ebbene, Opus non solo ha superato il test col 99% di accuratezza ma, in una risposta, ha detto di credere che la frase fosse stata inserita apposta per testarlo. Si tratterebbe della prima volta che un’IA dimostra consapevolezza.

La comunità di appassionati di intelligenze artificiali ha accolto Claude 3 con entusiasmo, definendolo il modello di IA più “umano”, creativo e naturale mai sperimentato fino ad ora”. Nonostante questo, rimane la curiosità su come si posizionerà effettivamente contro GPT-4 nel lungo termine, una domanda a cui solo test approfonditi potranno fornire una risposta definitiva.

Claude 3 purtroppo non è ancora attivo in Italia, ma è comunque possibile registrarsi sul sito di Anthropic per ricevere una notifica quando sarà disponibile.

POTREBBE INTERESSARTI

Brad Smith, presidente di Microsoft

Microsoft promette: i nostri data center non peseranno sulle bollette degli americani

L’azienda si impegna a non chiedere sgravi fiscali e a formare i residenti. Brad Smith: “Non chiediamo ai contribuenti di sovvenzionarci”.

Matthew McConaughey

McConaughey registra sé stesso come marchio contro i deepfake

Otto trademark approvati negli USA trasformano l’immagine dell’attore in un asset legale. Nel vuoto normativo sui deepfake, Hollywood ricorre...
Google AI Overviews

Google rimuove le AI Overviews per alcune ricerche mediche

Un’indagine del Guardian documenta errori potenzialmente letali nei riassunti sanitari del motore di ricerca. Il tempismo col lancio di ChatGPT Health solleva...
Google agente

Google entra nello shopping con gli agenti IA per i retailer

Con Gemini Enterprise for Customer Experience, Big G offre strumenti per costruire assistenti virtuali proprietari. Ma il commercio agentico è davvero dietro...
Apple Intelligence Siri

Siri parlerà con la voce di Gemini: Apple sceglie Google per l’IA

Annunciata ieri una partnership che riscrive gli equilibri del mercato. E anche una svolta storica che solleva domande sul futuro della privacy di Cupertino.

Nvidia CES 2026 Jensen Huag

Al CES 2026 la Silicon Valley ha scelto Trump

La Genesis Mission, Nvidia e il nuovo asse Washington-Silicon Valley: al Consumer Electronics Show è andata in scena la fine della neutralità tech.

Harry Potter e la Pietra Filosofale

I ricercatori sono riusciti a estrarre Harry Potter (quasi per intero) dai principali LLM

Una ricerca di Stanford dimostra che Claude, GPT-4.1, Gemini e Grok hanno memorizzato interi libri protetti da copyright. E possono riprodurli quasi parola per...
Grok

Grok, la risposta di Musk ai deepfake è farli pagare

Dall’Indonesia al Regno Unito, i governi reagiscono ai deepfake di Grok. Musk attacca gli inglesi: “Fascisti”. Ma intanto le immagini abusive...
Character

Google e Character.AI, accordi milionari per evitare il processo

Le famiglie ottengono risarcimenti per i suicidi legati al chatbot, ma il vuoto normativo sulla responsabilità dell’IA generativa resta intatto.

Andreessen Horowitz

Il secolo americano di Andreessen Horowitz: 15 miliardi per blindare il futuro tech

Dalla difesa all’intelligenza artificiale: come il colosso di Menlo Park sta puntando a riscrivere il rapporto tra capitale privato, sovranità e potere.

Share This