Strawberry diventa OpenAI o1, l’IA più intelligente e ‘consapevole’

da | 13 Set 2024 | IA

Tempo di lettura: 3 minuti

Fino a ieri l’abbiamo chiamato Strawberry, da oggi lo chiameremo OpenAI o1. Parliamo del nuovo modello dell’azienda di Sam Altman, che ieri sera ha presentato il suo ultimo ritrovato in campo di intelligenza artificiale generativa.

È progettato per migliorare le capacità di ragionamento e risolvere compiti complessi come matematica, programmazione e scienze. Ed è stato sviluppato per affrontare alcune delle carenze tipiche dei chatbot, come l’incapacità di gestire problemi semplici di matematica o la generazione di codice con errori. A differenza delle versioni precedenti, come GPT-4o, OpenAI o1 infatti è in grado di “pensare” prima di rispondere, migliorando così la sua precisione.

OpenAI o1, disponibile in due versioni (o1-preview e o1-mini), è progettato per essere più efficiente, soprattutto nella generazione di codice. Ed sarà inizialmente disponibile solo agli abbonati ai piani ChatGPT Plus e Team, mentre l’accesso esteso agli utenti aziendali ed educativi arriverà la settimana successiva.

Una delle principali innovazioni di OpenAI o1 è la sua capacità di ragionare attraverso una serie di passaggi logici per risolvere problemi complessi. Il sistema, addestrato con l’apprendimento per rinforzo, è in grado di verificare autonomamente le sue risposte, prendendosi più tempo per analizzare tutte le parti di una domanda.

Questo approccio lo rende ideale per attività che richiedono una sintesi di informazioni, come la rilevazione di email privilegiate in un contesto legale o la pianificazione di strategie di marketing.

Secondo Jakub Pachocki, capo scienziato di OpenAI, a differenza dei modelli precedenti, o1 può riflettere su un problema scomponendolo e analizzandolo in profondità, con l’obiettivo di fornire la migliore risposta possibile. In una dimostrazione, OpenAI ha mostrato il modello risolvere complessi puzzle di parole e rispondere a domande di chimica a livello di dottorato.

Pablo Arredondo, vicepresidente di Thomson Reuters, ha confermato che OpenAI o1 ha superato i modelli precedenti, come GPT-4o, nell’analisi di documenti legali e nella risoluzione di giochi di logica dell’LSAT, dimostrando una maggiore capacità di affrontare analisi complesse e multi-sfaccettate.

Il modello o1 di OpenAI ha dimostrato notevoli miglioramenti rispetto a GPT-4o nei benchmark di ragionamento complesso.

OpenAI ha testato o1 in varie competizioni accademiche, come le Olimpiadi Internazionali di Matematica (IMO), dove ha risolto l’83% dei problemi, rispetto al 13% di GPT-4o. Il modello ha inoltre raggiunto l’89° percentile nella competizione di programmazione online Codeforces, superando il sistema AlphaCode 2 di DeepMind. Anche i test automatici hanno evidenziato miglioramenti significativi su una vasta gamma di compiti più semplici.

OpenAI o1 non però è esente da difetti. Il modello può essere più lento rispetto ad altri, con alcuni utenti che riportano tempi di risposta superiori ai 10 secondi. Inoltre, o1 può ancora fare errori e generare allucinazioni. Anche se OpenAI ha lavorato per ridurre questi difetti, Noam Brown, ricercatore di OpenAI, ha ammesso che questo problema accade ancora. Inoltre, o1 è ancora in fase iniziale e non può ancora navigare sul web o analizzare file e ha limiti settimanali di utilizzo.

Il costo di OpenAI o1 è un altro svantaggio: con un prezzo di 15 dollari per 1 milione di token in ingresso e 60 dollari per 1 milione di token in uscita, il modello è significativamente più caro rispetto a GPT-4o. Va però detto che OpenAI ha dichiarato l’intenzione di rendere o1-mini disponibile a tutti gli utenti gratuiti di ChatGPT, anche se non ha ancora fissato una data di rilascio.

Nonostante questi limiti, OpenAI o1 rappresenta un passo importante verso lo sviluppo di sistemi di intelligenza artificiale in grado di ragionare su compiti complessi. Ma la competizione nel settore è intensa: Google DeepMind e altre aziende stanno lavorando su tecnologie simili, cercando di migliorare la precisione e l’efficacia dei loro modelli.

Il modello o1 di OpenAI ha superato GPT-4o in una vasta gamma di benchmark, migliorando in 54 delle 57 sottocategorie del test MMLU (Massive Multitask Language Understanding).

I ricercatori di Google DeepMind, tra l’altro, hanno pubblicato uno studio che dimostra come concedere ai modelli più tempo di elaborazione e una guida per completare le richieste possa migliorare significativamente le loro prestazioni senza ulteriori modifiche. È quindi probabile che si stiano muovendo nella stessa direzione di OpenAI.

L’azienda di Sam Altman ha dichiarato di voler continuare a sperimentare con modelli o1 che possano ragionare per ore, giorni o addirittura settimane, per potenziare ulteriormente le capacità di ragionamento della sua tecnologia.

Con tutta probabilità, il successo di OpenAI o1 dipenderà dalla sua capacità di risolvere problemi complessi e dall’accessibilità che l’azienda riuscirà a garantire agli utenti, sia in termini di prezzo che di disponibilità. E dal tempo che bisognerà attendere per una risposta che non presenti allucinazione.

 

POTREBBE INTERESSARTI

Papa Leone XIV
• ⏱ 2 min

Magnifica Humanitas: il Papa pubblica la sua prima enciclica sull’IA insieme al co-fondatore di Anthropic

Papa Leone XIV presenterà la sua prima enciclica sull’IA; tra i relatori anche Christopher Olah, responsabile della ricerca sull’interpretabilità...
OpenAI Elon Musk
, • ⏱ 2 min

Musk perde contro OpenAI: accuse prescritte

Un tribunale federale USA archivia il caso dopo un mese di processo. Altman e OpenAI escono vincitori contro Musk, arrivato in ritardo con le accuse.

JPMorgan
• ⏱ 4 min

La causa JPMorgan e i video (falsi) che milioni hanno visto

Bastano pochi minuti e un chatbot per costruire una storia falsa su chiunque. Il caso della banca americana mostra come uno scandalo giudiziario possa diventare materia...
Eric Schmidt Google
• ⏱ 3 min

Eric Schmidt fischiato dai neolaureati: l’IA non entusiasma i giovani

L’ex CEO di Google e un’altra dirigente hanno provato a vendere l’IA come futuro luminoso a chi sta per entrare in un mercato del lavoro in crisi. Non...
Agenti IA
• ⏱ 3 min

Troppi agenti IA: le grandi aziende corrono ai ripari

Gartner stima 150.000 agenti per azienda Fortune 500 entro due anni. Solo il 13% delle organizzazioni si dice pronta a gestirli.

Elon Musk vs Sam Altman OpenAI
, • ⏱ 3 min

Musk in Cina, Altman in aula: il processo dell’anno ai titoli di coda

Altman accusato di mentire, Musk di amnesia selettiva: mentre la giudice prepara la sentenza finale, OpenAI difende il suo primato.

Jensen Huang Nvidia
, , • ⏱ 3 min

Trump porta Huang a Pechino: gli H200 sono approvati ma la Cina non li compra

Gli Stati Uniti hanno dato il via libera ma la Cina blocca i propri acquirenti. E nel mezzo c’è Nvidia, che ha visto la propria quota di mercato cinese...
Sundar Pichai. Foto: Sanjay Rawat
, , • ⏱ 3 min

Soci e rivali: Google e SpaceX trattano per i data center in orbita

Google è azionista di SpaceX da anni. Ora le due aziende potrebbero diventare partner sui lanci (e concorrenti nello spazio).

Trump USA Xi Jinping Cina
, , • ⏱ 4 min

Trump e Xi parlano di IA, ma il dialogo resta difficile

A Pechino l’intelligenza artificiale entra per la prima volta nell’agenda bilaterale USA-Cina. Le aspettative però sono basse: troppa rivalità, troppa...
sam altman reuters
, • ⏱ 4 min

Altman in aula: “Musk voleva il 90% di OpenAI”

Il CEO di OpenAI testimonia su donazioni, equity e metodi manageriali che “hanno devastato la cultura” del laboratorio.

Share This