OpenAI o3, l’IA che sorprende (non sempre positivamente)

da | 25 Apr 2025 | IA

Illustrazione: openai
Tempo di lettura: 2 minuti

OpenAI ha lanciato ufficialmente il modello o3 lo scorso 16 aprile, insieme alla versione ridotta o4-mini.

Questa data ha segnato la disponibilità generale del modello o3, successiva a una fase iniziale di test e accesso limitato per motivi di sicurezza. ​

Lo scorso 31 gennaio era stata resa disponibile una versione più leggera, denominata o3-mini. Questa era destinata a utenti selezionati e a sviluppatori con accesso API, offrendo un’alternativa specializzata per domini tecnici che richiedono precisione e velocità. ​

Un buon inizio per o3

Nel complesso, la ricezione di o3 è stata positiva. I primi tester hanno lodato il modello per la sua capacità di ragionamento: è infatti in grado di rispondere a un prompt pianificando, eseguendo e spiegando una sequenza di passaggi.

Il modello di OpenAI è stato apprezzato anche per l’affidabilità nel condurre ricerche online e nell’utilizzare strumenti digitali senza supervisione continua.

O3 ha ricevuto consensi per le attività più classiche dell’IA – scrittura, disegno, calcolo e programmazione – ma anche per i progressi nella visione artificiale.

Uno degli “esperimenti” diventati virali, e che ha fatto storcere il naso a molti esperti di privacy, consisteva nell’usare o3 per analizzare una qualsiasi foto digitale e identificare il luogo in cui è stata scattata.

OpenAI: prestazioni super ma a caro prezzo

In uno studio sull’accuratezza nell’analisi finanziaria condotto su diversi modelli di IA, o3 ha ottenuto i risultati migliori, ma è riuscito a fornire risposte corrette solo nel 48,3% dei casi.

Non solo: ogni singola interrogazione è costata a OpenAI 3,69 dollari, rendendolo il modello più dispendioso in assoluto. Una combinazione che ha lasciato perplesso chi sperava in una maggiore efficienza dai modelli di nuova generazione.

OpenAI ha anche ammesso che il modello soffre ancora di problemi strutturali.

In uno dei benchmark di accuratezza più usati nel settore, o3 ha “allucinato” (ovvero fornito risposte inventate ma convincenti) a un ritmo doppio rispetto al suo predecessore, o1.

E sebbene risponda a un numero maggiore di domande e ne azzecchi di più, il salto nel tasso di errore resta un mistero: “Servono ulteriori ricerche”, ha dichiarato l’azienda.

“Fa piazza pulita degli esseri umani”

L’effetto “wow”, però, è stato reale. Lo ha scritto Tyler Cowen, economista e autore molto seguito, che non ha lesinato complimenti per il nuovo modello di OpenAI.

“Non mi importa se non lo vuoi chiamare AGI. E no, non fa tutto giusto, e ci sono modi per ingannarlo, spesso con domande piuttosto semplici (per gli esseri umani). Ma non prendiamoci in giro su quello che sta succedendo qui. Su un’enorme varietà di argomenti e approcci, fa piazza pulita degli esseri umani. È ora di essere onesti e ammetterlo.”.

Anche se la definizione di “intelligenza artificiale generale” resta vaga, è evidente che qualcosa è cambiato. Il confine dell’IA però oggi appare frastagliato: in certi compiti è imprecisa, in altri è semplicemente superumana.

Ed è proprio questa imprevedibilità a distinguere la fase attuale.

A due anni e mezzo dal debutto di ChatGPT, l’intelligenza artificiale continua ad avanzare ma senza diventare più comprensibile o prevedibile.

POTREBBE INTERESSARTI

Papa Leone XIV
• ⏱ 2 min

Magnifica Humanitas: il Papa pubblica la sua prima enciclica sull’IA insieme al co-fondatore di Anthropic

Papa Leone XIV presenterà la sua prima enciclica sull’IA; tra i relatori anche Christopher Olah, responsabile della ricerca sull’interpretabilità...
OpenAI Elon Musk
, • ⏱ 2 min

Musk perde contro OpenAI: accuse prescritte

Un tribunale federale USA archivia il caso dopo un mese di processo. Altman e OpenAI escono vincitori contro Musk, arrivato in ritardo con le accuse.

JPMorgan
• ⏱ 4 min

La causa JPMorgan e i video (falsi) che milioni hanno visto

Bastano pochi minuti e un chatbot per costruire una storia falsa su chiunque. Il caso della banca americana mostra come uno scandalo giudiziario possa diventare materia...
Eric Schmidt Google
• ⏱ 3 min

Eric Schmidt fischiato dai neolaureati: l’IA non entusiasma i giovani

L’ex CEO di Google e un’altra dirigente hanno provato a vendere l’IA come futuro luminoso a chi sta per entrare in un mercato del lavoro in crisi. Non...
Agenti IA
• ⏱ 3 min

Troppi agenti IA: le grandi aziende corrono ai ripari

Gartner stima 150.000 agenti per azienda Fortune 500 entro due anni. Solo il 13% delle organizzazioni si dice pronta a gestirli.

Elon Musk vs Sam Altman OpenAI
, • ⏱ 3 min

Musk in Cina, Altman in aula: il processo dell’anno ai titoli di coda

Altman accusato di mentire, Musk di amnesia selettiva: mentre la giudice prepara la sentenza finale, OpenAI difende il suo primato.

Jensen Huang Nvidia
, , • ⏱ 3 min

Trump porta Huang a Pechino: gli H200 sono approvati ma la Cina non li compra

Gli Stati Uniti hanno dato il via libera ma la Cina blocca i propri acquirenti. E nel mezzo c’è Nvidia, che ha visto la propria quota di mercato cinese...
Sundar Pichai. Foto: Sanjay Rawat
, , • ⏱ 3 min

Soci e rivali: Google e SpaceX trattano per i data center in orbita

Google è azionista di SpaceX da anni. Ora le due aziende potrebbero diventare partner sui lanci (e concorrenti nello spazio).

Trump USA Xi Jinping Cina
, , • ⏱ 4 min

Trump e Xi parlano di IA, ma il dialogo resta difficile

A Pechino l’intelligenza artificiale entra per la prima volta nell’agenda bilaterale USA-Cina. Le aspettative però sono basse: troppa rivalità, troppa...
sam altman reuters
, • ⏱ 4 min

Altman in aula: “Musk voleva il 90% di OpenAI”

Il CEO di OpenAI testimonia su donazioni, equity e metodi manageriali che “hanno devastato la cultura” del laboratorio.

Share This