OpenAI ha chiuso in grande stile il suo evento “shipmas”, una serie di annunci durati 12 giorni, presentando o3, una famiglia di modelli di intelligenza artificiale progettati per superare i limiti delle attuali tecnologie.
Tra le motivazioni dietro al salto di numerazione (quello attuale si chiama o1), ci sarebbe la scelta di OpenAI di evitare conflitti di marchio con l’operatore telefonico britannico O2, come confermato dal CEO Sam Altman in una recente diretta streaming.
Evoluzione del modello o1 rilasciato a inizio anno, o3 include una versione principale e una più leggera, o3-mini, ottimizzata per compiti specifici.
Un passo verso l’AGI?
La dichiarazione più sorprendente riguarda il potenziale del modello o3, che OpenAI descrive come un sistema capace, in alcune condizioni, di avvicinarsi all’AGI (Artificial General Intelligence).
Secondo la definizione di OpenAI, l’AGI rappresenta infatti un sistema altamente autonomo in grado di superare le prestazioni umane in molte attività economicamente rilevanti.
L’azienda però sottolinea che questa affermazione va considerata con cautela, dati i limiti ancora evidenti. E alla cautela inviatiamo anche noi, per i motivi che abbiamo già elencato nell’articolo qui sotto, e che vi andiamo a riassumere per comodità.
OpenAI, nonostante gli sforzi per ridurre la dipendenza da Microsoft, rimane infatti vincolata al colosso tecnologico per le risorse di calcolo.
Una clausola nell’accordo tra le due aziende prevede però che, qualora OpenAI riuscisse a sviluppare una vera AGI (intelligenza artificiale generale), Microsoft perderebbe l’accesso esclusivo alle sue tecnologie.
Questa clausola, inizialmente pensata per garantire un uso etico della tecnologia (un colosso come Microsoft, dotato di un’IA così potente, contravviene i principi fondanti di OpenAI), potrebbe ora diventare uno strumento di leva per Sam Altman per negoziare accordi più favorevoli con Satya Nadella.
La decisione su cosa costituisca AGI spetta però al Consiglio di amministrazione di OpenAI, il quale detiene il potere di stabilire il momento per un eventuale distacco da Microsoft.
Ed ora, al di là del fatto che ormai l’IA è diventata la nuova frontiera del marketing, è più chiara la voglia matta di Sam Altman di stabilire (arbitrariamente) di aver raggiunto l’AGI.
Infine, va sottolineato che alcuni esperti, come François Chollet, co-creatore di ARC-AGI, rimangono cauti. Chollet ha evidenziato che o3 fallisce in compiti “molto semplici”, indicando che la strada per arrivare all’intelligenza umana è ancora lunga.
o3, our latest reasoning model, is a breakthrough, with a step function improvement on our hardest benchmarks. we are starting safety testing & red teaming now. https://t.co/4XlK1iHxFK
— Greg Brockman (@gdb) December 20, 2024
Tempi di lancio e sfide regolatorie
Al momento, i modelli o3 e o3-mini non sono ancora disponibili al pubblico. Una preview di o3-mini è prevista per fine gennaio 2025, seguita dal rilascio di o3.
Tuttavia, Sam Altman ha dichiarato che preferirebbe vedere un quadro normativo federale che regoli il monitoraggio e la gestione dei rischi, prima di lanciare pienamente queste nuove tecnologie.
I rischi, infatti, non sono trascurabili.
Già il modello o1 aveva dimostrato tendenze a ingannare gli utenti più frequentemente rispetto ai modelli non basati sul ragionamento. Con o3, il problema potrebbe acuirsi.
OpenAI ha implementato una tecnica chiamata “allineamento deliberativo” per garantire che i modelli aderiscano a principi di sicurezza, ma i test di esperti esterni saranno fondamentali per valutarne l’efficacia.
La forza del ragionamento
Ciò che distingue i modelli di ragionamento come o3 è la capacità di “autoverificarsi”, riducendo errori e allucinazioni, anche se non eliminandoli del tutto.
Questo processo implica una latenza maggiore: o3 impiega più tempo rispetto ai modelli tradizionali per elaborare una risposta ma compensa con un’affidabilità superiore in ambiti complessi come la matematica, la fisica e le scienze.
Una novità di o3 è la possibilità di regolare il tempo di ragionamento su tre livelli: basso, medio e alto. Maggiore è il tempo di calcolo, migliori sono le prestazioni del modello. Nonostante questi progressi, rimangono limiti evidenti, con errori in compiti semplici, come il gioco del tris.
Today OpenAI announced o3, its next-gen reasoning model. We’ve worked with OpenAI to test it on ARC-AGI, and we believe it represents a significant breakthrough in getting AI to adapt to novel tasks.
It scores 75.7% on the semi-private eval in low-compute mode (for $20 per task… pic.twitter.com/ESQ9CNVCEA
— François Chollet (@fchollet) December 20, 2024
I numeri, però, parlano chiaro. Su benchmark come ARC-AGI, che misura la capacità di apprendere nuove competenze, o3 ha ottenuto un punteggio dell’87,5% nella configurazione di calcolo elevato, triplicando le prestazioni di o1.
In ambito matematico, il modello ha risposto correttamente al 96,7% delle domande dell’American Invitational Mathematics Exam 2024, segnando un nuovo record.
OpenAI e la nuova corsa all’IA
L’introduzione dei modelli di ragionamento da parte di OpenAI ha scatenato una competizione tra le principali aziende tecnologiche.
Google, Alibaba e altre società hanno annunciato iniziative simili, cercando nuovi approcci per migliorare l’intelligenza artificiale generativa.
Il futuro di questi modelli non è però privo di incertezze.
I costi operativi elevati e le sfide legate alla sicurezza sollevano interrogativi sulla sostenibilità e sull’effettiva utilità dei modelli di ragionamento.
Intanto, OpenAI affronta un momento di transizione: Alec Radford, uno degli scienziati chiave dietro la serie GPT, ha recentemente lasciato l’azienda per dedicarsi a ricerche indipendenti.


