Non basta avere ricercatori brillanti e potenza di calcolo. Per costruire modelli di IA competitivi serve qualcosa di più concreto: dati reali, feedback continuo, valutazioni sistematiche.
È questo il ragionamento alla base della nuova organizzazione di ingegneria applicata per l’IA che Meta sta costruendo, secondo un memo interno visionato dal Wall Street Journal. Una struttura che non si occupa di ricerca fondamentale ma di tutto ciò che trasforma un modello promettente in uno strumento che migliora nel tempo.
Il concetto chiave è quello del “volano”, un ciclo in cui i dati generati dall’uso reale alimentano valutazioni, le valutazioni migliorano i modelli, i modelli migliori producono interazioni più utili, e così via.
“Costruire modelli eccellenti non riguarda solo ricercatori e capacità di calcolo”, scrive Maher Saba, il manager scelto per guidare la nuova organizzazione. “Richiede dati del mondo reale, feedback e valutazioni. Questo crea il volano che trasforma un modello solido in uno leader.”
Saba proviene dalla divisione Reality Labs ed è stato scelto per costruire una struttura che risponde direttamente al Chief Technology Officer di Meta, Andrew Bosworth.
La nuova organizzazione collaborerà con i Superintelligence Labs, il laboratorio che Meta ha creato la scorsa estate per concentrare i suoi sforzi sui modelli di frontiera.
Meta: due team, una missione
L’organizzazione sarà articolata in due team distinti. Il primo si occuperà di costruire interfacce e strumenti interni. Il secondo eseguirà compiti concreti: generare dati, produrre valutazioni e restituirle ai team che lavorano sui modelli. È una divisione del lavoro pensata per chiudere rapidamente il ciclo tra sperimentazione e miglioramento.
La struttura organizzativa scelta è volutamente inusuale, con un rapporto fino a 50 collaboratori per ogni manager. Nel settore tecnologico, dove i livelli gerarchici si moltiplicano facilmente, si tratta di una scelta precisa. Meno burocrazia, più autonomia operativa, velocità di esecuzione come priorità dichiarata.
“Crediamo di avere una reale opportunità di accelerare e guadagnare terreno se raddoppiamo questi sforzi”, scrive ancora Saba, citando i progressi recenti ottenuti con il reinforcement learning e il post-training, tecniche usate per affinare il comportamento dei modelli dopo la fase di addestramento iniziale.
La corsa ai modelli, la pressione degli analisti
La nuova organizzazione nasce in un momento di forte attesa. Meta è al lavoro su nuovi modelli (nome in codice Avocado e Mango), e Mark Zuckerberg è stato sollecitato più volte dagli analisti finanziari per aggiornamenti sullo stato dei lavori.
In una call di gennaio, il CEO ha promesso che i primi modelli arriveranno “nei prossimi mesi”, aggiungendo che si aspetta mostrino “la rapida traiettoria su cui ci troviamo”.
I Superintelligence Labs, affidati ad Alexandr Wang (ex CEO di Scale AI, azienda specializzata proprio nella produzione di dati per l’addestramento dei modelli), sono il punto di convergenza di questa strategia.
La nuova organizzazione di ingegneria applicata è il pezzo mancante: l’infrastruttura operativa che deve alimentare quella traiettoria con dati, feedback e valutazioni continue.
È una scommessa che Meta sta costruendo pezzo per pezzo, con la consapevolezza che nella corsa all’IA il vantaggio non si misura solo in parametri e architetture, ma nella capacità di far girare il volano più velocemente degli altri.
Fonte: Wall Street Journal


