OpenAI lancia la visione per ChatGPT: ora “vede” in tempo reale

da | 13 Dic 2024 | IA

Dopo mesi di attesa, OpenAI ha finalmente introdotto la capacità di analizzare video in tempo reale all’interno di ChatGPT.

L’annuncio è stato fatto ieri, durante una diretta streaming in cui l’azienda ha mostrato come la funzione permetta agli utenti di puntare il proprio smartphone verso oggetti fisici e ricevere risposte quasi istantanee.

Inutile dirlo, si tratta di un’evoluzione importante rispetto alla modalità vocale già presente.

Come funziona la nuova modalità

La nuova funzionalità, disponibile per gli abbonati ai piani Plus, Team e Pro, combina una capacità conversazionale avanzata con la visione artificiale.

Tramite l’app di ChatGPT, gli utenti possono attivare il riconoscimento visivo premendo sull’icona del video accanto alla barra di chat.

Oltre a interpretare oggetti fisici, la funzione consente di comprendere e spiegare il contenuto dello schermo del dispositivo, grazie alla condivisione dello schermo.

Questo permette, ad esempio, di ricevere suggerimenti su problemi matematici o spiegazioni relative a menu di impostazioni tecniche.

La distribuzione e i limiti

OpenAI ha dichiarato che il rollout globale della modalità vocale avanzata con visione sarà completato entro una settimana, ma non tutti gli utenti potranno accedervi immediatamente.

I clienti dei piani Enterprise ed Edu dovranno attendere fino a gennaio, mentre gli utenti in Unione Europea, Svizzera, Islanda, Norvegia e Liechtenstein rimangono esclusi senza una data definita per il rilascio.

La nuova modalità è stata testata pubblicamente durante un episodio del programma “60 Minutes” della CNN, dove il presidente di OpenAI, Greg Brockman, ha sfidato il giornalista Anderson Cooper con un quiz di anatomia.

ChatGPT ha dimostrato la capacità di riconoscere e commentare disegni realizzati in tempo reale, ma ha anche commesso errori in un problema di geometria, confermando una tendenza a generare risposte imprecise, note come “allucinazioni.”

La corsa dei rivali

OpenAI aveva annunciato la funzione ad aprile, promettendo una distribuzione “in poche settimane,” ma solo ora la versione completa è disponibile per alcuni utenti. I ritardi nel lancio sono stati attribuiti alla complessità tecnica.

Nel frattempo, i rivali del settore non sono rimaste a guardare. Google ha recentemente testato una funzione simile, Project Astra, su dispositivi Android, riservandola a un ristretto gruppo di tester. Meta, dal canto suo, sta sviluppando soluzioni conversazionali con capacità di analisi video.

Ah, dimenticavamo: accanto a questa innovazione tecnologica, OpenAI ha lanciato anche una modalità festiva denominata “Santa Mode,” che consente agli utenti di interagire con ChatGPT usando la voce di Babbo Natale.

Un’aggiunta leggera, ma perfettamente in tema con il periodo natalizio.

POTREBBE INTERESSARTI

OpenAI Sam Altman ChatGPT

Sam Altman dopo il no ai salvataggi di Stato, dice sì agli incentivi

Il CEO di OpenAI ha lanciato un appello al governo statunitense per estendere il credito d’imposta previsto dal Chips and Science Act anche alle infrastrutture dedicate...
Marsha Blackburn

Google ritira Gemma dopo le accuse di diffamazione della senatrice Blackburn

Dopo una risposta “allucinata” del modello Gemma, la senatrice repubblicana Marsha Blackburn accusa Google di aver inventato false accuse di stupro. Mountain View parla...
Deli Chen Deepseek

DeepSeek riappare e avverte: “L’IA cambierà tutto, e non in meglio”

Dopo mesi di silenzio, la startup simbolo dell’IA cinese torna a parlare. E il ricercatore Chen Deli avverte: “Sono positivo sulla tecnologia ma vedo in modo negativo...
Sam Altman

Sam Altman: “No ai salvataggi di Stato per le aziende di IA”

Il CEO di OpenAI interviene per frenare le polemiche dopo le dichiarazioni della sua CFO Sarah Friar, che durante il WSJ Tech Live ha evocato un possibile intervento...
tinder

Tinder vuole le nostre foto per fermare il crollo degli abbonati

Match Group scommette sull’intelligenza artificiale per interpretare interessi e personalità. Ma il prezzo è la nostra la privacy.

Sam Altman OpenAI Miyazaki

Studio Ghibli sfida OpenAI: “Basta addestrare l’IA sulle nostre opere”

Gli editori giapponesi chiedono a OpenAI di fermare l’uso dei loro contenuti per l’addestramento dei modelli generativi. Altman risponde con un post ironico su...
microsoft-uae

Trump, gli Emirati e Microsoft: l’IA diventa geopolitica

L’investimento da 15,2 miliardi di dollari di Microsoft porta per la prima volta ad Abu Dhabi le GPU Nvidia più avanzate negli Emirati. Segnando un cambio di rotta nei...
AWS Amazon

OpenAI firma con Amazon: 38 miliardi per la potenza di calcolo

Il colosso guidato da Sam Altman sigla un contratto settennale con Amazon Web Services. Gli garantirà l’accesso a 30 gigawatt di capacità per la prossima...
Google Veo3

Google lancia il suo primo spot con l’IA, ma dimentica la trasparenza

Google sceglie un personaggio non umano per evitare l’effetto inquietante dei volti sintetici, ma omette di dichiarare che lo spot è interamente generato con Veo...
Sam Altman ChatGPT

Altman sbotta: “Basta domande sui ricavi di OpenAI”

Nell’intervista con Nadella, il CEO di OpenAI reagisce alle speculazioni sui conti: “Abbiamo superato ogni piano industriale presentato a Microsoft”.

Share This