Alcuni ospedali usano un modello di OpenAI che ha allucinazioni

da | 29 Ott 2024 | IA

Tempo di lettura: 3 minuti

O tempora o mores, direbbero i latini. O, più probabilmente, visto quanto ci apprestiamo a scrivere, mala tempora currunt.

Whisper, infatti, è il modello di riconoscimento vocale sviluppato da OpenAI, progettato per trascrivere l’audio in testo, riconoscere il parlato e supportare la traduzione in più lingue.

Rilasciato come modello open-source, Whisper è stato addestrato su una grande quantità di dati audio, inclusi contenuti video provenienti da diverse piattaforme online, per poter comprendere vari accenti e idiomi.

Whisper: l’utilizzo che non t’aspetti

Tuttavia, questo modello mostra ancora alcune vulnerabilità, tra cui la tendenza a produrre “allucinazioni”, ossia parti di testo inesistenti o errate.

Il che non sarebbe un problema limitato qualora venisse utilizzato per la trascrizione automatica di meeting o la traduzione in tempo reale.

Peccato invece che, secondo ABC News, Whisper sia usato in oltre 30.000 cliniche e 40 sistemi sanitari. E che al momento ha trascritto circa sette milioni di conversazioni mediche.

Ma un gruppo di ricercatori della Cornell University e dell’Università di Washington ha evidenziato che Whisper allucina in circa l’1% delle trascrizioni, generando frasi inesistenti che possono includere sentimenti violenti, espressioni illogiche o interi passaggi di testo inventati durante i momenti di silenzio.

Rischio afasia

“E che problema sarà mai?”, si domanderà qualcuno di voi? In verità, è un problema che va oltre il mero aspetto tecnico.

Per comprendere meglio il fenomeno, gli studiosi hanno esaminato audio tratti da AphasiaBank, una risorsa contenente campioni di parlato di persone con afasia, un disturbo del linguaggio.

In questi contesti, i momenti di silenzio sono particolarmente frequenti, e Whisper sembra interpretarli in maniera errata.

La ricercatrice Allison Koenecke della Cornell University ha condiviso esempi di queste trascrizioni in un thread online, mostrando come Whisper possa arrivare persino a inventare condizioni mediche o a inserire frasi che appaiono completamente fuori contesto, come “Grazie per aver guardato!”.

Se vi domandate il perché di questa uscita… beh, è la tipica espressione con la quale si chiudono i video su YouTube, piattaforma su cui OpenAI ha addestrato GPT-4 trascrivendo oltre un milione di ore di filmati.

Questi risultati sono stati presentati a giugno durante la conferenza FAccT dell’Association for Computing Machinery in Brasile. Al momento, non è noto se lo studio sia stato sottoposto a revisione paritaria.

La risposta di OpenAI

Preso atto della situazione, OpenAI ha dichiarato che affronta la questione delle allucinazioni con serietà.

La portavoce Taya Christianson ha così dichiarato a The Verge, da cui abbiamo ripreso questa notizia: “Prendiamo molto seriamente questo problema e stiamo lavorando continuamente per migliorare, inclusa la riduzione delle allucinazioni”.

“Per l’uso di Whisper sulla nostra piattaforma API” ha proseguito, “le nostre policy d’uso vietano l’utilizzo in contesti decisionali ad alto rischio e la nostra scheda del modello per l’uso open-source include raccomandazioni contro l’impiego in ambiti a rischio elevato. Ringraziamo i ricercatori per aver condiviso i loro risultati”.

Il caso Whisper solleva dunque domande importanti sull’utilizzo dell’intelligenza artificiale in settori come quello sanitario, dove gli errori possono costare caro.

Se da un lato i modelli di IA come Whisper promettono maggiore efficienza e precisione, dall’altro le loro “allucinazioni” possono rappresentare un serio rischio per la sicurezza.

Ma è tutto così più comodo, veloce ed economico…

POTREBBE INTERESSARTI

Sundar Pichai. Foto: Sanjay Rawat
, , • ⏱ 3 min

Soci e rivali: Google e SpaceX trattano per i data center in orbita

Google è azionista di SpaceX da anni. Ora le due aziende potrebbero diventare partner sui lanci (e concorrenti nello spazio).

Trump USA Xi Jinping Cina
, , • ⏱ 4 min

Trump e Xi parlano di IA, ma il dialogo resta difficile

A Pechino l’intelligenza artificiale entra per la prima volta nell’agenda bilaterale USA-Cina. Le aspettative però sono basse: troppa rivalità, troppa...
sam altman reuters
, • ⏱ 4 min

Altman in aula: “Musk voleva il 90% di OpenAI”

Il CEO di OpenAI testimonia su donazioni, equity e metodi manageriali che “hanno devastato la cultura” del laboratorio.

amazon logo
• ⏱ 3 min

I dipendenti Amazon usano l’IA anche quando non serve, per sembrare efficienti

Con 200 miliardi di investimenti da giustificare, Amazon vuole dati sull’utilizzo. E i suoi dipendenti glieli danno (ma non nel modo atteso).

nadella sutskever altman
, • ⏱ 3 min

Musk vs. Altman: le testimonianze di Nadella e Sutskever

Il CEO di Microsoft definisce “roba da dilettanti” il tentativo di rimozione del 2023; l’ex chief scientist di OpenAI conferma che Altman sabotava i...
OpenAI
, • ⏱ 2 min

OpenAI vuole ingegneri nelle aziende: nasce la Deployment Company

L’acquisizione di Tomoro porta 150 specialisti pronti al lavoro. Sullo sfondo, la corsa con Anthropic per conquistare il mercato enterprise.

lavoratori cina
• ⏱ 2 min

In Cina non si licenzia più per colpa dell’IA

Un tribunale di Hangzhou stabilisce che l’automazione non è una causa legale di licenziamento. E le imprese devono fare i conti con una giurisprudenza in...
Fairwater IA data center Microsoft compute tax
, • ⏱ 4 min

La “compute tax”: ecco perché si torna a parlare di tassare l’IA

Tra redistribuzione e fuga di capitali, il dibattito sulla tassazione dell’IA scalda la campagna elettorale americana.

SpaceX Anthropic
• ⏱ 3 min

Anthropic affitterà i server di Musk

Colossus 1, il data center da centinaia di migliaia di chip Nvidia, cambia inquilino. E la corsa alla potenza di calcolo di Anthropic aggiunge un tassello...
Shivon Zilis Elon Musk
, • ⏱ 5 min

Secondo Shivon Zilis, Musk voleva fondere OpenAI in Tesla

Le testimonianze della compagna di Musk, Shivon Zilis, insieme a quelle di Brockman e Murati, ricostruiscono i sei mesi del 2017-2018 in cui il fondatore di Tesla tentò...
Share This