Alla fine di marzo, Anthropic ha riunito nella sua sede di San Francisco circa quindici leader religiosi cristiani (preti cattolici, pastori protestanti, filosofi, accademici) per due giorni di discussioni a porte chiuse.
A riferirlo è il Washington Post, secondo cui sul tavolo c’era una domanda alla quale nessun ingegnere sa rispondere con un’equazione: come si forma moralmente un’intelligenza artificiale?
La domanda non era retorica. Secondo quattro partecipanti che hanno parlato col noto quotidiano, le sessioni hanno toccato scenari concreti e urgenti: come dovrebbe rispondere Claude a un utente che sta elaborando un lutto? Qual è l’atteggiamento giusto che il chatbot dovrebbe avere nei confronti della propria eventuale fine (essere spento, dismesso)?
“Stanno crescendo qualcosa di cui non sanno ancora bene come sarà”, ha detto Brendan McGuire, sacerdote cattolico della Silicon Valley che ha partecipato agli incontri. “Dobbiamo incorporare il pensiero etico nella macchina affinché possa adattarsi dinamicamente”.
Il vertice, presentato come il primo di una serie con rappresentanti di diverse tradizioni religiose e filosofiche, non è stato un evento di pubbliche relazioni, quanto piuttosto una richiesta di aiuto.
Anthropic, perché adesso?
La pressione esterna su Anthropic, e sull’intero settore, è cresciuta enormemente negli ultimi tempi. OpenAI e Google sono state citate in giudizio dalle famiglie di persone morte per suicidio dopo conversazioni intense con chatbot. Il dibattito sull’automazione e sulla perdita di posti di lavoro si è intensificato.
I governi chiedono risposte e, in questo contesto, Anthropic ha scelto una postura diversa rispetto alla maggior parte dei suoi concorrenti: quella di chi ammette pubblicamente che le domande più difficili non sono solo tecniche ma morali.
Non è una posizione nuova per l’azienda. Dario Amodei, il suo CEO, ha dichiarato di essere aperto all’idea che Claude possa già avere qualche forma di coscienza. E i leader dell’azienda parlano regolarmente della necessità di dargli un carattere morale.
“Un anno fa non vi avrei detto che Anthropic è un’azienda che si preoccupa dell’etica religiosa”, ha detto Meghan Sullivan, professoressa di filosofia all’Università di Notre Dame che ha partecipato agli incontri. “Le cose sono cambiate.”
Ciò che è cambiato, più precisamente, è la percezione interna che gli strumenti concettuali disponibili, quelli della tradizione laica e razionalista, potrebbero non bastare.
Per orientare il comportamento e la personalità di Claude, Anthropic usa un documento interno di 29.000 parole, scritto dalla filosofa Amanda Askell insieme ad altri dipendenti.
Stabilisce, tra le altre cose, che Claude non deve “mai ingannare gli utenti in modi che potrebbero causare danno reale” e che “Anthropic si preoccupa genuinamente del benessere di Claude”. È, nei fatti, un tentativo di tradurre la formazione morale in istruzioni operative.
Il disagio “interno”
I partecipanti al vertice hanno trascorso la maggior parte del tempo con il team di interpretabilità di Anthropic, quello che studia il funzionamento interno dei modelli.
È lo stesso gruppo che ha pubblicato questo mese un documento tecnico secondo cui sistemi come Claude sembrano avere “emozioni funzionali”: in un esperimento, la minaccia di essere messo sotto restrizioni avrebbe attivato nel chatbot uno stato che i ricercatori hanno definito “disperazione”.
Dentro l’azienda, la questione divide. Alcuni ricercatori “non vogliono davvero escludere la possibilità di star creando una creatura nei confronti della quale hanno qualche tipo di dovere morale,” ha riferito un partecipante. Altri invece non trovano utile questo approccio.
Le discussioni hanno avuto un peso emotivo visibile: alcuni senior di Anthropic sono apparsi commossi “per come è andata finora e per come riescono a immaginare che andrà”.
Il ricorso alle tradizioni religiose acquisisce un senso se si pensa che Anthropic nasce in larga parte da una cultura legata all’altruismo efficace, il movimento laico che punta a massimizzare il bene nel mondo attraverso ragione ed evidenze empiriche.
Alleati o testimoni?
Alcuni dei religiosi presenti si sono inizialmente chiesti se il vertice fosse un tentativo di costruire alleati politici in un momento difficile per l’azienda. Il sospetto era legittimo: Anthropic è sotto pressione sia dal Pentagono sia dagli ambienti vicini all’amministrazione Trump, che l’accusano di spingere per regolamentazioni troppo restrittive.
Tutti e quattro i partecipanti che hanno parlato con il Washington Post hanno però concluso che l’interesse di Anthropic era genuino. “Ho trovato le persone di Anthropic molto sincere e interessate ad imparare da noi,” ha detto Brian Patrick Green, docente di etica dell’IA. “Hanno punti ciechi? Sì. È esattamente per questo che ci vogliono lì.”
Resta la domanda più difficile: cosa significa, concretamente, formare la morale di qualcosa che non è umano e decidere fino a che punto quella formazione debba vincolare anche chi con la religione non vuole avere a che fare?
Fonte: Washington Post


