L’intelligenza artificiale sta rivoluzionando il modo in cui gli scienziati comprendono e progettano le proteine, i mattoni fondamentali della vita.
Il modello che ha segnato un punto di svolta è stato AlphaFold, sviluppato da DeepMind, in grado di prevedere con grande accuratezza la struttura tridimensionale delle proteine a partire dalla loro sequenza di amminoacidi.
Ora, un altro sistema basato sull’IA ha fatto un ulteriore passo avanti: non solo analizza le proteine esistenti, ma ne progetta di completamente nuove, al di fuori dei confini dell’evoluzione naturale.
esmGFP: una proteina mai vista in natura
Un gruppo di scienziati della società EvolutionaryScale ha sviluppato una proteina fluorescente chiamata esmGFP utilizzando il modello di intelligenza artificiale ESM3.
Secondo i ricercatori, questa proteina avrebbe impiegato 500 milioni di anni per emergere naturalmente, se mai la natura ne avesse avuto bisogno a scopo evolutivo.
EsmGFP esiste per ora solo sotto forma di codice informatico ma contiene il progetto di una proteina fluorescente verde che non ha precedenti in natura. Queste proteine sono tipicamente associate a organismi come le meduse e i coralli, che le utilizzano per produrre il loro caratteristico bagliore.
La sequenza genetica di esmGFP è solo per il 58% simile alla proteina fluorescente più vicina conosciuta, derivata da un’anemone di mare. Il resto della sequenza è unico e avrebbe richiesto almeno 96 mutazioni genetiche per evolversi naturalmente.
Il modello ESM3, invece, è stato in grado di progettare questa proteina in tempi estremamente ridotti.
Le applicazioni di esmGFP
Gli scienziati modificano da anni proteine naturali per migliorarne le caratteristiche o adattarle a specifiche esigenze sperimentali.
Quelle fluorescenti sono strumenti fondamentali nella ricerca scientifica. In laboratorio, vengono spesso utilizzate come marcatori per monitorare processi cellulari, facilitando lo studio di malattie e lo sviluppo di nuovi farmaci.
La nuova proteina esmGFP potrebbe così rivelarsi una risorsa preziosa per il settore farmaceutico e biotecnologico. “Le capacità di ESM3 possono accelerare una vasta gamma di applicazioni nell’ingegneria delle proteine, inclusa la progettazione di nuovi farmaci”, ha dichiarato Alex Rives, cofondatore e capo scienziato di EvolutionaryScale.
Come funziona ESM3 e com’è stato addestrato
A differenza dei metodi tradizionali, che ereditano le limitazioni dell’evoluzione naturale, il modello di IA ESM3 utilizza un approccio alternativo.
Il sistema è infatti stato addestrato su un database contenente le informazioni di 2,78 miliardi di proteine esistenti in natura. Il modello ha imparato a riconoscere le relazioni tra sequenza, struttura e funzione delle proteine, permettendogli di generare nuove sequenze plausibili.
Per testare le capacità di ESM3, i ricercatori hanno rimosso parti di sequenze proteiche conosciute e chiesto al modello di completarle in modo coerente con le informazioni apprese. Questo metodo è simile a come un modello di linguaggio, come ChatGPT, completa una frase a partire dalle parole iniziali.
“Allo stesso modo in cui una persona può completare la frase ‘essere o non essere, questo è il …’, possiamo addestrare un modello linguistico a riempire gli spazi vuoti nelle proteine”, ha spiegato Rives.
Secondo gli scienziati, il modello è in grado di generare proteine funzionali che non esistono in natura, superando i limiti della selezione naturale. Ma alcuni esperti invitano alla cautela.
Tiffany Taylor, biologa evolutiva dell’Università di Bath, ha sottolineato che l’affermazione di aver simulato 500 milioni di anni di evoluzione riguarda solo singole proteine e non tiene conto dei complessi processi della selezione naturale.
A suo modo di vedere, infatti, l’uso dell’intelligenza artificiale per creare proteine è interessante e promettente, ma potrebbe esserci troppa sicurezza nel pensare che l’IA possa davvero fare meglio di ciò che la selezione naturale ha perfezionato in milioni di anni.
La natura ha sviluppato meccanismi complessi ed efficaci, e non è così scontato che un algoritmo possa superarli senza conseguenze o limiti imprevisti.
Il dibattito è dunque aperto ma una cosa è certa: l’intelligenza artificiale sta già trasformando il modo in cui gli scienziati progettano le proteine, con implicazioni che potrebbero rivoluzionare la medicina e la biotecnologia nei prossimi anni.


