
Nel gennaio 2025, il gruppo di ricerca guidato dalla EvolutionaryScale, con la collaborazione dell’Arc Institute (un’organnizzazione statunitense di ricerca senza scopo di lucro), ha pubblicato su Science il risultato di un procedimento innovativo: la costruzione di una proteina verde fluorescente chiamata esmGFP, completamente artificiale e mai esistita in natura.
La proteina è stata generata impiegando ESM3, un modello di intelligenza artificiale sviluppato da EvolutionaryScale, basato su architetture simili a quelle dei grandi modelli di linguaggio, ma specializzato nel dominio biologico. ESM3 è stato allenato su un vastissimo dataset di 770 miliardi di sequenze proteiche che ha permesso di simulare i processi evolutivi di oltre 500 milioni di anni. La tecnologia per ottenere questo risultato si è basata sul prompting “chain-of-thought” che ha generato oltre 190 varianti, alcune delle quali sono risultate fluorescenti. Tra le varianti generate, la più promettente è stata chiamata esmGFP, mostra una somiglianza significativa con la GFP (Green Fluorescent Protein) presente nell’anemone Entacmaea quadricolor.
Tra i potenziali utilizzi di esmGFP, spiccano le applicazioni in biologia cellulare e molecolare, dove potrebbe fungere da marcatore fluorescente in studi di espressione genica, localizzazione subcellulare e interazioni proteina-proteina. In ambito biotecnologico e diagnostico, potrebbe essere incorporata in biosensori, sistemi di tracciamento molecolare o dispositivi portatili per la rilevazione di sostanze biologiche o chimiche.
La progettazione di esmGFP dimostra che l’IA può esplorare percorsi evolutivi che la selezione naturale potrebbe non aver mai attraversato. Questo approccio apre nuove vie nella biologia sintetica, nella medicina e nelle applicazioni ambientali, come lo sviluppo di enzimi per la degradazione della plastica, o di molecole terapeutiche totalmente nuove.
Gli autori sottolineano che, sebbene tali modelli possano generare sequenze funzionali, mancano ancora molti dettagli sul comportamento reale di queste proteine in vivo: interazioni cellulari, stabilità, potenziali risposte immunitarie e impatti ambientali dovranno essere attentamente valutati.
Alcuni scienziati indipendenti, interrogati sul tema, mettono in guardia contro un’applicazione troppo entusiastica di questi modelli. Ad esempio, l’evoluzionista Tiffany Taylor ha osservato come il procedimento artificiale pilotato dalla IA non può essere paragonabile alla complessità dei processi di selezione naturale che coinvolgono interazioni tra organismi e ambienti diversi in milioni di anni.
EsmGFP rappresenta comunque uno dei primi casi documentati di proteina artificiale progettata interamente tramite AI. I risultati dello studio confermano il potenziale di ESM3 come strumento generativo in biologia, capace di produrre biomolecole mai osservate in natura. Ma è importante non lasciarsi trasportare troppo dall’entusiasmo iniziale: sono necessari ulteriori studi e sperimentazioni per esplorare in profondità sia le potenzialità che i limiti di questa nuova frontiera della biologia.