HomeSaluteBiotecnologie e GeneticaL'IA eccelle nella creazione di nuove proteine

L’IA eccelle nella creazione di nuove proteine

(IA, intelligenza artificiale-Immagine Credit Public Domain).

Negli ultimi due anni, l’apprendimento automatico ha rivoluzionato la previsione della struttura delle proteine. Ora, tre articoli pubblicati su Science descrivono una rivoluzione simile nella progettazione delle proteine.

Le proteine ​​progettate con uno strumento software ultrarapido chiamato ProteinMPNN avevano molte più probabilità di piegarsi come previsto. Credito immagine: Ian Haydon / Università di Washington

Nei nuovi articoli, i biologi della University of Washington School of Medicine mostrano che l’IA, l’apprendimento automatico,  può essere utilizzato per creare molecole proteiche in modo molto più accurato e rapido di quanto fosse possibile in precedenza. Gli scienziati sperano che questo progresso porti a molti nuovi vaccini, trattamenti, strumenti per la cattura del carbonio e biomateriali sostenibili.

“Le proteine ​​sono fondamentali in tutta la biologia, ma sappiamo che tutte le proteine ​​che si trovano in ogni pianta, animale e microbo costituiscono molto meno dell’uno per cento di ciò che è possibile. Con questi nuovi strumenti software, i ricercatori dovrebbero essere in grado di trovare soluzioni a sfide di lunga data in medicina, energia e tecnologia”, ha affermato l’autore senior dello studio David Baker, Professore di biochimica presso la University of Washington School of Medicine e destinatario di un  Premio Breakthrough 2021 in Scienze della Vita.

Le proteine ​​sono spesso indicate come i “mattoni della vita” perché sono essenziali per la struttura e la funzione di tutti gli esseri viventi. Sono coinvolti praticamente in ogni processo che avviene all’interno delle cellule, inclusa la crescita, la divisione e la riparazione. Le proteine ​​sono costituite da lunghe catene di sostanze chimiche chiamate amminoacidi. La sequenza di amminoacidi in una proteina determina la sua forma tridimensionale. Questa forma intricata è fondamentale per il funzionamento della proteina.

Recentemente, potenti algoritmi di apprendimento automatico, tra cui  AlphaFold e RoseTTAFold, sono stati addestrati per prevedere le forme dettagliate delle proteine ​​naturali basate esclusivamente sulle loro sequenze di amminoacidi. L’apprendimento automatico è un tipo di intelligenza artificiale che consente ai computer di apprendere dai dati senza essere programmati in modo esplicito. L’apprendimento automatico può modellare problemi scientifici complessi che sono troppo difficili da comprendere per gli esseri umani.

Anelli simmetrici con allucinazione AI. Credito immagini: Ian Haydon, Washington University

Per andare oltre le proteine ​​presenti in natura, i membri del team di Baker hanno suddiviso la sfida della progettazione delle proteine ​​in tre parti e hanno utilizzato nuove soluzioni software per ciascuna.

Innanzitutto, deve essere generata una nuova forma proteica. In un articolo pubblicato il 21 luglio sulla rivista Science, il team ha dimostrato che l’intelligenza artificiale può generare nuove forme proteiche in due modi.

Il primo, soprannominato “allucinazione”, è simile a DALL-E o altri strumenti di IA generativa che producono output sulla base di semplici prompt. Il secondo, chiamato “inpainting”, è analogo alla funzione di completamento automatico che si trova nelle moderne barre di ricerca.

Vedi anche:La teoria musicale utilizzata dall’intelligenza artificiale per creare proteine mai viste prima

In secondo luogo, per accelerare il processo, il team ha ideato un nuovo algoritmo per la generazione di sequenze di amminoacidi. Descritto nel numero del 15 settembre di Science, questo strumento software, chiamato ProteinMPNN, viene eseguito in circa un secondo. È più di 200 volte più veloce del miglior software precedente. I suoi risultati sono superiori agli strumenti precedenti e il software non richiede personalizzazione da parte di esperti per l’esecuzione.

“Le reti neurali sono facili da addestrare se si dispone di una tonnellata di dati, ma con le proteine ​​non abbiamo tutti gli esempi che vorremmo. Abbiamo dovuto entrare e identificare quali caratteristiche di queste molecole sono le più importanti. Ci sono stati tentativi per prove ed errori”, ha affermato lo scienziato del progetto Justas Dauparas, un borsista post-dottorato presso l’Institute for Protein Design.

In terzo luogo, il team ha utilizzato AlphaFold, uno strumento sviluppato da DeepMind di Alphabet, per valutare in modo indipendente se le sequenze di amminoacidi che hanno inventato potessero piegarsi nelle forme previste.

 “Il software per la previsione delle strutture proteiche fa parte della soluzione, ma da solo non può inventare nulla di nuovo”, ha spiegato Dauparas.

“ProteinMPNN è per la progettazione delle proteine ​​ciò che AlphaFold era per la previsione della struttura delle proteine”, ha aggiunto Baker.

In un altro articolo apparso su Science il 15 settembre, un team del laboratorio Baker ha confermato che la combinazione di nuovi strumenti di apprendimento automatico potrebbe generare in modo affidabile nuove proteine ​​che funzionano in laboratorio.

Abbiamo scoperto che le proteine ​​prodotte utilizzando ProteinMPNN avevano molte più probabilità di ripiegarsi come previsto e potremmo creare assemblaggi proteici molto complessi utilizzando questi metodi“, ha affermato lo scienziato del progetto Basile Wicky, un borsista post-dottorato presso l’Institute for Protein Design.

Tra le nuove proteine ​​prodotte c’erano anelli su nanoscala che secondo i ricercatori potrebbero diventare parti per nanomacchine personalizzate. I microscopi elettronici sono stati usati per osservare gli anelli, che hanno diametri circa un miliardo di volte più piccoli di un seme di papavero.

“Questo è l’inizio dell’apprendimento automatico nella progettazione delle proteine. Nei prossimi mesi lavoreremo per migliorare questi strumenti per creare proteine ​​ancora più dinamiche e funzionali”, ha affermato Baker.

Microsoft e Amazon Web Services hanno donato risorse informatiche per questo lavoro.

Fonte: Università di Washington

 

Newsletter

Tutti i contenuti di medimagazine ogni giorno sulla tua mail

Articoli correlati

In primo piano