AlphaFold compie cinque anni: questi grafici mostrano come ha rivoluzionato la scienza
AlphaFold-immagine: un modello AlphaFold di Tmem81, una proteina di membrana coinvolta nella fusione tra ovulo e spermatozoo. Crediti: Google DeepMind/EMBL-EBI (CC-BY-4.0)
Da quando è stato presentato nel 2020, lo strumento di intelligenza artificiale rivoluzionario di Google DeepMindha aiutato i ricercatori di tutto il mondo a prevedere le strutture 3D di centinaia di milioni di proteine.
Da quasi un decennio Andrea Pauli, biochimica presso l’Istituto di ricerca di patologia molecolare di Vienna, cerca di capire come si uniscono spermatozoi e ovulo.
Nel 2018, il suo laboratorio ha scoperto una proteina sulla superficie delle uova di pesce zebra ( Danio rerio ), chiamata Bouncer, essenziale per la fecondazione. Ma il team di Pauli e altri hanno faticato a dimostrare come Bouncer riconoscesse gli spermatozoi. Poi è avvenuta una rivoluzione.
AlphaFold rivela nei minimi dettagli come si collegano spermatozoi e ovuli
Cinque anni fa, alla fine di novembre 2020, i ricercatori di Google DeepMind, con sede a Londra, hanno presentato AlphaFold2.Lo strumento di intelligenza artificiale per la previsione delle strutture proteiche ha generato modelli 3D incredibilmente accurati che, in alcuni casi, erano indistinguibili dalle mappe sperimentali, vincendo una sfida di lunga data nella previsione della struttura. La prima versione di AlphaFold è stata annunciata nel 2018, ma le sue previsioni non erano nemmeno lontanamente affidabili come quelle del suo successore, il che ne ha limitato l’impatto.
La pubblicazione del codice AlphaFold2 nel 2021 e un database che ha raggiunto centinaia di milioni di strutture previste significano che gli scienziati possono ora ottenere una previsione affidabile per quasi tutte le proteine.
“Avere modelli per qualsiasi cosa ha avuto un impatto enorme”, afferma Janet Thornton, bioinformatica presso l’European Bioinformatics Institute di Hinxton, nel Regno Unito, parte dell’European Molecular Biology Laboratory (EMBL–EBI). “È come la seconda venuta della biologia strutturale”.
Scoperta rapida
Per il team di Pauli, il software ha aperto una strada che altrimenti non avrebbero mai trovato. Il modello prevedeva che una proteina, chiamata Tmem81, stabilizzasse un complesso di altre due proteine spermatiche, creando una tasca a cui Bouncer potesse legarsi . Gli esperimenti hanno confermato le previsioni dello strumento. “AlphaFold “accelera la scoperta”, afferma Pauli. “Lo usiamo per ogni progetto”.
L’articolo del suo team su questo argomento, pubblicato nel 2024, è uno dei quasi 40.000 articoli di riviste che citano l’ articolo del 2021 su Nature che descrive AlphaFold2. A differenza di molti altri articoli biomedici e di scienze della vita altamente citati dello stesso periodo, inclusi resoconti fondamentali sulla pandemia di COVID-19, l’interesse per AlphaFold non sembra rallentare.
John Jumper di DeepMind, che ha condiviso metà del Premio Nobel per la Chimica 2024 con l’amministratore delegato Demis Hassabis per lo sviluppo di AlphaFold, si dice “profondamente orgoglioso” di quanto lo strumento sia stato utile per scienziati come Pauli. “Quando qualcuno vincerà uno di questi importanti premi per aver utilizzato AlphaFold?“, si chiede.
“Parte del rapido impatto di AlphaFold2 è dovuto alla sua accessibilità”, affermano i ricercatori. Google DeepMind ha reso il codice sottostante e altri parametri liberamente accessibili agli scienziati, che hanno rapidamente potuto eseguire il software autonomamente su larga scala: questo è ciò che ha fatto il team di Pauli.
Circa 3,3 milioni di utenti in oltre 190 paesi hanno avuto accesso al database AlphaFold (AFDB), ospitato dall’EMBL–EBI e contenente oltre 240 milioni di previsioni strutturali, che comprendono la maggior parte delle proteine note. Oltre un milione di utenti AFDB proviene da paesi a basso e medio reddito, tra cui Cina e India.
Rivoluzione della struttura proteica
Il campo in cui AlphaFold sembra aver avuto il suo maggiore impatto è la biologia strutturale.I ricercatori che hanno utilizzato AlphaFold hanno inviato circa il 50% in più di strutture proteiche a un archivio di modelli sperimentali, chiamato Protein Data Bank (PDB), rispetto a un gruppo di ricercatori di biologia strutturale non utilizzatore di AlphaFold, secondo uno studio sugli impatti di AlphaFold, finanziato da Google DeepMind e pubblicato questa settimana. L’utilizzo di AlphaFold2 è stato inoltre associato a tassi più elevati di invii di dati PDB rispetto a quelli dei ricercatori che utilizzano altri metodi “di frontiera” nell’intelligenza artificiale, nella biologia strutturale e nella previsione della struttura proteica.
Jumper si dice particolarmente soddisfatto che AlphaFold2, addestrato utilizzando i dati PDB, si sia dimostrato così utile per dedurre le strutture proteiche. Le strutture previste possono aiutare i ricercatori a dare un senso ai dati grezzi generati dalla cristallografia a raggi X e dalla microscopia crioelettronica. “Sono entusiasta che aiuti le persone che ci hanno fornito i dati”, aggiunge Jumper.