Il genoma umano potrebbe contenere fino al 20% di geni in meno

geni

Immagine: DNA illustration (stock image). Credit: © k_e_n / Fotolia.

Un nuovo studio condotto dal Centro nazionale spagnolo di ricerca sul cancro (CNIO) rivela che fino al 20 percento dei geni classificati come codificanti (quelli che producono le proteine ​​che sono gli elementi costitutivi di tutti gli esseri viventi) hanno caratteristiche tipiche di non codificanti o pseudogeni (geni codificanti obsoleti). La conseguente riduzione delle dimensioni del genoma umano potrebbe avere effetti importanti in biomedicina, dal momento che il numero di geni che producono proteine ​​e la loro identificazione è di vitale importanza per lo studio di molteplici malattie, tra cui il cancro e le malattie cardiovascolari.

ll lavoro, pubblicato sulla rivista Nucleic Acids Research, è il risultato di una collaborazione internazionale condotta da Michael Tress del CNIO Bioinformatics Unit insieme ai ricercatori del Wellcome Trust Sanger Institute nel Regno Unito, il Massachusetts Institute of Technology negli Stati Uniti, l’Università Pompeu Fabra e il Centro Nazionale per il Supercalcolo (BSC-CNS) a Barcellona ​​e il Centro Nazionale per la Ricerca Cardiovascolare (CNIC) a Madrid.

Dal completamento del sequenziamento del genoma umano nel 2003, esperti di tutto il mondo hanno lavorato per compilare il proteoma umano finale (il numero totale di proteine ​​generate dai geni) e i geni che le producono. Questo compito è immenso, data la complessità del genoma umano e il fatto che gli esseri umani hanno circa 20.000 geni codificanti separati.

I ricercatori hanno analizzato i geni catalogati come codificanti proteine ​​nei principali proteomi umani di riferimento. Il confronto dettagliato dei proteomi di riferimento da GENCODE / Ensembl, RefSeq e UniProtKB ha trovato 22.210 geni codificanti, ma solo 19.446 di questi geni erano presenti in tutte e 3 le annotazioni.

Quando hanno analizzato i 2764 geni presenti in una o due di queste annotazioni di riferimento, sono stati sorpresi di scoprire che prove sperimentali e annotazioni manuali hanno suggerito che quasi tutti questi geni avevano più probabilità di essere geni non codificanti o pseudogeni. In realtà, questi geni, insieme ad altri 1470 geni codificanti presenti nei tre cataloghi di riferimento, non si evolvevano come i tipici geni codificanti le proteine. La conclusione dello studio è che la maggior parte di questi 4.234 geni probabilmente non codificano per le proteine.

Lo studio sta già dando i suoi frutti, secondo gli scienziati. “Siamo stati in grado di analizzare molti di questi geni in dettaglio”, spiega Tress, “e oltre 300 geni sono già stati riclassificati come non codificanti”. I risultati sono già inclusi nelle nuove annotazioni del genoma umano dal consorzio internazionale GENCODE, di cui fanno parte i ricercatori del CNIO.

Numeri di geni in conflitto negli ultimi anni

Il lavoro mette nuovamente in luce dubbi sul numero di geni reali presenti nelle cellule umane 15 anni dopo il sequenziamento del genoma umano. Anche se i dati più recenti indicano che il numero di geni che codificano per le proteine ​​umane potrebbe superare i 20.000, Federico Abascal, del Wellcome Trust Sanger Institute nel Regno Unito e primo autore del lavoro, afferma: “Le nostre prove suggeriscono che gli esseri umani possono avere solo 19.000 geni codificanti, ma non sappiamo ancora quali siano”.

Da parte sua, David Juan, dell’Università Pompeu Fabra e partecipante allo studio, ribadisce l’importanza di questi risultati: “Sorprendentemente, alcuni di questi geni insoliti sono stati ben studiati e hanno più di 100 pubblicazioni scientifiche basate sul presupposto che il il gene produce una proteina.

Questo studio suggerisce che c’è ancora una grande quantità di incertezza, dal momento che il numero finale di geni codificanti potrebbe essere 2.000 in più o 2.000 in meno rispetto a ora. Il proteoma umano richiede ancora molto lavoro, soprattutto data la sua importanza per la comunità medica.

Fonte: Nucleic Acid Reserch

Altri articoli su geni