Il progetto ENCODE
ENCODE
rappresenta
nella cyclopedia O
f D
NA E
LEMENTI, ed è un'analisi
completa del genoma umano progetto,
che ha avuto inizio con un progetto pilota in cui abbiamo studiato
solo l'1% del totale. Alla fine abbiamo ottenuto un'immagine molto
dettagliata che mostra tutte le trascrizioni delle primarie e maturi,
e la posizione delle principali modifiche degli istoni, i siti di
legame di fattori di trascrizione, avviare i siti di trascrizione,
siti DNasi ipersensibili, ecc, tutti collegati ai dati di espressione
genica, la replicazione e numero di esemplari delle stesse regioni.
Inizialmente,
il più evidente di questa analisi è stata la grande
quantità di trascrizione
viene rilevata lungo il genoma umano: 15%
dei nucleotidi sono inclusi in trascritti maturi, e gran parte del
resto della base (fino a 90 %) sono la parte del tessuto trascritti
primari. Inoltre, ci sono molti
siti di inizio di trascrizione
diversi da quelli elencati in precedenza, spesso lontano da quello
che era considerato l'inizio del gene. Analogamente, abbiamo
identificato circa 200
pseudogeni
(60% trasformati e non trasformati 40%), di cui sono trascritte
quinto. Questo, trasposti al resto del genoma significa circa 20.000
pseudogeni in totale.
Anche se si è poi trovato che l'intensità della trascrizione "basale" non è alto, i dati forniti dalla ENCODE indicano che i geni sono più complessi di quanto precedentemente pensato: invece di vista tradizionale, secondo cui un gene dà luogo ad uno o più alternative trascritti codificanti una proteina nelle loro varie isoforme, appare chiaro che una regione genomica possono codificare prodotti proteici differenti, e anche causare altri trascritti (non necessariamente codificante proteina) in entrambe le catene. Tutto questo ci ha portato a ripensare il concetto di gene, che nel post-ENCODE essere definita come "l'unione di sequenze genomiche che codificano un insieme coerente di prodotti funzionali, potenzialmente sovrapposti." Questa definizione sottolinea il prodotto funzionale è codificato (qui l'uso di "coerente" per indicare che si codifica una proteina o RNA). L'aspetto più nuovo di questa definizione è che le regioni non tradotte (UTR) non sarebbe parte del gene, essendo inclusi, insieme normativo-elementi nella categoria di "regioni associate con i geni." La definizione alternativa è più in linea con il pensiero corrente che un gene è "la regione genomica codificante un insieme di alternative trascritti sovrapposti", ma codificano prodotti proteici differenti, è problematico in base ai dati forniti dal progetto ENCODE. Se c'è molto sovrapposizione dei trascritti, applicando questa definizione porterebbe ad un piccolo numero di geni di grandi dimensioni, che avrebbe anche poco significato per codificare prodotti biologicamente funzionali differenti (lo stesso gene potrebbe portare a proteina diversa e / o RNA di codifica). La nuova definizione può aumentare il numero totale di geni nel genoma, ma essendo centrata nel prodotto finale è più informativo del ruolo di ciascun gene particolare.
Anche se si è poi trovato che l'intensità della trascrizione "basale" non è alto, i dati forniti dalla ENCODE indicano che i geni sono più complessi di quanto precedentemente pensato: invece di vista tradizionale, secondo cui un gene dà luogo ad uno o più alternative trascritti codificanti una proteina nelle loro varie isoforme, appare chiaro che una regione genomica possono codificare prodotti proteici differenti, e anche causare altri trascritti (non necessariamente codificante proteina) in entrambe le catene. Tutto questo ci ha portato a ripensare il concetto di gene, che nel post-ENCODE essere definita come "l'unione di sequenze genomiche che codificano un insieme coerente di prodotti funzionali, potenzialmente sovrapposti." Questa definizione sottolinea il prodotto funzionale è codificato (qui l'uso di "coerente" per indicare che si codifica una proteina o RNA). L'aspetto più nuovo di questa definizione è che le regioni non tradotte (UTR) non sarebbe parte del gene, essendo inclusi, insieme normativo-elementi nella categoria di "regioni associate con i geni." La definizione alternativa è più in linea con il pensiero corrente che un gene è "la regione genomica codificante un insieme di alternative trascritti sovrapposti", ma codificano prodotti proteici differenti, è problematico in base ai dati forniti dal progetto ENCODE. Se c'è molto sovrapposizione dei trascritti, applicando questa definizione porterebbe ad un piccolo numero di geni di grandi dimensioni, che avrebbe anche poco significato per codificare prodotti biologicamente funzionali differenti (lo stesso gene potrebbe portare a proteina diversa e / o RNA di codifica). La nuova definizione può aumentare il numero totale di geni nel genoma, ma essendo centrata nel prodotto finale è più informativo del ruolo di ciascun gene particolare.
Un'altra
sorpresa del progetto ENCODE è stato quello di testare una
percentuale di trascrizioni rilevate non codificano proteine, in modo
che la categoria di "RNA non codificante" continuano ad
aumentare in futuro. In particolare, negli ultimi anni hanno visto
l'esplosione di un nuovo tipo di RNA
non codificanti lunghi (lncRNAs inglese),
con importanti funzioni di regolamentazione stanno iniziando a
imparare a poco a poco. Questi RNA con una
dimensione maggiore di 200
nucleotidi che maturano attraverso splicing, ma che non codificano
proteine. Il loro numero è in aumento, raggiungendo calcola che
circa 10 a 20 volte più proteine di sequenza genomica
codificante RNA.
Tra
le funzioni svolte da lncRNAs, è che essi sono in grado di inibire
geni multipli
in trans (cioè sono geni su cromosomi diversi), come nel caso di
lincRNA-p21. Di particolare interesse sono alcuni altri lncRNAs nuove
caratteristiche. Ad esempio, è stato mostrato agire come impalcature
su cui vari fattori sono reclutati regolatori dell'espressione genica
(modificatori della cromatina, che nel capitolo seguente). Questo è
il caso di una chiamata lncRNA
Hotair,
che è in grado di trasportare un geni repressore genoma complesso.
LncRNAs
altri stimolare l'espressione di geni vicini, o perché sono attivi
stessi o perché enhancer sono associati con co-attivatori di
trascrizione. Infine, lncRNAs sembrano essere coinvolti con la
formazione
di anelli cromatina,
servendo come punti di ancoraggio formate sui compartimenti nucleari
(paraspeckles, per esempio).
Nel
complesso, i risultati del progetto ENCODE sono entusiasmanti e molto
arricchire la nostra visione del genoma umano, la sua
regolamentazione e il funzionamento, che apre orizzonti inattesi
nella ricerca genomica e hanno forti implicazioni biomediche nel
prossimo futuro. .
Fonte:http://www.unav.es/ocw/genetica/tema-1-4.html
Nessun commento:
Posta un commento
COMMENTI