Dal DNA alle proteine

Il gene è l’intera sequenza di DNA necessaria per la sintesi di una proteina o di una molecola di RNA funzionale. Gli esoni sono le porzioni codificanti, gli introni sono le porzioni non codificanti.

Il codice genetico è una sorta di alfabeto in cui le 4 basi del DNA si combinano a 3 lettere, permettendo la formazione di 4³ = 64 “parole”, più che sufficiente a specificare tutti gli aminoacidi ritrovati nelle proteine. Il codice genetico è universale, è praticamente lo stesso in tutti gli organismi, dai procarioti all’uomo, mentre presenta un certo grado di ridondanza, detta anche degenerazione, la quale consiste nel fatto che alcuni amminoacidi sono specificati da più di un codone, ad esempio i codoni CCU, CCC, CCA e CCG codificano tutti per la prolina, l’unica differenza tra i quattro codoni riguarda il nucleotide posto all’estremità 3’ della tripletta.

Nella trascrizione gli RNA sono sintetizzati da RNA polimerasi DNA dipendenti, cioè che che richiedono il DNA come stampo. Come le DNA polimerasi, le RNA polimerasi effettuano la sintesi in direzione 5’-3’, cioè partono dall’estremità 5’ della molecola di RNA da sintetizzare e proseguono aggiungendo nucleotidi all’estremità 3’ finchè la molecola non è completa. Le RNA polimerasi usano come substrati i nucleotidi trifosfati. Come i 2 filamenti del DNA, anche il filamento del DNA trascritto e il filamento dell’RNA complementare sono antiparalleli: l’RNA è sintetizzato in direzione 5’-3’ ed il DNA stampo è letto in direzione 3’-5’.

Vediamo ora il meccanismo della trascrizione del DNA nelle sue fasi: all’inizio la sequenza di DNA alla quale la RNA polimerasi inizialmente si lega è chiamata promotore, quando la RNA polimerasi ha riconosciuto il corretto promotore, srotola la doppia elica di DNA ed inizia la trascrizione. Il promotore non è trascritto, quindi la RNA polimerasi si deve spostare oltre (al 3’) rispetto al promotore. La reazione richiede, oltre all’RNA polimerasi, anche alcune proteine dette fattori trascrizionali. Nella fase di allungamento il primo nucleotide al 5’ della molecola di RNA trattiene il gruppo trifosfato, mentre nella fase di allungamento due fosfati vengono rimossi da ogni nucleotide successivamente incorporato all’estremità 3’. L’allungamento prosegue fino a che la RNA polimerasi riconosce un segnale di terminazione, che consiste in una serie di specifiche sequenze di DNA sul filamento stampo e che causa il distacco dell’enzima sia dal DNA stampo che dall’RNA neosintetizzato.

Solo uno dei due filamenti di DNA in una regione codificante è trascritto per un dato gene, ad esempio il filamento 3’-TAACGGTCT-5’ detto filamento stampo è copiato in 5’-ATTGCCAGA-3’ che è detto il filamento complementare. Se il filamento complementare venisse trascritto, sarebbe infatti prodotto un mRNA per una proteina completamente diversa, dunque un determinato filamento può fungere da stampo per alcuni geni e da filamento non trascritto per altri.

L’mRNA completo contiene più sequenze nucleotidiche di quelle che codificano la proteina: esso possiede all’estremità 5’ una sequenza leader non codificante, che contiene i siti di riconoscimento per il ribosoma, segue verso il 3’ la sequenza codificante per le proteine, mentre alla fine di ciascuna sequenza codificante c’è uno speciale codone di STOP o di terminazione che può essere UAA, UGA o UAG.

Dopo la trascrizione il RNA eucariotico o pre-mRNA richiede vari passaggi di maturazione nel nucleo prima di potere essere tradotto nella sintesi proteica: viene aggiunta di un cappuccio all’estremità 5’ di 7-metilguanosina, che consente l’attacco ai ribosomi per la sintesi proteica, inoltre viene aggiunta di una coda di PoliA (poliadenina) al 3’ della molecola, che serve per la stabilizzazione dell’RNA e per il suo trasporto nel citoplasma. A questo punto può avvenire il meccanismo dello splicing, ovvero la rimozione degli introni non-codificanti e la ricucitura degli esoni codificanti. Questo processo avviene grazie all’interazione di proteine leganti il DNA quali l’snRNP che formano uno spliceosoma, da cui verranno eliminati gli introni con un taglio sull’estremità 5′ che andrà poi ad indurre il distacco dell’altrà estremità dal successivo esone. Infine avviene il trasporto attraverso i pori nucleari nel citoplasma del mRNA, dove può venire tradotto.

 

Per quanto riguarda la regolazione dell’espressione genica, in ogni organismo pluricellulare, ogni tipo cellulare ha la sua forma caratteristica, esprime attività specifiche e produce un insieme distinto di proteine. Eppure, a parte alcune eccezioni, tutte le cellule contengono lo stesso DNA. Le cellule differiscono infatti perché l’espressione dei geni è regolata e in ogni cellula solo alcune tra tutte le informazioni genetiche vengono espresse. I meccanismi di regolazione dell’espressione genica si esplicano a vari livelli: la regolazione della trascrizione dell’mRNA, la regolazione della maturazione dell’mRNA, la regolazione della traduzione e la regolazione della maturazione della proteina.

Nei procarioti, molti degli enzimi necessari a tutte le cellule sono detti housekeeping o di mantenimento, e sono codificati da geni costitutivamente espressi. Altri geni, la cui espressione non è costitutiva ma inducibile, vengono espressi solo in risposta ad mutazioni ambientali, ad esempio la variazione dei livelli di lattosio nell’ambiente con porta alla produzione inducibile di enzimi del metabolismo del lattosio, ad esempio batteri come Escherichia Coli regolano la produzione di molti suoi enzimi in modo da utilizzare in modo efficiente le molecole organiche disponibili, se infatti viene aggiunto lattosio ad una coltura, le cellule batteriche sintetizzano rapidamente gli enzimi del metabolismo del lattosio.

Ciò è possibile grazie al fatto che geni funzionalmente correlati sono regolati insieme all’interno di complessi di geni chiamati operoni, ovvero complessi genici che comprendono geni strutturali con funzioni correlate e sequenze di DNA vicine responsabili del loro controllo. Prendendo in considerazione l’operone del lattosio, vediamo come esso sia formato da una sequenza di DNA, formato dai geni strutturali per gli enzimi del metabolismo, lac Z, lac Y e lac A, a monte sono invece presenti le sequenze regolatrici di questi geni, il promotore e l’operatore, a monte di tutta questa struttura c’è anche il gene repressore. In assenza di lattosio il batterio induce una “standby” di questi enzimi, il gene repressore codifica infatti per una proteina repressore che si va a legare alle sequenze regolatrici dell’operatore reprimendo la sintesi di questi enzimi. Quando aggiungiamo lattosio all’ambiente, esso viene trasformato in allolattosio, dove allostericamente si va a legare la proteina repressore in maniera allosterica, il repressore viene così impegnato in un altro legame, manca la repressione a livello della sequenza dell’operatore, così gli enzimi per la sintesi del lattosio possono essere trascritti. L’operone del triptofano funziona in maniera analoga, anche se con qualche piccola differenza.

 

Negli eucarioti ciascun gene presenta specifiche sequenze di regolazione essenziali al controllo della sua espressione: molti degli enzimi necessari a tutte le cellule, detti housekeeping o di mantenimento, sono codificati da geni costitutivamente espressi, mentre altri geni, la cui espressione non è costitutiva ma inducibile, vengono espressi solo in risposta ad alterazioni ambientali o a livello di specifici tessuti. La maggior parte dei geni degli eucarioti pluricellulari è controllata a livello trascrizionale. Esiste un sito di inizio della trascrizione, una coppia di basi da cui il processo inizia, il RNA polimerasi prima di iniziare la trascrizione si lega ad una sequenza detta promotore, in corrispondenza della TATA box (sito caratteristico che fa parte della porzione prossimale del promotore), che si trova a 25-35 paia di basi dal sito di inizio della trascrizione. Il RNA polimerasi eucariotica non può legarsi al promotore prima dell’associazione con il DNA di varie proteine regolatrici dette fattori trascrizionali che si legano a parti diverse del promotore, essi sono infatti componenti caratteristici di questo processo aventi un dominio di legame al DNA ed un dominio attivatore o repressore della trascrizione.

Molti fattori trascrizionali funzionano in forma di dimeri. L’apparato generale di trascrizione è così formato da un complesso proteico che si lega alla TATA box del promotore vicino al sito di inizio della trascrizione, questo complesso è richiesto per il legame dell’RNA polimerasi, che altrimenti non può avvenire. La regolazione genica negli eucarioti richiede anche la presenza di sequenze dette intensificatori o ENHANCER, che aumentano la velocità di sintesi dell’RNA, specifici regolatori proteici si legano all’enhancer attivando la trascrizione mediante il legame con le proteine legate al promotore. L’enhancer può essere localizzato sia a monte (al 5’) o a valle (al 3’) del gene anche ad una notevole distanza (anche a migliaia di basi dal promotore), infatti il legame di un attivatore sulla sequenza enhancer permette al DNA di formare un ansa che metta in contatto questo attivatore con le proteine bersaglio dell’apparato trascrizionale, determinando l’attività trascrizionale. Negli eucarioti pluricellulari solo una piccola parte dei geni è attiva in ogni momento, alcuni dei geni inattivi sono infatti associati alla cromatina altamente condensata, detta eterocromatina, mentre i geni attivi sono associati alla cromatina più dispersa, detta eucromatina, che essendo più lassamente organizzata, è in grado di interagire con i fattori trascrizionali ed altre proteine di regolazione. Questo però a volte non basta, perchè anche nell’eucromatina vengono utilizzati diversi metodi per inattivare temporaneamente delle porzioni geniche, come può essere la metilazione delle basi azotate.

La trasduzione o sintesi proteica è la conversione del codice a quattro basi dell’acido nucleico ad un alfabeto di venti aminoacidi delle proteine. Un amminoacido deve essere attivato da una specifica aminoacil-tRNA sintetasi prima di essere legato al suo specifico RNA transfer. Il complesso che si forma, detto aminoacil-tRNA, è in grado di legarsi alle sequenze codificanti dell’mRNA così da allineare gli amminoacidi nel giusto ordine e formare la catena polipeptidica.

Il t-RNA è una molecola caratteristica, a forma di quadrifoglio, che presenta diversi siti di notevole importanza: l’anticodone è una tripletta che si lega in modo specifico al codone presente sull’mRNA, presente sull’ansa 2, all’estremità 3′ è presente il sito d’attacco per l’amminoacido, inoltre è presente anche il sito di riconoscimento della specifica aminoacil-tRNA-sintetasi che lega il corretto amminoacido ed il sito d’attacco ai ribosomi.

I ribosomi sono particelle ribonucleoproteiche formate da RNA ribosomiale, detto anche rRNA, e proteine. L’rRNA viene trascritto nel nucleolo, dove avviene anche l’assemblaggio con le proteine sintetizzate nel citoplasma. Il ribosoma presenta 3 siti di legame, uno per l’mRNA e tre per i tRNA, questa struttura permette di mantenere nel corretto orientamento sia lo stampo di mRNA, sia le molecole di aminoacil-tRNA e la catena polipepticica nascente. I siti di legame per il tRNA sono rappresentati dal sito P o peptidilico, occupato dal tRNA che porta la catena peptidica nascente, il sito A o amminoacilico che lega l’aminoacil-tRNA che porta l’amminoacido successivo da inserire nella sequenza ed il sito E o di exit-uscita, che rappresenta il punto in cui il tRNA che ha fornito l’amminoacido alla catena peptidica nascente lascia il ribosoma.

L’inizio dell traduzione richiede l’intervento dei fattori di inizio, tre nei procarioti, che si attaccano alla subunità ribosomale minore, dopo ciò l’mRNA si lega a questa subunità in corrispondenza del codone di inizio della traduzione, AUG, guidato dalla sequenza leader. Il t-RNA che porta il primo amminoacido è detto tRNA iniziatore, e lega sempre la metionina, che in seguito viene rimossa. Il legame con il tRNA iniziatore causa il rilascio di uno dei fattori di inizio. Il complesso di inizio è completo quando la subunità ribosomale maggiore si lega a quella minore e vengono rilasciati i rimanenti fattori di inizio. La sintesi proteica può così procedere, andando sempre dall’estremità amminica (NH2) all’estremità carbossilica (COOH) della catena polipeptidica. La sintesi della catena peptidica è terminata da un fattore di rilascio che s’inserisce nel sito A, ed è rappresentato da una proteina che riconosce il codone di stop alla fine della sequenza codificante. Quando il sito A si lega al fattore di rilascio, il legame tra il t-RNA nel sito P e l’ultimo amminoacido della catena si rompe, la proteina si è così formata e tutti i componenti del complesso possono così dissociarsi.

Le mutazioni consistono in alterazioni del DNA di grandi o piccole dimensioni, e possono avvenire anche se esistono sistemi intercellulari che riparano gli errori che si verificano a livello del DNA, in particolare esistono tre sistemi che riparano sequenze di DNA a singolo filamento ed un sistema ripara le sequenze a doppio filamento. Le mutazioni puntiformi comportano l’alterazione di una singola coppia di basi, per sostituzione o delezione, e colpiscono generamente la funzionalità di un singolo gene. La mutazione senso o missense provoca la sintesi di una proteina nella quale un amminoacido è sostituto con un altro, la mutazione non senso o nonsense avviene quando un codone di stop sostituisce il codone di un amminoacido, provocando la sintesi di una proteina troncata, mentre la mutazione con slittamento del modulo di lettura, detta anche mutazione frameshift, provoca l’introduzione nella proteina di amminoacidi totalmente inappropriati, seguiti spesso da un segnale di stop. Le ABERRAZIONI CROMOSOMICHE comportano l’alterazione di una grande porzione di DNA, e solitamente sono dovute ad errori dei meccanismi di riparazione del DNA: le inversioni comportano una rottura del DNA che viene saldata nel cromosoma giusto, ma con orientamento opposto, nelle delezioni viene perduto un tratto di DNA mentre nelle traslocazioni avviene una rottura del DNA che viene saldata nel cromosoma sbagliato, infine nelle inserzioni una porzione di un cromosoma viene inserita in un altro cromosoma.