Replicazione dei Retrovirus e degli Hepadnavirus

6° classe replicativa: i RETROVIRUS

La famiglia retroviridae comprende il genere oncovirine, che incontreremo anche fra i virus oncogeni, ed il genere lentivirine che comprende il HIV (quindi è chiaramente una famiglia molto importante).

Si tratta di virus rivestiti con un capside a geometria icosaedrica.

Il genoma è particolare in quanto consiste di due filamenti di RNA, entrambi con polarità positiva, quindi non è un RNA double strand, ma un genoma diploide di dimensioni tra le 9 e le 10 Kbasi.
Vediamo ora come è organizzato il genoma (inteso qui come RNA) dei retrovirus:

Al 5’ troviamo il cap, al quale segue una regione non codificante, all’inizio della quale vi è una regione ripetuta (quindi ci sono delle sequenze di basi ripetute che, come abbiamo visto, sono importanti per la ciclizzazione o comunque per l’appaiamento).

Segue poi una regione unica non codificante chiamata U5.

A U5 seguono due siti molto importanti: dapprima il PBS (primer binding site), cioè il sito a cui si lega il primer, che consiste in una molecola di tRNA cellulare che il virus si porta dietro e che funziona da inizio per la retrotrascrizione.

Questo primer è specifico per ogni retrovirus, ovviamente ogni virus ha la sua sequenza genomica ed anche il PBS avrà una sua sequenza alla quale si legherà uno specifico tRNA (ad esempio per quanto riguarda il HIV troviamo il tRNA della lisina).

La BPS segue il DLS (dimer linking site) che è il punto di legame del dimero, cioè è l’unico punto in cui le due catene di RNA sono appaiate assieme.

Troviamo poi la sequenza Ψ (psi), che è la sequenza di packaging, cioè è una sequenza che è riconosciuta dalle proteine del capside e che quindi consente al RNA virale di essere incapsidato.

In pratica consente alle proteine capsidiche di distinguere il RNA virale (che devono rivestire) dal RNA cellulare.

Questo riconoscimento, oltre che da questo segnale di incapsidamento, dipende anche dalle dimensioni del RNA, infatti solo delle molecole di determinate dimensioni possono essere incapsidate.

Seguono poi tre geni orf, che troviamo in tutti i retrovirus (ci sono però degli esempi di virus che presentano dei geni supplementari), che sono:

  • gag, che codifica per le proteine strutturali che formano il nucleocapside (quindi le proteine associate al RNA, le proteine capsidiche e la proteina della matrice).
  • pol, codifica per gli enzimi, primo fra tutti la trascrittasi inversa che ha 3 funzioni:
    • funziona come DNA-polimerasi RNA-dipendente
    • funzione di DNA-polimerasi DNA-dipendente (quindi funziona come una normale DNA polimerasi)
    • funziona come ribonucleasi H, quindi servirà a digerire il template di RNA quando è ibridato ad un filamento di DNA

Sempre tra i prodotti di pol abbiamo l’integrasi, che è l’enzima che consente di inserire il cDNA virale all’interno del genoma della cellula.

Poi troviamo un altro enzima importantissimo che è la proteasi virale.

  • env codifica per le glicoproteine dell’envelope

A questa lunga porzione codificante segue una regione non codificante che inizia con una regione detta +P, che è una regione polipurinica, cioè caratterizzata da molte basi puriniche, inoltre indica che è il punto dal quale inizia la sintesi del filamento positivo di cDNA.

Segue poi una regione unica U3 ed una regione ripetuta uguale a quella che troviamo all’estremo 5’.

Alla fine troviamo la coda poliA.

Una volta che il virus è entrato nella cellula e si trova ancora nel citoplasma con il capside solo parzialmente digerito, avviene la retrotrascrizione con la formazione del cDNA, che è ovviamente double strand e che si circolarizza prendendo il nome di provirus o DNA provirale.

Il provirus passa nel nucleo e si va ad integrare grazie all’attività dell’integrasi nel DNA cellulare, quindi diventa una parte del genoma cellulare e di conseguenza viene trasmesso alle cellule figlie nel momento in cui la cellula si duplica.

Ovviamente una volta integrato nel DNA cellulare questo viene trascritto dalla polimerasi II della cellula e si formano i vari tipi di RNA che subiscono poi dei fenomeni di splicing diversi, ma si formano anche lunghe molecole di RNA unspliced lunghe come l’intero genoma.

I vari RNA subgenomici passano nel citoplasma dove vengono tradotti, mentre gli RNA unspliced andranno a costituire i nuovi genomi e quindi verranno incapsidati.

Vediamo ora come avviene il processo di retrotrascrizione

Abbiamo già visto come i retrovirus e soprattutto gli HIV assommino un elevato numero di mutazioni proprio grazie a questo sistema di trascrizione che fa molti errori.

Abbiamo detto che attaccato al PBS troviamo il tRNA che funziona da primer per la retrotrascrizione.

Quindi la trascrittasi inversa, che ovviamente è una proteina virionica, inizia a sintetizzare il primo filamento di DNA in corrispondenza del PBS.

Ovviamente trattandosi di un filamento a polarità positiva la prima catena di DNA trascritta sarà a polarità negativa e avremo un allungamento dal PBS in direzione 5’, quindi viene immediatamente replicata la sequenza U5 e la sequenza R.

A questo punto vediamo che la trascrittasi inversa comincia subito a funzionare anche come ribonucleasi e digerisce il template di RNA che è già stato trascritto.

Il fatto che la trascrittasi inversa si sposti verso l’estremo 5’ significa che dopo poche centinaia di basi avremo la fine del template ed il cosiddetto primo arresto brusco, in conseguenza di questo tutto il complesso (il DNA già replicato, il primer e la trascrittasi inversa) si spostano all’estremo opposto compiendo il primo salto.

Questo può avvenire per il fatto che ad entrambi gli estremi del filamento ci sono le sequenze palindromiche ripetute che facilitano l’appaiamento.

Quindi abbiamo che la sequenza R sul cDNA che è appena stata trascritta al 5’ si appaia con la sequenza R che si trova al 3’ del filamento di RNA ed a questo punto la trascrizione continua da qui.

Contemporaneamente la porzione che ha la funzione di ribonucleasi H comincia a digerire la porzione del template di RNA a polarità positiva che è già stato retrotrascritta, però nel fare questo lascia una piccola porzione di quella sequenza +P (o polipurinica) che abbiamo detto essere il punto di inizio della sintesi del secondo filamento, quindi questa sequenza rimane e funziona da primer.

Il secondo filamento, che sarà a polarità positiva, inizia ad essere trascritto da questa regione e la trascrittasi inversa a questo punto si muoverà verso il 3’ del filamento originario, quindi andrà a replicare la sequenza R che si trovava al 3’ e la regione U3 che erano stati retrotrascritti dopo il primo salto.

Nuovamente finirà il template poche centinaia di nucleotidi dopo l’inizio della sintesi, quindi avremo il secondo arresto brusco ed il secondo salto, tramite il quale il complesso si sposterà all’altro estremo, da dove proseguirà la sintesi del secondo filamento.

Quindi per questo particolare meccanismo di sintesi (per cui gli estremi della molecola vengono in sostanza replicati due volte) abbiamo che nella molecola di DNA gli estremi non codificanti sono più grossi ed entrambi presentano tutte e due le regioni unite con frapposta la regione ripetuta.

Questi due estremi non codificanti nel loro complesso prendono il nome di LTR (o long terminal repeat) e sono importantissime per la replicazione virale, perchè contengono i promoter e gli enhancer per i geni virali e sono tra i promotori più potenti, infatti vengono utilizzati per i vettori virali in modo da essere certi che la porzione che deve essere trascritta venga effettivamente trascritta.

Un’altra conseguenza di questo tipo di replicazione è l’alto numero di mutazioni, perché nel compiere questi salti il complesso di trascrizione presenta il fenomeno del copy choice, cioè può scegliere su quale dei due filamenti continuare la trascrizione, infatti il complesso una volta compiuto il salto può appaiarsi alla sequenza R dell’uno o dell’altro filamento, che abbiamo detto sono legati tramite il DLS, dunque sono molto vicini.

Quindi questo fatto implica che la catena di cDNA che ne deriva presenta una sommatoria delle mutazioni dell’uno e dell’altro filamento, quindi ogni volta abbiamo un aumento delle mutazioni.

Inoltre la trascrittasi inversa non corregge i mismatch, quindi ad ogni ciclo aggiunge degli errori.

Questo cDNA double strand a questo punto si circolarizza ed entra nel nucleo.

7° classe replicativa: gli HEPADNAVIRUS

Si tratta della famiglia dei virus epatitici a DNA dei quali l’unico che infetta l’uomo è il virus dell’epatite B (o HBV). Il HBV è un virus con l’envelope, però è molto piccolo (ha un diametro di 40 nm), infatti non ha nemmeno la matrice.

Ha una simmetria icosaedrica ed un DNA molto piccolo, di 3,2 Kbasi, molto particolare perché è una molecola di DNA circolare aperta (questo perché gli estremi non sono saldati covalentemente) ed è parzialmente bicatenario. Delle due catene, quindi, solo quella a polarità negativa (la catena L-long) è completa mentre l’altra (a polarità positiva) manca per circa il 40 % (ma è un dato variabile) ed è detta catena S (o short).
All’estremo 5’ della catena L è legata la proteina P, che è la polimerasi, ed anche in questo caso si tratta di una retrotrascrittasi.

Quando il virus entra nella cellula deve raggiungere il nucleo (perché si tratta di un virus a DNA), dove gli enzimi di riparo della cellula completano il secondo filamento (cioè il filamento S), quindi diventa un DNA completamente double strand, e gli estremi si chiudono covalentemente, diventando una molecola circolare chiusa, infatti prende il nome di cccDNA, che sta per DNA circolare chiuso covalentemente.

Questa molecola circolare chiusa rimane nel nucleo in forma episomale, quindi non si integra.

Questo DNA viene trascritto dalla DNA polimerasi II della cellula e si formano due classi di RNA virale a polarità positiva:

  • RNA subgenomici, quindi più corti rispetto alla lunghezza dell’intero genoma, i quali vengono esportati nel citoplasma dove funzionano da mRNA che vengono tradotti per la sintesi di alcune proteine
  • RNA pre-genomici, sono RNA lunghi come l’intero genoma, i quali una volta esportati nel citoplasma possono o essere tradotti, quindi si formano altre proteine che non erano codificate dagli RNA sub-genomici, oppure funzionare da genomi virali, infatti abbiamo detto che esistono dei virus a DNA con degli intermedi replicativi a RNA

Quello che succede è che dagli RNA messaggeri virali si sono formate le varie proteine e la proteina del core si assembla formando un pro-capside, in questo entra l’RNA pre-genomico insieme alla proteina P, che è la trascrittasi inversa.

Anche la proteina P, come la trascrittasi inversa dei retrovirus ha 3 funzioni:

  • come DNA-polimerasi RNA dipendente
  • come DNA-polimerasi DNA dipendente
  • come ribonucleasi H

Quindi all’interno del pro-capside inizia la retrotrascrizione del primo filamento di DNA (a polarità negativa) sullo stampo di RNA pre-genomico, che quindi sarà lungo come l’intero genoma, contemporaneamente l’attività ribonucleasica digerirà il template di RNA già trascritto.

La retrotrascrizione avviene in maniera analoga a ciò che avviene nei retrovirus, quindi avremo i due salti anche qui.

Retrotrascritto il primo filamento e digerito lo stampo avremo l’inizio della sintesi del secondo filamento, che però non giunge al termine probabilmente perché il pool di nucleotidi all’interno del pro-capside vengono esauriti, infatti come abbiamo già detto il filamento S è di lunghezza variabile in base a quanto riesce a progredire la retrotrascrittasi.

A questo punto abbiamo il procapside con dentro il DNA parzialmente bicatenario e non chiuso covalentemente.

A questo punto acquisisce l’envelope da una membrana interna del reticolo e viene eliminato per esocitosi. Una parte dei procapsidi con dentro il DNA anziché acquisire l’envelope ritornano nel nucleo dove si ripete quello che abbiamo appena visto, con un fenomeno di amplificazione virale.

Quindi una parte dei virioni neoformati esce ed un’altra ritorna nel nucleo.