Evoluzione delle proteine

17 Luglio 2009

ELLS, Monterotondo, Roma, Italia

ELLS LearningLAB: L’evoluzione della teoria di Darwin

Francesca Diella

 

Attvita’ 1: Evoluzione della struttura e funzione della molecola dell’ Emoglobina (Hb)

Allineamento di sequenza (MSA)

Copia e incolla il contenuto di questo documento (sequenze proteiche in formato FASTA) nel MUSCLE webserver dell’ EBI (nella casella sotto il testo "Enter or Paste a set of Sequences in any supported format:"). Premere il tasto "Run" per iniziare l’ allineamento.

 

 

Attendere qualche secondo e poi premere sul tasto JalView per visualizzare i risultati.

 

 

(Qui troverete una versione pre-calcolata del file che puoessere visualizzato usando un software di analisi di sequenze, JalView o CLUSTALX, installato sul vostro computer.)

Noterete che i diversi aminoacidi hanno colori diversi anche se talvolta non sono stati colorati. Se sono colorati, il colore sarasempre lo stesso, per esempio l’ acido aspartico (D) e’ sempre rosa. Noterete anche che diversi aminoacidi hanno lo stesso colore, per esempio sia l’ acido aspartico che l’ acido glutammico sono rosa.

 

Usando le tabelle e i diagrammi presentati nellintroduzione, sapreste indicare quali sono le diverse proprietapresentate dai diversi gruppi/colori di aminoacidi?

 

Che cosa descrive il diagramma "Conservatio" (si trova al fondo del JalView)?

 

La "stessa" proteina in diversi organismi e in diversi membri della stessa famiglia proteica puoavere una diversa sequenza aminocidica (come si nota dal MSA). Queste differenze sono dovute a mutazioni puntiformi (point mutations) nelle sequenze di DNA che codificano per queste proteine.

 

Lo scopo di un allineamento (MSA) e’ di incolonnare gli aminoacidi di diverse sequenze in modo tale che i residui aminoacidici in ogni colonna siano gli stessi o abbiano  proprieta fisico-chimiche simili.

 

Note, however, that some positions in the alignment contain the "-" character, indicating a "blank" or "gap" i.e. that there is no residues in these sequences at those positions that are related via point mutations (or no mutations at all).

 

Alcune posizioni nellallineamento contengono il carattere  "-"  - spazi- (gap) perche’ non ci sono residui in queste sequenze che si possano allineare agli altri residui della colonna

 

Che tipo di evento genetico puoavere causato tali gap?

 

Noterete anche che le diverse colonne dell’ allineamento appaiono differenti l’una dallaltra.

 

Descrivete queste differenze per a) numero dei diversi aminoacidi presenti in una colonna ( per esempio, ci sono solo D e E o ce ne sono molti diversi V, I,L, D, G, ecc); b) proprietadegli aminoacidi (sono tutti idrofili o idrofili/polari, ecc); c) presenza di gap.

 

Queste osservazioni ci possono aiutare a rispondere ad alcune domande sullevoluzione delle proteine;

 

La percentuale di mutationi puntiformi in diveserse posizioni di una proteina e’ (a) la stessa per tutte le posizioni o (b) diversa in diverse posizioni?

 

Tutti le posizioni di una protein sono in grado di accettare " gap" o ci sono poszioni che sembrano non accettare " gap"?

 

Tutte le posizioni mantengono le proprietachimic-/fisiche o ci sono posizioni che accettano aminoacidi con differenti proprieta’?

 

Alcune proprietasembrano piuconservate di altre?

 

 

Lasciate aperta la finestra con l’ allineamento prima di procedere alla prossima sezione.

 

Struttura delle Proteine e Proprietadegli aminoacidi:

Aprite il file delle catena beta dell’ HB in PyMOL.

 

Per l’ analisi della struttura tridimensionale (3D) colorare i diversi residui a seconda delle loro proprieta’:

 

 

A

Idrofobico (blu)

G A V L I C M F P W

Non-idrofobico (bianco)

R N D E Q H K S T Y

B

Polare (rosso)

K R H D E N Q

Non-polare (bianco)

A C G I L M F P S T W Y V

C

Aromatico (giallo)

F H W Y

Grande (bianco)

A C D E G I K L M N P Q R S T V

 

 

Dovreste essere in grado di notare quali residui tendono a prefererire alcune posizioni rispetto ad altre. Siete in grado di identificarle?

 

 

 

 (I seguenti file mostrano le proteine giacolorate con i diversi colori: hydrophobic; polar; small per favore, non aprire i file prima di aver provato da soli)

 

 

Struttura delle proteine e Allineamento:

Usare la colonna "Conservation" per identificare le colonne dove I residui sono conservati (simbolo "*").

 

Identificare la sequenza nellallineamento che corrisponde alla catena beta dell’ emoglobina ("humanHemoglobinB").

 

Usando il file della catena beta, colorare di rosso tutti i residui di questa catena.

 

I residui piuconservati sono localizzati (a) nel core, (b) sulla superficie o (c) nella tasca che lega l’ eme?

 

Questa e’ la catena dell’ Hb con i residui conservati in rosso

 

Quando si parla di sequenze simili e’ utile poter quantificare la similitudine. Una possibilita’ e’ quella di calcolare la "percentuale di identita" (o %ID).

 

L’allineamento delle sequenze dovrebbe fornire un punteggio (score), col quale Ź  possibile valutare (secondo i criteri impostati) il grado di similaritą.

La %ID e’ calcolata nel modo seguente:  Percentuale di identitą= di residui identici/residui totali*100 (residui identici + residui simili)

 

Esempio:

-       lallineamento contiene 22 residui

-       cisono 2 colonne che contengono gap (Colonna 8 e 9); il numero delle colonne che non contiene gap e’ 20

      - di queste 20 , 13 hanno gli stessi aminoacidi in entrambe le sequenze (colonne 3 4 5 6 7 12 13 15 17 18 19 21 22)

      la percentuale di allineamento e’: 13 * 100 / 20 = 65%

 

 

La misura della percentuale di allineamento e’ utile percheci permette di dire quanto due sequenze siano simili fra loro. Una %ID = 20% implica per esempio che le sequenze sono molto diverse.

 

 

Returning the the MSA, compare the sequences for human haemoglobin A and B chains ("humanHemoglobinA" and "humanHemoglobinB")

 

Paragonate l’ allineamento delle sequenze HbA ad HbB

 

Qual e’ la %ID di queste due sequenze ?

 

Vista la differenza fra le due sequenze, vi aspettate che anche la struttura sia diversa?

 

 

Se si, in che cosa consiste la differenza (guardate ad esempio le strutture secondary)?

 

Osservare le due strutture (non allineate) delle due catene.

 

Ci sono le differenze che vi aspettavate?

 

Allineate le due sequenze usando PyMOL

 

Qual ‘e la maggiore differenza fra le due strutture?

 

Qual e’ la %ID del seguente allineamento (le sequenze son quelle della catena beta dell’ Hb humana, e una legemoglobina di pianta)

 

Paragonate l’ allineamento di struttura di queste due proteine come in questo file (this PyMOL file).

 

 

Vi potrasorprendere come simile siano le due strutture nonostante la bassa %ID.

 

 

Protein Structure, Structure Alignment, and Disease:

Struttura delle proteine, allineamento e malattia:

The mutation responsible for causing the sickle-cell anemia disease is the change of residue 7 from a glutamate to a valine (E->V).

 

La mutazione che causa l’ anemia falciforme e’ la mutazione del residuo 6 da acido glutammico a valina (E->V).

 

Given what you have learnt about the relationship between sequence and structure, would you expect this mutation to make a large difference to the structure of the protein?

 

In base a quello che avete imparato sulla relazione fra sequenza e struttura, vi aspettate che questa mutazione crei delle grosse differenze

 

Questo PyMOL file contiene l’ allineamento della catena mutata e quella wildtype.

 

Quale differenze notate fra le due sequenze?

 

Per capire meglio come questa mutazione causi l’ anemia falciforme, esaminate il seguente file (this PyMOL file). I residui mutati sono colorati in arancione, la catena con cui interagiscono  e’ in “surface view”, le molecole di acqua sono in azzurro, I contatti polari sono in giallo.

 

In che modo la mutazione causa la malattia?

 

Allineate la struttura dell’ Hb dell’anemia falciforme con quella dell’ emoglobina di topo (this PyMOL file).

 

In base all’ allineamento, quale residuo potrebbe causare la malattia nel topo? Suggerite un motivo per cui questo gene mutato non e’ stata conservata nel topo.

 

 

 

 

Database Records

Banche dati

Le informazioni che vi abbiamo presentato sono tutte disponibili in rete.

 

Il primo passo per studiare una protein e’ andare al sito UniProt database dove troverete le informazioni sulla proteina che vi interessa e  link  ad altre banche dati.

 

Per trovare un record possiamo fare una ricerca utilizzando le parole "hemoglobin sickle cell" nellEBI EB-eye search tool e seguire poi il link HBB_HUMAN in UniProt

 

Da questo record potete ricavare le seguenti informazioni:

-       lunghezza della proteina

-       il nome dell’ organismo da cui e’ stata isolata la sequenza

-       associazione con patologie

-       variazioni della sequenza nella popolazione

-       sequenza aminoacidica

-       link a banche dati che contengono informazioni sulla struttura tridimensionale

 

Usate EB-eye search tool per trovare informazioni simili sulla proteina "P02088"

 

C’equalche informazione che trovate particolarmente interessante?

 

Back To Gibson Team Training Pages