Evoluzione delle proteine
17 Luglio 2009
ELLS, Monterotondo, Roma,
Italia
ELLS LearningLAB: Levoluzione della teoria
di Darwin
Francesca Diella
Attvita 1: Evoluzione della
struttura e funzione della molecola dell Emoglobina (Hb)
Allineamento di sequenza (MSA)
Copia e incolla il
contenuto di questo documento (sequenze proteiche in formato FASTA) nel
MUSCLE webserver
dell EBI (nella casella
sotto il testo "Enter
or Paste a set of Sequences in any supported format:"). Premere il
tasto "Run" per iniziare
l allineamento.

Attendere qualche secondo e
poi premere sul tasto JalView per visualizzare i risultati.

(Qui troverete una versione pre-calcolata del file
che puo essere visualizzato usando un software di analisi di
sequenze, JalView
o CLUSTALX, installato sul vostro computer.)
Noterete che i diversi
aminoacidi hanno
colori diversi anche se talvolta non sono stati colorati.
Se sono colorati, il colore
sara sempre lo stesso, per esempio l acido aspartico (D) e sempre rosa. Noterete
anche che diversi aminoacidi hanno lo stesso
colore, per esempio sia l acido aspartico
che l acido glutammico sono rosa.
Usando le tabelle e i diagrammi
presentati nell
introduzione, sapreste indicare quali sono le diverse proprieta presentate dai diversi gruppi/colori di aminoacidi?
Che cosa descrive il diagramma "Conservatio" (si trova al fondo del JalView)?
La "stessa" proteina in diversi organismi e in diversi membri della
stessa famiglia proteica puo avere
una diversa sequenza aminocidica (come si nota dal MSA). Queste differenze sono dovute a mutazioni puntiformi (point
mutations) nelle sequenze di DNA che codificano per queste proteine.
Lo scopo di un allineamento (MSA) e di incolonnare gli aminoacidi di diverse sequenze in modo tale che i
residui aminoacidici in ogni colonna siano gli stessi o abbiano proprieta fisico-chimiche simili.
Note, however, that some positions in the alignment
contain the "-" character, indicating a "blank" or
"gap" i.e. that there is no residues in these sequences at those
positions that are related via point mutations (or no mutations at all).
Alcune posizioni nell
allineamento contengono il carattere "-" - spazi- (gap) perche
non ci sono residui in queste sequenze che si
possano allineare agli altri residui
della colonna
Che tipo di evento genetico puo avere causato
tali gap?
Noterete anche che le
diverse colonne dell allineamento
appaiono differenti luna dall altra.
Descrivete queste differenze per a) numero dei diversi
aminoacidi presenti in una colonna ( per esempio, ci sono
solo D e E o ce ne sono molti diversi
V, I,L, D, G, ecc); b) proprieta
degli aminoacidi (sono tutti idrofili
o idrofili/polari, ecc); c)
presenza di gap.
Queste osservazioni ci possono aiutare a rispondere ad alcune domande sull evoluzione
delle proteine;
La percentuale
di mutationi puntiformi in diveserse posizioni di una
proteina e (a) la stessa
per tutte le posizioni o
(b) diversa in diverse posizioni?
Tutti le posizioni di una
protein sono in grado di accettare " gap"
o ci sono poszioni che sembrano
non accettare " gap"?
Tutte le posizioni mantengono le proprieta chimic-/fisiche o ci sono posizioni
che accettano aminoacidi con differenti proprieta?
Alcune proprieta sembrano piu conservate di altre?
Lasciate aperta la finestra
con l allineamento prima di
procedere alla prossima sezione.
Struttura delle Proteine e Proprieta degli aminoacidi:
Aprite il file
delle catena beta dell HB in PyMOL.
Per l analisi della struttura
tridimensionale (3D) colorare
i diversi residui a seconda delle loro proprieta:
|
A |
Idrofobico (blu) |
G A V L I C M F P W |
Non-idrofobico (bianco) |
R N D E Q H K S T Y |
|
B |
Polare (rosso) |
K R H D E N Q |
Non-polare (bianco) |
A C G I L M F P S T W Y V |
|
C |
Aromatico (giallo) |
F H W Y |
Grande (bianco) |
A C D E G I K L M N P Q R S T V |
Dovreste essere in grado di notare quali
residui tendono a prefererire alcune posizioni rispetto ad altre. Siete in grado
di identificarle?


(I seguenti file mostrano le proteine gia colorate
con i diversi colori: hydrophobic; polar; small
– per favore, non aprire
i file prima di aver provato da soli)
Struttura delle proteine e Allineamento:
Usare la
colonna "Conservation" per identificare le colonne dove I residui sono conservati (simbolo "*").
Identificare la sequenza nell
allineamento che corrisponde alla catena beta
dell emoglobina ("humanHemoglobinB").
Usando il file della
catena beta, colorare di rosso tutti i
residui di questa catena.
I residui
piu conservati sono localizzati (a) nel core, (b) sulla superficie o (c) nella tasca che lega
l eme?
Questa e la catena dell Hb
con i residui conservati in rosso
Quando si parla di sequenze simili
e utile poter quantificare
la similitudine. Una possibilita
e quella di calcolare la "percentuale di identita" (o %ID).
Lallineamento delle sequenze
dovrebbe fornire un punteggio (score), col quale possibile
valutare (secondo i criteri impostati)
il grado di similarit.
La %ID e calcolata nel
modo seguente: Percentuale di identit= di residui
identici/residui totali*100
(residui identici + residui simili)
Esempio:
- l allineamento contiene 22 residui
-
cisono 2 colonne che contengono
gap (Colonna 8 e 9); il numero delle
colonne che non contiene gap e 20
- di queste
20 , 13 hanno gli stessi aminoacidi in entrambe le sequenze (colonne 3 4 5 6 7 12 13 15 17 18 19 21 22)
la percentuale di allineamento e: 13 * 100 / 20
= 65%

La misura della percentuale
di allineamento e utile perche ci permette
di dire quanto due sequenze siano simili fra loro.
Una %ID = 20% implica per esempio che le sequenze sono molto diverse.

Returning the the MSA,
compare the sequences for human haemoglobin A and B
chains ("humanHemoglobinA" and "humanHemoglobinB")
Paragonate l allineamento delle sequenze HbA ad HbB
Qual e la
%ID di queste due sequenze ?
Vista la differenza fra le due sequenze,
vi aspettate che anche la struttura sia diversa?
Se si,
in che cosa consiste la differenza (guardate ad esempio le strutture secondary)?
Osservare le due strutture (non allineate) delle due catene.
Ci sono le differenze che vi aspettavate?
Allineate le due sequenze usando PyMOL
Qual e la maggiore differenza fra le due strutture?
Qual e la
%ID del seguente allineamento
(le sequenze son quelle della catena beta dell Hb humana, e una legemoglobina
di pianta)
Paragonate l allineamento di struttura di queste
due proteine come in questo
file (this PyMOL file).

Vi potra sorprendere come simile siano le
due strutture nonostante la
bassa %ID.
Protein Structure, Structure Alignment, and
Disease:
Struttura delle proteine, allineamento e malattia:
The mutation responsible for causing the
sickle-cell anemia disease is the change of residue 7 from a glutamate to a valine (E->V).
La mutazione che causa l anemia falciforme e la mutazione del residuo 6 da acido
glutammico a valina
(E->V).
Given what you have learnt about the relationship
between sequence and structure, would you expect this mutation to make a large
difference to the structure of the protein?
In base a quello che avete imparato
sulla relazione
fra sequenza e struttura, vi aspettate che questa mutazione
crei delle grosse differenze
Questo PyMOL file contiene l allineamento della
catena mutata e quella wildtype.
Quale differenze notate fra
le due sequenze?
Per capire meglio come questa mutazione causi l anemia falciforme, esaminate il seguente
file (this PyMOL file). I residui
mutati sono colorati in arancione, la catena
con cui interagiscono e in surface
view, le molecole di acqua sono in azzurro,
I contatti polari sono in giallo.
In che modo la mutazione causa la malattia?
Allineate la struttura dell Hb
dellanemia falciforme con quella dell emoglobina di topo (this PyMOL file).
In base all allineamento,
quale residuo potrebbe causare la malattia nel topo?
Suggerite un motivo per cui questo gene mutato non e stata conservata nel topo.
Database Records
Banche dati
Le informazioni che vi abbiamo
presentato sono tutte disponibili in rete.
Il primo passo per studiare una protein e andare al sito UniProt database
dove troverete le informazioni
sulla proteina che vi interessa e link ad altre banche dati.
Per trovare un record possiamo fare una ricerca utilizzando
le parole "hemoglobin sickle cell" nell EBI EB-eye
search tool e seguire poi il link HBB_HUMAN in UniProt
Da questo record potete ricavare le seguenti informazioni:
-
lunghezza della proteina
-
il nome dell organismo da cui e stata isolata la sequenza
-
associazione con patologie
-
variazioni della sequenza nella popolazione
-
sequenza aminoacidica
-
link a banche dati che
contengono informazioni sulla struttura tridimensionale
Usate EB-eye
search tool per trovare informazioni
simili sulla
proteina "P02088"
Ce qualche informazione
che trovate particolarmente interessante?
Back To
Gibson Team Training Pages