Caracterizao de
Protenas
Aula 5
Prof. Rodrigo Volcan Almeida
DBq IQ UFRJ
BIOINFORMTICA
Introduo
Projetos Genoma e Proteoma
Grande nmero de seqncias
Nucleotdeos (DNA)
Aminocidos (Protenas)
aaattagctagttacttaagg
aaattagctagttacttaagg
aaattagctagttacttaagg
MGCTEFHKJLMASGGATVRRE
HGCTSFHKJLMASGGATVRRE
QGCTEFHKJLYASGGATVRRE
DNA
Protena
Estruturas
~85 bilhes de
nucleotdeos
Crescimento
exponencial
Bioinformtica
Como se confere a uma
seqncia uma funo
biolgica?
Bioinformtica
Qual a sua definio?
a unio/interseo da biotecnologia
com a cincia da computao
Stios
Ferramentas
computacionais
Ativos
Fosforilao
Funes
biolgicas
Domnios
Estruturas
Glicosilao
Bioinformtica
Bancos de Dados
Funes
GenBank
Gerais
Bioinformtica
Formato FASTA
Sinal de Maior
(>)
Identificador
(nome)
>4TGL:_|PDBID|CHAIN|SEQUENCE
SINGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIY
DTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQN
ELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALDLYQREEGLSSSNLFLYTQGQPRVG
NPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGSEYWITDNSPETVQVCTSDLE
TSDCSNSIVPFTSVLDHLSYFGINTGLCT
Seqncia em
cdigos de uma letra
Bioinformtica
Coding Sequence (CDS)
Bioinformtica
Como atravs da bioinformtica pode ser atribuda
uma funo biolgica a uma seqncia?
Comparando seqncias
conhecidas com a que se
quer atribuir a funo
funo conhecida
desconhecido
funo hipottica
Bioinformtica
Alinhamento
Bioinformtica
Identidade
VEDQKLS--KCE
VEE-KLTRPKCD
**: **:
Similaridade
**:
VEDQKLS--KCE
VEE-KLTRPKCD
**: **:
Homologia
**:
Aminocidos com
caractersticas fsico-qumicas
semelhantes (Asp/Glu e Ser/Thr)
-cristalino
55%
3 hidrxi esteride/dihidrodiol
R. catesbeiana
identidade
desidrogenase (3-HSD)
Bioinformtica
Mas como se constri um alinhamento?
Matriz de Substituio
Serve para relacionar a importncia de um
determinado pareamento de aminocidos em
um alinhamento.
Bioinformtica
Mas como se constri um alinhamento?
(algortmo de Needleman-Wunsch)
10
-2
-2
-2
-1
-2
-2
-2
-2
-3
-5
-2
-3
-4
-2
-3
-5
-3
-4
-2
-3
-3
-3
-6
-3
-1
-2
-2
-2
-1
-1
-3
-4
-1
-1
-1
-1
-3
-3
-2
-3
-5
10
-2
-5
-5
-5
-5
-6
-5
12
-4
11
-2
-4
-5
Bioinformtica
Mas como se constri um alinhamento?
(algortmo de Needleman-Wunsch)
10
41
4
33
-2
31
2
29
-2
24
-2
22
2
18
-1
12
-2
0
-2
-2
31
-2
37
4
35
3
33
2
26
0
17
-3
19
0
14
0
-3
-5
29
-2
32
1
33
2
32
1
27
1
17
-3
20
1
15
1
-2
-4
24
-2
26
0
26
0
27
1
31
5
17
-3
19
0
19
5
-3
-5
25
2
20
-3
18
-4
21
-2
17
-3
26
6
16
-3
11
-3
-4
-6
-3
23
0
23
0
23
0
22
-1
19
0
18
-2
20
1
14
0
0
-2
-2
18
-1
19
-1
19
1
21
3
23
-3
17
0
19
3
17
-4
-2
18
-1
18
-1
18
-1
19
0
18
-1
16
-3
20
1
14
0
-1
-3
12
-2
14
0
14
0
15
1
19
5
11
-3
14
0
19
5
-3
-5
10
-2
2
-5
-1
-5
-3
-5
-3
-5
-3
-6
-4
02
-5
-3
12
14
-4
11
-2
-4
-5
2
(11;10)
Bioinformtica
V
41
33
31
31
37
35
29
32
33
24
O Score
do
ser
Q
K alinhamento
L
S
18
12
-2
19
14
-3
20
15
-2
-3
29
33
24
22
transformada
26
17
Contudo o alinhamento
32
27
17
26
26
27
31
17
19
19
25
20
21
17 negativos
26
16
11ao Score.
-4
-3
L
Penalidades
=18 Valores
T
23
23
23
22
19
18
20
14
18
19
19
21
23
17
19
17
-2
18
18
18
19
18
16
20
14
-1
12
14
14
15
19
11
14
19
-3
-1
Score
= 41-3 10-4 12
-3
-3
2
-3
14
-4
-2
-5
SEQ 1
SEQ 2
-4
Score = 19
VEDQKLS--KCN
VEN-KLTPRKCD
Bioinformtica
Alinhamentos Mltiplos (mtodo hierrquico)
CLUSTAL mais utilizado
Seqncias (FASTA)
Vantagens:
-Torna mais robusta a anotao de uma
determinada funo;
Alinhamentos em pares
Bioinformtica
Alinhamentos Mltiplos (mtodo hierrquico)
CLUSTAL
Bioinformtica
Alinhamentos Mltiplos (mtodo hierrquico)
CLUSTAL
Bioinformtica
Mas a informao em protenas no est contida apenas
em sua seqncia de aminocidos.
Suas estruturas so muito importantes
Predio de Estrutura Secundria
Predio de Regies Transmembranares
Predio de Peptdeos Sinais
Bioinformtica
Muitas vezes somente a partir da
estrutura primria no possvel
atribuir uma funo...
Bioinformtica
Modelagem comparativa
Bioinformtica
1NDO
CarAa
1
1
-MNYNNKILVSESGLSQKHLIHGDEELFQHEL-KTIFARNWLFLTHDSLIPAPGDYVTAK
MANVDEAILKRVKGWA------------PYVDAKLGFRNHWYPVMFSKEIDE-GEPKTLK
* :: **
.* :
:
* * .:* : ... *
*: * *
1NDO
CarAa
59
48
MGIDEVIVSRQNDGSIRAFLNVCRHRGKTL-VSVEAGNAKGFVCSYHGWGF----GSNGE
LLGENLLVNRI-DGKLYCLKDRCLHRGVQLSVKVECKTKSTITCWYHAWTYRWEDGVLCD
: ::::*.* **.: .: : * *** * *.**. . . :.* **.* :
*
:
1NDO
CarAa
114
107
LQSVPFEKDLYGESLNKKCLGLKEVARVESFHGFIYGCF-DQEAPPLMDYLGDAAWYLEP
ILTNPTSAQIGRQKL--------KTYPVQEAKGCVFIYLGDGDPPPLARD--------TP
: : * . :: :.*
:. *:. :* :: : * :.***
*
1NDO
CarAa
173
151
Modelagem comparativa
Seqncia
1NDO
CarAa
alvo
1NDO
CarAa
291
264
1NDO
CarAa
350
318
Estrutura molde
1NDO
CarAa
Modelo da protena
MFKHSGGLELVGPPGKVVIKANWKAPAENFVGDAYHVGWTHASSLRSGESIFSSLAGNAA
PNFLDDDMEILGK--NQIIKSNWRLAVENGF-DPSHI-YIHKDSILVKD---NDLALPLG
alvo por homologia
...:*::*
: :**:**: ..** . *. *: : * .*:
:
..**
.
410
370
Alinhamento
IYRSH-LNCTVFPNNSMLTCSGVFKVWNPIDANTTEVWTYAIVEKDMPEDLKRRLADSVQ
IWLPGVLKVNPFPNPDMMQ----FEWYVPIDENTH--YYFQTLGKPCANDEERKNYEQEF
*: . *: . *** .*:
*: : *** **
: : : * .:* :*: :.
Avaliao do
modelo
Bioinformtica
Modelagem comparativa
Bioinformtica
Modelagem comparativa
Bioinformtica
Ser que todas estas caracterizaes
se verificam na prtica?
BIOINFORMTICA
uma ferramenta fundamental para a Qumica de
Protenas...
TCNICAS DE
PURIFICAO
Localizao celular
NCLEO
CITOPLASMA
Centrifugao
Solubilidade de protenas
depende da concentrao
de sais, da polaridade do
solvente, do pH e da T
protein solubility
Solubilidade da -lactoglobina em
funo do pH para diferentes
concentraes de NaCl
protein solubility
protein solubility
Solvente
Constante Momento
Dieltrica Dipolar
78.5
1.85
3.96
Dimetilformamida 48.9
Metanol
32.6
1.66
Etanol
24.3
1.68
Acetona
20.7
2.72
Clorofrmio
4.8
1.15
Benzeno
2.3
0.00
gua
Solventes miscveis
com a gua diminuem
a constante dieltrica
do meio e
desorganizam a
camada de solvatao
das protenas.
A constante dieltrica de um meio a razo entre o trabalho necessrio para separar cargas
opostas a uma determinada distncia no vcuo pelo trabalho necessrio para separar as
mesmas cargas quando imersas no meio.
Cromatografia
Cromatografia:
Tipos de matrizes usadas para cromatografia
Cuba de vidro
Amostra
Suporte
Suporte
Papel
Frente do
Solvente
Amostra
Solvente
Solvente
ASCENDENTE
DESCENDENTE
Eluio
+
+
+
+
+
+
++
+
+
+
+
+
+
++
Molculas
com a mesma
carga, ou sem
carga, no
interagem
com a resina
cido
PI
neutro
bsico
H+
-COOH
+
-NH3
+ Na+Cl-
-COO
-NH2
H+
Carga em
OVALBUMINA
PI = 4.6
Adio de sal ao
tampo resulta em
competio entre os
ons em soluo e as
molculas adsorvidas
na resina
HEMOGLOBINA
PI =7.1
CITOCROMO C
PI = 10.6
pH_ 7.0
+
+
0. 10 M
(-)
(-)
(-)
+
+ +
0. 10 M
(+)
(+)
0. 20 M
_
=
(-)
0. 15 M
++
Eluio NaCl
0. 15 M
_
(+) =
0. 20 M
(+)
No retidas
+
+
+
No retidas
Carboximetil~celulose
Dietilaminoetil~celulose
(trocadora de ctions)
(trocadora de nions)
Partculas
porosas
Coluna de vidro
Perfil de Eluio
Concentrao
b)
Molcula pequena
v0
vc
Volume (ml)
vt
Poro da membrana
Adsoro
Adsoro
Molcula de interesse
Eluio
Dilise
CARACTERIZAO
Eletroforese
+
+
t
+
+
SUPORTE X pH MEIO
Eletroforese
persulfate
poliacrilamide
Eletroforese nativa
Ponto Isoeltrico
Protena
Pepsina
< 1.0
Ovalbumina
(galinha)
4.6
AlbuminaSrica(humana)
4.9
Tropomiosina
5.1
Insulina (bovina)
5.4
Fibrinognio (humano)
Globulina
Colgeno
5.8
155.000
6.6
330.000
6.6
Mioglobina
(cavalo)
Hemoglobina (humana)
RibonucleaseA (bovina)
18.000
64.000
7.0
7.1
7.8
Citocromoc(cavalo)
10.6
Histona (bovina)
10.8
Lisozima (galinha)
11.0
Salmina(salmon)
12.1
Separao na eletroforese
nativa influenciada pela
carga, massa e forma da
molcula
Eletroforese desnaturante
Efeitos do SDS
desnaturao
uniformiza a forma das
protenas;
mascara a carga natural
das protenas no pH da
corrida, fazendo com que
todas molculas migrem
para o ando;
facilita o efeito de
redutores
H3C-CH2-CH2-CH2-CH2-CH2-CH2-CH2-CH2-CH2-CH2-CH2-
Eletroforese desnaturante
cistina
2 cistenas
Padres
2-mercaptoetanol
AB
A
B
s
2 - Mercaptoetanol
Sem
Com
2 - Mercaptoetanol
A
SH
SH
Eletroforese
distncia percorrida pela banda X
distncia percorrida pelo marcador da corrida
Log MW
Migrao relativa =
Eletroforese
ilustrao
Focalizao isoeltrica
Eletroforese bidimensional
Primeiro passo:
Focalizao isoeltrica
Eletroforese bidimensional
pH
Mr, kDa
66
48
23
18
16
Protenas com a
mesma massa
Eletroforese 2D de protenas
totais (proteoma) de clulas de
Escherichia coli
PROTEOMA:
anlise simultnea de at 5.000 protenas
Proteoma Comparativo
condio
condio
Banco de
espectros
Banda
removida do
gel
Espectro de
massas dos
fragmentos
virtuais
Fragmentar
com tripsina
Obter
espectro de
massas dos
fragmentos
compara
o
Tripsiniza
o virtual
Banco de
seqncias
(i.e.
SwissProt)
Sequenciamento de
protenas
Degradao de Edman
Espectrometria de Massas
Degradao de Edman
Etapas
Etapa 1
Etapa 2
Etapa 3
Etapa 4
Clivagem das
ligaes
peptdicas
Identificao
dos
aminoterminais
Hidrlise da
protena em
peptdeos
Sequenciamento
dos peptdeos
(HCl, NaOH ou
enzimas)
(1 flor - 2,4
dinitro benzeno)
Separao,
identificao e
quantificao
dos
aminocidos
HCl 6M
Separao e
identificao
dos
aminocidos
Tripsina (Arg,
Lys)
CNBr (Met)
Quimiotripsina
(Tyr, Trp, Phe)
Degradao de
Edman
Fenilisotiocianato
Degradao de Edman
Degradao de Edman
PTC feniltiocarbamoil
PTH feniltioidantona
Espectrometria de Massas
Fragmentao de peptdeos
Seqenciamento
H CH3
H CH3
H
H CH2-(CH2)3-NH2
+
H N C C N C C N C C N C C OH
H H +O H H +O H H +O H H O
Massa Molecular
dos aminocidos
Espectro
de massas
Glicina
Alanina
Alanina
Lisina
58.0
71.0
71.0
146.1
218.1
129.0
147.1
58.0
100
200.0
200
346.1
289.1
300
Identificao de protena
hidrlise
Identificao
Protena A
Gel 2D
Protena B
Protena C
Identificao de protenas