Bioinformática
Osmar NORBERTO DE SOUZA, PhD
E-mail: [email protected]
Laboratório de Bioinformática, Modelagem e Simulação de Biossistemas - LABIO
Faculdade de Informática
Pontifícia Universidade Católica do Rio Grande do Sul – PUCRS
Porto Alegre - RS
Domains
A
B
C
D
(1) Proteína com um único domínio
(2) Proteína com múltiplos domínios
• Proteoma procariótico: 2/3 das proteínas possuem dois ou mais domínios
• Proteoma eucariótico: 4/5 das proteínas possuem múltiplos domínios
Bioinformática Estrutural
Análise de sequências de genomas
Classe 1
- 50% podem ser inferidas por homologia
Classe 2
- 10% a 20% possuem motivos ou domínios
Classe 3
- 30% a 40% não podem ser identificadas –
famílias desconhecidas
Análise de sequências de genomas
clonar
expressar
purificar
crescer
cristais
Raio X
NMR
Bioinformática Estrutural
Bioinformática Estrutural
Modelagem Comparativa por Homologia
Baseia-se na similaridade entre sequências de proteínas
Identidade igual ou superior a 30%
Pequenas mudanças na sequência ocasionam pequenas
mudanças na estrutura
(Chothia & Lesk, 1986)
O método mais confiável para a PREDIÇÃO da estrutura
3D de proteínas
SIM
Identificar estruturas similares
(moldes)
Selecionar moldes
Alinhar sequência alvo
com as estruturas molde
Construir modelo para o alvo
usando informação das estruturas molde
Avaliar a qualidade do modelo
Modelo
OK?
Início
Término
NÃO
SRSVLVTGGNRGIGLAIAQR LAADGHKVAVTHRGSG ...Sequência-alvo
Estrutura do molde
Alinhamento
Alvo
... SRSVLVTGGNRGIGLAIAQRLAADGHKVAVTHRG ...Estrutura do
alvo
Ramachandran plot
qualidade do modelo PROCKECK (Laskowski et al.)
Molde
... SPVVVVTGASRGIGKAIALSLGKAGCKVLVNYAR ...Bioinformática Estrutural
Modelagem Comparativa por Homologia da Enzima 3-Oxoacil-PCA
(CoA) Redutase de Mycobacterium tuberculosis H37Rv
Motivações: a doença da tuberculose
1,4 milhões de mortos em 2010 (WHO, 2012)
120 mil novos casos por ano no Brasil, ou mais
Em 2010, 8,8 milhões de novos casos (WHO)
Muito preocupante, aparecimento de cepas multi-resistentes
Prevenção e
tratamento:
vacina
BCG
politerapia com isoniazida,
rifampicina, pirazinamida,
estreptomicina ou etambutol
Bioinformática Estrutural
Mycobacterium tuberculosis e tuberculose
Bioinformática Estrutural
O genoma e rotas essenciais
n
O
S
ACP
O- S ACP O OS
ACP
O
O
n
S
ACP
O
OH
n
S
ACP
O
n
S
ACP
O
n
MabA
InhA
?
KasA /KasB
Bioinformática Estrutural
Representação esquemática das reações catalisadas pelo sistema FAS II
de síntese de lipídeos em M. tuberculosis
Bioinformática Estrutural
Modelagem Comparativa por Homologia da Enzima 3-Oxoacil-PCA
(CoA) Redutase de Mycobacterium tuberculosis H37Rv
MabA?
1994
, Jacobs Jr. e cols. identificaram o gene inhA
1998
, Jacobs Jr. e cols. mostraram que o gene mabA
pertence ao mesmo operon da inhA
Postula-se que a MabA esteja envolvida com a síntese
de ácidos micólicos
Inibição da síntese de ácidos micólicos é letal às micobactérias
MabA não está presente em seres humanos
MTATATEGAK PPFVSRSVLV TGGNRGIGLA IAQRLAADGH KVAVTHRGSG APKGLFGVEC
DVTDSDAVDR AFTAVEEHQG PVEVLVSNAG LSADAFLMRM TEEKFEKVIN ANLTGAFRVA
QRASRSMQRN KFGRMIFIG
S
VSGSWGIGNQ AN
Y
AAS
K
AGV IGMARSIA
RE LSKANVTANV
VAPGYIDTDM TRALDERIQQ GALQFIPAKR VGTPAEVAGV VSFLASEDAS YISGAVIPVD
GGMGMGH-
247
Bioinformática Estrutural
Análise da Sequência da Enzima 3-Oxoacil-PCA (CoA) Redutase de
Mycobacterium tuberculosis H37Rv
S
VSGSWGIGNQ AN
Y
AAS
K
AGV IGMARSIA
S-(X)
12
-Y-(X)
3
-K
Próximo
passo:
procurar moldes ou templates
“blastar” a sequência contra bancos de
estruturas 3D (PDB) no NCBI (BLAST), EMBL
Encontramos candidatos? Sim.
Alinhamento múltiplo com ClustalW
10 20 30 40 50 60 70 80 | | | | | | | |
3_OARBNA ---SPVVVVTGASRGIGKAIALSLGKAGCKVLVNYARSAKAAEEVSKQIEAYGGQAITFGGDVSKEADV
3_OARECO ---MNFEGKIALVTGASRGIGRAIAETLAARGAKVIG-TATSENGAQAISDYLGANGKGLMLN---VTDPASI
3_OARMTB MTATATEGAKPPFVSRSVLVTGGNRGIGLAIAQRLAADGHKVAV---THRGSGAPKGLFGVECDVTDSDAV
. .:***..**** *** *. * ** :. . : *:. : 90 100 110 120 130 140 150 160 | | | | | | | | 3_OARBNA EAMMKTAIDAWGTIDVVVNNAGITRDTLLIRMKKSQWDEVIDLNLTGVFLCTQAATKIMMKKRKGRIINIASVVGLIGNI 3_OARECO ESVLEKIRAEFGEVDILVNNAGITRDNLLMRMKDEEWNDIIETNLSSVFRLSKAVMRAMMKKRHGRIITIGSVVGTMGNG 3_OARMTB DRAFTAVEEHQGPVEVLVSNAGLSADAFLMRMTEEKFEKVINANLTGAFRVAQRASRSMQRNKFGRMIFIGSVSGSWGIG : : * ::::*.***:: * :*:**...:::.:*: **:..* :: . : * ::: **:* *.** * * 170 180 190 200 210 220 230 240 | | | | | | | | 3_OARBNA GQANYAAAKAGVIGFSKTAAREGASRNINVNVVCPGFIASDMTAKLGEDMEKKILGTIPLGRTGQPENVAGLVEFLALSP 3_OARECO GQANYAAAKAGLIGFSKSLAREVASRGITVNVVAPGFIETDMTRALSDDQRAGILAQVPAGRLGGAQEIANAVAFLAS-D 3_OARMTB NQANYAASKAGVIGMARSIARELSKANVTANVVAPGYIDTDMTRALDERIQQGALQFIPAKRVGTPAEVAGVVSFLAS-E .******:***:**:::: *** :. .:..***.**:* :*** *.: . * :* * * . ::*. * *** 250 260 | | 3_OARBNA AASYITGQAFTIDGGIAI --3_OARECO EAAYITGETLHVNGGMYM V-3_OARMTB DASYISGAVIPVDGGMGMGH *:**:* .: ::**: :
Bioinformática Estrutural
Alinhamento Múltiplo da Sequência da Enzima 3-Oxoacil-PCA (CoA)
Redutase de Mycobacterium tuberculosis H37Rv contra candidatos a molde
10 20 30 40 50 60 70 80 | | | | | | | | 3_OARMTB SRSVLVTGGNRGIGLAIAQRLAADGHKVAVTHRGSGAPKGLFG---VECDVTDSDAVDRAFTAVEEHQGPV 3_OARBNA SPVVVVTGASRGIGKAIALSLGKAGCKVLVNYARSAKAAEEVSKQIEAYGGQAITFGGDVSKEADVEAMMKTAIDAWGTI * *:***..**** *** *. * ** *.: *. . .. . **:.. *: :.:. : *.: 90 100 110 120 130 140 150 160
| | | | | c | N N N|c c N
3_OARMTB EVLVSNAGLSADAFLMRMTEEKFEKVINANLTGAFRVAQRASRSMQRNKFGRMIFIGSVSGSWGIGNQANYAASKAGVIG
3_OARBNA DVVVNNAGITRDTLLIRMKKSQWDEVIDLNLTGVFLCTQAATKIMMKKRKGRIINIASVVGLIGNIGQANYAAAKAGVIG
:*:*.***:: *::*:**.:.::::**: ****.* :* *:: * ::: **:* *.** * * .******:****** 170 180 190 200 210 220 230 240 | | | | | | | | 3_OARMTB MARSIARELSKANVTANVVAPGYIDTDMTRALDERIQQGALQFIPAKRVGTPAEVAGVVSFLAS-EDASYISGAVIPVDG
3_OARBNA FSKTAAREGASRNINVNVVCPGFIASDMTAKLGEDMEKKILGTIPLGRTGQPENVAGLVEFLALSPAASYITGQAFTIDG
:::: *** :. *:..***.**:* :*** *.* ::: * ** *.* * :***:*.*** ****:* .:.:**
3_OARMTB GMGM
3_OARBNA GIAI
*:.: Alignment length : 244
G-X-G-(X)
2
-A-(X)
3
-A-(X)
6
-G
Identity (*) : 97 is 39.75 %
Strongly similar (:) : 47 is 19.26 % Weakly similar (.) : 30 is 12.30 % Different : 70 is 28.69 %
Sequence 0001 : 3_OARMTB ( 231 residues). Sequence 0002 : 3_OARBNA ( 244 residues).
Modelo da MabA
Modelagem Comparativa por Homologia da Enzima 3-Oxoacil-PCA
(CoA) Redutase de Mycobacterium tuberculosis H37Rv
Modelagem Comparativa por Homologia da Enzima 3-Oxoacil-PCA
(CoA) Redutase de Mycobacterium tuberculosis H37Rv
Modelagem Comparativa por Homologia da Enzima 3-Oxoacil-PCA
(CoA) Redutase de Mycobacterium tuberculosis H37Rv
Superfície molecular
Grey:
hydrophobic
yellow:
polar
Red:
acidic
Blue:
basic
Bioinformática Estrutural
Predição ab initio ou por primeiros princípios
Funções Escore
: distinguir estado nativo (funcional)
do não nativo
(métodos estatísticos)
Espaço Conformacional
:
Monte Carlo
e
Dinâmica Molecular
(hipótese termodinâmica)
Dada uma sequência de aa, qual é a sua estrutura 3D?
Há duas variações básicas:
Desenvolver protocolos específicos para a predição da estrutura 3D de
proteínas a partir apenas da sua seqüência de aminoácidos
Compreender os mecanismos de formação das estruturas secundária e
terciária de proteínas (protein folding)
Gerar modelos (estruturas 3D) de qualidade satisfatória para serem
utilizados no desenvolvimento racional de fármacos
Objetivos
Dada uma sequência qualquer de aminoácidos, que corresponda a
uma proteína, qual a sua estrutura 3D?
,...,N
,
, i =
m
) /
r
,...,
r
,
r
(
F
=
dt
r
d
i N i i2
1
2 1 2 2,...N.
,
), i =
r
,...,
r
,
r
V (
Δ
) =
-r
,...,
r
,
r
(
F
i
1
2
N
i
1
2
N
1
2
)
r
D
-r
C
(
+
)
r
q
q
(
EEL
1
+
)
r
B
-r
A
(
VDW
1
+
)
r
q
q
+
r
B
-r
A
(
+
)]
-(n
cos
+
1
[
2
V
+
)
K
+
)
r
K
=
)
r
,...,
r
,
r
1 0 ij ij 1 2 ij ij b o n d s -H ij j i terms 4 -1 6 ij ij ij 1 2 ij terms 4 -1 ij j i 6 ij ij ij 1 2 ij j i m d ih ed rals 2 eq an g les 2 eq r b o n d s N 2 1(r
-
(
-
(
V
AMBER: Assisted Model Building with Energy Refinement (UCSF)
Bioinformática Estrutural
0 2 4 6 8 10 12 14 16 18 20 R M S 1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 S1 Time (10xps) Backbone RMS Seqüência1