Bioinformática Estrutural
Modelagem Molecular
Bioinformática Estrutural
Resumo
Previsão da estrutura secundária
Modelagem molecular
PARMODEL
DBMODELING
Bioinformática na era pós-genoma
Referências
Previsão de estrutura secundária
Introdução. É possível prever a estrutura
secundária de peptídeos e proteínas a partir da estrutura primária. Há diversas abordagens e algoritmos, normalmente a taxa de sucesso desses algoritmos não ultrapassa 80 %, quando comparada com estruturas resolvidas por cristalografia por difração de raios X e ressonância magnética nuclear. Para ilustrar as
principais características desses
algoritmos descreveremos o algoritmos Chou e Fasman (1978, 1989), que apesar de obsoleto descreve os aspectos fundamentais de boa parte dos algoritmos de previsão de estrutura secundária de proteínas.
MIAALTKAAIKKTEALLAKIWYLK
Algoritmo de previsão
Fonte: Chou, P.Y., Fasman, G.D. (1978). Empirical
predictions of protein conformations. Annu. Rev. Biochem, 47, 251-276.
Previsão de estrutura secundária
Algoritmo de Chou e Fasman. Esse algoritmo baseia-se nas informações disponíveis
sobre a estrutura tridimensional de proteínas disponíveis em base de dados com o PDB. A partir de uma análise estatística das tendências de formação de hélice e fitas das aminoácidos contidos nas estruturas resolvidas depositadas no PDB é determinada propensão dos aminoácidos de adotarem uma determinada estrutura secundária. É estabelecida um janela de um certo número de aminoácidos, por exemplo 4, e determina-se qual a propensão para o trecho, segue-se na cadeia e quando há mudança na propensão há mudança na indicação da estrutura provável para o trecho da cadeia do peptídeo ou proteína.
Fonte: P.Y. Chou: "Prediction of Protein Structural Classes from Amino Acid Compositions". p 549-586 in the Fasman's 1989
Previsão de estrutura secundária
Algoritmo de Chou e Fasman. No método são usados conjuntos de parâmetros que
refletem a média da propensão de um dado aminoácido adotar hélice alfa <Palfa>, fita beta <Pbeta> ou laços <Pturn>. A propensão de um dado aminoácido formar hélice é determinado a partir da fração molar que este aminoácido apresenta em hélice a partir da análise da base de dados estruturais. O parâmetro χalfa, i representa a ocorrência do aminoácido i em hélice dividido pela a ocorrência total desse aminoácido na base de dados. Assim temos que a propensão de um dado aminoácido estar em hélice como dado pela equação:
<Palfa> = χalfa, i/<χalfa>
onde <χalfa> é a média de χalfa, i para todos os 20 aminoácidos naturais. De forma similar são determinados os <Pbeta> e <Pturn> .
Previsão de estrutura secundária
Algoritmo de Chou e Fasman. Na forma de algoritmo o método de Chou e Fasman
tem a seguinte implementação.
4. Leitura da sequência de aminoácido;
6. Determinar os valores das propensões, a partir da tabela de Chou e Fasman
(próximo slide);
8. Procurar por trechos com um certo número de aminoácidos em hélice, ou fita beta
ou laço;
Previsão de estrutura secundária
Glicina 0,57 0,75 1,56 Alanina 1,42 0,83 0,66 Serina 0,77 0,75 1,43 Treonina 0,83 1,19 0,96 Cisteina 0,70 1,19 1,19 Valina 1,06 1,70 0,50 Isoleucina 1,08 1,60 0,47 Leucina 1,41 1,30 0,59 Prolina 0,57 0,55 1,52 Fenilalanina 1,13 1,38 0,60 Tirosina 0,69 1,47 1,14 Metionina 1,45 1,05 0,60 Triptofano 1,08 1,37 0,96 Asparagina 0,67 0,89 1,56 Glutamina 1,11 1,10 0,98 Histidina 1,00 0,87 0,95 Aspartato 1,01 0,54 1,46 Glutamato 1,39 1,17 0,74 Lisina 1,14 0,74 1,01 Arginina 0,98 0,93 0,95Propensão de formação de hélice, fitas e laços (Chou e Fasman, 1978).
Previsão de estrutura secundária
Algoritmo de Chou e Fasman. O algoritmo de Chou e Fasman tem uma taxa de acertos relativamente baixa, por volta de 50 %, quando comparado a métodos mais modernos que atingem margens próximas a 75 %. Um dos problemas do método e que é fortemente influenciado pela limitação das estruturas disponíveis na base de dados estruturais, que tendem a ter influência na facilidade que certas famílias de proteínas têm em serem resolvidas. O algoritmo de Chou e Fasman tem uma taxa de acertos relativamente baixa, por volta de 50 %, quando comparado a métodos mais modernos que atingem margens próximas a 75 %. Um dos problemas do método e que é fortemente influenciado pela limitação das estruturas disponíveis na base de dados estruturais, que tendem a ter influência na facilidade que certas famílias de proteínas têm em serem resolvidas, o que acaba criando concentração de informações estruturais em determinadas famílias de proteínas, enquanto outras, por serem apresentarem dificuldade em cristalizar não apresentam informação estrutural.
Previsão de estrutura secundária
Aplicação do algoritmo de Chou e Fasman. Para ilustrar o método vamos prever a estrutura secundária do peptídeo mastoparano. A sequência apresenta 14 resíduos de aminoácidos. Ile-Asn-Leu-Lys-Ala-Leu-Ala-Ala-Leu-Ala-Lys-Lys-Ile-Leu
<P
alfa>
1,08-0,67 -1,41 -1,14 -1,42 -1,41-1,42 -1,42-1,41 -1,42-1,14-1,14 -1,08-1,41<P
beta>
1,60-0,89 -1,30 -0,74 -0,83 -1,30- 0,83 -0,83 -1,30-0,83-0,74-0,74-1,60-1,30<P
turn>
0,47-1,56- 0,59 -1,01- 0,66- 0,59- 0,66- 0,66- 0,59- 0,66-1,01-1,01-0,47-0,59 Hélice alfaPrevisão de estrutura secundária
Aplicação do algoritmo de Chou e Fasman. A estrutura desse peptídeo foi resolvida por RMN (Hori et al., 2001). A figura abaixo mostra sua estrutura tridimensional, que como prevista é helicoidal.
Referência:
Hori, Y., Demura, M., Iwadate, M., Ulrich, A. S., Niidome, T., Aovagi, H., Asakura, T. Interaction of mastoparan with membranes
C
Previsão de estrutura secundária
Outros algoritmos de previsão de estrutura secundária. O uso do algoritmo de Chou e Fasman tem uma taxa de acerto de aproximadamente 50 %, métodos mais recentes de previsão de estrutura secundária, como o PSIPRED (Bryson et al., 2005), PROFphd(Rost et al., 1994), SSpro (Pollastri et al., 2002) atingem níveis de acerto de ate 77 %. Muitos desses métodos fazem uso de redes neurais para previsão da estrutura secundária, contudo nenhum deles apresentam resultados positivos acima de 80 %.
Referências:
Bryson, K., McGuffin, L. J., Marsden, R. L., Ward, J. J., Sodhi, J. S. & Jones, D. T. (2005) Protein structure prediction servers at University College London. Nucl. Acids Res. 33(Web Server issue):W36-38.
Rost, B., Sander, C. and Schneider, R. (1994) PHD--an automatic mail server for protein secondary structure prediction. Comput Appl Biosci 10:53-60.
Pollastri G, Przybylski D, Rost B, Baldi P. Improving the prediction of protein secondary structure in three and eight classes using
recurrent neural networks and profiles.
Previsão de estrutura secundária
Uso do PSIPRED. Para comparação usaremos o servidor wev PSIPRED (Bryson et al., 2005) na previsão da estrutura secundária do peptídeo mastoparano. O PSIPRED está disponível no site: http://bioinf.cs.ucl.ac.uk/psipred/psiform.html .
Previsão de estrutura secundária
Uso do PSIPRED. A interface de entrada
do servidor web do PSIPRED está mostrada ao lado. Para usá-la basta inserirmos a sequência de aminoácidos do peptídeo o proteína que queremos identificar a estrutura secundária.
Previsão de estrutura secundária
Uso do PSIPRED. Inserimos a sequência
de aminoácidos do mastoparano na janela indicada com código de uma letra para cada aminoácido. Após inserirmos a sequência escolhemos a opção de predição, no caso PSIPRED 2.5. Há ainda opções de filtragens e por último a colocação do e-mail do usuário.
Previsão de estrutura secundária
Uso do PSIPRED. Depois clicamos
“predict”. O resultado será enviado via e-mail para o usuário.
Previsão de estrutura secundária
Uso do PSIPRED. O resultado do PSIPRED corrobora a previsão do método de Chou
Algoritmo
A modelagem molecular por homologia, baseia-se no princípio que uma proteína, que apresenta identidade sequencial superior a 30 %, com outra proteína, compartilhará o mesmo enovelamento. A partir desse princípio podemos usar a estrutura tridimensional de um proteína, para modelar a estrutura tridimensional de uma que não apresenta estrutura resolvida. A abordagem desse problema admite diversas implementações, uma das mais utilizadas é a do MODELLER (Sali & Blundell, 1993), que usa o conceito de restrições espaciais. Parâmetros
Algoritmo
A modelagem por homologia pode seguir o algoritmo mostrado à direita. Nesta abordagem o usuário seleciona um molde para a modelagem, é iniciado o alinhamento do molde com a sequência a ser modelada, para posteriormente ser construído o modelo. O modelo construído é avaliado, caso satisfaça a uma condição padrão é considerado adequado, caso contrário é selecionado outro molde, se possível. O processo de modelagem
permite que sejam selecionados
diferentes conjuntos de parâmetros estruturais a serem na montagem de modelos distintos. Início Identificação de moldes Seleção de moldes Alinhamento Construção do modelo Avaliação do modelo Modelo OK? Fim Sim Não
Início Identificação de moldes Seleção de moldes Alinhamento Construção do modelo Avaliação do modelo Modelo OK? Sim Não
Algoritmo
O algoritmo do PARMODEL usa uma implementação paralela do MODELLER, o que permite automatizar o processo de modelagem usando programação de grão grosso, onde as modelagem são divididas entre os nós de um cluster de computadores do tipo Beowulf. Cada modelagem usa um conjunto distinto de restrições espaciais, o que permite varrer diversas condições iniciais, gerando
modelos distintos para a mesma
sequência, sem contudo ocorrer uma mudança drástica na estrutura. Podemos obter modelos com melhor qualidade
Último modelo ? Não Seleciona o melhor modelo Fim Sim Uchoa et al., BBRC (2004)
Silveira et al., J. Mol. Mod. (2005)
Algoritmo do Parmodel
A paralelização obtida com o PARMODEL permite que diversos modelos sejam gerados simultaneamente, o número de modelos é escolhido pelo usuário. Cada nó do cluster gera
uma carga
aproximadamente igual de modelos, que são testados no final. O melhor modelo é enviado ao usuário. Início Identificação de moldes Seleção de moldes Alinhamento Construção do modelo Avaliação do modelo Modelo OK? Sim
Computação Paralela
O diagrama esquemático ao lado ilustra a arquitetura básica de um cluster de computadores. Esse cluster é dividido em diferentes nós, sendo cada nó uma CPU. Esses nós estão interconectados ao um nó central chamado de “front end”, responsável pelo gerenciamento dos processos em execução no cluster.
Computação Paralela
A figura ao lado mostra 2 clusters do tipo
Beowulf usados para modelagem
molecular por homologia. O programa PARMODEL, para modelagem molecular por homologia, está instalado no cluster da direita.
Página de entrada do PARMODEL. O
PARMODEL é um servidor web dedicado à modelagem molecular por homologia e análise da qualidade estrutural de modelos de proteínas. Clicando-se na opção “parmodel modeling” temos acesso à página de entrada para modelagem molecular por homologia on-line. A interface do PARMODEL é simples e intuitiva, permitindo acesso a uma ferramenta poderosa de modelagem molecular de forma rápida.
PARMODEL
Referência:UCHOA et al. .Biochem. Biophys. Res. Commun. 2004;325(4):1481-1486.
PARMODEL
Página de entrada do PARMODEL. A
página de entrada do PARMODEL
descreve brevemente as principais
ferramentas presentes no servidor web. Além do “parmodel modeling”, temos interfaces para otimização do modelo estrutural (parmodel optimization) e análise da qualidade de modelos de proteínas (parmodel assesment).
PARMODEL
PARMODEL Modeling. Para modelagem
molecular por homologia o PARMODEL solicita ao usuário o preenchimento de um formulário breve, com as informações necessárias para modelagem.
PARMODEL
PARMODEL Modeling. O PARMODEL
retornará os resultados da modelagem molecular por homologia por e-mail, assim como primeira etapa é solicitado ao usuário seu e-mail e uma identificação do usuário e da instituição.
PARMODEL
PARMODEL Modeling. Variando-se as
restrições espaciais é possível a gerar até 1000 modelos para cada proteína a ser modelada. Caso o usuário deseje gerar 1000 modelos é necessário indicar que o número de modelos será de 1 até 1000, como indicado ao lado. Duas informações
fundamentais para a modelagem
molecular por homologia. 1) A sequência de aminoácidos da proteína a ser modelada (no formato fasta). 2) Arquivo PDB com as coordenadas atômicas do molde (template). Nesta versão é possível o uso de até 8 moldes. Os dois slides a seguir mostram os arquivos exemplos usados neste modelagem.
PARMODEL
PARMODEL Modeling. A sequência da
proteína a ser modelada é carregada no PARMODEL no formato fasta. Neste formato a primeira linha começa com o símbolo “>” maior que, normalmente seguido com comentário sobre a proteína,
identificação, código de acesso,
organismo etc. Da segunda linha em diante fica a sequência de aminoácidos usando o código de uma letra. Na figura ao lado temos o arquivo fasta para a sequência de aminoácidos da CDK3 humana, a proteína a ser modelada neste exemplo.
PARMODEL
PARMODEL Modeling. O arquivo com as
coordenadas atômicas do molde
(template), neste caso o arquivo PDB (1HCL) com a estrutura da CDK2 humana na forma apo, a ser usado para a modelagem da CDK3. A CDK2 apresenta identidade sequêncial de 74,8 % com a CDK3, o que indica que a CDK2 é um bom molde para a modelagem da CDK3.
PARMODEL
PARMODEL Modeling. Na fase seguinte
o usuário indica o método usado para obtenção do molde (template). Há 3 opções: Difração de raios X, NMR e modelagem. No exemplo aqui analisado a opção é difração de raios X. Outro campo a ser preenchido é sobre a presença de ligantes, neste caso coloca-se “0” visto que estamos modelando a enzima na forma apo.
PARMODEL
PARMODEL Modeling. A etapa seguinte
permite ao usuário indicar a forma como será avaliado os modelos gerados. Lembramos que podemos gerar diversos modelos (até 1000), para a mesma proteína. O PARMODEL retornará ao usuário o melhor modelo, segundo um critério estabelecido pelo usuário, como o PROCHECK ou o VERIFY3D, ou usarmos
a função objetiva do programa
MODELLER, como mostrado na figura ao lado. Depois de selecionar a forma de avaliação do modelo clicamos em “submit”, e termos a mensagem mostrada no slide a seguir.
PARMODEL
PARMODEL Modeling. A modelagem foi
aceita e os resultados serão enviados via e-mail para o usuário. Os resultados incluem o arquivo PDB do melhor modelo gerado por homologia, o alinhamento do
molde (template) e a sequência
PARMODEL
PARMODEL Modeling. É possível avaliar
a evolução do processo de modelagem na
página de entrada (
www.biocristalografia.df.ibilce.unesp.br/bioxtal1.php
PARMODEL
PARMODEL Modeling. A partir do uso da
ferramenta “Ganglia Cluster Toolkit”, usada para avaliar o desempenho de
clusters de computadores podemos
verificar a entrada da modelagem solicitada ao PARMODEL, caso o cluster esteja sem modelagens no momento da solicitação, como mostrado na figura ao lado. O gráfico da direita acima indica o número de processos atualmente sendo executados no cluster. O segundo gráfico abaixo indica a porcentagem da CPU sendo usada. À esquerda é indicado o número de CPUs sendo usados no
PARMODEL
PARMODEL Modeling. Na página
seguinte é mostrado o tráfego de rede e a velocidade do tráfego de rede, bem como um gráfico de pizza indicando o uso do
cluster. O PARMODEL divide o processo
de modelagem igualmente entre os nós disponíveis para a modelagem.
PARMODEL
PARMODEL Modeling. O final da página
indica o uso de cada nó (CPU) do cluster. Cinza indica uso, branco indica sem uso. A situação indicada mostra sem uso, esta é a situação onde não nenhuma proteína está em processo de modelagem.
PARMODEL
PARMODEL Modeling. Vamos analisar o
uso do cluster logo após a entrada da modelagem da CDK3. Poucos minutos após a submissão da modelagem vemos claramente um aumento nos gráficos do número de processos (gráfico de cima) e da porcentagem de CPU usada (segundo gráfico de cima para baixo)
PARMODEL
PARMODEL Modeling. No terceiro
gráfico vemos um pico do tráfego de rede, devido ao início da modelagem, e depois
uma velocidade de transferência
constante (quarto gráfico) devido à comunicação dos diferentes nós durante a modelagem. O PARMODEL divide a modelagem igualmente entre os nós, armazena os resultados e retorna ao usuário o arquivo PDB com o melhor modelo. Vemos também uma mudança no gráfico de pizza da esquerda, indicando um aumento do uso do cluster.
PARMODEL
PARMODEL Modeling. Os dezesseis
gráficos do final da página indicam o uso de cada CPU, há uma CPU não sendo usada, e as outras quinze sendo usadas intensamente.
PARMODEL
PARMODEL Modeling. Ao final da
modelagem vemos que o uso do cluster volta ao mínino.
PARMODEL
PARMODEL Modeling. Os resultados
são enviandos via e-mail com informações sobre como descompactar em ambiente linux e windows.
PARMODEL
PARMODEL Modeling. Em linux basta
copiar o arquivo para um diretório e usar o comando tar –xvf “nome-do-arquivo”. Em windows pode usar o winrar ou winzip ou
qualquer outra programa para
descompactar. O arquivo compactado apresenta três arquivos, mostrados no próximo slide.
PARMODEL
PARMODEL Modeling. O arquivo
alignment.pap com o alinhamento da sequência de aminoácidos do modelo e do template, usado na modelagem. O arquivo pdb com o melhor modelo e o arquivo rank com o valor da função objetiva do MODELLER.
PARMODEL
PARMODEL Modeling. A função objetiva
é listada da menor para a maior, com o respectivo modelo. Quanto menor a função objetiva do MODELLER melhor é o modelo. O arquivo PDB enviado ao usuário é aquele que apresenta menor valor para a função objetiva.
PARMODEL
PARMODEL Modeling. O programa PARMODEL retorna ao usuário as coordenadas
atômicas do modelo, no caso a CDK3, mostrada em verde. A estrutura do molde usado, as coordenadas atômicas da CDK2 humana (código de acesso no pdb: 1HCL), na forma apo, está mostrada em seguida, em vermelho. A sobreposição das duas estruturas indica um rmsd de 0,3 Å, indicando um bom ajuste entre modelo (CDK3) e molde (CDK2).
PARMODEL
PARMODEL Modeling. Análise do diagrama da Ramachandran da estrutura do molde
(Código pdb: 1HCL) indica que o molde apresenta boa qualidade estereoquímica, com 91,4 % dos resíduos nas regiões permitidas, 8,2 % nas regiões adicionalmente permitidas, e 0,4 % nas regiões adicionalmente permitidas. Não há resíduos nas regiões proibidas.
PARMODEL
PARMODEL Modeling. Para o modelo da CDK3, o diagrama de Ramachandran
indica que a estrutura apresenta boa qualidade estereoquímica, com 92,1 % dos resíduos nas regiões permitidas, 6,0 % nas regiões adicionalmente permitidas, e 1,1 % nas regiões adicionalmente permitidas. Há 2 resíduos nas regiões proibidas (0,8%).
PARMODEL
PARMODEL Modeling. A interface de avaliação da qualidade de modelos do
PARMODEL permite a avaliação do diagrama de Ramachandran por tipo de resíduo de aminoácido. A análise a seguir é para o modelo da CDK3.
Os pontos em vermelho indicam resíduos na região proibida. O número em parênteses indica
quantos resíduos de
PARMODEL
PARMODEL Modeling. Outra opção avalia os ângulos chi1 e chi2 das cadeias laterais
dos resíduos de aminoácido que apresentam estes ângulos. A análise abaixo é para o modelo da CDK3.
Os pontos em vermelho indicam resíduos na região proibida. O número em parênteses indica
quantos resíduos de
Além dos ângulos de torção da cadeia principal, temos, para a maioria do aminoácidos a possibilidade de ângulos de torção para a cadeia lateral. Obviamente tais ângulos só existem para os aminoácidos de cadeia lateral média e longa. No exemplo abaixo temos uma lisina, com 5 ângulos de torção possíveis.
χ
1χ
2χ
3χ
4χ
5PARMODEL
Algoritmo do DBMODELING
DBMODELING. DBMODELING é uma
base de dados que armazena modelos estruturais de proteínas identificadas em genomas de patógenos, foi desenvolvida usando-se Perl e MySQL. Esta base de dados é aberta e armazena modelos estruturais de proteínas identificadas nos genomas de Mycobacterium tuberculosis e Xylella fastidiosa. O DBMODELING permite um acesso fácil e intuitivo. O usuário ao entra no site tem a possibilidade de indicar o nome da proteína. Esta pesquisa gera uma solicitação ao sistema que retornará ao
DBMODELING
DBMODELING. A interface permite
selecionar dois genomas (versão atual). Uma vez selecionado o genoma é possível solicitar uma proteína ou via metabólica específica.
DBMODELING
DBMODELING. A possibilidade de acessar diretamente a via metabólica de interesse, como mostrado na coluna esquerda da página mostrada ao lado. Clicando-se da primeira via metabólica mostrada, é mostrada as enzimas dessa via metabólica que apresentam modelo estrutural. Nem todas enzimas de uma via metabólica apresentam modelo estrutural depositado, visto que não há moldes (templates) para todas as enzimas. As
passíveis de modelagem estão
DBMODELING
DBMODELING. Na interface é mostrada
seis enzimas da via de biossíntese de ácido fólico. Para acessar as coordenadas atômica, bem como, detalhes sobre a modelagem, estrutura primária, reação catalisada e outras informações o usuário clica na enzima.
DBMODELING
DBMODELING. A interface mostra o
modelo em fitas da estrutura 3D do modelo obtido por homologia. É mostrada a sequência de aminoácidos da proteína modelada. Há possibilidade de acessar a qualidade estereoquímica do modelo, usando-se o PROCHECK, VERIFY3D e o WHATCHECK. Há possibilidade de fazer
download das coordenadas atômicas dos
DBMODELING
DBMODELING. Abaixo na página há links
para as bases de dados com informações sobre enzimas e via metabólicas (Kegg e MetaCyc), bem como links para sites sobre o Mycobacterium tuberculosis.
Enzimas alvo para desenho
de drogas contra o
Número de pessoas infectadas por ano 0 200 400 600 800 1000 1200 1400 1600 1800 2000 Ín d ia C h in a In d o n é s ia N ig é ri a B an g la d e s h Et ió p ia Fi lip in as P aq u is tã o Á fr ic a d o S u l Fe d e ra çõ e s C o n g o K e n ia V ie tn am T an zâ n ia B ra s il T ai lâ n d ia U g an d a M ya n m ar M o ça m b iq u e C am b o d ia Z im b áb u e A fe g an is tã o País N ú m e ro d e c as o s (m ilh ar e s)
Fonte: WHO report 2002
Mycobacterium tuberculosis
O agente causado da tuberculose é o
Mycobacterium tuberculosis. A tuberculose normalmente é uma doença relacionada ao século XIX, fortemente
marcante no romantismo, sendo
responsável pela morte precoce de diversos expoentes da literatura do final do século XIX e início do século XX. Contudo, devido à decadência dos centros urbanos e a epidemia de AIDS há um ressurgimento da tuberculose, sendo que a OMS declarou em 1993 a TB como epidemia mundial. O gráfico ao lado mostra a incidência de TB nos principais
Via metabólica do ácido
chiquímico
Via metabólica do ácido chiquímico.
Esta via é composta de sete passos
enzimáticos, é responsável pela
conversão de eritrose-4-fosfato e
fosfoenol-piruvato em corismato. O
corismato precursor para biossíntese de aminoácidos aromáticos, entre outros compostos. Como esta via metabólica está presente em bactérias, organismos do filo apiconplexa e plantas, mas ausente em mamíferos, as enzimas que a
constituem são potenciais alvos
moleculares para o desenho de drogas, a partir do paradigma de toxidade seletiva.
0,5mm
Cristalização da MtCQ
A MtCQ foi cristalizada usando a técnica de difusão de vapor e o sistema de gota suspensa. A MtCQ foi concentrada e dializada contra uma solução de 50mM de Hepes Na em pH 7,5, contendo 0,5 M NaCl
e 5,0 mM de MgCl2 . A proteína foi
concentrada a 17 mg/ml. ADP e ácido chiquímico foram adicionados à solução da proteína. A solução do poço apresentava 0,1 M de Hepes em pH 7,5, 10 % de 2-propanol e 35 % de PEG 3350, as gotas consistiam de 1 µ l de solução do poço e 1,5
µ l de solução de proteína. Os cristais cresciam até aproximadamente 0,5 mm, após uma semana.
Mapa de difração do complexo MtCQ-MgADP-Ác.chiquímico obtido no LNLS (Estação PCr, Laboratório Nacional de Luz
Síncroton, Campinas, Brasil). Os
parâmetros da cela unitária estão na tabela abaixo.
Difração da MtCQ
Parâmetros da cela unitária
a = b (Å) 62,91
c (Å) 90,92
Resolução (Å) 29,74-2,30 (2,41-2,30)
Grupo espacial P3221
Ácido Chiquímico
A reação de fosforilação do ácido chiquímico é catalisada pela chiquimato quinase. Nesta reação há transferência de um grupo fosfato da molécula de ATP para o ácido chiquímico. O ácido chiquímico apresenta três hidroxilas e um grupo carboxílico, como mostrado na figura ao lado.
O principal objetivo deste trabalho é a identificação da posição do ácido chiquímico na estrutura da MtCQ, para isto foram gerados mapas de densidade eletrônica de omissão, onde uma grande região sem modelo de proteína e ADP apareceu de forma destacada (gradeado azul). Tal observação é uma indicação que há densidade eletrônica não incluída no modelo cristalográfico, no caso este modelo foi refinado como a molécula de ácido chiquímico. Na figura ao lado vemos o ác. Chiquímico, a molécula de ADP, o íon magnésio, e os carbonos alfa da MtCQ.
Complexo CQ-ADP-Ác. Chiquímico
A figura ao lado mostra a estrutura final do complexo MtCQ-ADP-Ac. Chiquímico. A estrutura indica o bolsão de ligação do ác. chiquímico próximo ao bolsão de ligação de ADP, com o íon magnésio entre as duas moléculas. A estrutura da MtCQ apresenta um folha beta central formada por cinco fitas beta (indicada em vermelho) e circundada por oito hélices alfa. Um pequeno trecho em hélice funciona como uma tampa sobre o bolsão de ligação do ác. chiquímico.
CQ:ADP:Ac. Chiquímico
Complexo CQ-ADP-Ác. Chiquímico
A sobreposição da estrutura do complexo MtCQ-ADP-Ác. Chiquímico (código de acesso PDB: 1WE2) com a estrutura da CQ de Erwinia chrysanthemi na forma apo mostra um grande movimento do domínio da tampa (LID domain), este movimento provavelmente é induzido devido à ligação do ácido chiquímico.
Complexo CQ-ADP-Ác. Chiquímico
Afim de averiguar a estabilidade que a adição da molécula de ácido chiquímico, proporciona à estrutura da chiquimato quinase realizamos uma simulação de dinâmica molecular da estrutura na forma apo e na forma complexada com ADP e
ácido chiquímico. Foi realizada um
simulação de dinâmica molecular por 5 ns (nanosegundos). O gráfico do desvio médio quadrádico (rmsd) com relação à estrutura inicial é mostrado ao lado. A linha preta indica a evolução da dinâmica da MtCQ na forma apo, e a linha cinza na forma complexada, vemos claramente que a forma apo apresenta maior rmsd, o que indica maior flexibilidade da estrutura.
Complexo CQ-ADP-Ác. Chiquímico
A estrutura em cinza é a MtCQ complexada, e a estrutura em preto a MtCQ na forma apo, após a simulação computacional de dinâmica molecular por 5 ns. Vemos claramente a diferença da região da tampa, com a estrutura complexada mantendo o domínio na posição fechada.
Ác. chiquímico Átomo Distância (Å) Grupos hidroxil O1 Gly 80-N 3,10 Asp34-OD1 2,82 Asp34-OD2 2,57 Água1-O 2,46 O2 Asp34-OD1 2,66 Asp34-OD2 2,85 Grupo carboxil O4 Gly 81-N 3,22 Arg136-NH2 2,68 O5 Arg58-NH2 2,67 Gly 81-N 3,49
Tabela – Ligações de hidrogênio entre MtSK e ácido chiquímico
Sítio de ligação do ácido chiquímico. A linha descontínua em preto mostra as ligações de hidrogênio entre ác.chiq. e MtSK e a linha em verde, a ligação ligações de hidrogênio entre Glu61 e Arg58.
Complexo CQ-ADP-Ác. Chiquímico
Análise dos resíduos de aminoácido da CQ, que participam de ligações de hidrogênio, indica a participação do resíduos: Gly80, Asp34, Gly81, Arg136 e Arg58, conforme a tabela abaixo.
-A primeira estrutura de CQ complexada com Ác.chiquímico (este trabalho) vai fornecer informações para entendermos o mecanismo de catálise das CQs e também para o desenho de drogas baseado em estrutura.
-A estrutura cristalográfica da MtCQ poderá ser utilizada como “template” para futuras modelagens de CQs complexada com ác. Chiquímico.
2) Silveira NJ, Uchoa HB, Pereira JH, Canduri F, Basso LA, Palma MS, Santos DS, de Azevedo WF Jr. Molecular models of protein targets from Mycobacterium tuberculosis. J Mol Model (Online). 2005 Mar;11(2):160-6.
3) Pereira JH, de Oliveira JS, Canduri F, Dias MV, Palma MS, Basso LA, Santos DS, de Azevedo WF Jr. Structure of shikimate kinase from Mycobacterium tuberculosis reveals the binding of shikimic acid. Acta Crystallogr D Biol Crystallogr. 2004 Dec;60(Pt 12 Pt 2):2310-9.
4) Dias MV, Ely F, Canduri F, Pereira JH, Frazzon J, Basso LA, Palma MS, de Azevedo WF Jr, Santos DS. Crystallization and preliminary X-ray crystallographic analysis of chorismate synthase from Mycobacterium tuberculosis. Acta Crystallogr D Biol Crystallogr. 2004 Nov;60(Pt 11):2003-5.
5) Arcuri HA, Canduri F, Pereira JH, da Silveira NJ, Camera Junior JC, de Oliveira JS, Basso
LA, Palma MS, Santos DS, de Azevedo Junior WF. Molecular models for shikimate pathway enzymes of Xylella fastidiosa. Biochem Biophys Res Commun. 2004 Jul 30;320(3):979-91.
6) Pereira JH, Canduri F, de Oliveira JS, da Silveira NJ, Basso LA, Palma MS, de Azevedo WF Jr, Santos DS. Structural bioinformatics study of EPSP synthase from Mycobacterium tuberculosis. Biochem Biophys Res Commun. 2003 Dec 19;312(3):608-14.
7) Filgueira de Azevedo W Jr, Canduri F, Simoes de Oliveira J, Basso LA, Palma MS, Pereira JH, Santos DS. Molecular model of shikimate kinase from Mycobacterium tuberculosis. Biochem Biophys Res Commun. 2002 Jul 5;295(1):142-8.
Publicações Sobre Via do
Ácido Chiquímico
Pereira JH, de Oliveira JS, Canduri F, Dias MV, Palma MS, Basso
LA, Santos DS, de Azevedo WF Jr. Structure of shikimate kinase from Mycobacterium tuberculosis reveals the binding of shikimic acid. Acta Crystallogr D Biol Crystallogr. 2004 Dec;60(Pt 12 Pt 2):2310-9.
Proteína quinase de
PfPK6
A alta identidade entre a Proteína Quinase de Plasmodium falciparum (PfPK6) e a CDK2 humana faz desta última um excelente molde para a modelagem por homologia da PfPK6. O alinhamento é mostrado ao lado, indicando uma identidade entre as duas proteína superior a 38 %. O servidor web PARMODEL foi usado para a modelagem por homologia da PfPK6.
PfPK6
A PfPK6 apresenta a estrutura
tridimensional canônica das CDKs, com dois lóbulos, um menor no N-terminal com alta incidência de fitas beta, e outro no C-terminal, maior com presença majoritária de hélices alfa. O bolsão de ligação de ATP localiza-se entre os dois lóbulos. Na figura ao lado temos o inibidor roscovitine ligado ao bolsão de ligação de ATP. Roscovitine é um inibidor competitivo com ATP.
PfPK6
O modelo tridimensional, obtido por modelagem molecular por homologia revela o padrão de ligações de hidrogênio intermolecular entre roscovitine e a PfPK6, revelando os principais resíduos de aminoácido responsáveis pelo contato intermolecular. Há duas ligações de hidrogênio intermolecular, envolvendo o resíduo Leu 95.
PfPK6
O modelo da PfPK6 em complexo com olomoucine revela as bases estruturais para as diferenças de especificidade mostrada por estes inibidores.
PfPK6
A figura ao lado mostra as ligações de hidrogênio intermoleculares entre a PfPK6 e o roscovitine. Estas ligações de
hidrogênio intermoleculares são
observadas no modelo estrutural da PfPK6 em complexo com o inibidor olomoucine. O slide a seguir mostra um resumo sobre a análise das ligações de hidrogênio entre olomoucine e roscovitine com diferentes quinases.
2.6 N6 Cys83O 2.9 N7 Cys83N CDK5-Olomoucine 2.6 N6 Leu83O 2.9 N7 Leu83N CDK2-Olomoucine 2.6 N6 Leu83O 2.9 N7 Leu83N CDK1-Olomoucine 3.2 N1 Asp86OD2 3.5 N2 Asp86OD2 3.3 O1 Gln130NE2 3.1 N6 Cys83O 3.5 N7 Cys83N CDK5-Roscovitine 2.8 N6 Leu83O 3.4 N7 Leu83N CDK2-Roscovitine 3.3 N2 Asp86OD2 3.2 N1 Asp86OD2 2.8 O1 Gln132NL2 3.1 N6 Leu83O 3.4 N7 Leu83N CDK1-Roscovitine Distance (Å) Inhibitor Residues Protein
PfPK6
A análise do padrão de ligações de hidrogênio intermolecular indicam um padrão comum observados em todos os complexos entre quinases e inibidores. Há um trecho da cadeia principal envolvendo os resíduos Leu 83 e Glu 81 nas CDKs e Leu 95 na PfPK6, que apresentam um conjunto aceitado, doador e aceitador de ligação de hidrogênio. Este padrão é chamado de garfo molecular e permite que diversas topologias moleculares se encaixem no bolsão de ligação de ATP.
A: H717
B: Staurosporine C: Descloroflavopiridol D: Oxindole
A figura ao lado ilustra alguns dos principais inibidores de CDKs. Vemos claramente a flexibilidade do bolsão de ligação de ATP das CDKs, que permite que topologias moleculares tal diversas liguem-se à CDK, fornecendo IC50 na faixa de nanomolar.
PfPK6-Roscovitine PfPK6-Olomoucine
A figura ao lado ilustra a superfície do potencial eletrostático da proteína. Em branco neutro, azul positivo e vermelho negativo. A especificidade do ligante por uma proteína é determinada por ligações de hidrogênio e complementaridade de forma e carga. A análise da superfície do
potencial eletrostático permite uma
avaliação qualitativa da interação ligante-proteína. Vemos na figura ao lado uma certa complentaridade de carga entre inibidor-proteína.
2 269 7 CDK2-Olo 2 320 0,7 CDK2-Rosc 2 289 3 CDK5-Olo 5 334 0,16 CDK5-Rosc 2 285 7 CDK1-Olo 6 339 0,45 CDK1-Rosc Número de ligações de H Área de contato (Å2) IC50 (μM) Complexo
Análise das estruturas dos complexos de olomoucine e roscovitine com diferentes quinases indica que quando comparamos a mesma quinase, com diferentes inibidores há uma correlação da área de contato e o número de ligações de H com o IC50, contudo tal correlação não é observada quando comparamos várias quinases, conforme a tabela abaixo.
• Os inibidores ligam-se ao bolsão de ligação de ATP
• Há participação do garfo molecular em ligações de hidrogênio
• Roscovitine e olomoucine são mais específicos para CDK1, CDK2,
CDK5 e PfPK6
• Os tradicionais inibidores de CDK apresentam potencial de inibirem
PfPKs
2) Manhani KK, Arcuri HA, Silveira NJ, Uchoa HB, Azevedo WF Jr, Canduri F. Molecular models of protein kinase 6 from Plasmodium falciparum. J Mol Model (Online). 2005 Aug 11;:1-7.
3) Canduri F, Uchoa HB, de Azevedo WF Jr.Related Articles, Links Molecular models of cyclin-dependent kinase 1 complexed with inhibitors. Biochem Biophys Res Commun. 2004 Nov 12;324(2):661-6.
4) Filgueira de Azevedo W Jr, Gaspar RT, Canduri F, Camera JC Jr, Freitas da Silveira NJ. Molecular model of cyclin-dependent kinase 5 complexed with roscovitine. Biochem Biophys Res Commun. 2002 Oct 11;297(5):1154-8.
5) de Azevedo WF Jr, Canduri F, da Silveira NJ. Structural basis for inhibition of cyclin-dependent kinase 9 by flavopiridol. Biochem Biophys Res Commun. 2002 Apr 26;293(1):566-71.
6) Kim SH, Schulze-Gahmen U, Brandsen J, de Azevedo Junior WF. Structural basis for chemical inhibition of CDK2. Prog Cell Cycle Res. 1996;2:137-45.
7) De Azevedo WF, Leclerc S, Meijer L, Havlicek L, Strnad M, Kim SH. Inhibition of cyclin-dependent kinases by purine analogues: crystal structure of human cdk2 complexed with roscovitine. Eur J Biochem. 1997 Jan 15;243(1-2):518-26.
8) De Azevedo WF Jr, Mueller-Dieckmann HJ, Schulze-Gahmen U, Worland PJ, Sausville E, Kim SH. Structural basis for specificity and potency of a flavonoid inhibitor of human CDK2, a cell cycle kinase. Proc Natl Acad Sci U S A. 1996 Apr 2;93(7):2735-40.
Purina Nucleosídeo Fosforilase
Humana
Cristalização da PNP
Cook, W. J., Ealick, S. E., Bugg, C. E., Stoeckler, J. D. & Parks, R. E., Jr. (1981) J. Biol. Chem., 256, 4079-4080. 0,5mm
Electron density map (2F
obs- F
calc, 1
σ
cutoff) for the Lys244 region of human PNP
solved to 2.3 Å resolution.
(1) O uso da cristalografia melhorou a resolução em 0,5 A.
(2) Análise das moléculas de água no sítio ativo indicam posições
preferenciais para interação com inibidores.
(3) Redefinição do sítio ativo da PNP
(4) Análise do complexo da PNP com inibidores fornecem a base
estrutural para a inibição da PNP.
Publicações sobre PNP entre 2002 e 2005
1) Canduri F, Silva RG, dos Santos DM, Palma MS, Basso LA, Santos DS, de Azevedo WF Jr. Structure of human PNP complexed with ligands. Acta Crystallogr D Biol Crystallogr. 2005 Jul;61(Pt 7):856-62.
2) Canduri F, Fadel V, Basso LA, Palma MS, Santos DS, de Azevedo WF Jr. New catalytic mechanism for human purine nucleoside phosphorylase. Biochem Biophys Res Commun. 2005 Feb 18;327(3):646-9.
3) Canduri F, Fadel V, Dias MV, Basso LA, Palma MS, Santos DS, de Azevedo WF Jr. Crystal structure of human PNP complexed with hypoxanthine and sulfate ion. Biochem Biophys Res Commun. 2005 Jan 14;326(2):335-8.
4) Nolasco DO, Canduri F, Pereira JH, Cortinoz JR, Palma MS, Oliveira JS, Basso LA, de Azevedo WF Jr, Santos DS. Crystallographic structure of PNP from Mycobacterium tuberculosis at 1.9A resolution. Biochem Biophys Res Commun. 2004 Nov 12;324(2):789-94. 5) da Silveira NJ, Uchoa HB, Canduri F, Pereira JH, Camera JC Jr, Basso LA, Palma MS, Santos DS, de Azevedo WF Jr. Structural bioinformatics study of PNP from Schistosoma mansoni. Biochem Biophys Res Commun. 2004 Sep 10;322(1):100-4.
6) Canduri F, dos Santos DM, Silva RG, Mendes MA, Basso LA, Palma MS, de Azevedo WF, Santos DS. Structures of human purine nucleoside phosphorylase complexed with inosine and ddI. Biochem Biophys Res Commun. 2004 Jan 23;313(4):907-14.
7) de Azevedo WF Jr, Canduri F, dos Santos DM, Pereira JH, Bertacine Dias MV, Silva RG, Mendes MA, Basso
LA, Palma MS, Santos DS. Crystal structure of human PNP complexed with guanine. Biochem Biophys Res Commun. 2003 Dec 19;312(3):767-72.
8) Filgueira de Azevedo W Jr, dos Santos GC, dos Santos DM, Olivieri JR, Canduri F, Silva RG, Basso
LA, Renard G, da Fonseca IO, Mendes MA, Palma MS, Santos DS. Docking and small angle X-ray scattering studies of purine nucleoside phosphorylase. Biochem Biophys Res Commun. 2003 Oct 3;309(4):923-8.
9) Filgueira de Azevedo W Jr, Canduri F, Marangoni dos Santos D, Pereira JH, Dias MV, Silva RG, Mendes MA, Basso
LA, Palma MS, Santos DS. Structural basis for inhibition of human PNP by immucillin-H. Biochem Biophys Res Commun. 2003 Oct 3;309(4):917-22.
Perspectivas
Uso das estruturas determinadas para simulações de docking
Análise da estrutura de complexos enzima-inibidor Desenvolver ferramentas computacionais para bioinformática estrutural
Desenvolvimento de softwares para
Bioinformática
BOURNE, P. E. & WEISSIG, H. Structural Bioinformatics. John Wiley & Sons, Inc. New Jersey, 2003.
LASKOWSKI, R. A., MACARTHUR, M. W., MOSS, D. S., THORNTON, J. M PROCHECK: a program to check the stereochemical quality of protein structures. J. of
Appl. Cryst. 26(2), 283-291, (1993).
LESK, A. M. Introduction to Protein Architecture. Oxford University Press, New York, 2001.
DA SILVEIRA, N. J. F., UCHOA, H. B., PEREIRA, J. H., CANDURI, F., BASSO, L. A., PALMA, M. S., SANTOS, D. S., & DE AZEVEDO, W. F. Jr. Molecular models of protein targets from Mycobacterium tuberculosis. Journal of Molecular Modeling 11, 160-166, 2005
.
UCHOA, H. B., JORGE, G. E., DA SILVEIRA, N. J. F, CAMERA, J. C. Jr., CANDURI, F., DE AZEVEDO, W. F.Biochem. Biophys. Res. Commun. 2004;325(4):1481-1486.