Bioinformática Estrutural

(1)

Bioinformática Estrutural

Modelagem Molecular

(2)

Bioinformática Estrutural

Resumo

Previsão da estrutura secundária

Modelagem molecular

PARMODEL

DBMODELING

Bioinformática na era pós-genoma

Referências

(3)

(4)

Previsão de estrutura secundária

Introdução. É possível prever a estrutura

secundária de peptídeos e proteínas a partir da estrutura primária. Há diversas abordagens e algoritmos, normalmente a taxa de sucesso desses algoritmos não ultrapassa 80 %, quando comparada com estruturas resolvidas por cristalografia por difração de raios X e ressonância magnética nuclear. Para ilustrar as

principais características desses

algoritmos descreveremos o algoritmos Chou e Fasman (1978, 1989), que apesar de obsoleto descreve os aspectos fundamentais de boa parte dos algoritmos de previsão de estrutura secundária de proteínas.

MIAALTKAAIKKTEALLAKIWYLK

Algoritmo de previsão

Fonte: Chou, P.Y., Fasman, G.D. (1978). Empirical

predictions of protein conformations. Annu. Rev. Biochem, 47, 251-276.

(5)

Previsão de estrutura secundária

Algoritmo de Chou e Fasman. Esse algoritmo baseia-se nas informações disponíveis

sobre a estrutura tridimensional de proteínas disponíveis em base de dados com o PDB. A partir de uma análise estatística das tendências de formação de hélice e fitas das aminoácidos contidos nas estruturas resolvidas depositadas no PDB é determinada propensão dos aminoácidos de adotarem uma determinada estrutura secundária. É estabelecida um janela de um certo número de aminoácidos, por exemplo 4, e determina-se qual a propensão para o trecho, segue-se na cadeia e quando há mudança na propensão há mudança na indicação da estrutura provável para o trecho da cadeia do peptídeo ou proteína.

Fonte: P.Y. Chou: "Prediction of Protein Structural Classes from Amino Acid Compositions". p 549-586 in the Fasman's 1989

(6)

Previsão de estrutura secundária

Algoritmo de Chou e Fasman. No método são usados conjuntos de parâmetros que

refletem a média da propensão de um dado aminoácido adotar hélice alfa <P_alfa>, fita beta <P_beta> ou laços <P_turn>. A propensão de um dado aminoácido formar hélice é determinado a partir da fração molar que este aminoácido apresenta em hélice a partir da análise da base de dados estruturais. O parâmetro χ_{alfa, i} representa a ocorrência do aminoácido i em hélice dividido pela a ocorrência total desse aminoácido na base de dados. Assim temos que a propensão de um dado aminoácido estar em hélice como dado pela equação:

<P_alfa> = χ_{alfa, i}/<χ_alfa>

onde <_χ_alfa> é a média de _χ_{alfa, i} para todos os 20 aminoácidos naturais. De forma similar são determinados os <P_beta> e <P_turn> .

(7)

Previsão de estrutura secundária

Algoritmo de Chou e Fasman. Na forma de algoritmo o método de Chou e Fasman

tem a seguinte implementação.

4. Leitura da sequência de aminoácido;

6. Determinar os valores das propensões, a partir da tabela de Chou e Fasman

(próximo slide);

8. Procurar por trechos com um certo número de aminoácidos em hélice, ou fita beta

ou laço;

(8)

Previsão de estrutura secundária

Glicina 0,57 0,75 1,56 Alanina 1,42 0,83 0,66 Serina 0,77 0,75 1,43 Treonina 0,83 1,19 0,96 Cisteina 0,70 1,19 1,19 Valina 1,06 1,70 0,50 Isoleucina 1,08 1,60 0,47 Leucina 1,41 1,30 0,59 Prolina 0,57 0,55 1,52 Fenilalanina 1,13 1,38 0,60 Tirosina 0,69 1,47 1,14 Metionina 1,45 1,05 0,60 Triptofano 1,08 1,37 0,96 Asparagina 0,67 0,89 1,56 Glutamina 1,11 1,10 0,98 Histidina 1,00 0,87 0,95 Aspartato 1,01 0,54 1,46 Glutamato 1,39 1,17 0,74 Lisina 1,14 0,74 1,01 Arginina 0,98 0,93 0,95

Propensão de formação de hélice, fitas e laços (Chou e Fasman, 1978).

(9)

Previsão de estrutura secundária

Algoritmo de Chou e Fasman. O algoritmo de Chou e Fasman tem uma taxa de acertos relativamente baixa, por volta de 50 %, quando comparado a métodos mais modernos que atingem margens próximas a 75 %. Um dos problemas do método e que é fortemente influenciado pela limitação das estruturas disponíveis na base de dados estruturais, que tendem a ter influência na facilidade que certas famílias de proteínas têm em serem resolvidas. O algoritmo de Chou e Fasman tem uma taxa de acertos relativamente baixa, por volta de 50 %, quando comparado a métodos mais modernos que atingem margens próximas a 75 %. Um dos problemas do método e que é fortemente influenciado pela limitação das estruturas disponíveis na base de dados estruturais, que tendem a ter influência na facilidade que certas famílias de proteínas têm em serem resolvidas, o que acaba criando concentração de informações estruturais em determinadas famílias de proteínas, enquanto outras, por serem apresentarem dificuldade em cristalizar não apresentam informação estrutural.

(10)

Previsão de estrutura secundária

Aplicação do algoritmo de Chou e Fasman. Para ilustrar o método vamos prever a estrutura secundária do peptídeo mastoparano. A sequência apresenta 14 resíduos de aminoácidos. Ile-Asn-Leu-Lys-Ala-Leu-Ala-Ala-Leu-Ala-Lys-Lys-Ile-Leu

<P

_alfa

>

1,08-0,67 -1,41 -1,14 -1,42 -1,41-1,42 -1,42-1,41 -1,42-1,14-1,14 -1,08-1,41

<P

_beta

>

1,60-0,89 -1,30 -0,74 -0,83 -1,30- 0,83 -0,83 -1,30-0,83-0,74-0,74-1,60-1,30

<P

_turn

>

0,47-1,56- 0,59 -1,01- 0,66- 0,59- 0,66- 0,66- 0,59- 0,66-1,01-1,01-0,47-0,59 Hélice alfa

(11)

Previsão de estrutura secundária

Aplicação do algoritmo de Chou e Fasman. A estrutura desse peptídeo foi resolvida por RMN (Hori et al., 2001). A figura abaixo mostra sua estrutura tridimensional, que como prevista é helicoidal.

Referência:

Hori, Y., Demura, M., Iwadate, M., Ulrich, A. S., Niidome, T., Aovagi, H., Asakura, T. Interaction of mastoparan with membranes

C

(12)

Previsão de estrutura secundária

Outros algoritmos de previsão de estrutura secundária. O uso do algoritmo de Chou e Fasman tem uma taxa de acerto de aproximadamente 50 %, métodos mais recentes de previsão de estrutura secundária, como o PSIPRED (Bryson et al., 2005), PROFphd(Rost et al., 1994), SSpro (Pollastri et al., 2002) atingem níveis de acerto de ate 77 %. Muitos desses métodos fazem uso de redes neurais para previsão da estrutura secundária, contudo nenhum deles apresentam resultados positivos acima de 80 %.

Referências:

Bryson, K., McGuffin, L. J., Marsden, R. L., Ward, J. J., Sodhi, J. S. & Jones, D. T. (2005) Protein structure prediction servers at University College London. Nucl. Acids Res. 33(Web Server issue):W36-38.

Rost, B., Sander, C. and Schneider, R. (1994) PHD--an automatic mail server for protein secondary structure prediction. Comput Appl Biosci 10:53-60.

Pollastri G, Przybylski D, Rost B, Baldi P. Improving the prediction of protein secondary structure in three and eight classes using

recurrent neural networks and profiles.

(13)

Previsão de estrutura secundária

Uso do PSIPRED. Para comparação usaremos o servidor wev PSIPRED (Bryson et al., 2005) na previsão da estrutura secundária do peptídeo mastoparano. O PSIPRED está disponível no site: http://bioinf.cs.ucl.ac.uk/psipred/psiform.html .

(14)

Previsão de estrutura secundária

Uso do PSIPRED. A interface de entrada

do servidor web do PSIPRED está mostrada ao lado. Para usá-la basta inserirmos a sequência de aminoácidos do peptídeo o proteína que queremos identificar a estrutura secundária.

(15)

Previsão de estrutura secundária

Uso do PSIPRED. Inserimos a sequência

de aminoácidos do mastoparano na janela indicada com código de uma letra para cada aminoácido. Após inserirmos a sequência escolhemos a opção de predição, no caso PSIPRED 2.5. Há ainda opções de filtragens e por último a colocação do e-mail do usuário.

(16)

Previsão de estrutura secundária

Uso do PSIPRED. Depois clicamos

“predict”. O resultado será enviado via e-mail para o usuário.

(17)

Previsão de estrutura secundária

Uso do PSIPRED. O resultado do PSIPRED corrobora a previsão do método de Chou

(18)

(19)

Algoritmo

A modelagem molecular por homologia, baseia-se no princípio que uma proteína, que apresenta identidade sequencial superior a 30 %, com outra proteína, compartilhará o mesmo enovelamento. A partir desse princípio podemos usar a estrutura tridimensional de um proteína, para modelar a estrutura tridimensional de uma que não apresenta estrutura resolvida. A abordagem desse problema admite diversas implementações, uma das mais utilizadas é a do MODELLER (Sali & Blundell, 1993), que usa o conceito de restrições espaciais. Parâmetros

(20)

Algoritmo

A modelagem por homologia pode seguir o algoritmo mostrado à direita. Nesta abordagem o usuário seleciona um molde para a modelagem, é iniciado o alinhamento do molde com a sequência a ser modelada, para posteriormente ser construído o modelo. O modelo construído é avaliado, caso satisfaça a uma condição padrão é considerado adequado, caso contrário é selecionado outro molde, se possível. O processo de modelagem

permite que sejam selecionados

diferentes conjuntos de parâmetros estruturais a serem na montagem de modelos distintos. Início Identificação de moldes Seleção de moldes Alinhamento Construção do modelo Avaliação do modelo Modelo OK? Fim Sim Não

(21)

Início Identificação de moldes Seleção de moldes Alinhamento Construção do modelo Avaliação do modelo Modelo OK? Sim Não

Algoritmo

O algoritmo do PARMODEL usa uma implementação paralela do MODELLER, o que permite automatizar o processo de modelagem usando programação de grão grosso, onde as modelagem são divididas entre os nós de um cluster de computadores do tipo Beowulf. Cada modelagem usa um conjunto distinto de restrições espaciais, o que permite varrer diversas condições iniciais, gerando

modelos distintos para a mesma

sequência, sem contudo ocorrer uma mudança drástica na estrutura. Podemos obter modelos com melhor qualidade

(22)

Último modelo ? Não Seleciona o melhor modelo Fim Sim Uchoa et al., BBRC (2004)

Silveira et al., J. Mol. Mod. (2005)

Algoritmo do Parmodel

A paralelização obtida com o PARMODEL permite que diversos modelos sejam gerados simultaneamente, o número de modelos é escolhido pelo usuário. Cada nó do cluster gera

uma carga

aproximadamente igual de modelos, que são testados no final. O melhor modelo é enviado ao usuário. Início Identificação de moldes Seleção de moldes Alinhamento Construção do modelo Avaliação do modelo Modelo OK? Sim

(23)

Computação Paralela

O diagrama esquemático ao lado ilustra a arquitetura básica de um cluster de computadores. Esse cluster é dividido em diferentes nós, sendo cada nó uma CPU. Esses nós estão interconectados ao um nó central chamado de “front end”, responsável pelo gerenciamento dos processos em execução no cluster.

(24)

Computação Paralela

A figura ao lado mostra 2 clusters do tipo

Beowulf usados para modelagem

molecular por homologia. O programa PARMODEL, para modelagem molecular por homologia, está instalado no cluster da direita.

(25)

(26)

Página de entrada do PARMODEL. O

PARMODEL é um servidor web dedicado à modelagem molecular por homologia e análise da qualidade estrutural de modelos de proteínas. Clicando-se na opção “parmodel modeling” temos acesso à página de entrada para modelagem molecular por homologia on-line. A interface do PARMODEL é simples e intuitiva, permitindo acesso a uma ferramenta poderosa de modelagem molecular de forma rápida.

PARMODEL

Referência:UCHOA et al. .Biochem. Biophys. Res. Commun. 2004;325(4):1481-1486.

(27)

PARMODEL

Página de entrada do PARMODEL. A

página de entrada do PARMODEL

descreve brevemente as principais

ferramentas presentes no servidor web. Além do “parmodel modeling”, temos interfaces para otimização do modelo estrutural (parmodel optimization) e análise da qualidade de modelos de proteínas (parmodel assesment).

(28)

PARMODEL

PARMODEL Modeling. Para modelagem

molecular por homologia o PARMODEL solicita ao usuário o preenchimento de um formulário breve, com as informações necessárias para modelagem.

(29)

PARMODEL

PARMODEL Modeling. O PARMODEL

retornará os resultados da modelagem molecular por homologia por e-mail, assim como primeira etapa é solicitado ao usuário seu e-mail e uma identificação do usuário e da instituição.

(30)

PARMODEL

PARMODEL Modeling. Variando-se as

restrições espaciais é possível a gerar até 1000 modelos para cada proteína a ser modelada. Caso o usuário deseje gerar 1000 modelos é necessário indicar que o número de modelos será de 1 até 1000, como indicado ao lado. Duas informações

fundamentais para a modelagem

molecular por homologia. 1) A sequência de aminoácidos da proteína a ser modelada (no formato fasta). 2) Arquivo PDB com as coordenadas atômicas do molde (template). Nesta versão é possível o uso de até 8 moldes. Os dois slides a seguir mostram os arquivos exemplos usados neste modelagem.

(31)

PARMODEL

PARMODEL Modeling. A sequência da

proteína a ser modelada é carregada no PARMODEL no formato fasta. Neste formato a primeira linha começa com o símbolo “>” maior que, normalmente seguido com comentário sobre a proteína,

identificação, código de acesso,

organismo etc. Da segunda linha em diante fica a sequência de aminoácidos usando o código de uma letra. Na figura ao lado temos o arquivo fasta para a sequência de aminoácidos da CDK3 humana, a proteína a ser modelada neste exemplo.

(32)

PARMODEL

PARMODEL Modeling. O arquivo com as

coordenadas atômicas do molde

(template), neste caso o arquivo PDB (1HCL) com a estrutura da CDK2 humana na forma apo, a ser usado para a modelagem da CDK3. A CDK2 apresenta identidade sequêncial de 74,8 % com a CDK3, o que indica que a CDK2 é um bom molde para a modelagem da CDK3.

(33)

PARMODEL

PARMODEL Modeling. Na fase seguinte

o usuário indica o método usado para obtenção do molde (template). Há 3 opções: Difração de raios X, NMR e modelagem. No exemplo aqui analisado a opção é difração de raios X. Outro campo a ser preenchido é sobre a presença de ligantes, neste caso coloca-se “0” visto que estamos modelando a enzima na forma apo.

(34)

PARMODEL

PARMODEL Modeling. A etapa seguinte

permite ao usuário indicar a forma como será avaliado os modelos gerados. Lembramos que podemos gerar diversos modelos (até 1000), para a mesma proteína. O PARMODEL retornará ao usuário o melhor modelo, segundo um critério estabelecido pelo usuário, como o PROCHECK ou o VERIFY3D, ou usarmos

a função objetiva do programa

MODELLER, como mostrado na figura ao lado. Depois de selecionar a forma de avaliação do modelo clicamos em “submit”, e termos a mensagem mostrada no slide a seguir.

(35)

PARMODEL

PARMODEL Modeling. A modelagem foi

aceita e os resultados serão enviados via e-mail para o usuário. Os resultados incluem o arquivo PDB do melhor modelo gerado por homologia, o alinhamento do

molde (template) e a sequência

(36)

PARMODEL

PARMODEL Modeling. É possível avaliar

a evolução do processo de modelagem na

página de entrada (

www.biocristalografia.df.ibilce.unesp.br/bioxtal1.php

(37)

PARMODEL

PARMODEL Modeling. A partir do uso da

ferramenta “Ganglia Cluster Toolkit”, usada para avaliar o desempenho de

clusters de computadores podemos

verificar a entrada da modelagem solicitada ao PARMODEL, caso o cluster esteja sem modelagens no momento da solicitação, como mostrado na figura ao lado. O gráfico da direita acima indica o número de processos atualmente sendo executados no cluster. O segundo gráfico abaixo indica a porcentagem da CPU sendo usada. À esquerda é indicado o número de CPUs sendo usados no

(38)

PARMODEL

PARMODEL Modeling. Na página

seguinte é mostrado o tráfego de rede e a velocidade do tráfego de rede, bem como um gráfico de pizza indicando o uso do

cluster. O PARMODEL divide o processo

de modelagem igualmente entre os nós disponíveis para a modelagem.

(39)

PARMODEL

PARMODEL Modeling. O final da página

indica o uso de cada nó (CPU) do cluster. Cinza indica uso, branco indica sem uso. A situação indicada mostra sem uso, esta é a situação onde não nenhuma proteína está em processo de modelagem.

(40)

PARMODEL

PARMODEL Modeling. Vamos analisar o

uso do cluster logo após a entrada da modelagem da CDK3. Poucos minutos após a submissão da modelagem vemos claramente um aumento nos gráficos do número de processos (gráfico de cima) e da porcentagem de CPU usada (segundo gráfico de cima para baixo)

(41)

PARMODEL

PARMODEL Modeling. No terceiro

gráfico vemos um pico do tráfego de rede, devido ao início da modelagem, e depois

uma velocidade de transferência

constante (quarto gráfico) devido à comunicação dos diferentes nós durante a modelagem. O PARMODEL divide a modelagem igualmente entre os nós, armazena os resultados e retorna ao usuário o arquivo PDB com o melhor modelo. Vemos também uma mudança no gráfico de pizza da esquerda, indicando um aumento do uso do cluster.

(42)

PARMODEL

PARMODEL Modeling. Os dezesseis

gráficos do final da página indicam o uso de cada CPU, há uma CPU não sendo usada, e as outras quinze sendo usadas intensamente.

(43)

PARMODEL

PARMODEL Modeling. Ao final da

modelagem vemos que o uso do cluster volta ao mínino.

(44)

PARMODEL

PARMODEL Modeling. Os resultados

são enviandos via e-mail com informações sobre como descompactar em ambiente linux e windows.

(45)

PARMODEL

PARMODEL Modeling. Em linux basta

copiar o arquivo para um diretório e usar o comando tar –xvf “nome-do-arquivo”. Em windows pode usar o winrar ou winzip ou

qualquer outra programa para

descompactar. O arquivo compactado apresenta três arquivos, mostrados no próximo slide.

(46)

PARMODEL

PARMODEL Modeling. O arquivo

alignment.pap com o alinhamento da sequência de aminoácidos do modelo e do template, usado na modelagem. O arquivo pdb com o melhor modelo e o arquivo rank com o valor da função objetiva do MODELLER.

(47)

PARMODEL

PARMODEL Modeling. A função objetiva

é listada da menor para a maior, com o respectivo modelo. Quanto menor a função objetiva do MODELLER melhor é o modelo. O arquivo PDB enviado ao usuário é aquele que apresenta menor valor para a função objetiva.

(48)

PARMODEL

PARMODEL Modeling. O programa PARMODEL retorna ao usuário as coordenadas

atômicas do modelo, no caso a CDK3, mostrada em verde. A estrutura do molde usado, as coordenadas atômicas da CDK2 humana (código de acesso no pdb: 1HCL), na forma apo, está mostrada em seguida, em vermelho. A sobreposição das duas estruturas indica um rmsd de 0,3 Å, indicando um bom ajuste entre modelo (CDK3) e molde (CDK2).

(49)

PARMODEL

PARMODEL Modeling. Análise do diagrama da Ramachandran da estrutura do molde

(Código pdb: 1HCL) indica que o molde apresenta boa qualidade estereoquímica, com 91,4 % dos resíduos nas regiões permitidas, 8,2 % nas regiões adicionalmente permitidas, e 0,4 % nas regiões adicionalmente permitidas. Não há resíduos nas regiões proibidas.

(50)

PARMODEL

PARMODEL Modeling. Para o modelo da CDK3, o diagrama de Ramachandran

indica que a estrutura apresenta boa qualidade estereoquímica, com 92,1 % dos resíduos nas regiões permitidas, 6,0 % nas regiões adicionalmente permitidas, e 1,1 % nas regiões adicionalmente permitidas. Há 2 resíduos nas regiões proibidas (0,8%).

(51)

PARMODEL

PARMODEL Modeling. A interface de avaliação da qualidade de modelos do

PARMODEL permite a avaliação do diagrama de Ramachandran por tipo de resíduo de aminoácido. A análise a seguir é para o modelo da CDK3.

Os pontos em vermelho indicam resíduos na região proibida. O número em parênteses indica

quantos resíduos de

(52)

PARMODEL

PARMODEL Modeling. Outra opção avalia os ângulos chi1 e chi2 das cadeias laterais

dos resíduos de aminoácido que apresentam estes ângulos. A análise abaixo é para o modelo da CDK3.

Os pontos em vermelho indicam resíduos na região proibida. O número em parênteses indica

quantos resíduos de

(53)

Além dos ângulos de torção da cadeia principal, temos, para a maioria do aminoácidos a possibilidade de ângulos de torção para a cadeia lateral. Obviamente tais ângulos só existem para os aminoácidos de cadeia lateral média e longa. No exemplo abaixo temos uma lisina, com 5 ângulos de torção possíveis.

χ

₁

χ

2

χ

₃

χ

₄

χ

₅

PARMODEL

(54)

(55)

Algoritmo do DBMODELING

DBMODELING. DBMODELING é uma

base de dados que armazena modelos estruturais de proteínas identificadas em genomas de patógenos, foi desenvolvida usando-se Perl e MySQL. Esta base de dados é aberta e armazena modelos estruturais de proteínas identificadas nos genomas de Mycobacterium tuberculosis e Xylella fastidiosa. O DBMODELING permite um acesso fácil e intuitivo. O usuário ao entra no site tem a possibilidade de indicar o nome da proteína. Esta pesquisa gera uma solicitação ao sistema que retornará ao

(56)

DBMODELING

DBMODELING. A interface permite

selecionar dois genomas (versão atual). Uma vez selecionado o genoma é possível solicitar uma proteína ou via metabólica específica.

(57)

DBMODELING

DBMODELING. A possibilidade de acessar diretamente a via metabólica de interesse, como mostrado na coluna esquerda da página mostrada ao lado. Clicando-se da primeira via metabólica mostrada, é mostrada as enzimas dessa via metabólica que apresentam modelo estrutural. Nem todas enzimas de uma via metabólica apresentam modelo estrutural depositado, visto que não há moldes (templates) para todas as enzimas. As

passíveis de modelagem estão

(58)

DBMODELING

DBMODELING. Na interface é mostrada

seis enzimas da via de biossíntese de ácido fólico. Para acessar as coordenadas atômica, bem como, detalhes sobre a modelagem, estrutura primária, reação catalisada e outras informações o usuário clica na enzima.

(59)

DBMODELING

DBMODELING. A interface mostra o

modelo em fitas da estrutura 3D do modelo obtido por homologia. É mostrada a sequência de aminoácidos da proteína modelada. Há possibilidade de acessar a qualidade estereoquímica do modelo, usando-se o PROCHECK, VERIFY3D e o WHATCHECK. Há possibilidade de fazer

download das coordenadas atômicas dos

(60)

DBMODELING

DBMODELING. Abaixo na página há links

para as bases de dados com informações sobre enzimas e via metabólicas (Kegg e MetaCyc), bem como links para sites sobre o Mycobacterium tuberculosis.

(61)

(62)

Enzimas alvo para desenho

de drogas contra o

(63)

Número de pessoas infectadas por ano 0 200 400 600 800 1000 1200 1400 1600 1800 2000 Ín d ia C h in a In d o n é s ia N ig é ri a B an g la d e s h Et ió p ia Fi lip in as P aq u is tã o Á fr ic a d o S u l Fe d e ra çõ e s C o n g o K e n ia V ie tn am T an zâ n ia B ra s il T ai lâ n d ia U g an d a M ya n m ar M o ça m b iq u e C am b o d ia Z im b áb u e A fe g an is tã o País N ú m e ro d e c as o s (m ilh ar e s)

Fonte: WHO report 2002

Mycobacterium tuberculosis

O agente causado da tuberculose é o

Mycobacterium tuberculosis. A tuberculose normalmente é uma doença relacionada ao século XIX, fortemente

marcante no romantismo, sendo

responsável pela morte precoce de diversos expoentes da literatura do final do século XIX e início do século XX. Contudo, devido à decadência dos centros urbanos e a epidemia de AIDS há um ressurgimento da tuberculose, sendo que a OMS declarou em 1993 a TB como epidemia mundial. O gráfico ao lado mostra a incidência de TB nos principais

(64)

Via metabólica do ácido

chiquímico

(65)

Via metabólica do ácido chiquímico.

Esta via é composta de sete passos

enzimáticos, é responsável pela

conversão de eritrose-4-fosfato e

fosfoenol-piruvato em corismato. O

corismato precursor para biossíntese de aminoácidos aromáticos, entre outros compostos. Como esta via metabólica está presente em bactérias, organismos do filo apiconplexa e plantas, mas ausente em mamíferos, as enzimas que a

constituem são potenciais alvos

moleculares para o desenho de drogas, a partir do paradigma de toxidade seletiva.

(66)

0,5mm

Cristalização da MtCQ

A MtCQ foi cristalizada usando a técnica de difusão de vapor e o sistema de gota suspensa. A MtCQ foi concentrada e dializada contra uma solução de 50mM de Hepes Na em pH 7,5, contendo 0,5 M NaCl

e 5,0 mM de MgCl₂ . A proteína foi

concentrada a 17 mg/ml. ADP e ácido chiquímico foram adicionados à solução da proteína. A solução do poço apresentava 0,1 M de Hepes em pH 7,5, 10 % de 2-propanol e 35 % de PEG 3350, as gotas consistiam de 1 µ l de solução do poço e 1,5

µ l de solução de proteína. Os cristais cresciam até aproximadamente 0,5 mm, após uma semana.

(67)

Mapa de difração do complexo MtCQ-MgADP-Ác.chiquímico obtido no LNLS (Estação PCr, Laboratório Nacional de Luz

Síncroton, Campinas, Brasil). Os

parâmetros da cela unitária estão na tabela abaixo.

Difração da MtCQ

Parâmetros da cela unitária

a = b (Å) 62,91

c (Å) 90,92

Resolução (Å) 29,74-2,30 (2,41-2,30)

Grupo espacial P3₂21

(68)

Ácido Chiquímico

A reação de fosforilação do ácido chiquímico é catalisada pela chiquimato quinase. Nesta reação há transferência de um grupo fosfato da molécula de ATP para o ácido chiquímico. O ácido chiquímico apresenta três hidroxilas e um grupo carboxílico, como mostrado na figura ao lado.

(69)

O principal objetivo deste trabalho é a identificação da posição do ácido chiquímico na estrutura da MtCQ, para isto foram gerados mapas de densidade eletrônica de omissão, onde uma grande região sem modelo de proteína e ADP apareceu de forma destacada (gradeado azul). Tal observação é uma indicação que há densidade eletrônica não incluída no modelo cristalográfico, no caso este modelo foi refinado como a molécula de ácido chiquímico. Na figura ao lado vemos o ác. Chiquímico, a molécula de ADP, o íon magnésio, e os carbonos alfa da MtCQ.

(70)

Complexo CQ-ADP-Ác. Chiquímico

A figura ao lado mostra a estrutura final do complexo MtCQ-ADP-Ac. Chiquímico. A estrutura indica o bolsão de ligação do ác. chiquímico próximo ao bolsão de ligação de ADP, com o íon magnésio entre as duas moléculas. A estrutura da MtCQ apresenta um folha beta central formada por cinco fitas beta (indicada em vermelho) e circundada por oito hélices alfa. Um pequeno trecho em hélice funciona como uma tampa sobre o bolsão de ligação do ác. chiquímico.

(71)

CQ:ADP:Ac. Chiquímico

Complexo CQ-ADP-Ác. Chiquímico

A sobreposição da estrutura do complexo MtCQ-ADP-Ác. Chiquímico (código de acesso PDB: 1WE2) com a estrutura da CQ de Erwinia chrysanthemi na forma apo mostra um grande movimento do domínio da tampa (LID domain), este movimento provavelmente é induzido devido à ligação do ácido chiquímico.

(72)

Complexo CQ-ADP-Ác. Chiquímico

Afim de averiguar a estabilidade que a adição da molécula de ácido chiquímico, proporciona à estrutura da chiquimato quinase realizamos uma simulação de dinâmica molecular da estrutura na forma apo e na forma complexada com ADP e

ácido chiquímico. Foi realizada um

simulação de dinâmica molecular por 5 ns (nanosegundos). O gráfico do desvio médio quadrádico (rmsd) com relação à estrutura inicial é mostrado ao lado. A linha preta indica a evolução da dinâmica da MtCQ na forma apo, e a linha cinza na forma complexada, vemos claramente que a forma apo apresenta maior rmsd, o que indica maior flexibilidade da estrutura.

(73)

Complexo CQ-ADP-Ác. Chiquímico

A estrutura em cinza é a MtCQ complexada, e a estrutura em preto a MtCQ na forma apo, após a simulação computacional de dinâmica molecular por 5 ns. Vemos claramente a diferença da região da tampa, com a estrutura complexada mantendo o domínio na posição fechada.

(74)

Ác. chiquímico Átomo _{Distância (Å)} Grupos hidroxil O1 Gly 80-N 3,10 Asp34-OD1 2,82 Asp34-OD2 2,57 Água1-O 2,46 O2 Asp34-OD1 2,66 Asp34-OD2 2,85 Grupo carboxil O4 Gly 81-N 3,22 Arg136-NH2 2,68 O5 Arg58-NH2 2,67 Gly 81-N 3,49

Tabela – Ligações de hidrogênio entre MtSK e ácido chiquímico

Sítio de ligação do ácido chiquímico. A linha descontínua em preto mostra as ligações de hidrogênio entre ác.chiq. e MtSK e a linha em verde, a ligação ligações de hidrogênio entre Glu61 e Arg58.

Complexo CQ-ADP-Ác. Chiquímico

Análise dos resíduos de aminoácido da CQ, que participam de ligações de hidrogênio, indica a participação do resíduos: Gly80, Asp34, Gly81, Arg136 e Arg58, conforme a tabela abaixo.

(75)

(76)

-A primeira estrutura de CQ complexada com Ác.chiquímico (este trabalho) vai fornecer informações para entendermos o mecanismo de catálise das CQs e também para o desenho de drogas baseado em estrutura.

-A estrutura cristalográfica da MtCQ poderá ser utilizada como “template” para futuras modelagens de CQs complexada com ác. Chiquímico.

(77)

2) Silveira NJ, Uchoa HB, Pereira JH, Canduri F, Basso LA, Palma MS, Santos DS, de Azevedo WF Jr. Molecular models of protein targets from Mycobacterium tuberculosis. J Mol Model (Online). 2005 Mar;11(2):160-6.

3) Pereira JH, de Oliveira JS, Canduri F, Dias MV, Palma MS, Basso LA, Santos DS, de Azevedo WF Jr. Structure of shikimate kinase from Mycobacterium tuberculosis reveals the binding of shikimic acid. Acta Crystallogr D Biol Crystallogr. 2004 Dec;60(Pt 12 Pt 2):2310-9.

4) Dias MV, Ely F, Canduri F, Pereira JH, Frazzon J, Basso LA, Palma MS, de Azevedo WF Jr, Santos DS. Crystallization and preliminary X-ray crystallographic analysis of chorismate synthase from Mycobacterium tuberculosis. Acta Crystallogr D Biol Crystallogr. 2004 Nov;60(Pt 11):2003-5.

5) Arcuri HA, Canduri F, Pereira JH, da Silveira NJ, Camera Junior JC, de Oliveira JS, Basso

LA, Palma MS, Santos DS, de Azevedo Junior WF. Molecular models for shikimate pathway enzymes of Xylella fastidiosa. Biochem Biophys Res Commun. 2004 Jul 30;320(3):979-91.

6) Pereira JH, Canduri F, de Oliveira JS, da Silveira NJ, Basso LA, Palma MS, de Azevedo WF Jr, Santos DS. Structural bioinformatics study of EPSP synthase from Mycobacterium tuberculosis. Biochem Biophys Res Commun. 2003 Dec 19;312(3):608-14.

7) Filgueira de Azevedo W Jr, Canduri F, Simoes de Oliveira J, Basso LA, Palma MS, Pereira JH, Santos DS. Molecular model of shikimate kinase from Mycobacterium tuberculosis. Biochem Biophys Res Commun. 2002 Jul 5;295(1):142-8.

Publicações Sobre Via do

Ácido Chiquímico

(78)

Pereira JH, de Oliveira JS, Canduri F, Dias MV, Palma MS, Basso

LA, Santos DS, de Azevedo WF Jr. Structure of shikimate kinase from Mycobacterium tuberculosis reveals the binding of shikimic acid. Acta Crystallogr D Biol Crystallogr. 2004 Dec;60(Pt 12 Pt 2):2310-9.

(79)

Proteína quinase de

(80)

PfPK6

A alta identidade entre a Proteína Quinase de Plasmodium falciparum (PfPK6) e a CDK2 humana faz desta última um excelente molde para a modelagem por homologia da PfPK6. O alinhamento é mostrado ao lado, indicando uma identidade entre as duas proteína superior a 38 %. O servidor web PARMODEL foi usado para a modelagem por homologia da PfPK6.

(81)

PfPK6

A PfPK6 apresenta a estrutura

tridimensional canônica das CDKs, com dois lóbulos, um menor no N-terminal com alta incidência de fitas beta, e outro no C-terminal, maior com presença majoritária de hélices alfa. O bolsão de ligação de ATP localiza-se entre os dois lóbulos. Na figura ao lado temos o inibidor roscovitine ligado ao bolsão de ligação de ATP. Roscovitine é um inibidor competitivo com ATP.

(82)

PfPK6

O modelo tridimensional, obtido por modelagem molecular por homologia revela o padrão de ligações de hidrogênio intermolecular entre roscovitine e a PfPK6, revelando os principais resíduos de aminoácido responsáveis pelo contato intermolecular. Há duas ligações de hidrogênio intermolecular, envolvendo o resíduo Leu 95.

(83)

PfPK6

O modelo da PfPK6 em complexo com olomoucine revela as bases estruturais para as diferenças de especificidade mostrada por estes inibidores.

(84)

PfPK6

A figura ao lado mostra as ligações de hidrogênio intermoleculares entre a PfPK6 e o roscovitine. Estas ligações de

hidrogênio intermoleculares são

observadas no modelo estrutural da PfPK6 em complexo com o inibidor olomoucine. O slide a seguir mostra um resumo sobre a análise das ligações de hidrogênio entre olomoucine e roscovitine com diferentes quinases.

(85)

2.6 N6 Cys83O 2.9 N7 Cys83N CDK5-Olomoucine 2.6 N6 Leu83O 2.9 N7 Leu83N CDK2-Olomoucine 2.6 N6 Leu83O 2.9 N7 Leu83N CDK1-Olomoucine 3.2 N1 Asp86OD2 3.5 N2 Asp86OD2 3.3 O1 Gln130NE2 3.1 N6 Cys83O 3.5 N7 Cys83N CDK5-Roscovitine 2.8 N6 Leu83O 3.4 N7 Leu83N CDK2-Roscovitine 3.3 N2 Asp86OD2 3.2 N1 Asp86OD2 2.8 O1 Gln132NL2 3.1 N6 Leu83O 3.4 N7 Leu83N CDK1-Roscovitine Distance (Å) Inhibitor Residues Protein

(86)

PfPK6

A análise do padrão de ligações de hidrogênio intermolecular indicam um padrão comum observados em todos os complexos entre quinases e inibidores. Há um trecho da cadeia principal envolvendo os resíduos Leu 83 e Glu 81 nas CDKs e Leu 95 na PfPK6, que apresentam um conjunto aceitado, doador e aceitador de ligação de hidrogênio. Este padrão é chamado de garfo molecular e permite que diversas topologias moleculares se encaixem no bolsão de ligação de ATP.

(87)

A: H717

B: Staurosporine C: Descloroflavopiridol D: Oxindole

A figura ao lado ilustra alguns dos principais inibidores de CDKs. Vemos claramente a flexibilidade do bolsão de ligação de ATP das CDKs, que permite que topologias moleculares tal diversas liguem-se à CDK, fornecendo IC50 na faixa de nanomolar.

(88)

PfPK6-Roscovitine PfPK6-Olomoucine

A figura ao lado ilustra a superfície do potencial eletrostático da proteína. Em branco neutro, azul positivo e vermelho negativo. A especificidade do ligante por uma proteína é determinada por ligações de hidrogênio e complementaridade de forma e carga. A análise da superfície do

potencial eletrostático permite uma

avaliação qualitativa da interação ligante-proteína. Vemos na figura ao lado uma certa complentaridade de carga entre inibidor-proteína.

(89)

2 269 7 CDK2-Olo 2 320 0,7 CDK2-Rosc 2 289 3 CDK5-Olo 5 334 0,16 CDK5-Rosc 2 285 7 CDK1-Olo 6 339 0,45 CDK1-Rosc Número de ligações de H Área de contato (Å2₎ IC50 (μM) Complexo

Análise das estruturas dos complexos de olomoucine e roscovitine com diferentes quinases indica que quando comparamos a mesma quinase, com diferentes inibidores há uma correlação da área de contato e o número de ligações de H com o IC50, contudo tal correlação não é observada quando comparamos várias quinases, conforme a tabela abaixo.

(90)

• Os inibidores ligam-se ao bolsão de ligação de ATP

• Há participação do garfo molecular em ligações de hidrogênio

• Roscovitine e olomoucine são mais específicos para CDK1, CDK2,

CDK5 e PfPK6

• Os tradicionais inibidores de CDK apresentam potencial de inibirem

PfPKs

(91)

2) Manhani KK, Arcuri HA, Silveira NJ, Uchoa HB, Azevedo WF Jr, Canduri F. Molecular models of protein kinase 6 from Plasmodium falciparum. J Mol Model (Online). 2005 Aug 11;:1-7.

3) Canduri F, Uchoa HB, de Azevedo WF Jr.Related Articles, Links Molecular models of cyclin-dependent kinase 1 complexed with inhibitors. Biochem Biophys Res Commun. 2004 Nov 12;324(2):661-6.

4) Filgueira de Azevedo W Jr, Gaspar RT, Canduri F, Camera JC Jr, Freitas da Silveira NJ. Molecular model of cyclin-dependent kinase 5 complexed with roscovitine. Biochem Biophys Res Commun. 2002 Oct 11;297(5):1154-8.

5) de Azevedo WF Jr, Canduri F, da Silveira NJ. Structural basis for inhibition of cyclin-dependent kinase 9 by flavopiridol. Biochem Biophys Res Commun. 2002 Apr 26;293(1):566-71.

6) Kim SH, Schulze-Gahmen U, Brandsen J, de Azevedo Junior WF. Structural basis for chemical inhibition of CDK2. Prog Cell Cycle Res. 1996;2:137-45.

7) De Azevedo WF, Leclerc S, Meijer L, Havlicek L, Strnad M, Kim SH. Inhibition of cyclin-dependent kinases by purine analogues: crystal structure of human cdk2 complexed with roscovitine. Eur J Biochem. 1997 Jan 15;243(1-2):518-26.

8) De Azevedo WF Jr, Mueller-Dieckmann HJ, Schulze-Gahmen U, Worland PJ, Sausville E, Kim SH. Structural basis for specificity and potency of a flavonoid inhibitor of human CDK2, a cell cycle kinase. Proc Natl Acad Sci U S A. 1996 Apr 2;93(7):2735-40.

(92)

Purina Nucleosídeo Fosforilase

Humana

(93)

(94)

Cristalização da PNP

Cook, W. J., Ealick, S. E., Bugg, C. E., Stoeckler, J. D. & Parks, R. E., Jr. (1981) J. Biol. Chem., 256, 4079-4080. 0,5mm

(95)

(96)

Electron density map (2F

_obs

- F

_calc

, 1

σ

cutoff) for the Lys244 region of human PNP

solved to 2.3 Å resolution.

(97)

(98)

(99)

(100)

(1) O uso da cristalografia melhorou a resolução em 0,5 A.

(2) Análise das moléculas de água no sítio ativo indicam posições

preferenciais para interação com inibidores.

(3) Redefinição do sítio ativo da PNP

(4) Análise do complexo da PNP com inibidores fornecem a base

estrutural para a inibição da PNP.

(101)

Publicações sobre PNP entre 2002 e 2005

1) Canduri F, Silva RG, dos Santos DM, Palma MS, Basso LA, Santos DS, de Azevedo WF Jr. Structure of human PNP complexed with ligands. Acta Crystallogr D Biol Crystallogr. 2005 Jul;61(Pt 7):856-62.

2) Canduri F, Fadel V, Basso LA, Palma MS, Santos DS, de Azevedo WF Jr. New catalytic mechanism for human purine nucleoside phosphorylase. Biochem Biophys Res Commun. 2005 Feb 18;327(3):646-9.

3) Canduri F, Fadel V, Dias MV, Basso LA, Palma MS, Santos DS, de Azevedo WF Jr. Crystal structure of human PNP complexed with hypoxanthine and sulfate ion. Biochem Biophys Res Commun. 2005 Jan 14;326(2):335-8.

4) Nolasco DO, Canduri F, Pereira JH, Cortinoz JR, Palma MS, Oliveira JS, Basso LA, de Azevedo WF Jr, Santos DS. Crystallographic structure of PNP from Mycobacterium tuberculosis at 1.9A resolution. Biochem Biophys Res Commun. 2004 Nov 12;324(2):789-94. 5) da Silveira NJ, Uchoa HB, Canduri F, Pereira JH, Camera JC Jr, Basso LA, Palma MS, Santos DS, de Azevedo WF Jr. Structural bioinformatics study of PNP from Schistosoma mansoni. Biochem Biophys Res Commun. 2004 Sep 10;322(1):100-4.

6) Canduri F, dos Santos DM, Silva RG, Mendes MA, Basso LA, Palma MS, de Azevedo WF, Santos DS. Structures of human purine nucleoside phosphorylase complexed with inosine and ddI. Biochem Biophys Res Commun. 2004 Jan 23;313(4):907-14.

7) de Azevedo WF Jr, Canduri F, dos Santos DM, Pereira JH, Bertacine Dias MV, Silva RG, Mendes MA, Basso

LA, Palma MS, Santos DS. Crystal structure of human PNP complexed with guanine. Biochem Biophys Res Commun. 2003 Dec 19;312(3):767-72.

8) Filgueira de Azevedo W Jr, dos Santos GC, dos Santos DM, Olivieri JR, Canduri F, Silva RG, Basso

LA, Renard G, da Fonseca IO, Mendes MA, Palma MS, Santos DS. Docking and small angle X-ray scattering studies of purine nucleoside phosphorylase. Biochem Biophys Res Commun. 2003 Oct 3;309(4):923-8.

9) Filgueira de Azevedo W Jr, Canduri F, Marangoni dos Santos D, Pereira JH, Dias MV, Silva RG, Mendes MA, Basso

LA, Palma MS, Santos DS. Structural basis for inhibition of human PNP by immucillin-H. Biochem Biophys Res Commun. 2003 Oct 3;309(4):917-22.

(102)

Perspectivas

Uso das estruturas determinadas para simulações de docking

Análise da estrutura de complexos enzima-inibidor Desenvolver ferramentas computacionais para bioinformática estrutural

(103)

Desenvolvimento de softwares para

Bioinformática

(104)

BOURNE, P. E. & WEISSIG, H. Structural Bioinformatics. John Wiley & Sons, Inc. New Jersey, 2003.

LASKOWSKI, R. A., MACARTHUR, M. W., MOSS, D. S., THORNTON, J. M PROCHECK: a program to check the stereochemical quality of protein structures. J. of

Appl. Cryst. 26(2), 283-291, (1993).

LESK, A. M. Introduction to Protein Architecture. Oxford University Press, New York, 2001.

DA SILVEIRA, N. J. F., UCHOA, H. B., PEREIRA, J. H., CANDURI, F., BASSO, L. A., PALMA, M. S., SANTOS, D. S., & DE AZEVEDO, W. F. Jr. Molecular models of protein targets from Mycobacterium tuberculosis. Journal of Molecular Modeling 11, 160-166, 2005

.

UCHOA, H. B., JORGE, G. E., DA SILVEIRA, N. J. F, CAMERA, J. C. Jr., CANDURI, F., DE AZEVEDO, W. F.Biochem. Biophys. Res. Commun. 2004;325(4):1481-1486.