• Nenhum resultado encontrado

Prospecção in silico de compostos bioativos contra malária utilizando modelos de previsão de atividade biológica

N/A
N/A
Protected

Academic year: 2021

Share "Prospecção in silico de compostos bioativos contra malária utilizando modelos de previsão de atividade biológica"

Copied!
115
0
0

Texto

(1)

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

PROGRAMA DE PÓS GRADUAÇÃO EM CIÊNCIAS FARMACÊUTICAS

DESENVOLVIMENTO E AVALIAÇÃO DE MEDICAMENTOS

PROSPECÇÃO IN SILICO DE COMPOSTOS BIOATIVOS CONTRA MALÁRIA UTILIZANDO MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA

NATAL - RN 2016

(2)

CAROLINA ARRUDA BRAZ

PROSPECÇÃO IN SILICO DE COMPOSTOS BIOATIVOS CONTRA MALÁRIA UTILIZANDO MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA.

Dissertação apresentada ao Programa de Pós Graduação em Ciências Farmacêuticas da Universidade Federal do Rio Grande do Norte, como requisito para obtenção do título de mestre em Ciências Farmacêuticas. Área de Concentração: Desenvolvimento e avaliação de Medicamentos

Orientador: Prof. Dr. Euzébio Guimarães Barbosa

NATAL – RN

(3)

CAROLINA ARRUDA BRAZ

PROSPECÇÃO IN SILICO DE COMPOSTOS BIOATIVOS CONTRA MALÁRIA UTILIZANDO MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA

Dissertação apresentada ao Programa de Pós Graduação em Ciências Farmacêuticas da Universidade Federal do Rio Grande do Norte, como requisito para obtenção do título de mestre em Ciências Farmacêuticas, pela Banca examinadora, formada por:

Data de aprovação: ___/___/___

Presidente – Prof. Dr. Euzébio Guimarães Barbosa.

Membro: Prof. Dr. Norberto de Kassio Vieira Monteiro.

(4)

Carolina Arruda Braz.

Prospecção in silico de compostos bioativos contra malária utilizando modelos de previsão de atividade biológica / Carolina Arruda Braz. - Natal, 2016.

115f: il.

Orientador: Prof. Dr. Euzébio Guimarães Barbosa. Dissertação (Mestrado) apresentada ao Programa de Pós-Graduação em Ciências Farmacêuticas. Centro de Ciências da Saúde. Universidade Federal do Rio Grande do Norte.

1. Malária - Dissertação. 2. LQTA-QSAR - Dissertação. 3. Plasmepsina - Dissertação. I. Barbosa, Euzébio Guimarães. II. Título.

(5)
(6)

Agradecimentos

Primeiramente ao meu orientador, o professor Euzébio pelas oportunidades

oferecidas durante o mestrado. Pelos conselhos, parceria e exemplos de postura de pesquisador. Por transferir tanta calma e segurança que o mestrado passou

tranquilo. Que essa parceria possa perdurar por projetos futuros.

Aos meus colegas de laboratório, em especial ao Edjan, pelas ajudas mútuas nos nossos respectivos projetos.

A toda equipe do Programa de Pós Graduação em Ciências Farmacêuticas.

A Sarah e Izadora, minhas amigas, conterrâneas de estágio e Mestrado. Pelas angústias e aperreios compartilhados nessa vida acadêmica.

À minha família, Cristina, Max e in memoriam Alberto, por me acompanhar e acreditar nessa jornada. Ao meus primos, Alberto Wilson, Lucas e Syllyanne e em especial a Laura, por tantas vezes negar essa viagem para Jeriquaquara.

Ao meu querido companheiro Magnus, pela companhia, por se estressar junto comigo durante o processo de escrituras e me convencer sempre que eu consigo entregar os documentos nos prazos.

E aos meus amigos por me aguentarem usar o diploma de cientista pra ganhar discussões científicas (para Débora Sá).

(7)

ÉPIGRAFE

“The nitrogen in our DNA, the calcium in our teeth, the iron in our blood, the carbon in our apple pies were made in the interiors of collapsing stars. We are made of starstuff.” ― Carl Sagan.

(8)

LISTA DE FIGURAS

Figura 1 Número de casos confirmados de malária mundialmente em 2014.

Figura 2 Casos confirmados de malária no Brasil em 2014

Figura 3 Ciclo de vida do Plasmodium no homem e mosquito.

Figura 4 Rota geral do metabolismo da hemoglobina no P. falciparum

Figura 5 Principais fármacos utilizados no tratamento da malaria

Figura 6 Representação de uma caixa cúbica utilizada para calcular descritores MIF. A sonda utilizada para calcular as energias de interação está no canto superior esquerdo.

Figura 7 Funcionamento esquemático do OPS.

Figura 8 Exemplo de exibição espacial de descritores para a metodologia LQTA e CoMFA. a) Representação descritores LJ e QQ em esferas. b) Mapas de contorno obtidos por CoMFA

Figura 9 Mecanismo da quebra da ligação peptídica feita pelas proteases aspárticas.

Figura 10 Estrutura cristalográfica da Plasmepsina.II.

Figura 11 Inibidores peptidiomiméticos das plasmepsinas.

Figura 12 Pepstatina A e alofenilnorstatina.

Figura 13 Estrutura cristalina da Plasmepsina II (4CKU).

Figura 14 Estrutura química do Composto 33.

Figura 15 Etapas dos filtros virtuais .

Figura 16 Farmacóforo característico da série de compostos utilizada na construção do modelo LQTA-QSAR. Anel de cinco membros tiazolidina e os locais de possíveis substituições (R1, R2, R3 e R4)

Figura 17 Dendograma referente à análise de grupamentos hierárquicos para o conjunto de dados (a numeração dos compostos não corresponde a numeração referente a tabela).

Figura 18 Alinhamento das melhores conformações obtidas pelo processo de docagem automatizado.

Figura 19 Sitio ativo da Plm II com o Composto 33 (roxo) e ligante natural do cristal (azul).

Figura 20 Composto 33 após adaptação do sítio ativo.

(9)

Figura 22 Resultado do filtro virtual referente ao tratamento dos descritores de LJ.

Figura 23 Resultados dos testes de validação LNO e y-randomization e a qualidade de previsão do modelo.

Figura 24 Visualização dos descritores no sitio ativo da proteína.

Figura 25 Representação gráfica dos descritores do modelo final. Visões com os compostos 33 (a) e 25 (b).

Figura 26 Composto 39 (pKi: 9,6), mais potente, em cinza e 27 (pki: 4,89) em laranja.

Figura 27 Orientação do anel tiazolidina. Composto 33 (pki: 7,69) e 30 (pki: 5,03). Figura 28 Mapas de contorno obtidos por Muthas (MUTHAS et al., 2005). A região

S1’ está assinalada pelo mapa verde, que representa região estérica favorável para presença de grupos volumosos.

Figura 29 Composto 39 (azul) com pKi: 9,7 e 25 (verde), pKi: 4,02. Em roxo os resíduos de aminoácidos próximos aos descritores.

Figura 30 Composto 30 (verde) e 7 (vermelho) representando o pior e melhor perfil para descritor QQ7.

Figura 31 A) Descritor QQ4 relacionado com substituintes alifáticos e cíclicos. Compostos mais potente, 33 (roxo) com pKi de 7,69 e menos potente, 25 (azul) com pki de 4,01 foram usados como exemplo. B) Contribuição de interações eletronegativas negativas. Composto 9 em azul de pKi: 9,31 e 18, marrom de pKi: 6,14.

Figura 32 Esquema de interação das alofenilnorstatinas de acordo com o modelo LQTA. Em vermelho, as regiões do sitio ativo da Plm II que cada porção do inibidor interage.

(10)

LISTA DE TABELAS

Tabela 1. Candidatos a fármacos em estudos clínicos durante o ano de 2014 Tabela 2. Parâmetros estatísticos básicos para modelos de regressão

Tabela 3. Lista dos principais resíduos de aminoácidos e suas regiões respectivas no sitio ativo da Plm II

Tabela 4. Conjunto de dados retirados da literatura

Tabela 5 Números de descritores iniciais e após casa processo de filtragem virtual.

(11)

LISTA DE ABREVIATURAS E SIGLAS

1D Unidimensional

2D Bidimensional ou Segunda dimensão 3D Tridimensional ou Terceira dimensão 4D Tetradimensional ou Quarta dimensão

AM1-BCC Austin Model 1 with simple additive bond charge corrections. Método de cargas atômicas baseado no potencial eletrostático.

AMBER Nome do campo de força para o programa AMBER. Asp Resíduo de Ácido Aspártico

CDDA Comparative Distribuition Algoritm, Algoritmo de distribuição comparativa.

CoMFA Comparative Molecular Field Analisys

Da Dalton

DHFR Diidrofolato Redutase DHPS Diidropteroato Sintetase DPAP I Dipeptil Aminopeptidases FDA Food Drug Administration

Hb Hemoglobina

Ile Resíduo de Isoleucina Leu Resíduo de Leucina

LJ Descritores Potencial de Lennard Jones LOO Leave-one-out

LQTA Laboratório de Quimiometria Teórica e Aplicada LNO Validação Cruzada - Leave-N-Out

MD Dinâmica Molecular

MIF Campos de Interação Molecular - Molecular Interaction Field N Número de Amostras

OMS Organização Mundial da Saúde OPS Seleção de Preditores Ordenados.

PDB Bando de Dados de Proteinas – Protein Data Bank PFCRT Plasmodium falciparum cloroquine resistance transporter PFMDRI Plasmodium falciparum multidrug resistance I

(12)

Plm Plasmepsina. Plm II Plasmepsina II.

PLS Regressão por Mínimos Quadrados Parciais - Partial Least-Squares. Q² Coeficiente de Correlação de Validação Cruzada.

QQ Descritores calculados com o potencial de Coulomb.

QSAR Relação Quantitativa Estrutura Atividade - Quantitative Structure Activity Relationship.

R² Coeficiente de Correlação de Determinação Múltipla. SBDS Structure-based Drug Design.

SEC Erro Padrão de Calibração - Standart Error of Calibration.

SEV Erro Pardrão de Validação Cruzada - Standart error of validation. SUS Sistema Universal de Saúde.

Tyr Resíduo de Tirosina. VDW Van der Waals

(13)

RESUMO

Estratégias de planejamento de fármacos auxiliadas por computador utiliza-se de técnicas computacionais para auxiliar o descobrimento de novos fármacos. Economizando custos e agilizando o processo de pesquisa e desenvolvimento, além de poder processar uma quantidade grande de dados. A utilização da técnica do LQTA-QSAR permite a criação de modelos de previsão de atividade biológica capazes de sugerir estruturas inéditas sem a real necessidade de execução de teste de atividade biológica in vitro ou in vivo. A malária é uma doença causada pelo parasito do gênero Plasmodium e afeta principalmente as regiões da África e América Latina. Estima-se que em 2014 ocorreram 214 milhões de caso de malária e 438 mil de mortes de acordo com a Organização Mundial de Saúde. A enzima Plasmepsina II é responsável pela clivagem inicial da hemoglobina e é um alvo validado para o planejamento de novos agentes antimaláricos. O objetivo geral desse trabalho foi desenvolver um modelo de previsão de atividade biológica baseado na relação estrutura atividade de compostos inibidores da Plasmepsina II que possuem um núcleo derivado de alofenilnostatinas. Foi criado um modelo de previsão com 37 amostras. O modelo PLS apresentou um Q² = 0,92 e R² = 0,95 com 10 variáveis e 2 variáveis latentes. O modelo apresentou bons parâmetros estatísticos e boa capacidade preditiva (Q² ext = 0,79) Os descritores também estão corroboram com a interação dos inibidores com sítio receptor da Plm II. Os dados obtidos servem como guia para o planejamento de novos antimaláricos com maior potência.

(14)

ABSTRACT

Strategies for drug design aided by computer uses of computational techniques for guidance on the discovery of new drugs. Saving costs and speeding the process of research and development, besides it being able to process a big volume data. The utilization of LQTA-QSAR allows the creation of predicting models of biological activity able to propose novel compounds without the real necessity of in vitro biological activity essays. Malaria is a disease caused by the parasite from genre Plasmodium and affects mainly the Africa and Latin America regions. It is estimated that in 2014 it happened 214 million cases of malaria and 438 thousand cases of death according to World Health Organization. Plasmepsin II is responsible for the metabolism of hemoglobin and it is a valid target for the development of new antimalarial agents. The general objective of this work is to develop a predictive model of biological activity based on the structure of Plasmepsin II inhibitors derivate from allophenylnorstatine. A model was built with 37 samples, Q² = 0.92 and R² = 0.95 with 10 variables and 2 latent variables. The model present good statistical parameters and good predicting ability (Q²ext=0.79). The descriptors could be well correlated to ligand-Plm II interactions. The data obtained serves as guides to the design of new optimized antimalarial agents.

(15)

SUMÁRIO

1. INTRODUÇÃO ...17 1.1 MALÁRIA... 17 1.1.1 Aspectos Epidemiológicos. ... 17 1.1.2 Ciclo evolutivo ... 19 1.1.2.1 Degradação da hemoglobina. ...22

1.1.3 Tratamento / Quimioterapia e Resistência. ... 23

1.1.4 Resistência ... 27

1.2 DESCOBERTA DE FÁRMACOS... 28

1.2.1 Ferramentas computacionais para o desenvolvimento de fármaco... 28

1.2.2 QSAR-4D ... 30

1.2.3 Descritores moleculares de interação. ... 32

1.2.4 Validação dos modelos de LQTA-QSAR ... 34

1.3 APLICAÇÃO DO LQTA-QSAR PARA ALVOS E INIBIDORES DE PROTEÍNA DE P. FALCIPARUM ... 36

1.3.1 Plasmepsina II do Plasmodium falciparum. ... 36

1.3.2 Inibidores da Plasmepsina II : alofenilnorstatinas. ... 39

2 OBJETIVOS ...42 2.1 OBJETIVOS ESPECÍFICOS ... 42 3 MATERIAL E MÉTODOS ...43 3.1 MATERIAL ... 43 3.1.1 Computadores. ... 43 3.1.2 Conjunto de dados ... 43 3.1.3 Receptor ... 43 3.2 METODOLOGIA ... 44

3.2.1 Padronização do conjunto de dados e preparo das estruturas tridimensionais. ... 44

3.2.2 Adaptação do sítio ativo ... 45

3.2.3 Dinâmica molecular ... 46

3.2.4 Geração do modelo 4D LQTA-QSAR ... 46

3.2.4.1 Filtros virtuais ...47

3.2.4.2 Seleção de variáveis ...48

3.2.5 Validação do modelo ... 48

3.2.5.1 Leave-N-out e y-randomization ...49

4 RESULTADOS E DISCUSSÕES. ...50

4.1 CARACTERIZAÇÃO DO CONJUNTO DE DADOS. ... 50

4.2 DIVISÃO DO CONJUNTO DE DADOS PARA A CONSTRUÇÃO DO MODELO LQTA-QSAR ... 56

(16)

4.4 4DLQTA-QSAR ... 61

4.5 INTERPRETAÇÃO DOS DESCRITORES. ... 64

5 CONCLUSÕES E PERSPECTIVAS. ...74

6 REFERÊNCIAS ...75

7 ANEXOS ...88

7.1 ANEXO 1.SCRIPT PARA TRATAR A MATRIZ DE DESCRITORES DO OPEN3DQSAR ... 88

7.2 ANEXO 2.SCRIPT REALIZADO PARA A REALIZAÇÃO DOS FILTROS VIRTUAIS NO MATLAB. ... 88

7.3 ANEXO 3.TABELA COM A REGRESSÃO PLS PARA O MELHOR MODELO 4DLQTA-QSAR ... 90

7.4 ANEXO 4.ARQUIVO PDB DAS COORDENADAS DOS DESCRITORES. ... 92

(17)

1. INTRODUÇÃO

1.1 Malária.

Os agentes etiológicos da malária são protozoários eucariotos unicelulares pertencentes ao filo Apicomplexa, da família Plasmodiidae e ao gênero Plasmodium, onde as espécies P. falciparum, P. vivax, P. malariae, e P. ovale são conhecidas por causarem a doença. A malária é transmitida pela picada da fêmea do mosquito

Anopheles, compartilhamento de agulhas e seringas infectadas, transfusão de

sangue, ou da gestante para o bebê antes ou durante o parto. Os principais sinais clínicos são febre alta, calafrio, sudorese e cefaleia (MINISTÉRIO DA SAÚDE, 2010).

Apesar de na maioria dos casos a malária não apresentar um risco à vida, sua manifestação em mulheres grávidas e crianças é de extremo perigo. A espécie P.

falciparum é a mais virulenta das formas de malária humana e é o principal causador

de casos relatados de mortes em crianças, além de ser a única capaz de evoluir para malária cerebral (SNOW; KORENROMP; GOUWS, 2004).

A resistência crescente à terapia atual (WHITE et al., 1999) e enquadramento da malária como uma doença negligenciada (BRASIL, 2008) denota a importância na pesquisa em inovação para o planejamento de novos candidatos as fármacos antimaláricos. De fato, as técnicas de modelagem molecular vem demonstrando um papel importante na descoberta de candidatos a fármacos antimaláricos (BARMADE et al., 2015).

O custo de realização desse tipo de projeto é puramente computacional, e por isso, bastante reduzido e seus resultados podem minimizar despesas desnecessárias na síntese dos compostos ativos. O uso de altos níveis da teoria quântica molecular é mínimo nesse tipo de estudo, barateando ainda mais o custo computacional por molécula investigada nos estudos QSAR. Dessa forma, com estações de trabalho, embora modestas, gera-se em tempo hábil resultados empíricos que podem ser utilizados diretamente na triagem de novos compostos bem como na proposição de estruturas químicas com possível atividade in vitro e in vivo.

1.1.1 Aspectos Epidemiológicos.

De acordo com a OMS (Organização Mundial da Saúde) a malária é uma doença que põe em risco cerca de 3,2 bilhões de pessoas – quase metade da população mundial. Estima-se que em 2015 ocorreram 214 milhões de casos de malária e 438

(18)

mil mortes. Felizmente, este é um número decrescente, nos últimos 15 anos a incidência de casos de malária diminuiu 37% mundialmente. Os casos de morte, também no mesmo período, diminuíram 60% em todas as idades. A África continua sendo a região de maior incidência, com 89% dos casos mundiais (Figura 1). Apesar da maioria dos casos se concentrarem na África, também há grande incidência de casos de malária na Ásia, América Latina e parte do Oriente Médio (DALRYMPLE; MAPPIN; GETHING, 2015; WHO, 2015).

Figura 1. Número de casos confirmados de malária em 2014.

Fonte: Global Malaria Mapper (Disponível em: < http://www.worldmalariareport.org>).

Para região da América Latina a quantidade de casos confirmados de malária diminuiu de 1,2 milhões de casos no ano de 2000 para 390 mil casos em 2014. Ainda no ano de 2014, foi reportado somente 79 casos de morte por malária, uma diminuição de 80% dos casos quando comparados com os últimos 14 anos. O Brasil contabiliza quase metade dos casos de mortes na região (WHO, 2015).

A malária transmitida através da picada de fêmeas do mosquito Anopheles spp. Existem cerca de 400 espécies de Anopheles no mundo, onde somente 60 são possíveis vetores da malária e destes, 30 de maior importância epidemiológica. Nas

(19)

Américas, ocorrem principalmente as espécies Anopheles darlingi, Anopheles

aquasalis, Anopheles albimanus e Anopheles pseudopunctipennis. No Brasil, o

principal vetor é o A. darlingi (REY, 2011).

No Brasil, 99% dos casos de malária estão restritos à Amazônia Legal (Figura 2), totalizando cerca de 310 mil novos casos por ano, quase todos os casos s causados pelo P. vivax (OLIVEIRA-FERREIRA et al., 2010). Apesar da baixa incidência, quando comparada ao continente africano, o quadro endêmico nesta região representa gastos substanciais para o Sistema Único de Saúde (SUS), chegando a aproximadamente US$ 72 milhões apenas em 2014 (WHO, 2015).

Na Amazônia, a diminuição da incidência de casos por P. falciparum está correlacionada a melhoras no diagnóstico. É provável também que a adição da associação arterméter + lumefantrina à terapia no estado de Manaus e outros municípios também contribuiu para a diminuição da incidência do P. falciparum. O crescimento do número de casos de P.vivax pode ser explicado pela compensação de comorbidades aguda ou crônica da malária (SAMPAIO et al., 2015).

Figura 2. Casos confirmados de malária no Brasil em 2014.

Fonte: adaptado de (WHO,2015). 1.1.2 Ciclo evolutivo

O Plasmodium possui um ciclo biológico complexo, dividido em três etapas: ciclo hepático, ciclo eritrocitário e ciclo esporocogônico. O seu desenvolvimento ocorre envolvendo um hospedeiro invertebrado (Anopheles) nas fases sexuadas e um hospedeiro vertebrado no ciclo assexuado. O processo evolutivo do parasita requer a expressão de proteínas, importantes para sua sobrevivência tanto no hospedeiro invertebrado como vertebrado. (TUTEJA, 2007). A Figura 3 (próxima página) apresenta as etapas envolvidas no ciclo de vida do Plasmodium spp.

(20)

Os esporozoítos (forma infectante), localizados nas glândulas salivares do mosquito Anopheles, são inoculados no hospedeiro vertebrado durante a picada do mosquito. Estas formas alcançam as células hepáticas em média de 30 a 60 minutos após a picada (REY, 2013; TUTEJA, 2007). Antes que ocorra a infecção dos hepatócitos, há a possibilidade dessas formas entrarem em diferentes células, sem que ocorra o desenvolvimento. Os esporozoítos apresentam motilidade graças a reorientação de proteínas de superfícies e de proteínas adesivas, que são essenciais para invasão das células hospedeiras (BRAGA; FONTES, 2005; MOTA et al., 2001).

Os esporozoítos transformam-se em criptozoítos, que são estruturas arredondadas que crescem e iniciam o ciclo de reprodução assexuada. Após numerosas divisões nucleares passa a constituir um esquizonte. No P. falciparum, a fase esquizogonia pré-eritrocítica dura 6 dias, enquanto que em P. vivax dura 8 dias. Essa é a primeira fase do ciclo, denominada exoeritrocítica, antecedendo o ciclo sanguíneo (REY, 2013).

Em infecções causadas por P. falciparum e P. malariae, os esquizontes se rompem todos ao mesmo tempo e não persistem no interior dos hepatócitos. Já no P.

ovale e no P. vivax, algumas formas exo eritrocı́ticas, denominadas hipnozoı́tas

permanecem latentes no fígado, e parecem ser responsáveis pelas recidivas tardias da doença (BRAGA; FONTES, 2005).

O ciclo eritrocítico se inicia quando os esquizontes localizados nas células hepáticas dão origem aos merozoítos, que são liberados após o rompimento da célula parasitada. Os merozoítos invadem as hemácias iniciando ciclo eritrocítico, onde se desenvolvem e multiplicam por divisão binária até romperem a célula e serem liberados na corrente sanguínea para infectar novamente outras hemácias (REY, 2013). Para o P. falciparum o ciclo sanguíneo se repete a cada 48 horas (NEVES, 2005).

(21)

Fonte: adaptado de (ERSMARK; SAMUELSSON; HALLBERG, 2006)

Os merozoítos podem também se diferenciar em estágios sexuados, gametócitos femininos (macrogametócitos) e masculinos (microgametócitos) que irão dar início ao ciclo sexuado (esporogônico) no vetor. O inseto, após se alimentar de sangue infectado pode ingerir esses gametócitos. Estes gametas se fundem e formam um zigoto. O zigoto se diferencia em oocineto, que por sua vez migra até o intestino do inseto e dá origem a um oocisto. O oocisto maduro libera estes esporozoítos que

(22)

migram para as glândulas salivares, podendo infectar outros seres humanos. Retomando assim, o ciclo (DOUGLAS et al., 2015; TUTEJA, 2007).

O período de incubação da doença varia de 7 a 14 dias, podendo, contudo, chegar a vários meses devido às formas latentes de P. vivax e P. malariae. A crise aguda caracteriza-se por episódios de febre, calafrios, tosse, dificuldade respiratória, dor nas articulações, dor de cabeça, diarreia, vômitos e convulsões. Os intervalos entre as febres acompanham os ciclos repetidos de obstrução dos eritrócitos, repetindo-se a cada 48 horas para infecções por P. vivax e P. falciparum e de 72 horas para infecções causadas pelos demais parasitos (TUTEJA, 2007).

A gravidade do quadro clínico da malária depende da espécie do parasito, da quantidade de parasitos circulantes, do tempo de doença e do nível de imunidade adquirida pelo paciente. O P. falciparum está sempre associado a quadros graves, acarretando em complicações clínicas como icterícia, insuficiência renal, anemia grave e obstrução dos capilares que levam sangue ao cérebro (SNOW; KORENROMP; GOUWS, 2004; TUTEJA, 2007).

1.1.2.1 Degradação da hemoglobina.

O parasita degrada a hemoglobina (Hb) nas células eritrocíticas do hospedeiro durante fases morfológicas distintas do seu ciclo evolutivo (esquizonte e trofozoíta). A atividade metabólica varia muito entre as fases e é mais intensa durante o estágio trofozoita (GOLDBERG, 1993). A hemoglobina, uma proteína tetramérica com ~64k Da, é metabolizada pelas enzimas do parasito. Esses aminoácidos obtidos da metabolização são utilizados para biossíntese de proteínas do próprio Plasmodium. Ajudando a manter a osmolaridade intracelular durante esta fase de crescimento intenso (MOURA; DAME; FIDOCK, 2009).

O P.falciparum digere mais de 80% da hemoglobina do eritrócito, para nutrir o parasito durante sua fase de crescimento e replicação assexuada na fase eritrocítica. (LAZARUS; SCHNEIDER; TARASCHI, 2008). A degradação da hemoglobina ocorre via proteases dentro do vacúolo digestivo do parasita e a sua internalização ocorre por meio do citostoma, uma invaginação da membrana externa do vacúolo (MILANI; SCHNEIDER; TARASCHI, 2015). A hematina livre é potencialmente tóxica tanto para o parasito quanto seu hospedeiro, devido a sua atividade membranotropica. Para bloquear essa toxicidade o Plasmodium sequestra a hematina na forma do pigmento malárico cristalizado e insolúvel, hemozoina (AZOUZI; EL KIRAT; MORANDAT,

(23)

2015). Fármacos como cloroquina, se acumulam no vacúolo digestivo e interferem neste processo (SCHOLL; TRIPATHI; SULLIVAN, 2005). As quinolinas agem interferindo no processo de transformação da hematina (GOLDBERG, 1993).

O processo de degradação apresenta uma cascata ordenada de reações (Figura 4). Várias enzimas são atribuídas ao processo de degradação, no P. falciparm são as proteases aspárticas (Plasmepsinas (Plm) – I, II, IV e HAP), falcipainas, metaloproteases (falcilisina) e dipeptil aminopeptidases (DPAP 1). A clivagem inicial se dá nos resíduos Phe33 e Leu34 na cadeia A da hemoglobina, região do domínio responsável por manter a estabilidade da estrutura quaternária. A clivagem subsequente da Hb em peptídeos menores é realizada pelas proteases plasmepsinas e falcipainas. Esses peptídeos menores são então clivados pela falcilisina, DPAP 1 e aminopeptidases formando os aminoácidos que são aproveitados pelo Plasmodium. (ERSMARK; SAMUELSSON; HALLBERG, 2006).

Figura 4. Rota geral do metabolismo da hemoglobina no P. falciparum.

Fonte: adaptado de (ERSMARK, 2006).

1.1.3 Tratamento / Quimioterapia e Resistência.

O tratamento da malária deve tanto prevenir a ocorrência de casos graves quanto eliminar fontes de infecção para os mosquitos. Tratamento e diagnóstico adequado tem grande contribuição para redução e erradicação da doença, mas

(24)

enfrentam grandes dificuldades frente a não existência de uma única terapia eficaz contra as quatro espécies parasitárias que infectam o ser humano. Além da crescente resistência do P. falciparum aos esquemas terapêuticos utilizados (BRASIL, 2010).

A conduta terapêutica na utilização dos fármacos antimaláricos deve levar em consideração a tolerância, segurança e tratamento com regimes de curta duração. Atualmente se preconiza o uso de associações entre antimaláricos com mecanismos de ação distintos, tornando o tratamento mais efetivo e evitando a expansão dos casos de resistência (GINER ALMARAZ et al., 2010; PETERSEN; EASTMAN; LANZER, 2011).

Os fármacos antimaláricos são compostos naturais ou sintéticos. Os antimaláricos eritrocíticos atuam nas formas presentes nas células sanguíneas do homem enquanto que os antimaláricos gametocíticos atuam nas formas sexuadas do parasita no individuo, com o intuito de evitar a disseminação da doença caso o indivíduo seja picado (GRIMBERG; MEHLOTRA, 2011). Grande parte dos fármacos utilizados na rotina como antimaláricos são denominados esquizonticidas sanguíneos, porque apresentam ação sobre os estágios assexuados sanguíneos do parasita responsáveis pelas manifestações clínicas (BIAMONTE; WANNER; LE ROCH, 2013; PRAZERES et al., 2007).

Os medicamentos antimaláricos podem ser classificados de acordo com seu grupo químico (Figura 5) : 4-aminoquinolinas (cloroquina e amodiaquina), aril-aminoálcoois (quinina, mefloquina, halofantrina e lumefantrina), 8-aminoquinolinas (primaquina), peróxido de lactona sesquiterpênica (derivados da artemisinina), naftoquinonas (atovaquona) e os antibióticos (tetraciclina, doxiciclina e clindamicina)(BRASIL, 2010). A primeira terapia amplamente utilizada para as quatro espécies do parasita que causam a malária foi a quinina e seus derivados sintéticos, desde o século XVII. Na segunda metade do século XX, a cloroquinolona foi utilizada como medicamento de primeira linha para o tratamento das quatro espécies de Plasmodium e uma combinação de sulfadoxina e pirimetamina como tratamento de segunda escolha (WELLS; ALONSO; GUTTERIDGE, 2009).

No Brasil, o esquema terapêutico para casos não complicados de malária são realizado com cloroquina e primaquina, para infecções pelo P. falciparum usa-se a combinação de artemeter+lumefantrina e artesunato+mefloquina e o tratamento de segunda escolha é realizado com quinina, doxiclina e primaquina (BRASIL, 2010). Comumente, a terapia da malária é utilizada em associação com outros

(25)

quimioterápicos, como sulfonamidas (sulfadoxina), tetraciclinas (tetraciclina, doxicilina) e lincosaminas (clindamicina e lincomicina), mas o seu uso apresenta inconvenientes como administração de regimes complexos e rígidos e muitos efeitos colaterais. O que contribui para interrupção do tratamento e o consequente desenvolvimento de resistência do parasita (PIMENTEL et al., 2007).

(26)

Fonte: elaborado pelo autor

O aparecimento de cepas multirresistentes aos fármacos antimaláricos disponíveis tem impulsionado a pesquisa de novos fármacos. A Tabela 1 ilustra os principais candidatos a fármacos em fase clínica de desenvolvimento no ano de 2014.

(27)

É possível observar que a maioria dos candidatos são novas associações de medicamentos, ou mudança de formulação, ou adequação de doses para pacientes pediátricos (MMV, 2014) ou reproposição de outras terapias (KUNDU et al., 2015).O que não sana a real necessidade apontada pelo surgimento de cepas resistentes a maioria das terapias atuais, que é o planejamento e desenvolvimento de novas moléculas.

Tabela 1. Candidatos a fármacos em estudos clínicos durante o ano de 2014.

Fase I Fase II Fase III Fase IV Registro

DSM 265 (Takeda) OZ439/PQ (Sanofi) Tafenoquina (GSK) Artesunato retal Artesunato injetável (Guilin) MMV 048 (UCT/TIA) Ferroquina (Sanofi Aventis ) co-trimoxazol( in stituto Medicina Tropical) Pironaridina/Ar tesunato pediátrico (Shin Poong) ACT (Sigma – Tau) P218 (Novatis ) KAE609 ( Novartis ) ASAQ (Sanofi Aventis/DNDi) GSK030 (GSK) KAF156 ( Novartis) Pironaridina/Art esunato (Shin Poong) Fonte: adaptado de (MMV, 2014). 1.1.4 Resistência

A partir da década de 90 estudos já apontavam para a resistência global à múltiplos fármacos pelo P.falciparum nos casos agudos de malária (WHITE et al., 1999). Terapias combinadas a base de artemisinina são utilizadas atualmente nos programas de controle globais em resposta a resistência do P .falciparum (MAZIER; RÉNIA; SNOUNOU, 2009). A descoberta de parasitas com diminuição da sensibilidade a artemisinina (WELLS, 2010), os efeitos colaterais da atual terapia medicamentosa e a ausência de vacinas efetivas (HOFFMAN et al., 2015; LONGLEY; HILL; SPENCER, 2015; RICHIE; SAUL, 2002) denotam a necessidade da busca por novos alvos terapêuticos e do desenvolvimento de uma nova geração de fármacos

(28)

para o tratamento, controle e erradicação da malária (WELLS; VAN HUIJSDUIJNEN; VAN VOORHIS, 2015).

O principal mecanismo de resistência à cloroquina está relacionado com mutações no gene Plasmodium falciparum cloroquine resistance transporter (PFCRT), que permite alterações nos transportadores de membrana. Polimorfismo no gene

Plasmodium falciparum multidrug resistance I (PFMDRI) estão relacionados a

resistência a quinina e mefloquina. Mutações no gene Citocromo b conferem resistência a atovaquona, que acarretam em mutações no sitio ativo da enzima alvo, diminuindo a afinidade de ligação do fármaco (ARAV-BOGER; SHAPIRO, 2005) . Mutações nos genes das enzimas diidrofolato redutase (DHFR) e diidropteroato sintetase (DHPS) estão associados a resistência a pirimetamina e sulfadoxina, respectivamente, para o P.falciparum (BASCO; RINGWALD, 1998). A resistência a artemisinina está relacionada a uma maior expressão do gene PFMDR I (AFONSO et al., 2006) e a resistência ao artesunato está relacionada a uma mutação no gene da ubiquitina (HUNT et al., 2007).

1.2 Descoberta de Fármacos.

A descoberta e o desenvolvimento de fármacos pode ser dividida em três fases. A fase de descoberta, na qual ocorre a identificação e validação do alvo, desenvolvimento de ensaios, identificação e otimização de compostos protótipos e seleção de candidatos a fármacos. Fase de estudos pré-clínicos, onde são executados estudos extensos em animais. Fase de desenvolvimento clínico: durante a qual o composto selecionado é testado quanto à eficácia, efeitos colaterais e riscos potenciais em humanos (NWAKA; RIDLEY, 2003). O processo de pesquisa e desenvolvimento de fármacos, então, consiste e uma etapa de descoberta (pesquisa) e desenvolvimento (ensaios pré-clínicos e clínicos) (ELEBRING; GILL; PLOWRIGHT, 2012).

1.2.1 Ferramentas computacionais para o desenvolvimento de fármaco.

O planejamento de novos candidatos a agentes terapêuticos e otimização destes pode ser obtido por diferentes estratégias da Química Medicinal. A escolha da estratégia a ser adotada depende da elucidação da estrutura do alvo (BARREIRO, 2009). A utilização de métodos computacionais no processo de pesquisa e

(29)

desenvolvimento de novos fármacos é uma área de destaque nos últimos anos. O conhecimento das estruturas de alvos macromoleculares ou de complexos ligante-receptor permite a aplicação de estratégias de planejamento de fármacos baseado na estrutura (SBDD - Structure-based Drug Design) (COHEN, 1996).

Pela exploração de bancos de dados que compilam informações sobre testes biológicos em alvos proteicos podem ser construídos modelos de previsão da atividade biológica a partir da relação quantitativa da atividade destes compostos com a sua estrutura, QSAR (Quantitative Structure-Activity Relationship) (VERMA; KHEDKAR; COUTINHO, 2010). A metodologia de QSAR foi inicialmente estabelecida na década de 1960, pelos trabalhos de Hansch e Fujita (HANSCH; FUJITA, 1964). O QSAR desempenha um papel vital no design de novos fármacos, já que se trata de uma metodologia que permite um custo baixo, processamento rápido e diminuição da quantidade de amostras in vitro geralmente envolvidas (PATEL et al., 2014).

O objetivo do estudo QSAR é a criação de modelos capazes de prever a atividade ou propriedade e explicar as relações entre características estruturais específicas (descritores moleculares) e atividade biológica ou propriedade. Métodos estes que já se tornaram uma parte essencial do desenvolvimento de novas moléculas na atualidade. Atualmente, nenhum fármaco é criado sem a análise por QSAR (ANDRADE et al., 2010).

Métodos de QSAR são classificados de acordo com a dimensionalidade dos descritores utilizados, estabelecendo quantitativamente a correlação entre propriedades da estrutura química das moléculas e a atividade biológica. Assim, são desenvolvidos modelos matemáticos capazes de prever a atividade biológica de moléculas, através de um conjunto de dados (HANSCH; FUJITA, 1964).

Diferentes tipos de descritores químicos refletem diferentes níveis de representação estrutural. Esses descritores podem ser classificados quanto à sua “dimensionalidade”: unidimensionais (1D), baseados em propriedades físico-químicas e da fórmula molecular (ex., massa molecular, refratividade molar, logP, entre outros); bidimensionais (2D), que descrevem propriedades que podem ser calculadas de uma representação 2D (ex., número de átomos, número de ligações, índices de conectividade, entre outros); e tridimensionais (3D), que dependem da conformação das moléculas (ex., volume de Van der Waals, área de superfície acessível ao solvente, entre outros) (XUE; BAJORATH, 2000).

(30)

1.2.2 QSAR-4D

A análise de QSAR-4D, proposta inicialmente por Hopfinger e colaboradores (HOPFINGER et al., 1997) incorpora a liberdade conformacional com o alinhamento para o desenvolvimento de modelos QSAR-3D levando em conta, então uma quarta dimensão para os descritores moleculares. Nessa abordagem, os valores dos descritores são as ocupações medidas para os átomos que compõe as moléculas do conjunto investigado a partir da amostragem de conformação e do espaço de alinhamento (ANDRADE et al., 2010).

Uma nova abordagem de QSAR-4D, desenvolvida pelo grupo Laboratório de Quimiometria Teórica e Aplicada (LQTA – Unicamp) é baseado na geração de um perfil de amostragem conformacional para cada composto. Ao invés de somente uma conformação seguindo os princípios do QSAR-3D (KUBINYI, 1997). Esse perfil conformacional é seguido para os cálculos de descritores 3D (MIFF - Molecular

Interaction Fields ou descritores de interação molecular).

Essa metodologia contempla simultaneamente, as principais características do método CoMFA (Comparative Molecular Field Analisys). Técnica desenvolvida por Cramer que demonstra que a propriedade biológica dos compostos pode ser correlacionada com as energias do potencial de Lennard Jones e eletrostáticas (descritores MIF) provenientes das interações formadas com o ligante no sítio ativo do alvo biológico (CRAMER; PATTERSON; BUNCE, 1988) e o QSAR-4D (HOPFINGER et al., 1997).

Essas metodologias de QSAR-3D e 4D apresentam alguns problemas. No QSAR-3D realizado pelo CoMFA, o fato da conformação bioativa não ser conhecida acarreta ao usuário fazer a escolha de uma única conformação para cada molécula (geralmente a conformação bioativa). Em QSAR-4D a ausência dos descritores de interação dificultam a interpretação dos modelos obtidos (GHASEMI; SAFAVI-SOHI; BARBOSA, 2012). Aliás, não existe programas livres que possibilite a geração de descritores para essas duas metodologias. Existe uma versão gratuita do programa, Open3DQSAR (TOSCO; BALLE, 2011), mas para utilizar o CoMFA é necessário adquirir a versão do programa pago. Para usar o QSAR-4D, é necessário adquirir uma licença colaborativa com o grupo do Hopfinger.

O LQTA-QSAR faz uso do pacote livre GROMACS (VAN DER SPOEL et al., 2005) para calcular as simulações de dinâmicas moleculares (MD) e estimar o perfil conformacional gerado. As simulações de MD podem ser desenvolvidas considerando

(31)

moléculas de solvente explicito, que gera aproximações biológicas mais precisas (mas aumenta o custo computacional) ou com solvente implícito, menos dispendioso.

O programa open3DQSAR gera ao redor do alinhamento de todas as estruturas uma caixa virtual cúbica (grid) (Figura 6). A energia de interação para cada tipo de campo de interação molecular (descritores LJ e QQ) são calculadas por meio da distância de uma sonda para cada ponto do grid (PATEL et al., 2014; TOSCO; BALLE, 2011).

A geração de descritores MIFF pelas metodologias de QSAR 3D geram uma quantidade exorbitante de descritores. O número total de variáveis disponíveis é muito maior do que o número que será efetivamente incluído nos modelos, incluindo ruído e informações redundantes ou irrelevantes (TEÓFILO; MARTINS; FERREIRA, 2009a). O objetivo da seleção de variáveis é diminuir o volume de processamento de data e melhorar a performance preditiva do modelo(ARAKAWA; HASEGAWA; FUNATSU, 2007; GONZÁLEZ et al., 2008).

Figura 6. Representação de uma caixa cúbica utilizada para calcular descritores MIF. A sonda utilizada para calcular as energias de interação está no canto superior esquerdo.

Fonte: (RONCAGLIONI; BENFENATI, 2008).

O algoritmo de seleção de preditores ordenados (OPS) (TEÓFILO; MARTINS; FERREIRA, 2009a) foi desenvolvido para realizar esta seleção das variáveis. A seleção com algoritmo OPS é realizada através do programa QSARModelling (Disponível em: < http://lqta.iqm.unicamp.br/programasOPS.html>) (MARTINS et al.,

(32)

2009). A regressão multivariada para construir o modelo é feita com o método de PLS (partial least squares).

O OPS visa melhorar a qualidade dos modelos de regressão, removendo descritores que possuem baixa capacidade de prever a atividade biológica. Para isso é feito um ordenamento dos descritores utilizando um vetor informativo. Esse vetor informativo pode ser a correlação destes descritores com a atividade biológica, ou mesmo os valores de regressão multivariada (vetor de regressão do PLS). Os modelos são construídos com um determinado número de descritores (janela inicial) e posteriormente tal janela é aumentada de um incremento fixo até que todas os descritores ou uma porcentagem do total sejam adicionadas a esta. O conjunto de variáveis que apresentarem os melhores parâmetros de qualidade contém as variáveis que apresentam a melhor capacidade de previsão para o modelo construído e, portanto, são estas as variáveis selecionadas (TEÓFILO; MARTINS; FERREIRA, 2009a). A Figura 7 mostra um esquema do algoritmo OPS.

Figura 7. Funcionamento esquemático do OPS.

Fonte : adaptado de (TEÓFILO; MARTINS; FERREIRA, 2009a). 1.2.3 Descritores moleculares de interação.

Na metodologia QSAR-3D a energia de interação de um átomo de prova ou fragmento molecular (sonda) com cada molécula em uma conformação alinhada é

(33)

calculada em ponto de uma grade e constitui os descritores chamados de campo de

interação molecular (MIF, molecular interacion fields) (CRUCIANI, 2006).

As energias de interação mais empregadas são as de van der Waals e Coulomb, calculadas por funções comuns aos campos de força moleculares, como o potencial de Lennard-Jones (EVDW) (2) e o potencial de Coulomb (EQQ) (1), respectivamente. 𝐸𝑄𝑄 = ∑ 𝑞𝑠𝑜𝑛𝑑𝑎𝑞𝑘 𝐷𝑟𝑠𝑜𝑛𝑑𝑎𝑘 𝐾 𝐾=1 (1) 𝐸𝑣𝑑𝑤 = ∑𝑘𝑘=1(𝐴𝑟𝑠𝑜𝑛𝑑𝑎𝑘2 − 𝐶𝑟𝑠𝑜𝑛𝑑𝑎𝑘−6 ) (2)

Onde EQQ e a Evdw são as energias que irão compor os descritores eletrostáticos

(QQ) e de Van der Waals (WDV) calculada pelo potencial de Lennard-Jones. qsonda é a carga da sonda, qk é a carga parcial do átomo k da molécula, D é a constante

dielétrica, e rsondak é a distância da sonda dentro da grade virtual até o átomo k da

molécula. Os termos A e C são constantes dependentes do raio de van der Waals parametrizados para o campo de força usado no cálculo da energia (MARTINS et al., 2009).

Os descritores no modelo final com a metodologia LQTA QSAR são expressos como esferas, coloridas de acordo com o sinal do vetor de regressão e a natureza dos descritores (LJ ou QQ). Diferentemente do CoMFA que os descritores de interação são demonstrados através de mapas de contorno (Figura 8).

Figura 8. Exemplo de exibição espacial de descritores para a metodologia LQTA e CoMFA. a) Representação descritores LJ e QQ em esferas. b) Mapas de contorno obtidos por CoMFA.

(34)

Fonte : adaptado de (a) (DE ARAÚJO SANTOS et al., 2014) e (b) (DOWEYKO, 2004). 1.2.4 Validação dos modelos de LQTA-QSAR

A validação do modelo QSAR é essencial para garantir a qualidade da capacidade de previsão do modelo. Para tanto, a validação deve ocorrer tanto de maneira interna (do próprio modelo) quanto de maneira externa (do grupo de previsão). A validação cruzada (leave-one-out - LOO) é utilizada para determinar o número de variáveis latentes no modelo PLS (KIRALJ; FERREIRA, 2009). A validação cruzada leave-one-out consiste em excluir uma amostra de cada vez do conjunto de treinamento, construir um modelo sem essa amostra, e então realizar a previsão da atividade para esta amostra deixada de fora. O procedimento é realizado quantas vezes for o número das amostras do conjunto de treinamento. A diferença entre o valor experimental e o estimado para as amostras retiradas são usados para calcular o erro padrão da validação cruzada (SEV, standart error of validation) e o coeficiente de correlação da validação LOO (Q2). O modelo com todas as amostras é expresso

(35)

em termos do coeficiente de correlação de determinação múltipla (R2) e o erro padrão

de calibração (SEC, standart error of calibration).

Se a diferença entre os valores de Q2 LOO e R2 for de 0,2 a 0,3 há indícios de

sobreajuste do modelo. É preconizado que os valores de Q² e R² devem ser maiores que 0,6 para um modelo satisfatório (CHIRICO; GRAMATICA, 2011; GRAMATICA, 2007; KIRALJ; FERREIRA, 2009). A tabela 2 mostra os parâmetros estatísticos básicos para os modelos de regressão.

Tabela 2. Parâmetros estatísticos básicos para modelos de regressão.

Parâmetro Definição

Coeficiente de validação cruzada

𝑄2 = 1 −∑ (𝑦𝑖− 𝑦𝑣𝑖)² 𝑙 𝑖=1 ∑𝑙𝑖=1(𝑦𝑖 − [𝒚])² Coeficiente de correlação de determinação múltipla 𝑅 2 = 1 −∑ (𝑦𝑖− 𝑦𝑐𝑖)² 𝑙 𝑖 ∑ (𝑦𝑙𝑖 𝑖− [𝒚])²

Coeficiente de correlação de validação

externa 𝑄𝑝𝑟𝑒𝑑

2 = 1 −∑ (𝑦𝑖 − 𝑦𝑝𝑖)² 𝑙

𝑖

∑ (𝑦𝑙𝑖 𝑖− [𝒚])²

A validação cruzada Leave-N-out (LNO) é recomendada para testar a robustez do modelo. Diferente do LOO, são retiradas do conjunto de treinamento N amostras em bloco. Um novo modelo é construído sem estas amostras, e os valores de atividade biológica são previstos para o bloco de amostras separadas para validação. O valor de N deve apresentar uma porção significativa das amostras, sendo preconizado um número de 20% a 30% de amostras a serem retiradas (CHIRICO; GRAMATICA, 2011). Os coeficientes de correlação da validação cruzada LNO (Q2LNO) são calculados da mesma maneira que para Q2LOO. É recomendado um

valor máximo de oscilação de 0,1. Os resultados do teste de LNO é expresso através de um gráfico que mostra o desvio máximo entre Q2LOO e Q2LNO. Devem também

ser expressos dois desvios padrão ao redor do valor médio para a diferença entre o

Q2LOO e Q2LNO (KIRALJ; FERREIRA, 2009).

O último teste, de y-randomization detectar e quantifica as chances de correlações ao acaso entre a variável dependente e os descritores. De modo que o modelo não seja obtido ao acaso. O teste consiste em construir vários modelos com

(36)

as variáveis independentes, mas utilizando valores randomizados da matriz de variáveis latentes (y). Nessas condições, os modelos obtidos não podem obter valores bons de Q² e R² LOO. Valores ideais para os parâmetros obtidos com o teste y-randomization, Q²yrand e R²yrand são preconizados como : Q²yrand e R²yrand < 0,2 para um modelo obtido sem chance de correlação ao acaso (ERIKSSON et al., 2003).

Os resultados do teste ainda podem ser expressos levando em conta o coeficiente de correlação absoluta de Pearson, |r|. São construídos dois gráficos, no eixo y com os valores de Q2yrand e outro R2yrand e no eixo x os valores de |r| para os

dois gráficos. É feita então uma regressão linear com os valores e se o modelo foi obtido com descritores que possuem correlação ao acaso, os interceptos desses gráficos são aQ > 0,05 e aR > 0,3. Estes interceptos são medidas da correlação ao acaso (KIRALJ; FERREIRA, 2009).

1.3 Aplicação do LQTA-QSAR para alvos e inibidores de proteína de P. falciparum 1.3.1 Plasmepsina II do Plasmodium falciparum.

Presentes no P. falciparum, as plasmepsinas são um grupo de dez isoformas de proteases aspárticas presentes no Plasmodium e estão envolvidas no processo de degradação da hemoglobina. Quatro proteínas são ativas no vacúolo alimentar (I, II, IV e HAP) e são expressas na fase eritrocítica. Proteases aspartáticas se constituem de uma das maiores subclasses de proteínas e são encontradas em sua maioria, somente em eucariotos (ERSMARK; SAMUELSSON; HALLBERG, 2006).

A utilização das Plm como alvos farmacológicos já é uma realidade no mercado de fármacos. O FDA (Food and Drug Administration) já aprovou fármacos tanto para alvos em humanos quanto na terapia contra o HIV. A maioria desses esforços foi guiado pelo projeto de protótipos baseados em estrutura. As descobertas feitas nos últimos vinte anos quanto ao design de fármacos permitem uma orientação para o descobrimento de possíveis novos compostos para a inibição das plasmepsinas. Existe uma vasta coleção na literatura de compostos com atividade inibitória comprovada contra a enzima, que podem se tratar de ponto de partida para a pesquisa de um novo antimalárico (BJELIC et al., 2007; J. MEYERS; E. GOLDBERG, 2012; WEGSCHEID-GERLACH; GERBER; DIEDERICH, 2010).

O desenvolvimento de fármacos baseado na estrutura dos receptores foca primariamente na Plm II como alvo proteico, pois se trata da primeira estrutura

(37)

cristalográfica a ficar disponível para pesquisa. (HUIZING; MONDAL; HIRSCH, 2015; SILVA et al., 1996). O sequenciamento da Plm II também permitiu o desenvolvimento

in silico de modelos para a Plm I, IV e HAP, considerando que o sitio ativo destas

proteínas são similares – 63% de similaridade (BHAUMIK; GUSTCHINA; WLODAWER, 2012; ERSMARK; SAMUELSSON; HALLBERG, 2006).

A estrutura madura da Plm II tem 329 aminoácidos e consiste em dois domínios (C- e N-terminal), apresentando a forma típica bilobal das proteases aspárticas, forma esta que define o sítio ativo. Cada domínio contribui com um resíduo de ácido aspártico para compor o sítio catalítico da proteína, Asp214 e Asp34 (Figura 9). A estrutura da proteína se constitui ainda por uma formação de grampo β (β-hairpin) e um uma aba ( flap) que cobre o sitio ativo e interage com o substrato (ASOJO et al., 2003; ERSMARK; SAMUELSSON; HALLBERG, 2006; SILVA et al., 1996).

Figura 9.Mecanismo da quebra da ligação peptídica feita pelas proteases aspárticas.

Fonte: adaptado de (J. MEYERS; E. GOLDBERG, 2012)

A Figura 10 mostra uma lista dos principais resíduos de aminoácidos e como se organizam em bolsões hidrofóbicos de interação. Essas regiões de bolsões estão denominados de acordo os dados de Schechter e colaboradores (SCHECHTER; BERGER, 1967), seguindo a adaptação feita por Huizing (HUIZING; MONDAL; HIRSCH, 2015). Em azul a região S2’; em laranja a região S1’; em amarelo a aba; em vermelho a díade catalítica; em verde a região S1/S3 e em roxo a região S2.

(38)

Fonte: elaborado pelo autor.

Tabela 3. Lista dos principais resíduos de aminoácidos e suas regiões respectivas no

sitio ativo da Plm II. Díade Asp Flap S1/S3 S2 S1' S2' Asp34, Asp214. Pro43, Met75, Val105, Phe111, Ile123, Tyr77. Tyr17, Ile32, Ser215, Ser218, Phe120, Met15, Ile123,Ile14, Thr114. Pro243, Leu271, Phe244, Met286, Ile290, Tyr273. Tyr192, Trp193, Ile300, Ile212, Phe294. Asn39, Leu131, Ser132, Ile133.

Esse grupo de proteínas é capaz de clivar a cadeia A da hemoglobina entre os resíduos Phe33 e Leu34 (BRINKWORTH et al., 2001). Acredita-se que tal processo induza um desenrolamento da proteína e permita a exposição de mais sítios catalíticos (ASOJO et al., 2003). Sendo assim, as plasmepsinas responsáveis pelo metabolismo da hemoglobina, são também consequentemente responsáveis pelos sintomas clínicos característicos da malária (febre); reforçando a proteína como alvo potencial para terapia antimalárica.

(39)

1.3.2 Inibidores da Plasmepsina II: alofenilnorstatinas.

A principal estratégia do planejamento de inibidores das Plasmepsinas utiliza a ação da díade catalítica formada pelos resíduos de ácido aspártico. O mecanismo de ação consiste na clivagem da ligação peptídica, gerando um substrato intermediário tetraédrico. Análogos desse substrato intermediário simulam a interação com as Plm de maneira mais específica. Isósteros desse substrato são definidos por possuir um grupamento funcional capaz de simular esse intermediário, mas é mais resistente a clivagem da proteína. Os inibidores peptidiomiméticos (Figura 11) resistentes a essa clivagem são amidas reduzidas, estatinas, estatinas reversas hidroxietilaminas, hidroxipropilaminas, norstatinas e dihidroxietilenos (C e N duplicados) (DAN; BHAKAT, 2015).

Figura 11. Inibidores peptidiomiméticos das plasmepsinas.

Fonte: adaptado de (PÉREZ et al., 2013).

As norstatinas foram previamente desenvolvidas como inibidores de HIV e utilizadas pela primeira vez como inibidores de Plasmepsina II por Nezami e colaboradores, com uma série de norstationas com um núcleo de alofenilnorstatinas associado a tiazolidina (NEZAMI et al., 2002).

(40)

Em uma colaboração entre a Universidade Jonhs Hopkins e Universidade Farmacêutica de Kyoto, a série de compostos químicos chamada de KNI foi desenvolvida. Com o intuito final de inibir as quatro Plasmepsinas (I, II, IV e HAP) presentes no vacúolo digestivo, mas primariamente a Plasmepsina II (HIDAKA et al., 2007; KISO et al., 2004; MIURA et al., 2010; NEZAMI et al., 2002). A estratégia de desenvolver inibidores adaptativos tenta planejar inibidores mais potentes e específicos que interagem com as regiões mais conservadas no sitio ativo (área catalítica), mantendo a flexibilidade dos compostos para que se adaptem as regiões menos conservadas (S2, S1’ e flap) da proteína (NEZAMI et al., 2003).

Compostos baseados nesse núcleo químico demonstraram grande biodisponibilidade e baixa toxicidade. As alofenilnorstatinas apresentam uma estrutura similar ao primeiro sitio de clivagem da hemoglobina, Phe33-Leu34 e a porção tiazolidina simula uma leucina conformacionalmente restringida. Estudos de docking realizados por Nezami (NEZAMI et al., 2002) demonstraram que as alofenilnortatinas se ligam a Plasmepsna II da mesma forma que a Pepstatina A (Figura 12), um potente inibidor natural da proteases aspárticas (ASOJO et al., 2003). Interações dos compostos com os resíduos da Plm II sugeriam que a otimização desta classe deveria ser direcionada para interações com o flap e as bordas dos bolsões de interações. (NEZAMI et al., 2003).

Figura 12. Pepstatina A e alofenilnorstatina.

(41)
(42)

2 OBJETIVOS

O objetivo geral dessa dissertação consiste no desenvolvimento de um modelo de previsão LQTA-QSAR para uma série de inibidores da Plasmepsina II.

2.1 Objetivos específicos

Padronização do conjunto de dados de compostos ativos contra o Plasmodium

falciparum para a geração do modelo.

 Desenvolvimento do modelo de LQTA-QSAR-4D

 Validar extensivamente o melhor modelo obtido.

 Identificação de pontos estruturais relevantes para a atividade biológica por meio da interpretação dos descritores.

(43)

3 MATERIAL E MÉTODOS

3.1 Material

3.1.1 Computadores.

Todos os estudos foram realizados no Laboratório de Química Farmacêutica Computacional, em estações computacionais operando em Linux, com processadores Intel® Xeon®E5-2690, 2.9 GHz, 20 MB cache, 16 GB RAM. Os softwares utilizados estão disponíveis através de licenças acadêmicas ou são de uso livre.

3.1.2 Conjunto de dados

Para os estudos de modelagem molecular, foram selecionados um conjunto de dados de 49 inibidores derivados da estrutura do ácido (2S,3S) -3-amina-2-hidroxi-4-fenilbutirato (ALOFENILNORSTATINAS) com Ácido (R)-1,3-tiazolidina 4-carboxilico (BHAUMIK et al., 2011; HIDAKA et al., 2007; KISO et al., 2004; MIURA et al., 2010; NEZAMI et al., 2002). Os valores da constante de inibição (Ki) foram obtidos sobre as mesmas condições experimentais. Esses valores de Ki foram transformados para a escala logarítmica pki (-log Ki). A faixa de valores variou de 4,01 a 9,69.

3.1.3 Receptor

A estrutura cristalográfica da enzima Plasmepsina II presente no Plasmodium

falciparum foi obtida a partir do banco de dados online Protein Data Bank ( PDB)

(BERNSTEIN et al., 1977) sob o código 4CKU (JAUDZEMS et al., 2014), com resolução de 1,85 Å e valor-R de 0,209 (Figura 13). As estruturas, que apresentavam resíduos de aminoácidos incompletos foram reconstruídas utilizando modelos de homologia com o Swiss Model (GUEX; PEITSCH, 1997).

(44)

Figura 13. Estrutura cristalina da Plasmepsina II (4CKU).

Fonte: <http://www.rcsb.org> 3.2 Metodologia

3.2.1 Padronização do conjunto de dados e preparo das estruturas tridimensionais. As estruturas 3D dos compostos foram desenhadas com o auxílio do programa

Marvin Scketch versão 15.9 (ChemAxon). O estado de protonação foi estimado para

pH = 7,40 e os átomos de hidrogênio foram adicionados com o programa Avogadro (HANWELL et al., 2012). Foi realizada uma inspeção criteriosa do banco de dados selecionado da literatura utilizando o protocolo descrito por Fourches & Tropsha (FOURCHES, 2010).

Todos os modelos moleculares, nos devidos estados de protonação, passaram por uma minimização de energia com o campo de forma MMFFFG94, com o programa MarvinSketch; e tiveram suas energias otimizadas ao nível semi-empírico PM6, com o programa Gaussian. Cargas AM1-BCC (JAKALIAN; JACK; BAYLY, 2002) foram adicionadas com o UCSF Chimera (PETTERSEN et al., 2004).

Para as simulações de dinâmica molecular, todo o conjunto de dados tiveram suas ligações parametrizadas para o campo de força AMBER99SB-ILDN (LINDORFF-LARSEN et al., 2010).

(45)

3.2.2 Adaptação do sítio ativo

A estrutura cristalográfica 3D do complexo Plasmpepsina II com um ligante natural baseado na estrutura da hidroxietilamina (código PDB: 4CKU) (JAUDZEMS et al., 2014) foi utilizado como receptor para a construção do modelo de previsão dependente de receptor LQTA-QSAR. A estrutura química do ligante cristalizado se interage com a proteína por um modo de interação distinto dos compostos do conjunto de dados. O que não permite a inserção direta dos ligantes escolhidos na conformação apresentada pelo sítio ativo cristalizado.

A adaptação do sítio ativo foi feita a partir do estudo de docking do composto mais potente da série - composto 33 (Figura 14). Para tal, o ligante natural foi removido da estrutura do cristal e foi realizada a docagem com o composto de referência. As melhores poses foram submetidas a simulações de dinâmica molecular (metodologia referente ao tópico 3.2.3) e propiciaram a adaptação do sítio ativo por meio de encaixe induzido. O processo automatizado de docking foi realizado com o programa AutoDock Vina (TROTT; OLSON, 2010) e as simulações de dinâmica molecular com o pacote GROMACS 4 (VAN DER SPOEL et al., 2005).

Figura 14. Estrutura química do compostos 33 (NEZAMI et al., 2002).

O novo sítio ativo hipotético, adaptado e aperfeiçoado para o modo de interação do composto 33 foi utilizado para orientar os processos de refinamento subsequentes com dinâmica molecular de todos os ligantes da série de derivados Alofenilnorstatinas e obter os perfis conformacionais necessários para a construção do modelo LQTA-QSAR-DR.

As conformações iniciais (input) para a realização das simulações de todos os ligantes dos conjuntos de dados foram obtidas a partir de um processo de docagem manual, utilizando a estrutura da Plm II com o sítio ativo adaptado. O processo manual

(46)

foi realizado utilizando a ferramenta de ajuste de torções (adjust torsions) e o movimento do mouse (movement mouse), átomo por átomo, baseados no conhecimento do modo de interação do ligante natural cocristalizado e interações relatadas na literatura (DAN; BHAKAT, 2015; HUIZING; MONDAL; HIRSCH, 2015). Otimizações da geometria dos compostos foram realizadas para eliminar possíveis distorções nas posições dos átomos. As estruturas otimizadas foram submetidas ao programa topobuild para a criação dos arquivos de topologia GAFF (WANG et al., 2004) para as subsequentes simulações de dinâmica molecular.

3.2.3 Dinâmica molecular

As simulações de dinâmica molecular ocorreram utilizando o pacote GROMACS 4 (VAN DER SPOEL et al., 2005). Todas as simulações foram feitas em solvente implícito empregando o formalismo generalizado de Born (FAN et al., 2005). Como não foi construído uma caixa, não foi levado em consideração as condições periódicas de limite. Todos os complexos tiveram sua energia otimizada usando o algoritmo de descida mais inclinada (steepest descent algorithm - SDA). O critério de convergência empregado nas otimizações foi que a força máxima que agisse sobre os átomos não superasse 10 kJ mol-1 nm-1. Caso a convergência não fosse atingida em 20 000 passos, foi empregado o algoritmo de Broydens-Fletcher-Goldfarb-Shanno (BFGS). Foram aplicadas Correções de dispersão de longo alcance somente para energia. Restrições de posições com penalidades de energia totais foram adicionadas à cadeia principal (backbone) e parciais à cadeia lateral da proteína. Todas as ligações foram vínculos pelo algoritmo LINCS, foi removido o centro de massa translacional e rotacional ao redor do centro de massa e um algoritmo de leap-frog foi utilizado para integrar as equações de Newton de movimento. As interações de Lennard-Jones e Coulombic sofreram consideradas até 2 nm. As simulações duraram 2 000 ps para cada composto, ou o suficiente para adaptação e estabilização da posição do ligante no sítio ativo.

3.2.4 Geração do modelo 4D LQTA-QSAR

Os descritores de interação foram calculados com o programa Open3DQSAR (TOSCO; BALLE, 2011). Estes descritores foram criados com a utilização das conformações alinhadas provenientes da dinâmica molecular. A seleção destas

(47)

conformações foi realizada a partir da ferramenta de análise de agrupamentos do Chimera. Foi utilizada uma caixa cúbica com 1.0 Å de espaçamento e dimensões de 33x32x30 Å. Foram calculados no total 63360 descritores paras energias de interação de Lennard-Jones (LJ) e Coulomb (QQ). Os descritores de LJ foram calculados com uma sonda sp³, e os de QQ com uma sonda de carga +1.

A filtragem (Figura 15), seleção e construção dos modelos de QSAR seguiram os protocolos já estabelecidos por Barbosa e colaboradores (BARBOSA; FERREIRA, 2012) para a metodologia do LQTA-QSAR. O script utilizado para retirar os descritores do Open3DQSAR e o script feito para aplicar os filtros virtuais nas matrizes do Matlab estão disponíveis no Anexo I.

Figura 15. Etapas dos filtros virtuais.

Fonte: elaborado pelo autor 3.2.4.1 Filtros virtuais

Os descritores moleculares excessivamente distantes (baixa variância) das estruturas 3D alinhadas dentro da grade virtual foram eliminados. O corte da variância foi de 0,02 para descritores abaixo desse valor, de acordo com o proposto por Kubiny e colaboradores (KUBINYI, 1997). Os descritores de LJ são submetidos a um tratamento devido a seus valores positivos serem de elevada magnitude nos postos da grade próximos aos átomos. Um corte (cut-off) de energia é realizado seguindo a equação 3. Se um descritor de LJ nas coordenadas x, y, z tiver valor de energia menor

(48)

ou igual que 30 kcal/mol não foi aplicado nenhum corte. Se não, o valor logaritmo residual da energia foi adicionado a 30 kcal/mol.

𝑆𝑒 𝐿𝐽𝑥,𝑦,𝑧 ≤ 30 𝑘𝑐𝑎𝑙 𝑚𝑜𝑙−1 , 𝑒𝑛𝑡ã𝑜 𝐿𝐽′𝑥,𝑦,𝑧 = 𝐿𝐽𝑥,𝑦,𝑧

𝑆𝑒 𝐿𝐽𝑥,𝑦,𝑧 > 30 𝑘𝑐𝑎𝑙 𝑚𝑜𝑙−1 , 𝑒𝑛𝑡ã𝑜 𝐿𝐽′𝑥,𝑦,𝑧 = 30 + 𝑙𝑜𝑔 (

𝐿𝐽𝑥,𝑦,𝑧

𝑘𝑐𝑎𝑙 𝑚𝑜𝑙−1− 29) (3)

O segundo filtro virtual foi realizado por meio da eliminação dos descritores de baixa correlação, ou seja, se comportam como um vetor aleatório. Para tal, são eliminados os descritores que tem correlação de Pearson absoluta (|r|) com atividade biológica (y) no mesmo nível de ruído aleatório.

A última etapa de filtros virtuais visa eliminar os descritores com perfil de distribuição muito diferente em relação a atividade biológica (y), utilizando o

Comparative Distribution Detection Algorithm (CDDA) (BARBOSA; FERREIRA, 2012).

Tal algoritmo permite um modo de quantificar o quão similar y está distribuído para um descritor especifico.

3.2.4.2 Seleção de variáveis

Após o procedimento de filtragem virtual, foi realizado a seleção de descritores com o algoritmo OPS (TEÓFILO; MARTINS; FERREIRA, 2009a). Foram removidos descritores redundantes (com coeficiente de correlação inter descritor igual ou maior que 0,9), que apresentaram discrepância entre o sinal do vetor de regressão e do coeficiente de correlação com a atividade biológica (KIRALJ; FERREIRA, 2009).

3.2.5 Validação do modelo

A validação interna do modelo foi obtida a partir dos parâmetros de méritos R² e Q², e testes de validação y-randomization e Leave-N-out (LNO) (GRAMATICA, 2007; KIRALJ; FERREIRA, 2009). A validação externa foi realizada empregando um conjunto teste de 12 compostos, a fim de se verificar a capacidade preditiva dos melhores modelos obtidos. Tal capacidade foi avaliada utilizando o coeficiente de correlação externo (Q²ext).

O modelo final que passou nas devidas etapas de validação teve seus descritores visualizados no espaço 3D ao redor das moléculas alinhadas. As

(49)

coordenadas que definem os descritores são expressas em formato .pdb e exibidas como esferas utilizando o programa USCF Chimera (PETTERSEN et al., 2004). A interpretação dos descritores do modelo foi feita com base na disposição espacial, natureza energética e pelo sinal do vetor de regressão.

3.2.5.1 Leave-N-out e y-randomization

Para o teste de LNO, os modelos foram considerados robustos se os desvios máximos absolutos de Q²LNO e que o Q²LOO não fossem superiores que 0,1, para N sendo cerca de 20-30% das amostras separadas para validação interna (GRAMATICA, 2007; KIRALJ; FERREIRA, 2009). O resultado é mostrado graficamente, exibindo o valor do desvio máximo e o valor médio de dois desvios padrão.

No teste y-randomization os modelos foram construídos com atividades biológicas randomizadas para gerar modelos que apresentassem pouca qualidade estatística (R² e Q² baixos). Os descritores obtidos para os modelos foram considerados livres de correlação ao acaso quando os interceptos para as regressões lineares dos valores de |r| x Q²yrand e |r| x R²yrand forem aQ < 0,05 e aR < 0,3 (ERIKSSON et al., 2003). Os resultados foram expressos em dois gráficos contendo a linha para a regressão linear, seguindo as equações:

i) 𝑄²𝑦𝑟𝑎𝑑 = 𝑎𝑄+ 𝑏𝑄|𝑟| (4) ii) 𝑅²𝑦𝑟𝑎𝑑= 𝑎𝑅 + 𝑏𝑅|𝑟|

Onde Q²yrad e R²yrad são os parâmetros estatísticos do coeficiente de correlação para os modelos randômicos, aQ e aR são os interceptos da reta e |r| é o coeficiente de correlação de Pearson. Foram realizadas 100 randomizações de y.

Referências

Documentos relacionados

A preparação de recursos humanos para utilizar e aplicar novas técnicas e métodos de gestão, deverá ser realizada através de projetos de treinamento na utilização

O Guia Orientador para a Intervenção de Enfermagem na Consulta Telefónica na Unidade Dor do Hospital Garcia de Orta, EPE, emerge da evolução da prática

– Criação de base legal que possibilitou a ação do Estado para intervir no espaço urbano e regular a atuação da iniciativa privada  leis de desapropriação, leis

Este trabalho teve como objetivo realizar um estudo sobre a composição química e, especialmente sobre a composição em ácidos graxos nos lipídios totais de filés de trutas arco-

condiçóes estudadas, fatores adversos 9 cultura, como por exemplo, ventos fortes. Esses resultados estão em consonbncia com os obtidos para perimetro do tronco a

Atentos para estes desafios e buscando proporcionar para os alunos uma formação ancorada nos pilares éticos políticos e metodológicos do serviço social, que

Aim: This retrospective study evaluated the preoperative risk factors not surgery-related for persistent dysphagia after primary laparoscopic antireflux surgery.. Methods