D, de uma estrutura Da matriz D extrai-se a soma das linhas (ou colunas) onde cada elemento
4. Resultados e discussão
4.2. Estudo de QSAR-4D
Além do estudo de QSAR-2D, foi realizado também um estudo de QSAR-4D usando a metodologia LQTA-QSAR introduzida no capítulo 4. Para este estudo foram selecionados 89 com uma ampla faixa de atividade biológica, como pode ser visto no histograma da Figura 34. Nota-se que a classificação dos compostos de acordo com a atividade é muito semelhante ao estudo de QSAR-2D. São considerados compostos inativos aquele que possuem LogRA abaixo de -1,83. Os compostos com baixa atividade tem valores de LogRA -1,83 LogRA < -0,39. Os compostos ativos -0,39 LogRA < 2,50. Os compostos com alta atividade possuem valore de LogRA 2,50.
Figura 34. Histograma apresentando a distribuição dos valores de Log RA para 89
compostos.
Do mesmo modo que no estudo de QSAR-2D, diferentes grupos substituintes entraram nas posições dos átomos de carbono C3, C9 e C10 para os análogos e derivados da artemisinina. Esses compostos podem ser visualizados na Tabela 35.
Universidade Estadual de Campinas
Tabela 35. 89 compostos selecionados para o estudo de QSAR-4D.
Universidade Estadual de Campinas
Tabela 35 (continuação). 89 compostos selecionados para o estudo de QSAR-4D.
Universidade Estadual de Campinas
Tabela 35 (continuação). 89 compostos selecionados para o estudo de QSAR-4D.
Universidade Estadual de Campinas
Tabela 35 (continuação). 89 compostos selecionados para o estudo de QSAR-4D.
Universidade Estadual de Campinas
Tabela 35 (continuação). 89 compostos selecionados para o estudo de QSAR-4D.
Universidade Estadual de Campinas
Tabela 35 (continuação). 89 compostos selecionados para o estudo de QSAR-4D.
Universidade Estadual de Campinas
As simulações de DM foram realizadas para os 89 compostos. Como mencionado anteriormente, o sistema foi aquecido gradativamente, conforme o seguinte esquema: 50K, 100 K, 200 K e 350 K para simulações de DM de 20 ps, que corresponde a 20.000 passos, sendo cada passo de 1 fs (0,001 ps). Posteriormente, o sistema foi resfriado a 310K para simulações de DM de 500 ps (500.000 passos de 1 fs).
Para este estudo foi selecionado um alinhamento (Figura35) que considera o farmacóforo, i.e., o anel endoperóxido (C3, O2, O1, C12a e C12). Após o alinhamento, os perfis de conformações de cada ligante foram submetidos ao programa LQTAgrid a fim de gerar os descritores de energia de interação molecular (descritores de Coulomb, C, e de Lennard Jones, LJ). Foi utilizada uma caixa com as seguintes dimensões꞉ 31 Å x 24 Å x 31Å. Foram calculados 51.200 descritores de campo utilizando como sonda o íon NH3+.
Figura 35. Estrutura molecular da artemisinina indicando a numeração dos átomos
selecionados para o alinhamento.
Uma vez gerados os descritores, procedeu-se à seleção para eliminar aqueles que continham nenhuma ou pouca informação. A Figura 36 ilustra os pontos da grade após a remoção dos descritores que possuíam variância inferior a 0,01.
No momento em que a sonda está numa posição da grade bem próxima a um dos átomos da molécula, os valores de energia potencial adquirem valores positivos muito elevados em função da expressão de potencial de Lennard Jones. Sendo assim, os descritores LJ foram submetidos a um pré-tratamento (equação 19) com a finalidade de garantir que a
Universidade Estadual de Campinas
informação dos pontos da grade próximos às moléculas alinhadas não sejam perdidas. Após essa remoção, o número de descritores LJ foi reduzido a 11.863.
Figura 36. Descritores resultantes após o corte pela variância.
Na etapa seguinte, os descritores de Coulomb e Lennard-Jones foram submetidos ao filtro CDDA [140]. Foram eliminados os descritores que têm baixa correlação com y (coeficiente de correlação 0,3
corte
r ) bem como aqueles que não apresentam uma
distribuição adequada (Descritores com ej 0,5) (ver metodologia, equação18). A aplicação desse filtro (Tabela 36) possibilitou uma grande redução no número de descritores. A Figura 37 ilustra os descritores de campo resultantes da filtragem para os compostos 55 (LogRA=- 4,00) e 164 (LogRA=3,22).
Tabela 36. Número de descritores iniciais e após a filtragem para cada alinhamento. 89 Compostos Descritores Iniciais Corte pela variância 3 , 0 corte r (Descritores com ej 0,5) Coulomb Lennard-Jones
Universidade Estadual de Campinas
(a)
(b)
Figura 37. Descritores de campo resultantes após o processo de filtragem Para os
compostos 55 (a). Composto 164 (b). As esferas com a cor cinza ilustram os descritores de Coulomb e as esferas com a cor chumbo, os descritores de Lennard Jones.
A partir das estruturas 3D (Figura 37) destes compostos verifica-se que os descritores de Coulomb estão em torno de regiões polares. Como o número de descritores, 141, ainda é bastante alto, foi feita uma nova seleção de variáveis com o uso do método OPS
Universidade Estadual de Campinas
[141]. Dessa seleção, restaram 19 descritores. A última etapa do estudo foi a construção do modelo de QSAR utilizando os 19 descritores. O gráfico da Figura 38 mostra a influência
versus resíduos de Student para os 89 compostos. Dois deles (150 e 151) apresentaram
influência muito acima do limite, indicando que eles estavam fora do domínio de aplicabilidade e, portanto, foram excluídos. Esses dois compostos têm como substituinte o grupo NH3+ que, provavelmente, foram mal descritos pela sonda utilizada que também é
NH3+.
Figura 38. Gráfico da influência versus Resíduos de Student para o conjunto de 89
compostos.
Além disso, os compostos 6, 57 e 164 apresentaram resíduos bastante altos, acima do limite de 95% de confiança indicado pelo resíduo de Student. Como os compostos 57 e 164 têm atividades biológicas extremas, eles foram mantidos no modelo e somente o composto 6 foi excluído. Com base na estrutura 2D (Figura 39) dos compostos eliminados pode-se observar que꞉ i) o composto 6 possui uma insaturação nas posições C9 (e
simultaneamente, e uma hidroxila na posição C10; ii) O composto 150 possui uma carbonila na posição C10 e C9um grupo substituinte contendo NH3+. O composto 151
Universidade Estadual de Campinas
difere do composto 150 por ter um grupo substituinte contendo NH3+ na posição C9 ao invés
da posição C9.
Figura 39. Estrutura molecular 2D dos compostos eliminados no estudo de QSAR-
4D.
Uma nova visualização dos descritores foi feita e 7 deles foram eliminados restando no modelo final apenas 12, dos quais 9 são de Coulomb e apenas 3 de Lennard Jones. Eles foram designados como: + 1C, + 2C, + 3C, + 4C, - 5C, - 6C, - 7C, - 8C, - 9C, - 1L, - 2L e + 3L. Dos descritores de Coulomb, 4 deles têm sinal positivo (aumenta LogRA => aumenta o valor do descritor) e 5 são negativos (aumenta LogRA => diminui o valor do descritor). Dos 3 descritores de Lennard Jones, dois deles também têm valores negativos e um é positivo. O modelo de regressão foi construído com o método PLS usando duas variáveis latentes (A = 2). O modelo final com 86 compostos e 12 descritores se encontra na equação 23 LogRA = + 0,10 1C + 0,13 2C + 0,16 3C+ 0,19 4C - 0,15 5C - 0,10 6C - 0,10 7C - 0,11 8C - 0,10 9C - 0,12 1L - 0,17 2L e + 0,13 3L (23) LogRA = 1,04 + 0,003 1C + 0,003 2C + 0,003 3C + 0,003 4C - 0,008 5C - 0,003 6C - 0,003 7C - 0,003 8C - 0,005 9C - 0,77 1L - 0,67 2L e + 0,007 3L
A equação superior contém os coeficientes de regressão autoescalados, quando todos eles podem ser comparados entre si. Pode-se ver que todos eles têm praticamente a mesma importância no modelo. Os coeficientes da equação inferior contém a contribuição de
Universidade Estadual de Campinas
cada descritor nas devidas unidades, além do termo independente. O modelo foi construído com 2 variáveis latentes e produziu os seguintes parâmetros estatísticos: R2 = 0,67; RMSEC = 0,695; Q2LOO = 0,59; RMSECV = 0,775. Esse modelo foi totalmente validado segundo as
exigências da literatura e se mostrou adequado.
Gráficos dos valores experimentais de LogRA versus preditos pelo modelo e os valores preditos da atividade versus resíduos são apresentados nas Figuras 40 e 41 para confirmação da linearidade do modelo.
Figura 40. Gráfico dos valores experimentais versus os valores estimados de LogRA
para o modelo de regressão PLS construído com 2 fatores.
Universidade Estadual de Campinas
Alguns resultados dos testes de validação do modelo são apresentados a seguir e, como já foram discutidos anteriormente para o estudo de QSAR-2D, são apresentados apenas os resultados. Os resultados do teste de igualdade de sinais se encontra na Tabela 37.
Tabela 37. Análise dos sinais dos coeficientes de correlação descritor-atividade e dos
coeficientes de regressão.
Descritor Coef. Correl. Desc./LogRA Coef. Regressão 1C +0,55 +0,10 2C +0,55 +0,13 3C +0,54 +0,16 4C +0,36 +0,19 5C -0,37 -0,15 6C -0,48 -0,10 7C -0,50 -0,10 8C -0,51 -0,11 9C -0,41 -0,10 1L -0,30 -0,12 2L -0,36 -0,17 3L +0,34 +0,13
Os resultados do teste de robustez excluindo N amostras para N variando de 1 a 50. Ele foi repetido 50 vezes e os valores médios e respectivos desvios-padrões são apresentados na Figura 42. O valor crítico de N é igual 22, quando Q2LNO se encontra no
intervalo 0,59 - 0,05 ≤ Q2LNO ≤ 0,59 + 0,05. Pode-se ver que o modelo é robusto, e, portanto,
Universidade Estadual de Campinas
Figura 42. Gráficos dos resultados obtidos para o teste de robustez a partir do método
LNO (N = 1 - 50).
Finalmente, o modelo foi testado para checar se não foi obtido ao acaso. Para tal, foi aplicado o teste de aleatorização de y, com 50 repetições e os resultados estão nas Figuras 43 e 44.
Figura 43. Gráficos dos resultados obtidos no teste de aleatorização de y. (a) Q2 em função do R2 para 50 randomizações.
Universidade Estadual de Campinas (a)
(b)
Figura 44. Gráficos do teste de aleatorização de y. (a) Coeficientes de correlação
absoluto entre y aleatorizado (yal) e os respectivos valores originais (y) versus R2. (b) Coeficientes de correlação absoluto entre y aleatorizado (yal) e os valores originais (y) versus
Q2.
Nesse estudo, o conjunto de dados não foi dividido em dois (conjunto de treinamento e de validação externa). O objetivo aqui foi explorar a metodologia 4D e demonstrar a sua utilidade comparando os resultados com o estudo 2D.
Universidade Estadual de Campinas
Os descritores de Coulomb descrevem interações hidrofílicas entre regiões polares do composto e do receptor (o grupo heme). Já os descritores de Lennard Jones estão relacionados às interações hidrofóbicas. Os descritores selecionados pelo modelo podem ser visualizados graficamente (esferas coloridas) e são indicados na Figura 45.
Figura 45. Visualização dos descritores 4D selecionados pelo melhor modelo de
QSAR para a artemisinina. Descritores de Lennard Jones estão em azul claro/escuro. Descritores de Coulomb em rosa claro/escuro.
Os descritores selecionados pelo modelo são: de Lennard Jones, LJ positivo (3LJ +) e negativos (1LJ - e 2LJ -), bem como os de Coulomb, C positivos (1C+, 2C+, 3C+ e 4C+) e negativos (5C-, 6C-, 7C-, 8C- e 9C-). As contribuições favoráveis e desfavoráveis de energia para a atividade biológica são mostradas por meio de esferas claras e escuras. Adicionalmente, os descritores LJ são representados por esferas de cor azul, enquanto os
1LJ- 2LJ- 3LJ+ 1C+ 2C+ 3C+ 4C+ 6C- 7C- 8C- 9C- 5C-
Universidade Estadual de Campinas
descritores C por esferas de cor rosa. A interpretação dos descritores de campo será realizada com base nas Figuras 46-53.
O descritor 9C- (Figura 46) está localizado próximo ao átomo de hidrogênio (do C5. A análise desse descritor foi realizada com base nas estruturas 2D e 3D da artemisinina e nos dois compostos selecionados, um ativo (92 (LogRA = 1,36)) e outro inativo (54 (LogRA = -2,76)). Esses compostos possuem na posição C3 um grupo éster (C2H4CO2C2H5) e um átomo
de hidrogênio, respectivamente. Esses resultados indicam que um grupo substituinte na posição C3 contribui para o aumento ou diminuição da densidade eletrônica próximo, ao átomo de hidrogênio (do C5.
A Tabela 38 aponta os valores de densidade de carga para o átomo de carbono na posição C5, assim como, os átomos de hidrogênio nas posições C5(H) e C5 (H), para os compostos 92 e 54.
Universidade Estadual de Campinas
Tabela 38. Valores de densidade de carga para os compostos 92 e 54.
Composto Densidade de Carga em C5 Densidade de Carga em C5(H) Densidade de Carga em C5 (H) 0,143 -0,045 0,008 0,302 -0,073 -0,025
Pode-se observar que o valor de densidade de carga, na região do átomo de hidrogênio (do C5, para o composto inativo (-0,025) é menor em relação ao composto ativo (0,008). O presente estudo revela a importância de um grupo substituinte, na posição C3, que aumente da densidade eletrônica na região do átomo de hidrogênio do C5 favorecendo, assim, a atividade biológica.
Os descritores 7C- e 8C- (Figura 47) estão posicionados em torno do átomo de hidrogênio (do C7. A análise desses descritores foi baseada nas estruturas 2D e 3D da artemisinina e nos compostos selecionados, um ativo (18 (LogRA = 1,40)) e outro inativo (52 (LogRA = -2,47)). Esses compostos possuem na posição C9 um grupo C2H5 e carbonila, nesta
ordem. O presente estudo permitiu observar que um grupo substituinte na posição C9 contribui para o aumento ou diminuição da densidade eletrônica, em torno do átomo de hidrogênio (do C7.
A Tabela 39 indica os valores de densidade de carga para os átomos de carbono nas posições C7 e C9, bem como, os átomos de hidrogênio nas posições C7(H) e C7 (H), para os compostos 18 e 52.
Universidade Estadual de Campinas
Figura 47. Análise dos descritores 7C- e 8C- com base nas estruturas 2D e 3D da
artemisinina.
Tabela 39. Valores de densidade de carga para os compostos 18 e 52. Composto Densidade de Carga em C9 Densidade de Carga em C7 Densidade de Carga em C7(H) Densidade de Carga em C7 (H)) -0,164 -0,287 0,0620 0,050 0,425 -0,091 0,032 0,017
A partir da Tabela 39 pode-se notar que o valor de densidade de carga para o átomo de carbono na posição C9 é maior no composto inativo (0,425) do que no composto ativo (-0,164). Esta análise está de acordo, com os estudo realizado por Pinheiro et al [49] em
O O O H O O CH3 H 2 1 3 4 5 5a 6 7 8 8a 9 10 11 1212a 13 H3C CH3 H H
7C-
8C-
Universidade Estadual de Campinas
que grupos substituintes de alta densidade eletrônica em C9, em alguns casos, contriui para a diminuição da atividade biológica do composto. Desse modo, prejudicando a interação do ligante com o grupo heme. Por sua vez, o valor de densidade de carga, na região do átomo de hidrogênio do C7, para o composto inativo (0,017) é menor em comparação com o composto ativo (0,050). Assim sendo, os descritores -7C e 8C- sugerem que o aumento da densidade eletrônica deve favorecer a interação entre o átomo de hidrogênio (do C7 e o grupo heme.
O descritor 6C- (Figura 48) está localizado próximo ao átomo de hidrogênio (do C8. Sua análise foi feita a partir das estruturas 2D e 3D da artemisinina e dos compostos selecionados, um ativo (1 (LogRA = 0,86)) e outro inativo (65 (LogRA = -1,10)). O composto 1 possui na posição C9, um grupo C6H13 enquanto o composto 65 possui um grupo Z- CH2CH
= CHCH3, respectivamente. A partir desta análise pode-se observar que um grupo substituinte
na posição C9 contribui para o aumento ou diminuição da densidade eletrônica próximo, ao átomo de hidrogênio (do C8.
Os valores de densidade de carga para o átomo de carbono na posição C8 e para os átomos de hidrogênio nas posições C8(H) e C8 (H) dos compostos 1 e 69 podem ser visualizados a partir da Tabela 40.
Figura 48. Análise do descritor 6C- com base nas estruturas 2D e 3D da artemisinina.
O O O H O O CH3 H 2 1 3 4 5 5a 6 7 8 8a 9 10 11 12 12a 13 H3C CH3 H H
6C-
Universidade Estadual de Campinas
Tabela 40. Valores de densidade de carga para os compostos 1 e 65. Composto Densidade de Carga em C9 Densidade de Carga em C8 Densidade de Carga em C8(H) Densidade de Carga em C8 (H)) 0,010 0,035 -0,022 0,067 0,116 0,021 -0,010 0,032
Assim como a análise anterior, o valor de densidade de carga para o átomo de carbono na posição C9 é maior no composto inativo (0,116) do que no composto ativo (0,010). O presente estudo está de acordo com o trabalho realizado por Pinheiro et al [49] em que grupos substituintes de alta densidade eletrônica na posição C9, em alguns casos, leva à diminuição da atividade biológica do composto prejudicando, assim, a sua interação com o grupo heme. Pode-se, também, observar que o valor de densidade de carga na região do átomo de hidrogênio (do C8, para o composto inativo (0,032) é menor em comparação ao composto ativo (0,067). Portanto, o descritor -6C sugere que o aumento da densidade eletrônica favorece a interação do átomo de hidrogênio (do C8 com grupo heme.
Para análise do descritor 5C- foi selecionado o composto 80 (LogRA = 2,25) que pode ser visualizado em diferentes posições (Figura 49) em relação ao descritor 5C-. O composto selecionado tem metila nas posições C3 e C9, átomo de hidrogênio em C9e substituinte altamente polar ( (S) C5H9O3),na posição C10.
Universidade Estadual de Campinas
Figura 49. Análise do descritor 5C- com base nas estruturas 2D e 3D do composto 80.
A partir do gráfico de LogRA versus descritor de coulomb (Figura 50) pode-se observar que 5C- descreve o compostos 80 e seus isômeros. Dessa forma, o presente estudo sugere que um grupo substituinte altamente polar na posição C10 favorece a atividade biológica.
Figura 50. Gráfico de LogRA versus Descritor de Coulomb, 5C-.
Os descritores 1C+, 2C+, 3C+ e 4C+ (Figura 51) foram analisados em conjunto para os compostos 1 (LogRA = 0,86) e 178 (LogRA = -2,14). Ambos, com os seguintes grupos substituintes em C9: C6H13 e C3H5O2, respectivamente. De acordo, com os
6C-
I
5C- II
Universidade Estadual de Campinas
descritores selecionados pode-se notar que um grupo substituinte hidrofílico na posição C9 é prejudicial para a atividade.
(a)
(b)
Figura 51. Análise dos descritores 1C+, 2C+, 3C+ e 4C+ com base nas estruturas 2D
e 3D dos compostos (a) 1 e (b) 178.
O descritor 3LJ+ (Figura 52) será analisado a partir do composto 164 (LogRA = 3,22). O mesmo possui uma metila na posição C3, uma carbonila na posição C10, um átomo de hidrogênio em C9e o grupo C14H29 na posição C9. Com base nos descritores acima
Universidade Estadual de Campinas
pode-se observar que a presença de um substituinte hidrofóbico favorece a atividade biológica nesta posição. O descritor de 3LJ+ sugere que o aumento do número de carbono do substituinte n-alquila nesta região favorece a atividade biológica.
Figura 52. Análise do descritor 3LJ+ a partir do composto 164.
Vale salientar, que esta análise é condizente com o estudo de QSAR-2D. O composto 164 possui uma cadeia longa, na posição C9O alto valor de sua atividade biológica pode ser sugerido pela interação de van der Waals do grupo substituinte C14H29 com
algum resíduo de proteína próximo ao heme.
Em estudos recentes de docking molecular da artemisinina e derivados, [39, 57] observou-se que a distância entre o Fe2+ e o átomo de oxigênio do anel trioxano é menor para o átomo O1 do que para o átomo de O2. Este resultado confirma a teoria de que o Fe2+ do heme se liga, preferencialmente, ao átomo de O1. Ficou claro nesses estudos que a distância d(Fe-O1) varia para diferentes derivados, sendo que compostos que têm valores de atividade maiores que a artemisinina apresentam, também, os maiores valores de distância. Substituintes volumosos, certamente, na posição C9 provocam um efeito estérico, que os impede de se aproximarem mais do heme.
Os descritores 1LJ- e 2LJ- da abordagem 4D indicam que um grupo substituinte muito volumoso na posição C9 desfavorece a atividade biológica. Neste caso, o grupo
Universidade Estadual de Campinas
volumoso ocasiona um impedimento estérico, o que prejudica a interação do ligante com o receptor (grupo heme).