• Nenhum resultado encontrado

Atracamento molecular (“docking”)

No documento Download/Open (páginas 83-89)

Interações não ligadas

4.1.2. Atracamento molecular (“docking”)

Para a modelagem e predição da atividade de moléculas inéditas, seriam vantajosos métodos que permitissem grande capacidade de explicação do modo pelo qual estas estruturas se ligam a sítios ativos, quando a geometria do sítio ativo é conhecida — o chamado “problema do atracamento” (“the docking problem”). Com isto surgiu, na década de 1980 [KUNTZ et al., 1982], a técnica de atracamento molecular, também conhecida como “docking”, altamente utilizada quando as estruturas dos sítios ativos e das moléculas estão disponíveis, ou ainda para o atracamento entre duas proteínas.

Entretanto, a identificação das características moleculares responsáveis pelo reconhecimento biológico, ou a predição de modificações moleculares que aumentem a potência das estruturas envolvidas, são assuntos complexos, de difícil simulação

do modo de interação do ligante — os chamados posicionamentos, ou “posing”, que são combinações de orientações e conformações [KITCHEN et al., 2004; BROOIJMANS & KUNTZ, 2003].

A investigação de todas as combinações possíveis em um domínio protéico geraria um número enorme de combinações, geralmente bilhões. Qualquer solução para este problema requer uma excelente técnica de pesquisa e amostragem, capaz de explorar adequadamente as orientações e as conformações de interação entre a proteína e o ligante, e um bom entendimento do processo de reconhecimento molecular, para o desenvolvimento das chamadas “funções de escore” (“scoring functions”), capazes de predizer as interações de forma rápida e confiável. Portanto, o processo é iniciado com a aplicação de algoritmos de atracamento capazes de atracar as pequenas moléculas em um sítio ativo, fazendo uma amostragem efetiva de regiões no espaço próximas à solução correta, sem uma investigação exaustiva de todas as conformações. De forma geral, há dois objetivos nos estudos por atracamento: a modelagem estrutural com acurácia e a predição correta da atividade [McCONKEY et al., 2002; JONES et al., 1997].

O teste das várias possibilidades, devido ao grande grau de liberdade dentre as conformações possíveis em uma molécula, deve ser efetuado com acurácia suficiente para identificar a conformação que melhor interage com a estrutura do receptor/enzima, e deve ser rápido o suficiente para permitir a avaliação de centenas de compostos. Para tanto, os algoritmos são complementados por funções de escore, designadas à predição da atividade biológica através da avaliação de interações (geralmente eletrostáticas e de vdW, conforme descritas no item anterior) entre os compostos e alvos protéicos, além de efeitos entrópicos e de solvatação [GOHLKE & KLEBE, 2002; HALPERIN et al., 2002].

Para avaliar os métodos de atracamento, é importante considerar como os ligantes e proteínas são representados pelos programas. Existem três representações básicas:

1 – Representação atômica: em geral, apenas é usada em conjunção com funções de energia potencial, ou durante procedimentos de ranqueamento (“ranking”) — a reavaliação de vários resultados de escores iniciais, para uma reprodução da interação mais próxima possível da realidade — pela complexidade computacional da avaliação das interações atômicas repetidamente [HALPERIN et al., 2002].

2 – Representação superficial: programas baseados neste tipo de representação de superfície são apenas utilizados para atracamento entre duas proteínas (o chamado atracamento proteína/proteína), através do alinhamento de pontos superficiais, minimizando o ângulo entre as superfícies de moléculas opostas [NOREL et al., 1999].

3 – Representação em grade: o uso de grades de energia potencial, iniciado por Goodford (1985), é feito por vários programas para o cálculo de energia, acumulando informações sobre a contribuição energética da proteína como pontos em uma grade ou rede, para que sejam lidas e utilizadas durante o escore do ligante. Isto é feito com a energia potencial eletrostática (equação 2), representada como uma soma de interações coulombianas, e a de vdW (equação

3), modelada como uma função 12-6 de Lennard-Jones [KITCHEN et al., 2004]:

(2)

(3)

onde NA e NB representam o número de átomos das moléculas A e B, respectivamente, q a carga de cada átomo, rij a distância entre eles e ε0 é a constante dielétrica; ε representa a profundidade do poço do potencial, e σ o diâmetro de colisão dos átomos i e j [GOODFORD, 1985]. A figura 4.2 demonstra a representação da função 12-6 de Lennard-Jones. Repulsões de curta distância são representadas pelo termo 1/r12 enquanto que as forças atrativas provenientes dos efeitos de dispersão de London são descritas pelo termo 1/r6.

Figura 4.2: Gráfico representativo da função 12-6 de Lennard-Jones, e demonstração das variáveis ε e σ (equação 3).

Adaptado de: KITCHEN et al., 2004.

   B A N j ij j i N i coul r q q r E 1 0 1 4 ) ( 

                            B A N j ij ij ij ij N i vdW r r r E 1 6 12 1 4 ) (

energia de van der Waals

distância energia

A figura 4.3 demonstra uma grade representativa para capturar potenciais eletrostáticos, que podem ser demonstrados pelo programa que os calcula como um mapa de potencial eletrostático, demonstrando quais partes do ligante se encontram com maior ou menor densidade eletrônica, de acordo com a interação feita com aquele receptor ou enzima. A maior parte dos programas utilizados atualmente para atracamento utiliza este modo de representação.

Figura 4.3: Exemplos de representações em grade: [A] Superfície de uma grade capturando o potencial eletrostático de uma HIV protease (código PDB 1BVE) por todo seu sítio ativo, com seu inibidor. Áreas em azul e vermelho representam áreas de potencial eletrostático positivo e negativo, respectivamente. [B] Grade de potencial eletrostático “contrário” (cut-away) de uma enzima ao redor do inibidor ligado (não incluído no cálculo).

Fonte: KITCHEN et al., 2004.

Os algoritmos utilizados para tratar a flexibilidade do ligante são divididos em três categorias básicas. A primeira constitui os denominados métodos sistemáticos, com algoritmos que exploram todos os graus de liberdade conformacional da molécula, mas que vêm sendo menos utilizados, pois possuem o problema denominado “explosão combinatorial”. Vários fragmentos moleculares são atracados no sítio, sendo então ligados covalentemente um ao outro, podendo ser ainda divididos em regiões rígidas (“núcleos”) e flexíveis (cadeias laterais) [LEACH, 2001]. Tal método inclui ainda, em alguns programas, uma pesquisa de conformações geradas previamente, em bancos de dados.

Uma segunda categoria engloba os denominados métodos estocásticos, que atuam promovendo mudanças aleatórias em ligantes, de acordo com funções de probabilidade, implementadas principalmente por duas metodologias: “Monte Carlo” e “algoritmo genético”

A

(GA); esta última é utilizada por vários programas, incluindo o GOLD (Genetic Optimisation for Ligand Docking — Otimização Genética para Atracamento de Ligantes — CCDC Ltd.). O GA utiliza uma estratégia evolucionária para explorar a variabilidade estrutural de um ligante flexível, testando simultaneamente vários modos disponíveis de ligação em um sítio ativo protéico parcialmente flexível [KITCHEN et al., 2004; JONES et al., 1997].

Os métodos simulacionais constituem a terceira categoria básica, sendo a técnica de dinâmica molecular (simulação dos movimentos e do espaço conformacional de sistemas de partículas atômicas [GOODMAN, 2000]) a mais utilizada neste tipo de método. Estes constituem métodos mais demorados, por se tratarem de processos dinâmicos complexos, e devem apenas ser utilizados quando não há uma grande barreira energética a ser quebrada para o atracamento, sendo necessário utilizar diferentes fragmentos protéicos para que a técnica seja aplicada de forma mais adequada.

A avaliação e ranqueamento de conformações dos ligantes é um aspecto crucial para o atracamento. Por tal motivo foram implementadas as funções de escore, compreendendo várias suposições e simplificações na avaliação dos complexos formados, pois estes não contam com vários fenômenos físicos que determinam o reconhecimento molecular, como por exemplo, os efeitos entrópicos. Há três tipos de funções de escore: as baseadas em campos de força (“force-field-based scoring functions”), as empíricas (“empirical scoring functions”) e as baseadas em conhecimentos (“knowledge-based scoring functions”), que serão demonstradas a seguir [KITCHEN et al., 2004].

i. Funções de escore baseadas em campos de força:

Estas funções quantificam a soma de duas energias: a de interação entre o receptor e o ligante (energia “externa”) e a energia “interna” do ligante. Por constituir um método de campo de força (MM), são também investigadas as interações não-ligadas envolvidas no reconhecimento molecular. As interações entre o ligante e a proteína em jogo são quase sempre descritas utilizando termos de energia eletrostática e de vdW. Potenciais 12-6 (Lennard-Jones) (equação 3), como o presente da função “D-Score” [KRAMER et al., 1999], aumentam a repulsão, desfavorecendo contatos muito próximos entre receptor e ligante; termos menores, como o potencial 8-4 da função “G-Score” [KRAMER et al., 1999], tornam este termo mais “suave”.

corte” para o tratamento destas interações não-ligadas. Distâncias muito grandes complicam a acurácia do método, diminuindo a possibilidade de atracamento nestas posições muito distantes. Muitos destes escores foram originalmente feitos para modelar contribuições estruturais e entálpicas em fase gasosa, não incluindo termos entrópicos e de solvatação [KITCHEN et al., 2004; SCHNEIDER & BÖHM, 2002].

A maior parte das funções de escore considera uma única conformação protéica, o que faz com que a determinação da energia interna da proteína possa ser omitida, simplificando o cálculo do escore. Várias funções são baseadas em diferentes parâmetros de campos de força: por exemplo, o “G-Score” é baseado no campo de força Tripos [KRAMER et al., 1999] e o “AutoDock” [MORRIS et al., 1998] é baseado no campo de força AMBER [WEINER et al., 1986]. Algumas funções possuem extensões dos termos de energia para englobar termos entrópicos e outros. Como exemplo, temos a inclusão de termos de entropia torsional ao “G- Score” e “Goldscore” [VERDONK et al., 2003], e a inclusão de termos para ligação hidrogênio entre ligante e proteína no “Goldscore” [VERDONK et al., 2003] e “AutoDock” [MORRIS et al., 1998].

ii. Funções de escore empíricas:

Essas funções de escore reproduzem dados experimentais, como energias de interação e conformacionais, como uma soma de várias funções parametrizadas, primeiramente propostas por Böhm (1992), baseado na aproximação das energias de interação por uma soma de termos individuais não-correlacionados. Tais termos são obtidos de uma análise por regressão, usando energias de interação determinadas experimentalmente, com informações estruturais (obtidas por cristalografia de raios-X). Suas formas funcionais são frequentemente mais simples que as funções de escore obtidas por campos de força, com termos de avaliação mais simples. Sua desvantagem reside na dependência dos conjuntos de dados moleculares, o que leva a diferentes fatores (quando comparados a funções de campos de força), que não podem ser facilmente recombinados em uma nova função de aptidão [KITCHEN et al., 2004]. Para evitar isso, termos que contabilizam interações não-ligadas podem ser implementados de várias formas. Na formulação de “LUDI” [BÖHM, 1992], os termos de ligação hidrogênio são separados em ligações hidrogênio neutras e ligações hidrogênio iônicas, enquanto o “ChemScore” [ELDRIDGE et al., 1997] não diferencia os tipos de ligação hidrogênio. “LUDI” calcula as contribuições hidrofóbicas com base na representação da área superficial molecular, enquanto “ChemScore” avalia o contato entre pares de átomos hidrofóbicos, e “F-

Score” [RAREY et al., 1996] adiciona um termo para incluir as interações entre fragmentos aromáticos.

iii. Funções de escore baseadas em conhecimento:

Estas funções de escore foram feitas para reproduzir estruturas experimentais, ao invés de energias de ligação. Os complexos ligante-proteína são modelados usando potenciais de interação atômica relativamente simples. Assim como os métodos empíricos, incluem implicitamente efeitos de ligação difíceis de incluir explicitamente. Implementações destas funções incluem o “PMF” (“Potencial of Mean Force”) [MUEGGE & MARTIN, 1999] e o “DrugScore” [GOHLKE et al., 2000], que também incluem correções como a acessibilidade ao solvente, dentre outras. “SMoG” [DeWITTE & SHAKHNOVICH, 1996] utiliza potenciais de pares de átomos para avaliar interações entre ligantes e proteínas. Tais funções primam pela simplicidade, fazendo com que grandes conjuntos de moléculas possam ser avaliadas com rapidez. A desvantagem deste método reside no fato de que sua derivação é baseada na informação codificada implicitamente em conjuntos limitados de complexos ligante-proteínas.

No documento Download/Open (páginas 83-89)