1.2 Mudança de Paradigma – Bioinformática Estrutural
1.2.1 O Docking Molecular
1.2.1.2 GOLD – Genetic Optimisation for Ligand Docking
Os estudos de estruturas cristalográficas por difração de raio X de proteínas complexadas com ligantes de alta afinidade revelaram que estes parecem adequar-se à forma da cavidade do receptor, de forma a maximizar a contribuição hidrofóbica à ligação, além de interagirem em diversos sítios onde é possível formar ligações de hidrogênio. Desta maneira, o principal requerimento para uma ligação de alta afinidade parece ser a complementaridade da forma tridimensional do ligante e da proteína, além da habilidade do ligante em formar ligações de hidrogênio em pontos chaves quando associado ao sítio de ligação. Para entender como e por que os inibidores se ligam a uma enzima, por exemplo, este conceito de forma complementar entre as superfícies das moléculas é tratado como uma ferramenta de grande utilidade. As contribuições mais significantes desta complementaridade de forma são provavelmente as interações dispersivas entre os átomos da proteína e do ligante, juntamente com uma contribuição entrópica que surge a partir do deslocamento de águas ordenadas do sítio receptor para o solvente. Assim, uma simulação suficientemente precisa de muitas destas interações pode ser o suficiente para explicar e predizer o modo de ligação da maioria dos ligantes de alta afinidade (JONES, WILLETT e GLEN, 1995; JONES et al., 1997).
Por conta disto, o AG utiliza uma nova representação do processo de
docking. O algoritmo genético presente no programa GOLD (Genetic Optimisation for Ligand Docking), por exemplo, leva em conta o mapeamento entre átomos doadores para
ligações de hidrogênio e pares de elétrons isolados no ligante e na proteína, além dos ângulos torcionais das moléculas (considera a variabilidade conformacional do ligante e da proteína); em cada cromossomo está codificada uma conformação interna das moléculas e inclui um “mapa” dos aceptores e doadores de ligações de hidrogênio no ligante e na proteína. O programa GOLD adota um AG que utiliza uma estratégia evolucionária na exploração da flexibilidade conformacional total do ligante, com uma flexibilidade parcial da proteína na região do sítio de ligação (JONES e WILLETT, 1995; JONES, WILLETT e GLEN, 1995; JONES et al., 1997).
Na execução de um cálculo de docking no programa GOLD, primeiramente uma população de potenciais soluções (possíveis orientações e conformações do ligante no sítio estudado) é criada aleatoriamente. Cada membro da população está codificado como um cromossomo, o qual contém informações conformacionais e os ângulos de torção que podem ser modificados (do ligante e de algumas cadeias laterais de aminoácidos do sítio receptor), além do mapeamento de pares de elétrons isolados (de potenciais átomos aceptores de ligação de hidrogênio) e hidrogênios (de potenciais átomos doadores para ligações de hidrogênio) no ligante e na proteína – complementaridade entre doadores e aceptores de ligação de hidrogênio. O cromossomo contém, ainda, informações sobre mapeamento dos pontos hidrofóbicos do ligante com pontos hidrofóbicos da proteína.
Para posicionar o ligante no interior do sítio de ligação, na decodificação do cromossomo o AG utiliza uma rotina de mínimos quadrados, em uma tentativa de se formar tantas ligações de hidrogênio quanto forem possíveis (sugeridas no mapeamento dos aceptores e doadores de ligação de hidrogênio presente nos cromossomos), definindo, desta maneira, uma orientação do ligante no sítio estudado. Assim, as conformações do ligante e do sítio ativo resultantes da rotação torcional são examinadas para se determinar a extensão do encaixe entre átomos de hidrogênio e pares isolados e, portanto, a possibilidade de uma ligação de hidrogênio ser formada entre cada possível par doador-aceptor (JONES, WILLETT e GLEN, 1995; WILLETT, 1995; JONES et al., 1997).
No docking molecular que utiliza AG, a aptidão é representada pela energia de interação total do ligante com a proteína e é avaliada utilizando-se uma função de energia (MORRIS et al., 1998). Para cada cromossomo é assinalado um escore fitness baseado na predição de sua afinidade de ligação e esta função escore é utilizada para ordenar (“ranquear”) os modos de ligação gerados nos cálculos de docking (JONES et al., 1997). A função escore do programa GOLD é uma combinação da energia de van der Waals para a interação ligante- proteína (capaz de descrever uma contribuição significante da energia hidrofóbica da ligação), a energia interna da conformação do ligante (descrita através de mecânica molecular) e a energia de ligação de hidrogênio para o complexo (JONES e WILLETT, 1995; JONES, WILLETT e GLEN, 1995; JONES et al., 1997).
A função fitness, portanto, é avaliada em seis estágios: (1) uma conformação do ligante e do sítio receptor da proteína é gerada; (2) o ligante é posicionado no interior deste sítio utilizando um procedimento de mínimos quadrados; (3) a energia de ligação de hidrogênio é obtida para o complexo; (4) a energia de van der Waals é obtida para a interação ligante-proteína; (5) expressões de mecânica molecular são utilizadas para gerar uma medida
da energia interna do ligante; (6) a soma destes termos de energia (com seus respectivos pesos) é realizada para dar um escore fitness final. Os diferentes pesos dos componentes de energia da função escore do programa GOLD foram determinados através de ajustes empíricos para melhor reproduzir estruturas conhecidas de ligantes complexados a macromoléculas (JONES, WILLETT e GLEN, 1995; JONES et al., 1997).
Após a formação aleatória de uma população inicial e o cálculo da aptidão de seus indivíduos, a população de cromossomos é, então, otimizada iterativamente. A cada passo são aplicados os operadores genéticos descritos acima: mutação pontual do cromossomo, cruzamento de dois cromossomos e migração de um membro da população de uma ilha para outra. A seleção dos cromossomos parentais é sempre tendenciosa no sentido dos membros mais aptos da população (soluções com melhores escores fitness), utilizando-se o Método da Roleta para esta seleção. Cada um dos operadores genéticos retira informações dos cromossomos parentais e reúne estas informações nos cromossomos filhos. Os cromossomos filhos então substituem os membros menos aptos de seu nicho (ou, se for o caso, da população total). Os pesos dados a estes operadores governam as frequências relativas dos três tipos de operações que podem ocorrer durante a otimização geométrica (mutação, cruzamento e migração). Assim, cada vez que o algoritmo genético seleciona um operador, ele o faz de modo aleatório, mas tendencioso, novamente utilizando o Método da Roleta.
No GOLD as entradas para o AG são a localização e o tamanho do sítio receptor, indicados pelo usuário, além do ligante que será complexado neste sítio. As saídas, por sua vez, são as conformações do ligante e da proteína associadas ao cromossomo mais apto na população final quando as condições de término do algoritmo são satisfeitas (embora outros cromossomos, com escores fitness piores, possam ter melhores encaixes ao receptor). Este programa tem se mostrado eficiente na predição dos modos de ligação de um grande número de ligantes flexíveis (JONES, WILLETT e GLEN, 1995; WILLETT, 1995; JONES et al., 1997).
Após a análise dos resultados dos cálculos de docking em tela gráfica, o complexo receptor-ligante (ou os possíveis complexos) pode(m) então ser selecionado(s), obtendo-se um possível posicionamento para os ligantes no sítio de ligação dos receptores alvo (KUNTZ et al., 1982; SHOICHET e KUNTZ, 1991; SHOICHET, BODIAN e KUNTZ, 1992).