• Nenhum resultado encontrado

4.2 Modelagem das restrições advindas dos experimentos de XLMS

4.2.1 Determinação do comprimento máximo, L max

Se um resíduo é encontrado ligado ao ALC, isto significa que o resíduo esteve acessível ao solvente em alguma conformação da proteína em solução. Se, adicionalmente, o ALC é encontrado ligado a um par de resíduos, A e B, isso implica que os átomos reativos Ax e By estiveram próximos a no máximo o comprimento da

cadeia espaçadora do ALC, LXL. O ALC funciona, dessa forma, como uma régua

molecular sobre a superfície da proteína. Portanto, a medida da distância entre os átomos Ax e By, d(Ax,By) deve ser o caminho físico entre eles, dtop(Ax,By), onde o índice

top se refere à distância topológica, a qual está definida aqui como o menor caminho

fisicamente acessível ao ALC que conecta os átomos reativos (Figura 20).

Figura 20: Informação do experimento de XLMS. A identificação de uma espécie de ligação cruzada

entre dois resíduos (linhas amarelas) implica que a distância entre os átomos reativos, d(Ax,By), é menor do que a comprimento da cadeia espaçadora, LXL. No entanto, uma estrutura cuja os átomos da cadeia principal estão fixos não representam todas as configurações entre os pares de resíduos que podem ser modificados pelo ALC. Como indicado pelas linhas vermelhas conectando os átomos C, configurações alternativas das cadeias laterais para a mesma cadeia principal pode potencialmente validar outras três restrições. Dessa forma, pelo menos a variabilidade devido à reorientação das cadeias laterais deve ser considerada para definir a distância máxima efetiva, Lmax, entre os resíduos que podem ser conectados.

Em princípio, a observação de uma espécie de ligação cruzada está associada aos átomos reativos das cadeias laterais estarem dentro do comprimento da cadeia espaçadora do ALC, dtop(Ax,By) ≤ LXL. Uma vez que os modelos estruturais

são estáticos e as cadeias laterais expostas ao solvente são frequentemente móveis, a distância entre os átomos das cadeias laterais pode não refletir a possibilidade de uma espécie de ligação cruzada em um dado modelo. Os átomos da cadeia principal e o átomo Cβ são posições mais estáveis para a introdução de potenciais restritivos.

A distância topológica máxima entre os átomos Cβ consistentes com a formação de uma espécie de ligação cruzada é Lmax=LXL+LA+LB, onde LXL é o

comprimento máximo da cadeia espaçadora e LA e LB os comprimentos das cadeias

laterais dos resíduos envolvidos. Se a distância topológica entre os átomos Cβ, dtop(ACβ/BCβ), é menor do que Lmax, os resíduos A e B podem formar uma espécie de

ligação cruzada, uma vez que as cadeias laterais podem flutuar para assumir conformações compatíveis com a distância topológica associada com dtop(ACβ,BCβ).

Dessa forma, em uma primeira aproximação, utilizar Lmax para restringir a distância

entre os resíduos pode ser considerado uma boa estratégia para incorporar a flexibilidade das cadeias laterais no procedimento de modelagem.

Entretanto, Lmax quando implementado como distância Euclidiana,

representa um cenário improvável no qual o ALC e ambas as cadeias laterais estão em sua conformação completamente estendida. Intuitivamente, restringir a distância entre átomos Cβ para algo menor do que Lmax deve ser uma boa abordagem na

maioria dos casos.

Aqui, primeiramente propomos que o Lmax efetivo pode ser acessado a

partir da análise estatística de estrutura de proteínas conhecidas (ver sessão 3.1.2 para mais detalhes). A distribuição de frequências das dtop(ACβ,Bcβ) nesse banco de

dados foi computada sob a condição de que dtop(Ax,By) ≤ LXL.Uma redução significante

da distância máxima pode ser obtida ao se eliminar uma fração (por exemplo, 1%) de cenários pouco prováveis. Dessa forma, foi definida uma distância máxima mais restrita que considera 99% das possíveis espécies de ligação cruzada, Lmax(0,99).

A Tabela 2 mostra os números do banco de dados criado a partir da medida da distância topológica entre os átomos C e entre os átomos reativos para alguns pares de interesse (KK, KS, SS, DD, DE e EE). Foram calculadas entre 100 mil e 241

mil distâncias entre C para cada par. Dessas, entre 4 e 5% das distâncias estavam associadas a átomos reativos estando a uma distância menor do que 11,5 Å (distância correspondente a cadeia espaçadora do DSS/BS3 e 1,6-hexanodiamina) e entre 1 e 2% com átomos reativos a uma distância menor do que 7,7 Å (distância que corresponde à cadeia espaçadora no DSG e 1,3-propanodiamina).

Tabela 2 Número de distâncias calculadas a partir das 21.000 estruturas do CATHS40(v4.1)

A Figura 22 mostra os resultados das distribuições de distâncias entre os C para os seis pares de resíduos indicados na Tabela 2 que podem formar espécies de ligações cruzadas com DSS/BS3 ou 1,6-hexanodiamina, ou seja, LXL=11,5 Å. Cada

gráfico é construído a partir do subconjunto de distâncias entre os C que possuem os átomos reativos a no máximo a distância LXL=11,5 Å. Por exemplo, do subconjunto

de pares de resíduos de Lys para os quais a distância entre os átomos Nζ está abaixo de 11,5 Å, 99% dos pares de átomos Cβ estão mais próximos do que 17,8 Å. Como resultado, 17,8 Å é a distância entre Cβ efetiva para esse ALC e esse par de resíduos. A distância máxima efetiva é designada limite estatístico.

pares total de entradas Entradas LXL ≤ 11,5 Å fraçãoEntradas LXL ≤ 11,5 Å Entradas LXL ≤ 7,7 Å fraçãoEntradas LXL ≤ 7,7 Å DD 1.134.892 49.955 0,04 19.535 0,02 DE 2.409.610 109.715 0,05 36.879 0,02 EE 1.415.423 75.096 0,05 23.928 0,02 KK 1.027.711 48.247 0,05 13.026 0,01 KS 2.009.671 82.786 0,04 29.631 0,01 SS 1.203.604 48.421 0,04 21.976 0,02

Figura 21: Definição estatística de Lmax. Depois de computar a distância topológica entre os átomos

reativos, o subconjunto de pares com distâncias menores do que o comprimento da cadeia espaçadora, 11,5 Å, foi selecionado. Em seguida, as distâncias topológicas entre os átomos C que tinham os correspondentes átomos reativos no subconjunto anterior foram selecionadas. A distribuição de distância topológicas revela que distâncias correspondentes a soma dos comprimentos das cadeias laterais e da cadeia espaçadora do ALC nunca são observadas (comparar com dados na Tabela 2). Nós definimos a distância máxima para o qual um par de resíduos podem ser observados conectados pelo ALC após remover cenários improváveis (1%). Por exemplo, no caso dos pares de Lisinas, Lmax(0,99)=17,8 Å (linha pontilhada vertical do primeiro gráfico), aumentando o papel restritivo da restrição por mais de 4 Å. Perfis similares foram obtidos para outros pares reativos.

Um caso um pouco distinto ocorre na parametrização das distâncias efetivas para as espécies de zero-length. Essas espécies são o resultado da união covalente de um nitrogênio de uma lisina ou um oxigênio de uma serina a um grupo carbonila de um ácido aspártico ou glutâmico e eliminação de uma molécula de água. Ou seja, a formação de uma espécie zero-length implica em um sistema mais restrito do que a proteína nativa. Dessa forma, devemos avaliar a distância associada ao estado da proteína no momento anterior à formação da espécie de zero-length. Aqui, computamos a distância topológica entre os átomos que estariam conectados após a reação através da ligação covalente. Na Figura 22 cada painel à esquerda mostra a distribuição de distâncias entre esses átomos de acordo com o par de resíduos envolvidos. Para todos os casos, um máximo a aproximadamente 4Å é observado nas

distribuições o qual é devido à interação polar e iônica que existe entre esses resíduos no momento anterior a formação da ligação. Uma distribuição normal, que é mostrada como uma curva azul tracejada em cada um dos gráficos é utilizada para ajustar a distribuição de probabilidade para essa condição e a distância contendo 99% da área sob a curva gaussiana é escolhida para representar a distância máxima entre os átomos reativos. Essa distância é tratada como LXL, embora não haja nenhum ALC

envolvido, e a determinação de Lmax é análoga àquela representada na Figura 22, a

partir das distribuições das distâncias dos C. A linha tracejada nos painéis à direita definem Lmax(0,99) para esses pares. A Tabela 3 resume os valores obtidos para os

limites estatísticos para cada um dos pares de resíduos e os quatro ALCs discutidos e os compara com a distância teórica associada às cadeias estendidas. Em todos os casos há aumento da precisão da informação gerada pela restrição do experimento de XLMS.

Tabela 3: Distância estendida e estatística (Lmax) para os pares de resíduos considerados. A distância efetiva máxima que contém 99% de as possíveis espécies de ligação cruzada ao se considerar as distribuições da Figura 20 é significativamente mais restritiva do que o comprimento máximo esperado. Conformações estendidas não são frequentemente observadas.

ALC ID distância estendida / Å Lmax(0,99)* / Å distância estendida - Lmax

BS3/DSS KK 21,8 17,8 4,0 KS 18,0 15,8 2,2 SS 14,1 13,4 0,7 DSG KK 18,0 15,2 2,8 KS 14,2 12,4 1,8 SS 10,3 10,0 0,3 1,6-hexanodiamina DD 14,1 13,5 0,6 DE 15,4 14,3 0,9 EE 16,7 15,1 1,6 1,3-propanodiamina DD 10,3 9,8 0,5 DE 11,6 10,7 0,9 EE 12,9 11,6 1,3 zero-length KE - 10,5 - KD - 9,7 - SE - 7,7 - SD - 7,0 -

Figura 22: Definição do limite estatístico, Lmax, para espécies de zero-length. Os painéis à direita

mostram a distribuição de distância entre os átomos que estão envolvidos na ligação covalente quando da formação da espécie de ligação cruzada. A aproximação Gaussiana mostrada na curva azul tracejada define a distância LXL para cada par como 99% da área sobre a curva. Os painéis à direita mostram as distribuições entre os C e a definição de Lmax análoga a mostrada na Figura 21.