• Nenhum resultado encontrado

4.5 Desempenho da modelagem com restrições experimentais

4.5.3 Impacto da modelagem com restrições nas vizinhanças da estrutura

Como destacado anteriormente na Tabela 6, o nosso resultado experimental de XLMS contém entre 25 e 40% das restrições que seriam esperadas teoricamente mesmo nas condições de seleção flexíveis aqui empregadas. Isso pode, por exemplo, ser o resultado da diminuição da reatividade intrínseca de determinados resíduos dado o seu microambiente, aspecto que não é considerado na avaliação do TopoLink. Mais curioso, entretanto, é que somente 16 a 19% das restrições experimentais são validadas pela estrutura cristalográfica.

Para avaliar a natureza das restrições não consistentes, o TopoLink foi utilizado para calcular as distâncias topológica e Euclidiana das restrições experimentalmente observadas para comprimentos de até 80 Å. Em seguida, calculou-se o desvio de Lmax associado a cada restrição de acordo com a natureza do

ALC e do par de resíduos envolvidos. Como resultado, obtém-se o perfil de desvios observados em relação à estrutura cristalográfica. A Figura 33 mostra o número de restrições validadas em função do desvio do limite estatístico, Lmax, para cada uma

das proteínas aqui investigadas. A curva em preto se refere aos desvios observados em relação à distância topológica. Por exemplo, para ALB-D1, 32 das 206 restrições experimentais são validadas pela estrutura cristalográfica. Aceitando-se um desvio de até 5 Å, porém, 62 restrições passam a ser possíveis. Para ALB-D3, 30 das 157 restrições experimentais são validadas pela estrutura cristalográfica, mas esse número aumenta para 50 se considerados 5 Å de desvio. Similarmente, um aumento expressivo do número de restrições validadas também ocorre para as outras proteínas em função do desvio de Lmax. Naturalmente, esses dados apontam que XLMS é uma

técnica poderosa para investigar a variabilidade conformacional desses sistemas em solução, aspecto não avaliado quando da obtenção da estrutura cristalográfica. Ainda, reforçam que um único modelo não é suficiente para representar o dado experimental que, portanto, deve ser representado por um conjunto de modelos complementares entre si. Além disso, é interessante notar que uma fração relevante das restrições só pode ser explicada por grandes desvios da estrutura cristalográfica. Por exemplo, 35% dos dados experimentais da ALB-D1 não podem ser explicados mesmo depois de distender o ALC por 20 Å de seu limite máximo. Para ALB-D2, ALB-D3 e SalBIII esses

valores são 39, 27 e 34% dos dados experimentais, respectivamente, para os mesmos 20 Å de desvio.

Figura 33: Validação das restrições experimentas de XLMS em função do desvio de Lmax. As

curvas em preto representam desvios em relação a distância topológica e as curvas em vermelho desvios em relação a distância Euclidiana calculadas a partir de Lmax.

A Figura 33 ainda avalia o perfil de validação dos dados experimentais como uma função dos desvios em Lmax quando considerada a distância Euclidiana

(curva vermelha). Obviamente, as distâncias Euclidianas são mais rapidamente validadas do que as respectivas distâncias topológicas. Para a ALB-D1, por exemplo, 32 restrições experimentais observadas são validadas pela estrutura cristalográfica quando a distância topológica é considerada, enquanto 44 são validadas se a distância Euclidiana é considerada. Um perfil similar é encontrado para os demais alvos. Do ponto de vista da modelagem, essas 12 restrições que não são validadas, ao se considerar a distância topológica, são consistentes, uma vez que o processo de modelagem só avalia distâncias Euclidianas. Isso se deve ao fato de que se uma restrição tem distância Euclidiana menor que Lmax existe uma probabilidade diferente

de zero de que exista uma distância topológica menor de Lmax. Além disso, essas 12

restrições devem corresponder ao conjunto de restrições que seriam validadas fisicamente ao se considerar pequenos desvios em Lmax.

Para testar a hipótese de que restrições nas vizinhanças da estrutura cristalográfica devem melhorar a qualidade dos modelos obtidos, modelamos esses quatro sistemas com diferentes conjuntos de restrições. Cada conjunto corresponde às restrições que são validadas em cada um dos seguintes desvios de Lmax: 0, 2, 4, 6,

8 e 10 Å, para distância topológica e Euclidiana, totalizando 12 modelagens para cada sistema.

A Figura 34 mostra a fração de modelos gerados em três critérios de qualidade, TM-score maior que 0,4, 0,5 e 0,6, em função do desvio de Lmax. As curvas

cheias mostram os resultados em função dos desvios na distância topológica. Como esperado, a condição de qualidade máxima para cada um dos alvos ocorre em valores diferentes de zero de desvio da distância topológica, entre 4 e 8 Å dependendo do sistema. Para ALB-D1, por exemplo, a condição com zero de desvio gera 6% de modelos com TM-score maior que 0,5. Esse valor sobe para 16% na condição ótima, alcançada com desvio de 4Å.

Analogamente, as curvas tracejadas mostram os resultados para os desvios em função da distância Euclidiana. Para os três domínios da Albumina, as modelagens correspondentes ao desvio zero resultaram no melhor conjunto de modelos dentre os desvios analisados. Para SalBIII, o máximo observado foi em 4 Å de desvio, mas com resultado muito similar àquele encontrado para devio igual a zero. Ainda, em todos os casos, o máximo de desempenho observado ao utilizar o conjunto de restrições da análise Euclidiana é similar ao máximo observado com o desvio em função da distância topológica, indicando consistência com nossas considerações iniciais.

Essa análise revela a importância de estratégias que eliminem falsos positivos ou restrições correspondentes a conformações muito distintas das de interesse para a modelagem da estrutura terciária, um desafio importante a ser perseguido na área de XLMS para aplicação abrangente da técnica para essa finalidade.

Figura 34: Avaliação do desempenho da modelagem ao se utilizar diferentes subconjuntos de restrições experimentais. Os subconjuntos são obtidos pela validação das restrições experimentais

em função do desvio de Lmax (Figura 33). As linhas cheias e tracejadas correspondem às tendências observadas para a modelagem em função da validação em função da distância topológica e Euclidiana, respectivamente. As cores preto, vermelho e azul correspondem a fração de modelos com TM-score maior que 0,4, 0,5 e 0,6, repectivamente.

4.5.4 Avaliação da modelagem como fonte de informação sobre o