• Nenhum resultado encontrado

Aplicação de Modelos de potencial da Água baseados em RNAs em Simulações de Monte Carlo

Resultados dos Treinamentos

3.3.4. Aplicação de Modelos de potencial da Água baseados em RNAs em Simulações de Monte Carlo

Simulações de Monte Carlo são continuamente investigadas do ponto de vista computacional, para que o tempo de simulação não inviabilize o estudo de sistemas grandes (elevado número de átomos) e a exatidão seja aprimorada com representações que prevejam com confiabilidade as propriedades dos sistemas simulados. A dependência limitante da demanda computacional é dada pelo cálculo do potencial de interação. Modelos baseados em RNAs poderiam constituir uma opção para este fim, através do ajuste de funções a partir de resultados ab initio ou outros ramos da inteligência artificial,

como algoritmos genéticos, ou combinação de ambos114. Daí o estudo a que se voltou esta

etapa do trabalho de pesquisa, na qual testou-se potenciais de interação baseados em RNAs em simulações de Monte Carlo. Existem trabalhos publicados referentes à obtenção de

superfícies de energia potencial coerentes para a água líquida usando RNAs115, entretanto

ainda permanece desconhecida a atuação destes modelos em simulações.

Para obtenção do modelo baseado em RNAs capaz de atuar em simulações de Monte Carlo, além da rede neural treinada com dados sistemáticos, gerou-se novos conjuntos de dados, os quais provém de caixas de simulação geradas randomicamente ou equilibradas previamente em simulações de Monte Carlo. Tais dados contém energias de valor maior, ampliando por completo a faixa de atuação da RNA. O objetivo é investigar a dependência das redes neurais com relação ao conjunto de treinamento.

O estudo realizado no item 3.5.3 indicou que o tipo de RNA a ser escolhida para esta tarefa é aquela do tipo MLP. Novos testes ratificaram esta escolha, de modo que os demais tipos de RNAs foram descartadas.

114

A RNA 4:4:1 mostrada na Figura 3.38 treinada a partir de dados gerados de forma sistemática (sistemático 1 na Tabela 3.30), cuja saída da rede fornece a energia de

interação de pares em kcal mol-1 apresentou desempenho desfavorável em simulações de

Monte Carlo. A densidade e energia média por molécula divergiram do valor simulado com o modelo TIP5P, bem como as energias monitoradas indicaram que a RNA não foi capaz de extrapolar a faixa para a qual foi treinada. Os dados gerados sistematicamente não explorou uma região considerável de energia (setas duplas na Figura 3.37), de modo que um dos teste seguintes foi incluir um passo menor nesta região formando um novo conjunto de dados, chamado sistemático 2. A Figura 3.40 apresenta este conjunto, para o qual em valores menores da distância quadrada usou-se um passo menor de distância para cálculo da energia. 2 4 6 8 10 12 14 -10 0 10 20 30 40 50 60 70 80

Energia (kcal mol

-1 )

R16

Figura 3.40: Energia do conjunto de dados de treinamento (Sistemático 2) com relação a

distância R16 (O1 ··· O2: oxigênios da moléculas 1 e 2).

Outros testes foram realizados: geração de novos conjuntos de dados, mudança da saída rede. Para este conjunto de dados contendo uma faixa de energia maior, usou-se a

saída da rede neural sugerida no trabalho de No et al. (1997) [f (V)=log(VVab,0+C)],

onde V é a energia de interação de pares, Vab,0 representa a energia da conformação mais

estável e C é uma constante que tem o papel de localizar a posição de máximo da função

f(V) e aumentar a eficiência do treinamento das RNAs. O valor 0,25 foi adotado pelos

autores116.

Neste trabalho para evitar o cálculo da energia da configuração mais estável durante as

simulações, incorporou-se Vab,0 na constante [f(E)=log(E+C), com E = V], de modo

115

K. Tanabe, T. Tamura, H. Uesaka, Appl. Spectrosc. 46, 807-810 (1992); B. Curry, D. E. Rumelhart, Tetrahedron Comput. Methodol. 3, 213-237 (1990).

que testou-se diversos valores de C para os quais C > Vab,0. A alteração foi importante para permitir a inclusão de altas energias no conjunto de treinamento com menor efeito no erro calculado. Entretanto, o desempenho das RNAs nas simulações de Monte Carlo não foi satisfatório, além de requerer um grande número de configurações para equilibração.

A Tabela 3.30 mostra um resumo dos resultados obtidos para algumas das RNAs testadas, exibindo o tipo de RNA, a função de saída (f(E)) com o valor da constante C, conjunto de treinamento utilizado e o percentual de aceitação para as variações de volume.

O conjunto de treinamento nomeado “Caixa equilibrada” corresponde a um conjunto de treinamento formado por valores de energias de interação calculadas a partir das configurações de pares aleatórios presentes em uma caixa previamente equilibrada em simulações de Monte Carlo usando o modelo TIP5P.

Os dados apresentados na Tabela 3.20 foram adquiridos após pelo menos 13 milhões de configurações, apesar do acompanhamento ter sido realizado a cada 1 milhão de configurações. Quando necessário, apresentou-se valores entre parênteses que representam a quantidade de configurações utilizadas para a leitura da medida apresentada.

Tabela 3.20: Resultados de simulações de Monte Carlo usando RNAs distintas e usando o modelo TIP5P.

RNA f(E) C Conjunto de Treinamento AVV(%) (milhões de configurações) (E/N)RNA ρ (g cm-3) 4:4:1 E - Sistemático 1 0,0 -950,7 1,01 4:4:1 E - Sistemático 2 0,0 -17,66 1,01

4:2:1 log(E + C) 8,0 Caixa equilibrada 0,0 -90,13 1,01

4:4:1 log(E + C) 8,0 Caixa equilibrada ~11,0 (< 4)

0,0 (> 4)

-257,2 1,15

4:3:1 log(E + C) 10,0 Caixa equilibrada ~95,0 3,25 0,88

4:2:1 log(E + C) 6,0 Caixa equilibrada ~30,0

0,0 (> 10)

-182,4 0,95

A energia média por molécula (E/N) para a caixa equilibrada após 190 milhões de

configurações é igual a -9,97 kcal mol-1, usando o modelo TIP5P. As simulações de Monte

Carlo usando o modelo TIP5P permitiram cálculos de correção de longa distância, ao passo

116

que com RNAs isto não foi feito. Verifica-se que para as seis RNAs apresentadas acima, a energia média por molécula diverge deste valor. Pode ser necessário um número maior de configurações para que a RNA 4:3:1 esteja devidamente equilibrada.

As Tabelas 3.21-22 apresentam resultados mais detalhados obtidos a partir do monitoramento de simulações de Monte Carlo executadas a partir de uma dada configuração (Figura 3.41) previamente equilibrada, usando a constante C igual a 8 (RNA 4:2:1). O protocolo inicial da equilibração é o mesmo apresentado no item 3.2.

Para variações de volume das primeiras configurações (< 200.000) ocorre aceitação para variação de volume, mesmo que muito baixa. As novas energias calculadas para movimentos rotacionais e translacionais vão diminuindo rapidamente usando o modelo baseado em RNAs e aumentando a partir do cálculo da energia usando o modelo TIP5P, de modo que o comportamento observado na Tabela 3.21 inverte-se e nenhuma variação de volume é aceita para a RNA (4:2:1) em teste. Por isto a ene rgia média por molécula tende a um valor menor que aquele previsto pelo modelo TIP5P (Tabela 3.22).

Figura 3.41: Configuração de pares de moléculas de água usadas para o treinamento de RNAs (caixa equilibrada em condição ambiente de temperatura e pressão).

A cada 200 mil configurações coletou-se as densidades do líquido (ρ) e a energia

média por molécula (E/N). Verificou-se ainda a aceitação quanto à variação de volume (AVV) do sistema (Tabela 3.22).

Tabela 3.21: Energias totais de interação (kcal mol-1) para uma caixa com 256 (L1) + 256 (L2) moléculas de água, usando o modelo baseado em RNAs e o modelo TIP5P.

RNA 4:2:1 TIP5P

-988,633 -1259,74

-1010,14 -1274,31

Interações Líquido 1 - Líquido 1 (L1L1)

-1029,32 -1278,07

-991,525 -1316,08

Interações Líquido 2 - Líquido 2

(L2L2) -999,351 -1338,26

-2007,29 -2489,72

Interações Líquido 1 - Líquido 2

(L1L2) -2057,44 -2492,09

Tabela 3.22: Energias médias por molécula (L1L1 + L2L2 + L1L2) para uma caixa com 512 moléculas de água utilizada em simulações de Monte Carlo.

FVV = 180

Documentos relacionados