Estudo da colisão de um próton com um par de base do DNA via dinâmica molecular clássica

(1)

JHAISON COSTA DE FARIA

ESTUDO DA COLISÃO DE UM PRÓTON COM UM PAR DE BASE DO DNA VIA DINÂMICA MOLECULAR CLÁSSICA

CAMPINAS 2019

(2)

ESTUDO DA COLISÃO DE UM PRÓTON COM UM PAR DE BASE DO DNA VIA DINÂMICA MOLECULAR CLÁSSICA

Dissertação apresentada ao Instituto de Física "Gleb Wataghin"da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestre em Física, na Área de Física Aplicada.

Orientador: Prof. Dr. Mario Antonio Bernal Rodriguez

Coorientador: Prof. Dr. Ricardo Paupitz Bar-bosa dos Santos

ESTE EXEMPLAR CORRESPONDE À VER-SÃO FINAL DA DISSERTAÇÃO DEFEN-DIDA PELO ALUNO JHAISON COSTA DE FARIA ORIENTADO PELO PROF. DR. MARIO ANTONIO BERNAL RODRIGUEZ e COORIENTADO PELO PROF. DR. RI-CARDO PAUPITZ BARBOSA DOS SAN-TOS.

Campinas 2019

(3)

Biblioteca do Instituto de Física Gleb Wataghin Lucimeire de Oliveira Silva da Rocha - CRB 8/9174

Faria, Jhaison Costa de,

F225e FarEstudo da colisão de um próton com um par de base do DNA via dinâmica molecular clássica / Jhaison Costa de Faria. – Campinas, SP : [s.n.], 2019.

FarOrientador: Mario Antonio Bernal Rodriguez.

FarCoorientador: Ricardo Paupitz Barbosa dos Santos.

FarDissertação (mestrado) – Universidade Estadual de Campinas, Instituto de Física Gleb Wataghin.

Far1. Dinâmica molecular. 2. Prótons. 3. DNA. I. Bernal Rodriguez, Mario Antonio, 1972-. II. Santos, Ricardo Paupitz Barbosa dos, 1973-. III.

Universidade Estadual de Campinas. Instituto de Física Gleb Wataghin. IV. Título.

Informações para Biblioteca Digital

Título em outro idioma: Study of the collision of a proton with a base pair of DNA via classical molecular dynamics

Palavras-chave em inglês: Molecular dynamics

Protons DNA

Área de concentração: Física Aplicada Titulação: Mestre em Física

Banca examinadora:

Mario Antonio Bernal Rodriguez [Orientador] Alexandre Fontes da Fonseca

Elisabeth Mateus Yoshimura Data de defesa: 24-05-2019

Programa de Pós-Graduação: Física

Identificação e informações acadêmicas do(a) aluno(a)

- ORCID do autor: https://orcid.org/0000-0003-0544-4498 - Currículo Lattes do autor: http://lattes.cnpq.br/0701072278371764

(4)

DE FÍSICA “GLEB WATAGHIN”, DA UNIVERSIDADE ESTADUAL DE CAMPINAS, EM 24 / 05 / 2019.

COMISSÃO JULGADORA:

- Prof. Dr. Mario Antonio Bernal Rodriguez – Orientador –

DFA/IFGW/UNICAMP

- Prof. Dr. Alexandre Fontes da Fonseca – DFA/IFGW/UNICAMP

- Profa. Dra. Elisabeth Mateus Yoshimura – IF/USP

OBS.: Informo que as assinaturas dos respectivos professores membros da banca

constam na ata de defesa já juntada no processo vida acadêmica do aluno.

CAMPINAS

2019

(5)

À minha querida mãe, Maria Lucileide Alves da Costa, e à minha queria esposa, Cinara Littig Vilela.

(6)

O objetivo deste trabalho é estudar a colisão de um próton com um par de base citosina-guanina do DNA via dinâmica molecular clássica e comparar os resultados com os ob-tidos previamente usando dinâmica molecular quântica. Isso permitiria estudar estruturas do DNA mais complexas, já que poderíamos incluir até milhares de átomos no cálculo clássico, algo proibido no quântico. Foi usado o programa LAMMPS para resolver as equações de mo-vimento e extrair as propriedades desejadas do sistema. O potencial usado é o campo de forças REAXFF. Observa-se que apesar de ambos os métodos preverem a quebra das mesmas liga-ções, as energias transferidas e tempos de dissociação são muito diferentes. De fato, o cálculo clássico subestima a energia transferida quando comparado com o quântico. Percebe-se que o método de equilíbrio de carga Qeq instalado no LAMMPS e o REAXFF não estariam prepara-dos para estudar processos de colisões rápidas. Conclui-se que esse estudo para ser completado precisa da resolução de dois problemas: (1) introduzir um novo método de equilíbrio carga que leve em conta a distância entre os átomos e (2) um estudo mais profundo do potencial de interação de um próton com os átomos que formam o DNA.

(7)

The objective of this work is to study the collision of a proton with a pair of cytosine-guanine base of DNA via classical molecular dynamics and compare the results with those obtained previously using quantum molecular dynamics. This would allow us to study more complex DNA structures, since we could even include thousands of atoms in the classical cal-culus, something forbidden in the quantum. The LAMMPS program was used to solve the equations of motion and extract the desired properties of the system. The potential used is the REAXFF force field. It is noted that although both methods provide for the same bond break, the transferred energies and dissociation times are very different. In fact, classical calculation underestimates the energy transferred when compared to the quantum. It is noticed that the Qeq load balancing method installed in LAMMPS and REAXFF would not be prepared to study rapid collision processes. It is concluded that this study to be completed needs to solve two problems: (1) introduce a new method of equilibrium load that takes into account the distance between atoms and (2) a deeper study of the interaction potential of a proton with the atoms that form the DNA.

(8)

2.1 Bases purina (esquerda) e pirimidina (direita) [13]. . . 14

2.2 Bases guanina (esquerda) e adenina (direita) [13]. . . 15

2.3 Bases timina (esquerda), citosina (centro) e uracila (direita) [13]. . . 15

2.4 Açúcar desoxirribose do DNA [13]. . . 16

2.5 Fosfato [15]. . . 16

2.6 Figura de um nucleotídeo. Fonte: [13]. . . 17

2.7 Cadeia de nucleotídeos [13]. . . 17

2.8 Representação do DNA [13]. . . 18

2.9 Pares de bases A-T (em cima) e C-G (em baixo) [17]. . . 19

2.10 Principais tipos de conformações do DNA [18]. . . 20

3.1 Passos na modelagem da dinâmica da matéria. Adaptado de fonte:[19]. . . 28

3.2 Condições de contorno periódicas. fonte: [20]. . . 30

4.1 Sobrecoordenação e subcoordenação.fonte: [10]. . . 39

4.2 Aleno [33]. . . 41

4.3 Molécula fictícia para demonstrar o que é o ângulo de torção. .fonte: [34]. . . . 43

4.4 Potenciais blindados para orbitais de Slater 1s-7s. . . 51

5.2 Primeiros Resultados. Comportamento das ligações de hidrogênio centrais para o impacto central. . . 56

5.3 Primeiros Resultados. Comportamento das ligações de hidrogênio centrais para o impacto no fósforo. . . 57

5.4 Comportamento das ligações de hidrogênio centrais para o impacto central. . . 59

5.5 Comportamento das ligações açúcar-fosfato para o impacto central. . . 60

5.6 Comportamento das ligações açúcar-guanina e açúcar-citosina para o impacto central. . . 61

5.7 Carga normal durante o impacto central. . . 61

5.8 Carga com os coeficientes do REAXFF alterado durante o impacto central. . . . 62

5.9 Carga com o algoritmo do LAMMPS alterado durante o impacto central. . . 62

5.10 Comportamento das ligações açúcar-guanina e açúcar-citosina para o impacto no fósforo. . . 63

5.11 Comportamento das ligações de hidrogênio centrais para o impacto no fósforo. 64 5.12 Comportamento das ligações açúcar-fosfato para o impacto no fósforo. . . 65

5.13 Comportamento de duas ligações Oxigênio-Fósforo, do grupo fosfato, no im-pacto no fósforo. . . 66

(9)

(10)

Sumário 1 Introdução 12 2 O DNA 14 2.1 A Base . . . 14 2.1.1 Purinas . . . 15 2.1.2 Pirimidinas . . . 15 2.2 O Açúcar . . . 16 2.3 O Fosfato . . . 16 2.4 As Ligações . . . 16 2.5 A dupla hélice . . . 18

3 Dinâmica Molecular Clássica 21 3.1 Mecânica Clássica Newtoniana . . . 22

3.2 Resolvendo as Equações de Movimento . . . 23

3.2.1 O Método de Verlet . . . 23

3.2.2 O Método Velocity-Verlet . . . 25

3.3 Espaço de Fase . . . 26

3.4 Medidas de Propriedades e Incertezas . . . 27

3.5 Modelando a Dinâmica Molecular . . . 27

3.5.1 Interação com o Ambiente . . . 28

3.5.2 O Potencial . . . 29

3.5.3 Solução das Equações de Movimento . . . 30

3.5.4 Inicialização . . . 31

3.5.5 Equilibração . . . 31

3.5.6 Produção . . . 31

3.5.7 Análise das Trajetórias . . . 32

3.6 Simulação Clássica: O Programa LAMMPS . . . 32

3.7 Simulação Clássica: O Programa VMD . . . 34

4 O Campo de Forças REAXFF 35 4.1 Ordem de Ligação e Energia de Ligação . . . 35

4.2 Energia de Pares Isolados . . . 38

4.3 Energia de Sobrecoordenação e Energia de Subcoordenação . . . 38

4.4 Energia dos Ângulos de Valência . . . 40

4.5 Energia de Penalidade . . . 41

4.6 Energia para Sistemas Conjugados de Três Corpos . . . 42

(11)

4.10 Energia de Sistemas Conjugados . . . 44

4.11 Energia para Ligações de Hidrogênio . . . 45

4.12 Energia de van der Waals . . . 45

4.13 Energia de Coulomb . . . 46

4.14 O Método QEq . . . 47

4.14.1 O Hidrogênio . . . 52

5 Metodologia e Resultados 53 5.1 Primeiros Resultados e Problemas Encontrados . . . 55

5.1.1 Impacto Central . . . 55

5.1.2 Impacto sobre o átomo de Fósforo . . . 56

5.1.3 Análise . . . 57

5.2 Últimos Resultados e Problemas Encontrados . . . 58

5.2.1 Impacto Central . . . 58

5.2.2 Impacto Fósforo . . . 63

6 Conclusões 68

(12)

Capítulo 1

Introdução

Durante a interação com o DNA, a radiação ionizante1 perde energia, principal-mente mediante os processos de ionização e excitação da molécula. Esses processos geram danos no DNA [1], a maioria dos quais são reparados pelos mecanismos celulares responsáveis pela manutenção da integridade do genoma. O dano do DNA pode levar ao câncer. Por causar danos nas células, as radiações ionizantes são utilizadas para destruir células malignas (radiote-rapia)2. Os tecidos cancerosos têm seus mecanismos de reparação danificados, o que não ocorre com os tecidos normais. Assim, quando um paciente é irradiado, os tecidos cancerosos tendem a sofrer mais do que os saudáveis [2, 3, 4].

O estudo e uso de radiação ionizante em aplicações médicas começou com três im-portantes descobertas: os raios-X por Wilhelm Roentgen em 1895, a radioatividade natural por Henri Becquerel em 1896 e o elemento químico Rádio por Pierre e Marie Curie em 1898. Desde então, a radiação ionizante tem desempenhado um papel importante na medicina, permitindo o surgimento da Radioterapia e junto com ela, a Radiobiologia, ramo da ciência que estuda os efeitos biológicos causados por essa radiação. Curiosamente, os potenciais benefícios do uso dos raios-X para o diagnóstico por imagens foi percebido poucas semanas após sua descoberta [5]. Sem dúvidas foi um dos descobrimentos na Física que mais rápido se aplicou em Medicina. Diferentemente dos fótons e elétrons, que vêm sendo usados na radioterapia do câncer há mais de um século, o próton teve sua primeira aparição nessa área em 1946 quando, Robert R. Wilson, produziu o primeiro artigo sobre a possibilidade de se usar feixes de pró-tons para a terapia de câncer. Desde então, a radioterapia com própró-tons (também chamada de Protonterapia) foi crescendo cada vez mais, sobretudo na última década [6].

A radiação de prótons tem sido usada para o tratamento do câncer [7]. Além do uso crescente em aplicações clínicas, a Radiobiologia de prótons também é importante para a industria aeroespacial já que aproximadamente 90% da radiação cósmica é constituída de prótons e saber como ela afeta os astronautas é de suma importância para as agências espaciais [6].

Na tentativa de se explicar os efeitos biológicos induzidos por radiações ionizan-1_{Radiação ionizante neste contexto é aquela capaz de provocar ionização em meios biológicos.}

(13)

tes, muitos modelos foram desenvolvidos. Inicialmente, ensaios in vitro foram implementados, onde células eram cultivadas, irradiadas e depois analisadas. Posteriormente e com a evolução dos computadores, métodos numéricos como as simulações de Monte Carlo e mais recente-mente com a Teoria do Funcional da Densidade Dependente do Tempo - TD-DFT, têm sido aplicados para estudar o dano físico-químico inicial induzido por radiações ionizantes no DNA [8]. Esses modelos numéricos propostos até então, sejam clássicos ou quânticos, não simula-vam o impacto direto da radiação com algum componente do DNA. O primeiro trabalho nesse sentido foi realizado em 2017, onde foi usado a TD-DFT para simular a colisão de um próton de 4 keV com um par de base Citosina-Guanina do DNA. Os resultados encontrados estavam em bom acordo com os dados experimentais, mas o grande problema encontrado é que o custo computacional é muito grande. Levou-se cerca de 6 semanas para rodar uma simulação de 194 fs [8].

A sequência de eventos que ocorre quando a radiação ionizante interage com a matéria é dividida em vários estágios: o físico, com intervalo de tempo de até aproximadamente 10−15s; o físico-químico, com intervalo de tempo de até aproximadamente 10−6s; o químico, com intervalo de tempo de alguns segundos e o biológico, com intervalo de tempo de dias, semanas ou anos [9].

Partindo dessa definição vemos que o problema simulado em [8] está entre o estágio físico e o físico-químico da interação da radiação com a matéria. Isso está ainda longe de todo o processo que acontece na Protonterapia, mas é o começo para um melhor entendimento dos estágios iniciais do dano no DNA induzido por prótons.

Para nos aproximarmos da Protonterapia, deveríamos estender o tempo de simula-ção e aumentar a complexidade da estrutura do DNA. O problema é que com o estado atual do desenvolvimento da computação isso é inviável através de simulações quânticas. É ai que entra este trabalho e seu objetivo.

O objetivo desse trabalho é estudar a colisão de um próton com um par de base do DNA, igual ao realizado previamente [8], mas com dinâmica molecular clássica, onde uti-lizaremos o potencial REAXFF (Reactive Force Field)[10] e o programa LAMMPS[11] para resolver as equações clássicas. Tentaremos com isso, obter os mesmos resultados do cálculo quântico, mas com um menor custo computacional. Isso deve permitir posteriormente levar em conta estruturas do DNA mais complexas, como a dupla hélice, e também a um maior tempo de simulação.

Essa dissertação está dividida da seguinte maneira: o capítulo 2 será voltado para uma breve discussão sobre o DNA, onde falaremos sobre seus componentes básicos. No ca-pítulo 3 será introduzido os conceitos básicos da Dinâmica Molecular Clássica e os métodos usados neste trabalho. No capítulo 4 será exposto o campo de potencial REAXFF e no capítulo 5 e 6 serão apresentados nossos resultados e conclusões.

(14)

Capítulo 2

O DNA

O DNA, ácido desoxirribonucleico, foi descoberto em 1869 por Friedrich Mies-cher, mas apenas em 1944, por Avery, MacLeod e McCarty, é que foi sugerido que a função fundamental dele seria a de armazenar e transmitir a informação genética. Essa suposição foi confirmada em 1953 por Hershey e nesse mesmo ano a estrutura de dupla hélice foi proposta por Watson e Crick [2].

O DNA é um polímero; uma molécula grande formada a partir de pequenas mo-léculas repetidas (unidades chamadas de monômeros). Seus monômeros são os nucleotídeos, que são compostos por um açúcar, uma base nitrogenada e um grupo fosfato. Como veremos adiante, esse polímero formado pelos nucleotídeos compõem apenas uma das fitas do DNA, que é composto de duas, a dupla hélice [2, 12].

2.1 A Base

As bases encontradas no DNA são de dois tipos: as purinas e as pirimidinas. Na figura 2.1 vemos a fórmula molecular das purinas que têm dois anéis, e das pirimidinas que têm um anel.

Figura 2.1: Bases purina (esquerda) e pirimidina (direita) [13].

(15)

fa-lamos sobre o átomo N1 da purina estamos nos referindo ao átomo de Nitrogênio entre os carbonos C6 e C2.

2.1.1 Purinas

As purinas são de duas espécies: a guanina e a adenina. Como pode ser visto na figura 2.2, a guanina tem um grupo amino1na posição C2 (na guanina o grupo amino é o NH2)

e um grupo carbonila (uma ligação dupla de um carbono com um oxigênio) na posição C6. A adenina tem um grupo amino, que também é o NH2, na posição C6 [12].

Figura 2.2: Bases guanina (esquerda) e adenina (direita) [13].

2.1.2 Pirimidinas

As pirimidinas são de três espécies: a timina, a citosina e a uracila e estão represen-tadas na figura 2.3. No DNA existem a timina e a citosina, enquanto que a uracila é encontrada no RNA (ácido ribonucleico) junto com a citosina. A timina contém um grupo metil2 na po-sição C5 com grupos carbonila nas posições C2 e C4. A citosina contém um grupo carbonila na posição C2 e um grupo amino, NH2, na posição C4. A uracila contém grupos carbonila nas

posições C2 e C4 [14].

Figura 2.3: Bases timina (esquerda), citosina (centro) e uracila (direita) [13].

1_{O grupo amino é derivado do amoníaco, NH}

3, e que tem um, dois ou três hidrogênios retirados. 2_{O grupo metil é um radical composto por um carbono ligado a três hidrogênios, CH}

(16)

2.2 O Açúcar

O açúcar encontrado no DNA é a desoxirribose. É um açúcar simples (monossa-carídeo3) e, também, uma pentose (por conter cinco carbonos na sua composição). A forma molecular da desoxirribose é mostrada na figura 2.4.

Figura 2.4: Açúcar desoxirribose do DNA [13].

Aqui, os números 1’ até 5’ identificam os cinco carbonos na molécula.

2.3 O Fosfato

O fosfato, PO−3₄ , é um radical composto de um átomo de fósforo ligado a quatro átomos de oxigênio como mostrado na figura 2.5.

Figura 2.5: Fosfato [15].

2.4 As Ligações

A base nitrogenada liga-se ao carbono 1’ do açúcar por uma ligação glicosídica4, geralmente através do átomo de nitrogênio N9, mas pode também ocorrer com o N7, para as purinas e através do N1 para as pirimidinas. O fosfato liga-se ao carbono 5’ do açúcar. Isso 3_{Quando há apenas uma molécula de açúcar. Se fossem duas moléculas de açúcar interligadas chamaríamos}

de dissacarídeos. De 3 a 10 moléculas de açúcar interligadas são chamados de oligossacarídeos. Mais do que 10 moléculas de açúcar interligadas são chamados de polissacarídeos [12].

4_{A ligação glicosídica é a combinação da hidroxila de um carbono anomérico (carbono ligado ao oxigênio}

cetal e a uma hidroxila livre) de um monossacarídeo com a hidroxila de um álcool ou com a hidroxila de qualquer carbono de outro monossacarídeo, produzindo água [16].

(17)

faz com que o açúcar fique no centro e a base de um lado e o fosfato do outro formando o nucleotídeo, que é mostrado na figura 2.6 [2].

Figura 2.6: Figura de um nucleotídeo. Fonte: [13].

Na molécula de DNA os nucleotídeos são ligados entre si através do fosfato. Ana-lisando a figura 2.7 vemos que, de baixo para cima, temos uma base guanina ligada ao açúcar e este ligado ao fosfato; isso forma um nucleotídeo. O fosfato desse nucleotídeo está ligado no carbono 5’ do açúcar e ele liga-se ao carbono 3’ do açúcar do nucleotídeo posterior. Nessa cadeia (chamada de uma fita do DNA) todos os nucleotídeos têm a mesma posição relativa à suas extremidade 5’ e 3’, ou seja, todos os quatro nucleotídeos têm seus carbonos 5’ voltados para cima e os 3’ para baixo. Isso faz com que essas cadeias de nucleotídeos tenham direciona-lidade, onde na extremidade 5’ está o fosfato e na 3’ uma hidroxila. Podemos denotar a fita da figura 2.7 como 5’-TACG-3’, onde G é a guanina, C a citosina, A a adenina e T é a timina.

(18)

Podemos ver na figura que há uma região nos fosfatos que fica carregada negativa-mente. Essa região é responsável pela interação do DNA com proteínas e outras moléculas.

Como o que diferencia um nucleotídeo de outro é apenas a base nitrogenada, cos-tuma-se chamar os nucleotídeos apenas pelo nome da base. Ou seja, o nucleotídeo formado de um fosfato, um açúcar e um base nitrogenada guanina é chamado apenas de base guanina.

2.5 A dupla hélice

A dupla hélice é a forma do DNA proposta por Watson e Crick e pode ser vista na figura 2.8.

Figura 2.8: Representação do DNA [13].

Ela é dextrógira e composta por duas fitas de nucleotídeos anti-paralelas, isto é, uma está orientada de 5’ para 3’ e a outra está de 3’ para 5’. As duas fitas são ligadas através de pontes de hidrogênio5 entre suas bases. As bases estão empilhadas no centro da hélice

(19)

cilíndrica. Os açúcares e os fosfatos ficam na parte externa formando o esqueleto da hélice. No DNA a base timina (T) só pode se ligar à adenia (A) e vice versa. A base citosina (C) só pode ligar-se à guanina (G) e vice versa. Isso resulta que se em um determinado local da fita de um DNA existe uma base A na outra fita (no mesmo local) existirá um base T, e o mesmo vale para C e G.

Quando um nucleotídeo liga-se a outro através de pontes de hidrogênio, timina-adenina ou citosina-guanina, é dado o nome de par de base (pb). A figura 2.9 mostra os dois tipos de pares de bases encontrados no DNA ligados entre si através dos fosfatos. Sendo que usaremos o par de base citosina-guanina neste trabalho.

Figura 2.9: Pares de bases A-T (em cima) e C-G (em baixo) [17].

O DNA pode assumir diferentes conformações que dependem das bases e do meio que ele se encontra. Algumas estruturas de DNA existem apenas em condições artificiais, já os tipos encontrados em condições fisiológicas são: tipo B, tipo A e tipo Z. A figura 2.10 representa essas três formas do DNA.

O que caracteriza, principalmente, o tipo de DNA é quantos pares de bases existem por volta da hélice e se ela é dextrógira ou levógira. O tipo B é a forma clássica de dupla hélice proposta por Watson e Crick, também é a forma mais abundante encontrada em condições fisiológicas; tem cerca de 10,4 pares de bases por volta e é dextrógira. O tipo A é dextrógira também, mas tem cerca de 11 pares de bases por volta. O tipo Z é levógira e tem cerca de 12 pares de bases por volta.

(20)

(21)

Capítulo 3

Dinâmica Molecular Clássica

O principal objetivo de uma simulação de Dinâmica Molecular Clássica (também chamada de MD-Molecular Dynamics Simulation) é resolver numericamente o problema de N-corpos da Mecânica Clássica. Nessa resolução calcula-se os movimentos individuais de mo-léculas e/ou átomos nos modelos propostos (que podem ser de líquidos, sólidos ou gases). Neste caso, os elétrons não são explicitamente considerados, o que permite reduzir drastica-mente a complexidade do sistema e, portanto, os recursos computacionais para descrevê-lo. Por exemplo, o cálculo quântico do problema em questão, usando TD-DFT, consome ao redor de 6 semanas para uma única colisão, enquanto usando a dinâmica clássica esse tempo é reduzido para perto de 1 h, usando os mesmos recursos computacionais. Por outro lado, a exclusão dos elétrons da dinâmica do sistema causa uma perda na exatidão da descrição da realidade física do sistema eletrônico [19, 20].

Na simulação, as forças que agem sobre um átomo são obtidas calculando-se a primeira derivada do potencial em relação às posições desses átomos. A partir disso resolve-se as equações de movimento, que descreve como as posições e velocidades atômicas variam com o tempo [21].

O conjunto de todos os potenciais é chamado de campo de forças, que em princípio, pode ser qualquer um, desde uma pura suposição até um ajuste de cálculos quânticos da energia química. No fim, a qualidade do campo de força molecular e o valor da simulação só podem ser julgados mediante comparação com dados experimentais [22].

Se o campo de forças utilizado na simulação conservar a energia total do sistema, quando resolvermos as equações de Newton somos levados ao ensemble microcanônico (NVE), no qual o número de partículas N, o volume V e a energia total do sistema E são constantes. Isso leva a uma amostragem do espaço de fase1desse ensemble e as propriedades desejadas do sistema podem serem extraídas a partir de uma média estatística no mesmo [23].

Pelo fato dos valores de grandezas obtidos numa simulação MD serem uma média estatística, temos que levar em conta as incertezas estatísticas2 associadas às medidas dessas

1_{O conceito de espaço de fase será apresentado na seção 3.3.} 2_{Que veremos na seção 3.4 junto com as incertezas sistemáticas.}

(22)

grandezas.

3.1 Mecânica Clássica Newtoniana

Na formulação Newtoniana da mecânica clássica o movimento de translação de um corpo i é causado por uma força externa resultante Fie eles estão relacionados pela segunda lei

de Newton [24]:

Fi=

dp_i

dt ≡ ˙pi (3.1)

onde p_ié o vetor momento linear do corpo e é igual a:

p_i= mi· vi. (3.2)

Aqui mié a massa do corpo i e vi, seu vetor velocidade, dado por:

vi=

dr_i

dt , (3.3)

onde rié a posição do corpo i em relação ao sistema de referência.

Se a massa mido corpo i for constante e usando 3.2, podemos reescrever a equação

3.1 como:

Fi= mi

dvi

dt = mi· ai (3.4)

onde, aié o vetor aceleração do corpo i, que também pode ser escrita como:

ai=

d2ri

dt2 . (3.5)

Todas as variáveis em negrito são vetores de 3 dimensões, ou seja, para N corpos a equação 3.4 representa 3N equações diferenciais ordinárias de segunda ondem.

Se as forças que atuam num corpo i são conservativas, a energia total E do sistema se conserva e, temos a seguinte relação:

Fi= −

∂

V

∂ri

, (3.6)

onde

_V

é a energia potencial do sistema (ou seja, o campo de forças).

Se não haver força resultante agindo sobre o sistema o momento linear total deve se conservar, pois:

˙

P = 0 (3.7)

(23)

P =

N

∑

i=1

p_i. (3.8)

Isso faz com que P seja constante. Também sabemos que:

N =dL

dt (3.9)

onde, L é a soma de todos os momentos angulares das partículas do sistema em relação a um ponto O e N é a soma de todos os torques em relação ao ponto O sobre todas as partículas do sistema, e são definidos como:

L =

_∑

i ri × pi (3.10) e N =

_∑

i ri × Fi (3.11)

onde ri é o vetor posição da partícula i em relação a O, pi seu momento linear e Fi é a força

atuando nela. O simbolo × representa o produto vetorial.

Com isso, vemos que se não há torques resultantes agindo no sistema o momento angular deve se conservar, pois:

dL

dt = 0 (3.12)

o que faz com que L seja constante.

Para resolvermos numericamente as equações de movimento do sistema podemos fazer uso de alguns métodos. Os mais conhecidos são os métodos de Euler, Runge-Kutta, Preditor-Corretor de Gear e o método de Verlet. O método que será usado nesse trabalho é uma variação do método de Verlet chamado de método Velocity-Verlet.

3.2 Resolvendo as Equações de Movimento

Antes de apresentarmos o método Velocity-Verlet que será utilizada nessa disserta-ção, mostraremos o método de Verlet, que foi desenvolvido primeiro que o método Velocity-Verlete tem a mesma linha de raciocínio [25].

3.2.1 O Método de Verlet

A ideia no algoritmo de Verlet é expandir em série de Taylor o vetor posição r(t) em duas direções do tempo. Vamos expandir as funções r(t + ∆t) e r(t − ∆t).

(24)

A expansão de Taylor é dada por [26]: f(u) = ∞

∑

n=0 f(n)(a) n! (u − a) n _(3.13)

Expandindo até a terceira ordem temos:

f(u) = f (a) + f0(a)(u − a) + f

00 (a) 2! (u − a) 2₊ f 000 (a) 3! (u − a) 3_{+ O(4)} (3.14)

onde f0, f00 e f000 são, respectivamente, a primeira, a segunda e a terceira derivada de f com relação a u.

Fazendo f (u) = r(t + ∆t), isto é, (u = t + ∆t) e expandindo em torno de t, isto é, (a = t), temos: r(t + ∆t) = r(t) + ∆t ˙r(t) +∆t 2 2! ¨r(t) + ∆t3 3! ... r (t) + O(4) (3.15)

Agora, fazendo f (u) = r(t − ∆t), isto é, (u = t − ∆t) e expandindo em torno de t, isto é, (a = t), temos: r(t − ∆t) = r(t) − ∆t ˙r(t) +∆t 2 2! ¨r(t) − ∆t3 3! ... r (t) + O(4). (3.16)

Somando 3.15 e 3.16 e isolando r(t + ∆t), temos:

r(t + ∆t) = 2r(t) − r(t − ∆t) + a(t)∆t2+ O(4), (3.17) onde ¨r(t) ≡ a(t).

A ordem do erro desse algoritmo para a posição é O(∆t4). Um problema encon-trado é o fato de que para calcular r(t + ∆t) precisamos conhecer r(t − ∆t) e r(t), porém, não conseguimos conhecer r(t − ∆t) no tempo inicial. Além disso, o algoritmo de Verlet não calcula as velocidades das partículas. Para isso temos que usar as expansões das equações 3.15 e 3.16 até a segunda ordem:

r(t + ∆t) = r(t) + ∆tv(t) +∆t 2 2! ¨r(t) + O(3) (3.18) r(t − ∆t) = r(t) − ∆tv(t) +∆t 2 2! ¨r(t) + O(3). (3.19)

Agora, fazemos a subtração da equação 3.18 pela 3.19 e isolando v(t) obtemos:

v(t) =r(t + ∆t) − r(t − ∆t)

2∆t + O(3) (3.20)

(25)

o das posições (erro da ordem O(∆t3)). Por esse motivo e por causa do problema da posição inicial num tempo anterior, criou-se uma variação do método de Verlet.

3.2.2 O Método Velocity-Verlet

No método Velocity Verlet a função r(t + ∆t) é expandida até a segunda ordem. Usando 3.15 até segunda ordem temos:

r(t + ∆t) = r(t) + ∆tv(t) +∆t

2

2 a(t) + O(3) (3.21)

que é a equação do método Velocity-Velert para a posição. Vemos que ela não depende da posição no instante de tempo anterior. E tem um erro da ordem de O(∆t3).

Agora, para a velocidade expandimos o termo v(t + ∆t) até a segunda ordem:

v(t + ∆t) = v(t) + ∆ta(t) +∆t

2

2 ¨v(t) + O(3) (3.22)

Para eliminar o termo de segunda derivada da velocidade expandimos ˙v(t + ∆t) até a primeira ordem:

˙v(t + ∆t) = ˙v(t) + ∆t ¨v(t) + O(2), (3.23) que é igual a

a(t + ∆t) = a(t) + ∆t ¨v(t) + O(2). (3.24) Isolando o termo de segunda derivada da velocidade obtemos

∆t ¨v(t) = a(t + ∆t) − a(t) + O(2). (3.25) Multiplicando os dois lados dessa equação por ∆t/2, temos

∆t2 2 ¨v(t) =

∆t

2[a(t + ∆t) − a(t)] + O(3). (3.26) Substituindo a equação 3.26 na 3.22, temos:

v(t + ∆t) = v(t) + ∆ta(t) +∆t

2 [a(t + ∆t) − a(t)] + O(3) (3.27) abrindo os termos entre colchetes:

v(t + ∆t) = v(t) + ∆ta(t) +∆t

2a(t + ∆t) − ∆t

2 a(t) + O(3) (3.28)

(26)

v(t + ∆t) = v(t) +∆t 2 a(t) +

∆t

2 a(t + ∆t) + O(3). (3.29) Juntando o segundo com o terceiro termo, temos, finalmente:

v(t + ∆t) = v(t) +∆t

2[a(t) + a(t + ∆t)] + O(3) (3.30) que é a equação do método Velocity-Verlet para a velocidade. Vemos que o erro é da ordem de O(∆t3).

As equações 3.21 e 3.30 são as equações que serão usadas para resolver as equações de movimento do nosso problema.

Para calcular a posição do corpo no tempo posterior t + ∆t, a partir da equação 3.21, precisamos da posição, velocidade e da aceleração do corpo num tempo inicial. A posição e velocidade inicial é dada pelas condições iniciais do problema. Para encontrar a aceleração inicial calculamos o gradiente do potencial com relação à posição inicial a partir da equação 3.6 onde encontraremos a força agindo nesse corpo no tempo inicial. Depois usamos a equação 3.4 para calcular a aceleração num tempo inicial.

Para calcular a velocidade do corpo no tempo posterior t + ∆t, a partir da equação 3.30, precisamos da velocidade e da aceleração do corpo num tempo inicial e também precisa-mos da aceleração do corpo nesse tempo posterior t + ∆t. Com isso, para encontrar a velocidade num tempo posterior, primeiramente temos que encontrar a posição num tempo posterior, como visto no parágrafo anterior, depois com esse resultado da posição encontraremos uma nova ace-leração, que seria a aceleração num tempo posterior, e só depois disso calcular a velocidade num tempo posterior.

Depois de calcular as posições e velocidades num tempo posterior para cada corpo do sistema repetimos o processo N vezes para que possamos atingir o tempo de simulação desejado ttotal = N · ∆t.

3.3 Espaço de Fase

O espaço de fase é o nome dado a um hiperespaço de 6N dimensões onde são plotadas as posições e momentos de todos os N corpos do sistema. Ele é divido em espaço de configurações, que tem 3N dimensões e no qual os eixos são as componentes do vetor posição ri(t) de cada corpo, e espaço de momentos, que tem 3N dimensões e no qual os eixos são as

componentes do vetor momento linear p_i(t) de cada corpo. Em um dado instante, as posições e momentos de todos os N átomos do sistema são representados por um ponto nesse hiperespaço. Como as posições e momentos mudam com o tempo, esse ponto também se move, descrevendo uma trajetória no espaço de fase.

Com a utilização do método Velocity-Verlet obtemos a amostragem desse espaço de fase e com isso podemos retirar os valores das propriedades que estamos interessados.

(27)

3.4 Medidas de Propriedades e Incertezas

Suponhamos que em uma simulação fizemos M passos de tempo com cada passo sendo dado por ∆t. A equação para se obter a média de alguma propriedade é dada por [19]:

hAi = 1 M M

∑

k=0 A(k · ∆t) (3.31)

onde A(k · ∆t) é o valor da propriedade no instante t = k · ∆t. Esse é o valor médio medido da propriedade.

A incerteza estatística associada à medida dessa propriedade é dada pela variância σ2dessa média, que é dada por:

σ2= 1 M− 1 M

∑

k=0 (hAi − A(k · ∆t))2 (3.32)

Sabemos que nenhuma medida, por mais cuidado que se tenha, está completamente livre de incertezas. Saber como avaliar estas incertezas e minimizá-las o quanto possível é muito importante [27].

A maneira como uma medida é realizada em uma simulação de dinâmica molecular clássica é muito similar ao caso experimental; em ambos os casos temos que considerar o erro estatístico associado com as medidas. Por outro lado, em uma simulação MD temos também os erros sistemáticos gerados por: truncamento causado por usarmos um passo de tempo ∆t muito grande no método de diferença finita, aproximações no cálculo das equações de movi-mento, efeitos de condições de contorno periódicas3, arredondamentos nos cálculos, corte das interações (entre outros) [28, 19].

O controle das incertezas estatísticas está ligado à duração da simulação e o tamanho do timestep usado.

Para sondar as incertezas sistemáticas podemos: repetir a simulação usando o mes-mo código em computadores diferentes, repetir a simulação usando o mesmes-mo código em com-piladores diferentes, repetir a simulação usando diferentes métodos (podemos usar ensembles diferentes ou comparar com cálculos de Monte Carlo), entre outros [19].

3.5 Modelando a Dinâmica Molecular

A partir da figura 3.1 vemos que a modelagem da dinâmica molecular se divide em duas partes: desenvolver um modelo e usar o modelo em uma simulação.

A primeira tarefa, desenvolver um modelo, se divide em três outras: definir como será a interação do sistema com o ambiente, escolher uma forma para o potencial intermolecular

(28)

e depois derivar as equações de movimento. Se tratando de sistemas isolados as equações de movimento são obtidas a partir da segunda lei de Newton.

A segunda tarefa, a simulação, se divide em duas partes: gerar as trajetórias no es-paço de fase e analisar as trajetórias para obter as propriedades desejadas. Sendo que a parte de gerar as trajetórias do espaço de fase pode ser dividida em três etapas: inicialização, equilibra-ção e produequilibra-ção. Modelando a Dinâmica Molecular Desenvolver Modelo Simulação Interação Ambiente Potencial Derivar Equações Gerar Trajetórias Analisar Trajetórias

Inicialização Equilibração Produção

Figura 3.1: Passos na modelagem da dinâmica da matéria. Adaptado de fonte:[19].

3.5.1 Interação com o Ambiente

Aqui é onde definiremos qual o ensemble estatístico será usado no modelo. Como mencionado anteriormente, a resolução das equações de movimento utilizando o método Velo-city - Verletleva ao ensemble NVE, onde o número de partículas N, o volume V e a energia total E do sistema são constantes. Nesse ensemble o nosso sistema não interagem com o ambiente, sendo um sistema isolado.

No entanto, o ensemble NVE, chamado de ensemble microcanônico, não tem uma relação direta com os dados obtidos experimentalmente. Num experimento, normalmente se controla a temperatura T e/ou a pressão P do sistema. Com isso, também podemos optar por fazer as simulações no ensemble NVT, chamado de ensemble canônico, onde o número de partículas N, o volume V e a temperatura T do sistema são constantes. Ou no ensemble NPT, chamado de ensemble isobárico-isotérmico, onde o número de partículas N, a pressão P e a

(29)

temperatura T do sistema são constantes.

3.5.2 O Potencial

Um dos primeiros modelos de potenciais para esferas maciças4foi introduzido, em 1924, por J. E. Lennard-Jones, dado por:

u(r) = 4ε _σ r 12 −σ r 6 (3.33) Como as forças intermoleculares são conservativas, temos:

F(r) = −du(r) dr = 24 ε σ 2σ r 13 −σ r 7 (3.34) Nessa dissertação trabalharemos com o potencial REAXFF, que é composto de uma soma de vários termos de energia potencial, como será detalhado no capítulo 4.

Os potenciais intermoleculares têm uma distância de corte rc, distância essa a partir

da qual o potencial é considerado nulo. Isso causa uma redução no tempo de simulação por causa da diminuição de interação par a par entre átomos, já que átomos que estão a uma dis-tância maior que a disdis-tância de corte não estariam interagindo. Mas também por causa desse corte no potencial surgem problemas na simulação para fornecer valores de propriedades que dependem do potencial, tais como a energia do sistema, por causa da descontinuidade criada pelo corte. Os resultados da simulação para tais propriedades devem ser corrigidas para intera-ções de longo alcance (r > rc) que são negligenciadas durante a simulação. Geralmente, isso é

feito acrescendo termos de energias no campo de forças ou modificando a distancia de corte rc.

Como há um truncamento no potencial, também há um truncamento na força. Isso causa pequenos impulsos nos átomos i e j sempre que sua distância de separação ri j ultrapassar

rc. Consequentemente, em vez de uma energia total E estritamente constante, podemos observar

pequenas flutuações em E. Estas flutuações afetam pouco os valores computados para propri-edades de equilíbrio, e os efeitos podem ser negligenciados aumentando rc ou diminuindo o

timestep a custa de um aumento no tempo da simulação. Note que a distância de truncamento é bem maior que a distância de ligação típica para quaisquer elementos, permitindo uma transição suave quando se tem uma quebra de ligação.

Lista de Vizinhos

O que mais consome tempo numa simulação de dinâmica molecular é o cálculo das forças sobre os átomos. Para N átomos temos que calcular 1₂N(N − 1) forças. Mas quando um potencial truncado é usado as forças são iguais a zero para ri j > rc, consequentemente, calcular

forças para distâncias ri j maiores do que rc desperdiça tempo de computação.

4_{Esferas maciças são aquelas em que as forças intermoleculares são funções contínuas das distâncias entre si.}

(30)

A lista de vizinhos é um arquivo usado para armazenar os átomos que estão dentro de uma certa distância rL do átomo i, ou seja, a lista identifica os átomos que contribuem para a

força sobre o átomo i. Enquanto rLfor suficientemente maior do que rcnão teremos o problema

de deixar passar alguma interação. Esse método foi desenvolvido por Verlet em 1967 e reduz o tempo de computação num fator de ordem igual a 10 [29].

3.5.3 Solução das Equações de Movimento

Nessa etapa escolhemos como serão solucionadas as equações de movimento do sistema. Como mencionado anteriormente, usaremos o método Velocity-Verlet para resolver as equações.

Condições de Contorno Periódicas

Quando, ao se fazer uma simulação MD, não estamos interessados nos efeitos de superfície, isto é, a interação entre os átomos e o recipiente, usamos condições de contorno periódicas (pbc - periodic boundary conditions) [19].

Assumimos que nossa caixa de simulação principal, chamada de célula primária, está cercada em cada face por uma caixa de simulação, chamada de célula imagem, cujas posi-ções das partículas são exatamente imagens deslocadas daquelas da célula principal. Os átomos que saem da célula primária não são refletidos de volta pela parede, mas entram na célula ima-gem na sua frente em um ponto correspondente da face oposta, como na figura 3.2.

Figura 3.2: Condições de contorno periódicas. fonte: [20].

Essa periodicidade se estende às posições e momentos das imagens nas células de imagem.

(31)

3.5.4 Inicialização

A etapa de inicialização pode ser dividida em duas partes: preliminares (onde es-colhemos o sistema de unidades em que o cálculo será feito, o algoritmo que será usado para resolver as equações de movimento e assinalamos valores para os parâmetros que serão constan-tes durante a simulação) e inicialização dos átomos (onde serão atribuídos valores às posições e velocidades iniciais e, em alguns casos, valores às derivadas da posição de mais alta ordem).

Também é nessa etapa que assinalamos as condições de contorno do problema. Se desejamos excluir os efeitos de superfície temos que usar condições de contorno periódicas. Também temos que escolher a forma da caixa de simulação, que geralmente é um cubo.

Com o modelo de potencial, unidades, estado termodinâmico e geometria da caixa escolhidos, devemos selecionar o algoritmo que resolverá as equações de movimento. Para aplicar o algoritmo devemos escolher o passo de tempo da integração ∆t, que deve ser ajustado caso a caso para melhorar a performance da simulação (achar um equilíbrio entre agilidade da simulação com precisão dos resultados obtidos).

O passo seguinte é assinalar as posições iniciais e velocidades iniciais para que o algoritmo possa resolver as equações de movimento.

3.5.5 Equilibração

Com a etapa de inicialização completada, a simulação pode começar. Sobre as primeiras centenas de passos de tempo ∆t o sistema relaxa a partir das condições iniciais as-sinaladas arbitrariamente e aproxima-se do equilíbrio. Essa fase de relaxação é chamada de equilibração que envolve: usar o método numérico para gerar a trajetória no espaço de fase; monitorar a trajetória seguindo a propriedade desejada; o terceiro é opcional, que é escalar as velocidades atômicas (que pode ser feita através do método de Nosé-Hoover, que leva ao en-sembleNVT ou ao NPT dependendo da implementação) para manter a temperatura do sistema perto do valor desejado (desde que estejamos trabalhando com uma temperatura constante e di-ferente de zero); a última atividade ocorre no fim da equilibração quando os valores acumulados das propriedades de interesse são reiniciadas a zero. O objetivo da equilibração é garantir que os valores calculados para as propriedades de equilíbrio não são afetadas por como a simulação é iniciada e também saber se a estrutura está estável ou não.

Como será visto no capitulo 5, as condições iniciais dos átomos do nosso problema não são dadas aleatoriamente e nem utilizamos uma temperatura fixa. Também será visto que no inicio da simulação as ligações químicas analisadas estão estáveis.

3.5.6 Produção

Uma vez que a etapa de equilibração esteja completa, a fase de produção da simu-lação pode começar. Na produção o código aplica repetidamente o algoritmo que resolverá

(32)

as equações de movimento do sistema (calculando posições e velocidades de cada corpo) para seguir a trajetória do espaço de fase. E paralelamente a esse algoritmo podemos ter um outro algoritmo que pega esses valores (de posições e velocidades) e calcula algumas propriedades que desejamos, como por exemplo a energia cinética, a energia potencial, entre outras. Em in-tervalos durante a produção, podemos salvar o valor dessas propriedades que podem ser melhor analisadas após o término da execução. A finalidade de estender o tempo de uma simulação é reduzir as incertezas estatísticas que diminuem como a raiz do número de valores numéricos calculados. Porém, temos que notar que os erros de truncamento e arredondamento acumulam com o aumento do tempo da simulação. Determinamos o tempo de execução, primeiro fazendo uma breve execução piloto (que seria uma simulação de teste) na qual calculamos propriedades e suas incertezas estatísticas. Em seguida, identificamos a magnitude da incerteza estatística que estamos dispostos a tolerar e, finalmente, para obter um estimativa da duração necessária da execução da produção podemos usar a equação :

M_f = σ

2 p

σ2_f

M_p (3.35)

onde, Mf é o número de passos da simulação final, Mp é o número de passos da simulação

piloto, σ2_f é a incerteza final esperada para a medida de uma determinada propriedade e σ2_pé a incerteza piloto encontrada para essa mesma propriedade.

3.5.7 Análise das Trajetórias

É nessa etapa onde obtemos as propriedades desejadas do sistema. Onde também devemos avaliar a confiabilidade dos resultados analisando os erros estatísticos e erros sistemá-ticos do problema.

3.6 Simulação Clássica: O Programa LAMMPS

Para fazer todo o processo da simulação de dinâmica molecular clássica utilizare-mos o programa LAMMPS [11].

Large-scale Atomic/Molecular Massively Parallel Simulator - LAMMPS, é um có-digo de simulação de dinâmica molecular clássica projetado para funcionar de forma eficiente em computadores paralelos. Foi desenvolvido no Sandia National Laboratories nos Estados Unidos e é um código livre, distribuído sob os termos da Licença Pública GNU (GPL).

O LAMMPS modela um conjunto de partículas no estado líquido, sólido ou gasoso. Ele pode modelar sistemas atômicos, poliméricos, biológicos, metálicos e granulares usando uma variedade de campos de força e condições de contorno. Pode modelar sistemas com apenas algumas partículas até milhões ou bilhões. Foi projetado para ser fácil de modificar ou ampliar com novos recursos, como novos campos de força, tipos de átomo, condições de contorno ou

(33)

diagnósticos.

Ele integra as equações de movimento de Newton para os corpos que interagem através de forças de curto ou longo alcance com uma variedade de condições iniciais e/ou de contorno. Para eficiência computacional, é usada a listas de vizinhos para rastrear partículas próximas.

O LAMMPS é executado lendo os comandos de um script de entrada (arquivo de texto da forma in.nome_escolhido) uma linha por vez e cada comando entra em vigor quando é lido. A maioria dos comandos tem configurações padrão, o que significa que só é preciso usar o comando se quiser alterar o padrão. Existem distinções entre maiúsculas e minúsculas nos comandos. Os nomes dos comandos são minúsculos, assim como os argumentos de comando especificados. Letras maiúsculas podem ser usadas em nomes de arquivos ou cadeias de IDs (identificadores) escolhidas pelo usuário. Se o último caractere imprimível na linha for um caractere “&”, presume-se que o comando continue na próxima linha. Todos os caracteres depois do primeiro caractere “#” são tratados como comentário e descartados.

Um script de entrada LAMMPS normalmente possui 4 partes: 1. Inicialização

Onde são definidos: a dimensão do problema (que pode ser em 2 ou 3 dimensões), as unidades de medidas utilizadas, as condições de contorno, os estilos atômicos (onde de-finimos se estamos lidando com um sistema molecular, carregado, corpos rígidos entre outros) e o potencial a ser usado.

2. Definição de Átomos

A definição dos átomos é onde se determina: o tamanho da caixa de simulação, quais tipos de átomos serão usados, suas massas, posições iniciais, velocidades iniciais (que podem ser configuradas no script de entrada) e outras propriedades que dependem do estilo atômico usado.

Essa definição dos átomos pode ser realizada pela leitura de um arquivo externo ou pela definição no próprio script de entrada do LAMMPS.

3. Configurações

Uma vez que a topologia dos átomos e moléculas está definida, uma variedade de confi-gurações podem ser especificadas: coeficientes do campo de força, parâmetros da simu-lação, opções de saída, etc.

É nessa etapa que definimos qual método de integração das equações de movimento será usado, o tamanho do timestep, a distância de corte da lista de vizinhos, definição do ensembletermodinâmico, se será utilizado ou não o equilibrio de carga do sistema, quais propriedades serão calculadas e extraídas (podemos extrair as posições de cada átomo a cada timestep o que nos dará a trajetória de cada partícula durante a simulação, podemos

(34)

extrair a energia cinética, a energia potencial, velocidade, e várias outras propriedades a cada timestep, tanto individualmente, para cada átomo, como para todo o sistema). 4. Rodar a Simulação

Essa etapa é a que colocamos a simulação para rodar. As partes 3 e 4 podem ser repetidas. Ou seja, podemos rodar a simulação, depois mudar algumas configurações, depois rodar outra simulação e assim por diante.

3.7 Simulação Clássica: O Programa VMD

Depois de realizar a simulação com o programa LAMMPS, teremos arquivos de saída com as propriedades que queremos analisar. Uma propriedade muito interessante é a posição de cada partícula a cada instante de tempo, a trajetória de cada partícula. A visualização dessa trajetória é feita utilizando o programa Visual Molecular Dynamics - VMD [30].

O VMD é um programa de visualização molecular que permite exibir, animar e analisar grandes sistemas biomoleculares ou moléculas gerais, usando gráficos 3-D e scripts incorporados, podendo fazer com que ele mostre também a interação entre as moléculas.

Através desse programa iremos analisar os comprimentos das ligações dos átomos no par de base Citosina-Guanina durante a simulação.

(35)

Capítulo 4

O Campo de Forças REAXFF

O campo de força REAXFF é um potencial reativo que consegue simular a quebra e a formação de ligações químicas, no qual as forças de Coulomb e de Van der Waals são consideradas desde o início. O formalismo de força central é usado, o que faz com que todos os pares de átomos tenham interações não ligadas, causando o rompimento de um ligação de maneira contínua. Mas, há também a adição de perturbações locais para descrever moléculas complexas de maneira mais precisa. A descrição que se segue é baseada no artigo produzido por Adri C. T. van Duin e colaboradores, criadores do REAXFF [10], e também, em Chenoweth [31], que é a versão do REAXFF instalada no LAMMPS.

A energia total do sistema é divida em varias contribuições parciais:

Esystem= Ebond+ El p+ Eover+ Eunder+ Eval+ Epen+ Ecoa+ EC2+ Etriple+ Etors

+Econ j+ EH−bond+ EvdWaals+ ECoulomb

(4.1)

onde, Esystemé a energia total do sistema, Ebondé a energia de ligação, El pé a energia para pares

isolados, Eover é a energia de sobrecoordenação, Eunder é a energia de subcoordenação, Eval é a

energia do ângulo de valência, Epen é uma energia de penalidade, Ecoaé a energia para sistemas

conjugados de três corpos, EC2 é a energia de ligação carbono-carbono, Etriple é a energia de

ligação carbono-oxigênio, Etorsé a energia do ângulo de torção, Econ jé a energia para sistemas

conjugados de quatro corpos, EH−bond é a energia para ligações de hidrogênio, EvdWaals é a

energia de van der Waals e ECoulombé a energia de Coulomb.

4.1 Ordem de Ligação e Energia de Ligação

A principal suposição deste potencial é que a ordem de ligação1não-corrigida, BO0_{i j}, dada pela equação 4.3, entre um par de átomos i e j, pode ser obtida diretamente a partir da distância interatômica ri j, que é dada pela equação 4.2, destes átomos.

(36)

r_{i j}= q (xj− xi)2+ (yj− yi)2+ (zj− zi)2 (4.2) (4.3) BO0_{i j} = BO0σ i j + BO 0 π i j + BO 0 ππ i j = exp p_bo1· ri j rσ o pbo2 + exp p_bo3· ri j rπ o pbo4 + exp p_bo5· ri j rππ o pbo6

onde, o primeiro termo representa a ligação sigma, o segundo a primeira ligação pi e o terceiro a segunda ligação pi2. Os parâmetros pbo,1 até pbo,6 são constantes que são ajustadas de forma

a reproduzir os cálculos quânticos e experimentais3, e rk₀é dado por:

r₀k= [rk₀(i) + rk₀( j)]12 _(4.4)

k pode ser σ, π ou ππ, e r₀k(i) é uma constante que é ajustada para cada átomo i.

Baseado nas ordens de ligações não-corrigidas BO0_{i j}, é definida uma sobrecoordena-ção4não-corrigida ∆0 para cada átomo, dada pela equação 4.5a, que é a diferença entre a ordem de ligação total ao redor deste átomo e sua valência. E para suavizar as correções para átomos com pares de elétrons isolados5 uma segunda sobrecoordenação ∆0boc é definida na equação 4.5b. ∆ 0 i= −Vali+ neighbours(i)

∑

j=1 BO0_{i j} (4.5a) ∆ 0_boc i = −Valiboc+ neighbours(i)

∑

j=1 BO0_{i j} (4.5b)

neighbours(i)é o número de ligações que o átomo i faz com seus vizinhos.Vali é a valência do

átomo i (Vali= 4 para o carbono e Vali= 1 para o hidrogênio) e Valiboc é valência aparente do

átomo i, que o faz carregar pares isolados, mesmo após sua valência ser preenchida.

O REAXFF usa estas sobrecoordenações não-corrigidas para corrigir as ordens de ligações BO0_{i j} como descrito nas equações 4.6a até 4.6f.

2_{Quando dois orbitais se interpenetram em um mesmo eixo, a ligação é chamada sigma (σ). Quando dois}

orbitais p se interpenetram lateralmente (eixos paralelos), a ligação é denominada pi (π). A ligação simples é uma ligação sigma. A ligação dupla é uma sigma e outra pi. A ligação tripla é uma sigma e duas pi, sendo que uma é chamada de 1a_{ligação pi e a outra de 2}a_{ligação pi.}

3_{Daqui em diante, todos os parâmetros constantes que são ajustadas dessa forma serão chamados apenas de}

parâmetros constantes.

4_{Sobrecoordenação ocorre quando a ordem de ligação é maior que a valência do átomo.} 5_{Elétrons que não fazem parte da ligação.}

(37)

BOi j = BOσi j+ BOπi j+ BOππi j (4.6a) BOσ i j = BO 0 σ i j · f1(∆ 0 i, ∆ 0 j) · f4(∆ 0 i, BO 0 i j) · f5(∆ 0 j, BO 0 i j) BOπ i j = BO 0 π i j· f1(∆ 0 i, ∆ 0 j) · f1(∆ 0 i, ∆ 0 j) · f4(∆ 0 i, BO 0 i j) · f5(∆ 0 j, BO 0 i j) BOππ i j = BO 0 ππ i j · f1(∆ 0 i, ∆ 0 j) · f1(∆ 0 i, ∆ 0 j) · f4(∆ 0 i, BO 0 i j) · f5(∆ 0 j, BO 0 i j) f1(∆ 0 i, ∆ 0 j) = 1 2· Vali+ f2(∆ 0 i, ∆ 0 j) Vali+ f2(∆ 0 i, ∆ 0 j) + f3(∆ 0 i, ∆ 0 j) + Valj+ f2(∆ 0 i, ∆ 0 j) Valj+ f2(∆ 0 i, ∆ 0 j) + f3(∆ 0 i, ∆ 0 j) ! (4.6b) f2(∆ 0 i, ∆ 0 j) = exp

−p_boc1· ∆0_i+ exp−p_boc1· ∆0_j (4.6c)

f3(∆ 0 i, ∆ 0 j) = − 1 p_boc2· ln 1 2· [exp

−p_boc2· ∆0_i+ exp−p_boc2· ∆0_j]

(4.6d)

f₄(∆0_i, BO0_{i j}) = 1 1 + exp[−pboc3· (pboc4· BO

0 i j· BO 0 i j− ∆ 0_boc i ) + pboc5] (4.6e) f₅(∆0_j, BO0_{i j}) = 1 1 + exp[−pboc3· (pboc4· BO

0 i j· BO 0 i j− ∆ 0_boc j ) + pboc5] (4.6f)

os pboc1até pboc5são parâmetros constantes. BOi j são as ordens de ligações corrigidas.

Com isso, é definida uma sobrecoordenação corrigida ∆i, que é derivada da ordem

de ligação corrigida. ∆i= −Vali+ neighbours(i)

∑

j=1 BO_{i j} (4.7)

Se ∆ié maior que zero a ligação é dita ser sobrecoordenada, onde a ordem de ligação total do

átomo é maior que sua valência. Por outro lado, se ∆i é menor que zero a ligação é dita ser

subcoordenada, onde a ordem de ligação total do átomo é menor que sua valência.

A energia de ligação Ebond, o primeiro termo da energia total do potencial ReaxFF,

é calculado de acordo com a equação 4.8.

E_bond= −Dσ

e· BOσi j· exp pbe1 1 − BOσi j

pbe2_{− D}π

(38)

onde Dσ

e, Dπe, Dππe , pbe1e pbe2são parâmetros constantes.

4.2 Energia de Pares Isolados

A equação 4.9 é usada para determinar o número de pares de elétrons isolados ao redor de um átomo. ∆e_i é determinado na equação 4.10 e descreve a diferença entre o número total de elétrons da camada exterior Val_ie(Val_ieé igual a 6 para o oxigênio, 4 para o silício e 1 para o hidrogênio) e a soma das ordens de ligações ao redor do centro atômico:

n_{l p,i}= int ∆e_i 2 + exp " −pl p1· 2 + ∆e_i− 2 · int ∆e_i 2 2# (4.9) ∆e_i = −Val_ie+ vizinhos(i)

∑

j=1 BOi j (4.10)

pl p1 é um parâmetro constante. Para o oxigênio com coordenação normal (ordem de ligação

total = 2, ∆e_i = 4), a equação 4.9 leva a dois pares isolados. Conforme a ordem de ligação total associada com um oxigênio particular começa a exceder 2, a equação 4.9 causa, gradualmente, a quebra do par isolado, causando um desvio ∆l p_i , definido na equação 4.11, a partir de um número de pares isolados otimizados nl p,opt (que é, 2 para o oxigênio, 0 para o silício e hidrogênio).

∆l p_i = nl p,opt− nl p,i (4.11)

Isso é acompanhado por uma energia de penalidade para pares isolados, como cal-culada pela equação 4.12.

E_{l p}= pl p2· ∆

l p i

1 + exp(−75 · ∆l p_i ) (4.12)

que é o segundo termo da energia total do sistema e pl p2também é um parâmetro constante.

4.3 Energia de Sobrecoordenação e Energia de

Subcoorde-nação

Sabemos, a partir da teoria de valência, que a ordem de ligação total do carbono não deve exceder 4 e para o hidrogênio não deve exceder 1. Mas como pode ser visto na figura 4.1, mesmo após a correção das ordens de ligações originais BO0_{i j} um grau de sobrecoordenação (no carbono) e subcoordenação (no hidrogênio) permanece na molécula. A esquerda são as ordens de ligações para o carbono e hidrogênio sem correções. A direta são as ordens de ligações para o carbono e hidrogênio com correções. Para lidar com esse problema é adicionado dois termos de penalidades no campo de forças, um de sobrecoordenação e outro de subcoordenação.

(39)

Figura 4.1: Sobrecoordenação e subcoordenação.fonte: [10].

Para um átomo sobrecoordenado ∆i> 0 e é calculado através da equação 4.7. Além

disso, o grau de sobrecoordenação é diminuído se o átomo contiver um par de elétrons isolados quebrado. Isso leva a uma nova sobrecoordenação corrigida ∆l pcorr_i para o desvio ∆l p_i dos pares isolados, que é dada por:

∆l pcorr_i = ∆i− ∆l p_i 1 + povun3· exp povun4· n ∑neighbours(i)_j=1 ∆j− ∆l p_j ·BOπ i j+ BOππi j o (4.13)

Com isso, temos que a energia de penalidade para átomos sobrecoordenados é dada por: Eover= ∑nbondj=1 povun1· Dσe · BOi j ∆l pcorr_i +Vali · ∆l pcorr_i ·   1

1 + expp_ovun2· ∆l pcorr_i 

 (4.14)

nbondé o número de ligações.

Para um átomo subcoordenado ∆i< 0 e é calculado da mesma forma que para um

átomo sobrecoordenado. Leva-se em conta a contribuição da energia gerada pela ressonân-cia6 de elétrons π entre centros atômicos subcoordenados anexados. A energia de subcoor-denação Eunder, dada pela equação 4.15, é importante apenas se as ligações entre um átomo

subcoordenado i e seus vizinhos subcoordenados j tem características parciais de ligações π (BOπ

i j e\ou BOππi j > 0).

6_{Mantendo-se os núcleos no mesmo lugar, se for possível mudar a posição da ligação pi, ocorre o que é chamado}

(40)

E_under= −povun5·

1 − exp(povun6· ∆l pcorr_i )

1 + exp(−povun2· ∆l pcorr_i )

· 1 1 + povun7· exp h povun8· n ∑neighbours(i)_j=1 ∆j− ∆l p_j ·BOπ i j+ BOππi j oi (4.15)

onde, povun1até povun8, das equações 4.13, 4.14 e 4.15, são parâmetros constantes.

4.4 Energia dos Ângulos de Valência

Assim como para os termos da energia de ligação, é importante que a contribuição energética dos termos dos ângulos de valência (ângulo formado entre duas ligações que vão para o mesmo átomo, ou seja, ângulo formado entre três átomos) vá a zero quando a ordem de ligação vai a zero.A contribuição da energia de valência, Eval, é calculada através das equações

4.16a-4.16g:

E_val = f7(BOi j) · f7(BOjk) · f8(∆j) · {pval1− pval1exp[−pval2(Θ0(BO) − Θi jk)2]} (4.16a)

onde:

f₇(BOi j) = 1 − exp(−pval3· BOi jpval4) (4.16b)

f₈(∆j) = pval5− (pval5− 1) ·

2 + exp(pval6· ∆anglej )

1 + exp(pval6· ∆angle_j ) + exp(−pval7· ∆angle_j )

(4.16c) SBO= neighbors( j)

∑

n=1 BOπ jn+ BOππjn + " 1 − neighbors( j)

∏

n=1 exp −BO8_jn # ·−∆angle_j − p_val8· n_{l p, j} (4.16d)

∆angle_j = −Valangle_j +

neighbors( j)

∑

n=1

(41)

SBO2 = 0 se SBO2 ≤ 0 (4.16f) SBO2 = SBOpval9 _se _{0 < SBO < 1}

SBO2 = 2 − (2 − SBO)pval9 _se _{1 < SBO < 2}

SBO2 = 2 se SBO > 2

Θ0(BO) = π − Θ0,0· {1 − exp[−pval10· (2 − SBO2)]} (4.16g)

aqui, pval1até pval10e Θ0,0são parâmetros constantes.

O termo f7(BO) descrito na equação 4.16b garante que a contribuição da energia

do ângulo de valência desaparece de forma suave durante a dissociação da ligação. O ângulo de valência de equilíbrio Θ0, a partir do qual temos o ângulo de valência de desvio Θi jk, depende

da soma das ordens de ligações π (SBO - Sum of Bond Orders) em torno do átomo central j, conforme descrito na Equação 4.16d. Assim, o ângulo de equilíbrio vai a cerca de 109,47 para a hibridização7 sp3 (ligação π = 0), 120 para sp2 (ligação π = 1) e 180 para sp (ligação π = 2) com base na geometria do átomo central j e seus vizinhos8. Além de incluir os efeitos das ligações π no átomo central j, a equação 4.16d também leva em conta os efeitos de sobre e subcoordenação no átomo central j, conforme determinado pela equação 4.16e, no ângulo de valência de equilíbrio, incluindo a influência de um par de elétrons isolado. A forma funcional da equação 4.16g é designada a evitar singularidades quando SBO = 0 e SBO = 2. Os ângulos nas equações 4.16a até 4.16g estão em radianos.

4.5 Energia de Penalidade

A energia de penalidade Epené acrescentada no campo de potencial para reproduzir

a estabilidade de sistemas com duas ligações duplas compartilhando um átomo em um ângulo de valência, como no aleno visto na figura 4.2, e é dada nas equações 4.17a e 4.17b.

Figura 4.2: Aleno [33].

7_{Mistura de orbitais atômicos formados de maneira a minimizar a energia da molécula.}

8_{Hibridização sp}3_{: o orbital 2s e os três orbitais 2p se rearranjam formando quatro orbitais equivalentes.}

Hibri-dização sp2: o orbital 2s e dois orbitais 2p se rearranjam formando três orbitais equivalentes. Hibridização sp: o orbital 2s e um orbital 2p se rearranjam formando dois orbitais equivalentes.

(42)

Epen= ppen1· f9(∆j) · exp h −ppen2· BOi j− 2 2i · exph−ppen2· BOjk− 2 2i (4.17a) f9(∆j) = 2 + exp(−ppen3· ∆j)

1 + exp(−ppen3· ∆j) + exp(−ppen4· ∆j)

(4.17b) onde, ppen1até ppen4são parâmetros constantes.

A equação 4.17b lida com os efeitos de sobrecoordenação e subcoordenação no átomo central j na energia de penalidade.

4.6 Energia para Sistemas Conjugados de Três Corpos

O termo de energia para sistemas conjugados de quatro corpos que será descrito na seção 4.10 é suficiente para descrever a maioria dos sistema hidrocarbonetos. Contudo, este termo falha ao descrever a estabilidade obtida a partir da conjugação do grupo NO2. Para

descrever a estabilidade de sistemas conjugados de três corpos pertencentes a esse grupo um termo de energia para sistemas conjugados de três corpos Ecoa é introduzido.

E_coa= pcoa1·

1

1 + exp(pcoa2· ∆val_j )

· exp  −pcoa3· −BOi j+ neighbors(i)

∑

n=1 BO_in !2  ·exp  −p_coa3· −BO_jk+ neighbors(i)

∑

n=1 BO_kn !2 · exp h −p_coa4· BO_{i j}− 1.52i ·exph−pcoa4· BOjk− 1.5 2i (4.18)

onde, pcoa1até pcoa4são parâmetros constantes.

4.7 Energia de Ligação Carbono-Carbono

Essa energia é introduzida para capturar a estabilidade da molécula C2.

E_C2= kc2· BOi j− ∆i− 0.04 · ∆4i − 3

2

se BO_{i j}− ∆i− 0.04 · ∆4i − 3 > 3

EC2= 0 se BOi j− ∆i− 0.04 · ∆4i − 3 ≤ 3

(4.19)

(43)

4.8 Energia de Ligação Carbono-Oxigênio

Esse termo da energia total é usado para descrever a ligação tripla no monóxido de carbono CO, e afeta apenas pares ligados de C-O.

E_triple= ptrip1· exp

h −ptrip2· BOi j− 2.5 2i · exp h −ptrip4· ∑vizinhos(i)_k=1 BOik− BOi j i 1 + 25 · exp ptrip3 ∆i+ ∆j + ptrip1· exp h −ptrip2· BOi j− 2.5 2i · exp h −ptrip4· ∑vizinhos(i)_k=1 BOjk− BOi j i 1 + 25 · exp ptrip3 ∆i+ ∆j (4.20) onde, ptrip1até ptrip4são parâmetros constantes.

4.9 Energia dos Ângulos de Torção

Suponhamos que os átomos A, B, C e D da figura 4.3 formem uma molécula. O ângulo de torção envolvendo os átomos B e C é o ângulo θ entre os dois planos definidos pelos grupos de átomos ABC e BCD. No potencial REAXFF os ângulos de torções são sempre calculados para um conjunto de quatro átomos.

Figura 4.3: Molécula fictícia para demonstrar o que é o ângulo de torção. .fonte: [34]. A energia de torção Etors, descrita nas equações 4.21a,4.21b e 4.21c, está associada

com os termos dos ângulos de torção ωi jkl. Aqui, os índices i, j, k e l representam os quatro

(44)

E_tors= f10(BOi j, BOjk, BOkl) · sin Θi jk· sin Θjkl· [ 1 2V1· 1 + cos ωi jkl + 1 2V2· exp ptor1· BOπ_jk− 1 + f11(∆j, ∆k) 2 · (1 − cos 2ωi jkl) + 1 2V3· (1 + cos 3ωi jkl)] (4.21a)

f₁₀(BOi j, BOjk, BOkl) = [1 − exp(−ptor2· BOi j)] · [1 − exp(−ptor2· BOjk)]·

[1 − exp(−ptor2· BOkl)]

(4.21b)

f11(∆j, ∆k) =

2 + exp h

−p_tor3·∆angle_j + ∆angle_k i 1 + exph−ptor3· ∆angle_j + ∆angle_k i + exph−ptor4· ∆angle_j + ∆angle_k i (4.21c)

onde, ptor1até ptor4e V1, V2e V3são parâmetros constantes.

Nos ângulos de torção com uma ligação dupla central, onde BO_jk = 2, a expressão que contém o termo V2 atinge um máximo e se BOjk desvia de 2, essa expressão diminui

ra-pidamente. O termo dependente do ângulo de valência sin(Θi jk) · sin(Θjkl) na equação 4.21a

assegura que a contribuição da energia de torção desaparece quando qualquer um dos dois ân-gulos de valência (Θi jk e Θjkl) se aproximam de π.

A equação 4.21b descreve o desaparecimento suave da contribuição da energia do ângulo de torção quando uma das ligações no ângulo de torção se dissocia. A equação 4.21c é introduzida para evitar contribuições excessivas da torção no sistema contendo átomos de carbono sobrecoordenado com hibridização sp3. Ela reduz a influência de BOjk no termo V2na

equação 4.21a quando os átomos j e k são sobrecoordenados (∆j> 0 e ∆k> 0).

4.10 Energia de Sistemas Conjugados

Sistemas conjugados são sistemas com ligações duplas ou triplas alternadas com ligações simples [35]. A energia para sistema conjugados Econ j é dado nas equações 4.22a e

4.22b: