• Nenhum resultado encontrado

Dinâmica molecular de uma nova família de Glicosil Hidrolases (GH-X)

N/A
N/A
Protected

Academic year: 2021

Share "Dinâmica molecular de uma nova família de Glicosil Hidrolases (GH-X)"

Copied!
91
0
0

Texto

(1)

SINKLER EDUARDO TORMET GONZALEZ

DINÂMICA MOLECULAR DE UMA NOVA FAMÍLIA DE GLICOSIL HIDROLASES (GH-X)

CAMPINAS 2019

(2)

SINKLER EDUARDO TORMET GONZALEZ

DINÂMICA MOLECULAR DE UMA NOVA FAMÍLIA DE GLICOSIL HIDROLASES (GH-X)

Dissertação de Mestrado apresentada ao Instituto de Química da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestre em Química na área de Físico-Química.

Orientador: Prof. Dr. Munir Salomão Skaf

O arquivo digital corresponde à versão final da Dissertação defendida pelo aluno Sinkler Eduardo Tormet Gonzalez e orientada pelo Prof. Dr. Munir Salomão Skaf.

CAMPINAS 2019

(3)
(4)

BANCA EXAMINADORA

Prof. Dr. Munir Salomão Skaf (Orientador)

Prof. Dr. Miguel Angel San Miguel Barrera (Unicamp)

Dra. Daniela Barretto Barbosa Trivella (LNBio – CNPEM)

Ata da defesa assinada pelos membros da Comissão Examinadora, consta no SIGA/Sistema de Fluxo de Dissertação/Tese e na Secretaria do Programa da Unidade.

Este exemplar corresponde à redação final da Dissertação de Mestrado defendida pelo aluno Sinkler Eduardo Tormet Gonzalez, aprovada pela Comissão Julgadora em 11 de julho de 2019.

(5)

Agradecimentos

O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001.

Ao Centro para Computação em Engenhria e Ciências (CCES). Processo FAPESP 20173/08293-7

Agradeço ao Instituto de Química pelo apoio acadêmico e infraestrutura que possibilitaram o desenvolvimento do projeto.

Ao Prof. Dr. Munir Salomão Skaf por me aceitar como orientando e pela dedicação para finalizar este projeto de forma satisfatória.

Ao CNPEM e ao Dr. Mário Murakami e seu grupo de pesquisa pelas estruturas cristalográficas das enzimas estudadas e pelas discussões e ideias que ajudaram a desenvolver este projeto.

À Dra. Camila Ramos dos Santos e a Pedro Avellar pelas discussões e dados proporcionados durante esta pesquisa.

À Dra. Érica Teixeira Prates e ao Dr. Fabrício Bracht pela orientação, atenção e dedicação ao longo do meu mestrado e pela amizade e carinho.

Ao Adriano Ferruzzi pelo apoio técnico durante o mestrado

Aos meus pais e irmã, pelo apoio e carinho incondicional em todas as etapas da minha vida.

Aos meus amigos Bárbara, Gustavo e Patrícia pelo apoio incondicional durante esta e outras etapas da minha vida.

Aos amigos e colegas de laboratório.

(6)

“Attitude is a little thing that makes a big difference” Winston Churchill

(7)

Resumo

As glicosil hidrolases (GH) são enzimas que exercem um papel importante na hidrólise de ligações glicosídicas de açúcares complexos como celulose, hemicelulose e amido, constituindo uma das famílias enzimáticas de maior importância na degradação destes polissacarídeos. Este processo de degradação é de particular interesse devido à sua associação com a produção de bioetanol a partir de bagaço de cana de açúcar e de biomassa lignocelulósica em geral. Assim, a caracterização funcional e estrutural das GHs é de grande valor para aplicações industriais. Com intuito de conhecer a dinâmica destas proteínas, o que não pode ser facilmente determinado por meios experimentais, empregamos neste estudo metodologias de dinâmica molecular (DM) para determinar as propriedades estruturais e dinâmicas básicas de duas enzimas representativas de uma nova família de GHs, aqui denominada GH-X. Os analises feitos mostram os principais fenômenos dinâmicos e estruturais assim como as principais interações enzima-substrato e sua relação com a eficiência catalítica desta nova família GH-X.

(8)

Abstract

Glycoside Hydrolases (GH) are enzymes that play important roles in the hydrolysis of glycosidic bonds during the degradation of lignocellulosic biomass. The structural characterization of these enzymes is considered highly valuable for the second-generation ethanol production due to their central role on cellulose and hemicellulose saccharification. The use of molecular dynamics techniques to study conformational changes, substrate binding and the properties of the substrate itself has been essential to enlighten the molecular mechanisms involved on the enzymatic activity that cannot be easily studied through experimental methodologies. In this work, we used molecular dynamics techniques to study two representative proteins of a new family of glycoside hydrolases (GH-X). From our analysis, we provide strong suggestions about the key interactions and structure-dynamics relationships underlying the differences experimentally observed on their catalytic efficiency.

(9)

Lista de figuras

Figura 1. Representação esquemática dos diversos componentes da parede celular (lignina, hemicelulose e celulose). Modificado de (Chundawat et al. 2011). .. 19 Figura 2. Estrutura primaria da celulose e cadeias de celulose. Na Figura A se pode observar duas unidades de D-Glicose unidas por uma ligação β-1,4: estas unidades representam o constituinte básico de uma cadeia de celulose. Na FiguraB se pode observar as ligações dentre grupos hidroxilas de várias cadeias paralelas de celulose da fibrila. Fonte: http://commons.wikimedia.org/wiki/File:Cellulose_strand.jpg. ... 20

Figura 3. Estados de transição. Na Figura A energia livre do estado fundamental de P é menor do que a de S, e então ΔG para a reação é negativa e o equilíbrio favorece mais P que S. Na FiguraB se pode observar a diminuição da energia de ativação entre os estados S e P .Modificado de: Princípios de Bioquímica

(Nelson and Cox, 2013). ... 23

Figura 4. Curvas de concentração de produto no tempo e velocidade inicial 𝑉0 em relação a concentração de substrato. Na Figura A observa-se como é a variação do produto P no tempo para diferentes concentrações de substrato. Na Figura4B pode-se observar como é a variação de velocidade inicial 𝑉0 em relação á concentração do substrato, definindo a 𝐾𝑀 como a concentração donde se alcança a metade do valor de 𝑉𝑚𝑎𝑥. Modificado de: Princípios de Bioquímica (Nelson and Cox

2013). ... 25

Figura 5. Tipos de fenda catalítica comumente encontradas na família das glicosil hidrolases (GHs). (A) Pocket (glucoamilasa de A. awamori). (B) Cleft ou fenda (endoglucanases E2 de T. fusca). (C) Túnel (celobiohidrolase II de T. reesei). Os resíduos catalíticos estão em laranja (imagem modificada de Davies and Henrissat

(Davies and Henrissat 1995). ... 29

Figura 6. Mecanismos de hidrolises de ligações glicosídicas. A) Mecanismo de retenção. B) Mecanismo de inversão (modificado de Davies and Henrissat (Davies

and Henrissat 1995). ... 30

(10)

Figura 8. Representação esquemática de uma superfície de energia mínima em um sistema. Pode-se observar a existência tanto de mínimos de energia locais como um mínimo global. ... 38 Figura 9. Ordens de grandeza dos tempos de processos em proteínas. Pode-se obPode-servar que a dinâmica molecular pode Pode-ser usada para estudar vários fenômenos de interesse entre os fs e os μs. Modificado de (Henzler-Wildman and Kern 2007) 39 Figura 10. Representação esquemática do processo de docking proteína-ligante ... 42

Figura 11. Enzimas AME (vermelha) e CNE (azul) com as nomenclaturas usadas para identificar as posições dos anéis do substrato baseadas nos sub-sítios catalíticos da enzima. Neste caso, ambas as enzimas estão na configuração L6 .... 43 Figura 12. Resumo com o comprimento e posições dos ligantes nas enzimas simuladas. Na coluna a direita se pode observar a denominação dada para cada comprimento de ligante e na parte inferior as posições do ligante dentro da fenda catalítica. ... 44 Figura 13. Algumas poses do substrato geradas pelo software VINA na enzima AME depois do docking ... 46 Figura 14. Caixa de água para o sistema AME gerado com Packmol. ... 47 Figura 15. Gráficos de RMSD das enzimas AME e CNE para as formas Apo e L6. (A) RMSD da enzima AME na forma apo. (B) RMSD do complexo AME:L6 (C) RMSD da enzima CNE na forma apo (D) RMSD do complexo CNE:L6. Em todos os gráficos se pode observar como as simulações se estabilizam ao longo das dinâmicas0. ... 50 Figura 16. Enzima AME na forma Apo. Se pode observar a forma aberta da fenda catalítica como se pode esperar em certas enzimas da família GH. ... 51 Figura 17. Gráfico de RMSF da enzima AME na sua forma apo. Observa-se uma boa correlação entre os resultados experimentais e teóricos. Se podem observar certas diferenças em relação aos dados experimentais e teóricos devido a existência

(11)

de zonas de maior mobilidade dentro da estrutura que são observadas nas simulações. ... 52 Figura 18. Enzima AME na sua forma holo em duas representações. Se pode observar a forma aberta da fenda catalítica. ... 53 Figura 19. Gráfico de fatores B experimentais e teóricos nas formas holo e apo da enzima AME, se pode observar a boa correlaçoa entre todas as curvas e a redução do pico entre os residuos 100 e 110 ... 54 Figura 20. Diversos frames do complexo AMEM:L6 onde se pode observar o deslocamento do ligante em 3 frames da simulação: 1ns, 70ns e 90ns. ... 55 Figura 21. Análise e principais resíduos e interações na fenda catalítica da enzima AME. NA Figura(A) se podem observar os principais resíduos que interagem com o substrato. Na Figura(B) se pode observar o deslocamento da posições do ligante ao longo da simulação, os números em vermelhos mostram as posições no deslocamento máximo e em preto mostram as posições originais do complexo AME:L3. Na Figura(C) se podem observar os resíduos mais importantes e a posição mais deslocada do substrato(-1 até -6) , as posições -1,-2 e -4 são as que apresentam as maiores interações com os resíduos. ... 56 Figura 22. Gráfico de fatores B experimentais e teóricos nas formas holo e apo da enzima AME. Se pode observar a boa correlação entre todas as curvas e a redução do pico entre os residuos 100 e 110, da mesma forma, se pode observar uma maior mobilidade eda enzima entre os residuos 200 e 220 em relação aos valores experimentais e ao complexo AME:L6. ... 57 Figura 23. Complexo AME:L5 com os resíduos que interagem de forma significativa com o substrato: Y168, E199 e E102. Esta enzima apresentou um pequeno deslocamento do ligante nas dinâmicas, mas experimentalmente não se tem comprovado nenhuma atividade processiva. ... 58 Figura 24. Gráfico de fatores B experimentais e teóricos dos complexos AME:L4 e AME:L6 e apo da enzima AME. Pode-se observar a boa correlaçoa entre todas as curvas. O aumento do fator B do complexo AME:L4 em relaçao ao complexo

(12)

AME:L6 entre os residuos 170-180 é devido ao encurtamento do ligante reduz as interações com o loop o que resulta em maior liberdade de movimento ... 59 Figura 25. Complexo AME:L4 com os resíduos que interagem de forma significativa com o substrato: Y168, D171 E199 e E102. Da mesma forma que os complexos anteriores esta enzima apresentou um pequeno deslocamento do ligante nas dinâmicas, mas experimentalmente não se tem comprovado nenhuma atividade processiva. ... 60 Figura 26. Complexos AME:L3-1 e AME:L3-2. (A) Complexo: AME:L3-1 com os resíduos catalíticos e posições do substrato na fenda catalítica (B) Complexo AME:L3-2 com os resíduos catalíticos e posições do substrato na fenda catalítica .. 61 Figura 27. Distâncias entre o Glu102 e o oxigênio na posição 3 do anel do ligante na posição -1 para (A) Complexo AME:L3-1 e (B) Complexo AME:L3-2. Em ambos gráficos se pode observar a saída do carboidrato da fenda catalítica da enzima, o que da entender que só para complexos maiores os iguais a 4 anéis vão ser clivados pela enzima e ligantes de 3 o menos anéis não... 62 Figura 28. Estrutura CNE na sua forma apo em duas representações distintas. Se pode observar a forma da fenda catalítica aberta. ... 63 Figura 29. Gráficos de RMSF e fator B para a enzima CNE na sua forma apo. As curvas apresentam uma boa correlação dos dados experimentais e teóricos. .... 64 Figura 30. Gráfico dos fatores B experimentais e das estruturas do complexo CNE:L6 e apo da enzima CNE. Se pode observar a redução dos picos entre os resíduos 40 e 60 com a presençaa do substrato na forma holo. Esta redução poderia ser explicada devido as interações do ligante com os resíduos dessa região o que reduz a mobilidade. ... 65 Figura 31. Complexo CNE:L6 mostrando as principais interações do substrato com os resíduos da fenda catalítica. Os principais loops são amostrados em cores e correspondem a regiões de alta mobilidade as quais se vem reflexadas gráfico de fator B na Figura28. O fenômeno mais importante foi a forte interação que existe entre o Glu98 e o His239. ... 66

(13)

Figura 32. Estrutura CNE holo em diversas poses evidenciando o fenômeno de abre e fecha. (A)Resíduos His239 e Glu98 abertos na fenda catalitica. (B) )Residuos His239 e Glu98 fechados na fenda catalitica (C) Dois frames mostrando os residuos His239 e Glu98 abertos (laranja) e fechado (azul) ... 67 Figura 33. Gráfico dos fatores B experimentais e das estruturas dos complexos CNE:L5 e CNE:L6. Se pode observar a redução dos picos entre os resíduos 40 e 60 da L5 em relação a L6. Esta redução poderia ser explicada devido as interações do ligante com os resíduos dessa região o que reduze a mobilidade da mesma ... 68 Figura 34. Complexo CNE:L5 mostrando as principais interações do substrato com os resíduos da fenda catalítica. Os principais loops são amostrados em cores e correspondem a regiões de alta mobilidade as quais se vem reflexadas gráfico de fator B na Figura28. Nesta simulação não se observou a formação do túnel como no complexo CNE:L6. O loop entre os resíduos 42 e 63 apresentou uma maior mobilidade devido a uma menor interação com a extremidade não redutora ... 69 Figura 35. Gráfico dos fatores B experimentais e das estruturas dos complexos CNE:L4 e CNE:L6. Se pode observar a redução dos picos entre os resíduos 80 e 120 da L4 em relação a L6. Esta redução poderia ser explicada devido as interações do substrato com os resíduos dessa região o que reduze a mobilidade da mesma. Ao substrato ser mais curto, a extremidade redutora fica mais perto dos resíduos da região antes descrita e aumenta as interações com eles. ... 70 Figura 36. Complexo CNE:L4 mostrando as principais interações do substrato com os resíduos da fenda catalítica. Os principais loops são amostrados em cores e correspondem a regiões de alta mobilidade as quais se vem reflexadas gráfico de fator B. Nesta simulação não se observou a formação do túnel como no complexo CNE:L6. O loop entre os resíduos 42 e 63 apresentou uma maior mobilidade devido a uma menor interação com a extremidade não redutora da mesma forma que o complexo CNE:L5. Uma maior interação da extremidade não redutora com os resíduos do loop 89-105 reduziu a mobilidade do mesmo como se pode ver reflexado no gráfico na Figura33. ... 71 Figura 37. Distancias entre o Glu92 e o oxigênio na posição 3 do anel do ligante na posição -1 para A) Complexo CNE:L3-1 e B) Complexo CNE:L3-2. Em ambos

(14)

gráficos se pode observar a saída do carboidrato da fenda catalítica da enzima, o que dá entender que só para complexos maiores os iguais a 4 anéis vão ser clivados pela enzima e ligantes de 3 o menos anéis não. ... 72 Figura 38. Distância entre os resíduos His239 e Glu98. (A) Distancias para uma simulação de 300ns. (B) Histograma de frequências mostrando a frequência relativa da distribuição de distancias entre os resíduos Glu98 e His239, se pode observar um pico em distancias inferiores a 5 Å, sugerindo a existência de uma ligação de hidrogênio entre os resíduos. (C) Gráfico de energia livre mostrando uma maior quantidade de estados entre 3,5 e 5 Å o que dá a entender uma maior probabilidade de existência de uma interação nessas distancias. ... 74 Figura 39. Distância entre resíduos His239 e Glu98 na estrutura CNE apo para 300 ns. (A) Pode-se observar a pouca tendência dos resíduos a permanecer a distâncias menores a 5 Å e por tanto à formação de ligação de hidrogênio. (B) Diagrama de energia livre que mostra um mínimo entre 4 e 6 Å e poucos estados menores a 5 Å o que mostra pouca existência de estados em estas distancias ... 76 Figura 40. (A)Distancias entre os resíduos His239 e Glu98 no complexo CNE:L5-5. Não se observa ligação de hidrogênio ao longo da trajetória entre estes resíduos. Cada cor representa a média de uma simulação distinta para melhor visualização. . (B) Diagrama de energia livre que mostra um mínimo entre 4 e 6 Å o que mostra pouca existência de estados menores a estas distancias ... 77 Figura 41. Complexo CNE:L5-5 mostrando a interação entre a Val100 e o subsítio -5 que corresponde a extremidade não redutora. Esta interação da extremidade não redutora com o resíduo Val100 não permite que loop 89-105 fique com a liberdade suficiente para que aconteça a interação entre o Glu98 e o HIS239. Este sistema so foi simulado para tentar entender este fenômeno. ... 78 Figura 42. Distâncias entre os resíduos His239 e Glu98 do complexo CNE:L5. Se observa ligação de hidrogênio ao longo da trajetória entre os resíduos. Cada cor representa a média de uma simulação distinta para melhor visualização. . (B) Diagrama de energia livre que mostra poucos estados menores a 5 Å o que dá a entender a pouca existência de estados menores a estas distancias. ... 79

(15)

Figura 43. Complexo CNE:L5, pode-se observar como a extremidade não redutora do substrato interage com o resíduo Glu98 não tirando todo o loop e não permitindo a formação do túnel com o resíduo His239. ... 80 Figura 44. (A) Distâncias entre os resíduos His239 e Glu98 do complexo CNE:L4. Observa-se pouca ligação de hidrogênio ao longo da trajetória entre os resíduos. Cada cor representa a média de uma simulação distinta para melhor visualização. (B) Diagrama de energia livre que mostra poucos estados menores 5 Å o que dando a entender a pouca existência de estados menores a estas distancias ... 81

Figura 45. Distâncias entre os resíduos His239 e Glu98 para Complexos CNE:L3-1 e CNE:L3-2. Pode-se observar pouca as nenhumas distâncias menores a 5Å o que se pode entender como ausência de ligação de hidrogênio, neste sistema é esperado já que ao sair o carboidrato é equivalente a um sistema apo ... 82 Figura 46. Estruturas das enzimas AME e CNE alinhadas. Pode-se observar a similitude entre ambas estruturas. ... 83 Figura 47. Estruturas das enzimas AME e CNE alinhadas. (A) Loop 238 até 256 na enzima CNE e o equivalente na enzima AME de 248 até 250. (B) Loop 41 até 62 na enzima CNE e o equivalente na enzima AME de 56 até 70. (C) Loop 89 até 105 na enzima CNE e o equivalente na enzima AME de 100 até 112. O maior comprimento dos loops da enzima CNE favorecem uma maior mobilidade e por tanto facilitam o fenômeno de formação do túnel entre os resíduos His239 e Glu98, na enzima AME, uma menos flexibilidade facilita a existência de uma conformação de fenda aberta ao longo das dinâmicas e, portanto, falta a entra e siada de substrato. ... 84

(16)

Lista de tabelas

Tabela 1. Valores calculados de ΔG para algumas glicosil hidrolases. ... 28 Tabela 2. Tempos de minimização e etapas de equilibração usados para as dinâmicas das enzimas AME e CNE. ... 48 Tabela 3. Sistemas e tempos usados em cada simulação. ... 49

(17)

Sumário

Capítulo 1: Introdução ... 19

1.1 Biomassa lignocelulósica ... 19

1.2 Hidrólise enzimática de biomassa ... 21

1.3 Princípios de catálises enzimática ... 22

1.4 Glicosil Hidrolases ... 28

Objetivos da dissertação ... 32

Capítulo 2: Metodologia ... 33

2.1 Dinâmica molecular e campos de força ... 33

2.1.1 Equações de movimento e integração numérica ... 33

2.1.2 Campos de força... 35

2.1.3 Minimização e equilibração em dinâmica molecular ... 37

2.1.4 Distribuição de velocidades e posições iniciais ... 39

2.1.5 Cálculo de propriedades do sistema ... 40

2.2 Docking ... 42

2.3 Detalhes dos sistemas a serem simulados ... 43

Capítulo 3: Resultados e discussões ... 51

3.1 Enzima AME ... 51

3.1.1 Enzima AME na forma Apo ... 51

3.1.2 Complexo AME:L6 ... 53

3.1.3 Sistemas do complexo AME:L5 ... 57

3.1.4 Sistemas do complexo AME:L4 ... 58

3.1.5 Sistemas do complexo AME:L3 ... 60

3.2 Estrutura da enzima CNE ... 63

3.2.1 Enzima CNE na forma Apo ... 63

(18)

3.2.3 Sistemas do complexo CNE:L5 ... 67 3.2.4 Sistemas do complexo CNE:L4 ... 69 3.2.5 Sistemas do complexo CNE:L3 ... 71 3.3 Formação do túnel na enzima CNE e comparação estrutural entre CNE e AME 73

3.3.1 Formação do túnel entre os resíduos His239 e Glu98 na enzima

CNE 73

3.3.2 Comparações estruturais entre as enzimas AME e CNE e seu papel nas diferenças de eficiência catalítica... 82 Capítulo 4: Conclusões e perspectivas... 86 Referências Bibliográficas ... 88

(19)

Capítulo 1: Introdução

1.1 Biomassa lignocelulósica

A biomassa lignocelulósica é o principal componente das paredes celulares das plantas e tem enorme potencial para contribuir na demanda mundial de energia e outros produtos químicos, de forma sustentável e renovável (Payne et al. 2015). A demanda mundial de energia, especialmente de combustíveis líquidos, faz da biomassa lignocelulósica um provável jogador chave no mercado energético mundial. De forma geral, pode-se estabelecer que a biomassa lignocelulósica está composta por dois carboidratos de cadeia longa: a celulose e hemicelulose, e por um polímero aromático, que é a lignina. Os carboidratos de cadeia longa estão compostos por diferentes monômeros de açúcar e estão ligados fortemente à lignina. Na Figura1, pode-se observar um modelo da organização das paredes celulares das plantas.

Figura 1. Representação esquemática dos diversos componentes da parede celular (lignina, hemicelulose e celulose). Modificado de (Chundawat et al. 2011).

A celulose (𝐶6𝐻10𝑂5) é o polímero orgânico mais abundante na natureza e representa entre 40 e 60% do total da matéria seca da biomassa lignocelulósica (Gnansounou and Dauriat, 2005). A celulose consiste de longas cadeias de até 15000 unidades de D-glicose unidas por ligações glicosídicas β-1,4 (Figura2A). Os múltiplos grupos hidroxilas na glicose de uma cadeia formam ligações de hidrogênio com os

(20)

oxigênios da cadeia adjacente, formando fibrilas elementares compostas por aproximadamente 30 ou 36 cadeias do glicano, como se pode ver na Figura2B. O arranjo das cadeias celulósicas na fibrila elementar forma regiões de elevado grau de cristalinidade, alternadas por regiões amorfas com menor grau de ordenação. As fibrilas elementares são agrupadas em feixes (em inglês bundles) que, por sua vez conferem resistência a parede celular (Chundawat et al. 2011). Devido a seu arranjo cristalino, a celulose tem baixa solubilidade em água e na maioria dos solventes orgânicos, e ao estar cercada por hemicelulose e lignina, seu acesso ao solvente externo nas plantas é ainda mais limitado. Isso eleva o nível de recalcitrância da biomassa lignocelulósica ao ataque enzimático e/a tratamentos termoquímicos.

Figura 2. Estrutura primaria da celulose e cadeias de celulose. Na Figura A se pode observar duas unidades de D-Glicose unidas por uma ligação β-1,4: estas unidades representam o constituinte básico de uma cadeia de celulose. Na Figura B se pode observar as ligações dentre grupos hidroxilas de várias cadeias paralelas de celulose da fibrila. Fonte: http://commons.wikimedia.org/wiki/File:Cellulose_strand.jpg.

Cobrindo as fibrilas da celulose, localizam-se as hemiceluloses, que são heteropolímeros (matriz de polissacarídeos) compostos por xilose, manose, galactose e arabinose e representam entre 20 e 40% da massa seca das plantas. As hemiceluloses consistem em cadeias mais curtas em relação a celulose (entre 500 e 3000 unidades glicosídicas) e estão ligadas aos feixes de fibrilas elementares de celulose por ligações de hidrogênio. Sua principal função é aumentar a resistência da parede celular através de sua associação com celulose e, nas paredes secundárias, com a lignina (Scheller and Ulvskov, 2010) como ilustrado na Figura 1. Em contraste com a celulose, a hemicelulose apresenta uma estrutura amorfa e desorientada, além disso, é facilmente hidrolisada por ácidos e bases diluídas.

(21)

Por último, recobrindo toda a matriz hemicelulósica, encontram-se as ligninas, que são compostos polifenólicos que estão formados pela polimerização de três tipos de monômeros (os álcoois cumarílico, coniferílico e sinapílico) e representam entre 10-25% da massa seca das plantas. A lignina adiciona força compressiva e rigidez à parede celular.

1.2 Hidrólise enzimática de biomassa

A degradação da biomassa é feita por misturas (coquetéis) de enzimas que trabalham em conjunto como as endoglucanases, exoglucanases e β-glicosidases. A maioria das bactérias e fungos capazes de degradar material lignocelulósico secretam diversas enzimas isoladamente. As enzimas provenientes dos fungos são as mais estudadas devido à elevada capacidade de secreção destes micro-organismos e também são as mais disponíveis comercialmente.

Especificamente, a degradação de celulose envolve a participação de uma mistura de enzimas chamadas celulases que clivam ligações β-1,4 e se complementam em suas funções. As endoglucanases que apresentam uma forma de fenda catalítica aberta, clivam ligações glicosídicas de forma randômica gerando novas extremidades redutoras e não redutoras. As exoglucanases, por sua vez, apresentam um domínio de ligação à celulose e, portanto, são capazes de fazer a hidrólise enzimática de forma contínua (processiva). Por último, as β-glicosidases completam o processo com a hidrólise de moléculas de celobiose liberando glicose. Geralmente, a hidrólise enzimática ocorre via um coquetel de enzimas que melhora a eficiência de todo o processo, já que o rendimento em conjunto é muito melhor que a soma dos rendimentos (sinergia).

Os parâmetros macroscópicos empregados na descrição da cinética enzimática são geralmente obtidos pelo mecanismo clássico de Michaellis-Menten, por meio do qual obtém-se parâmetros ou quantidades que determinam a eficiência de uma enzima na degradação de um dado substrato. Para entender melhor estes mecanismos, faremos uma pequena introdução à catalise enzimática.

(22)

1.3 Princípios de Catálises Enzimática

Em condições biológicas relevantes, as reações químicas não catalisadas tendem a ser lentas e só podem acontecer sob certas condições muito específicas (pH, temperatura, meio aquoso, etc.). Portanto, os catalisadores, como as enzimas, são de vital importância em sistemas biológicos e em contextos industriais. As enzimas estão sujeitas às mesmas leis da natureza que governam o comportamento de outras substâncias, mas, as enzimas também diferem em aspectos importantes que podem acelerar uma reação química específica (Voet and Voet 2014):

• As reações catalisadas por enzimas apresentam velocidades de reação maior (entre 106 e 1012 vezes mais rápidas) em relação a reações químicas não catalisadas

• As enzimas podem atuar em condições de reação mais suaves: As reações catalisadas enzimaticamente podem acontecer em condições brandas (menos de 50ºC, pressão atmosférica, pH neutro)

• As reações enzimáticas têm maior grau de especificidade: As enzimas tem maior grau de especificidade em relação às identidades do substrato e seus produtos em relação a catalizadores químicos e, portanto, as reações enzimáticas raramente tem produtos secundários

• As enzimas têm maior capacidade de regulação

A melhor forma de entender como funciona este processo de catalise é entender como as enzimas funcionam. Uma reação enzimática simples pode ser escrita como:

𝐸 + 𝑆 ⇌ 𝐸𝑆 ⇌ 𝐸 + 𝑃 (1.1) onde E, S e P representam respectivamente a enzima, o substrato e o produto.

Um catalisador não afeta o equilíbrio da reação, só a velocidade da mesma. O ponto de partida tanto da reação direta quanto da reação reversa é denominado estado fundamental (Figura3A). O equilíbrio entre S e P na equação anterior reflete a diferença entre as energias livre dos seus estados fundamentais. Na Figura3A, a

(23)

energia livre do estado fundamental de P é menor que a de S, o ΔG para a reação é negativo e o equilíbrio favorece mais P que S. Pode-se observar, que há uma barreira energética entre S e P que é a energia necessária para alinhar os grupos reagentes, para a formação de cargas instáveis transitórias, rearranjos de ligações e ainda outras transformações necessárias para que a reação ocorra em qualquer direção. Esta barreira deve, antes, ser suplantada pelo sistema para atingir um nível de energia livre mais alto para que a reação aconteça.

O topo da curva de energia livre visto nas Figuras 3A e 3B é um ponto a partir do qual o decaimento para o estado S ou para o estado P tem a mesma probabilidade de ocorrer. É o chamado estado de transição (para entender melhor este fenômeno, podemos fazer uma analogia com o equilíbrio instável de um sistema mecânico). O estado de transição é um momento molecular transitório no qual eventos como a quebra de ligação, a formação de ligação ou o desenvolvimento de carga ocorrem com a mesma probabilidade de seguirem tanto para formar novamente o substrato como para formar o produto. A diferença entre os níveis energéticos do estado basal e do estado de transição é a energia de ativação,

ΔG

.

A velocidade da reação reflete essa energia livre de ativação: uma energia de ativação maior corresponde a uma reação mais lenta. Portanto os catalisadores buscam aumentar a velocidade das reações por diminuírem as energias livres de ativação como se pode observar na Figura3B.

Figura 3. Estados de transição. Na Figura A energia livre do estado fundamental de P é menor do que a de S, e então ΔG para a reação é negativa e o equilíbrio favorece mais P que S. Na FiguraB se pode observar a diminuição da

(24)

energia de ativação entre os estados S e P .Modificado de: Princípios de Bioquímica

(Nelson and Cox, 2013).

De forma geral, pode-se dizer que a energia livre de ativação é uma barreira energética para as reações químicas e é crucial para a própria vida já que sem essa barreira, macromoléculas complexas poderiam reverter espontaneamente para formas moleculares mais simples, e as estruturas complexas e altamente ordenadas e os processos metabólicos nas células não poderiam existir.

A velocidade de uma reação é determinada pela concentração do reagente (ou reagentes) e por uma constante de velocidade, designada por k. Para uma reação unimolecular S → P, a velocidade da reação V é expressa por uma equação de velocidade:

𝑉 = 𝑘[𝑆] (1.2) Nesta equação a velocidade depende só da concentração S, sendo esta uma reação de primeira ordem. O fator k é uma constante de proporcionalidade que reflete a probabilidade de que a reação ocorra em determinado conjunto de condições (pH, temperatura, etc). Nesta equação k é a constante de velocidade de primeira ordem e tem unidade de recíproco do tempo (𝑠−1). Esta expressão pode ser estendida para o caso em que reação depende da concentração de dois compostos diferentes; a constante k passa a ser de segunda ordem e com unidade 𝑀−1𝑠−1

𝑉 = 𝑘[𝑆1][𝑆2] (1.3)

A partir da teoria do estado de transição pode-se derivar a equação de Eyring, a que relaciona a magnitude da constante de velocidade com a energia de ativação:

𝑘 =𝑘𝐵𝑇

ℎ 𝑒

−∆𝐺 𝑅𝑇⁄ (1.4)

onde 𝑘𝐵 é a constante de Boltzmann e ℎ a constante de Planck. A relação da constante de velocidade k e a energia de ativação

ΔG

‡ é inversa e exponencial, ou seja, menor energia de ativação significa velocidade de reação maior.

(25)

Uma das melhores formas de entender o mecanismo das enzimas é através dos estudos de cinética enzimática. A cinética enzimática estuda as velocidades das reações e como se modificam em resposta a mudanças nos parâmetros experimentais.

Devido à dificuldade de medir a concentração de substrato [S] (que geralmente se altera durante a reação), a cinética enzimática toma como medida inicial a velocidade inicial 𝑉0 , que é dada pela taxa de produção do produto [P] nas etapas iniciais da reação (Figura4A). 𝑉0 pode ser estudada em função de [S] como é mostrado na Figura4B. Em concentrações baixas de substrato 𝑉0 aumenta quase linearmente e com o aumento de [S] chega se num ponto no qual 𝑉0 aumenta muito lentamente. Neste regime a velocidade inicial tende para seu máximo, 𝑉𝑚𝑎𝑥 como mostra a Figura4B

Figura 4. Curvas de concentração de produto no tempo e velocidade inicial 𝑉0 em relação a concentração de substrato. Na Figura A observa-se como é a variação do produto P no tempo para diferentes concentrações de substrato. Na Figura4B pode-se observar como é a variação de velocidade inicial 𝑉0 em relação á concentração do substrato, definindo a 𝐾𝑀 como a concentração donde se alcança a metade do valor de 𝑉𝑚𝑎𝑥. Modificado de: Princípios de Bioquímica (Nelson and Cox

2013).

A curva que expressa a relação entre [S] e 𝑉0 (Figura4B) tem a mesma forma geral para a maioria das enzimas e pode ser expressa algebricamente pela equação de Michaelis-Menten, que tem como hipótese básica que a etapa limitante da

(26)

velocidade de uma reação enzimática é a quebra do complexo ES em produto e enzima livre. A equação é:

𝑉0 = 𝑉𝑚𝑎𝑥[𝑆]

𝐾𝑀+ [𝑆] (1.5)

Todos esses termos são determinados do ponto de vista experimental, e a constante de Michaelis, 𝐾𝑀, pode ser medida experimentalmente. Uma relação numérica importante emerge da equação de Michaelis-Menten no caso especial quando 𝑉0 é exatamente metade da 𝑉𝑚𝑎𝑥.

O valor de 𝑉𝑚𝑎𝑥 pode variar muito entre enzimas diferentes. Se uma enzima reage pelo mecanismo de duas etapas de Michaelis-Menten, então 𝑉𝑚𝑎𝑥 = 𝑘2[𝐸𝑡], onde 𝑘2 é a etapa limitante da velocidade. Entretanto, o número de etapas da reação e a identidade das etapas limitantes da velocidade podem variar de acordo com a enzima. Por exemplo, considere a situação bem comum na qual a liberação do produto, EP → S + E, é a etapa limitante da velocidade. No início da reação (quando [P] é baixo), a reação total pode ser descrita pelo esquema:

𝐸 + 𝑆 ⇋𝑘

−1

𝑘1 𝐸𝑆 ⇋

𝑘−2

𝑘2 𝐸𝑃 ⇋𝑘3 𝐸 + 𝑃 (1.6)

Quando várias etapas são parcialmente limitantes, 𝑘𝑐𝑎𝑡 pode se tornar uma função complexa com várias das constantes de velocidade que definem individualmente cada uma das etapas da reação. Na equação de Michaelis-Menten, 𝑘𝑐𝑎𝑡 = 𝑉𝑚𝑎𝑥/[𝐸𝑡], e a Equação (1.5) torna-se

𝑉0 =

𝐾𝑐𝑎𝑡[𝐸𝑡][𝑆]

𝐾𝑀+ [𝑆] (1.7)

A constante 𝑘𝑐𝑎𝑡 é a constante de primeira ordem da velocidade, tendo como unidade a recíproca do tempo. Ela também é chamada de número de renovação (“turnover”), sendo, quando a enzima estiver saturada com o substrato, equivalente ao número de moléculas de substrato convertidas em produto por unidade de tempo por uma única molécula de enzima.

Os parâmetros 𝑘𝑐𝑎𝑡 e 𝐾𝑀 são úteis para estudar e comparar enzimas diferentes, independentemente se os mecanismos de reação são simples ou complexos. Cada enzima tem valores de 𝐾𝑐𝑎𝑡 e 𝐾𝑀 que refletem o ambiente celular,

(27)

a concentração de substrato normalmente encontrada in vivo pela enzima e a química da reação catalisada. Os parâmetros 𝑘𝑐𝑎𝑡 e 𝐾𝑀 também possibilitam que se avalie a eficiência cinética das enzimas, embora individualmente cada um desses parâmetros seja insuficiente para isso. Duas enzimas que catalisam reações diferentes podem ter o mesmo 𝑘𝑐𝑎𝑡 (número de renovação). Entretanto, as velocidades dessas reações quando não catalisadas podem ser diferentes entre si e, portanto, o aumento de velocidade propiciado por cada enzima pode ser muito diferente. A melhor maneira de comparar as eficiências catalíticas de enzimas diferentes, ou o número de vezes que diferentes substratos são catalisados por uma mesma enzima, é comparar a relação 𝑘𝑐𝑎𝑡/𝐾𝑀 para as duas reações. Esse parâmetro, algumas vezes denominado constante de especificidade, é a constante de velocidade para a conversão de E + S em E +P. Quando [S] << 𝐾𝑀 a equação (1.8) se reduz à forma:

𝑉0 =𝑘𝑐𝑎𝑡

𝐾𝑀 [𝐸𝑡][𝑆] (1.8)

Neste caso 𝑉0 depende da concentração dos dois reagentes [𝐸𝑡] e [S], e consequentemente essa é a equação de velocidade de segunda ordem e 𝑘𝑐𝑎𝑡/𝐾𝑀 é a constante de velocidade de segunda ordem com unidades de 𝑀−1𝑠−1. Existe um limite superior para a relação 𝑘𝑐𝑎𝑡/𝐾𝑀 imposto pela velocidade com que E e S podem se difundir em soluções aquosas (entre 108 e 109 𝑀−1𝑠−1).

Como foi dito, os mecanismos clássicos de Michaelis-Menten podem ser empregados na descrição da cinética enzimática e para comparar a eficiência catalítica de enzimas conhecidas. A equação (1.9) também chamada equação de Eyring também pode ser usada para obter valores de energia de ativação a partir dos valores de 𝑘𝑐𝑎𝑡. Em geral a cinética das enzimas que degradam a biomassa lignocelulosica é bastante lenta, na Tabela 1, se pode observar valores típicos de 𝑘𝑐𝑎𝑡 com seus respectivos valores de energia de ativação para algumas enzimas da família das Glicosil Hidrolases junto com as duas enzimas que são estudadas nesta dissertação (AME e CNE).

(28)

Tabela 1. Valores calculados de ΔG para algumas glicosil hidrolases.

Enzima Kcat (1/s) ΔG(kcal/mol)

TrCel7A 7,64𝑥10−1 15,50

D214N 2,51𝑥10−3 21,86

AME 5,59𝑥101 15,69

CNE 5,20𝑥100 17,16

1.4 Glicosil Hidrolases

As Glicosil Hidrolases (GH) são enzimas que exercem um papel importante na hidrólise de ligações glicosídicas de açúcares complexos como celulose, hemicelulose e amido, constituindo uma das famílias enzimáticas de maior importância na degradação destes açúcares presentes nas paredes celulares de plantas (Davies & Henrissat, 1995). Este processo de degradação é de particular interesse devido à sua associação com a produção de bioetanol a partir de bagaço de cana de açúcar e de outras fontes de biomassa lignocelulósica (Chundawat, Beckham, Himmel, & Dale, 2011) ⁠. Assim, a caracterização funcional e estrutural das GHs é de grande valor para as indústrias de biocombustíveis e de geração sustentável de produtos químicos de maior valor agregado.

O processo de hidrólise enzimática envolve dos domínios das enzimas, o primeiro domínio é chamado domínio catalítico (em inglês Catalytic Core Domain ou CCD) onde ocorre a hidrólise e o segundo é o domínio de ligação da celulose (em inglês Cellulose Binding Domain ou CBM) o qual é responsável por aumentar a quantidade de celulase na superfície celulósica. Este último domínio CBM está presente na maioria das enzimas endo e exoglucanases de estrutura conhecida. Para o nosso estudo com a família GH-X, se apresenta uma enzima endoglucanases porém sem a presença do CBM.

O domínio estrutural chave para os processos de bioconversão catalítica é o CCD. A Figura5 mostra alguns exemplos gerais de estruturas dos diferentes tipos de sitio ativo reportados para os CCD de diversas GHs. Os CCD têm a função de reconhecer e se ligar a estes substratos alvo, e exercer a função de clivagem catalítica

(29)

com auxílio de um conjunto de aminoácidos específicos que podem variar entre as famílias de enzimas.

Figura 5. Tipos de fenda catalítica comumente encontradas na família das glicosil hidrolases (GHs). (A) Pocket (glucoamilasa de A. awamori). (B) Cleft ou fenda (endoglucanases E2 de T. fusca). (C) Túnel (celobiohidrolase II de T. reesei). Os resíduos catalíticos estão em laranja (imagem modificada de Davies and Henrissat

(Davies and Henrissat 1995).

As glicosil hidrolases tem desenvolvido vários mecanismos para baixar a barreira energética da reação de hidrolises como a distorção do substrato numa conformação de meia cadeia ou sofá (Kuroki, Weaver, and Matthews 1993; Strynadka and James 1991). Acredita-se que a protonação das ligações glicosídicas está acompanhada por um alongamento de estas ligações.

Nas GHs, a maioria das reações de hidrólise das ligações glicosídicas acontece através de dois mecanismos que precisam de dois resíduos: um doador de prótons e um nucleófilo/base. O primeiro mecanismo chamado de inversão acontece com assistência ácido/báse da cadeia lateral de dois aminoácidos, enquanto no segundo mecanismo, chamado de retenção, dois resíduos atuam, um como nucléofilo e outro como catalisador ácido/base (Davies and Henrissat 1995).

Nos dois mecanismos tanto inversão quanto retenção as posições do doador de prótons são idênticas, ou seja, dentro da distância de ligação de hidrogênio do oxigênio glicosídico. Nas enzimas com mecanismo de retenção a base nucleofílica

(30)

está perto da vizinhança do carbono anomérico do açúcar (Figura4-A). Nas enzimas inversoras, a base fica mais longe, pois deve acomodar uma molécula de água entre a base e o açúcar(Figura4-B) . As distâncias entre os resíduos catalíticos é de aproximadamente 5.5 A para as enzimas retentoras e 10 A para as enzimas inversoras.

Figura 6. Mecanismos de hidrolises de ligações glicosídicas. A) Mecanismo de retenção. B) Mecanismo de inversão (modificado de Davies and Henrissat (Davies

and Henrissat 1995).

Para o caso da nova família GH-X os resíduos catalíticos foram identificados experimentalmente como Glu102 e Glu199 na enzima denominada AME e Glu92 e Glu187 na enzima denominada CNE. Os aminoácidos Glu102 e Glu92 são identificados como catalizador ácido-base e Glu199 assim como Glu187 como nucléofilos. Este trabalho visa estudar duas enzimas da nova família de Glicosil Hidrolases denominada GH-X (ainda não publicada) descoberta pelo grupo do Dr. Mário Murakami do Centro Nacional de Pesquisa em energia e Materiais (CNPEM). Com intuito de obter dados sobre a dinâmica e mecanismos de esta nova família de GHs, foram empregadas metodologias de dinâmica molecular (DM) para estudar fenômenos que não poderiam ser facilmente determinados por meios experimentais.

(31)

Neste estudo, simulações de dinâmica molecular e docking foram realizados nesta nova família de GH-X para poder entender melhor seu comportamento, estrutura e mecanismo de ação.

(32)

Objetivos da dissertação

No contexto dos sistemas enzimáticos, as trajetórias atomísticas são utilizadas para obter interpretações detalhadas e predições do comportamento proteico (Karplus and Kuriyan 2005). Por esta razão, as simulações computacionais por DM exercem um papel altamente complementar a análises de cristalografia de raios-X e a outros ensaios experimentais biofísicos, químicos e biológicos (Sandgren, Ståhlberg, and Mitchinson 2005) e são elementos chave para estudar de forma mais detalhadas os mecanismos de ação de uma enzima e ainda mais em uma nova família como a GH-X. Portanto, o foco primário da dissertação é o estudo da nova família GH-X por meio de simulações de dinâmica molecular. Será dedicada especial atenção aos seguintes aspectos:

● Investigar as propriedades estruturais e dinâmicas básicas da família GH-X ● Estudar as interações entre o ligante e o sítio catalítico a fim de caracterizar a

atividade enzimática da família GH-X

● Associar o comportamento dinâmico às propriedades de estrutura para esclarecimento do mecanismo de ligação do complexo substrato-enzima.

(33)

Capítulo 2: Metodologia

2.1 Dinâmica molecular e campos de força

A técnica de Dinâmica Molecular tornou-se uma importante ferramenta que permite aos pesquisadores em física, química e biologia, modelar o comportamento dinâmico microscópico de muitos tipos de sistemas diferentes. Ela consiste em estudar o movimento de átomos e moléculas por um período fixo e, na versão mais básica, consiste em resolver numericamente as equações de movimento do Newton para um sistema com múltiplas interações interatômicas e energia potenciais.

A dinâmica molecular foi desenvolvida por Alder e Wainwright (Alder and Wainwright 1957) para simular um sistema em fase condensada e, portanto, seu campo de atuação original foi na física. Ao longo do tempo, as técnicas foram desenvolvidas e estendidas para outras áreas como a físico-química, ciência dos materiais e modelagem de biomoléculas. Nesta última área, muitos avanços puderam ser feitos já que permitiu “observar” o comportamento de uma proteína adicionando o tempo como uma das variáveis nos estudos de proteínas.

A dinâmica molecular calcula a dinâmica real do sistema de modo iterativo e, portanto, propriedades estatísticas podem ser calculadas. A dinâmica molecular é um método determinístico e, portanto, podem ser calculados os estados do sistema num tempo futuro. Nas simulações, é necessário discretizar as equações de movimento para assim calcular as forças, velocidades e posições sobre cada átomo para gerar novas posições no próximo passo. A força ao longo de cada passo discreto é considerada constante para cada átomo. O tempo de duração dependerá do tipo de fenômeno a estudar (Henzler-Wildman and Kern 2007) o qual pode ser desde picosegundos (10−12𝑠), até nanosegundos (10−9𝑠).

2.1.1 Equações de movimento e integração numérica

A descrição das trajetórias dos átomos poderia dar-se através do uso da mecânica clássica. A simples integração da equação da segunda lei de Newton (𝐹 = 𝑚𝑎) dá os parâmetros necessários para obter uma descrição da trajetória dos átomos do sistema a estudar:

(34)

𝑑2𝑥𝑖 𝑑𝑡2 =

𝐹𝑥𝑖 𝑚𝑖

(2.1)

esta equação descreve o movimento de uma partícula de massa 𝑚𝑖 ao longo da coordenada 𝑥𝑖 com uma força 𝐹𝑥𝑖.

Muitos algoritmos numéricos têm sido desenvolvidos para gerar as trajetórias atomísticas em uma simulação. O programa NAMD usado para as simulações nesta dissertação usa o algoritmo de Verlet e por isso será discutido aqui. Todos os algoritmos de integração de equações de movimento, envolvem o truncamento de uma série de Taylor da posição 𝑟 no tempo. No caso do algoritmo de Verlet (Verlet 1967) este trunca a expansão na série de Taylor no segundo termo para as posições no tempo (𝑡 + 𝛿𝑡) e no tempo anterior (𝑡 − 𝛿𝑡), onde 𝛿 é o passo de integração, fornece: 𝑟(𝑡 + 𝛿𝑡) = 𝑟(𝑡) + 𝛿𝑡𝑣(𝑡) + 1 2𝛿𝑡 2𝑎(𝑡) + … (2.2) 𝑟(𝑡 − 𝛿𝑡) = 𝑟(𝑡) − 𝛿𝑡𝑣(𝑡) + 1 2𝛿𝑡 2𝑎(𝑡) + … (2.3)

adicionando as equações (2.2) e (2.3), obtém-se 𝑟(𝑡 + 𝛿𝑡):

𝑟(𝑡 + 𝛿𝑡) = 2𝑟(𝑡) − 𝑟(𝑡 − 𝛿𝑡) + 𝛿𝑡2𝑎(𝑡) + … (2.4) As velocidades não podem ser obtidas explicitamente na equação (2.4) e, portanto, representam uma desvantagem já que a velocidade só pode ser calculada no seguinte intervalo de integração quando todos os parâmetros anteriores já foram calculados. Por esta razão, uma modificação deste algoritmo, chamado algoritmo de Verlet de Velocidade (Swope et al. 1982) obtém as velocidades e acelerações ao mesmo tempo sem comprometer a precisão do algoritmo. O algoritmo de Verlet de velocidade é implementado em um procedimento de 3 passos:

No primeiro passo as posições são calculadas em 𝑡 + 𝑡𝛿 usando 𝑎(𝑡):

𝑟(𝑡 + 𝛿𝑡) = 𝑟(𝑡) + 𝛿𝑡𝑣(𝑡) + 1 2𝛿𝑡

(35)

No segundo passo, são calculadas as velocidades no tempo 𝑡 +1 2 : 𝑣 (𝑡 +1 2𝛿𝑡) = 𝑣(𝑡) + 1 2𝛿𝑡𝑎(𝑡) (2.6)

Finalmente, novas forças são calculadas a partir das posições atuais e, portanto, é obtida 𝑎(𝑡 + 𝑡𝛿) e por último podem ser calculadas explicitamente as velocidades:

𝑣(𝑡 + 𝛿𝑡) = 𝑣 (𝑡 +1

2𝛿𝑡) + 1

2𝛿𝑡𝑎(𝑡 + 𝛿𝑡) (2.7)

Uma das vantagens deste algoritmo é que não são necessárias as posições anteriores para calcular a próxima configuração do sistema e por isso é preferido em muitos programas de dinâmica molecular como NAMD que foi usado neste trabalho. 2.1.2 Campos de força

Muitos dos sistemas que se pretende investigar com dinâmica molecular são demasiadamente grandes para ser considerados desde o ponto de vista quântico(Leach 2001). Os métodos de campos de força (também conhecidos como mecânica molecular) ignoram os elétrons dos átomos e só consideram as energias do sistema em função das posições nucleares, desta forma permitindo simular sistemas com uma grande quantidade de átomos.

A maioria dos campos de força usados hoje em dia em sistemas moleculares pode ser interpretada em termos de quatro simples componentes de forças inter e

intra moleculares dentro do sistema. Penalidades energéticas são aplicadas quando

acontecem desvios nas ligações e ângulos em relação aos valores de referência ou equilíbrio. O campo de força também tem funções que descrevem como as trocas de energia acontecem nas rotações das ligações e, por último, tem termos que descrevem as interações entre as partes não ligadas do sistema. Campos de força mais avançados podem ter outros termos, mas geralmente os termos descritos anteriormente estão sempre presentes. Uma forma funcional do campo de força é mostrada na equação:

(36)

𝑉𝑡𝑜𝑡𝑎𝑙(𝒓𝑁) = ∑ 𝑘𝑖 2(𝑙𝑖 − 𝑙𝑖,0) 2 𝑙𝑖𝑔𝑎çõ𝑒𝑠 ∑ 𝑘𝑖 2 á𝑛𝑔𝑢𝑙𝑜𝑠 (𝜃𝑖 − 𝜃𝑖,0)2+ ∑ 𝑉𝑁 2 (1 + cos(𝑛𝜔 − 𝛾)) 𝑡𝑜𝑟𝑠õ𝑒𝑠 + ∑ ∑ (4𝜀𝑖𝑗[(𝜎𝑖𝑗 𝑟𝑖𝑗 ) 12 − (𝜎𝑖𝑗 𝑟𝑖𝑗 ) 6 ] + 𝑞𝑖𝑞𝑗 4𝜋𝜀0𝑟𝑖𝑗 ) 𝑁 𝑗=𝑖+1 𝑁 𝑖=1 (2.8)

onde a energia potencial depende das posições r e do número de partículas N. Tanto o primeiro como o segundo termo são modelados por um potencial do tipo oscilador harmônico. Mais especificamente, no primeiro termo se modela a interação entre pares de átomos ligados e como o aumento da distância 𝑙𝑖 entre átomos em relação a um valor de referência 𝑙𝑖,0 deixa ver o aumento da energia de interação entre os átomos. O segundo termo é uma soma de todos os ângulos de valência da molécula (torções diedrais), que é o ângulo formado por três átomos i-j-k com vértice em j, como se pode ver na FiguraB da imagem 5. O terceiro termo é um termo torsional que descreve a variação da energia em função da rotação da ligação dos átomos. Por último, o quarto termo é calculado entre todos os pares de átomos da molécula (i,j) e que consistem em a interação eletrostática e de van der Waals.

(37)

O potencial anterior, pode ser considerado como a suma de dois potencias: os três primeiros termos são considerados o potencial ligado ou 𝑉𝑙𝑖𝑔𝑎𝑑𝑜 e o último termo como o potencial nao ligado ou 𝑉𝑛ã𝑜−𝑙𝑖𝑔𝑎𝑑𝑜. Portanto

𝑉𝑡𝑜𝑡𝑎𝑙 = 𝑉𝑙𝑖𝑔𝑎𝑑𝑜+ 𝑉𝑛ã𝑜−𝑙𝑖𝑔𝑎𝑑𝑜 (2.9)

Dentre os potenciais efetivos clássicos desenvolvidos, destacam-se os campos de força, CHARMM (Brooks et al., 1983)⁠, AMBER (Jorgensen, Maxwell, & Tirado-Rives, 1996)⁠ e GROMOS (Ott & Meyer, 1996)⁠. Estes campos de força descrevem as interações entre diferentes átomos pela soma de interações de curto alcance do tipo Lennard-Jones, termos de interação eletrostática coulombianos e potenciais internos de estiramento e distensão de ligação.

2.1.3 Minimização e equilibração em dinâmica molecular

Na DM, é de especial interesse conseguir os pontos mínimos na superfície de energia (ver Figura8). Arranjos de energia mínima dos átomos, correspondem a estados simples dos sistemas, qualquer movimento fora do mínimo, dá uma nova configuração de maior energia. A minimização em dinâmica molecular é feita já que as coordenadas iniciais do sistema têm maus contatos e altas energias (devido a problemas com o empacotamento do cristal, por exemplo.). Portanto, um algoritmo de minimização ajuda a conseguir mínimos de energia que podem mitigar os problemas anteriores.

(38)

Figura 8. Representação esquemática de uma superfície de energia mínima em um sistema. Pode-se observar a existência tanto de mínimos de energia locais como um mínimo global.

A equilibração, é o processo que permite ao sistema evoluir até conseguir o equilíbrio. A equilibração deve continuar até que uma série de propriedades monitoradas fiquem estáveis. Dentre de estas propriedades, monitoradas temos a energia, temperatura e pressão assim como também, propriedades estruturais.

A duração das simulações se baseia nos tipos de fenômenos que se deseja observar nas enzimas. No nosso caso, queremos estudar a estrutura e interações ligante-proteína e, portanto, precisaríamos ter tempos da ordem de nano segundos (Henzler-Wildman and Kern 2007). A Figura9 mostra as diversas ordens de grandeza das simulações dependendo do tipo de fenômeno que se quer observar.

(39)

Figura 9. Ordens de grandeza dos tempos de processos em proteínas. Pode-se obPode-servar que a dinâmica molecular pode Pode-ser usada para estudar vários fenômenos de interesse entre os fs e os μs. Modificado de (Henzler-Wildman and Kern 2007) 2.1.4 Distribuição de velocidades e posições iniciais

Para fazer uma simulação de DM é necessário estabelecer configurações iniciais para o sistema. As configurações iniciais podem ser obtidas a partir de dados experimentais e teóricos ou uma combinação de ambos. Para atribuir as velocidades iniciais dos sistemas é usada a distribuição de velocidades de Maxwell-Boltzmann:

𝑝(𝑣𝑖𝑥) = ( 𝑚𝑖 2𝜋𝑘𝐵𝑇) 1 2 𝑒𝑥𝑝 [−1 2 𝑚𝑖𝑣𝑖𝑥2 𝑘𝐵𝑇 ] (2.10)

que dá a probabilidade que um átomo 𝑖 de massa 𝑚𝑖 tenha uma velocidade 𝑣𝑖𝑥 na direção 𝑥 a uma temperatura 𝑇. A distribuição de Maxwell-Boltzmann é uma distribuição gaussiana e portanto, pode ser obtida usando um gerador de números aleatórios.

(40)

2.1.5 Cálculo de propriedades do sistema

Uma das principais vantagens da DM é poder calcular propriedades do sistema que possam ser comparadas com medidas experimentais. Dentre estas propriedades, podemos mencionar uma propriedade termodinâmica genérica 𝐴 que poderia ser por exemplo pressão. O valor desta propriedade, que é medida experimentalmente, é uma média da propriedade de interesse no tempo. Esta propriedade pode ser calculada através da seguinte integral que representa a média do ensemble:

〈𝐴〉 = ∫ ∫ 𝑑𝒑𝑁𝑑𝒓𝑁𝐴(𝒑𝑁, 𝒓𝑁)𝜌(𝒓𝑁, 𝒓𝑁) (2.11)

onde 𝒑 representa o momentum e 𝒓 as posições para as 𝑵 partículas, os brackets 〈 〉 estão indicando a média sobre o ensemble ou o valor esperado que é a média do valor da propriedade A sobre todas as replicações do ensemble ao longo da simulação. O termo 𝜌(𝒓𝑁, 𝒓𝑁) representa a densidade de probabilidade de conseguir uma configuração do sistema com momentum, 𝒑𝑁 e posição 𝒓𝑁. Em condições de número de partículas constante, volume e temperatura, neste caso, a função de densidade de probabilidade é a distribuição de Bolztmann.

Desde o ponto de vista computacional, as propriedades médias podem ser obtidas a partir da equação:

〈𝐴〉 = 1 𝑀∑ 𝐴(𝒑 𝑁, 𝒓𝑁) 𝑀 𝑖=1 (2.12)

onde M é o número de passos.

Para nossos sistemas ao tratar de um sistema NPT, a temperatura foi mantida constante usando o método de Nosé-Hoover que permitiu controlar a energia cinética do sistema e, portanto, a temperatura. A pressão foi mantida constante com o pistão de Langevin (Feller et al. 1995; Hoover 1986; James C. Phillips et al. 2005).

No contexto do estudo de proteínas, uma das grandezas comummente empregadas, é o RMSD (Root Square Median Deviation). RMSD é uma grandeza que representa a variação média da distância entre átomos em relação a uma estrutura de referência. Esta relação é dada pela seguinte equação:

(41)

𝑅𝑀𝑆𝐷 = √∑ 𝑑𝑖 2 𝑁á𝑡𝑜𝑚𝑜𝑠 𝑖=1 𝑁á𝑡𝑜𝑚𝑜𝑠 (2.13)

onde 𝑁á𝑡𝑜𝑚𝑜𝑠 é o número de átomos nos quais o RMSD é medido e 𝑑𝑖 é a distância entre as coordenadas do átomo 𝑖 nas duas estruturas quando estão sobrepostas.

Outra grandeza importante é a mobilidade ou RMSF (Root Mean Square

Fluctuations) que representa uma medida da flutuação de um grupo de átomos ou

regiões especificas dentro da molécula. Esta flutuação é dada pela seguinte equação:

〈𝑅𝑀𝑆𝐹𝑗〉 = √1 𝑁∑ [𝑟𝑗(𝑡𝑖) − 𝑟0] 2 𝑁 𝑖=1 (2.14)

onde 𝑟𝑗(𝑡𝑖) é a posição do resíduo de interesse no tempo 𝑡𝑖 , 𝑟0 a posição da estrutura de referência e N é o número total de estados considerados dos resíduos de interesse. A mobilidade pode ser calculada considerando os deslocamentos dos carbonos alfa de cada aminoácido e os comparar com uma estrutura média de referência. Desta forma pode-se obter a mobilidade de cada resíduo na proteína que está sendo estudada. Para nosso trabalho RMSF foi usado para estudar a mobilidade dos resíduos ao longo da simulação.

RMSF é um parâmetro que tem uma contrapartida experimental que é chamado fator B de temperatura ou fator de Debye-Waller. O fator B é um parâmetro que descreve o quanto a densidade eletrônica está espalhada numa estrutura cristalográfica. O fator B pode indicar a mobilidade de um átomo e pode ser usado para validar os modelos experimentais em relação aos teóricos como em nosso caso. O fator B para cada resíduo “ 𝑖 “ está relacionado com o RMSF pela equação:

𝑅𝑀𝑆𝐹𝑖2 = 3𝐵𝑖

8𝜋2 (2.15)

O parâmetro B experimental encontra se nos arquivos .pdb das estruturas a estudar e, portanto, ao converter RMSF para fator B, das grandezas que podem ser comparadas e analisadas para observar se os dados teóricos têm uma boa correlação com os dados experimentais.

(42)

2.2 Docking

Quando a estrutura cristalográfica de uma proteína não pode ser resolvida com seu ligante ou só pode ser resolvido parte dele, é necessário fazer o processo de

docking molecular para poder obter as posições preferenciais do ligante dentro da

fenda catalítica e, desta forma obter uma estrutura holo para ser simulada. Nesta dissertação o docking foi feito para obter a estruturas holo adequada para as enzimas AME e CNE.

O docking molecular é uma técnica que busca predizer a estrutura ou estruturas de um complexo molecular composto entre duas ou mais moléculas. O docking é usado amplamente para sugerir modos de ligação de inibidores de proteínas (Figura6). De forma geral os algoritmos de docking geram grande número de possíveis estruturas e, portanto, precisam meios de avaliar cada estrutura e identificar a ou as estruturas de maior interesse(Blaney and Dixon 1993).

Figura 10. Representação esquemática do processo de docking proteína-ligante

Os programas de docking depois de gerar uma série de poses (posições) do ligante rejeitam h grande número delas. Estas rejeições são realizadas com base em uma função de classificação (scoring) que toma as poses e as identifica de acordo com fatores como probabilidade de que esta possa formar uma ligação favorável com a proteína. As funções de scoring estão baseadas nos campos de força da mecânica molecular que estimam a energia da pose dentro do sítio de ligação. As várias contribuições da ligação podem ser escritas como uma equação aditiva:

∆𝐺𝑙𝑖𝑔𝑎𝑑𝑜 = ∆𝐺𝑠𝑜𝑙𝑣𝑒𝑛𝑡𝑒+ ∆𝐺𝑐𝑜𝑛𝑓 + ∆𝐺𝑖𝑛𝑡+ ∆𝐺𝑟𝑜𝑡+ ∆𝐺𝑡

𝑟

(43)

onde o primeiro termo ∆𝐺𝑠𝑜𝑙𝑣𝑒𝑛𝑡𝑒 corresponde a contribuição devido a efeitos de solvatação, ∆𝐺𝑐𝑜𝑛𝑓 toma em consideração as alterações conformacionais da proteína e do ligante, ∆𝐺𝑖𝑛𝑡 é a energia livre para interações proteina-ligante especificas, ∆𝐺𝑟𝑜𝑡 é a perdida de energia livre devido ao esfriamento das rotações internas da proteína e do ligante, As componentes consistem de efeitos de solvatação, mudanças conformacionais na proteína e no ligante, energia livre devido às interações proteína-ligante, ∆𝐺𝑡/𝑟 é o termo associado com a perdida de energia rotacional e translacional causada pela associação de dois corpos, por ultimo ∆𝐺𝑣𝑖𝑏 é a energia livre devido a mudanças nos modos de vibração. Um valor baixo (negativo) de energia indica um sistema mais estável e, portanto, uma ligação mais provável (Ajay and Murcko 1995) 2.3 Detalhes dos sistemas a serem simulados

A metodologia experimental utilizada durante a realização deste trabalho está baseada em trabalhos prévios do grupo de pesquisa (Bleicher et al. 2011; Prates et al. 2013) nos quais tinha se já trabalhado com outras famílias das Glicosil Hidrolases. As duas enzimas mais representativas da nova família GH-X foram denominadas AME e CNE. A enzima AME deriva seu nome do organismo de onde foi obtida, o fungo Amycolatopsis mediterranei, enquanto a enzima CNE obtém seu nome do fungo Cryptococcus neoformans. Para cada uma destas enzimas foram feitas uma serie de simulações para as estruturas apo (sem ligante) e holo (com ligante), ambas as enzimas podem ser observadas na sua forma holo na Figura 11.

Figura 11. Enzimas AME (vermelha) e CNE (azul) com as nomenclaturas usadas para identificar as posições dos anéis do substrato baseadas nos sub-sítios catalíticos da enzima. Neste caso, ambas as enzimas estão na configuração L6

(44)

Para simplificar o entendimento dos sistemas simulados, vamos denominar os 6 anéis de glicose do ligante da mesma forma que a numeração convencional que se adota para os sub-sítios no interior da cavidade catalítica: desde os sub-sítios negativos até os sub-sítios positivos (de esquerda à direita), com o lado redutor a direita. O oligômero de seis anéis de glicose será denominado L6 e corresponde as posições (-4,-3,-2,-1,+1,+2) como se pode ver na Figura 11. Oligômeros de cinco, quatro e três anéis foram também simulados como ligantes na enzima e são denominados L5, L5-5, L4, L3-1 e L3-2, conforme exibidos na Figura 12, onde se pode ver um resumo com as posições e comprimentos dos sistemas simulados, tanto para AME, como para CNE.

Figura 12. Resumo com o comprimento, posições e denominação dos ligantes nas enzimas simuladas. Na coluna a direita se pode observar a denominação dada para cada comprimento de ligante e na parte inferior as posições do ligante dentro da fenda catalítica.

A estrutura experimental das enzimas anteriores foi obtida por difração de raios X pela equipe do Dr. Mário Murakami no CNPEM. A enzima AME conta com uma sequência de 240 aminoácidos e a CNE com 258. Ambas as estruturas foram introduzidas no site do BLAST (Basic Local Alignment Search Tool) (Altschul et al. 1990) para procurar alguma enzima que apresentasse similaridade e similitude com elas mas, por se tratar de uma nova família de Glicosil Hidrolases, não se obteve

(45)

nenhuma estrutura similar. É importante mencionar que estudos enzimáticos feitos nestas enzimas (ainda não publicados) sugerem maior eficiência catalítica na estrutura AME comparada com a CNE (a AME é aproximadamente 10 vezes mais eficiente que a CNE). Os estados de protonação dos aminoácidos de ambas as enzimas foram determinados obtendo os valores de pK partindo de um pH desejado (AME e para CNE) usando o servidor H++ (Bashford and Karplus 1990; Gordon et al. 2005).

As estruturas cristalográficas originalmente foram obtidas complexada com um oligo de laminarina nos subsitios -4,-3 e -2 e portanto, para gerar os complexos L4, L5 e L6, foi necessário a colocação do substrato em posições energeticamente válidas em cada estrutura. A forma de colocar os substratos em as posições dentro da fenda catalitica foi através do docking dos substratos com as estruturas AME e CNE. O docking foi feito para um oligo nas posições -1,+1 e +2 e posteriormente foi adicionado ao substrato cristalográfico original. O docking foi realizado usando o software AutoDockTools (Morris et al. 2009) com o algoritmo VINA (Trott and Olson 2010). Na Figura 13 se pode observar diversas poses resultantes do docking na enzima AME, se faz a escolha que tenha menor energia e sentido químico.

(46)

Figura 13. Algumas poses do substrato geradas pelo software VINA na enzima AME depois do docking

Muitos processos biológicos acontecem em soluções aquosas e, portanto, os efeitos de solvatação são de grande importância para determinar as conformações moleculares, propriedades eletrônicas, energias de ligação, etc. Portanto, depois de fazer a docking molecular das estruturas AME e CNE, se fez uma caixa de água com o propósito de considerar os efeitos de solvatação antes mencionados. Esta caixa de água foi desenhada com o tamanho suficiente para que a proteína possa se movimentar ao longo da simulação dentro das condições de contorno periódicas impostas (J C Phillips et al. 2005). Para as duas proteínas estudadas, foram feitas caixas com 15000 moléculas de água TIP3A (Jorgensen et al. 1983) e 81 Å de aresta, de forma que o centro da mesma ficou com coordenada 40.5 Å. Para ambas as proteínas foram adicionados 50 íons de 𝑁𝑎+ e 50 de 𝐶𝑙 para garantir um sistema neutro. O processo de geração da caixa de água, foi realizado com o programa PACKMOL (Martinez et al. 2009). Na Figura 14 se pode ver uma caixa de água feita para o sistema AME.

Referências

Documentos relacionados

O petróleo existe na Terra há milhões de anos e, sob diferentes formas físicas, tem sido utilizado em diferentes aplicações desde que o homem existe. Pela sua importância, este

Dos docentes respondentes, 62,5% conhe- cem e se sentem atendidos pelo plano de carreira docente e pelo programa de capacitação docente da instituição (que oferece bolsas de

There a case in Brazil, in an appeal judged by the 36ª Câmara Cível do Tribunal de Justiça do Estado de São Paulo (São Paulo’s Civil Tribunal, 36th Chamber), recognized

As análises serão aplicadas em chapas de aços de alta resistência (22MnB5) de 1 mm de espessura e não esperados são a realização de um mapeamento do processo

No primeiro livro, o público infantojuvenil é rapidamente cativado pela história de um jovem brux- inho que teve seus pais terrivelmente executados pelo personagem antagonista,

Os instrutores tiveram oportunidade de interagir com os vídeos, e a apreciação que recolhemos foi sobretudo sobre a percepção da utilidade que estes atribuem aos vídeos, bem como

O relatório encontra-se dividido em 4 secções: a introdução, onde são explicitados os objetivos gerais; o corpo de trabalho, que consiste numa descrição sumária das

Os principais resultados obtidos pelo modelo numérico foram que a implementação da metodologia baseada no risco (Cenário C) resultou numa descida média por disjuntor, de 38% no