• Nenhum resultado encontrado

propriedades eletrost´aticas das prote´ınas

8.2 Enfoque f´ısico

a) Equil´ıbrio Iˆonico: Observa-se uma grande semelhanc¸a em todas as curvas de titulac¸˜ao, apresentadas na Subsec¸˜ao 6.1.2 - Propriedades dos amino´acidos isolados (Single amino

acid properties), onde a valˆencia ideal do amino´acido diminui conforme o aumento do pH. Amino´acidos e prote´ınas apresentam not´aveis propriedades ´acido-base. Os α- amino´acidos quando isolados possuem dois ou, para aqueles com cadeias laterais io- niz´aveis, trˆes grupos ioniz´aveis. As propriedades dos amino´acidos permitem algumas generalizac¸˜oes sobre seu comportamento ´acido-base. Primeiro, todos os amino´acidos com apenas um grupo α-amino, um grupo carboxila e um grupo R que n˜ao se ioniza, possuem curvas de titulac¸˜ao que se assemelham `a da alanina, exibida na Figura 55. Se- gundo, amino´acidos com grupo R ioniz´avel possuem curvas de titulac¸˜ao mais complexas, com trˆes est´agios de ionizac¸˜ao poss´ıveis. As curvas de titulac¸˜ao para os amino´acidos desse tipo s˜ao exibidos pelas Figuras 11 e 57, onde podemos observar o comportamento de amino´acidos que s˜ao ´acidos e b´asicos, respectivamente.

O pH no qual uma mol´ecula n˜ao apresenta carga el´etrica l´ıquida ´e conhecido como seu ponto isoel´etrico, pI. Assim, observamos um comportamento semelhante entre as curvas de titulac¸˜ao dos amino´acidos, onde em pH abaixo do pI, os amino´acidos apresentam valˆencia positiva e acima do pI, negativa.

Quando o pH da soluc¸˜ao possui valores abaixo do pI do amino´acido, ´atomos de hi- drogˆenio presentes na soluc¸˜ao ligam-se com o grupo b´asico do amino´acido (COO−). Com isso, o res´ıduo fica positivamente carregado neste ambiente, conseq¨uentemente aumen- tando sua valˆencia. Por outro lado, quando o pH da soluc¸˜ao possui valores mais elevados do que o pI do amino´acido, ´atomos de hidrogˆenio do grupo ´acido do amino´acido (+H3N) s˜ao dissociados na soluc¸˜ao, tornando o res´ıduo negativamente carregado.

b) Propriedades eletrost´aticas em prote´ınas – preditor b´asico de complexos: As curvas de titulac¸˜ao dos α-amino´acidos isolados, obtidas a partir dos c´alculos, realizados pelas ferramentas desenvolvidas neste projeto, exibem seus respectivos valores de pKa. Entre- tanto em polipept´ıdios e prote´ınas, devido ao grande n´umero de amino´acidos ioniz´aveis presentes em sua estrutura bem como sua configurac¸˜ao espacial, este comportamento ´e raramente apresentado. Como resultado da influˆencia eletrost´atica de grupos carregados na vizinhanc¸a, al´em do efeito de sal e ´ıons m´oveis na soluc¸˜ao, o pKa de cada grupo io- niz´avel ´e deslocado em varias unidades de pH a partir de seu valor no amino´acido isolado. Essas diferenc¸as entre valores de pKa dos amino´acidos ioniz´aveis presentes na prote´ına e quando os mesmos est˜ao isolados s˜ao computadas utilizando-se o programa MEAD.

Por esta n˜ao ser uma an´alise trivial iremos abord´a-la detalhadamente na Subsec¸˜ao 8.2.1 -

Crit´erios para a predic¸˜ao dos pKa’s dos amino´acidos ioniz´aveis.

Com base nos valores de pKa’s, utilizando a ferramenta “Protein-protein interaction”, provida pelo portal PROMETHEUS, ´e poss´ıvel ter uma previs˜ao da formac¸˜ao de um complexo prot´eico (entre duas prote´ınas), a partir de suas propriedades eletrost´aticas (titulac¸˜ao e capacitˆancia), em dois n´ıveis de predic¸˜ao: 1) utilizando apenas a seq¨uˆencia prim´aria de cada prote´ına onde os c´alculos s˜ao realizados analiticamente e os valores de

pKa’s s˜ao obtidos de alguma tabela de referˆencia (Nozaki e Tanford ou Creighton), ou 2) atrav´es da estrutura tridimensional das prote´ınas, empregando soluc¸˜oes num´ericas da EPBL para computar os valores de pKa’s dos amino´acidos ioniz´aveis de acordo com sua localizac¸˜ao na estrutura 3D da prote´ına. A ferramenta realiza os c´alculos de acordo com os parˆametros f´ısico-qu´ımicos definidos pelo usu´ario e ´e capaz de identificar em quais condic¸˜oes (pH, concentrac¸˜ao de sal, etc.) a complexac¸˜ao ser´a mais favor´avel. A predic¸˜ao ´e realizada atrav´es da an´alise de ∆Gele e B2.

O ∆Gele pode ser adotado como um crit´erio conveniente da espontaneidade para proces- sos. Se ∆Gele ´e negativo, o processo ´e espontˆaneo; se positivo, o processo ´e dito n˜ao natural; e se ∆Gele ´e igual a zero, o sistema est´a em equil´ıbrio (201).

Ressaltamos que neste primeiro momento estamos calculando apenas interac¸˜oes de Coulomb do tipo carga-carga com a possibilidade de incluirmos o mecanismo de regulac¸˜ao de cargas. Futuramente esta ferramenta ser´a ampliada permitindo incorporar outras contribuic¸˜oes, como, por exemplo, as interac¸˜oes de van der Walls, que podem ser t˜ao importantes quanto as eletrost´aticas.

O B2 ´e uma propriedade f´ısica que representa a integral do potencial intermolecular sobre a distˆancia de separac¸˜ao entre duas biomol´eculas em quest˜ao. O c´alculo preciso das energias de interac¸˜ao entre mol´eculas de prote´ınas ´e uma tarefa que apresenta alto custo computacional, principalmente porque tais sistemas apresentam uma geometria complexa e uma irregular distribuic¸˜ao de cargas. O segundo coeficiente de virial ´e um indicador ´util das interac¸˜oes totais que ocorrem entre duas mol´eculas e ´e muito utilizado para descrever a agregac¸˜ao entre prote´ınas, compreendendo o efeito predominante das interac¸˜oes entre elas. Se B2 (ou B23) ´e positivo, o sistema ´e repulsivo; e se negativo, ´e atrativo (15, 98, 202). O valor de B2´e dependente de quais interac¸˜oes s˜ao inclu´ıdas em ∆Gele(ver Equac¸˜ao 5.17).

c) An´alise da freq ¨uˆencia de contatos: Para a determinac¸˜ao da freq¨uˆencia de contatos, se- lecionamos aleatoriamente algumas prote´ınas, cujos c´odigos PDB s˜ao exibidos na Tabela 15. O conjunto controle foi selecionado com base na referˆencia (129). Optamos pela

realizac¸˜ao dos c´alculos a partir do centro geom´etrico dos res´ıduos por: 1) minimizar o custo computacional, uma vez que as coordenadas de cada ´atomo constituinte do res´ıduo s˜ao omitidas e apenas as coordenadas do centro geom´etrico deste s˜ao consideradas; 2) a cadeia lateral R de alguns amino´acidos, como a arginina e histidina, ´e longa e o uso do centro geom´etrico para tais res´ıduos proporciona uma melhor descric¸˜ao do seu tamanho. Analisando os diversos gr´aficos normalizados (Figuras 96, 97 e outras), gerados ap´os o c´alculo do PFM, encontramos um padr˜ao satisfat´orio entre o conjunto controle e o conjunto de testes6. Tal observac¸˜ao indica uma constituic¸˜ao consistente do conjunto controle, garantindo a diversidade do mesmo e as perspectivas de uso para extrac¸˜ao das informac¸˜oes ai contidas.

No futuro, a construc¸˜ao dos conjuntos de prote´ınas poder´a ser realizada de forma mais cri- teriosa, por exemplo, os conjuntos poder˜ao ser divididos por fam´ılia de prote´ınas, func¸˜ao biol´ogica, quantidade de res´ıduos, etc. A quantidade de complexos presentes em cada um dos conjuntos ser´a objeto de estudo. Um dos fatores a ser analisado para tal escolha ser´a o pr´oprio crit´erio de an´alise, uma vez que a quantidade de informac¸˜oes presentes no banco de dados, em relac¸˜ao ao c´alculo das distˆancias de separac¸˜ao entre todos os res´ıduos pre- sentes em cadeias distintas do complexo, cresce explosivamente. Para um conjunto inicial de 180 complexos prot´eicos presentes no nosso banco de dados (informac¸˜ao obtida em 22/05/2010), h´a mais de 26 milh˜oes de poss´ıveis interac¸˜oes entre os res´ıduos constituintes de tais complexos.

Nossos resultados futuros ser˜ao confrontados com alguns mapas de contato existentes na literatura como, por exemplo, os encontrados por Miyazawa e Jernigan (111, 112) e resultados de simulac¸˜oes Monte Carlo.

8.2.1

Crit´erios para a predic¸˜ao dos pK

a

’s dos amino´acidos ioniz´aveis

Por depender de muitos parˆametros, n˜ao h´a na literatura um crit´erio definido e fun- damentado do protocolo mais adequado para a predic¸˜ao dos pKa’s em func¸˜ao da posic¸˜ao do amino´acido na estrutura da prote´ına atrav´es da soluc¸˜ao num´erica da EPBL. Diversos m´etodos num´ericos podem ser empregados para a soluc¸˜ao da EPBL, dentre os quais destacamos o m´etodo das diferenc¸as finitas. Este m´etodo est´a implementado em diversos pacotes de pro- gramas cuja func¸˜ao ´e calcular os pKa’s de cada amino´acido, como por exemplo, o MEAD (Macroscopic Electrostatics with Atomic Detail) e o UHBD (University of Houston Brownian

Dynamics). Optamos por utilizar o MEAD v.2.2.7 para o c´alculo dos pKa’s uma vez que este

pacote ´e utilizado por v´arios outros servic¸os web (20, 78), possuir boas concordˆancias com dados experimentais (8, 167) e por ser gratuito (dispon´ıvel em: ftp://ftp.scripps. edu/electrostatics/), embora seja pobre em documentac¸˜ao, referente `a sua utilizac¸˜ao e n˜ao apresentar protocolos bem definidos para a configurac¸˜ao dos arquivos auxiliares utiliza- dos nos diversos c´alculos das propriedades eletrost´aticas de biomol´eculas. Para minimizar este d´eficit de documentac¸˜ao, uma pequena explicac¸˜ao do funcionamento do MEAD, arquivos de configurac¸˜oes necess´arios e parˆametros exigidos para a utilizac¸˜ao dos diversos programas nele contidos, ´e apresentada no Apˆendice C.

8.2.1.1 Validac¸˜ao dos dados iniciais

Visando a familiarizac¸˜ao com o pacote MEAD, iniciamos nossos estudos reproduzindo alguns trabalhos da literatura (20, 121). Pela disponibilidade de informac¸˜oes a respeito dos ar- quivos de configurac¸˜ao utilizados pelos programas contidos no pacote MEAD, primeiro, repro- duzimos os resultados da referˆencia (121), onde seguimos fielmente todos os dados do autor. Os arquivos de configurac¸˜ao para a execuc¸˜ao dos comandos foram obtidos de um dos exemplos que acompanham o pacote MEAD v.2.2.7 (localizado no diret´orio “MEAD/examples/lysozyme”). Ap´os a confirmac¸˜ao dos nossos resultados avaliamos a influˆencia do parˆametro epsave oldway dispon´ıvel para o programa multiflex do pacote MEAD.

Apesar do autor n˜ao deixar claro quais foram todos os procedimentos utilizados para a criac¸˜ao dos arquivos de configurac¸˜ao, a reproduc¸˜ao deste trabalho foi importante, pois atrav´es dela podemos: 1) avaliar o funcionamento dos diversos programas contidos no pacote MEAD; 2) entender como tais programas funcionam e a influˆencia de cada parˆametro utilizado para a execuc¸˜ao dos mesmos; e 3) propor melhorias, em relac¸˜ao a forma como os arquivos devem ser configurados, al´em de demonstrar o correto funcionando do portal PROMETHEUS, quando o usu´ario optar por realizar os c´alculos a partir da estrutura 3D da prote´ına.

A configurac¸˜ao dos arquivos para a utilizac¸˜ao do MEAD ´e um fator crucial para a obtenc¸˜ao correta dos resultados. Para demonstrar a importˆancia da definic¸˜ao dos arquivos de configurac¸˜ao, realizamos uma comparac¸˜ao entre os valores de pKa’s obtidos utilizando os ar- quivos de configurac¸˜ao do exemplo (lysozyme) dispon´ıvel junto com a distribuic¸˜ao do MEAD e os valores de pKa’s obtidos quando utilizamos os arquivos de configurac¸˜ao, para as cargas dos ´atomos (arquivos .st), do trabalho da referˆencia (203). A Tabela 19 exibe a comparac¸˜ao reali- zada entre os valores de pKa’s obtidos do exemplo do MEAD, os providos pelo PROMETHEUS e os obtidos utilizando os arquivos de configurac¸˜ao da referˆencia (203).

Res´ıduo pKout(Bashford)7 pKout(PROMETHEUS)8 pkout(Juffer)9 N Term 6,4 6,4 6,8 His 15 4,0 4,0 4,0 Glu 7 2,1 2,1 2,3 Glu 35 6,3 6,4 4,9 Asp 18 3,1 3,1 2,7 Asp 48 1,0 1,0 2,5 Asp 52 7,0 7,0 7,3 Asp 66 1,7 1,7 1,8 Asp 87 1,2 1,2 2,2 Asp 101 7,9 7,9 8,4 Asp 119 3,2 3,2 3,6 Tyr 20 14,0 14,0 11,3 Tyr 23 11,7 11,7 11,2 Tyr 53 20,8 20,8 23 Lys 1 9,6 9,5 10,1 Lys 13 11,6 11,6 13,2 Lys 33 9,6 9,6 9,6 Lys 96 10,4 10,4 11,6 Lys 97 10,6 10,5 11,1 Lys 116 9,9 9,9 0,0 C Term 2,3 2,3 2,7 RMSD 0,1810 11,0111

Tabela 19: Comparac¸˜ao dos valores de pKa’s da prote´ına lisozima (distribu´ıdo junto com o pacote MEAD) e os

providos pelo PROMETHEUS com o parˆametro epsave oldway.

Analisando os resultados obtidos ´e vis´ıvel a importˆancia da “correta” configurac¸˜ao dos arquivos no formato st (arquivo onde se define os estados de ionizac¸˜ao do amino´acido isolado). Note que, apenas alterando as configurac¸˜oes das cargas dos ´atomos presentes nos arquivos no formato st, houve uma diferenc¸a significativa entre os resultados obtidos pelo trabalho de Juffer e colaboradores e PROMETHEUS, em relac¸˜ao ao de Bashford & Karplus. Verificamos tamb´em a correta reproduc¸˜ao, por nossa aplicac¸˜ao, do trabalho de referˆencia (Bashford), tor- nando evidente o correto funcionamento dos programas utilizados. Neste exemplo executamos os programas multiflex e redti da seguinte forma:

7Valores de pK

a’s obtidos da referˆencia (121).

8Valores obtidos pelo PROMETHEUS, utilizando todos os arquivos de configurac¸˜ao do exemplo “lysozyme”,

distribu´ıdo junto com o pacote MEAD v.2.2.7.

9Arquivos de configurac¸˜ao obtidos da referˆencia (203). 10RMSD entre os valores de pK

a’s obtidos pelo portal PROMETHEUS e pelo exemplo do MEAD (Bashford

(121)), ap´os a execuc¸˜ao do programa redti.

11RMSD entre os valores de pK

a’s obtidos utilizando os arquivos de configurac¸˜ao adotados pela referˆencia

(203) em relac¸˜ao ao resultado obtido utilizando os arquivos de configurac¸˜ao adotados por Bashford & Karplus (121), ap´os a execuc¸˜ao do programa redti.

Res´ıduo pKout(Bashford)12 pKout(PROMETHEUS)13 pkout(Juffer)14 N Term 6,4 6,6 6,7 His 15 4,0 4,4 4,6 Glu 7 2,1 2,0 2,0 Glu 35 6,3 6,0 4,5 Asp 18 3,1 2,7 2,3 Asp 48 1,0 0,6 2,2 Asp 52 7,0 7,0 7,3 Asp 66 1,7 1,1 1,2 Asp 87 1,2 0,8 1,8 Asp 101 7,9 7,8 8,4 Asp 119 3,2 3,2 3,6 Tyr 20 14,0 13,8 11,5 Tyr 23 11,7 11,6 11,3 Tyr 53 20,8 20,6 23,2 Lys 1 9,6 9,6 10,0 Lys 13 11,6 11,7 13,5 Lys 33 9,6 9,8 9,5 Lys 96 10,4 10,5 12,1 Lys 97 10,6 10,7 11,1 Lys 116 9,9 9,9 10,1 C Term 2,3 2,1 2,7 RMSD 1,1215 5,0816

Tabela 20: Comparac¸˜ao dos valores de pKa’s da prote´ına lisozima, distribu´ıdo junto com o pacote MEAD e os

providos pelo PROMETHEUS sem o parˆametro epsave oldway.

multiflex -epsin 4.0 -epsave_oldway -ionicstr 0.1 tric redti tric

onde tric ´e o nome da estrutura da prote´ına utilizada. Informac¸˜oes detalhadas sobre os diversos parˆametros para a execuc¸˜ao dos programas pertencentes ao pacote MEAD, podem ser encon- tradas no Apˆendice C.

Uma vez validado o funcionamento dos programas, iniciamos uma s´erie de testes vi- sando avaliar e efeito de cada parˆametro durante a realizac¸˜ao dos c´alculos, assim como buscar a melhor forma para a configurac¸˜ao de cada arquivo utilizado para o c´alculo dos pKa’s. Inici-

12Valores de pK

a’s obtidos da referˆencia (121).

13Valores de pK

a’s obtidos pelo PROMETHEUS, utilizando todos os arquivos de configurac¸˜ao do exemplo

“lysozyme”, distribu´ıdo junto com o pacote MEAD.

14Arquivos de configurac¸˜ao obtidos da referˆencia (203). 15RMSD entre os valores de pK

a’s obtidos pelo portal PROMETHEUS e pelo exemplo do MEAD, ap´os a

execuc¸˜ao do programa redti.

16RMSD entre os valores de pK

a’s obtidos utilizando os arquivos de configurac¸˜ao adotados pela referˆencia (203)

amos nossos testes investigando o efeito do parˆametro -epsave oldway dispon´ıvel na execuc¸˜ao do programa multiflex. A Tabela 20 exibe a comparac¸˜ao realizada entre os valores de pKa’s obtidos do exemplo disponibilizado junto com o MEAD, os calculados pelo PROMETHEUS e citados na referˆencia (203), em relac¸˜ao a n˜ao utilizac¸˜ao deste parˆametro. Para obtenc¸˜ao dos resultados, executamos os programas da seguinte forma:

multiflex -epsin 4.0 -ionicstr 0.1 tric redti tric

onde tric ´e o nome da estrutura da prote´ına utilizada. Note que a ausˆencia do parˆametro -

epsave oldway produziu resultados diferentes em relac¸˜ao ao resultado obtido anteriormente (Tabela 19). Dessa forma, os trabalhos atuais devem ser realizados sem essa opc¸˜ao.

Veja nos Apˆendices C e D os detalhes de cada parˆamentro que pode ser utilizado nos programas dispon´ıveis no pacote MEAD, os arquivos de configurac¸˜ao necess´arios para execuc¸˜ao de tais programas e os crit´erios adotados para a configurac¸˜ao das cargas parciais e raio de cada ´atomo em func¸˜ao do campo de forc¸a escolhido.

9

CONCLUS ˜AO E TRABALHOS