• Nenhum resultado encontrado

Uma nova abordagem para estudo de mudança conformacional de proteínas utilizando ligação cruzada quantitativa associada à espectrometria de massa

N/A
N/A
Protected

Academic year: 2021

Share "Uma nova abordagem para estudo de mudança conformacional de proteínas utilizando ligação cruzada quantitativa associada à espectrometria de massa"

Copied!
70
0
0

Texto

(1)

UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE QUÍMICA

LUANA OLIVEIRA DOS SANTOS

UMA NOVA ABORDAGEM PARA ESTUDO DE MUDANÇA CONFORMACIONAL DE PROTEÍNAS UTILIZANDO LIGAÇÃO CRUZADA QUANTITATIVA

ASSOCIADA À ESPECTROMETRIA DE MASSAS

CAMPINAS 2019

(2)

UMA NOVA ABORDAGEM PARA ESTUDO DE MUDANÇA CONFORMACIONAL DE PROTEÍNAS UTILIZANDO LIGAÇÃO CRUZADA QUANTITATIVA

ASSOCIADA À ESPECTROMETRIA DE MASSAS

Tese de Doutorado apresentada ao Instituto de Química da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Doutora em Ciências.

Orientador: Prof. Dr. Fabio Cesar Gozzo

O arquivo digital corresponde à versão final da Tese defendida pela aluna Luana Oliveira dos Santos e orientada pelo Prof. Dr. Fabio Cesar Gozzo.

CAMPINAS 2019

(3)
(4)

Prof. Dr. Fabio Cesar Gozzo (Orientador)

Profa. Dra. Juliana Helena Costa Smetana (LNBio-CNPEM/Campinas)

Prof. Dr. Paulo Costa de Carvalho (Fiocruz – PR)

Profa. Dra. Alessandra Sussulini (IQ-Unicamp)

Profa. Dra. Luciana Gonzaga de Oliveira (IQ-Unicamp)

A Ata da defesa assinada pelos membros da Comissão Examinadora, consta no SIGA/Sistema de Fluxo de Dissertação/Tese e na Secretaria do Programa da Unidade.

Este exemplar corresponde à redação final da Tese de Doutorado defendida pela aluna Luana Oliveira dos Santos, aprovada pela Comissão Julgadora em 28 de agosto de 2019.

(5)

Ainda bem que sempre existe outro dia. E outros sonhos. E outros risos. E outras pessoas. E outras coisas. (Clarice Lispector)

(6)

Ao meu orientador, Prof. Dr. Fabio Gozzo, por te me aceitado no grupo, pela disponibilização da infraestrutura do seu laboratório, pelas discussões científicas, ensinamentos e momentos de descontração.

Aos meus avós, Gilva e Filadelfo, por investirem em mim sem medir esforços para que eu tivesse a oportunidade que eles não puderam de estudar. Esforços esses indispensáveis para o desenvolvimento do trabalho e até o presente momento. Obrigada por sempre acreditarem em mim. A minha mãe Simone pelo apoio e suporte, em especial o período que morei em Campinas. As minhas irmãs Carol e Vanessa pela amizade e risadas. A minha tia Cilene pelo suporte e apoio.

A Jandyson pelo companheirismo nesses últimos anos, por me apoiar e incentivar no doutorado e na vida. Pela amizade e principalmente sua generosidade. Aos meus colegas e amigos do grupo Dalton, pelas discussões científicas e pelos vários momentos de descontração. Gostaria de fazer um agradecimento especial a Állan, Hugo e Mariana pelo esforço desmedido em meu exame geral. A Alex, Hector, Renan, André pelo bom convívio. Em particular, aos companheiros de salinha, Állan pela grande amizade que desenvolvemos, por explicar repetidas vezes o mesmo assunto, desabafos, ensinamentos e sua generosidade; Bruno pela amizade, discussões científicas e filosóficas e desabafos; e Eduardo pela amizade que fizemos em pouco tempo de convivência.

A Tati pela amizade, discussões científicas e ajuda imensurável na finalização da tese. Muito obrigada.

Pelos amigos que conquistei em Campinas, Fabio, Ingrid, Adriana e tantos outros. Em especial a Thata pela amizade e hospedagem na minha ida a Campinas.

A Fabiana pelo acompanhamento em Campinas e a Magda pelo acompanhamento e apoio nesses últimos meses que foram tão difíceis.

A técnica Priscila pelo suporte sempre que precisei e a grande amizade que construímos.

Ao Prof. Dr. Carlos Ramos, do IQ da UNICAMP, pela colaboração em fornecer as amostras de Hsp90 e a técnica Annelize responsável por preparar as amostras.

(7)

Ao Prof. Dr. Paolo di Mascio, do Departamento de Bioquímica no Instituto de Química da USP, por ceder o Espectrômetro de Massas para as análises das amostras.

Ao Prof. Dr. Paulo Carvalho e Diogo Lima pelo desenvolvimento do software SIM-Q.

Ao Instituto de Química da UNICAMP, pela infraestrutura, aos funcionários da CPG, pela atenção em tirar todas as dúvidas sobre cada uma das etapas que compuseram este trabalho. Em especial a Janaina, Bel e Isabela pelo apoio e amizade desenvolvida durante esses anos.

E a todos aqueles que fizeram parte dessa jornada e porventura esqueci de citá-los.

O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Brasil (CAPES) – Código de Financiamento 001.

(8)

O entendimento das funções de proteínas a nível molecular requer a descrição de suas mudanças conformacionais intrínsecas em condições fisiológicas. Essa diversidade conformacional desempenha um papel importante na forma como as proteínas se ligam a ligantes, cofatores e substratos. Devido à complexidade química desses sistemas, algumas técnicas estruturais evoluíram para estudar as interações proteína-proteína e proteína-ligante e monitorar as respectivas mudanças conformacionais. A espectrometria de massas em combinação com ligação cruzada tem se mostrado uma técnica atrativa para essa finalidade. Assim, este trabalho aplicou a espectrometria de massas associada à ligação cruzada e dados quantitativos de uma maneira inovadora para estudar mudanças conformacionais de proteínas por meio de um estímulo. Em virtude do amplo conhecimento das mudanças conformacionais da Calmodulina na presença e ausência de íons Ca2+, esse sistema

foi escolhido como modelo para o desenvolvimento do método demonstrado nesta tese. Esta metodologia é baseada na identificação e quantificação de peptídeos modificados com o agente de ligação cruzada seguido de correlação com dados estruturais. Os resultados obtidos com sistema modelo permitiram a validação desta metodologia como uma abordagem direta para obter informações de estrutura e conformação de proteínas em solução em diferentes condições. Esta nova metodologia foi aplicada posteriormente em um sistema mais desafiador (Hsp90/ADP/AMP). Os dados obtidos demonstram uma mudança conformacional da Hsp90 na presença do ligante ADP e estão de acordo com a literatura, e indicam que a proteína na presença da AMP adota uma conformação próxima da estrutura aberta da apoHsp90. Neste trabalho validamos essa nova metodologia como uma abordagem direta para obter informações de estrutura e conformação de proteínas em solução sob diferentes condições.

(9)

Understanding protein function at molecular level requires describing their intrinsic conformational changes under different physiological conditions. This conformational diversity plays an important role in how proteins bind to ligands, cofactors and substrates. Due to the chemical complexity of these systems, several structural techniques have been used to study protein-protein and protein-ligand interactions and monitor their conformational changes. Crosslinking in combination with Mass spectrometry emerged as attractive technique for this purpose. The present work applies cross-linked mass spectrometry and quantitative data in an innovative way to study protein conformational changes by means of a stimulus. Due to the wide knowledge of the conformational changes of Calmodulin in the presence and absence of Ca2+ ions, this system was chosen as a model for the development of the method

demonstrated in this thesis. This methodology is based on the identification and quantification of peptides modified with the crosslinking agent followed by correlation with structural data. The results obtained with the model system allowed the validation of the methodology as a direct approach to obtain protein structure and conformation information in solution under different conditions. This new methodology was later applied to a more challenging system (Hsp90/ADP/AMP). The data obtained demonstrate a conformational change of Hsp90 in the presence of the ADP ligand and are in agreement with the literature, and indicates that the protein in the presence of AMP adopted a conformation close to the open structure of apoHsp90. In this work, we validated this new methodology as a direct approach to obtain protein structure and conformation information in solution under different conditions.

(10)

Figura 1. Estrutura tridimensional da apoCaM (A) (PDB 1DMO) e da Ca CaM (B) (PDB 3CLN)... 20 Figura 2. Estrutura cristalográfica da Hsp90 da E. coli (HtpG) na conformação aberta (esquerda, PDB 2IOQ) e Hsp90 de levedura ligada ao nucleotídeo na conformação fechada (direita, PDB 2CG9). O domínio N-terminal está representado na cor azul, o domínio central em verde e o domínio C-terminal em laranja (LI; SOROKA; BUCHNER, 2012)... 22 Figura 3. Estrutura do ALC do tipo homobifuncional derivado de ésteres de N-hidróxisuccinimida (NHS) utilizados em experimentos de ligação cruzada com análise por MS... 24 Figura 4. Representação esquemática de um experimento típico de ligação cruzada com análise por MS para obtenção de dados estruturais de proteínas na forma de restrições espaciais de distância. 1) Reação da proteína alvo com o ALC desejado; 2) Digestão enzimática da proteína modificada, de forma a gerar peptídeos modificados e não-modificados; 3) Análise da mistura de peptídeos por LC-MS/MS, visando identificar os peptídeos contendo a modificação causada pela ligação cruzada, 4) Mapeamento das restrições de distância obtidas pelo experimento. 5) Uso do conjunto de restrições de distância como guia na modelagem computacional ou na seleção de modelos gerados que representem a estrutura da proteína alvo... 25 Figura 5. Representação dos tipos de espécies formadas em experimentos de ligação cruzada. A) uma representação dessas espécies após a proteólise enzimática da proteína (ou complexo) alvo. B) uma representação dessas espécies ligadas na superfície da proteína antes da proteólise enzimática... 26 Figura 6. Screenshots do analisador de quantificação do software SIM-Q. Em a) escolher os SIM-XLs das condições estudadas, b) aplicar o filtro desejável e criar um arquivo PLP para rodar no PatternLab e c) Adicionar o SIM-XL das condições estudadas e o arquivo do PatternLab e gerar os dados para visualização no Pymol...35 Figura 7. Sequência de resíduos de aminoácidos das proteínas CaM (A) e Hsp90 (B) destacando os resíduos de aminoácidos (lisina colorida em vermelho e serina em verde) reativos preferencialmente frente ao DSS...38 Figura 8. Esquema representando o mecanismo de formação de uma espécie

(11)

Figura 9. Mapa de cobertura para a Calmodulina... 40 Figura 10. Mapa bidimensional das ligações cruzadas identificadas para a apoCaM (20 espécies) e Ca2+CaM (13 espécies)... 42

Figura 11. Representação das espécies de ligação cruzada entre os resíduos K76 e K116 (A e B) e entre os resíduos K81 e K95 (C e D) e suas respectivas distâncias topológicas. Estruturas da A) e C) apoCaM (PDB 1DMO) e B) e D) Ca2+CaM

(PDB 3CLN)...44 Figura 12. Ligações cruzadas quantificadas e suas respectivas distâncias topológicas em A) apoCaM (PDB 1DMO) e B) Ca2+CaM (PDB 3CLN)... 45

Figura 13. Exemplos de espectros de íons produtos anotados para as espécies de ligação cruzada do tipo intermolecular (K76-K95) nas condições apoCaM (A) e Ca2+CaM (B) e seus respectivos XIC (do inglês, Extracted Ion Chromatogram). Em

azul: os íons fragmentos referentes a cadeia alfa da espécie de ligação cruzada. Em vermelho: os íons fragmentos referentes a cadeia beta da espécie de ligação cruzada. Em verde: os íons marcadores da espécie de ligação cruzada... 46 Figura 14. Modelos das estruturas da Hsp90 e Hsp90:ADP humana obtidos por meio de modelagem usando como molde as estruturas do PDB 2IOQ e 2IOP, respectivamente. O domínio N-terminal (resíduos 1-236) está representado em amarelo, o domínio central (resíduos 237-561) em laranja e o domínio C-terminal em azul (resíduos 562-732)...48 Figura 15. Mapa de cobertura para a Hsp90 obtido a partir do PatternLab. 49 Figura 16. Sequência de aminoácidos da Hsp90. Destacados em azul os resíduos identificados por modificações do tipo dead-end após a reação de ligação cruzada utilizando o DSS... 50 Figura 17. Mapa das ligações cruzadas identificadas para a Hsp90, Hsp90:AMP e Hsp90:ADP...51 Figura 18. Diagrama de Venn das espécies modificadas pelo agente de ligação cruzada para apoHsp90, Hsp90:ADP e Hsp90:AMP... 53 Figura 19. Representação estrutural do alinhamento, realizado pelo Pymol, de cada domínio da Hsp90. Em amarelo o domínio correspondente a estrutura da apoHsp90 e em azul da Hsp90:ADP... 55 Figura 20. Espécie de ligação cruzada entre os resíduos S641 e K567 e suas

(12)

respectivas distâncias topológicas na estrutura apoHsp90 e Hsp90:ADP... 58 Figura 22. Exemplos de espectros de íons produtos anotados para as espécies de ligação cruzada do tipo intrapeptídeo (K358-K362) nas condições apoHsp90 e Hsp90:ADP (A) e seus respectivos XIC (do inglês, Extracted Ion Chromatogram) (B). Em azul: os íons fragmentos referentes a cadeia alfa da espécie de ligação cruzada. Em vermelho: os íons fragmentos referentes a cadeia beta da espécie de ligação cruzada. Em verde: os íons marcadores da espécie de ligação cruzada... 63

(13)

Tabela 1. Espécies de ligação cruzada identificadas e quantificadas e as respectivas distâncias topológicas entre os resíduos modificados e a razão entre área dos íons produtos da apoCaM/Ca2+CaM. ... 47

Tabela 2. Espécies modificadas pelo agente de ligação cruzada DSS formadas exclusivamente na condição ApoHsp90 e suas distâncias topológicas na estrutura da apoHsp90 e Hsp90:ADP. ... 56 Tabela 3. Espécies modificadas pelo agente de ligação cruzada DSS formadas exclusivamente na condição Hsp90:ADP e suas distâncias topológicas na estrutura da apoHsp90 e Hsp90:ADP. ... 57 Tabela 4. Espécies modificadas pelo agente de ligação cruzada DSS formadas exclusivamente na condição Hsp90:AMP e suas distâncias topológicas na estrutura da apoHsp90. ... 57 Tabela 5. Espécies modificadas presentes nas amostras apoHsp90, Hsp90:ADP e Hsp90:AMP e suas respectivas distâncias topológicas, exceto para a Hsp90:AMP. ... 59 Tabela 6. Espécies modificadas encontradas unicamente nas amostras ApoHsp90-Hsp90:ADP. ... 60 Tabela 7. Espécies modificadas encontradas unicamente nas amostras Hsp90:ADP-Hsp90:AMP. ... 60 Tabela 8. Espécies modificadas encontradas unicamente nas amostras ApoHsp90-Hsp90:AMP. ... 61 Tabela 9. Espécies modificadas quantificadas e suas respectivas razões de XIC ... 64

(14)

ADP Adenosina difosfato

AGC Controle de ganho automático ALC Agente de ligação cruzada AMP Adenosina monofosfato ATP Adenosina trifosfato CaM Calmodulina

Ca2+CaM Calmodulina complexada aos íons cálcio cDNA DNA complementar

CID Dissociação induzida por colisão Da Dalton (1 Da = 1,661.10-24 g)

DDA Aquisição dependente de dados DMF N,N-dimetilformamida

DNA Ácido desoxirribonucleico DRX Difração de Raio–X

DSS Suberato de N,N-disuccinimidila DTT 1,4-Ditiotreitol

EGTA Ácido etileno glicol tetra-acético ESI Ionização por eletrospray

ETD Dissociação por transferência de elétrons

FTICR Ressonância ciclotrônica de íons com transformada de Fourier HCD High energy collision dissociation

Hsp90 Proteína de choque térmico 90 kDa IAA Iodoacetamida

iTRAQ Isobaric tags for relative and absolute quantitation

LC-MS Cromatografia líquida acoplada à espectrometria de massas LC-MS/MS Cromatografia líquida acoplada à espectrometria de massas

sequencial

MOPS Ácido 3 (N-morfolino) Propanosulfônico MS Espectrometria de massas

MS/MS Espectrometria de massas sequencial

m/z Razão massa carga

(15)

RMN Ressonância Magnética Nuclear RNA Ácido ribonucleico

SILAC Stable Isotope Labeling by Amino acids in cell Culture SIM-XL Spectrum Identification Machine for Cross-Linked peptides TOF Analisador de massas do tipo tempo de vôo

Tris.HCl Cloridrato de tris(hidroximetil)aminometano UHPLC Cromatografia líquida de ultra-alta eficiência XL Ligação cruzada

(16)

1. INTRODUÇÃO GERAL... 17

1.1 PROTEÍNAS: ESTRUTURAS, FUNÇÃO E INTERAÇÃO ... 17

1.2 CALMODULINA ... 18

1.3 Hsp90 (HEAT SHOCK PROTEIN 90 kDa) ... 20

1.4 LIGAÇÃO CRUZADA ASSOCIADA À ESPECTROMETRIA DE MASSAS PARA O ESTUDO ESTRUTURAL DE PROTEÍNAS ... 22

1.5 MÉTODOS DE PROTEÔMICA QUANTITATIVA... 27

2. OBJETIVOS ... 30

3. PROCEDIMENTO EXPERIMENTAL ... 31

3.1 FORMAÇÃO DOS COMPLEXOS... 31

3.2 REAÇÃO DE LIGAÇÃO CRUZADA ... 32

3.3 ANÁLISE POR ESPECTROMETRIA DE MASSAS ... 32

3.4 IDENTIFICAÇÃO E QUANTIFICAÇÃO DOS PEPTÍDEOS CONTENDO LIGAÇÃO CRUZADA ... 33

3.5 CÁLCULO DE DISTÂNCIA TOPOLÓGICA ... 35

3.6 MODELAGEM DA apoHsp90 e Hsp90:ADP ... 36

4. RESULTADOS E DISCUSSÃO ... 37

4.1 REAÇÃO DE LIGAÇÃO CRUZADA ... 37

4.2 LIGAÇÃO CRUZADA QUANTITATIVA DA CALMODULINA ... 39

4.3 Hsp90 ... 48

4.4 SIM-Q ... 52

5. CONCLUSÕES ... 65

(17)

1. INTRODUÇÃO GERAL

1.1 PROTEÍNAS: ESTRUTURAS, FUNÇÃO E INTERAÇÃO

As proteínas são macromoléculas biológicas compostas de aminoácidos ligados através de ligações peptídicas, podendo ter diferentes estruturas tridimensionais. Na maioria das proteínas, o enovelamento de suas cadeias polipeptídicas está diretamente ligado à sua função biológica, portanto, a perda ou mudança em sua estrutura pode provocar a perda de sua função biológica (NELSON; COX, 2004). A interação entre proteínas é um importante aspecto das suas funções biológicas, consequentemente, a determinação dessas interações e a identificação das proteínas que interagem com proteínas alvos é importante para a resolução de sua função, já que a complexidade de um organismo é determinada pelo tamanho de seu interactoma (quantidade de interação entre proteínas) e não a quantidade de proteínas presentes no sistema (DA SILVA; RAMOS, 2012; FIORAMONTE et al., 2012).

Pesquisas em sequenciamento de proteínas têm sido fundamentais, tanto para avaliar no estabelecimento da identidade e estrutura de uma proteína, quanto para estudos de sequência do gene, devido à inter-relação entre uma sequência de aminoácidos e a correspondente sequência de DNA (KINTER; SHERMAN, 2000). Entretanto, descobrir a identidade da proteína não é suficiente para descrever processos biológicos, assim, o conhecimento da sua estrutura, conformação e rede de interação é fundamental para inferir seu funcionamento. A maioria das tarefas realizadas pelas proteínas em processos celulares, tais como catálise, transporte, transcrição, síntese e degradação de moléculas, defesa do organismo, dentre outros, não é uma ação individual, mas é realizada por meio de interações proteína-ligante e proteína-proteína (LARANCE; LAMOND, 2015). Disfunções dessas interações são também responsáveis pelo desenvolvimento de patologias.

Atualmente, as técnicas de difração de raios-X (DRX) e ressonância magnética nuclear (RMN) são as técnicas padrões para a resolução de estruturas, no entanto, nem todas as proteínas são passíveis de terem suas estruturas resolvidas por essas técnicas devido a limitações experimentais (SINZ, 2003a). Estas restrições são ainda mais severas quando se pretende estudar a dinâmica conformacional dessas proteínas e, por isso, apenas um conjunto relativamente pequeno de proteínas

(18)

tem suas mudanças conformacionais bem caracterizadas. Mudanças na conformação das proteínas afetam as interações destas com outras moléculas e, por consequência, a função que desempenham no organismo.

1.2 CALMODULINA

O cálcio (Ca2+) é um elemento crucial em vários processos biológicos

(BERRIDGE; LIPP; BOOTMAN, 2000). Em muitos organismos, o fosfato atua como agente tamponante dos níveis de Ca2+ dentro dos fluidos extracelular e também boa

parte se encontra complexado para formar exo ou endoesqueleto que serve como suporte estrutural. A concentração de íons cálcio no citosol é usualmente muito baixa (0,1 µM) e o aumento de cálcio pode se dar de duas maneiras: por meio dos canais de cálcio que existem na membrana plasmática e que podem ser abertos por diferentes estímulos (despolarização da membrana, ligação com receptores pequenos, mensageiros intracelulares), uma vez que a concentração de cálcio extracelular é alta; ou pelo retículo endoplasmático que funciona como reserva de cálcio e pode liberar cálcio após estímulos, como, por exemplo, ADP-ribose cíclica (CRIVICI A, 1995; SHEPHERD; VOGEL, 2004; WRIGGERS et al., 1998).

Os sinais de cálcio regulam diferentes funções celulares tais como proliferação celular, secreção e contração muscular (KAHL; MEANS, 2003). A informação codificada dos sinais de Ca2+ transiente é decifrada por diferentes

proteínas que se ligam ao cálcio e convertem esses sinais em alterações bioquímicas (CHIN; MEANS, 2000). Algumas dessas proteínas se ligam diretamente ao metal e assim são reguladas de maneira dependentes de cálcio, por exemplo as proteínas Quinase C. Por outro lado, existem proteínas que atuam de forma intermediária e se ligam ao metal para gerar diferentes mudanças bioquímicas e celulares. Este grupo de proteínas responde aos sinais de cálcio de duas maneiras: sem ou com mudanças conformacionais significativas após a interação. O grupo sem mudanças conformacionais significativas funciona como tampão ou proteínas transportadoras de Ca2+, por exemplo a calbindina. O grupo com mudanças conformacionais significativas

induzidas pelo metal é denominado de sensores de Ca2+ que são capazes de detectar

e responder a uma variedade de processos biológicos e, neste caso, a maioria são proteínas (CHIN; MEANS, 2000). Os principais sensores de cálcio incluem a troponina C (participa do processo de contração muscular), a família de proteínas S100 e a

(19)

calmodulina (multifuncional transdutora de Ca2+) (BERRIDGE; BOOTMAN;

RODERICK, 2003).

A calmodulina (CaM) é expressa em todas células eucarióticas e está envolvida na regulação na maioria das vias de sinalização dependente de Ca2+ na

célula (SAIMI; KUNG, 2002; WRIGGERS et al., 1998). É uma proteína relativamente pequena (148 resíduos) e evolutivamente conservada (SAIMI; KUNG, 2002). Estruturalmente é formada por dois domínios N- e C- terminal separados por uma α-hélice central. Esses domínios têm afinidade discriminatória para Ca2+, sendo que o

domínio C-terminal tem de 3 a 5 vezes mais afinidade por Ca2+ do que o N-terminal.

A estrutura cristalográfica da CaM mostra que a ligação ao Ca2+ induz uma mudança

conformacional em sua estrutura, isso é, ela adota uma estrutura de haltere em que os domínios N- e C- terminal são separados por uma α-hélice de oito voltas (Figura 1). Estes dois domínios estão em orientação trans com a hélice central totalmente estendida (Figura 1B). Essa mudança conformacional expõe resíduos hidrofóbicos que promovem a interação do complexo Ca2+CaM com diversas proteínas

(SHEPHERD; VOGEL, 2004; WRIGGERS et al., 1998).

A calmodulina adota ainda outras conformações derivadas de suas interações com outras proteínas-alvo, essa flexibilidade estrutural explica o fato da CaM interagir com proteínas com características estruturais distintas (ZHANG et al., 2012).

A mudança conformacional da Calmodulina na presença e na ausência de Ca2+ já foi muito bem caracterizada pelas técnicas de DRX e RMN, tornando-a um

excelente alvo para desenvolvimento de novas metodologias de análise conformacional (SHEPHERD; VOGEL, 2004).

(20)

Figura 1. Estrutura tridimensional da apoCaM (A) (PDB 1DMO) e da Ca2+CaM (B) (PDB

3CLN).

1.3 Hsp90 (HEAT SHOCK PROTEIN 90 kDa)

As proteínas geralmente requerem enovelamento para atingir seu estado funcional e o oposto, desenovelamento ou mau enovelamento, pode resultar em perda de sua função. As chaperonas moleculares têm um importante papel no processo de enovelamento e também no reenovelamento de proteínas mal enoveladas (ADÃO et al., 2019).

A família das chaperonas Hsp60 e Hsp70 interage com cadeias polipeptídicas nascentes e promove o enovelamento da proteína (SHIAU et al., 2006). Em contraste, as proteínas Hsp90 têm como função associar-se com proteínas clientes no último estágio do enovelamento, estabilizando suas estruturas próximas ao seu estado nativo e auxiliando na montagem e desmontagem de complexos de sinalização. Essa associação da Hsp90 com proteínas clientes facilita as mesmas interagirem com ligantes ou proteínas alvo (YOUNG; MOAREFI; ULRICH HARTL, 2001).

A Hsp90, junto com a Hsp70 e outras co-chaperonas, compõem o maquinário da Hsp90 que estabiliza e ativa mais de 200 proteínas de células de mamíferos. As proteínas clientes da Hsp90 apresentam papéis essenciais na sinalização celular e resposta ao processo adaptativo ao estresse (LI; SOROKA; BUCHNER, 2012; MAKHNEVYCH; HOURY, 2012). Em virtude das diversas funções

(21)

das proteínas clientes, a Hsp90 está envolvida em diferentes vias metabólicas e, com isso, torna-se um alvo interessante para tratamento de doenças, tais como o câncer (MINARI et al., 2019).

A Hsp90 pertence a uma família altamente conservada de proteínas encontradas em bactérias e todas células eucariotas (PEARL; PRODROMOU, 2006). Em humanos, existem quatro isoformas da Hsp90: duas presentes no citoplasma (Hsp90 e Hsp90), uma versão mitocondrial (TRAP1) e uma forma no retículo endoplasmático (Grp94) (KRUKENBERG et al., 2011; MINARI et al., 2019). Em todas as versões, a Hsp90 existe como um dímero e cada monômero é formado por três domínios. O domínio N-terminal, que contém o sítio de ligação de nucleotídeos, é responsável pela atividade ATPase da Hsp90; esse domínio está conectado ao domínio central por um linker carregado que influencia na atividade ATPase e dinâmica da proteína (MINARI et al., 2019); o domínio central está envolvido na ligação de co-chaperonas e proteínas clientes; e o domínio C-terminal é o sítio de dimerização. Estruturas cristalográficas da Hsp90 de diferentes organismos demonstram uma grande mudança conformacional da Hsp90 ao se ligar a nucleotídeos, a ligação ao ATP pelo domínio N-terminal e subsequente hidrólise pela Hsp90 gera um ciclo conformacional que é essencial para atividade da chaperona (MAKHNEVYCH; HOURY, 2012). Dois estados conformacionais do dímero Hsp90 têm sido observados, um estado (holo Hsp90) em que a ligação com ATP resulta na associação dos domínios N-terminal do dímero causando a formação de uma estrutura fechada e um estado (apo Hsp90) em que o dímero tem uma estrutura em forma de V (KRUKENBERG et al., 2011; YOUNG et al., 2004; YOUNG; MOAREFI; ULRICH HARTL, 2001) (Figura 2).

A Hsp90 demonstra ser uma molécula altamente flexível e dinâmica, e grandes mudanças conformacionais foram observadas na presença de nucleotídeos (KRUKENBERG et al., 2011; SHIAU et al., 2006). Embora esteja claro que a dinâmica conformacional da Hsp90 desempenha um papel importante no reconhecimento e ativação de proteínas clientes, a completa identificação de seus clientes e como ligam-se a Hsp90 ainda é um desafio (DA SILVA; RAMOS, 2012).

A Hsp90 é uma chaperona bem caracterizada pelos seus domínios separados, porém sua estrutura completa é mais complexa e por isso pouco caracterizada. Estudos estruturais e bioquímicos têm demonstrado que o ciclo

(22)

conformacional da Hsp90 é complexo e em solução estes diferentes estados coexistem em um equilíbrio e a ligação de nucleotídeos desloca o equilíbrio para uma determinada conformação (KRUKENBERG et al., 2011). Devido à flexibilidade e a diferentes estados conformacionais, a Hsp90 torna-se um alvo interessante para aplicação da técnica de ligação cruzada associada à espectrometria de massas (XL-MS).

Figura 2. Estrutura cristalográfica da Hsp90 da E. coli (HtpG) na conformação aberta

(esquerda, PDB 2IOQ) e Hsp90 de levedura ligada ao nucleotídeo na conformação fechada (direita, PDB 2CG9). O domínio N-terminal está representado na cor azul, o domínio central em verde e o domínio C-terminal em laranja (LI; SOROKA; BUCHNER, 2012).

1.4 LIGAÇÃO CRUZADA ASSOCIADA À ESPECTROMETRIA DE MASSAS PARA O ESTUDO ESTRUTURAL DE PROTEÍNAS

A reação de ligação cruzada (cross-linking) é dada pela união de duas espécies por meio de uma ligação covalente utilizando um agente de ligação cruzada (ALC). Nesse fenômeno, espécies de natureza diferentes podem estar envolvidas nos experimentos podendo ser proteínas, peptídeos, moléculas orgânicas, ácidos nucleicos, partículas sólidas ou ainda diferentes regiões da mesma espécie como, por exemplo, ligação entre resíduos de uma mesma proteína (WONG S. S.; JAMESON D.

(23)

M., 1991). Um exemplo do fenômeno de ligação cruzada são as ligações de dissulfeto presentes em proteínas que ocorrem naturalmente. Os primeiros relatos do emprego da ligação cruzada mostram que a técnica era usada para a estabilização de proteínas, imobilização de macromoléculas em suportes sólidos, acoplamento de duas ou mais moléculas de proteína e extensão de interações proteína-proteína (HOLDING, 2015). Entretanto, somente nos anos 2000 que se iniciaram os primeiros trabalhos associados ao uso da espectrometria de massas para a obtenção de informações estruturais acerca das proteínas, proporcionando um avanço na interpretação de dados e no desenvolvimento de novas metodologias, sendo a técnica denominada então, de ligação cruzada associada à espectrometria de massas (XL-MS) (HOLDING, 2015; WONG S. S.; JAMESON D. M., 1991; YOUNG et al., 2000).

Os ALCs são compostos orgânicos multifuncionais, contendo em geral dois ou três grupos reativos, unidos por uma cadeia espaçadora de comprimento variável (SINZ, 2003b, 2006). O processo de ligação cruzada ocorre quando os ALCs em contato com proteínas em solução se ligam covalentemente às cadeias laterais dos resíduos de aminoácidos, de acordo com suas especificidades, unindo cadeias laterais que estejam espacialmente separadas, no máximo, pelo comprimento da cadeia espaçadora15. Dependendo se os grupos reativos dos ALCs bifuncionais são

idênticos ou distintos, eles podem ser classificados como homobifuncionais e heterobifuncionais, respectivamente, o que permite maior versatilidade na especificidade de cada reagente (SINZ, 2006; WONG S. S.; JAMESON D. M., 1991) Dentre os ALCs disponíveis atualmente, derivados de ésteres de N-hidroxisuccinimida (NHS) são os mais utilizados, devido aos rendimentos relativamente altos das reações e, principalmente, à facilidade de sua obtenção, bastando para isso reagir um haleto de acila com um NHS (FERNANDO et al., 2011). Estes reagentes são reativos preferencialmente frente a aminas primárias, podendo sofrer reação também com grupos álcoois e tióis (Figura 3).

Uma vez que a ligação cruzada tenha ocorrido e o ALC tenha se ligado à cadeia lateral dos resíduos reativos, cria-se uma modificação de massa nessa proteína ou peptídeo e é na identificação dessas espécies que a análise por MS é empregada para a obtenção de informações estruturais de proteínas. Tais informações são provenientes do tamanho da cadeia espaçadora do ALC utilizada, que limita os dois resíduos de aminoácidos envolvidos a uma determinada distância.

(24)

Assim, são obtidas restrições de distância entre esses resíduos indicando que, na estrutura nativa, eles se encontram separados por no máximo o comprimento da cadeia espaçadora do ALC utilizado. Com isso, é possível saber quais pares de resíduos de aminoácidos da proteína alvo sofreram ligação cruzada e, consequentemente, estavam espacialmente próximos na estrutura nativa (SINZ, 2006).

Figura 3. Estrutura do ALC do tipo homobifuncional derivado de ésteres de N-hidróxisuccinimida (NHS) utilizados em experimentos de ligação cruzada com análise por MS.

A ligação cruzada associada à MS é realizada submetendo a proteína ou o complexo proteico modificado pelos ALCs a proteólise enzimática seguido da identificação dos peptídeos modificados por técnicas de LC-MS e LC-MS/MS (SINZ, 2006). Nas análises, a mistura de peptídeos passa por uma separação cromatográfica seguida de análise por MS de forma contínua, e os íons de peptídeos são automaticamente submetidos a experimentos de MS/MS durante a corrida cromatográfica. Esse processo permite identificá-los, bem como localizar as modificações causadas pelo ALC, como mostra o esquema da Figura 4. Essa abordagem é semelhante aos métodos de proteômica shotgun empregados em análises de misturas complexas de proteínas. Essa metodologia foi aplicada pela primeira vez por Young et al. (2000) para provar uma estrutura tridimensional da albumina, determinando que se o número de restrições de distância fosse maior que N/10 (onde N é o número de resíduos da proteína), seria possível determinar o tipo de enovelamento por meio de métodos computacionais.

(25)

Após a reação das proteínas com ALC e digestão enzimática, os produtos derivados da proteólise enzimática podem ser classificados em três tipos (Figura 5): as espécies intramoleculares, intermoleculares e parcialmente hidrolisadas ou dead-end (HOLDING, 2015; SCHILLING et al., 2003; SINZ, 2003a). As espécies intermoleculares são aquelas em que a cadeia espaçadora conecta dois peptídeos que estariam separados devido à proteólise enzimática e fornecem informações a respeito de resíduos próximos na estrutura terciária, ainda que estejam distantes na sequência primária, ou quaternária. As espécies intramoleculares, são as que a cadeia espaçadora conecta dois resíduos de aminoácidos de um mesmo peptídeo gerado na proteólise enzimática e informam que resíduos próximos na sequência primária também se encontram dentro da restrição da cadeia espaçadora na estrutura terciária devido ao enovelamento característico da proteína alvo. As espécies parcialmente hidrolisadas ou dead-end, são formadas pelas porções do ALC que reagiu com uma cadeia lateral da proteína e a outra porção sofreu hidrólise, trazendo assim, informações a respeito da acessibilidade ao solvente desse resíduo (FIORAMONTE et al., 2012).

Figura 4. Representação esquemática de um experimento típico de ligação cruzada com

análise por MS para obtenção de dados estruturais de proteínas na forma de restrições espaciais de distância. 1) Reação da proteína alvo com o ALC desejado; 2) Digestão enzimática da proteína modificada, de forma a gerar peptídeos modificados e não-modificados; 3) Análise da mistura de peptídeos por LC-MS/MS, visando identificar os peptídeos contendo a modificação causada pela ligação cruzada; 4) Mapeamento das restrições de distância obtidas pelo experimento e 5) Uso do conjunto de restrições de distância como guia na modelagem computacional ou na seleção de modelos gerados que representem a estrutura da proteína alvo.

(26)

No começo, apesar de muito promissora na análise de complexos de proteínas e estruturas de proteínas, a metodologia de ligação cruzada associada à MS era bastante limitada por diversos motivos, tais como: a qualidade e velocidade de aquisição de dados nos espectrômetros de massas, disponibilidade de ALC, otimização das condições reacionais e softwares para identificação das espécies de ligação cruzada. Porém, nos últimos anos a técnica evoluiu em todos estes aspectos, sendo impulsionada pelo avanço científico na parte instrumental e de softwares. No que diz respeito à instrumentação, os dados para experimentos de ligação cruzada devem ser adquiridos com alta resolução/exatidão por técnicas de MS, para que se tenha alta confiabilidade na identificação das espécies. Assim, deseja-se equipamentos com alta velocidade de aquisição de espectros, pois se trata de amostras complexas. Para isso, existem atualmente espectrômetros de massas do tipo QTOF e QOrbitrap que adquirem até 100 espectros de íons produtos por segundo com alta resolução e sensibilidade.

Figura 5. Representação dos tipos de espécies formadas em experimentos de ligação

cruzada. A) uma representação dessas espécies após a proteólise enzimática da proteína (ou complexo) alvo. B) uma representação dessas espécies ligadas na superfície da proteína antes da proteólise enzimática.

(27)

Em relação aos softwares, no passado as buscas de espécies de ligação cruzada eram tradicionalmente feitas manualmente, o que levava à identificação de um número bastante restrito dado o enorme número de espectros gerados nesses experimentos. Atualmente, existe um conjunto razoável de softwares de busca com alta sensibilidade e interface amigável, tais como a nova versão do p-link (BELSARE et al., 2014), o MS-Studio (SARPE et al., 2016), a nova versão do StavroX (GÖTZE et al., 2012), dentre outros. Em 2015, o nosso grupo de pesquisa, juntamente com o grupo do Dr. Paulo Costa Carvalho (FIOCRUZ – PR), desenvolveu a primeira ferramenta de busca com interface de visualização gráfica dos espectros de massas, o SIM-XL (LIMA et al., 2015), tornando a validação dos dados mais simples e rápida. Entretanto, todos esses softwares ainda apesentam limitações e necessitam ser aprimorados, por isso, a área se encontra em constante desenvolvimento e expansão, visando melhorar a sensibilidade, diminuir a taxa de falsos-positivos, implementar novos ALCs e acompanhar os novos desenvolvimentos da área.

1.5 MÉTODOS DE PROTEÔMICA QUANTITATIVA

Uma vez que proteínas são as bases de construção da célula e, com isso, a base dos processos celulares, o entendimento dos processos de sinalização, ativação de gene, transcrição, tradução, mudanças pós-traducionais, transporte intracelular e processamento de metabólitos envolvem mudanças ao nível de gene e ao nível de proteína, causando as alterações celulares. Por isso, é importante entender a dinâmica relacionada a estímulos de expressão e associá-los com o mecanismo de resposta (LARANCE; LAMOND, 2015).

Uma das formas mais eficazes de acompanhar essas mudanças na dinâmica de expressão de proteínas é o uso de técnicas de proteômica quantitativa. O primeiro passo na proteômica consiste na identificação das proteínas presentes em um determinado tecido ou célula. Uma vez determinado o conjunto de proteínas em um sistema, pode-se utilizar técnicas quantitativas para acompanhar a evolução das abundâncias dessas proteínas em função do tempo ou de estímulos celulares (SCHMIDT; ROBINSON, 2014).

Na proteômica quantitativa tradicional, os métodos de quantificação são bem estabelecidos e se dividem em duas grandes categorias: os com marcação

(28)

isotópica e os livres de marcação. Dentre os métodos de marcação isotópica, existem por exemplo marcações in vivo como o SILAC (Stable Isotope Labeling by an Amino acids in cell Culture) (ONG et al., 2002) ou marcação química (iTRAQ) (ROSS et al., 2004). Por outro lado, entre os métodos livre de marcação (Label-free) destaca-se a quantificação por intensidade iônica. Isso é feito extraindo-se a corrente iônica associada a um determinado m/z e, dessa forma, referente a uma espécie de interesse. Assume-se que o valor da área calculada a partir desse cromatograma de corrente iônica extraída é proporcional a quantidade da espécie em solução. A razão entre os valores das áreas em diferentes condições experimentais pode ser utilizado para fazer quantificações relativas das espécies de interesse (BANTSCHEFF et al., 2007).

A ligação cruzada quantitativa associada à espectrometria de massas foi demonstrada recentemente como uma técnica alternativa para o estudo de mudança conformacional (KAHSAI et al., 2014; SCHMIDT; ROBINSON, 2014; ZHENG et al., 2016). O complexo cATPase foi estudado em resposta a um estímulo da presença de uma fosfatase. Neste trabalho (SCHMIDT; ROBINSON, 2014), foi desenvolvida uma estratégia quantitativa utilizando o agente de ligação cruzada BS3 em duas versões,

deuterada e não deuterada, e esta marcação isotópica foi aplicada para quantificar as ligações cruzadas identificadas para a cATPase na presença e ausência de uma fosfatase. As mudanças quantitativas observadas permitiram esclarecer a mudança conformacional da cATPase e estabelecer um mecanismo de controle de atividade. Essa abordagem, no entanto, tem várias limitações tal como o alto custo das análises. Além disso, o uso de ALC marcados limitam a comparação entre duas condições apenas, impedindo seu uso para comparações múltiplas.

Uma possível forma de expandir a aplicação de ligação cruzada quantitativa é realizar a quantificação livre de marcação, onde a intensidade do peptídeo com ligação cruzada ou um grupo desses peptídeos podem ser comparados através de diferentes análises. A quantificação do tipo label-free tem como vantagem ser econômica e poder comparar um número ilimitado de condições. Esse tipo de abordagem ainda é inexplorado devido, entre outros fatores, a todas variações sistemáticas e não-sistemáticas entre os experimentos que têm que ser controlados durante a análise (RAPPSILBER, 2011; SCHMIDT; ROBINSON, 2014). Assim, nesse trabalho é descrito o desenvolvimento da aplicação de ligação cruzada quantitativa

(29)

sem marcação isotópica e sua aplicação para um caso teste, apoCaM/Ca2+CaMe uma

aplicação em uma proteína de interesse, a Hsp90 na ausência e presença de dois ligantes: ADP e AMP.

(30)

2. OBJETIVOS

Sabendo da carência de métodos de quantificação label-free utilizando ligação cruzada associada à espectrometria de massas, o objetivo geral desse trabalho é desenvolver uma metodologia alternativa para o estudo de mudanças conformacionais de proteínas utilizando ligação cruzada associada à espectrometria de massas. Além disso, com os dados do trabalho, foi desenvolvida uma ferramenta computacional para quantificação label-free. Assim, os objetivos específicos do estudo foram:

• Desenvolver uma metodologia de quantificação de ligação cruzada associada à espectrometria de massas e validá-la com o sistema apoCaM/Ca2+CaM;

• Aplicar o método desenvolvido para o sistema apoHsp90/ADP/AMP;

• Correlacionar os dados de ligação cruzada quantitativa com as estruturas das proteínas em suas respectivas condições;

• Utilizar os dados deste trabalho para o desenvolvimento de uma ferramenta de automação de análise de dados.

(31)

3. PROCEDIMENTO EXPERIMENTAL

3.1 FORMAÇÃO DOS COMPLEXOS

A Calmodulina foi fornecida pelo grupo de pesquisa do Prof. Dr. Emer Suavinho Ferro do Departamento de Biologia Celular e Desenvolvimento no Instituto de Ciências Biomédicas da Universidade de São Paulo. A Hsp90 e os complexos Hsp90/ADP/AMP foram fornecidas pelo grupo de pesquisa do Prof. Dr. Carlos Ramos do Departamento de Química Orgânica da Universidade Estadual de Campinas.

• CALMODULINA/Ca2+

A Calmodulina de Rattus Novergicus fornecida estava complexada com íons de cálcio, por isso foi necessário a remoção dos mesmos. Para isso, foi adicionada à Calmodulina uma solução de tampão MOPS (do inglês, 3-morpholinopropane-1-sulfonic acid) (100 mmol L-1) contendo EGTA (do inglês,

ethylene glycol-bis(β-aminoethyl ether)-N,N,N′,N′-tetraacetic acid) (5 mmol L-1) por 30

minutos. Em seguida esta solução foi lavada utilizando filtro de centrífuga Amicon 500 com MWCO (do inglês, molecular weight cut off ) de 10 kDa (Milipore) com uma solução tampão MOPS contendo EGTA (5 µmol L-1).

Para indução da mudança conformacional na presença de cálcio, foram adicionados à Calmodulina íons cálcio (CaCl2) para obter uma concentração de 12

mmol L-1 de Ca2+. Na solução que representa o estado livre de cálcio, foi adicionado

cloreto de sódio (NaCl), buscando balancear a força iônica para atingir uma concentração final de 136 mmol L-1 de íons Na+. Após formação do complexo, as

amostras foram submetidas ao experimento de ligação cruzada.

• Hsp90/ ADP/ AMP

Os complexos da Hsp90 de Homo sapiens foram preparados no laboratório do Prof. Dr. Carlos Ramos. Para tanto, foi preparada uma mistura na proporção 1:10 em concentração de proteína e peptídeo, respectivamente, adicionando 160 µL de Hsp90 (10 µmol L-1) a 5 µL de ligante (100 µmol L-1) a 4 ºC. Após formação do

(32)

3.2 REAÇÃO DE LIGAÇÃO CRUZADA

Os experimentos de ligação cruzada foram realizados usando o suberato de N-hidroxisuccinimidila (DSS). O agente de ligação cruzada foi dissolvido em N,N-dimetilformamida (DMF) anidra de modo a obter uma concentração de 10 mg mL-1 (27

mmol L-1). Uma alíquota da solução de DSS foi adicionada à solução de proteína

mantendo a concentração de DMF menor que 10% (v/v) em solução.

Para os complexos CaM/Ca e Hsp90/ ADP/ AMP, o volume de DSS adicionado foi tal que o excesso molar do agente de ligação cruzada correspondesse a 50 e 100 vezes, respectivamente, em relação à proteína. As reações de ligação cruzada foram realizadas a 27 °C por um período de 2 horas.

As amostras da Hsp90 foram submetidas à redução de pontes dissulfeto por adição de 20 μL de solução de ditiotreitol (DTT) 10 mmol L-1, preparada em tampão

bicarbonato de amônio 100 mmol L-1 e incubada por 30 minutos a 70 °C. A

subsequente alquilação dos grupos tiol livres foi realizada adicionando 20 μL de solução de iodoacetamida (IAA) 50 mmol L-1, preparada em tampão bicarbonato de

amônio 100 mmol L-1 e incubada por 30 minutos em temperatura ambiente em

ausência de luz. Para a Calmodulina não foram necessárias as etapas de redução e alquilação, pois a proteína não contém resíduos de cisteína.

A digestão enzimática foi realizada utilizando tripsina porcina (Sequencing Grade Modified Trypsin, Promega) em uma proporção de 1:50 (m/m) enzima:substrato por um período de 18 h a 37 °C sob agitação (450 rpm) em um Thermomixer Comfort (Eppendorf).

A digestão enzimática da Calmodulina foi realizada utilizando duas etapas de adição de tripsina. A primeira adição da enzima foi em uma proporção de 1:20 (m/m) enzima:substrato e digerida a 37 °C, depois de 6 h de incubação foi feita uma segunda adição de tripsina atingindo uma concentração final de 1:10 (m/m) enzima:substrato por um período de 18 h a 37 °C (KUKACKA et al., 2015).

3.3 ANÁLISE POR ESPECTROMETRIA DE MASSAS

As análises dos peptídeos obtidos após a proteólise enzimática das amostras foram realizadas utilizando-se um cromatógrafo líquido de nanofluxo Easy-nLC 1200 (ThermoFisher Scientific) acoplado a um espectrômetro de massas Orbitrap

(33)

Fusion Lumos Tribrid (ThermoFisher Scientific) localizado no Instituto de Química da Universidade de São Paulo (IQ/USP, São Paulo).

Foram injetados aproximadamente 10 picomols de cada uma das amostras e as corridas cromatográficas foram de 30 minutos. As rampas de gradientes foram de 5 a 30% (v/v) acetonitrila em água + 0,1% de ácido fórmico entre 0 a 20 minutos, 30 a 90% (v/v) acetonitrila em água + 0,1% de ácido fórmico entre 20 e 25 minutos, e manteve-se 90% (v/v) acetonitrila em água + 0,1% de ácido fórmico até o fim dos 30 minutos. Os dados de espectrometria de massas foram adquiridos de modo contínuo durante toda a cromatografia. Cada espectro de MS foi adquirido no Orbitrap com resolução de 60.000 (m/z 400) e na faixa de m/z entre 300 e 2000. O tempo máximo de acúmulo de íons foi de 50 ms e AGC de 4x105 íons. Os espectros de MS2 foram

adquiridos de duas maneiras. Íons precursores de carga 2+ e 3+ foram fragmentados e analisados no ion trap linear, com tempo de injeção máximo de 70 ms e AGC de 1x104 íons. Os precursores de cargas mais altas foram fragmentados por HCD (do

inglês, Higher-energy collisional dissociation) e analisados no Orbitrap com resolução 30.000, com tempo máximo de injeção de 300 ms e AGC de 1x105 íons.

3.4 IDENTIFICAÇÃO E QUANTIFICAÇÃO DOS PEPTÍDEOS CONTENDO LIGAÇÃO CRUZADA

Os dados dos peptídeos advindos da digestão, obtidos no espectrômetro de massas Orbitrap Fusion Lumos Tribrid, foram submetidos a duas etapas de análise. Para isso, foi utilizado o software PatternLab (CARVALHO et al., 2016).

Primeiramente, foi analisada a cobertura de sequência da proteína por meio do software PatternLab usando como parâmetros de busca o banco de dados SwissProt, 20 ppm para massa do precursor, tripsina como enzima de proteólise e no máximo dois sítios de clivagem não digeridos. Foram adicionadas como modificações variáveis a oxidação de metionina e modificações para resíduos de lisina e serina do PatternLab com deslocamento de massa de 156,0786 Da, correspondente à modificação causada quando o ALC hidrolisado modifica esses resíduos e modificação fixa carbamidometilcisteínas.

O PatternLab foi escolhido para o tratamento dos dados porque ele apresentou menor quantidade de identificações de falso-positivo de acordo com o teste de hipótese nula no tratamento de dados de proteômica (ZHANG et al., 2017).

(34)

Para a identificação das espécies de ligação cruzada foi utilizado o software SIM-XL (LIMA et al., 2014). Os parâmetros de busca utilizados foram 20 ppm de erro para as massas tanto do precursor quanto do fragmento e modificação que a ligação do DSS causada nos peptídeos de 138,0681 Da. Foram permitidos até três sítios de clivagem não digeridos por tripsina e a oxidação de metionina foi adicionada como modificação variável para a CaM e Hsp90. A carbamidometilação de cisteína foi inserida como modificação fixa apenas para Hsp90. Foram validadas e aceitas espécies de ligação cruzada que apresentassem score interpeptídico acima de 3 e intrapeptídico acima de 2, além de cada uma das espécies terem spectral count de no mínimo 2. Posteriormente, todos os espectros foram validados manualmente. Os resultados do SIM-XL serviram como entrada para software SIM-Q, desenvolvido em colaboração com o grupo do Prof. Dr. Paulo Carvalho, com o objetivo de auxiliar na interpretação dos resultados. Esse software agrupa espécies de peptídeos de acordo com alterações semelhantes nos padrões qXLMS. Isto é atingido representando cada espécie modificada como um vetor composto pelos valores de quantificação em cada condição. O algoritmo k-means de agrupamento é então empregado para atingir esse agrupamento. As identificações das espécies modificadas dentro de cada grupo são ainda organizadas de acordo com os aminoácidos que reagiram aos ligantes. A Figura 6 exibe a tela do software SIM-XL.

(35)

Figura 6. Screenshots do analisador de quantificação do software SIM-Q. Em a) escolher os

SIM-XLs das condições estudadas, b) aplicar o filtro desejável e criar um arquivo PLP para rodar no PatternLab e c) Adicionar o SIM-XL das condições estudadas e o arquivo do PatternLab e gerar os dados para visualização no Pymol.

3.5 CÁLCULO DE DISTÂNCIA TOPOLÓGICA

Para os cálculos de distância topológica das possíveis espécies modificadas foi utilizado o software TopoLink (FERRARI et al., 2019) na versão Windows com as opções padrão para as distâncias entre os resíduos reativos frente ao DSS.

A

B

(36)

3.6 MODELAGEM DA apoHsp90 e Hsp90:ADP

Para modelagem da Hsp90 e Hsp90:ADP foi utilizado o software I-TASSER (ZHANG, 2008) utilizando como base as estruturas cristalográficas já existentes. Os códigos do PDB são 2IOQ e 2IOP, respectivamente.

(37)

4. RESULTADOS E DISCUSSÃO

4.1 REAÇÃO DE LIGAÇÃO CRUZADA

As estruturas primárias da CaM e Hsp90 foram analisadas para verificar se era possível aplicar a técnica de ligação cruzada associada à espectrometria de massas para estudo de mudança conformacional. Para isso, foram analisados se a frequência de resíduos reativos frente a DSS era suficiente para se obter informações estruturais dessas proteínas e, consequentemente, dos complexos.

Após análise das sequências de resíduos de aminoácidos dessas proteínas foi possível observar que há 8 e 80 resíduos de lisina (cerca de 5,4% e 10,6% da estrutura primária) e 4 e 42 resíduos de serina (cerca de 2,7% e 5,6% da estrutura primária) nas proteínas CaM e Hsp90, respectivamente (Figura 7), distribuídos de uma forma relativamente homogênea na estrutura primária. A porcentagem de resíduos de lisinas, resíduo mais reativo frente ao DSS, é superior à abundância relativa desse resíduo encontrado na maioria das proteínas (5,0%) (BAIROCH; APWEILER, 2000). Dessa forma, o número de resíduos reativos frente ao DSS é satisfatório tornando a técnica de ligação cruzada associada à espectrometria de massas adequada para obtenção de restrições de distâncias e também para o estudo de mudança conformacional dos complexos.

O agente de ligação cruzada utilizado (DSS) é um composto homobifuncional contendo grupos reativos ésteres de NHS. Esses grupos reagem com aminas e álcoois primários, formando amidas e ésteres, respectivamente, por um mecanismo de adição-eliminação nucleofílica (Figura 8). O nucleófilo, representado na figura pela cadeia lateral do resíduo de lisina (pKa 10,5), ataca o carbono da carbonila do DSS, formando um intermediário tetraédrico (com o carbono em hibridização sp3). Posteriormente, ocorre uma etapa de prototropismo na qual o

oxigênio ligado ao nitrogênio é protonado e esse grupo eliminado como NHS ao reestabelecer a hibridização sp2 ao carbono da carbonila. Esse grupo é eliminado

preferencialmente devido à formação de uma amida (mais estável, pKa ~15) e o NHS ser um bom grupo de saída (pKa ~6) (SOLOMONS; FRYHLE, 2011). Caso exista na proteína outro resíduo nucleofílico espacialmente próximo, a outra extremidade do DSS pode sofrer a mesma reação e é formado um produto de ligação cruzada do tipo inter- ou intramolecular. Caso não exista um resíduo espacialmente próximo, será

(38)

formada uma espécie do tipo dead-end como resultado da hidrólise da outra extremidade do ALC.

Figura 7. Sequência de resíduos de aminoácidos das proteínas CaM (A) e Hsp90 (B)

destacando os resíduos de aminoácidos (lisina colorida em vermelho e serina em verde) reativos preferencialmente frente ao DSS.

Após as reações de ligações cruzadas com as amostras de proteínas, digestão com tripsina e análise por MS2 utilizando o equipamento Lumos foram

realizadas as etapas de processamento dos dados. Para isso, foi utilizado o software PatternLab (CARVALHO et al., 2016) para verificar as proteínas presentes nas amostras, analisar a cobertura de sequência e identificar as espécies de dead-end. Esses dados serão discutidos na seção referente a cada proteína.

A CaM

MADQLTEEQI AEFKEAFSLF DKDGDGTITT KELGTVMRSL GQNPTEAELQ DMINEVDADG NGTIDFPEFL TMMARKMKDT DSEEEIREAF RVFDKDGNGY ISAAELRHVM TNLGEKLTDE EVDEMIREAD IDGDGQVNYE EFVQMMTAK B Hsp90

MPEETQTQDQ PMEEEEVETF AFQAEIAQLM SLIINTFYSN KEIFLRELIS

NSSDALDKIR YESLTDPSKL DSGKELHINL IPNKQDRTLT IVDTGIGMTK

ADLINNLGTI AKSGTKAFME ALQAGADISM IGQFGVGFYS AYLVAEKVTV ITKHNDDEQY AWESSAGGSF TVRTDTGEPM GRGTKVILHL KEDQTEYLEE RRIKEIVKKH SQFIGYPITL FVEKERDKEV SDDEAEEKED KEEEKEKEEK

ESEDKPEIED VGSDEEEEKK DGDKKKKKKI KEKYIDQEEL NKTKPIWTRN PDDITNEEYG EFYKSLTNDW EDHLAVKHFS VEGQLEFRAL LFVPRRAPFD LFENRKKKNN IKLYVRRVFI MDNCEELIPE YLNFIRGVVD SEDLPLNISR EMLQQSKILK VIRKNLVKKC LELFTELAED KENYKKFYEQ FSKNIKLGIH EDSQNRKKLS ELLRYYTSAS GDEMVSLKDY CTRMKENQKH IYYITGETKD QVANSAFVER LRKHGLEVIY MIEPIDEYCV QQLKEFEGKT LVSVTKEGLE LPEDEEEKKK QEEKKTKFEN LCKIMKDILE KKVEKVVVSN RLVTSPCCIV TSTYGWTANM ERIMKAQALR DNSTMGYMAA KKHLEINPDH SIIETLRQKA EADKNDKSVK DLVILLYETA LLSSGFSLED PQTHANRIYR MIKLGLGIDE DDPTADDTSA AVTEEMPPLE GDDDTSRMEE VD

(39)

Figura 8. Esquema representando o mecanismo de formação de uma espécie de ligação

cruzada utilizando o DSS como ALC sendo atacado por um grupo nucleofílico da cadeia lateral de um resíduo de lisina.

As reações de ligação cruzada com as proteínas foram cuidadosamente manipuladas a fim de minimizar os erros sistêmicos, permitindo obter dados satisfatórios para o estudo em questão.

(40)

Como mencionado anteriormente, o estudo de mudanças conformacionais de proteínas aplicando a técnica de ligação cruzada associada à espectrometria de massas é recente e a abordagem utilizando a quantificação label-free ainda é inexplorada. A fim de obter um conjunto de dados inicial para o desenvolvimento e validação do método, foi escolhido o sistema apoCaM/Ca2+CaM como alvo inicial, pois

este possui dois estados conformacionais diferentes muito bem caracterizados e estimulados pela presença de Ca2+. Devido a essas características, a Calmodulina

mostrou-se um alvo interessante de validação para esta etapa do trabalho.

Inicialmente foi analisada a sequência primária da CaM e as espécies formadas do tipo dead-end. O processamento mostrou que o mapa de cobertura de sequência foi aproximadamente de 90% para a proteína CaM com e sem ligante (Figura 9). Vale lembrar que a espécie desse tipo é formada quando o agente de ligação cruzada se liga a um resíduo reativo e por não ter outro resíduo próximo ele hidrolisa a outra extremidade do DSS. Sendo assim, foram avaliadas todas as lisinas e serinas que sofreram reação com o agente de ligação cruzada hidrolisado (espécies do tipo dead-end). A amostras apresentaram uma cobertura de 100% dos resíduos de lisina modificadas pelo DSS em espécies do tipo de dead-end tanto para apoCaM quanto a Ca2+CaM e 75% e 50% para os resíduos de serina para apoCaM e Ca2+CaM,

respectivamente. Esse tipo de espécie dá informações sobre a acessibilidade ao solvente da cadeia lateral dos aminoácidos da proteína na estrutura terciária e pode fornecer dados adicionais no estudo de mudança conformacional.

Figura 9. Mapa de cobertura para a Calmodulina.

O desenvolvimento do método foi realizado baseado na identificação, validação e quantificação das espécies de XL por espectrometria de massas na ausência e presença do ligante cálcio. Em uma etapa inicial as espécies de ligação cruzada do tipo intermolecular e intramolecular foram identificadas utilizando o software SIM-XL (LIMA et al., 2014), desenvolvido pelo nosso grupo em colaboração

MADQLTEEQI AEFKEAFSLF DKDGDGTITT KELGTVMRSL GQNPTEAELQ DMINEVDADG NGTIDFPEFL TMMARKMKDT DSEEEIREAF RVFDKDGNGY ISAAELRHVM TNLGEKLTDE EVDEMIREAD IDGDGQVNYE EFVQMMTAK

(41)

com o grupo do Prof. Dr. Paulo Carvalho e o Dr. Diogo B. Lima. Nessa etapa foram aplicados valores mínimos de score a fim de obter dados mais confiáveis e assim evitando atribuições equivocadas. Em seguida os espectros de MS/MS foram validados manualmente. Esse procedimento foi realizado utilizando os mesmos parâmetros para a CaM e Ca2+CaM.

Uma vez validados todos os espectros de íons fragmentos obtidos em ambas condições, o mapa de restrições foi gerado e é mostrado na Figura 10. É possível observar a distribuição de todas as restrições de distância obtidas por meio das espécies de ligação cruzada para sequência da CaM. Esse mapa mostra, em duas dimensões, as espécies interpeptídeos e intrapeptídeos que foram identificadas, sendo possível observar que uma quantidade menor de espécies de XL foi formada na Ca2+CaM quando comparada com apoCaM. Esse resultado está de acordo com

dados estruturais da proteína que mostram que a apoCaM adota uma conformação mais compacta, permitindo que um maior número de resíduos estejam próximos o suficiente para que a reação de ligação cruzada ocorra, enquanto que quando ligada ao metal a proteína adota uma conformação mais estendida e aberta, com menor número de espécies de XL possíveis. Também, nota-se na Figura 10 uma distribuição diferenciada dessas espécies na estrutura primária das proteínas.

(42)

Figura 10. Mapa bidimensional das ligações cruzadas identificadas para a apoCaM (20

espécies) e Ca2+CaM (13 espécies).

Além disso, foram calculadas as possíveis espécies de ligação cruzada a serem formadas usando o DSS como agente de ligação cruzada. Para isso, foi utilizado um software desenvolvido por nosso grupo de pesquisa em parceria com o Dr. Leandro Martínez (IQ/UNICAMP-SP), chamado Topolink, que calcula a distância topológica (menor distância acessível ao solvente) entre possíveis resíduos reativos de acordo com a especificidade e tamanho do ALC dada a estrutura terciária da proteína (FERRARI et al., 2019). Com isso, após os cálculos teóricos, observou-se que é possível formar até 18 e 10 espécies usando o DSS como ALC para a apoCaM e Ca2+CaM, respectivamente. Esses dados corroboram aos obtidos

experimentalmente, em que se observa uma maior quantidade de restrições de distância para a apoCaM em relação a Ca2+CaM. Nota-se, também, um maior número

de espécies geradas nos dados experimentais em relação aos dados teóricos. Isso pode ser explicado pelo fato da técnica de XL-MS ser capaz de fornecer informação de outros estados conformacionais que não são amostrados pelos dados teóricos

apoCaM

(43)

utilizando uma estrutura rígida, já que a reação de ligação cruzada ocorre em solução e existe uma dinâmica da proteína.

Um total de 20 espécies de XL foram identificadas para apoCaM, sendo 4 do tipo intrapeptídeos e 16 interpeptídeos. Para a análise de Ca2+CaM foram

identificadas 13 espécies, sendo 4 do tipo intrapeptídeos e 9 interpeptídeos.

Foram identificadas 5 espécies exclusivas para a apoCaM, sendo que três apresentaram uma baixa qualidade do espectro, não fornecendo uma informação confiável. Na Figura 11A e B é mostrada uma dessas espécies exclusivas identificada na amostra apoCaM que envolve a ligação entre os resíduos K76 e K116. Na estrutura da apoCaM, esses resíduos se encontram a 14 Å (distância topológica) enquanto na Ca2+CaM a distância topológica é de 42 Å, em concordância com os dados

experimentais. Uma possível explicação para esse aumento na distância entre os resíduos K76 e K116 na estrutura holo pode ser o fato que o resíduo K76 na estrutura apo está em uma região de alça, permitindo maior flexibilidade dos resíduos nessa região e maior proximidade dos resíduos K76-K116, enquanto na holo a K76 encontra-se em uma alfa-hélice. Esencontra-se mesmo comportamento é verificado para a espécie K95-S81, que na apoCaM a distância é de 24 Å enquanto na Ca2+CaM é de 29 Å (Figura

11C a D). Neste caso, o resíduo S81 está em uma região mais flexível na estrutura apo em relação a holo. Outro dado que reforça essa explicação é o fato que esse resíduo (S81) forma espécie do tipo dead-end apenas na apoCaM confirmando sua maior exposição ao solvente nessa condição. É bom destacar que a reação de ligação cruzada somente ocorre entre resíduos de aminoácidos espacialmente próximos na estrutura em solução. A distância topológica máxima considerada de reatividade para as espécies de ligação cruzada modificadas por DSS é aproximadamente de 25 Å entre os átomos de carbono alfa entre resíduos de lisina e de 23 Å entre resíduos de lisina e serina. Essa distância leva em consideração o comprimento da cadeia espaçadora do DSS (~11,4 Å), o comprimento das cadeias laterais dos resíduos de lisina (~7,6 Å) e a flexibilidade conformacional do agente de ligação cruzada e proteína (KAHRAMAN et al., 2013).

(44)

Figura 11. Representação das espécies de ligação cruzada entre os resíduos K76 e K116 (A

e B) e entre os resíduos K81 e K95 (C e D) e suas respectivas distâncias topológicas. Estruturas da A) e C) apoCaM (PDB 1DMO) e B) e D) Ca2+CaM (PDB 3CLN) geradas pelo

software PyMOL. K76 K116 14Å K76 K116 42Å

B

A

29Å K95 S81 K95 S81 24Å

D

C

(45)

Para as espécies identificadas em ambas as conformações, o cálculo de abundância relativa das espécies modificadas foi feito extraindo a corrente iônica (XIC) utilizando o software SIM-XL. Para a quantificação relativa foi utilizada a razão das áreas das espécies nas formas apoCaM e Ca2+CaM. Foram quantificadas quatro

espécies modificadas em ambos os sistemas, sendo uma do tipo interpeptídeo e três intrapeptídeo. A Figura 12 mostra as espécies quantificadas na estrutura da proteína.

Figura 12. Ligações cruzadas quantificadas e suas respectivas distâncias topológicas em A)

apoCaM (PDB 1DMO) e B) Ca2+CaM (PDB 3CLN).

Os dados de quantificação revelaram que, das quatro espécies quantificadas, três apresentaram maior abundância dos XIC na estrutura apoCaM

K31 K22 K76 K78 K95 S102 12Å 11Å 36Å K31 K22 K76 K78 K95 S102 16Å 28Å

B

A

Referências

Documentos relacionados

1 – O subscritor do presente é pós-graduando do curso de especialização em gestão pública municipal, junto à Universidade Tecnológica Federal do Paraná. Assim sendo, o

Este trabalho apresenta um modelo matemático para representação de um tecido em função da aplicação de forças e sua interação com elementos sólidos não deformáveis visando

Com o intuito de aperfeic¸oar a realizac¸˜ao da pesquisa O/D, o objetivo do presente trabalho ´e criar um aplicativo para que os usu´arios do transporte p´ublico informem sua origem

A proposta desta pesquisa objetivou desenvolver o estudante para realizar a percepção sobre o estudo da complexidade do corpo humano, onde o educando teve oportunidade

Neste capítulo, será apresentada a Gestão Pública no município de Telêmaco Borba e a Instituição Privada de Ensino, onde será descrito como ocorre à relação entre

O TBC surge como uma das muitas alternativas pensadas para as populações locais, se constituindo como uma atividade econômica solidária que concatena a comunidade com os

Objetivou-se com este estudo avaliar a qualidade de leite pasteurizado com inspeção estadual pela pesquisa de estafilococos coagulase positiva, sua

For additional support to design options the structural analysis of the Vila Fria bridge was carried out using a 3D structural numerical model using the finite element method by