• Nenhum resultado encontrado

Caracterização de Genes de Função Desconhecida com Expressão Associada às Formas Infectivas do Trypanosoma cruzi

N/A
N/A
Protected

Academic year: 2021

Share "Caracterização de Genes de Função Desconhecida com Expressão Associada às Formas Infectivas do Trypanosoma cruzi"

Copied!
129
0
0

Texto

(1)

INSTITUTO OSWALDO CRUZ

Pós-Graduação em Biologia Celular e Molecular

FELIPE DA VEIGA LEPREVOST

Caracterização de Genes de Função Desconhecida com Expressão

Associada às Formas Infectivas do Trypanosoma cruzi

Dissertação apresentada ao Instituto Oswaldo Cruz como parte dos requisitos para obtenção do título de Mestre em Biologia Celular e

Molecular

Orientador: Prof. Dr. Marco Aurélio Krieger Orientadora: Prof. Dra. Daniela Parada Pavoni

CURITIBA 2009

(2)

Livros Grátis

http://www.livrosgratis.com.br

(3)

INSTITUTO OSWALDO CRUZ

Pós-Graduação em Biologia Celular e Molecular

FELIPE DA VEIGA LEPREVOST

Caracterização de Genes de Função Desconhecida com Expressão

Associada às Formas Infectivas do Trypanosoma cruzi

Dissertação apresentada ao Instituto Oswaldo Cruz como parte dos requisitos para obtenção do título de Mestre em Biologia Celular e

Molecular

Orientador: Prof. Dr. Marco Aurélio Krieger Orientadora: Prof. Dra. Daniela Parada Pavoni

CURITIBA 2009

(4)

ii

INSTITUTO OSWALDO CRUZ

Pós-Graduação em Biologia Celular e Molecular

Esta dissertação intitulada

Caracterização de Genes de Função Desconhecida com Expressão

Associada às Formas Infectivas do Trypanosoma cruzi

Defendida por

FELIPE DA VEIGA LEPREVOST

Sob orientação de Marco Aurélio Krieger Daniela Parada Pavoni

Foi avaliada e aprovada pela banca examinadora composta por

Dr. Alejandro Correa Domingues

Dr. Milton Ozório Moraes

Dr. Augusto Savio Ramos

(5)

iii

A minha família, amigos e namorada pelo carinho e dedicação.

(6)

iv

AGRADECIMENTOS

A Dra. Daniela Parada Pavoni pela oportunidade, amizade, conselhos e ensinamentos.

Ao Dr. Marco Aurélio Krieger, pela orientação e pelas oportunidades.

Aos pesquisadores, funcionários, colegas e amigos do Instituto Carlos Chagas.

Ao CNPq, Fiocruz, ICC pelo auxílio financeiro.

A todos aqueles que, de alguma forma, fizeram parte de minha vida e me influenciaram na realização deste trabalho.

(7)

v

“... Porque as perguntas realmente sérias são aquelas que somente uma criança pode

formular. Só as perguntas mais ingênuas são realmente perguntas sérias. São as

interrogações para as quais não há resposta. Uma pergunta para qual não há

resposta é uma cancela além da qual não há mais caminhos. Em outras palavras:

são precisamente as perguntas para as quais não há respostas que marcam os limites

das possibilidades humanas e que traçam as fronteiras da nossa existência... ”.

(8)

vi

ÍNDICE

INTRODUÇÃO...1

GENÔMICA FUNCIONAL...2

SOBRE AS PROTEÍNAS DE FUNÇÃO DESCONHECIDA...4

SOBRE O TRYPANOSOMA CRUZI...6

BIOLOGIA DA FAMÍLIA TRYPANOSOMATIDAE...6

MECANISMOS DE TRANSCRIÇÃO E PROCESSAMENTO ...8

FORMAS EVOLUTIVAS ...9

CICLO DE VIDA ...10

A DOENÇA DE CHAGAS: PATOLOGIA E EPIDEMIOLOGIA...12

OBJETIVOS ...13

OBJETIVOS ESPECÍFICOS ...13

MATERIAIS E MÉTODOS ...14

MICROARRANJO DE DNA ...14

CRITÉRIOS DE SELEÇÃO DOS GENES ...15

AMPLIFICAÇÃO DOS GENES E PURIFICAÇÃO DOS PRODUTOS DE PCR ...17

CLONAGEM ATRAVÉS DA PLATAFORMA Gateway®...19

OBTENÇÃO DOS CLONES DE ENTRADA E DE EXPRESSÃO...21

CONFIRMAÇÃO DOS CLONES...22

EXPRESSÃO DAS PROTEÍNAS ...23

ANÁLISE DA EXPRESSÃO ...24

PURIFICAÇÃO DAS PROTEÍNAS EXPRESSAS ...25

IMUNIZAÇÃO E OBTENÇÃO DE SORO POLICLONAL...26

PURIFICAÇÃO DOS SOROS POLICLONAIS...26

CULTIVO DO TRYPANOSOMA CRUZI ...27

METACICLOGÊNESE IN VITRO...28

PREPARAÇÃO DOS EXTRATOS PROTÉICOS ...28

WESTERN BLOT DOS EXTRATOS PROTÉICOS ...29

CULTIVO DE CÉLULAS VERO ...30

IMUNOLOCALIZAÇÃO POR MICROSCOPIA ÓTICA ...30

ENSAIOS DE TRANSFECÇÃO EM TRYPANOSOMA CRUZI...32

MICROSCOPIA DE TRANSMISSÃO...33

IMUNOPRECIPITAÇÃO...33

ANÁLISES BIOINFORMÁTICA ...33

(9)

vii

AMPLIFICAÇÃO DOS GENES E PURIFICAÇÃO. ...34

OBTENÇÃO DOS CLONES E EXPRESSÃO DAS PROTEÍNAS ...35

CARACTERIZAÇÃO DOS GENES ...37

TcExp02H01 – Provável Peptidase Serina Hidrolase...37

TcExp02H02 – Provável Proteína de Domínio SAC3/GANP ...44

TcExp02H03 – Provável Proteína de Função Desconhecida ...48

TcExp02H04 – Provável Proteína Promotora de Polimerização de Tubulina...54

TcExp02H05 – Provável Proteína com Domínio Kelch de Função Desconhecida60 TcExp02H06 – Provável Proteína RPB11, Subunidade da RNA Polimerase II ...65

TcExp02H07 – Provável Proteína TcJ32, cochaperona família HSP40...74

TcExp02H08 – Provável Proteína de Interação à DAZ (Deleted in Azoospermia).86 TcExp02H09 – Provável Proteína p17, Subunidade da DNA Polimerase ε...90

TcExp02H10 – Provável Subunidade 6 do Complexo COP9 ...95

Localização Celular de Proteínas Fusionadas com Proteína GFP ...99

ANÁLISE DO TRABALHO ESCALONADO...99

CONCLUSÕES ...103

(10)

viii

LISTA DE FIGURAS

Figura 1.1. Contagem de proteínas hipotétcas em organismmos modelos Figura 2.1. Ciclo de vida do Trypanosoma cruzi

Figura 4.1. Valores de expressão dos genes no microarranjo de DNA Figura 4.2. Características das proteínas selecionadas

Figura 4.3. Lista de iniciadores

Figura 4.4. Exemplo de utilização do sistema Gateway.

Figura 4.5. Vetor de entrada na plataforma Gateway pDONR221. Figura 4.6. Vetor de expressão co etiqueta de 6x histidinas pDEST17.

Figura 4.7.Padrão eletroforéticos sos extratos referentes à metaciclogênese. Figura 5.1. Perfil eletroforético dos amplicons após purificação.

Figura 5.2. Perfil eletroforético dos vetores após recombinação.

Figura 5.3. Detalhe sobre a massa molecular das proteínas expressas em gel de poliacrilamida.

Figura 5.4.Padrão de expressão do gene TcExp02H01 atualizado. Figura 5.5.Análise de TcExp02H01 pelo PFAM.

Figura 5.6.Alinhamento múltiplo de TcExp02H01.

Figura 5.7.Expressão e purificação da proteína TcExp02H01

Figura 5.8.Expressão de TcExp02H01 durante a metaciclogênese, soro 1. Figura 5.9.Expressão de TcExp02H01 durante a metaciclogênese, soro 2. Figura 5.10.Imunolocalização de TcExp02H01 por microscopia ótica. Figura 5.11.Análise de TcExp02H02 pelo PFAM.

Figura 5.12.Padrão de expressão do gene TcExp02H02 atualizado. Figura 5.13.Alinhamento múltiplo de TcExp02H02.

Figura 5.14.Expressão da proteína TcExp02H02. Figura 5.15.Análise de TcExp02H03 pelo PFAM.

Figura 5.16.Padrão de expressão do gene TcExp02H03 atualizado. Figura 5.17.Alinhamento múltiplo de TcExp02H03.

Figura 5.18.Resultado do alinhamento entre TcExp02H03 e rib74. Figura 5.19.Resultado do alinhamento entre TcExp02H03 e EFCH1. Figura 5.20.Expressão da proteína TcExp02H03.

Figura 5.21.Análise de TcExp02H04 pelo PFAM.

Figura 5.22.Padrão de expressão do gene TcExp02H04 atualizado. Figura 5.23.Identificação deTcExp02H04 em análises proteômicas. Figura 5.24.Alinhamento múltiplo de TcExp02H04.

(11)

ix

Figura 5.25.Expressão e purificação da proteína TcExp02H04. Figura 5.26.Expressão de TcExp02H04 durante a metaciclogênese. Figura 5.27.Imunolocalização de TcExp02H04 por microscopia ótica. Figura 5.28.Imunolocalização de TcExp02H04 por microscopia eletrônica. Figura 5.29.Análise de TcExp02H05 pelo PFAM.

Figura 5.30.Padrão de expressão do gene TcExp02H05 atualizado. Figura 5.31.Alinhamento múltiplo de TcExp02H05.

Figura 5.32.Expressão e purificação da proteína TcExp02H05. Figura 5.33.Expressão de TcExp02H05 durante a metaciclogênese. Figura 5.34.Análise de TcExp02H06 pelo PFAM.

Figura 5.35.Alinhamento múltiplo de TcExp02H06.

Figura 5.36.Expressão e purificação da proteína TcExp02H06. Figura 5.37.Padrão de expressão do gene TcExp02H06 atualizado. Figura 5.38.Expressão de TcExp02H06 durante a metaciclogênese. Figura 5.39.Imunolocalização de TcExp02H06 por microscopia ótica. Figura 5.40.Imunolocalização de TcExp02H06 por microscopia ótica. Figura 5.41.Imunolocalização de TcExp02H06 por microscopia eletrônica. Figura 5.42.Localização celular de TcExp02H06 fusionada a GFP.

Figura 5.43.Análise da qualidade do modelo gerado por modelagem. Figura 5.44.Modelo tridimensional de TcExp02H06 gerado por homologia. Figura 5.45.Análise de TcExp02H07 pelo PFAM.

Figura 5.46.Contagem das proteínas J em organismos modelos. Figura 5.47.Subgrupos das proteínas J em Trypanosoma cruzi. Figura 5.48. Alinhamento múltiplo de TcExp02H07.

Figura 5.49.Padrão de expressão do gene TcExp02H07 atualizado. Figura 5.50.Expressão e purificação da proteína TcExp02H07. Figura 5.51.Expressão de TcExp02H07 durante a metaciclogênese. Figura 5.52.Expressão e purificação da proteína ∆TcExp02H07.

Figura 5.53.Expressão de TcExp02H07 durante a metaciclogênese, soro anti ∆H07. Figura 5.54.Imunolocalização de TcExp02H07 por microscopia ótica, soro anti H07. Figura 5.55.Imunolocalização de TcExp02H07 por microscopia ótica, soro anti ∆H07. Figura 5.56.Imunolocalização de TcExp02H07 por microscopia eletrônica, soro anti H07.

Figura 5.57 Imunolocalização da proteina TcExp02H07 durante infecção, soro anti ∆H07

(12)

x

Figura 5.58 Imunolocalização da proteina TcExp02H07 durante infecção, soro anti H07

Figura 5.59.Análise de TcExp02H08 pelo PFAM. Figura 5.60. Alinhamento múltiplo de TcExp02H08.

Figura 5.61.Padrão de expressão do gene TcExp02H08 atualizado. Figura 5.62.Expressão da proteína TcExp02H08.

Figura 5.63.Expressão de TcExp02H08 durante a metaciclogênese. Figura 5.64.Análise de TcExp02H09 pelo PFAM.

Figura 5.65. Anotação dos genes referentes às subunidades da DNA polimerase ε. Figura 5.66. Alinhamento múltiplo de TcExp02H09.

Figura 5.67.Padrão de expressão do gene TcExp02H09 atualizado. Figura 5.68.Expressão da proteína TcExp02H09

Figura 5.69.Reconhecimento do soro anti TcExp02H09 contra os estratos do parasita. Figura 5.70.Análise de TcExp02H10 pelo PFAM.

Figura 5.71.Padrão de expressão do gene TcExp02H10 atualizado. Figura 5.72. Alinhamento múltiplo de TcExp02H10.

Figura 5.73.Expressão da proteína TcExp02H10.

(13)

xi

INSTITUTO OSWALDO CRUZ

CARACTERIZAÇÃO DE GENES DE FUNÇÃO DESCONHECIDA COM EXPRESSÃO ASSOCIADA ÀS FORMAS INFECTIVAS DO TRYPANOSOMA CRUZI

RESUMO

DISSERTAÇÃO DE MESTRADO

Felipe da Veiga Leprevost

Atualmente novas abordagens e metodologias de pesquisa nos permitem iniciar projetos de caracterização de um conjunto de proteínas de um determinado organismo em escalas superiores aos realizados há algum tempo. Novas tecnologias para seqüenciamento, clonagem e expressão protéica permitem a geração de uma quantidade grande de novas informações numa fração de tempo relativamente curta. Organismos como o Trypanosoma cruzi, que possuem praticamente metade de seu genoma sem função conhecida, necessitam que estudos sejam realizados para que se consiga atribuir às proteínas de função desconhecida características funcionais. Em um esforço para se conhecer melhor os genes de função desconhecida deste parasita, um grupo de 10 genes foi selecionado com base na sua expressão diferencial durante a metaciclogênese, consistindo de genes anotados como ‘proteína hipotética’ em banco de dados públicos, com domínio identificado pelo banco de famílias protéicas PFAM e com ortólogos em outros organismos. Os 10 genes selecionados foram amplificados e clonados na plataforma de clonagem Gateway e as proteínas recombinantes foram expressas em Escherichia coli. Dos 10 genes destinados à expressão protéica, 8 expressaram proteínas insolúveis as quais foram utilizadas para obtenção de soro policlonal. Os soros obtidos foram utilizados em ensaios de Western Blot para averiguação da expressão protéica ao longo da metaciclogênese do parasita e ensaios de localização celular por microscopia ótica e eletrônica. Foram realizados também ensaios de transfecção em T. cruzi para a expressão das proteínas fusionadas com GFP, visando à determinação da localização celular, utilizando um vetor compatível com a plataforma Gateway, e foram realizados ensaios de imunoprecipitação para todas as 8 proteínas expressas. Os resultados obtidos no presente trabalho auxiliam na atribuição de informações experimentais a genes e proteínas anotados como ‘proteína hipotética de função desconhecida’ e avaliam a possibilidade de implementação de um estudo sistemático com este para uma aplicação em média/larga escala.

(14)

xii

INSTITUTO OSWALDO CRUZ

CHARACTERIZATION OF GENES OF UNKNOWN FUNCTION WITH A HIGHER EXPRESSION IN TRYPANOSOMA CRUZI INFECTIVE FORMS

ABSTRACT

DISSERTAÇÃO DE MESTRADO

Felipe da Veiga Leprevost

Recent research approaches and methodologies allow us to develop projects for the characterization of proteins of a given organism in scales greater than possible some time ago. New technologies for sequencing, cloning and protein expression allow the generation of large amounts of new information in relatively short time. Organisms such as Trypanosoma cruzi, which have nearly half of its genome with no known function, require studies to assign functions to proteins of unknown function. In an effort to characterize the genes of unknown function of this parasite, a group of 10 genes was selected based on their differential expression during metacyclogenesis. The genes were annotated as 'hypothetical protein' in public databases, with domains identified in the PFAM database and with orthologs in other organisms. The 10 selected genes were amplified and cloned in Gateway cloning platform and the recombinant proteins were expressed in Escherichia coli. Eight of the 10 genes expressed insoluble proteins which were used to obtain polyclonal serum. The sera were used in Western Blot analysis to verify protein expression throughout the parasite metacyclogenesis as well as cellular localization by optical and electron microscopy. To determine cellular localization, transfection experiments were conducted in T. cruzi for the expression of proteins fused with GFP using a vector compatible with the Gateway platform. Immunoprecipitation assays were also performed for the 8 expressed proteins. The results obtained in this work uncover experimental information of genes annotated as 'hypothetical protein of unknown function' and assess the possibility of implementing a systematic approach with this methodology in medium to large scale.

(15)

INTRODUÇÃO

Desde os tempos de Norbert Weiner, a busca pelo entendimento de organismos em nível de sistema tem sido um tema recorrente (Weiner, 1948). Atualmente tal tema tem ganhado maior atenção. A bioquímica e a biologia molecular, por exemplo, têm passado por mudanças impactantes. A tradicional metodologia de estudos nas áreas biológicas adotou o raciocínio reducionista, no qual a essência da pesquisa reside no estudo minucioso das partes de um organismo. Apesar de informativa a visão reducionista falha em buscar o entendimento dos organismos de forma global. Alguns fenômenos e características, como o comportamento dos organismos são na verdade produtos de interações de vias metabólicas, e somente o estudo de forma completa dos organismos poderá elucidar as singularidades de cada sistema estudado.

Para tal é necessária a aplicação de novas abordagens a antigos problemas. O objetivo destas novas abordagens é obter o máximo de informações sobre um sistema para ser possível traçar as interações que constituem o sistema como um todo (Kitano, 2001). A crescente utilização das metodologias denominadas de “ômicas”, neologismo utilizado na pesquisa biológica para denominar abordagens globais, como a genômica, proteômica e a metabolômica, surge em resposta à esta nova necessidade de estudos abrangentes que aliadas ao avanço notável da tecnologia permitem a obtenção de grandes quantidades de informações sobre os diferentes modelos biológicos. O entendimento da funcionalidade de um organismo e a forma como o mesmo responde a fatores diversos necessita da integração de todas estas abordagens, fato este cada vez mais evidente pela constante disparidade de dados, gerada pela falta de integração do conhecimento de um sistema (Gygi et al., 1990; Griffin et al., 2002; Anderson et al., 1997).

O avanço no estabelecimento da filosofia do estudo de sistemas em larga escala vem ao encontro dos interesses de empresas do setor biotecnológico. Empenhadas em investir no desenvolvimento de métodos e plataformas, visam obter uma grande quantidade de informações sobre o sistema biológic. Entre as tecnologias atuais podemos citar microarranjos, seqüênciadores de alto desempenho, plataformas robotizadas para clonagem e expressão protéica e sistemas de clonagem por recombinação. Dentre as tecnologias emergentes, é importante destacar a recente plataforma de clonagem recombinatória, que substitui os métodos clássicos de

(16)

2

clonagem utilizando enzimas de restrição por métodos que utilizam recombinação de sítios adaptadores universais, transformando assim a prática da clonagem gênica em algo rápido e prático (Hartley et al., 2000). Atualmente, este é o método escolhido para ser usado em grandes projetos de caracterização em larga escala de organismos modelos (Reboul et al., 2003).

Baseando-se nas tendências atuais, o presente trabalho lança-se em prol da pesquisa escalonada, buscando demonstrar como uma linha de trabalho em média escala pode ser aplicada na caracterização de um grupo de genes acreditados com função desconhecida. Utilizando das tecnologias de larga escala (microarranjo de DNA e sistema de clonagem recombinatório para expressão de proteínas), o trabalho busca a atribuição de informações em diferentes níveis biológicos para um grupo pequeno de genes do parasita Trypanosoma cruzi.

GENÔMICA FUNCIONAL

Atualmente, mais de 900 organismos celulares já possuem seus genomas seqüenciados (Liolios et al., 2008), o que contribuiu na geração de mais de 6 milhões de seqüências protéicas únicas divulgadas em bancos de dados públicos (Wu et al., 2006). Para a maioria destas proteínas, ainda é necessário a determinação das suas funções por métodos experimentais, iniciativa esta que necessita de um grande esforço e muito tempo para ser realizado. Até o momento, somente 20% e 1% dos respectivos genomas de Homo sapiens e Caenorhabditis elegans foram caracterizados funcionalmente por métodos experimentais (Lee et al., 2007).

O advento da genômica trouxe consigo a oportunidade de analisar concomitantemente grandes quantidades de informações gênicas sobre os organismos. O uso de microarranjos, por exemplo, foi de início um método complexo, porém eficiente, de se avaliar os padrões de expressão gênica de forma global (Schena et al., 1995). Recentemente a melhoria das técnicas de sequenciamento em larga escala, as chamadas técnicas de sequenciamento da próxima geração (next-generation sequencing), permitem-nos a rápida resolução de um genoma completo ou do próprio transcritoma (Schuster., 2008; Snyder et al., 2008). Ambas as técnicas se mostraram eficientes em facilitar o agrupamento de genes com base nos padrões de expressão, Entretanto estes métodos,

(17)

3

individualmente, não são capazes de apontar a casualidade do sistema, ou seja, os fatores responsáveis elos padrões orquestrados da expressão gênica.

Tal afirmativa demonstra como as novas tecnologias se tornaram essenciais aos trabalhos escalonados. Por conta da atual facilidade em se obter informações sobre um organismo, o número de dados gerados tem crescido de forma abrupta, exigindo cada vez mais a utilização de recursos informáticos. Como as caracterizações minuciosas não são, a princípio, utilizadas na aquisição dos dados em larga escala, muitos organismos hoje, possuem uma carência no processo de anotação e caracterização de genes e proteínas presentes em diversos processos biológicos. Dessa forma, criou-se um cenário, até então inédito na biologia, onde se pode deduzir a existência e o comportamento dos genes de um organismo. É possível ainda a dedução de padrões de comportamento de grupos gênicos, sua associação com certas doenças ou até mesmo indicar corregulação transcricional e, mesmo assim, não reconhecer nenhuma característica funcional de tais genes e proteínas.

Uma estratégia para reverter este quadro, é a prática da determinação de função através de 'herança por homologia'. A atual riqueza de informações sobre os organismos, somada à alta conservação entre os elementos gênicos nos permite utilizar de transferência de anotação para caracterizar um organismo menos estudado, facilitando assim a identificação de elementos essenciais do metabolismo de determinado organismo. Porém a transferência de anotação deve ser levada com cautela. A prática de “empréstimo de anotação” pode levar a considerações errôneas por uma série de motivos. Para que a transferência seja confiável é essencial que o organismo de origem seja anotado de forma correta e clara, de preferência através de evidências experimentais ao invés de predições eletrônicas. É de suma importância também, levar em consideração a distância evolutiva entre os organismos a serem comparados, uma vez que proteínas de sequência muito semelhantes possam obter uma denominação idêntica, porém a mesma pode adotar funções diferentes em organismos distantes evolutivamente, o que levaria a uma anotação errônea sobre sua função. Outro ponto de importância é a adoção de uma linguagem universal para a caracterização gênica, seja por anotação eletrônica ou por evidência experimental a fim de normalizar a utilização de nomes e termos na descrição funcional de genes e proteínas.

Esta prática gerou a necessidade de adotar uma linguagem de anotação universal e intuitiva, como o uso de ontologias (G.O. Consortium., 2000). O consórcio Gene Ontology utiliza de uma descrição dividida em três categorias, sendo

(18)

4

elas ‘Processos Biológicos’, ‘Função Molecular’ e ‘Componente Celular’. A ontologia geralmente compreende termos bem definidos com relações bem definidas entre si.

O termo ‘Processos Biológicos’ remete-se a um processo biológico no qual o produto gênico contribui. Processo este realizado através da organização de uma ou mais funções moleculares. ‘Função Molecular’ é a definição da atividade bioquímica realizada por um determinado produto gênico, descreve apenas o que é feito, sem prestar detalhes sobre a localização e o espaço temporal no qual tal função ocorre. Por fim, ‘Componente Celular’ descreve a localidade onde um produto gênico é ativo, remetendo-se à arquitetura celular eucariótica.

Através das metodologias utilizadas, o presente trabalho buscou agregar a maior quantidade possível de informação sobre o grupo de genes selecionados para poder então realizar a atualização sobre as predições e anotações realizadas nos bancos de dados.

SOBRE AS PROTEÍNAS DE FUNÇÃO DESCONHECIDA

A classificação de genes normalmente segue um roteiro descritivo, onde cada gene em um organismo recebe uma categoria relacionada à sua natureza. As categorias dizem respeito ao conhecimento sobre cada gene anotado no genoma. Genes cujos produtos protéicos são confirmados experimentalmente, porém sem maiores evidências sobre sua função recebem o prefixo ‘Provável’. No caso de genes sem informações funcionais e sem evidências da existência de um produto protéico, aplica-se o termo 'gene para proteína hipotética' (G.O. Consortium., 2000).

Observando os resultados de classificações de genes de alguns organismos modelos observamos um alto número de genes classificados como ‘hipotético’, a figura 1.1 descreve a atual porcentagem de proteínas denominadas como ‘hipotéticas’ em diversos organismos modelos. Por definição o termo deveria ser somente empregado em seqüências protéicas as quais nenhuma informação existe a respeito, sendo até mesmo sua existência questionável, mas o termo é comumente encontrado em seqüências protéicas conservadas e que não possuem função conhecida.

(19)

5

Figura 1.1. Gráfico demonstrando o resultado da busca no banco de dados do site NCBI pelo nome dos organismos e o termo ‘proteína hipotética’. No eixo Y está a porcentagem de proteínas classificadas como ‘Proteína Hipotética’ e no eixo X os organismos modelos utilizados na busca.

Observações mais cautelosas de algumas seqüências catalogadas como hipotéticas demonstram que o processo automatizado de categorização pode ser falho, atribuindo o termo ‘hipotético’ para seqüências com funções preditas ou já reconhecidas, fazendo com que as mesmas passem despercebidas.

Organismos pouco estudados, como o Trypanosoma cruzi, obtiveram uma extensa anotação automática de seus genomas. Neste caso muitas de suas CDSs foram anotadas genericamente como 'gene para proteína hipotética conservada' (GeneDB). Observando a anotação realizada sobre o genoma de T. cruzi, nota-se que cerca de 50% das seqüências protéicas estão anotadas desta forma, mas como apontado acima, isto não significa que praticamente metade de seu genoma seja desconhecido para a ciência, indicando apenas que é necessária a realização de um processo de anotação mais cuidadoso.

Esta observação sobre o processo de anotação levanta a questão sobre a confiabilidade dos processos utilizados em genes e proteínas de baixa similaridade ou sem ortólogos reconhecidos. Projetos de caracterização como o realizado no presente trabalho auxiliam na correção e atualização da anotação atribuída ao conteúdo do genoma, ressaltando a importância da anotação manual e da comprovação por meios experimentais.

(20)

6

SOBRE O TRYPANOSOMA CRUZI

O Trypanosoma cruzi, protista unicelular e flagelado, é um organismo pertencente à Ordem Kinetoplastida (Cavalier-Smith 1993, Corliss 1992), família Trypanosomatidae (Levine et al., 1980). Esta família apresenta importância médica por abrigar um conjunto de organismos relacionados causadores de patologias humanas e animais de profundo impacto econômico, social e cultural, como por exemplo, Trypanosoma brucei no continente africano, o complexo Leishmania spp em diversos continentes e o próprio Trypanosoma cruzi nas Américas. Os organismos da Ordem Kinetoplastida estão organizados em duas grandes famílias, Bodonidae e Trypanosomatidae, sendo a segunda responsável por abrigar o gênero Trypanosoma (Vickerman et al., 1976).

O Gênero Trypanosoma foi notadamente organizado em dois grupos, separando assim os organismos de acordo com as características do seu desenvolvimento celular no interior do hospedeiro invertebrado (Hoare 1972). O grupo Salivaria abriga os tripanossomas cujo desenvolvimento no interior do hospedeiro invertebrado se inicia na luz intestinal e termina no interior das glândulas salivares, através da migração das células pelo epitélio digestivo. O grupo Stercoraria abriga os demais tripanossomas (incluindo aqui o Trypanosoma cruzi) que possuem o ciclo de desenvolvimento abrangendo toda a luz do sistema digestivo do hospedeiro, se iniciando no trato digestivo superior e culminando na eliminação de formas parasitárias infectivas nas excretas do vetor.

BIOLOGIA DA FAMÍLIA TRYPANOSOMATIDAE

Os organismos da Família Trypanosomatidae apresentam uma série de peculiaridades biológicas incomuns, como a compartimentalização da via glicolítica (De Souza et al., 2002), edição dos mRNAs mitocondriais (Schneider, 2001) e o processamento dos mRNAs por trans-splicing (Lange et al., 1984). Tais características podem ser explicadas levando em consideração a grande distância evolutiva do Gênero em relação ao tronco eucariótico comum (Dacks et al., 2007). As espécies do Gênero Trypanosoma e Leishmania são amplamente aceitas como monofiléticas; apesar disso, as espécies T. cruzi, T. brucei e Leishmania spp

(21)

7

apresentam padrões evolutivos distintos, como, por exemplo, os diferentes ciclos de vida e os respectivos insetos hospedeiros presentes no ciclo de transmissão das doenças (Stevens et al., 2001).

Com a publicação dos primeiros rascunhos dos genomas dos três tripanossomatídeos, foi possível lançar novos olhares sobre a estruturação genômica dos parasitas e seu conteúdo gênico (El Sayed et al., 2005). Estimativas do projeto de seqüenciamento genômico do T. cruzi indicam que o genoma diplóide possui entre 106,4 e 110,7 Mb, destes, um montante de 67 Mb foram selecionados para anotação. A análise da fração anotada perfaz 60,7 Mb e demonstra que 30,5 Mb são compostos de seqüências encontradas pelo menos duas vezes, sugerindo que elas são oriundas dos diferentes haplótipos que compõem o genoma híbrido da cepa CL Brener. A organização e a montagem do genoma do T. cruzi demonstra-se ainda como um desafio. Os cromossomos dos tripanossomatídeos não se condensam durante o ciclo celular, dificultando o estudo da sua biologia (Vickerman et al., 1977). Estimativas baseadas em análises por PGFE indicam que o T.cruzi possui aproximadamente 64 cromossomos (Cano et al., 1995). É possível observar também uma grande variabilidade intra-específica do número e no tamanho dos cromossomos em cada linhagem clonal (Silveira, 2000), devido provavelmente à incidência de inserções e deleções. Por conta do alto teor repetitivo, uma série de fragmentos genômicos ainda não possui região cromossômica demarcada. Apesar das grandes distâncias e dos diferentes ciclos de vida adotado pelos parasitas Trypanosoma cruzi, Trypanosoma brucei e Leishmania spp, uma característica marcante é a extensa sintenia dos genomas (El-Sayed et al., 2005b; Ghedin et al 2004) e, portanto, dos blocos gênicos. O genoma dos tripanossomatídeos apresenta-se altamente compacto, tendo os genes organizados em grupos próximos, facilmente visualizados observando o cromossomo I de Leishmania major (Martinez-Calvillo et al., 2003).

A mitocôndria dos cinetoplastida apresenta uma morfologia singular. Localizada no interior da mitocôndria única destes protozoários, o cinetoplasto é constituído por uma complexa rede de moléculas circulares de DNA, todas catenadas entre si (Englund et al., 1996). O DNA mitocondrial ou kDNA é formada por maxicírculos, com cerca de 50 moléculas contendo entre 14 e 30 Kb responsáveis por abrigar genes codificadores de proteínas e rRNAs mitocondriais, e por minicírculos, com cerca de 20.000 moléculas contendo aproximadamente 1,4 Kb, sendo estes responsáveis por manter genes de um grupo de moléculas chamadas RNAs-guia

(22)

8

(gRNAs), envolvidas no processo de editoração dos RNAs mensageiros da mitocôndria. (Morris et al., 2001). Através do pareamento de determinados gRNAs com RNAs mensageiros específicos, ocorre adição e deleção de resíduos de uracil, levando a uma alteração da mensagem carregada pelo mRNA. Este fenômeno raro cria uma situação complexa na qual a informação correta para produção de certas moléculas não se encontra inteiramente armazenada no gene correspondente (Stuart, 1995; Lukes et al., 2002).

MECANISMOS DE TRANSCRIÇÃO E PROCESSAMENTO

Observando a organização dos genes ao longo dos cromossomos nota-se que os genes se organizam de forma próxima uns aos outros e em grandes grupos ao longo das duas fitas de DNA, de forma alternada (Martinez-Calvilho et al., 2003).

Diferentemente do policistron bacteriano, os genes de tripanossomatídeos estão organizados sem a manutenção de nenhuma relação funcional direta (El-Sayed et al., 2005b). No caso da transcrição de genes codificadores de proteínas, não há indícios de regulação da iniciação da expressão por parte da RNA Polimerase II (RNAP II), o que torna o controle da expressão gênica essencialmente pós-transcricional (Clayton, 2002). Nota-se também a ausência de regiões promotoras nas chamadas regiões de troca de fita, onde ocorre o intervalo de regiões codificantes entre as fitas do DNA (Palenchar & Bellofatto, 2006). Recentemente, estudos sobre a dinâmica do transcritoma de T. brucei apresentam indícios de que a maior parte da população de RNAs mensageiros não sofre regulação durante o desenvolvimento do parasita (Brems et al., 2005; Koumadou et al., 2008). O controle da expressão gênica aparenta ocorrer através da estabilidade e tradução dos RNAs mensageiros. Entretanto, análises da expressão diferencial, com microarranjos de DNA, produzidos com RNA polissomal de T.cruzi indicam que cerca de 20% dos genes possuem expressão regulada (Pavoni, comunicação pessoal). Até o momento, seqüências reguladoras têm sido mapeadas na região 3´ não traduzida dos RNAs mensageiros maduros (Noé et al., 2008), indicando a possibilidade de serem regiões de corregulação da expressão.

A molécula de RNA imaturo ou policistron é cotranscricionalmente processada por trans-splicing através da adição de uma seqüência líder (Spliced Leader ou miniexon) de 39 nucleotídeos que contém um cap e da adição da cauda poli-A na

(23)

9

região 3´ da molécula. (Matthews et al, 1994). O miniexon é adicionado à região 5´ de cada RNA mensageiro individualmente (Liang et al., 2003).

FORMAS EVOLUTIVAS

Durante a passagem dos parasitas pelos hospedeiros, vertebrado e invertebrado, uma série de mudanças morfológicas ocorre de forma a adaptar as células a novos ambientes e a novas funções biológicas. Tais formas podem, portanto, ser associadas aos estádios de desenvolvimento do parasita e da doença por ele provocada (Souza, 2002).

• Epimastigota: Células fusiformes possuindo 20 a 40 µm de comprimento. A célula neste estádio de desenvolvimento possui um núcleo arredondado e um flagelo emergindo da porção anterior da célula, próximo ao cinetoplasto em forma de disco estando em posição anterior em relação ao núcleo. Epimastigotas são encontrados predominantemente, em fase logarítmica de crescimento, nas porções do intestino médio do inseto vetor.

• Tripomastigota: Possuem aproximadamente 25 µm de comprimento e 2 µm de diâmetro. O núcleo retém uma forma alongada e o cinetoplasto arredondado. Nas formas tripomastigotas o cinetoplasto se encontra numa região posterior em relação ao núcleo.

Existem dois tipos de tripomastigotas identificados; o tripomastigota metacíclico é a forma infectiva ao hospedeiro mamífero, é encontrada nas fezes do inseto e no sobrenadante de culturas axênicas em fase estacionária. O tripomastigota sangüíneo é encontrado na corrente sangüínea do hospedeiro vertebrado, e é infectiva ao inseto hospedeiro.

• Amastigota: Neste estádio a célula adota uma forma esférica com cerca de 3 a 5 µm. Amastigotas são formas celulares encontradas no interior das células do hospedeiro vertebrado e eventualmente na corrente sangüínea, possuem intensa atividade replicativa, assim como possível potencial infectivo (Carvalho et al., 1996).

(24)

10

CICLO DE VIDA

O ciclo de vida do parasita possui dois momentos distintos caracterizados pelo hospedeiro infectado (figura 2.1). O hospedeiro mamífero infectado pelo parasita apresenta em sua corrente sanguínea a prevalência de formas tripomastigotas sanguíneas. Durante o ato de repasto, o inseto Reduviidae perfura a pele do hospedeiro mamífero e se alimenta do sangue contendo as forma infectivas. O sangue periférico contém uma mistura de formas tripomastigotas finas e longas e formas amastigotas (cerca de 10%), oriundas das células infectadas que se romperam durante o processo replicativo. Ao se deslocarem ao intestino médio do inseto, as células passam a adotar formas esféricas, semelhante aos amastigotas replicativos e passam em seguida a formas epimastigotas. As formas epimastigotas se aderem em grupos, denominados de rosetas, à parede da luz do intestino médio, dando seqüência à diferenciação de uma parcela destas células em estádios celulares infectivos ao hospedeiro mamífero, os tripomastigotas metacíclicos. O processo de transformação de células essencialmente replicativas em células infectivas ao mamífero é denominado metaciclogênese, processo que pode ser mimetizado in vitro (Contreras et al., 1985; Bonaldo et al., 1988). Uma parte da população de epimastigotas presentes no intestino do inseto jamais completa o ciclo de transformações que culminam em formas infectivas; estas células, portanto, se replicam mantendo a população de parasitas no inseto (Souza, 2002).

(25)

11

Figura 2.1. Ciclo de vida do Trypanosoma cruzi durante sua passagem entre os hospedeiros vertebrado e invertebrado (Barrett et al, 2003).

As formas tripomastigotas metacíclicas se concentram na ampola retal, localizada na porção final do intestino. Concomitantemente ao repasto sangüíneo, o inseto excreta uma parte do líquido ingerido, liberando na epiderme do mamífero excretas contendo as formas tripomastigotas metacíclicas. O ato do repasto e as atividades do inseto sobre a derme do mamífero causam certo incômodo, fazendo com que a pessoa ou o animal predado, possam inocular mecanicamente os parasitas na corrente sanguínea pela ferida causada pelo inseto.

Ao entrar em contato com o tecido sangüíneo do mamífero, as formas infectivas iniciam o processo de invasão celular em diferentes tecidos do organismo, possuindo tendência a infectar tecidos musculares, como o tecido cardíaco, por exemplo, (Dutra et al., 2005). O processo de penetração da célula mamífera envolve um processo de sinalização complexo, tanto por parte do parasita quanto do hospedeiro, culminando na ativação de vias de mobilização de cálcio em ambas células. A adesão e a invasão são mediadas por receptores e domínios na superfície das células (Yoshida, 2006). Uma vez no citoplasma celular, inicia-se o processo de amastigogênese no qual as formas infectivas passam a adotar uma forma esférica. As amastigotas se replicam ocupando todo o interior da célula, transformando-se em seguida em tipomastigotas sangüíneas. Eventualmente, a ocupação da célula e o movimento dos parasitas rompem a célula hospedeira, liberando na corrente sanguínea amastigotas e tripomastigotas sanguíneas, as formas infectivas ao inseto.

(26)

12

A DOENÇA DE CHAGAS: PATOLOGIA E EPIDEMIOLOGIA

Quando as formas tripomastigotas metacíclicas invadem o organismo humano, seja por feridas na pele, ingestão oral, transmissão congênita ou nosocomial, a pessoa infectada passa a desenvolver a doença de Chagas. A doença de Chagas ou tripanossomíase americana desenvolve-se em fases. Na fase aguda os sintomas mais comuns são: febre, mialgia, cefaléia e o sinal de Romaña (Anez et al., 1999). Seguindo a fase aguda inicia-se a fase crônica caracterizada pela baixa parasitemia ocasionada pela resposta imune do hospedeiro. Pessoas infectadas com HIV ou imunodeprimidas podem apresentar durante a fase crônica sintomas agudos e severos, como meningoencefalite e miocardite (Sartori et al., 2002). A grande maioria dos portadores permanece na fase crônica assintomaticamente. Todavia, cerca de de 10-30% das pessoas infectadas progridem para as formas crônicas sintomáticas da doença de Chagas desenvolvendo cardiomiopatia ou doença gastrintestinal crônica. A forma intestinal da doença usualmente se desenvolve como megaesôfago e megacolon, ocorrendo em 10-20% dos infectados, podendo em alguns casos estar associada com a forma cardíaca (Barret et al., 2003).

A doença de Chagas ocorre principalmente na América Latina, onde durante a década de 80 acreditou-se que até 20 milhões de pessoas poderiam estar infectadas (WHO, 1991). Por este motivo houve um grande esforço dos países latinos em controlar a disseminação da doença, o que levou o Brasil a ser considerado livre da transmissão da doença de Chagas no ano de 2006. Estimativas recentes indicam que menos de 8 milhões de pessoas permanecem infectadas (WHO, 2007). Atualmente a doença de Chagas deixou de ocorrer apenas em países latinos devido ao grande número de migrações pelo mundo. De acordo com estimativas, a prevalência de T. cruzi em imigrantes latino americanos é 16 por 1000 na Austrália, 9 por 1000 no Canadá, 25 por 1000 na Espanha, e 8-50 por 1000 nos E.U.A. (Schmunis et al., 2007). Outro fator importante associado aos índices de imigração é o controle sobre transfusões de sangue e transplantes, que no caso da tripanossomíase só se tornou efetivo em muitos países recentemente (CDC, 2007).

(27)

13

OBJETIVOS

Caracterizar genes codificadores de proteínas hipotéticas cujos mRNAs estão diferencialmente expressos no ciclo de vida do parasita e com expressão aumentada no estádio celular tripomastigota metacíclico.

OBJETIVOS ESPECÍFICOS

• Selecionar genes codificadores de proteínas hipotéticas, baseado no perfil de expressão diferencial durante a metaciclogênese.

• Clonar os genes selecionados utilizando a tecnologia Gateway®;

• Expressar os genes selecionados em E. coli;

• Obter anticorpos policlonais a partir das proteínas recombinantes;

• Realizar ensaios de western blot com amostras de diferentes pontos da metaciclogênese;

• Realizar imunolocalização por microscopia óptica e eletrônica utilizando os anticorpos policlonais obtidos.

(28)

14

MATERIAIS E MÉTODOS

MICROARRANJO DE DNA

As características gerais da arquitetura do microarranjo de DNA são as seguintes:

• 3552 sondas individuais, amplificadas de DNA genômico de T. cruzi, oriundas da segunda versão do microarranjo, obtidas a partir dos dados de EST de T. cruzi disponíveis no Genbank no ano de 2000.

• 2354 sondas individuais, amplificadas de insertos em vetor Topo T-A (Invitrogen), referente à biblioteca de EST de epimastigotas, epimastigotas em estresse nutricional, epimastigotas aderidos em 24 horas de diferenciação e tripomastigotas metacíclicos, produzida no IBMP (Probst CM, manuscrito em preparação).

• 144 sondas referentes a 12 genes selecionados como controles de hibridização – controles internos –, por apresentarem uma intensidade de sinal muito forte nos primeiros experimentos realizados (n= 8 a 20 sondas por gene, em número variável).

• 134 sondas referentes a genes selecionados, incluídos por serem de interesse às linhas de pesquisa de outros grupos do IBMP ou colaboradores.

• 4 sondas referentes ao genoma do endossimbionte de Crithidia deanei, utilizados como controles negativos de DNA.

• 10 produtos da amplificação do gene Q do bacteriófago λ, usado como controle negativo ou positivo externo, caso adicionado o mRNA do gene à preparação do material a ser hibridado.

Os procedimentos de espotagem e hibridação e todos os desenhos experimentais levados em conta para este e para futuros trabalhos podem ser encontrados nas publicações de Probst (2005) e Pavoni (2005).

(29)

15

CRITÉRIOS DE SELEÇÃO DOS GENES

A partir de um banco de dados povoado com uma série de genes com expressão diferencial durante a metaciclogênese, obtidos a partir de experimentos com microarranjos, a seleção dos genes candidatos seguiu um critério de exigências mínimas. Inicialmente foi realizada a escolha de genes com padrões de expressão semelhantes, observados pelo microarranjo. Todos os genes deveriam fazer parte do grupo gênico que cuja a expressão estava aumentada durante a metaciclogênese. Foi realizada uma busca por genes anotados como ‘codificadores de proteína hipotética’ e analisou-se a intensidade e confiabilidade do sinal produzido pelas sondas. Foram levadas em conta apenas sondas que apresentavam sinais estatísticamente confiáveis. Todos os genes deveriam possuir produtos protéicos que tivessem algum domínio funcional com predição confiante, realizado pelo banco de famílias protéicas PFAM. Foram consideradas apenas as seqüências que não possuíam qualquer região transmembrana ou região de alta hidrofobicidade, para não dificultar o processo de expressão em Escherichia coli. Os genes selecionados deveriam apresentar ortólogos em pelo menos algum outro organismo (geralmente Leishmania sp e Trypanosoma brucei), pois a conservação evolutiva aumenta a confiança na existência e funcionalidade dos produtos gênicos em questão. Os candidatos selecionados se resumiram em 10 genes que receberam códigos para identificação, sendo eles nomeados de TcExp02H01 a TcExp02H10, abreviados aqui como H01 a H10 (figura 4.1).

(30)

16

Figura 4.1. Padrões obtidos pela análise do microarranjo. Os gráficos demonstram, em escala logarítmica, as intensidades relativas das sondas em 6 pontos distintos da metaciclogênese. Epi: epimastigotas em fase exponencial de crescimento; Str: epimastigotas em estresse nutricional; A3h, A12h e A24h: células em processo de diferenciação coletadas 3, 12 e 24 horas após o estresse nutricional, respectivamente; Meta: tripomastigota metacíclico.

Como os resultados exibidos na figura 4.1 são oriundos de uma réplica biológica apenas, posteriormente, foi realizada uma nova série de experimentos, com 4 réplicas biológicas de cada estádio do ciclo de vida do T. cruzi. Com estes experimentos, foi possível aprofundar as análises dos padrões de expressão para os genes escolhidos neste trabalho. Estes resultados podem ser conferidos nos subtópicos adiante.

Análises iniciais das seqüências protéicas selecionadas nos permitem identificar domínios que por sua vez estão associados a funções celulares variadas. Apesar de compartilharem padrões de expressão semelhantes, os genes não possuem ligação funcional evidente (Figura 4.2).

(31)

17

Figura 4.2. Demonstração de algumas características dos genes e das proteínas selecionadas e seus respectivos domínios. Gene ID: O número à esquerda é o identificador atribuído a cada gene no presente estudo, o número à direita é o código referente à seqüência depositada no banco de dados GeneDB; Protein ID: Número de identificação da proteína estudada no banco de dados GeneDB; Tamanho do Gene: Tamanho em pares de base; Peso Molecular: Predição da medida em Daltons das proteínas estudadas; PI: Ponto isoelétrico; Domínios: Breve descrição dos domínios funcionais preditos pelo banco de famílias PFAM (http://pfam.sanger.ac.uk/).

AMPLIFICAÇÃO DOS GENES E PURIFICAÇÃO DOS PRODUTOS DE

PCR

Os iniciadores utilizados para realizar as amplificações foram desenhados com auxílio do programa Primer Select (Lasergene, DNASTAR Inc.) e sintetizados levando em conta as exigências para a clonagem na plataforma Gateway. Ambos iniciadores forward e reverse foram desenhados com os sítios adaptadores attB de recombinação segundo normas do fabricante, conforme pode ser visto na figura 4.3 (Invitrogen). Os iniciadores reverse tiveram seus últimos 3 pares de bases removidos da sequência a fim de deletar o códon de parada. O intuito foi de criar amplicons que pudessem ser clonados a posteriori em vetores de expressão com etiquetas posicionadas nas regiões C – terminal das proteínas.

(32)

18

Figura 4.3. Lista dos iniciadores utilizados na amplificação das ORFs para o estudo. Em negrito está ressaltado as regiões adaptadoras necessárias para a realização das reações de recombinação.

A reação de amplificação das 5 menores ORFs foi realizado seguindo o seguinte protocolo:

• 94° C por dois minutos;

• 10 ciclos de 94°C (30 segundos), 57°C (30 segundos ), 72°C (90 segundos);

• 25 ciclos de 94°C (30 segundos), 62°C (30 segundos ), 72°C (90 segundos);

Para amplificação das 5 maiores ORFs, foi realizada um protocolo com temperatura de extensão em 68°C e o tempo de extens ão aumentado para 4 minutos. As reações foram realizadas com a enzima de alta fidelidade Platinum TAQ DNA Polymerase (Invitrogen) e as concentrações dos reagentes foram ajustadas segundo o protocolo do fabricante.

Para purificar o DNA sintetizado e para remover os iniciadores empregados na PCR, foi utilizado o protocolo de precipitação de ácidos nucléicos com PEG / MgCl2 (30% PEG 8000, 30 mM MgCl2,), indicado pelo fornecedor do kit Gateway. Ao produto de PCR (reação de 50 µl) acrescentou-se quatro volumes de tampão TE (10 mM Tris-HCl, 1 mM EDTA, pH 8,0) e 50% v/v de PEG. As soluções foram homogeneizadas e rapidamente colocadas sob centrifugação a 10.000 x g por 15 minutos em temperatura ambiente. Após centrifugação, o sobrenadante foi retirado

(33)

19

cuidadosamente, descartado e o sedimento foi ressuspendido em 10 µl de tampão TE. Após este processo de purificação, as amostras foram submetidas à eletroforese em gel de agarose e submetidas à dosagem medindo-se a absorbância a 260 nm.

CLONAGEM ATRAVÉS DA PLATAFORMA Gateway®

O sistema Gateway® permite que, a partir de um clone de entrada, seja feita a passagem do inserto, de forma rápida e eficiente, para um segundo vetor, denominado vetor de destino, de acordo com a necessidade de utilização, como mostra a Figura 4.4. O sistema foi baseado na forma como o DNA do fago lambda se integra ao genoma bacteriano por recombinação (Hartley et al, 2000). A recombinação entre os sítios do bacteriófago lambda acontece tanto no ciclo lisogênico, entre os sítios attB e attP, resultando nos sítios attL e attR, quanto no ciclo lítico, entre os sítios attL e attR, resultando novamente nos sítios attB e attP. Essas reações são específicas e direcionais, pois attB1 e attP1, attB2 e attP2, attL1 e attR1, attL2 e attR2 recombinam somente entre si.

Figura 4.4. Versatilidade do sistema de clonagem Gateway. A imagem demonstra a possibilidade de clonagem rápida em diferentes sistemas (Adaptado de: http://www.invitrogen.com). Os vetores acima são exemplos de destinações que podem ser adaptadas à plataforma.

A reação de clonagem dos amplicons no vetor de entrada da plataforma, pDONR221 (Figura 4.5), ocorre utilizando uma mistura de proteínas presente no tampão comercial, responsáveis pela catálise do processo de recombinação entre os sítios attB dos amplicons e attP no vetor (passando a se chamar attL). Neste processo, de 5 a 10% do material inicial é inserido no vetor de entrada.

(34)

20

Figura 4.5. Vetor de entrada utilizado, pDONR221. M13 forward e reverse: regiões de anelamento de iniciadores para seqüenciamento; attP1 e attP2: sítios de recombinação; ccdB: inibidor da proteína girase (o gene ccdB é utilizado para realizar seleção negativa da cultura, inibindo o crescimento de células que tenham recebido o vetor sem recombinação; Cmr : resistência a cloranfenicol. pUC ori: origem de replicação, T1 e T2: região de terminação de replicação; Kanamycin e Zeocin: Respectivamente resistências aos antibióticos Canamicina e Zeocina. Imagem adaptada de: http://www.invitrogen.com.

Para obter os clones de expressão em Escherichia coli com etiqueta de 6 histidinas, os vetores pDONR221 contendo as ORFs clonadas foram utilizados em reações de recombinação com o vetor pDEST17 (Figura 4.6), que é o vetor apropriado para a expressão heteróloga em E. coli. Nesta reação, os sítios attL, presentes no vetor de entrada recombinam com os sítios attR do vetor pDEST17, transferindo as ORFs do vetor pDONR221 para o vetor pDEST17, posicionando-as em quadro de leitura com a etiqueta de 6 histidinas, a ser fusionada na região N – terminal da proteína. Cerca de 30% do material inicial da reação LR é convertido a produto.

(35)

21

Figura 4.6. Vetor de expressão com etiqueta de 6x histidinas, pDEST 17. T7: promotor T7; RBS: sítio de ligação de ribossomo; ATG: códon de inicio da tradução; 6xHis: etiqueta de 6 histidinas; attR1 e attR2: sítios de recombinação; Cmr: resistência a cloranfenicol; T7 term: região de finalização da transcrição; ccdB: inibidor da proteína girase (o gene ccdB é utilizado para realizar seleção negativa da cultura, inibindo o crescimento de células que tenham recebido o vetor sem recombinação; Ampicilin: Gene de resistência ao entibiótico Ampicilina. Imagem adaptada de: http://www.invitrogen.com.

OBTENÇÃO DOS CLONES DE ENTRADA E DE EXPRESSÃO

A inserção dos produtos de PCR no vetor de entrada se baseia na recombinação dos sítios conforme descrito anteriormente. O processo de amplificação das ORFs utilizando os iniciadores com os sítios attB gera amplicons com as regiões necessárias para a recombinação, os quais recombinarão com os sítios presentes no vetor pDONR221.

A reação foi realizada conforme indicações do fabricante, utilizando o tampão de reação Gateway BP clonase 2 Enzyme mix (Invitrogen). O processo consiste em reagir 150 ng do produto de PCR contendo o sítio attB e 150 ng do plasmídeo pDONR™221, completando com TE (10 mM Tris-HCl pH 8, 1 mM EDTA pH 8) num volume final de 10 µl. As reações foram incubadas a 25°C por 16 horas. Em seguida a reação foi interrompida adicionando proteinase K à reação por 10 minutos a 37°C. A transformação das células cálcio competente da linhagem de E. coli DH5α foi realizada utilizando 2 µl da reação BP em 50 µl de células cálcio-competentes. As células permaneceram no gelo por 30 minutos e, em seguida, foram incubadas a 42° C por 90 segundos, retornando ao gelo em seguida. Em seguida, foram transferidas para 1 ml de meio LB onde permaneceram por uma hora a 37 °C sob agitação moderada (200 rpm) para então serem centrifugadas a 4.000 x g por 5 minutos e plaqueadas em meio LB contendo canamicina (25 mg/ml) a 37°C durante 16 horas.

Para que fosse possível gerar clones com capacidade de expressão das proteínas recombinantes em sistema bacteriano, os vetores pDONR 221 foram

(36)

22

utilizados em reações de recombinação (reação LR) com o vetor pDEST 17 (figura 4.6), cuja natureza possibilita a expressão das proteínas associadas com etiquetas de 6 x histidinas na região N – terminal das proteínas. Foi utilizado 150 ng de pDONR221 contendo o gene de interesse, 150 ng do plasmídeo pDEST17 completado como tampão LR clonase 2 Enzyme mix (Invitrogen), que já contém as enzimas necessárias para as reações de recombinação. A reação foi incubada a 25°C por 16 horas, em seguida a reação foi interrom pida adicionando proteinase K à reação por 10 minutos a 37°C. A solução de recombin ação foi então utilizada para transformação de células cálcio-competentes da linhagem E. coli DH5α, conforme descrito anteriormente. Após a transformação as células foram cultivadas em 1 ml de meio LB por uma hora a 37 °C com agitação modera da (200 rpm), para em seguida serem centrifugadas a 4.000 x g por 5 minutos e plaqueadas em meio LB contendo ampicilina (100 µg/ml) a 37° C durante 16 horas. A verificação da ob tenção dos clones de destino foi realizada conforme descrito no capítulo 4.6. As colônias selecionadas foram estriadas em placa contendo LB e ampicilina (100 µg/ml), as quais foram incubadas em estufa a 37° C durante 16 horas. O processo de confirmação dos clones se deu por toothpicking seguido de PCR, como descrito no capítulo abaixo.

CONFIRMAÇÃO DOS CLONES

A seleção dos clones transformantes foi realizada através de toothpicking, técnica na qual um número determinado de clones é isolado das placas, e então lisados em tampão NSS (EDTA 10 mM, NaOH 2 M, SDS 0,5%, Sacarose 20%) a 70°C por 10 minutos. O material genético era submet ido à eletroforese em gel de agarose 0,8%. A seleção ocorre com a visualização de clones que possuam plasmídeos com tamanhos aproximados ao esperado (maiores do que o vetor nativo). As colônias que se apresentaram como positivas foram cultivadas em 3 ml de meio LB contendo canamicina (25 µg/ml) por 16 horas a 37°C com agitação moderada (200 rpm). As bactérias foram coletadas por centrifugação e utilizadas para extração e purificação dos plasmídeos utilizando o kit comercial QIAprep Spin Miniprep (Qiagen). Uma segunda etapa de confirmação consistiu na utilização de

(37)

23

PCR utilizando os iniciadores próprios de cada ORF e iniciadores para a região M13 no vetor pDONR221.

Posteriormente ambos os vetores pDONR221 e pDEST17 foram seqüenciados para confirmar a natureza das seqüências clonadas, utilizando os mesmos iniciadores externos às ORFs. A utilização destes iniciadores gerou seqüências para cada um dos insertos clonados nos plasmídeos, que abrangem apenas as extremidades das ORFs, uma vez que alguns dos genes são grandes, e o processo de seqüenciamento empregado não foi capaz de cobrir o interior das ORFs.

EXPRESSÃO DAS PROTEÍNAS

A produção de proteínas heterólogas ocorreu empregando o método de indução de E. coli BL21(DE2) pLysS por IPTG. Cerca de 50 µl de células cálcio-competentes foram misturadas a aproximadamente 100 ng de vetor pDEST 17 contendo os genes referentes a cada uma das proteínas. A transformação ocorreu da mesma forma como descrito acima. Os clones foram cultivados em 10 ml meio LB acrescido de cloranfenicol (25 µg/ml) e ampicilina (100 µg/ml), com agitação (200 rpm) durante 16 h a 37°C (pré-inóculo). Após este período, o pré-in óculo foi transferido para um outro erlenmeyer contendo 10x o seu volume em meio LB (as culturas para indução variaram de 100 a 300 ml). Ao atingir D.O.600de 0,6 a 0,8, uma alíquota da cultura foi retirada (controle não induzido) e só então IPTG (concentração final de 1 mM) foi adicionado a cultura para iniciar a produção das proteínas. Primeiramente utilizamos um único protocolo de indução para todas as proteínas: indução em fase de crescimento exponencial, com IPTG 1mM por 2 horas a 37°C. Quando as quantidades de proteínas induzidas foram insuficientes para purificação, algumas condições do processo de expressão foram modificadas, como a alteração da temperatura de indução para 27°C e para 42°C. Após o tempo determinado de indução as culturas foram centrifugadas a 5.000 x g por 15 minutos a 4°C, o sobrenadante foi descartado e o sedimento eluído em tampão para sonicação (50 mM Tris-HCl pH 8). As células foram então lisadas com ultrasonicação, removendo-se uma alíquota de 50 µl, denominada de amostra total. O restante do material lisado foi centrifugado a 10.000 x g por 15 minutos a 4°C para obtenção das frações protéicas solúveis e insolúveis. A fração solúvel era constituída pelo sobrenadante

(38)

24

obtido após a centrifugação, o qual foi armazenado a -20°C. O sedimento resultante foi suspenso em tampão de solubilização (uréia 2 M, NaCl 300 mM) e em seguida sonicado e submetido a centrifugação (10.000 x g por 15 minutos a 4°C). Este processo foi repetido 3 vezes a fim de remover proteínas que não estivessem fazendo parte dos corpúsculos de inclusão. Após as lavagens com o tampão de uréia 2M, a solução era novamente centrifugada e finalmente suspendida em um tampão composto por uréia 8M e NaCl 300 mM. Desta forma a proteína recombinante presente nos corpúsculos de inclusão se tornou solúvel. Para posterior análise da fração que contivesse as proteínas expressas, uma alíquota foi removida da fração solúvel em uréia 8M (logo após a sonicação e centrifugação do lisado) e da fração insolúvel (solução em tampão uréia 8M).

ANÁLISE DA EXPRESSÃO

A comprovação das expressões induzidas foi realizada pela resolução dos extratos protéicos por eletroforese em gel de poliacrilamida/SDS (SDS-PAGE). Os géis de poliacrilamida foram carregados com as respectivas alíquotas de cada ensaio de expressão diferente, contendo a amostra não induzida, a amostra correspondente ao lisado celular total, a amostra contendo a fração contendo as proteínas solúveis e a fração contendo as proteínas insolúveis. Às amostras foi adicionado tampão de amostra (4 ml glicerol, 0,8 g SDS, 2,5 ml Tris-HCl, 80 µl Bromophenol blue) e as alíquotas foram aquecidas a 95°C por 10 minutos. Depois de corados com Coomassie Blue, os géis serviram para a determinação visual da fração celular que contivesse a maior massa de expressão das proteínas recombinantes. A fração em específico (solúvel ou insolúvel) que contivesse quantidades suficientes de expressão foi utilizada na purificação das proteínas.

A análise da expressão das proteínas nos extratos protéicos bacterianos foi realizada primeiramente através de eletroforese em gel de poliacrilamida e em seguida por Western blot. Após a realização da eletroforese, os extratos foram eletrotransferidos para uma membrana de nitrocelulose. Após a transferência, a membrana de nitrocelulose foi corada com Ponceau S para verificação da transferência, sendo em seguida descorada com TBS / 0,1% Tween e incubada em solução de bloqueio (5% de leite desnatado em TBS / 0,1% Tween) por 1 hora à temperatura ambiente ou a 16 horas a 4°C. Após a in cubação, as membranas foram

(39)

25

submersas em solução de bloqueio contendo o anticorpo primário anti-histidina na diluição 1:800, permanecendo por 1 hora a temperatura ambiente e, em seguida, lavadas três vezes por 5 minutos com 50 ml de TBS / 0,1% Tween. Dois mililitros da solução contendo o anticorpo secundário (policlonal), anti-IgG de camundongo conjugado com fosfatase alcalina (Promega), diluído na proporção de 1:10.000, foram adicionados às membranas e incubou-se por 45 minutos. As membranas foram novamente lavadas 3 vezes (5 minutos com 50 ml de TBS / 0,1% Tween). Para revelar as reações, foram utilizados 66 µl de NBT (Nitroblue Tetrazolium) e 33 µl de BCIP (5-Bromo-4-chloro-3-Indolil fosfato), diluídos em 10 ml de tampão para fosfatase alcalina (Tris-HCl 100 mM pH 9.5, NaCl 100 mM, MgCl2 5 mM).

PURIFICAÇÃO DAS PROTEÍNAS EXPRESSAS

As frações de eluição recolhidas foram analisadas em gel de poliacrilamida para verificar a qualidade da purificação. O processo de purificação das proteínas recombinantes seguiu-se em dois passos. Primeiramente, as frações que apresentaram a indução (em todos os casos foi utilizado a fração insolúvel contendo corpúsculos de inclusão solubilizados em uréia 8M) passaram por cromatografia de afinidade em resina de níquel (QIAexpress System, Qiagem). As eluições foram realizadas com tampões de uréia em diferentes faixas de pH. A purificação utilizando o decréscimo de pH inicia-se com a lavagem das colunas e equilíbrio das mesmas com a chamada solução de lise (NaH2PO4 100 mM, Tris-HCl 10 mM, uréia 8 M, pH 8). Os extratos protéicos são adicionados à coluna permitindo a fixação das proteínas, sendo o restante coletado e armazenado, sendo denominado de flow-through (FT). As lavagens foram feitas com 10 ml de solução de lavagem (NaH2PO4 100 mM, Tris-HCl 10 mM, uréia 8 M, pH 6,3), sendo que os materiais proveniente das lavagens foram armazenados para verificação da qualidade do processo de purificação a –20°C. Para a realização das eluições foi utilizado a solução de eluição (NaH2PO4 100 mM, Tris-HCl 10 mM, uréia 8 M) sendo que eram realizadas duas lavagens de 0,5 ml com soluções de eluição em diferentes faixas de pH (na seguinte ordem: 5,9; 5,0; 4,5; 4,0 3,5 e 3,0). Os eluídos foram armazenados a –20°C.

A segunda etapa de purificação baseou-se na separação das proteínas em gel de poliacrilamida. Para tal, géis de poliacrilamida foram preparados e submersos em KCl 1 M. Dessa forma as proteínas puderam ser visualizadas e a banda

(40)

26

correspondente à proteína correta foi excisada do gel. O material excisado foi colocado em uma membrana de diálise (Sigma-Aldrich) e adicionou-se 1 ml de tampão de eletroforese SDS-PAGE (Tris 25 mM, Glicina 192 mM, SDS 0,1%) e lacrou-se as extremidades. Feito isto, as membranas foram colocadas dentro do tanque de eletroforese contendo tampão SDS-PAGE e submetidas a uma corrente de 50 mA por 2 horas. O líquido presente dentro da membrana foi coletado e o processo foi repetido. A determinação das quantidades de proteínas obtidas foram medidas por fluorimetria (Qubit, Invitrogen).

IMUNIZAÇÃO E OBTENÇÃO DE SORO POLICLONAL

As proteínas recombinantes foram inoculadas em camundongos de linhagem BALBc. Cada proteína foi inoculada intraperitonialmente em 2 camundongos. Foram realizadas quatro inoculações de aproximadamente 20 µg de proteína em intervalos de 15 dias. A primeira dose foi preparada em adjuvante completo de Freund (Sigma) e as demais doses em Alugel (Serva). Dez dias após a última inoculação, procedeu-se à coleta do soro. Os animais foram procedeu-sedados utilizando-procedeu-se 0,2 mg de cetamina (Syntec) e 2 mg de Xilasina (Vetbrands) e o sangue total foi coletado por punção cardíaca. O sangue recolhido foi colocado por 5 minutos a 37°C, centrifugado por 10 minutos a 1.500 x g e o soro coletado foi armazenado a –20° C.

PURIFICAÇÃO DOS SOROS POLICLONAIS

Primeiramente um gel de poliacrilamida foi preparado na porcentagem adequada e carregado com amostras concentradas de proteína recombinante utilizada no processo de inoculação ou com as frações de expressão insolúvel, após as lavagens com tampão de uréia 2 M . A proteína foi eletrotransferida para uma membrana de nitrocelulose e em seguida corada com Ponceau S. A banda referente à proteína foi recortada, descorada e submersa em solução de bloqueio (5% de leite desnatado em TBS / Tween 0,1%), onde permanecia por 1 hora à temperatura ambiente ou 16 horas a 4°C. Após o bloqueio o recorte foi lavado d uas vezes com solução TBS / Tween 0,1% por 5 minutos e em seguida mergulhado em tubo de 1,5 ml contendo o

Referências

Documentos relacionados

Complementando Alves (2018) divide os concorrentes em dois grupos, os concorren- tes diretos que vendem um mesmo produto com a mesma oferta e os concorrentes indiretos

Desse modo, esta pesquisa vem colaborar com os estudos sobre o ensino de ciências, suas práticas e metodologias, reafirmando a importância de se explorar a aula de campo,

mos e m´ultiplos produtos de cada DMU em um ´unico input e output virtual (Charnes et al., 1994, p. Esse modelo trabalha com retornos constantes de escala e, por essa raz˜ao,

As evidências cientificas mais relevantes sobre a estratificação de risco cirúrgico da RP definem uma abordagem prática para a avaliação funcional pré-operatória em pacientes com

In analysing the importance of PIBID in developing teacher training, three aspects stand out: difficulties are indicated by supervisors with regard to teaching practice; the

Utilizar aplicativos de informática gerais e específicos para gerenciamento das atividades na área Administrativa.. Utilizar equipamentos, acessórios e sistemas

A Coordenadoria - Geral de Trânsito e Transporte - CGTT da Prefeitura Municipal de SERRINHA e Autoridade de Trânsito deste Município, com fulcro no artigo 281 e 282 do Código

G. Standing 2008 (antigamente da OIT):  avaliação de diversas formas de assistência  social