• Nenhum resultado encontrado

VARIABILIDADE E HISTÓRIA EVOLUTIVA DO GENE HLA-E

N/A
N/A
Protected

Academic year: 2021

Share "VARIABILIDADE E HISTÓRIA EVOLUTIVA DO GENE HLA-E"

Copied!
77
0
0

Texto

(1)

UNIVERSIDADE FEDERAL DE GOIÁS INSTITUTO DE CIÊNCIAS BIOLÓGICAS PROGRAMA DE PÓS-GRADUAÇÃO EM BIOLOGIA

VARIABILIDADE E HISTÓRIA EVOLUTIVA DO GENE HLA-E

LEANDRO PRADO FELÍCIO

GOIÂNIA-GO 2013

(2)

LEANDRO PRADO FELÍCIO

VARIABILIDADE E HISTÓRIA EVOLUTIVA DO GENE HLA-E

Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Biologia do Instituto de Ciências Biológicas da Universidade Federal de Goiás, como requisito parcial para obtenção do título de Mestre em Biologia.

Orientador: Prof. Dr. Erick da Cruz Castelli

GOIÂNIA-GO 2013

(3)

Dados Internacionais de Catalogação na Publicação na (CIP)

Felício, Leandro Prado.

Variabilidade e história evolutiva do gene HLA-E [manuscrito] / Leandro Prado Felício. - 2013.

77 f. : il.

Orientador: Prof. Dr. Erick da Cruz Castelli

Dissertação (Mestrado) – Universidade Federal de Goiás, Instituto de Ciências Biológicas, 2013.

Bibliografia.

Inclui lista de figuras, abreviaturas, siglas e tabelas.

(4)

LEANDRO PRADO FELÍCIO

VARIABILIDADE E HISTÓRIA EVOLUTIVA DO GENE HLA-E

BANCA EXAMINADORA

(5)

TERMO DE CIÊNCIA E DE AUTORIZAÇÃO PARA DISPONIBILIZAR AS TESES E

DISSERTAÇÕES ELETRÔNICAS (TEDE) NA BIBLIOTECA DIGITAL DA UFG

Na qualidade de titular dos direitos de autor, autorizo a Universidade Federal de Goiás (UFG) a disponibilizar, gratuitamente, por meio da Biblioteca Digital de Teses e Dissertações (BDTD/UFG), sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o documento conforme permissões assinaladas abaixo, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.

1. Identificação do material bibliográfico: [x] Dissertação [ ] Tese 2. Identificação da Tese ou Dissertação

Autor (a): Leandro Prado Felício E-mail: lpfelicio@hotmail.com

Seu e-mail pode ser disponibilizado na página? [x]Sim [ ] Não Vínculo empregatício do autor

Agência de fomento: Conselho Nacional de Desenvolvimento Científico e

Tecnológico Sigla: CNPq

País: Brasil UF: CNPJ:

Título: Variabilidade e história evolutiva do gene HLA-E.

Palavras-chave: Complexo Principal de Histocompatibilidade, Antígenos Leucocitários Humanos, HLA-E, polimorfismos, haplótipos Título em outra língua: Variability and evolutionary history of HLA-E gene.

Palavras-chave em outra língua: Major Histocompatibility Complex, Human Leukocyte Antigens, HLA-E, polymorphism, haplotypes. Área de concentração: Biologia Celular e Molecular

Data defesa: (dd/mm/aaaa) 31/01/2013 Programa de Pós-Graduação: Biologia Orientador (a): Erick da Cruz Castelli E-mail: erick.castelli@gmail.com 3. Informações de acesso ao documento:

Concorda com a liberação total do documento [ x ] SIM [ ] NÃO1

Havendo concordância com a disponibilização eletrônica, torna-se imprescindível o envio do(s) arquivo(s) em formato digital PDF ou DOC da tese ou dissertação.

O sistema da Biblioteca Digital de Teses e Dissertações garante aos autores, que os arquivos contendo eletronicamente as teses e ou dissertações, antes de sua disponibilização, receberão procedimentos de segurança, criptografia (para não permitir cópia e extração de conteúdo, permitindo apenas impressão fraca) usando o padrão do Acrobat.

________________________________________ Data: ____ / ____ / _____ Assinatura do (a) autor (a)

1

Neste caso o documento será embargado por até um ano a partir da data de defesa. A extensão deste prazo suscita justificativa junto à coordenação do curso. Os dados do documento não serão disponibilizados durante o período de embargo.

(6)

os meus pais, José Felício e

Joselita,

e

à

minha

namorada, Karla Georgia,

dedico...

(7)

unca deixe que alguém te diga

que não pode fazer algo. (...) Se

você tem um sonho, tem que

protegê-lo. As pessoas que não

podem fazer por si mesmas, dirão

que você não consegue. Se quer

alguma coisa, vá e lute por ela."

The Pursuit of Happyness

(8)

gradeço à Deus pela dádiva da vida. Aos meus pais pelo amor

incondicional, pelo afeto e pela educação que recebi: à minha mãe que por várias vezes se privou do próprio conforto para poder agradar teus filhos, que

sempre estava lá quando mais precisei, com quem sempre contei em todos os momentos da minha vida; à meu pai, que com seu jeito fechado, por vezes até sistemático, nunca nos deixou faltar nada, nos ofertando as oportunidades que a vida não lhe deu, projetando em seus filhos aquilo que gostaria de ter tido.

À minha namorada, Karla, pelo carinho, amor e pela compreensão perante os vários “hoje eu não posso, tenho que estudar”, “amor, esse final de semana eu tenho que analisar dados”, “tenho que ir para a universidade” e demais ‘nãos’ que me privaram do seu convívio em diversos finais de semana.

Ao meu orientador, Prof. Dr. Erick da Cruz Castelli, pela oportunidade de ingressar na pós-graduação, pelo voto de confiança que me deu ao me ofertar uma carta de orientação depois de umas duas semanas de convívio, pelo exemplo em pesquisa e pela paciência durante a sua orientação. Espero ter correspondido às expectativas em mim depositadas.

À meu irmão e tias por todo o apoio, suporte, energia positiva e por representarem meu porto seguro.

Aos meus queridos amigos de laboratório: Andréia, Athamy, Iane, Denise, Karla, Kaisson, Lais, Lya, Mariana, Moisés, Thállita e Thiago pelo convívio, pelo auxílio na bancada, pelos momentos de descontração e de ‘nerdices’ e por ajudar a fazer do laboratório uma extensão de minha casa.

À Dra. Luciana Caricati Veiga-Castelli, pelos auxílios metodológicos e por ceder, gentilmente, parte de seus dados para que meu trabalho pudesse ser feito.

À Profª. Dra. Lee Chen Chen por me ajudar a ingressar na pós-graduação me apresentando ao Prof. Erick e por me encorajar a não desistir de prestar a prova de mestrado, se hoje cheguei até aqui, devo muito disso à você, Lee.

Ao Prof. Dr. Paulo César Gedhini, por nos acolher tão bem e nos oferecer um espaço físico dentro do Laboratório de Farmacologia Bioquímica e Molecular.

Ao pessoal do laboratório de Biotecnologia da EMBRAPA em especial à Dra. Rosana, à Dra. Gesimária e à Esp. Paula, pelo auxílio com os sequenciamentos.

(9)

Aos meus antigos orientadores, Prof. Dra. Wanderlene Blanco Nunes e Prof. Dr. Salvador de Carvalho, por me ajudarem a dar os primeiros passos na vida acadêmica.

Ao Programa de Pós-Graduação em Biologia da Universidade Federal de Goiás e ao seu corpo docente pelos ensinamentos.

Aos membros da banca por se disporem a oferecer seu tempo para contribuírem com a minha formação.

Ao CNPq por fornecer o apoio financeiro e a bolsa de mestrado. E a todos aqueles que de forma direta ou indireta contribuíram para que meu trabalho pudesse ser concluído.

(10)

SUMÁRIO

LISTA DE FIGURAS... 12

LISTA DE TABELAS ... 13

LISTA DE ABREVIATURAS E SIGLAS... 14

RESUMO ... 15

ABSTRACT ... 16

1. INTRODUÇÃO ... 17

1.1. FUNCIONAMENTO E HISTÓRICO DO COMPLEXO PRINCIPAL DE HISTOCOMPATIBILIDADE HUMANO ... 17

1.2. GENE HLA-E... 23

1.3. PROJETO 1000GENOMES CONSORTIUM ... 27

2. OBJETIVOS ... 28

3. JUSTIFICATIVA ... 29

4. MATERIAL E MÉTODOS ... 30

4.1. AMOSTRAS BRASILEIRAS UTILIZADAS ... 30

4.2. DEFINIÇÃO DA REGIÃO 3’NT DO GENE HLA-E ... 30

4.3. REAÇÃO EM CADEIA DA POLIMERASE PARA AMPLIFICAÇÃO DO GENE HLA-E ... 31

4.4. PROCESSAMENTO DO PRODUTO AMPLIFICADO ... 32

4.5. REAÇÃO DE SEQUENCIAMENTO ... 33

4.6. ANALISE DAS SEQUÊNCIAS ... 36

4.7. ANÁLISE DOS DADOS DO PROJETO 1000GENOMES ... 37

4.8. AVALIAÇÃO DO PADRÃO DE DESEQUILÍBRIO DE LIGAÇÃO E INFERÊNCIA COMPUTACIONAL DE HAPLÓTIPOS ... 38

4.9. CONVERSÃO DE HAPLÓTIPOS EM ALELOS HLA-E ... 39

(11)

5.1. FREQUÊNCIAS ALÉLICAS, GENOTÍPICAS E ADERÊNCIA AO EQUILÍBRIO DE HARDY-WEINBERG ... 41 5.2. DESEQUILÍBRIO DE LIGAÇÃO ... 49 5.3. DIVERSIDADE, FREQUÊNCIA E RELAÇÕES ENTRE OS HAPLÓTIPOS . 51 6. DISCUSSÃO ... 60 7. REFERÊNCIAS ... 72

(12)

LISTA DE FIGURAS

Figura 1 Estrutura da região do MHC humano, representando os genes MHC de classe I, II e III. Em destaque o gene HLA-E, alvo do presente estudo ... 21

Figura 2 Esquema resumido do funcionamento do MHC de classe I ... 22

Figura 3 Gel de agarose 1% corado com brometo de etídio e visualizado com luz UV ... 32

Figura 4 Esquema resumido do mapa cromossômico dos genes do complexo HLA, em destaque o gene HLA-E ... 35

Figura 5 Área de cobertura de cada iniciador utilizado para o sequenciamento da região 3’ não-traduzida do gene HLA-E, considerando-se 450 pb para cada primer ... 35

Figura 6 Exemplo de resultado dos sequenciamentos ... 37

Figura 7 LD entre os pares de SNPs no gene HLA-E . A imagem foi gerada pelo programa Haploview usando SNPs com frequência ≥ 1% ... 50

Figura 8 Rede de haplótipos ilustrando as relações entre os 33 haplótipos (Tabela 8) encontrados em populações mundiais ... 57

Figura 9 Alinhamento das sequências do gene humano HLA-E com o seu ortólogo em primatas MHC-E e a sequência padrão do elemento AluY ... 68

Figura 10 LD entre os pares de SNPs no gene HLA-G. A imagem foi gerada pelo programa Haploview usando SNPs com frequência ≥ 1% ... 70

(13)

LISTA DE TABELAS

Tabela 1 Número de alelos identificados para os principais genes HLA de classe I e II (IMGT - International Immunogenetics Database 3.10, outubro de 2012) ... 19

Tabela 2 Reagentes e concentrações para a reação de PCR para o gene HLA-E ... 31

Tabela 3 Reagentes e concentrações utilizadas na reação de sequenciamento (para uma corrida utilizando um primer específico) ... 34

Tabela 4 Pontos de variação do gene HLA-E e suas frequências em diferentes populações do projeto 1000Genomes e em uma amostra brasileira ... 44

Tabela 5 Índices de diversidade nucleotídica do gene HLA-E para a região codificadora, 3’ NT e ambas as regiões juntas considerando as populações do projeto 1000Genomes e as amostras Brasileiras ... 46

Tabela 6 Aderência das frequências do genótipos ao Equilíbrio de Hardy-Weinberg considerando as populações do projeto 1000Genomes e as amostras Brasileiras ... 47

Tabela 7 Frequência relativa d os 33 haplótipos encontrados para o gene HLA-E considerando-se os dados do projeto 1000Genomes e as amostras brasileiras ... 53

Tabela 8 Tabela 8: Haplótipos encontrados considerando os pontos de variação presentes nas sequências genômicas que codificam a porção externa na molécula HLA-E (éxons 1-4, incluindo os íntrons) e região 3’ NT do mRNA de HLA-E (incluindo o íntron 7) ... 55

(14)

LISTA DE ABREVIATURAS E SIGLAS

.vcf % µL APC EDTA HLA IMGT Kb LTA Mb MAF MHC miRNA mL mRNA ng NK NT ºC Pb PCR SNP SP TCR TNF UTR UV V

Virtual Business Card (Cartão de Visita Virtual) Por cento

Microlitro (10-6 litro)

Célula Apresentadora de Antígeno Acido Etileno Diamino Tetracético Antígeno Leucocitário Humano

ImMunoGeneTics information system Kilobase (103 bases)

Linfotoxina alfa

Megabase (106 bases)

Minimum allele frequency (Frequência alélica mínima)

Major Histocompatibility Complex (Complexo Principal de Histocompatibilidade)

MicroRNA

Mililitro (10-3 Litro) RNA mensageiro

Nanograma (10-9 grama) Células Natural Killer Não traduzida

Graus Celsius Pares de bases

Reação em Cadeia da Polimerase Polimorfismo de Base Única São Paulo

Receptor de Célula T Fator de Necrose Tumoral Untranslated region

Ultra Violeta Volts

(15)

RESUMO

O loco HLA-E é um gene do Complexo Principal de Histocompatibilidade Humano (MHC), cujo produto está relacionado com a modulação e supressão da resposta imunitária por meio da interação com receptores específicos das células NK e linfócitos T. O gene HLA-E é considerado o loco menos polimórfico dos genes do complexo HLA, no entanto, esta baixa variabilidade pode ser uma consequência do pequeno número de estudos realizados sobre esse tema. No presente trabalho, a variabilidade das regiões codificadoras e 3’ não traduzida do gene HLA-E foi analisada em amostras brasileiras e os resultados foram comparados com dados obtidos pelo projeto 1000Genomes. Considerando todas as populações avaliadas, apenas 28 pontos de variação foram encontrados em uma região de aproximadamente 2724-pb. Estes pontos de variação estão arranjados em 33 haplótipos diferentes, a maioria deles (98%) codificando uma das duas moléculas HLA-E frequentemente encontradas, E*01:01 e E*01:03. Ainda, 85% dos haplótipos encontrados foram representados por apenas três sequências diferentes, cada uma deles associada a um dos principais alelos da região codificadora do gene HLA-E, E*01:01:01, E*01:03:01 e E*01:03:02. Todas essas sequências foram encontradas em todas as populações avaliadas. Este fenômeno, em conjunto com as comparações envolvendo sequências de primatas, sugere que estes dois grupos de alelos principais (e moléculas) surgiram antes da especiação e dispersão humana, além de indicar que o alelo E*01:03:01 pode ser o mais antigo dentre os demais. Ainda, a baixa diversidade nucleotídica encontrada para a região codificadora e 3' NT do gene HLA-E em populações de todo o mundo sugere que este gene é, de fato, bastante conservado, provavelmente devido ao seu papel chave na modulação das respostas imunes.

Palavras-Chave: Complexo Principal de Histocompatibilidade, Antígenos Leucocitários Humanos, HLA-E, polimorfismos, haplótipos.

(16)

ABSTRACT

The HLA-E locus is a Human Major Histocompatibility Complex (MHC) gene associated with immune-modulation and suppression of the immune response by the interaction with specific NK and T cell receptors. The HLA-E gene is considered the most conserved locus in the human HLA; however, this low variability might be a consequence of the scarce number of studies focusing this subject. In this mastering thesis we assessed the HLA-E coding and 3’ untranslated region variability in a group of individuals from Brazil and the results were evaluated together with data from the 1000Genomes Consortium. Altogether, only 28 variation sites were found in approximately 2724 bp evaluated. These variation sites were arranged into 33 haplotypes, most of them (98.2%) encoding one of the two HLA-E molecules found worldwide, i.e., the molecules associated with the allele groups E*01:01 and E*01:03. Interestingly, 85% of all haplotypes were represented by only three different sequences, each of them associated with one of the main known HLA-E coding alleles, E*01:01:01, E*01:03:01 and E*01:03:02, all of them found worldwide. This phenomenon, together with the comparisons with other primate sequences, reveals that these two main allele groups (and molecules) arose early before human speciation, and indicates that E*01:03:01 might be the oldest allele. In addition, the low nucleotide diversity found for the HLA-E coding and 3’UTR in worldwide populations suggests that the HLA-E gene is in fact a conserved gene, which might be a consequence of its key role in the modulation of the immune system.

Key Words: Major Histocompatibility Complex, Human Leukocyte Antigens, HLA-E,

(17)

1. INTRODUÇÃO

1.1. FUNCIONAMENTO E HISTÓRICO DO COMPLEXO PRINCIPAL DE HISTOCOMPATIBILIDADE HUMANO

Os linfócitos T são uma importante linha de defesa contra microrganismos e formação de células tumorais, bem como a principal via de destruição de células infectadas por algum agente patogênico. Esta propriedade das células T se deve à sua capacidade de avaliar a procedência dos fragmentos proteicos que são apresentados na superfície de cada célula do organismo. Dessa forma, o linfócito T pode desencadear uma resposta específica quando do reconhecimento de proteínas estranhas ao organismo, interagindo com outras células do sistema imunitário, tais como linfócitos B, células dendríticas e macrófagos (Abbas et al., 2010). No entanto, para que a célula T possa reconhecer um antígeno na superfície celular, este fragmento proteico deve estar associado a uma glicoproteína transmembrânica que acomoda este peptídeo e o apresenta na superfície celular (Klein e Sato, 2000a; b)

Em humanos e na maioria dos organismos, estas proteínas transmembrânicas são codificadas pelos genes do complexo principal de histocompatibilidade, o MHC (do inglês Major Histocompatibility Complex).

A descoberta do MHC ocorreu durante ensaios com transplantes de tecido alogênico de camundongos em experimentos realizados por George Snell e colaboradores na década de 40 (Abbas et al., 2010). Em seus estudos, eles utilizaram linhagens que foram intercruzadas por 20 gerações a fim de se produzir indivíduos geneticamente idênticos pertencentes a dois grupos diferentes, com características genéticas distintas um do outro. Cirurgicamente, o tecido da pele dos camundongos pertencentes às duas amostras foi transplantado para outros indivíduos singênicos e alogênicos. Após a recuperação, notava-se que a rejeição ocorria apenas no segundo grupo, indicando uma possível participação das proteínas de compatibilidade do MHC no reconhecimento e resposta imunitária por parte do organismo (Abbas et al., 2010).

Em humanos a identificação do MHC ocorreu por Jean Dausset, Jon van Rood e Rose Payne em 1958. Os três pesquisadores trabalhavam com identificação de anticorpos em soro humano de pacientes que receberam múltiplas transfusões. O

(18)

crédito da descoberta do primeiro antígeno leucocitário humano, ou HLA (do inglês human leukocyte antigen), e por consequência do MHC humano, foi atribuída ao francês Jean Dausset, que recebeu um prêmio Nobel em 1980 (Thorsby, 2009).

As moléculas expressas pelo MHC tem função importante na resposta imunológica, sendo relacionadas à seleção de células T, respostas inflamatórias, indução de tolerância, produção de anticorpos e imunidade mediadas pelas células T (Parkin e Cohen, 2001). Alguns estudos sugerem que o polimorfismo do MHC pode influenciar na escolha do parceiro sexual na espécie humana e em outros mamíferos (Wedekind et al., 1995; Jacob et al., 2002).

Em nossa espécie, o MHC é composto por aproximadamente 224 genes que se estendem por cerca de 3,6 megabases (Mb) do cromossomo 6 (6p21.3) (Klein e Sato, 2000b). Os alelos de muitos desses genes guardam a informação para a síntese das proteínas que fazem parte do sistema de reconhecimento e apresentação de antígenos pelos linfócitos T (Setterfield et al., 2001).

Didaticamente, o MHC é subdividido em três regiões distintas, denominadas classe I, II e III (Figura 1) (Horton et al., 2004), sendo que os genes de classe I e II codificam proteínas envolvidas com a resposta imunitária e apresentação antigênica (Klein e Sato, 2000b). As moléculas HLA de classe I são glicoproteínas, formadas por três domínios extracelulares, α1, α2 e α3, um domínio transmembrana e um domínio citoplasmático, formando uma cadeia pesada. Esta cadeia se associa a uma cadeia leve, a β2 microglobulina, que ajuda a estabilizar o complexo, permitindo seu transito para a superfície celular (Klein e Sato, 2000a). Junto a este complexo são ligados pequenos fragmentos de proteínas citoplasmáticas que foram processados pelo proteassomo e encaminhadas ao retículo endoplasmático, onde o complexo proteico da molécula do MHC com seus epítopos específicos são montados. Posteriormente o complexo formado é encaminhado para a superfície celular e apresentado às células de resposta imunológica (Yewdell et al., 2003; Klein e Sato, 2000a) (Figura 2). Na região de classe I encontram-se os locos clássicos (Ia): HLA-A, -B e -C, que expressam moléculas presentes na superfície da maioria das células nucleadas (Klein e Sato, 2000b).

Além dos genes clássicos, a região de classe I exibe a fração Ib, denominados locos não-clássicos: HLA-G, HLA-E e HLA-F. Apesar da homologia molecular e estrutural entre os genes de ambas as classes, suas funções, padrões

(19)

de expressão e níveis de polimorfismos são distintos (Tabela 1). Enquanto que os genes da classe Ia são expressos em quase todos os tecidos, os genes não-clássicos apresentam expressão celular restrita. A expressão dos genes de classe II se restringe aos linfócitos B, células apresentadoras de antígeno (APCs), monócitos/macrófagos e células dendríticas (Fischer e Mayr, 2001). As moléculas de classe I e II são sintetizadas no retículo endoplasmático rugoso, onde se associam a peptídeos antigênicos em seus “sítios de ligação a peptídeos”. Transportadas à superfície celular, interagem com o complexo receptor de células T (TCR).

Mais de 60 dos 224 genes identificados no MHC humano estão dispostos entre essas duas regiões e consistem o MHC central ou região de classe III (Figura 1), onde estão codificados alguns elementos do sistema complemento e genes como TNF (Fator de Necrose Tumoral) e LTA (Linfotoxina Alpha) (Klein e Sato, 2000b; Undlien et al., 2001; Horton et al., 2004).

Tabela 1. Número de alelos identificados para os principais genes HLA de classe I e

II (IMGT - International Immunogenetics Database 3.10, outubro de 2012).

CLASSE I CLASSE II

Loco Alelos Loco Alelos

Clássicos (Ia) HLA-DRA cadeia α do HLA-DR 7

HLA-A 2132 HLA-DRB cadeia β1 do HLA-DR 1297

HLA-B 2798 HLA-DQA1 cadeia α do HLA-DQ 49

HLA-C 1672 HLA-DQB1 cadeia β do HLA-DQ 179

HLA-DPA1 cadeia α do HLA-DP 36 Não-Clássicos (Ib) HLA-DPB1 cadeia β do HLA-DP 158

HLA-E 11 * HLA-DOA cadeia α do HLA-DO 12

HLA-F 22 HLA-DOB cadeia β do HLA-DO 13

HLA-G 50 ** HLA-DMA cadeia α do HLA-DM 7

HLA-DMB cadeia β do HLA-DM 13

*Um desses alelos, E*01:03:05, foi identificado em trabalho prévio do grupo (Veiga-Castelli et al., 2012a).

**Quatro desses alelos, G*01:09, G*01:01:11, G*01:01:03:03 e G*01:01:21, foram identificados em trabalhos prévios do grupo (Castelli et al., 2007a; Castelli et al., 2007b; Castelli et al., 2012).

Devido ao seu grande polimorfismo, o maior dentre o genoma humano (Apanius et al., 1997; Hughes e Yeager, 1998; Penn et al., 2002), os genes do MHC humano possuem frequências alélicas distintas em diferentes populações. Muitos

(20)

estudos apoiam a hipótese de que essa diversidade alélica no MHC de vertebrados é mantida por meio de seleção balanceadora mediada por microorganismos. A variação nos sítios de ligação de peptídeos tem sido considerada a principal responsável pela habilidade dos genes de classe I e II de apresentar antígenos de diversos patógenos (Apanius et al., 1997; Hughes e Yeager, 1998; Penn et al., 2002; Bernatchez e Landry, 2003).

(21)

Figura 1. Estrutura da região do MHC humano, representando os genes MHC de classe I, II e III. Em destaque o gene HLA-E, alvo do presente estudo. (Shiina et al., 2009)

(22)

Figura 2. Esquema resumido do funcionamento do MHC de classe I (Yewdell et al., 2003).

No entanto, a capacidade de cada variante do MHC de acomodar peptídeos específicos tem sido estudada como um dos motivos que explicam a razão pela qual algumas variantes MHC estão associadas com susceptibilidade a doenças autoimunes e neoplásicas. Para tumores, por exemplo, postula-se que tipos parecidos de lesões expressam antígenos tumorais semelhantes e que algumas variantes MHC não seriam capazes de apresentar peptídeos oriundos de tais antígenos, pré-dispondo o indivíduo ao desenvolvimento de determinada neoplasia por falha da imunovigilância tumoral. A grande diversidade genética encontrada no

(23)

HLA faz com que haja uma diferença na predisposição a enfermidades comparando-se grupos geneticamente distintos, fato este evolutivamente importante, pois torna mais difícil a ocorrência de grandes epidemias que poderiam dizimar a espécie (Van Rood, 1993).

São reconhecidos atualmente mais de 6725 alelos ou haplótipos distintos para os genes de classe I (IMGT - http://www.ebi.ac.uk/imgt/hla/), Tabela 1. Diversos estudos demonstraram a seleção a favor da variabilidade nos genes de classe Ia, que seriam os responsáveis pela manutenção da resposta imunitária adaptativa como descrito anteriormente (Sabeti et al., 2006). No entanto, a variabilidade dos genes da região Ia em humanos é tamanha que a possibilidade de existir dois indivíduos idênticos para todos os polimorfismos de MHC (mesmo que considerando apenas os funcionais) é muito remota. Nas espécies até hoje estudadas, essa variabilidade é interessante considerando a resistência a patógenos. Por outro lado, a necessidade de realização ocasional de enxertos alogênicos (transplantes) em humanos, torna essa variabilidade prejudicial, pois a compatibilização desses polimorfismos é necessária para uma boa aceitação do enxerto (Vannas et al., 1976; Suciu-Foca et al., 1996; Slavcev, 2012)

Em uma molécula HLA de classe I clássica e classe II o polimorfismo está praticamente confinado aos sítios de ligação de peptídeos. Moléculas codificadas por diferentes alelos de um mesmo loco HLA apresentam diferentes sítios de ligação a peptídeos, sendo esses domínios caracterizados pela presença de resíduos polimórficos. Este polimorfismo é a razão da especificidade de ligação de cada molécula HLA a determinados peptídeos antigênicos, e a verificação desses polimorfismos é frequentemente realizada em genotipagem de HLA (Thorsby, 1997).

Por outro lado, a variabilidade dos genes não-clássicos de classe I é reduzida (Tabela 1). Embora estes genes sejam estruturalmente semelhantes aos genes clássicos (e provavelmente originaram-se de um mesmo ancestral), a função principal dos genes não-clássicos não é de apresentação antigênica. Os genes HLA-G e HLA-E, por exemplo, participam da modulação das respostas imunitárias, em especial durante a gestação (Arnaiz-Villena et al., 2007; Donadi et al., 2011).

(24)

Em contraste com os genes da região Ia do MHC, os genes não clássico (Ib) apresentam polimorfismo limitado e são predominantemente expressos em tecidos que exigem imunotolerância, principalmente na barreira placentária (Moscoso et al., 2006). Em humanos, existem três genes descritos considerados da classe Ib, HLA-E, -F e -G (Pyo et al., 2006). Estes genes foram descobertos por Geraghty e colaboradores entre 1987 e 1990 (Geraghty et al., 1987; Koller et al., 1988; Ishitani et al., 2006).

O gene HLA-E produz uma molécula estruturalmente semelhante aos genes clássicos, mas cuja função principal não é apresentação antigênica. Ainda, diferentemente de outras moléculas de classe Ib, como o gene HLA-G, sua expressão ocorre na maioria dos tecidos em níveis mais baixos do que as moléculas Ia clássicas. Originalmente conhecida por seu papel na imunidade inata, acredita-se agora que a molécula HLA-E desempenhe um papel mais amplo, atuando como um ligante para células T. Além disso, evidências recentes sugerem um papel do HLA-E na aceitação do enxerto (Sullivan et al., 2008).

A molécula HLA-E interage com os receptores CD96-NKG2A, B e C de células Natural Killer (NK) (Braud et al., 1997), originando sinais inibitórios (NKG2A) e suprimindo a atividade da célula NK, ou ativando a resposta citolítica (NKG2C) em situações como infecções virais (Gao et al., 2000). O gene HLA-E reconhece ainda o receptor TCR (T Cell Receptor) de células T CD8, inibindo sua citotoxicidade (Garcia et al., 2002).

Após a descoberta dos genes da classe Ib, muito foco foi dado ao gene HLA-G, o que resultou em um vasto conhecimento de sua biologia (Ishitani et al., 2003). No entanto, em relação aos outros genes não-clássicos, as informações disponíveis ainda são escassas. Acredita-se que parte da ação tolerogênica mediada pelo gene E depende da expressão prévia do gene G, uma vez que a molécula HLA-E necessita do peptídeo líder oriundo do gene HLA-G para sua estabilização na superfície celular (Braud et al., 1997; Lee et al., 1998).

O gene HLA-E é o menos polimórfico de todos os genes HLA de classe I, apresentando um grau de polimorfismo muito mais limitado do que os locos clássicos de classe I ou que qualquer outro gene não-clássico de classe I (Tabela 1). Em um estudo com 371 indivíduos de seis diferentes grupos étnicos (Arnaiz-Villena et al., 2007) apenas 3 alelos HLA-E distintos foram detectados, codificando somente

(25)

2 moléculas distintas, apoiando a ideia de polimorfismo restrito do HLA-E. Até o momento, foram reconhecidos em populações humanas apenas onze alelos HLA-E codificando três diferentes proteínas (http://www.ebi.ac.uk/imgt/hla/), contrastando com os mais de 2000 alelos para os genes clássicos para um mesmo loco.

Em um estudo recente realizado no Brasil (Veiga-Castelli et al., 2012b), 104 doadores saudáveis de medula óssea e selecionados aleatoriamente foram avaliados quanto à variabilidade da região codificadora do HLA-E, compreendendo a região dos éxons 1 a 4 (incluindo íntrons). Neste estudo, foi encontrado um pequeno número de alelos, gerando apenas três moléculas HLA-E distintas. Embora entre brasileiros um outro alelo codificando uma nova proteína tenha sido encontrado, a frequência desta variante não ultrapassou 1%, sendo portanto uma variante rara. Foram encontradas principalmente duas moléculas HLA-E, denominadas E*01:01 e E*01:03, com frequências similares em torno de 50% cada (Veiga-Castelli et al., 2012b). Ambas as moléculas encontrados no Brasil e em outras populações apresentam uma substituição de uma Arginina, um aminoácido grande, por uma Glicina, um aminoácido pequeno, na posição 107, o que poderia modificar a estrutura da molécula. Funcionalmente, estudos demonstraram que a molécula portando glicina estaria relacionada com níveis maiores de expressão de HLA-E, maior afinidade por peptídeos e uma maior estabilidade do complexo HLA-E/peptídeo (O'callaghan et al., 1998; Ulbrecht et al., 1999; Strong et al., 2003; Pietra et al., 2010). Desta forma, o alelo E*01:03 (HLA-E107gli) tem sido associado com uma maior estabilidade, maior expressão e potencialmente efeitos inibitórios de células NK mais potentes (Sullivan et al., 2008; Di Cristofaro et al., 2011).

Considerando as propriedades imunomodulatórias do HLA-E, um certo grau de invariabilidade na molécula é de fato esperado, o que forneceria um mecanismo preciso de regulação do sistema imunológico; no entanto, é interessante observar que evidências de seleção balanceadora também foram encontradas no éxon 3 que codifica a referida substituição de aminoácidos (Veiga-Castelli et al., 2012b) o que justificaria a elevada frequência de ambos os alelos em todas as populações já estudadas. Sendo que o polimorfismo na posição 107 é encontrado mundialmente, conclui-se que esta variação é uma mutação que deve ter ocorrido antes da migração da espécie humana à partir da África. Aparentemente, a presença de ambas as moléculas parece ser benéfica embora os mecanismos ainda não estejam

(26)

claros. De um lado, a presença de uma molécula mais estável e de maior capacidade de inibição de células NK, juntamente com outra molécula não tão eficaz, seria benéfica por adaptar o indivíduo às várias necessidades de HLA-E que ele pode vir a enfrentar. No entanto, isto é particularmente difícil de inferir no momento, uma vez que poucos estudos funcionais foram realizados com ambas as moléculas. Por outro lado, esta alta heterozigose poderia ser um efeito carona associado com polimorfismos das regiões regulatórias que de fato estariam sofrendo a ação de seleção balanceadora, assim como observado para o gene HLA-G (Castelli et al., 2011), porém praticamente nenhum dado está disponível quanto à estrutura e diversidade das regiões regulatórias para o gene HLA-E. De fato, apenas a porção proximal da região promotora (aproximadamente 300pb imediatamente anterior ao início do exon 1) encontra-se nos bancos de dados públicos e mostrou-se pouco polimórfica, com apenas dois casos conmostrou-secutivos de uma deleção de bamostrou-se única (posições -187 e -186) detectadas em apenas um dos onze alelos HLA-E (E*01:01:01:02) (http://www.ebi.ac.uk/imgt/hla/align.html).

Em relação à região 3’ não-traduzida (3’NT), pouco se sabe sobre a variabilidade e as forças evolutivas que atuam nesta região. Por meio de um alinhamento de sequências de mRNA obtidas nos bancos públicos, foi detectado que a região 3’NT do gene HLA-E possui aproximadamente 1460-pb, i.e., uma sequência muito maior do que a encontrada em genes não-clássicos mais conhecidos como o HLA-G (Castelli et al., 2010; Castelli et al., 2011). Um estudo in silico demonstrou que a maioria dos polimorfismos de HLA-G na região 3’NT poderiam influenciar a ligação de microRNAs humanos e atuar diretamente no controle pós-transcricional da expressão desse gene (Castelli et al., 2009).

Considerando-se que (a) ambas as moléculas HLA-G e HLA-E possuem similaridade funcional (inibição da ação de células T e NK), (b) ambos estão sob um rígido controle da expressão gênica quanto à quantidade, local e momento em que as moléculas estão sendo produzidas, (c) polimorfismos na região 3’NT poderiam influenciar a ligação de microRNAs e a estabilidade do mRNA, (d) não há estudos que avaliaram a variabilidade dos gene HLA-E, em especial suas sequências regulatórias, em escala mundial e (e) não há dados acerca da história evolutiva do gene HLA-E, a caracterização da variabilidade deste gene torna-se necessária para uma melhor compreensão dos mecanismos que controlam a expressão de HLA-E e

(27)

sua história evolutiva. A análise da variabilidade e estrutura da região 3’NT do gene HLA-E em uma população miscigenada como a brasileira, comparando estes achados com dados mundiais (como aqueles do projeto 1000Genomes), poderá contribuir para o entendimento da estrutura dessa região e funcionamento deste gene. Ainda, os estudos dos polimorfismos da região 3’NT deste gene podem servir de base para estudos futuros de afinidade por microRNAs conhecidos, o que poderá elucidar em parte os mecanismos de controle da expressão deste gene, além de direcionar estudos funcionais aplicados na tentativa de modular a expressão deste potente imunossupressor.

1.3. PROJETO 1000GENOMES CONSORTIUM

O projeto 1000Genomes (The 1000Genomes Project Consortium, 2010; 2012) é um consórcio internacional que, utilizando técnicas de sequenciamento de nova geração, avaliou o genoma completo de 1.092 indivíduos oriundos de 14 populações diferentes. A comparação dos dados obtidos em diferentes indivíduos e com sequenciamento do genoma completo de todos estes indivíduos torna-se uma valiosa fonte para estudos de associação e identificação de genes candidatos para diferentes doenças (Harrow et al., 2012), resposta individual e metabolização de fármacos (Allen, 2005) e padrões de diversidade gênica ao longo de diferentes populações. Neste aspecto, o sequenciamento em larga escala de diferentes indivíduos pode gerar dados mais completos e complementares aos dois consórcios iniciais que se propuseram a sequenciar o genoma humano de poucos indivíduos (International Human Genome Sequencing Consortium, 2001; Venter et al., 2001; Venter, 2003; International Human Genome Sequencing Consortium, 2004).

Em nenhum dos projetos de sequenciamento completo do genoma humano a população brasileira foi analisada. Neste aspecto a população brasileira torna-se uma excelente fonte de estudos, tendo em vista que esta constitui uma das populações mais heterogêneas do mundo, fruto de mais de cinco séculos de miscigenação entre as populações de quatro diferentes continentes: 1) Americano: população nativa de ameríndios; 2) Africano: escravos vindos para o Brasil entre o século 16 e o ano de 1850; 3) Europeu: principalmente portugueses que colonizaram o Brasil, seguidos por italianos, espanhóis e alemães (Pimenta et al., 2006); 4)

(28)

Asiático: japoneses que chegaram ao Brasil principalmente no período pós 2ª Guerra Mundial. O estudo da variabilidade do gene HLA-E em uma população tão miscigenada como a brasileira, comparados aos dados obtidos pelo 1000Genomes Project, pode contribuir para elucidar a importância funcional, as relações evolutivas e fornecer dados concisos para se esclarecer os mecanismos de regulação do gene HLA-E.

2. OBJETIVOS

O objetivo geral deste trabalho é avaliar a diversidade genética do gene HLA-E para as regiões codificadora e 3’ não-traduzida (NT) do gene HLA-HLA-E na população brasileira e correlacionar os resultados obtidos com os dados obtidos no projeto 1000Genomes para as mesmas regiões, o que permitirá atingir os seguintes objetivos específicos:

• caracterizar a variabilidade do gene HLA-E na população brasileira, correlacionando com os dados do projeto 1000Genomes;

• identificar novos sítios polimórficos nas regiões avaliadas;

• caracterizar a variabilidade da região codificadora e 3’NT do gene HLA-E em brasileiros e o perfil de haplótipos desta região;

• avaliar a intensidade do desequilíbrio de ligação (LD) entre as regiões codificadora e 3’NT;

(29)

3. JUSTIFICATIVA

Como visto anteriormente, a expressão de genes HLA não-clássicos (HLA-G e HLA-E) está relacionada a mecanismos de imunotolerância, em especial durante a gestação, escape da imunovigilância em tumores e tolerância à aloenxertos, por mecanismos inibitórios de CTL e células NK. O gene HLA-E, em especial, é capaz de ativar ou inibir uma resposta imunitária, dependendo do peptídeo associado a ele e ao receptor que ele interagir.

Em estudos anteriores, percebeu-se que o gene HLA-E é um gene conservado no Brasil e que as regiões regulatórias de outros genes não-clássicos, como o HLA-G, possuem uma alta variabilidade e heterozigosidade, mantida por seleção balanceadora. Não há estudos que caracterizaram a variabilidade do gene HLA-E em escala mundial, bem como nenhum estudo definiu a variabilidade de sua região 3’NT ou correlacionou sua importância com o padrão de expressão de HLA-E. Considerando-se que ambas as mol culas HLA-G e HLA-E possuem similaridade funcional (inibição da ação de c lulas T e N ), e o fato de que a região 3’NT do HLA-E é muito mais extensa do que a mesma região em outros genes de classe I, polimorfismos nesta região poderiam influenciar sobremaneira o perfil de expressão deste outro imuno-supressor pouco explorado. Dessa forma, a caracterização da variabilidade de HLA-E torna-se necessária para uma melhor compreensão dos mecanismos que controlam a expressão deste gene e para a compreensão de sua história evolutiva.

(30)

4. MATERIAL E MÉTODOS

4.1. AMOSTRAS BRASILEIRAS UTILIZADAS

Foram utilizadas amostras de potenciais doadores de medula óssea não-relacionados, selecionado de forma aleatória, oriundos do Hemocentro de Ribeirão Preto - SP. Estas amostras foram utilizadas em estudos prévios que avaliaram a variabilidade de outros genes do complexo HLA, incluindo os genes HLA-A, HLA-B, HLA-C, HLA-DRB1 e HLA-G, realizados pelo grupo (Castelli et al., 2009; Castelli et al., 2010; Castelli et al., 2011) e em um estudo sobre a variabilidade da região codificadora do gene HLA-E (Veiga-Castelli et al., 2012b). Este protocolo experimental foi aprovado pelo comitê de ética em pesquisa da FMRP-USP (Protocolo 12398/2004), autorizando sua utilização para estudos envolvendo a variabilidade dos genes HLA-G, HLA-E e HLA-F, estando as amostras disponíveis para estudo. O grupo estudado constituiu de 104 indivíduos sadios, não-relacionados, residentes na região de Ribeirão Preto, estado de São Paulo. Os dados dos polimorfismos da região codificadora foram gentilmente cedidos pela Dra. Luciana Caricati Veiga-Castelli, que em seu estudo avaliou a variabilidade da região codificadora (éxons 1-4, incluindo os íntrons) do gene HLA-E neste mesmo conjunto amostral (Veiga-Castelli et al., 2012b).

4.2. DEFINIÇÃO DA REGIÃO 3’NT DO GENE HLA-E

A região 3’ NT do gene HLA-E foi definida por meio de um alinhamento de sequências de mRNA obtidas no Genbank (http://www.ncbi.nlm.nih.gov/genbank/) -Números de acesso AK292391, BC002578, NM_005516 e X56841; e de DNA - NT_167249 e NT_113891.2. Desta forma, detectou-se que a região 3’ NT do mRNA de HLA-E possui aproximadamente 1460-pb de extensão. A região genômica responsável pela transcrição desta 3’ NT possui uma extensão de 1624-pb, pois ocorre a presença de um íntron que é excisado durante o processo de edição do mRNA.

(31)

4.3. REAÇÃO EM CADEIA DA POLIMERASE PARA AMPLIFICAÇÃO DO GENE HLA-E

A amplificação da região de interesse foi realizada por meio de uma reação em cadeia da polimerase (PCR – do inglês Polymerase Chain Reaction). Para a reação de PCR foram utilizados os iniciadores HE01F - TCCTGGATACTCATGACGCAGACTC (Grimsley et al., 2002) e HE3UTR.R1 - GGACTCCCTGGGCTTTCTCACCG, especificamente desenhado para este estudo. O amplicon gerado possui 5046-pb abrangendo parte da região promotora do gene HLA-E, toda a região codificadora e a região 3’NT.

A PCR foi realizada em um volume final de 50 µL, utilizando-se uma DNA Polimerase para amplificações longas, denominada Taq Long (Fermentas - Vilnius, Lituânia). Os reagentes utilizados para a PCR foram misturados em tubo separado em quantidades específicas conforme a Tabela 2. Em cada tubo para PCR de 0,2 mL, previamente identificado, foi adicionado 49 µL da mistura de reagentes (Tabela 2) e mais 1 µL de amostra de DNA diluído a 100 ng/uL. Em cada reação realizada, um controle negativo contendo apenas os reagentes (sem DNA) foi adicionado com o objetivo de confirmar a ausência de contaminação dos componentes da PCR.

Tabela 2: Reagentes e concentrações utilizadas para a amplificação do gene

HLA-E.

Componentes da Reação [ ] Solução de

Uso 1 x (uL) Concentração Final Água - 34,20 - PCR Buffer – Long 10X 5,00 1,00 X Sal - MgCl2 25 mM 3,50 1,75 mM dNTPs 5 mM 2,00 0,20 mM Iniciador 1F - HE01F 10 pM 2,00 0,40 µM Iniciador 1R - HE3UTR.R1 10 pM 2,00 0,40 µM DNA Polimerase – Long 5 U/µL 0,30 1,50 U

Volume total - 49,00 -

(32)

A ciclagem de temperaturas utilizada foi: (a) 94º C de desnaturação inicial por 3 minutos, (b) 30 ciclos de 94º C de desnaturação por 30 segundo, 60º C de temperatura de anelamento por 30 segundos, 68º C de temperatura de extensão por 6 minutos e (c) uma extensão final de 10 minutos a 68º C. O produto de PCR foi armazenado em freezer -20ºC até o momento de sua utilização conforme descrito adiante.

A amplificação das amostras foi avaliada em gel de agarose a 1% corado com brometo de etídio. Para cada amostra foi aplicado um volume de 7 µL de produto de PCR junto com 2 µL de tampão de carregamento 6x Loading Dye™ (Fermentas – Vilnius, Lituânia).

A eletroforese foi realizada em uma cuba de eletroforese com voltagem fixada em 90 V, durante 1 hora. Os géis foram expostos à luz ultravioleta (UV) e posteriormente fotografadas em um fotodocumentador. Em cada corrida foi adicionada uma escada alélica GeneRuler™ (Fermentas – Vilnius, Lituânia) com tamanho específico para conferência do tamanho aproximado dos produtos de amplificação gerados pela reação de PCR, bem como foi adicionado o controle negativo como um parâmetro de ausência de contaminação.

Figura 3. Gel de agarose 1% corado com brometo de etídio e visualizado com luz UV. Corrida 1: marcador molecular de peso conhecido, variando de 100 pb a 5000 pb. Corridas de 2 a 11: amostras adequadamente amplificadas. Corrida 12: controle negativo sinalizando ausência de contaminação.

(33)

As amostras amplificadas e checadas no gel de agarose foram purificadas com o kit comercial Illustra™ GFX™ PCR DNA and gel band purification (GE HelthCare® - Buckinghamshire, Reino Unido) para eliminação dos resíduos de dNTPs não incorporados, DNA polimerase e outros constituintes da reação de PCR. O produto pós purificação foi eluído em água ultrapura autoclavada. Em seguida, as amostras foram quantificadas com o uso do equipamento Qubit® 2.0 Fluorometer Quantitation (Invitrogen - Eugene, Estados Unidos). O método faz uso de um fluoróforo especifico para DNA, ligando-se à dupla fita e emitindo fluorescência, que é detectada pelo aparelho e convertida em uma quantificação de DNA presente em cada amostra. Para a quantificação foi utilizado o kit Qubit dsDNA® HS Assay Kit (Invitrogen - Oregon, Estados Unidos), um kit de alta sensibilidade para quantificações que variam de 0,2 a 100 ng/uL.

Uma vez quantificadas, as amostras foram normalizadas por meio de uma diluição em água ultrapura autoclavada para uma concentração de 10 ng/µL e posteriormente submetida à reação de sequenciamento direto conforme descrito nas seções seguintes.

4.5. REAÇÃO DE SEQUENCIAMENTO

Os produtos de amplificação foram sequenciados diretamente com o uso do kit de sequenciamento BigDye® Terminator v.3.1 Cycle Sequencing (Applied Biosystems - Foster City, Estados Unidos) e os primers indicados (Figuras 4 e 5). Os reagentes foram misturados em quantidades específicas (Tabela 03) em um único tubo para garantir a homogeneidade das reações.

Em cada microtubo de 0,2 mL devidamente identificado ou na placa de 96 poços, foram acrescentados 5 µL do produto de PCR purificado e normalizado a 10 ng/µL (totalizando 50 ng de DNA) e 5 µL da mistura de reagentes. O perfil de ciclagem utilizado foi: 1 ciclo de 96ºC por 1 minuto; 25 ciclos de 96ºC por 10 segundos, 56ºC por 5 segundos e 60ºC por 4 minutos. Para o sequenciamento de toda a região 3’NT do gene HLA-E foram utilizados 7 diferentes iniciadores desenhados especificamente para estre trabalho (Figura 5):

(34)

HE3UTR.F2 (5’ – GAGGGTGGGGCAGAGGGGAC – 3’); HE3UTR.F3 (5’ – CCCCCTTCCTCACACTGACCTGT – 3’); HE3UTR.F5 (5’ – AGTGTAAGTGCGGGGCGGGA– 3’); HE3UTR.R1 (5’ – GGACTCCCTGGGCTTTCTCACCG – 3’) HE3UTR.R2 (5’ – CAGCCTGGGAAGGTGAGGGGA – 3’); HE3UTR.R3 (5’ – CATCACTCTAGTGGAGGCTCTCTGT – 3’).

Tabela 3: Reagentes e concentrações utilizadas na reação de sequenciamento

(para uma corrida utilizando um primer específico).

Componentes da Reação 1 x (µL)

Água ultrapura autoclavada 1,25

Tampão BigDye 5X 1,25

Iniciador (3,2 ng/µL) 1,00

BigDye 3.1 1,50

Volume Total 5,00

(35)

Figura 4. Esquema resumido do mapa cromossômico dos genes do complexo HLA, em destaque o gene HLA-E. (Mehra e Kaur, 2003)

Figura 5. Área de cobertura de cada iniciador utilizado para o sequenciamento da região 3’ não-traduzida do gene HLA-E, considerando-se 450 pb para cada primer.

(36)

A precipitação da reação de sequenciamento foi realizada utilizando-se protocolo recomendando pela empresa produtora do kit de sequenciamento. Este protocolo utilizou-se dos reagentes etanol absoluto e ácido etileno diamino tetracético [EDTA] (125 mM), conforme procedimento descrito a seguir: em cada poço da placa foi adicionado 2,5 µL da solução de EDTA e 30 µL de etanol absoluto gelado (freezer -20 por um mínimo de 2 hora). Cobriu-se a placa, selando-a com papel alumínio e homogeneizou-se. A placa foi então incubada por 15 minutos a temperatura ambiente. Posteriormente, foi centrifugada por 30 min a 3000 x g. Passado este tempo, a placa foi vertida e centrifugada por 1 min a 185 x g com papel absorvente para se retirar o álcool do passo inicial de precipitação. Adicionou-se então 30 µL de etanol 70% gelado a cada poço, Adicionou-seguido de centrifugação por 15 min a 1650 x g com uma temperatura de 4ºC. Inverteu-se a placa e centrifugou-se por 1 min a 185 x g com papel absorvente para retirar os componentes da segunda rodada de precipitação. Por fim, a placa foi secada em um termociclador com temperatura de 90ºC por 1 minuto.

Após a precipitação, as amostras foram ressuspendidas em 10 µL de formamida Hi-Di, desnaturadas por 5 minutos a 95ºC e posteriormente aplicadas no sequenciador ABI3500 Genetic Analyser (Applied Biosystems) para a leitura do sequenciamento.

4.6. ANALISE DAS SEQUÊNCIAS

A qualidade dos sequenciamentos foi examinada em um primeiro momento visualizando-se os eletroferogramas no programa Chromas®. Posteriormente, os arquivos contendo os eletroferogramas de sequenciamento foram alinhados com a sequência genômica do HLA-E depositada no GenBank (número de acesso NT_113891.2), para fins de referência. A leitura e interpretação dos sequenciamentos e alinhamentos foi realizada manualmente por dois observadores, descartando-se regiões de baixa qualidade (nucleotídeos com valor PHRED inferiores a 20 foram descartados e posteriormente reavaliados). Cada SNP detectado (Figura 6) foi anotado individualmente e comparado com as variações já descritas para a sequência genômica do HLA-E por meio do software CLC Sequence Viewer (http://www.clcbio.com/products/clc-sequence-viewer/). Cada SNP

(37)

teve sua posição correta definida a partir da comparação com a sequência NT_113891.2, considerando a Adenina do primeiro ATG traduzido como base número +1. As bases analisadas em cada sequenciamento que não apresentaram variação foram definidas como sendo igual à sequencia padrão de comparação.

Figura 6. Exemplo de resultado dos sequenciamentos. Na seta nota-se a ocorrência de um ponto de variação presente em uma das amostras analisadas.

4.7. ANÁLISE DOS DADOS DO PROJETO 1000GENOMES

Os dados do projeto 1000Genomes referentes ao gene HLA-E foram obtidos no site oficial do projeto (www.1000genomes.org) (The 1000Genomes Project Consortium, 2010; 2012). A região avaliada neste estudo (éxons 1-4, incluindo íntrons, e da região de 3' NT do gene HLA-E) foi filtrada a partir dos arquivos .vcf baixados do site oficial do projeto 1000Genomes e concatenados com os dados obtidos a partir das análises das amostras brasileiras. O arquivo .vcf resultante foi convertido para o formato GENEPOP e ARLEQUIN usando o programa PGDSpider 2.0.19 (Lischer e Excoffier, 2012). Para as variações encontradas em uma das análises, mas não na outra, i.e., pontos de variação que ocorreram exclusivamente nas análises das amostras brasileiras e vice-versa, esses pontos foram considerados monomórficos no grupo onde eles não variaram e a base considerada foi aquela presente na sequencia padrão utilizada na análise (NT_113891.2).

(38)

4.8. AVALIAÇÃO DO PADRÃO DE DESEQUILÍBRIO DE LIGAÇÃO E INFERÊNCIA COMPUTACIONAL DE HAPLÓTIPOS

Para a análise do possível desequilíbrio de ligação (LD), o arquivo .vcf foi convertido para o formato de .ped LINKAGE e a inferência do padrão de desequilíbrio de ligação (LD) na região foi realizada usando o programa Haploview® 4.2 (Barrett et al., 2005). As imagens de LD foram geradas pelo Haploview utilizando-se os SNPs com o alelo menos frequente com uma frequência alélica mínima (MAF) de 0,01. As regiões com elevado LD (blocos de segregação) foram inferidas pelo método do Intervalo de Confiança (Gabriel et al., 2002).

Para a avaliação do LD, as populações foram agrupadas de acordo com a componente predominante de ancestralidade. Sendo assim, seis grupos foram considerados: a) população mundial, contendo os dados de todas as populações avaliadas no projeto 1000genomes mais os dados das amostras brasileiras; b) brasileiros do estado de São Paulo; c) europeus, onde todas as populações com ascendência europeia foram agrupadas em conjunto, ou seja, os residentes de Utah com ancestrais do Norte da Europa e da Europa Ocidental, moradores da Toscana na Itália, britânicos da Inglaterra e Escócia, finlandeses da Finlândia, e as populações ibéricas da Espanha; d) asiáticos, incluindo os chineses (População Han em Pequim e a população Han do sul da China) e a população japonesa (Tóquio), e) africanos, incluindo a população de Yoruba em Ibadan (Nigéria), habitantes de Luhya Webuye, (Quênia) e indivíduos com ascendência Africana do sudoeste dos EUA; e por ultimo f) americanos, incluindo indivíduos com ancestralidade mexicana que moram em Los Angeles (CA), os porto-riquenhos em Porto Rico e colombianos de Medellín na Colômbia.

A população brasileira não foi incluída no grupo de americanos, uma vez que o presente estudo teve como objetivo avaliar o padrão encontrado na análise das diferentes populações mundiais e comparar com os dados e padrões obtidos para a população brasileira. E ainda, pelo fato de que as outras populações enquadradas no grupo dos americanos possuem uma origem hispânica, ao contrário dos brasileiros que possuem basicamente ancestralidade portuguesa e africana.

Dada a associação positiva entre os alelos dos pontos de variação encontrados, mas a fase de ligação entre cada uma destas variantes desconhecida,

(39)

foi realizada uma inferência computacional dos haplótipos definindo-se a provável constituição de cada um dos cromossomos dos indivíduos analisados.

Para a inferência dos haplótipos, dois métodos computacionais foram empregados: o software PHASE v2 (Stephens et al., 2001; Stephens e Donnelly, 2003) que implementa um método Bayesiano para reconstrução do haplótipo mais provável; e algoritmo de máxima verossimilhança implementado no software PL-EM (Qin et al., 2002), que calcula pela maximização da expectativa cada um dos haplótipos presentes nas amostras. Foram realizadas 25 corridas independentes para cada um dos métodos e os resultados foram então comparados entre si. Para este procedimento foi utilizado um script em Perl denominado HaploRunner (desenvolvido por E. C. Castelli – disponível em http://bioinfo.icb.ufg.br), versão 1.1b. Este script executou as 25 corridas independentes de cada algoritmo, comparando os resultados obtidos em todas as corridas e entre ambos os métodos. Foram aceitas somente as inferências de haplótipos que atenderam a dois requisitos: a) tiveram probabilidade de inferência superior a 90%; b) obtiveram o mesmo haplótipo inferido em todas as corridas para cada um dos programas e entre os dois programas. Para o método PHASE foram utilizados os seguintes parâmetros: number of iteractions: 1000; thinning interval: 1; burn-in value: 1000 e valores seed diferentes para cada corrida, conforme descrito em um trabalho prévio (Castelli et al., 2011). Para o algoritmo PL-EM foram utilizados os seguintes parâmetros: Top value: 0; Parsize value: 2; Buffer: 1300 e Round value: 200.

As relações entre os haplótipos obtidos foram inferidas construindo-se uma network, utilizando-se para tanto o algoritmo median joining implementado no programa Network® 4.6.1.0 (http://www.fluxus-engineering.com/sharenet.htm). Nas análises, um haplótipo frequente de chipanzé (Pan troglodytes) foi considerado como nó ancestral. As imagens geradas pelo software foram tratadas e reconstruídas utilizando-se programas de edição de imagem.

4.9. CONVERSÃO DE HAPLÓTIPOS EM ALELOS HLA-E

A conversão de haplótipos em alelos codificadores do gene HLA-E foi realizada manualmente baseando-se nas sequências depositadas na base dados do IMGT/HLA. Os haplótipos foram comparados individualmente com cada um dos 11

(40)

alelos codificadores para o gene HLA-E descritos nesta plataforma de dados, desta forma identificando qual o alelo mais próximo da sequência encontrada, baseando-se nas variações que definem cada alelo.

As sequências de haplótipos que não foram compatíveis com nenhum alelo codificador já descrito foram agrupadas com o alelo mais semelhante descrito, adicionando-se a posição do nucleotídeo e o novo nucleotídeo apresentado para mutações sinônimas. Para os casos de mutações não sinônimas, o número do códon e a troca de aminoácido ocasionada pelo ponto de variação apresentado foram fornecidos.

ANÁLISES DE FREQUÊNCIAS

As frequências alélicas e genotípicas de cada loco foram estimadas por contagem direta. A aderência das frequências genotípicas em relação às proporções teóricas de Hardy-Weinberg foi avaliada pelo teste exato de Guo e Thompson (Guo e Thompson, 1992), utilizando-se o software GenePop® 4.0 (Raymond e Rousset, 1995). Este último também foi utilizado para inferir a heterozigosidade esperada e observada nesta população. A diversidade nucleotídica do gene HLA-E como um todo e de cada região de estudo (codificadora e 3’NT), tanto para cada população individualmente e para a população mundial, foi inferida com o uso do software Arlequin versão 3.5.1 (Excoffier et al., 2003; Excoffier et al., 2005)

(41)

5. RESULTADOS

5.1. FREQUÊNCIAS ALÉLICAS, GENOTÍPICAS E ADERÊNCIA AO EQUILÍBRIO DE HARDY-WEINBERG

Após a análise da variabilidade do gene HLA-E das 104 amostras oriundas do banco de doadores de medula óssea de Ribeirão Preto e dos indivíduos incluídos no projeto 1000Genomes, considerando-se a sequência genômica que codifica a porção externa na molécula HLA-E (1100-pb incluindo os éxons 1-4 e íntrons) e a região 3’ NT (1624-pb, incluindo o íntron 7), conforme descrito anteriormente, foram encontrados 34 pontos de variação (Tabela 4).

Considerando apenas as amostras brasileiras, seis pontos de variação foram detectados na região codificadora do HLA-E, nas posições +170, +424, +756, +1294, +1645 e +1857 (considerando a primeira A do primeiro ATG traduzido como nucleotídeo +1). Para a região 3' NT, oito pontos de variação foram encontrados, nas posições +3447, +3468, +3634, +3695, +3777, +3778, +4084 e +4297. Desses, sete foram encontrados exclusivamente no Brasil (Tabela 4). Curiosamente, dois novos pontos de variação, +3695 e +4084, foram encontrados na mesma amostra brasileira, um indivíduo do sexo masculino com 22 anos de idade e classificada como mulato. Para confirmar estas variações um novo PCR e novas reações de sequenciamento foram realizados.

Dos pontos de variação presentes na população brasileira, seis podem ser considerados polimorfismos (frequência do alelo mais frequente inferior a 99%), sendo três na região de codificação (+424, +756, +1645) e três na região 3' NT (+3468, +3777 e +4297) . Os três sítios polimórficos com maiores heterozigosidade foram os polimorfismos de região codificadora +424 e +756, e o polimorfismo da região 3’NT +3777. O primeiro é uma substituição sinônima no éxon 2, o segundo é uma mutação de sentido trocado que causa uma troca de um aminoácido na proteína HLA-E e o terceiro pode, em uma primeira análise, ser considerada como uma variação neutra por ocorrer na 3' NT.

A variação +756 define dois grupos de alelos, um grupo que codifica a molécula E*01:03 (que contém uma glicina no domínio α2 da cadeia pesada) e outro a molécula E*01:01 (que contém uma arginina nesta mesma posição) (Tamouza et

(42)

al., 2007). Todos os sítios de variação encontrados e as suas frequências em brasileiros e nas outras populações avaliadas no projeto 1000Genomes são apresentados na Tabela 4.

Considerando os dados do projeto 1000Genomes, 17 pontos de variação foram encontradas em uma ou mais populações mundiais (Tabela 4). Destes, apenas sete também estavam presentes no Brasil. Desta forma, todas estas variações exclusivas do Brasil ou de alguma população do 1000Genomes foram consideradas como sítios monomórficos nas demais populações, considerando o nucleotídeo presente na sequência de referência (NT_113891.2) como o nucleotídeo presente nestes pontos.

Das vinte variações encontradas exclusivamente nas populações avaliadas pelo 1000Genomes, onze apresentaram frequências superiores a 1% em pelo menos uma das populações. Ainda, seis pontos de variação foram considerados singletons (ocorreram em apenas um indivíduo no estado de heterozigose): +108, +1691, +3082, +3475, +3500 e +4430. Considerando-se que a cobertura de sequenciamento do genoma inteiro dos indivíduos analisados pelo projeto 1000Genomes é entre 2 a 6x, boa parte destes singletons podem ser fruto de erros de sequenciamento e erros de base calling, tornando-se resultados falso positivo. Por este motivo, optamos por excluir esses pontos de variações para as análises posteriores.

No total (1000Genomes e Brasil), quinze variações foram encontradas na região codificadora e treze variações na região 3' NT. O número de pontos de variação por população variou entre três e quatorze. As populações brasileira e queniana apresentaram o maior número de variações, seguidos por britânicos, colombianos e Afrodescendentes americanos. Dez dos vinte e oito pontos de variação foram encontrados em apenas um grupo populacional (mas com frequências muito baixas), e o SNP +887, já descrito pelo IMGT/HLA como associado com o alelo de região codificadora conhecido como E*01:03:03, não foi encontrado em qualquer uma das populações avaliadas.

A população finlandesa apresentou a maior diversidade nucleotídica considerando a região codificadora do HLA-E, enquanto que a população afrodescendente americana apresentou maior diversidade da região 3' NT (Tabela 5). Apesar do maior número de sítios de variação encontrados no Brasil, a

(43)

população brasileira apresentou a menor diversidade nucleotídica entre todas as populações. Considerando-se o loco HLA-E todo, a população afrodescendente americana apresentou a maior diversidade nucleotídica.

As frequências genotípicas aderiram ao esperado pelo Equilíbrio de Hardy-Weinberg para todos os marcadores (P > 0,05), exceto em dois casos: polimorfismo +424 na população Han do sul da China e +756 para os quenianos de Luhya (Tabela 6). Não foram detectados desvios para o Equilíbrio de Hardy-Weinberg nas amostras Brasileiras.

(44)

Tabela 4: Pontos de variação do gene HLA-E e suas frequências em diferentes populações do projeto 1000Genomes e em uma amostra brasileira.

Europa Ásia África Continente Americano Populações BRA CEU TSI GBR FIN IBS CHB JPT CHS YRI LWK ASW MXL PUR CLM Pontos de

variaçãoa SNP IDb Variação

nc

104 85 98 89 93 14 97 89 100 88 97 61 66 55 60 Alelod Frequência alélica

108e N.D. A/G A 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,994 1,000 1,000 1,000 1,000 1,000 170 N.D. G/T G 0,995 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 363 rs140107837 C/T C 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,974 1,000 1,000 1,000 1,000 424 rs114942539 C/T C 0,735 0,647 0,714 0,702 0,699 0,643 0,732 0,758 0,660 0,750 0,742 0,656 0,689 0,555 0,592 756 rs115492845 A/G A 0,635 0,606 0,592 0,624 0,516 0,500 0,423 0,303 0,360 0,659 0,541 0,467 0,553 0,455 0,508 971 rs145034129 G/A G 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,995 0,975 1,000 1,000 1,000 1014 rs114763484 T/A T 1,000 0,976 1,000 0,994 0,973 1,000 1,000 1,000 1,000 1,000 1,000 0,992 1,000 1,000 1,000 1278 rs182627071 C/T C 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,982 0,992 1283 rs114425530 G/A G 1,000 1,000 1,000 1,000 1,000 1,000 0,995 1,000 1,000 1,000 1,000 1,000 1,000 0,991 1,000 1294 N.D. G/A G 0,995 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1322 rs116563630 G/A G 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,977 0,974 0,975 1,000 0,982 1,000 1625 rs116099950 G/C G 1,000 0,988 0,980 0,994 1,000 1,000 1,000 0,994 1,000 0,955 0,918 0,926 0,992 1,000 0,992 1627 rs138823292 C/G C 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,990 1,000 1,000 1,000 1,000 1644 rs149396632 G/A G 1,000 1,000 0,995 0,994 0,995 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1645 N.D. A/T A 0,985 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1691e rs188968394 G/A G 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,992 1857 rs115331960 C/T C 0,990 0,988 1,000 0,983 0,860 1,000 0,995 1,000 1,000 1,000 1,000 1,000 0,992 1,000 0,983 3082e N.D. A/C A 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,994 1,000 1,000 1,000 1,000 1,000 1,000 1,000 3166 rs150528487 C/G C 1,000 1,000 0,995 0,994 1,000 1,000 0,979 0,983 1,000 1,000 1,000 1,000 0,992 1,000 1,000 3204 rs139529838 A/G A 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,974 1,000 1,000 1,000 1,000

Referências

Outline

Documentos relacionados

Dos docentes respondentes, 62,5% conhe- cem e se sentem atendidos pelo plano de carreira docente e pelo programa de capacitação docente da instituição (que oferece bolsas de

Estudos sobre privação de sono sugerem que neurônios da área pré-óptica lateral e do núcleo pré-óptico lateral se- jam também responsáveis pelos mecanismos que regulam o

Os principais objectivos definidos foram a observação e realização dos procedimentos nas diferentes vertentes de atividade do cirurgião, aplicação correta da terminologia cirúrgica,

Verificar a influência de exercícios simples de flexibilidade contidos no treinamento de karatê na melhora da amplitude articular dos membros inferiores em

Uma vez que o instituto da detenção administrativa aplica-se para o estrangeiro, por- que entrou ou permanece irregularmente no território da União Europeia, discute-se muito a

A democratização do acesso às tecnologias digitais permitiu uma significativa expansão na educação no Brasil, acontecimento decisivo no percurso de uma nação em

En conjunto, han sido protagonistas de la puesta en marcha de una investigación que los involucra en la construcción de memoria, han acrecentando el acervo del archivo (tanto

Necessário dizer que o Grupo de Trabalho: Etnia, Gênero e Classe da Associação dos Professores da UFSC (APUFSC) promoveu debates sobre a reserva de vagas para negros e indígenas