• Nenhum resultado encontrado

Estudos que investigam a base genética tem sido realizados para identificar as variantes que contribuem para a susceptibilidade às doenças complexas em humanos (Lin D e Zeng, 2011). Na concepção clássica de estudos do tipo caso- controle, as frequências alélicas entre indivíduos portadores de determinada doença e indivíduos saudáveis são comparadas (Farhi et al., 2016; Sacks et al., 2014). Entretanto, associações espúrias, não relacionadas aos loci causais, podem ser obtidas em decorrência da subestrutura populacional não mensurada (Coelho et al., 2015; Gomes et al., 2017).

A questão dos efeitos de confusão surge quando a população investigada é composta por várias subpopulações ancestrais com diferentes frequências alélicas e risco para desenvolver certas condições patológicas não representado igualmente nos casos e controles. Este viés nas frequências dos alelos pode resultar em associações falso- positivas na análise estatística (Birney et al., 2016; Cardon e Palmer, 2003; Shriner et al., 2011; Tang et al., 2005).

Os marcadores informativos de ancestralidade (ancestry informative markers, AIMs), aqueles exibem diferencial de frequência alélica () superior a 30% entre quaisquer duas populações parentais, são comumente utilizados para minimizar os efeitos da estratificação populacional em estudos genéticos (de Andrade Ramos et al., 2016; Maxwell, 2014; Qin et al., 2014).

Nesse contexto, a população brasileira representa um desafio especial devido a sua formação tri-híbrida, decorrente de mais de cinco séculos de mistura populacional em diferentes proporções em todo o território nacional. Mais especificamente, é resultado do processo de mistura entre ameríndios, europeus, africanos e, mais recentemente, indivíduos de outras nacionalidades (Salzano e Bortolini, 2005). Em 1500, quando a colonização europeia se iniciou com a chegada de aproximadamente 500.000 portugueses, a maioria homens, os ameríndios autóctones representavam uma população de aproximadamente 2,4 milhões de indivíduos (Callegari-Jacques e Salzano, 1999; Ribeiro, 2015). O tráfico de escravos teve início na metade do século XVI e, até meados do século XIX, foram trazidos por volta de 4 milhões de africanos ao Brasil (Rodrigues, 1932; Salzano, 1986). Tais escravos eram provenientes de diferentes regiões da África subsaariana, predominantemente de regiões que pertencem atualmente à Angola, ao Congo e à

I n t r o d u ç ã o 3 2

Moçambique (Curtin, 1972). Entre 1820 e 1975, estima-se que 6 milhões de imigrantes chegaram ao Brasil, em sua maioria portugueses e italianos, mas também grupos menos numerosos de espanhóis, alemães, japoneses, sírios e libaneses (Ribeiro, 2015).

Em casos de populações que apresentam grau de mistura, como a brasileira, estabelecer um conjunto de AIMs aplicável à população em questão é um passo crítico para realizar análises de associação genômica em doenças complexas para inferir ancestralidade e ajustar pela estratificação da população em estudos de caso- controle.

J u s t i f i c a t i v a 3 3

2 JUSTIFICATIVA

Ressalta-se que ainda persistem lacunas significativas na compreensão da base genética do LES, principalmente quando se diz respeito às variantes genômicas, como CNVs e LOH (Teruel e Alarcon-Riquelme, 2016). A importância de CNVs e LOH na susceptibilidade e no desenvolvimento de patologias complexas, como o LES, e em particular, a existência de poucos estudos em larga escala relacionando essa patologia a esses tipos de marcadores genéticos, motivam o desenvolvimento de pesquisas nessa área (Kim JH et al., 2013; Singh et al., 2014). Em 2012, foi iniciado o estudo piloto sobre CNVs em pacientes com LES no nosso grupo de pesquisa (Barbosa, 2013). A complexidade do tema levou à necessidade de aprimoramento, que se deu na forma de continuação do trabalho.

A abrangência das CNVs como fonte de variabilidade genética, seu potencial para alterar significativamente a expressão gênica, os estudos recentes que demonstram a contribuição de CNVs na susceptibilidade às doenças e suas implicações diretas para determinados fenótipos clínicos, destacam necessidade de aprimoramento do estudo deste tipo de variação estrutural na compreensão de fenótipos autoimunes (Fanciulli M et al., 2010; Yih Chen et al., 2016; Yim et al., 2015).

Em relação às regiões de LOH e sua associação com doenças complexas, diversos estudos têm mostrado o papel contributivo de regiões cujo acúmulo de variantes deletérias em longos trechos de homozigose acarreta em aumento do risco para desenvolver determinadas patologias (Ghani et al., 2015; Lencz et al., 2007; Szpiech et al., 2013). Nesse sentido, a abordagem genômica e a sua utilização na investigação etiológica de doenças complexas é uma estratégia adequada e plausível.

Considerando que a composição ancestral de populações pode alterar resultados de testes de associação, o estudo em populações heterogêneas pode produzir resultados diferentes e até mesmo conflitantes com os da literatura (Cardon e Palmer, 2003; Liu J et al., 2013; Shriner et al., 2011). A insuficiência de estudos que descrevem o perfil de CNVs e LOH em populações tri-híbridas, tanto quando se trata de indivíduos saudáveis ou de fenótipos patogênicos, dificulta a comparação com os bancos de dados disponíveis atualmente, pois alguns dos resultados obtidos podem ser discrepantes de outras populações, ou até mesmo representarem associações espúrias.

H i p ó t e s e 3 4

3 HIPÓTESE

A hipótese deste projeto fundamenta-se em que portadores de LES possuem variantes no número de cópias e regiões de perda de heterozigose em segmentos genômicos específicos, mais frequentes nos afetados do que em controles, que contribuem para etiologia da doença. Além disso, sugere-se que o efeito sinérgico de tais CNVs possa conduzir ao aumento da susceptibilidade à doença.

O b j e t i v o s 3 5

4 OBJETIVOS

4.1 OBJETIVO GERAL

O presente trabalho tem como objetivo geral promover análise da distribuição de CNVs e de regiões de LOH no genoma de portadores de LES em comparação com indivíduos saudáveis.

4.2 OBJETIVOS ESPECÍFICOS

(1) Genotipar pacientes com LES e indivíduos saudáveis com o intuito de detectar CNVs e segmentos LOH no genoma;

(2) Selecionar e validar um conjunto de AIMs capaz de diferenciar europeus, africanos e ameríndios, e aplicá-lo para inferência de ancestralidade em pacientes com LES e indivíduos saudáveis;

(3) Analisar a distribuição e o padrão de CNVs no genoma dos pacientes com LES em comparação com indivíduos saudáveis brasileiros e de outros grupos populacionais; (4) Desenvolver um protocolo de etapas para a identificação de CNVs raras em pacientes com LES;

(5) Confirmar os resultados de genotipagem de CNVs por metodologia alvo-específica; (6) Delinear o perfil de LOH autossômico e de LOH no cromossomo X em pacientes com LES, e compará-lo com o de indivíduos saudáveis brasileiros e de outros grupos populacionais.

M a t e r i a l e M é t o d o s 3 6

5 MATERIAL E MÉTODOS

5.1 DESENHO EXPERIMENTAL

A metodologia Cytoscan HD array, que produz dados genômicos de CNVs, SNPs e LOH a partir de amostras de DNA, é adequada para atender aos objetivos iniciais propostos no presente trabalho. Portanto, pacientes com LES e indivíduos saudáveis foram submetidos à genotipagem por esse tipo de ensaio.

Devido à formação tri-híbrida da população brasileira, à heterogeneidade do LES e o risco para desenvolver a doença variar de acordo com a região geográfica e ancestralidade, o primeiro passo foi estabelecer um conjunto de AIMs, a partir dos SNPs presentes no Cytoscan HD array, para inferir ancestralidade e avaliar diferenciação populacional entre os grupos de pacientes com LES e controles. Os modelos de regressão logística foram ajustados pela ancestralidade usando dados obtidos a partir da aplicação do painel de AIMs nas análises estatísticas subsequentes.

Em seguida, as CNVs presentes nos pacientes com LES e nos controles foram identificadas. A distribuição do número total e extensão de CNVs foi estimada nos pacientes com LES e indivíduos saudáveis, bem como a distribuição por cromossomo. Foram identificadas variantes compartilhadas por mais de um indivíduo, e a partir dessa análise, foram selecionadas CNVs candidatas à associação com o LES. Com o intuito de confirmar a relação com a doença, CNVs candidatas foram genotipadas por metodologia alvo-específica ─ PCR quantitativa em tempo real (quantitative real-time PCR, qPCR) ─ em maior grupo amostral.

Um protocolo de etapas para determinar CNVs raras em pacientes com LES foi desenvolvido e, além disso, CNVs em genes com relevância funcional para a patogênese foram identificados. A frequência de tais variantes foi avaliada em outras populações e em bancos de dados públicos. As CNVs identificadas que apresentaram potencial patogênico foram validadas por metodologia altamente específica ─ PCR digital (droplet digital PCR, ddPCR).

Para avaliar o perfil de copy-neutral LOH nos pacientes com LES, os eventos de LOH foram comparados àqueles presentes nos indivíduos do grupo controle e de outros

M a t e r i a l e M é t o d o s 3 7

grupos externos. A análise decorrente das comparações identificou LOH exclusivas do grupo de pacientes com LES.

As etapas desenvolvidas nesse trabalho estão resumidas na Figura 1.

Figura 1. Fluxograma de etapas desenvolvidas no presente trabalho.

5.2 AMOSTRAS BIOLÓGICAS

Para o desenvolvimento desse trabalho, foi utilizado o total de 335 amostras. Nas técnicas iniciais de triagem por array foram utilizados 23 pacientes com LES e 110 indivíduos saudáveis, enquanto as etapas de validação foram feitas em 135 casos e 200 controles.

M a t e r i a l e M é t o d o s 3 8

As amostras de LES foram provenientes de pacientes atendidos no ambulatório de Colagenoses da Clínica Médica do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP–USP), e diagnosticados segundo os critérios revisados do American College of Rheumatology (Hochberg M.C., 1997). Tais amostras pertencem ao Banco de Amostras do Núcleo de Pesquisa em Imunogenética (BANPI), sob coordenação do colaborador Prof. Dr. Eduardo Antônio Donadi.

Os dados clínicos e laboratoriais dos pacientes com LES foram obtidos a partir de consulta ao prontuários médicos. A média de idade de diagnóstico para o grupo de 135 pacientes foi de 32 ± 12 anos. O número de pacientes do sexo feminino/masculino foi de 125/10. As características clínicas apresentadas pelos portadores foram agrupadas em oito categorias cuja presença da característica em questão mostrou as seguintes frequências: (1) nefrite: 59%, (2) artrite: 60%, (3) rash malar: 36%, (4) úlceras orais e/ou nasais: 12%, (5) fotossensibilidade: 38%, (6) convulsões e psicoses: 22%, (7) alterações hematológicas definidas por presença de anemia ferropriva e/ou leocopenia (< 4.000/mm3) e/ou linfocitopenia (<1.500/mm3) e/ou trombocitopenia (< 150.000/mm3): 53%, (8) alterações imunológicas definidas por presença de anti-DNA e/ou anti-Sm e/ou anticorpos antifosfolipídeos (lúpus anticoagulante e anticardiolipina): 71%. A tabela completa está descrita no Apêndice A.

As amostras de grupo controle foram obtidas em colaboração com os grupos de pesquisa da Profa. Dra. Vera Lúcia Gil da Silva Lopes e da Profa. Dra. Íscia Lopes Cendes, do Laboratório de Citogenética Humana, Faculdade de Ciências Médicas, Universidade de Campinas (FCM-UNICAMP). Essas amostras foram coletadas de indivíduos saudáveis, voluntários, não aparentados, de ambos os sexos.

O DNA de todas as amostras utilizadas foi obtido em fases já realizadas de outros projetos e encontrava-se estocado. A extração de DNA foi realizada a partir de sangue periférico colhido com anticoagulante ácido etilenodiamino tetra-acético, segundo o método salting-out (Miller et al., 1988) em amostras do grupo de pacientes com LES, ou por kit comercial QIAamp® DNA Blood Maxi (Qiagen, Hilden, Alemanha) em amostras do grupo controle.

M a t e r i a l e M é t o d o s 3 9

5.3 ASPECTOS ÉTICOS

O presente trabalho foi aprovado pelo Comitê de Ética em Pesquisa do HCFMRP–USP (CAAE: 03199712.0.0000.5440) e da instituição coparticipante FCM–UNICAMP (CAAE: 35316314.9.1001.5404).

Para o armazenamento de amostras de DNA para fins de pesquisa e análise científica, foi criado o biorrepositório "Lúpus e Variantes Estruturais" junto ao Departamento de Genética da Faculdade de Medicina de Ribeirão Preto, sob responsabilidade do Prof. Dr. Aguinaldo Luiz Simões e da pós-graduanda Fernanda Bueno Barbosa. A criação do biorrepositório foi aprovada pelos comitês de ética do HCFMRP–USP (CAAE: 57570716.9.0000.5440) e da instituição coparticipante FCM–UNICAMP (CAAE: 57570716.9.3001.5404).

5.4 CYTOSCAN HD ARRAY

5.4.1 Análise laboratorial

O total de 23 amostras de pacientes com LES e 110 indivíduos saudáveis foi submetido à genotipagem por Cytoscan HD array (Affymetrix, CA, EUA). Com o intuito de avaliar a integridade do material genético, foi feita eletroforese em gel de agarose. As amostras de DNA foram diluídas em água livre de nucleases à concentração de 50 ng/µL e, em seguida, quantificadas em espectrofotômetro NanoDropTM 1000 (Thermo

Fisher Scientific, MA, EUA) para verificar se o DNA atingiu concentração e grau de pureza esperados.

Após a verificação da integridade do DNA e diluição das amostras, os experimentos de Cytoscan HD array foram realizados de acordo com as recomendações do fabricante. Reagentes, soluções e procedimentos detalhados das etapas do Cytoscan HD array encontram-se no Anexo A. As etapas principais do protocolo são enumeradas a seguir: (1) digestão das amostras de DNA com a enzima NspI, (2) reação de ligação aos adaptadores para NspI, (3) amplificação dos fragmentos por PCR, (4) purificação do DNA com beads magnéticas, (5) fragmentação dos produtos da PCR, (6) marcação do DNA por fluorescência, (7) hibridação das amostras de DNA marcadas aos chips Cytoscan HD no GeneChip® Hibridization Oven 640 (Affymetrix®), (8) lavagem dos chips no GeneChip® Fluidics Station 450 (Affymetrix®), (9) escaneamento dos chips no GeneChip® Scanner 3000 7G (Affymetrix®), (10) análise

M a t e r i a l e M é t o d o s 4 0

das imagens escaneadas de cada chip no GeneChip® Operating software (GCOS) (Affymetrix®).

5.4.2 Dados gerados por Cytoscan HD array

O Cytoscan HD array contém aproximadamente 1,9 milhões de sondas não polimórficas e 750 mil SNPs. Para cada chip, que corresponde a um indivíduo, a conversão da intensidade do sinal de cada sonda escaneada do chip em valores de logaritmo (log2 ratio) é realizada pelo software GCOS, o que origina arquivos com extensão .cel. O arquivo .cel referente a cada indivíduo é utilizado como input para que por meio do software Chromosome Analysis Suite v.3.0 (ChAS) (Affymetrix®) se obtenha: (1) a estimativa da qualidade dos resultados gerados por Cytoscan HD array, (2) a determinação dos genótipos das sondas bialélicas e o do número de cópias (copy number; CN) dos segmentos do genoma utilizando anotação do genoma humano GRCh37/hg19, por meio de algoritmo baseado em hidden markov model, (3) a definição do sexo do indivíduo, baseado no algoritmo Y-Gender, (4) a criação de arquivo com extensão .cyhd.cychp para cada indivíduo, utilizado para a análise de dados de CNVs, SNPs e LOH no ChAS.

Para avaliação da qualidade dos experimentos de Cytoscan HD array são estimadas três medidas recomendadas pelo fabricante, que também fornece os respectivos valores de limiar: (1) single nucleotide polymorphism quality control, SNPQC ≥ 12, (2) median absolute pairwise difference, MAPD ≤ 0,25 e (3) waviness standard deviation, wavinessSD ≤ 0,12. Essas indicam a qualidade dos dados obtidos na determinação dos genótipos das sondas bialélicas e CN dos segmentos de DNA. O SNPQC é uma estimativa sobre o nível global da qualidade dos dados de array a partir de uma perspectiva de SNPs. O MAPD e o wavinessSD são medidas de variação de curto e longo alcance, respectivamente, do conjunto de sondas do array em todo o genoma, que consideram a mediana e o desvio padrão dos valores de log2ratio par a par e aqueles referentes a toda extensão da faixa de variação.

Para determinação de genótipos das 750 mil sondas de SNPs e do CN para cada indivíduo, é necessário que os dados sejam normalizados em relação a um genoma de referência. Para tanto, foi utilizado modelo de referência genômica, disponível no software ChAS, composto por amostras de indivíduos saudáveis de ambos os sexos: 270 indivíduos da fase I do projeto HapMap e 96 indivíduos europeus pertencentes ao banco BioServe Biotechnologies (BioServe Biotechnologies, MD, EUA).

M a t e r i a l e M é t o d o s 4 1

5.5 ELABORAÇÃO DE PAINEL DE AIMs

Documentos relacionados