• Nenhum resultado encontrado

V. MATERIAL E MÉTODOS V.1 Amostragem V.2 Marcadores do Cromossomo Y:... 18

N/A
N/A
Protected

Academic year: 2022

Share "V. MATERIAL E MÉTODOS V.1 Amostragem V.2 Marcadores do Cromossomo Y:... 18"

Copied!
47
0
0

Texto

(1)

CONTEÚDO

I.RESUMO... 2

II. ABSTRACT ... 3

III. INTRODUÇÃO ... 4

III.1 O cromossomo Y humano e estudos históricos: ... 4

III.2 Estrutura física do cromossomo Y humano: ... 5

III.3 Marcadores moleculares do cromossomo Y humano ... 6

III.4 Povoamento e “descoberta” da América: ... 9

III.5 Evidências do passado das sociedades nativas americanas: ... 11

IV. OBJETIVOS ... 14

IV.1 Objetivo Geral: ... 14

IV.2 Objetivos Específicos: ... 14

V. MATERIAL E MÉTODOS... 15

V.1 Amostragem ... 15

V.2 Marcadores do Cromossomo Y: ... 18

VI. RESULTADOS: ... 25

VI.1 Genotipagem de SNPs do cromossomo Y ... 25

VI.2 Genotipagem de microssatélites do cromossomo Y ... 27

VI.3 Busca de novos marcadores do tipo SNP ... 29

VII. DISCUSSÃO FINAL ... 34

VIII. PERSPECTIVAS ... 36

IX. CONCLUSÕES ... 37

X. BIBLIOGRAFIA ... 38

Anexo I – Frequências dos microssatélites ... 44

Anexo II – Haplótipos dos indivíduos analisados ... 46

(2)

I.RESUMO

Neste estudo foram utilizados os marcadores de substituição nucleotídica (SNP) M242, que caracteriza o haplogrupo Q (Q-M242), e o DYS199 (ou M3), que caracteriza o sub-haplogrupo Q1a3a (Q-M3). O haplogrupo Q e seu sub-haplogrupo Q1a3a ocorrem na maior parte dos cromossomos Y de nativos americanos. O subgrupo de cromossomos do haplogrupo Q, que possui o estado ancestral em DYS199, é considerado como o paragrupo Q*. Utilizaram-se amostras de indígenas dos Andes colombianos, Andes Peruanos e Alasca. Foram realizados experimentos para identificação de novos SNPs do cromossomo Y humano utilizando uma metodologia otimizada. Primeiramente, foi criada uma rede de haplótipos a partir de 6 locos de microssatélites do cromossomo Y pertencentes ao Q* e Q1a3a separadamente. As amostras com haplótipos de microssatélites mais divergentes, um total de dez indígenas, foram amplificadas com 16 iniciadores já descritos na literatura para diferentes locos do cromossomo Y. As sequências foram geradas e analisadas em toda sua extensão e foi encontrado um SNP ainda não descrito que foi genotipado no restante da amostragem, sendo identificado também em outras amostras. Posteriormente as amostras de indígenas foram submetidas à genotipagem de mais dez locos de microssatélites do cromossomo Y para um estudo mais detalhado de estrutura populacional. Nas análises populacionais foram utilizados o Teste Exato de Diferenciação e Análise Rst par a par entre populações.

Este estudo teve como objetivo contribuir para o conhecimento da história das populações pré-Colombianas nos Andes. A metodologia de procura de novos SNPs se mostrou eficiente pela economia de insumos, tempo e principalmente por preservar amostras muito difíceis de serem coletadas. A genotipagem de novos microssatélites também foi informativa, permitindo discriminar mais haplótipos e aumentar a resolução de linhagens de cromossomo Y entre indígenas americanos.

(3)

II. ABSTRACT

In this study we have used the markers of nucleotide substitution (SNP) M242, which characterizes the haplogroup Q (Q-M242), and DYS199 (or Q-M3), which characterizes the sub-haplogroup Q1a3a (Q-M3). The haplogroup Q and its sub- haplogroup Q1a3a occur in most of the Y chromosomes of Native Americans. The subgroup of chromosomes of haplogroup Q, that bears the ancestral state at DYS199, is considered as the paragroup Q*. The samples used in this study were obtained from indigenous Colombian Andes, Peruvian Andes and Alaska.

Experiments were carried out to identify new SNPs of the human Y chromosome using an optimized technology. Firstly, a network of haplotypes was created from 6 microsatellite loci of the Y chromosome belonging to Q* and Q1a3a separately. The samples with microsatellite haplotypes more divergent, a total of ten people, were amplified with 16 primers already described in the literature for different loci of the Y chromosome. The sequences were generated and analyzed in its entire length, and was found one SNP previously not described that was genotyped in the remainder of the samples. Subsequently the indigenous samples were submitted to genotyping of another ten microsatellite loci of the Y chromosome for a more detailed study of the population structure. In the population analysis were used the Exact Test of Differentiation and Rst Pairwise population. The searching methodology for new SNPs was shown to be efficient because of the saving of reagents, time and especially to preserve samples that are very difficult to collect. Genotyping of new microsatellites also proved to be informative, allowing discriminating more haplotypes and increase the resolution of Y chromosome lineages among Native Americans.

(4)

III. INTRODUÇÃO

III.1 O cromossomo Y humano e estudos históricos:

Os geneticistas, diferentemente de outros cientistas históricos como arqueólogos, lingüistas, antropólogos físicos, etc, utilizam a variabilidade genética para reconstruir o passado da humanidade. A genética histórica utiliza diferentes porções do genoma humano para reconstruir eventos passados dos ancestrais das populações quando em análise. No genoma humano, o cromossomo Y é uma importante fonte de informação histórica sobre a linhagem patrilinear e sobre a ancestralidade paterna dos homens atuais. A caracterização e a análise de variações polimórficas nesse cromossomo estão intimamente relacionadas com a curiosidade científica em desvendar o passado dos ancestrais humanos, suas migrações e padrões de fluxo gênico.

No entanto, o processo de descoberta de regiões variáveis no cromossomo Y humano tem sido lento, até que vários marcadores bialélicos puderam ser identificados através da técnica de Cromatografia Líquida Desnaturante de Alta Performance (DHPLC) (Underhill et al. 1997). Atualmente são conhecidos vários SNPs do cromossomo Y humano, cuja análise combinada permite a caracterização de vários haplogrupos em diferentes populações (YCC, 2002). Entretanto, algumas populações indígenas continentais, como os nativos americanos, estão pouco representadas em termos de haplogrupos discriminados. Portanto, ainda faz-se necessário identificar novas variações do tipo SNPs e indels para discriminar novos haplogrupos e sub-haplogrupos e melhorar a resolução de linhagens entre povos indígenas das Américas. A discriminação de linhagens autóctones de cromossomos Y permitirá, por exemplo, comparar povos indígenas no continente e estimar possíveis rotas migratórias intracontinentais e padrões históricos de fluxo-gênico. Na falta de SNPs, microssatélites do Y são utilizados para discriminação de haplótipos, mas, devido à natureza altamente variável desses marcadores, existem limitações práticas do seu uso, principalmente para reconstrução de eventos históricos antigos como o início do povoamento da América do Sul (>10.000 anos).

(5)

III.2 Estrutura física do cromossomo Y humano:

O cromossomo Y humano se distingue dos demais por ser curto, acrocêntrico e possuir a parte distal do braço longo uma região heterocromática constituída, principalmente, por DNA satélite altamente repetitivo (Smith et al .1987). A maior parte do cromossomo Y humano, ~60 milhões de pares de bases (Mpb), não sofre recombinação e é efetivamente haplóide. A região não-recombinante (NRY) é um mosaico de sequências de heterocromatina e três classes de seqüências eucromáticas que perfazem um total de 23 Mpb (Skaletsky et al. 2003).

Legenda: a= representação esquemática do cromossomo y.

b= porção eucromática do cromossomoY.

Figura 1: Representação esquemática do cromossomo Y humano.

Fonte: Reproduzido de Skalatsky et al. 2003.

O cromossomo Y possui particularidades genéticas muito significativas que tornam seu estudo diferenciado dos estudos de reconstrução histórica. Ele é herdado em estado hemizigótico apenas entre os homens. Os locos são ligados entre si, pois não sofre recombinação, o que o torna parecido com um organismo haplóide assexuado, acumulando variação através de mutação ao longo das gerações. Somente as pequenas regiões pseudo-autossômicas nas extremidades distais dos braços curtos Yp-PAR e longo Yq-PAR fazem pareamento e recombinação com o cromossomo X durante a meiose (Ellis et al. 1989; Freije et al.

1992)

Há no cromossomo Y humano menos polimorfismos, se comparado a

(6)

autossomos, devido à sua natureza não recombinante e haplóide. Para cada cromossomo Y na população, existem três cromossomos X e quatro de cada autossomo, o que implica na redução relativa do tamanho efetivo e da diversidade genética do Y em comparação com os outros segmentos genômicos (Jobling e Tyler-Smith, 1995). Por essas características, a variabilidade genética presente no cromossomo Y é mais sensível a eventos históricos como flutuações demográficas, fluxo gênico e gargalos populacionais.

III.3 Marcadores moleculares do cromossomo Y humano

Em 2002 o Consórcio do Cromossomo Y (YCC) começou a sistematizar a nomenclatura de linhagens (haplogrupos e haplótipos) formadas, inicialmente, por 245 marcadores polimórficos binários, entre SNPs e indels. Desde então, novos polimorfismos e linhagens foram descritas, porém várias lacunas ainda existem na filogenia do Y e, entre elas, a baixa resolução das linhagens autóctones de nativos americanos. Atualmente é consensual o reconhecimento de duas grandes linhagens específicas de nativos americanos: os haplogrupos C e Q. A primeira é encontrada apenas na América do Norte, e o haplogrupo Q (ou Q-M242) contém uma sub- linhagem autóctone americana (Q-M3), que possui o alelo derivado no marcador DYS199 (ou M3), e compreende mais de 70% dos cromossomos Y nativos americanos pesquisados atualmente. Portanto, são ainda necessários mais marcadores para discriminação de outras linhagens derivadas de Q, incluindo o sub- haplogrupo Q-M3 e os cromossomos do paragrupo Q* (Q menos cromossomos Q- M3). Esses marcadores permitirão definir novos grupos monofiléticos e comparar populações no nível intracontinental.

Para estudos evolutivos e históricos é necessário analisar marcadores moleculares que sejam polimórficos dentro de uma população e entre populações e informativos em diferentes escalas de tempo. Os marcadores de evolução lenta no cromossomo Y, denominados UEPs (Unique Event Polymorphisms), são geralmente bialélicos, podendo ser do tipo SNPs, indels (pequenas inserções ou deleções) ou inserções de retrotransposons (YCC, 2002); possuem uma baixa taxa de mutação (10 7a 10 9mutações por sítio por geração) e são eventos únicos de mutação na

(7)

maioria dos casos, nos quais os estados ancestrais e derivados dos alelos podem ser facilmente reconhecidos a partir de comparações com sequências de chimpanzés e gorilas. O alelo (geralmente um nucleotídio em posição específica) compartilhado com os demais primatas, normalmente, é o estado ancestral. Por esse motivo é possível usar um enfoque cladístico (reconhecimento de linhagens ancestrais e descendentes) para reconstruir a filogenia do cromossomo Y humano (YCC, 2002).

Os marcadores polimórficos de evolução rápida do cromossomo Y compreendem os mini e microssatélites. Os microssatélites são regiões de DNA com unidades repetidas em tandem, com motivos de 1 a 6 pb. São abundantes, ubíquos e altamente polimórficos nos genomas de eucariotos, incluindo o cromossomo Y (Tautz, 1989; Carvalho-Silva et al. 1999). A diferença do número de repetições determina a variabilidade entre os alelos (Tautz, 1989). Esses polimorfismos possuem altas taxas de mutações (10 2 a 10 5 mutações por loco por geração) (Tautz, 1989; Carvalho-Silva et al. 1999; Kayser et al. 2000). Em 2005 já haviam sido descritos 230 microssatélites do cromossomo Y humano (Gusmão et al. 2005, Jobling e Tyler-Smith, 2003,). A alta variabilidade dos locos de microssatélites possibilita estudos populacionais detalhados das linhagens de cromossomo Y (Santos e Tyler-Smith, 1996; Zerjal et al. 1997), podendo ser facilmente associados aos UEPs/SNPs em estudos filogeográficos e análises demográficas, incluindo o povoamento da América (Tarazona-Santos et al. 2001; Bortolini et al. 2003; Bailliet et al. 2009).

Uma linhagem ou haplogrupo do cromossomo Y pode ser definido como a combinação de alelos (derivados/ancestrais) formados por uma série de polimorfismos binários (UEPs) do cromossomo Y, que apresenta uma distribuição geográfica conhecida. O haplogrupo Q1a3a, por exemplo, é caracterizado pela presença dos alelos derivados em três UEPs (92R7, P36 ou M242 e DYS199), sendo observado quase exclusivamente no continente americano (Underhill et al.

1996; Santos et al. 1999a; Santos et al. 2007). O Haplogrupo Q (que contêm Q menos M3) não possui o alelo derivado no loco DYS199, e está também presente em alta frequência entre nativos americanos (Santos et al. 2007). Usando-se dados de SNPs e microssatélites do cromossomo Y, um modelo de evolução das populações indígenas da América do Sul foi sugerido recentemente conforme

(8)

Modelo Evolutivo

Tarazona-Santos et al. 2001

Andes Grande Ne

Alto fluxo gênico homogeneização

Leste da América do Sul Pequeno Ne

Baixo fluxo gênico deriva

visualizado na figura 2.

Figura 2: Modelo Evolutivo das Populações Ameríndis Pré-colombianas da América do Sul.

Fonte: Reproduzido de Tarazona – Santos et al. 2001.

Na Fig. 2 estão ilustradas as localidades das populações ameríndias andinas representadas pelos círculos vermelhos e as populações ameríndias amazônicas representadas pelos círculos verdes. As setas bidirecionais indicam fluxo gênico, cujo tamanho é proporcional à intensidade.

Dados de SNPs e microssatélites podem ser também utilizados em estudos evolucionários nas escalas de tempo mais recentes, tal como análises filogeográficas e demográficas com populações nativas da América do Sul (Tarazona-Santos et al. 2001). No estudo de Tarazona-Santos com populações nativas dos Andes, Planalto Central do Brasil, Amazônia e Chaco, um modelo evolucionário peculiar foi proposto (figura 2) que estabelece distinção entre

(9)

populações andinas e populações não-andinas. Esse modelo evidencia que populações Andinas possuem alta diversidade intrapopulacional, um grande tamanho efetivo (Ne) da população, porém baixa diversidade interpopulacional devido ao grande fluxo gênico. Populações ameríndias localizadas na Amazônia brasileira apresentam características opostas, ou seja, baixa diversidade intra- populacional (baixo Ne) e grande diversidade interpopulacional devido ao baixo fluxo gênico e maior efeito da deriva. Esta observação pode ser devida a diferentes eventos históricos e/ou características culturais daqueles povos (Tarazona-Santos et al. 2001).

Entretanto, vários questionamentos e modelos alternativos de povoamento e flutuação demográfica podem ser ainda testados (Santos et al. 2007), tanto no nível macrogeográfico (América e demais continentes) quanto regional (América do Sul), em escalas de tempo antigas e mais recentes.

III.4 Povoamento e “descoberta” da América:

No fim da última era glacial (~12.000 anos atrás) a transição Pleistoceno-Holoceno produziu um grande impacto no meio ambiente e tem sido o evento paleoecológico mais importante na América nos últimos 20.000 anos (Ab’Sàber, 1990). A América foi o último continente a ser colonizado pelos humanos modernos em período anterior ou concomitante a esta transição. Os primeiros povos chegaram, provavelmente, no fim do Pleistoceno e permaneceram isolados até o século XVI (Santos et al. 2007). Em 1492, no período do expansionismo europeu (Hoffner, 1977; Heers, 1981), Cristóvão Colombo chega até a América, mais precisamente no Caribe. O Novo Mundo é reconhecido historicamente como descoberto em 1492. No entanto, a palavra “descobrimento” é imprópria, pois estima-se que aqui já viviam cerca de 40 milhões de pessoas de inúmeras civilizações diferentes e grandiosas (Salzano e Bortolini 2002). Colombo, primeiramente, pensou que seus habitantes eram chineses, depois japoneses, mas finalmente, por estar confiante de que teria chegado às Índias, os nativos foram chamados de índios. Em 1501, durante o mapeamento da costa norte do Brasil, Américo Vespúcio, a serviço da coroa portuguesa, concebeu, diferentemente de Colombo, a descoberta de um conjunto

(10)

imenso de terras, um novo continente, sendo posteriormente reconhecido como América (Santos et al. 2007). Muito se conhece do que se passou na América pós- 1492 já que inúmeros registros escritos, figuras, pinturas, monumentos descrevem a história desde o início da colonização européia do continente. A pré-história da América, o passado pré-Colombiano do continente, não possui registros escritos.

Investigar o passado do último continente alcançado pelos humanos modernos é um grande desafio científico em que devem interagir e convergir várias disciplinas:

arqueologia, paleoantropologia, bioantropologia, antropologia social, linguística, mitologia e genética. A genética atual utiliza várias ferramentas da biotecnologia (Borém e Santos, 2008) para investigar e reconstruir esse passado, e é o objeto de trabalho desta dissertação.

A colonização européia da América promoveu, além de especulações filosóficas, científicas e religiosas, uma nova era de expansão territorial e populacional. Inicialmente a grande maioria dos migrantes era composta de homens europeus. Nas colônias portuguesas e espanholas observou-se uma assimetria demográfica de gênero, determinando que os primeiros americanos não-nativos (ou miscigenados) surgiram devido à união entre homens europeus e mulheres ameríndias (Alves-Silva et al. 2000; Mesa et al. 2000; Carvalho-Silva et al. 2001;

Salzano e Bortolini, 2002). Posteriormente, dois movimentos migratórios se seguiram, o primeiro iniciado em meados do século XVI com o tráfico de escravos vindos da África Sub-Saariana e depois, já nos séculos XIX e XX, com a chegada de muitos imigrantes asiáticos e europeus (Alves-Silva et al. 2000; Carvalho-Silva et al.

2001; Salzano e Bortolini, 2002; Carvalho-Silva et al. 2006). Assim, desde 1492, os nativos do continente americano, após terem permanecido sem contato com outros povos por provavelmente mais de 10 milênios, foram submetidos à miscigenação com pessoas de diferentes continentes, fato que foi acompanhado de uma dramática redução de sua população original. Atualmente, com exceção de alguns países sul- americanos como Bolívia, Equador, Paraguai e Peru, os povos indígenas são minorias, marginalizados das sociedades urbanas, embora tenham contribuído significativamente, do ponto de vista genético e cultural, para a população atual de todo o continente americano (Santos et al. 2007).

Evidências lingüísticas, bioantropológicas, paleoantropológicas, arqueológicas e genéticas são, regularmente, utilizadas para reconstruir a pré-história da América.

(11)

Na atualidade marcadores genéticos de ancestralidade são algumas das ferramentas mais informativas sobre a pré-história dos povos nativos americanos (Santos et al. 2007). Mesmo assim, inúmeras questões ainda persistem, principalmente em relação ao povoamento da América do Sul e sobre como se originou tamanha diversidade linguística e cultural.

III.5 Evidências do passado das sociedades nativas americanas:

Desde a “descoberta” da América, os pensadores europeus puseram-se a refletir sobre a origem dos povos indígenas. Em 1520 Paracelsus considerou a possibilidade de os Ameríndios serem crianças de um outro “Adão”, uma metáfora cientificamente sensata levando-se em consideração estudos atuais com o cromossomo Y humano (Pena et al. 1995, Santos et al. 1995, 1996, 1999a). Em 1589 o Jesuíta José de Acosta (1539-1600), missionário espanhol no Peru entre 1571 e 1586, considerou a hipótese da ocupação da América por terra, sugerindo que povos ancestrais poderiam ter vindo em ondas migratórias sucessivas, através de uma possível ponte terrestre entre Ásia e América (Hoffner, 1977). Essa idéia era realmente incrível para a época, visto que o Estreito de Bering (entre Sibéria e Alasca) e respectiva ponte de terra (Beríngia), que se formava durante as glaciações, foram descritos séculos mais tarde. Outras hipóteses sobre a origem remota dos nativos americanos foram cogitadas, incluindo a idéia de que teriam chegado ao continente por rotas transoceânicas, principalmente pelo Pacífico (Heyerdhal, 1971; Holden, 1999). Contudo, a origem asiática dos nativos americanos, cujos ancestrais teriam passado pelo Estreito de Bering (ou Beríngia, quando se refere à região emersa durante as Glaciações), é aceita pela grande maioria dos cientistas (Santos et al. 2007).

Um dos primeiros modelos científicos interdisciplinares e de maior sucesso em explicar o povoamento pré-Colombiano da América foi proposto por Greenberg, Turner e Zegura em 1986. O modelo (Greenberg et al. 1986) envolveu a análise de dados lingüísticos juntamente com dados de anatomia dental e diversidade genética (proteínas sanguíneas); o modelo foi chamado de Teoria das Três Migrações , pois sugeria que migrações anacrônicas sucessivas teriam dado origem aos três

(12)

principais agrupamentos linguísticos de povos nativos americanos: Ameríndios, Na- Denes e Aleutas-Esquimós. A primeira migração teria originado os atuais Ameríndios (todos os povos da América do Sul, Central e da maior parte da América do Norte) que seriam descendentes do povo da cultura Clóvis (EUA), cerca de 12.000 anos atrás (Greenberg et al. 1986; Santos et al. 2007). Os primeiros estudos detalhados de polimorfismos de grupos sanguíneos apoiavam a teoria das três migrações (Cavalli-Sforza et al. 1994). Contudo, surgiram modelos explicativos diferentes com dados genéticos (Pena et al.,1995; Santos et al.,1995, 1996, 1999a; Bonatto e Salzano 1997a,b; Hey 2005), paleoantropológicos (Neves e Hubbe, 2005; González- José et al. 2005) e arqueológicos (Guidon e Armaud,1991, Dixon, 2001; Santos et al.

2003). Esses modelos relativizaram a questão da divisão lingüística, que atualmente é muito controversa entre lingüistas (Bolnick et al. 2004), evitando colocá-la como explicação fundamental para diferenciação entre os grupos populacionais nativos americanos. Além disso, a idéia de migrações como eventos bem definidos (ondas), isolados e identificáveis durante a primeira colonização da América, foi também muito questionada por diferentes cientistas (Dixon, 2001; Tarazona-Santos e Santos 2002; Salzano, 2006). A história do povoamento inicial da América é única, mas pode ser averiguada e investigada de vários ângulos, por diferentes disciplinas científicas com suas respectivas limitações. Por exemplo, dados arqueológicos e paleoantropológicos nos fornecem informações da existência e passagem de povos do passado, que podem não ter deixado descendentes, portanto podem não relacionar-se ao passado direto dos povos atuais. Os dados genéticos obtidos de povos atuais dizem respeito exclusivamente ao seu passado, sobre a história dos seus ancestrais, mas não dizem nada sobre povos do passado que não deixaram descendentes, ou cujos descendentes não foram analisados por dados genéticos.

No entanto, a quantidade de dados genéticos que tem sido gerada na última década está convergindo para um cenário histórico comum, independente dos marcadores utilizados (Rosenberg et al. 2002; Ramachandran et al. 2005; Salzano 2006; Santos et al. 2007; Gonzáles-José et al. 2008).

Vários achados e estudos paleoantropológicos recentes de esqueletos pré- Colombianos sugerem que indivíduos do final do Pleistoceno na América não possuíam a morfologia craniana típica dos Mongolóides (sensu Neves e Hubbe, 2005; Gonzáles-José et al. 2005), que é característica comum dos atuais nativos

(13)

americanos. A interpretação de alguns paleoantropólogos (Neves e Hubbe, 2005) é que não há continuidade entre Mongolóides e não-Mongolóides, portanto os não- Mongolóides teriam sido extintos ou substituídos pelos Mongolóides que vieram em migrações subsequentes. Outros paleoantropólogos (Gonzáles-José et al. 2005) sugerem que os pré-Mongolóides precederam aos Mongolóides, pois há uma heterogeneidade morfológica nos crânios que persiste até tempos atuais.

Considerando os dados genéticos que indicam que os ancestrais dos nativos americanos atuais vieram para a América no Pleistoceno, quando não existiam ainda Mongolóides típicos, nem na Ásia, a interpretação consensual é de que há uma continuidade, uma linhagem ancestral-descendente entre os primeiros migrantes com morfologia não-Mongolóide e os povos indígenas de hoje (Gonzáles- José et al. 2008).

Muitos dos avanços na reconstrução histórica do povoamento da América são devido ao uso de marcadores polimórficos de herança uniparental tais como o DNA mitocondrial (DNAmt) e o cromossomo Y humano. Existe uma grande correlação entre a distribuição geográfica dessas linhagens e os movimentos populacionais pré- históricos (Santos e Tyler-Smith, 1996; YCC, 2002; Schurr e Sherry, 2004).

Utilizando-se o DNAmt, que revela o passado materno, e o cromossomo Y, que revela o passado paterno, podemos reconstruir diferentes histórias ancestrais dos povos atuais, mas são complementares. Marcadores uniparentais detectam padrões demográficos diferentes entre homens (linhagens paternas ou patrilinhagens) e mulheres (linhagens maternas ou matrilinhagens) no passado, tais como ocorrência de patrilocalidade ou matrilocalidade, bem como sociedades com poliginia ou poliandria (Levi-Strauss, 1976).

Embora os primeiros estudos com DNA mitocondrial (DNAmt) tenham concordado com a hipótese de três ondas migratórias (Greenberg et al. 1986), tal ponto de vista não foi comprovado com dados obtidos em estudos recentes (Bonatto e Salzano,1997a,b; Schurr e Sherry, 2004; Forster et al. 1996). A ocupação ancestral do continente (provavelmente ao redor de 18.000 anos atrás) por povos que teriam dado origem a todos indígenas americanos, atuais, é atualmente mais aceita (Schurr e Sherry, 2004; Santos et al. 2007), pelo menos entre biólogos. A idéia de uma origem comum na Beríngia para todos aborígenes americanos de diferentes grupos linguísticos é sustentada por vários estudos genéticos (Bonatto e

(14)

Salzano, 1997 a e b; Tarazona-Santos e Santos, 2002, Santos et al. 2007).

Recentemente, através do sequenciamento da região, 9 mil pares de bases (Kpb) do DNAmt em alguns Ameríndios (Silva-Jr et al. 2002), foi sugerido uma data de pelo menos 16.000 anos atrás para o início da expansão da população que deu origem à população atual. Este ponto de vista consensual, também revelado pelos estudos com cromossomo Y (Tarazona-Santos e Santos, 2002; Bortolini et al. 2003) afirma que populações ancestrais chegaram na Beríngia (e América) durante o Pleistoceno,

> 15.000 anos atrás, vindos do nordeste da Ásia (Santos et al. 1999a; Schurr e Sherry, 2004; Santos et al. 2007).

IV. OBJETIVOS IV.1 Objetivo Geral:

O objetivo geral deste projeto é desenvolver, padronizar e genotipar marcadores genéticos para estudar a história de populações Ameríndias.

IV.2 Objetivos Específicos:

1) Desenvolver novos marcadores do tipo SNPs (polimorfismos de nucleotídios únicos) do cromossomo Y humano que sejam informativos para estudos históricos de indígenas americanos;

2) Genotipar SNPs e microssatélites do cromossomo Y nos indígenas americanos.

3) Comparar padrões de variabilidade populacional haplotípica obtida com novos marcadores do cromossomo Y entre populações indígenas americanas.

4) Interpretar nossos resultados analisados frente a publicações e modelos recentes sobre o Povoamento das Américas (Tarazona-Santos et al. 2001;

Tarazona-Santos e Santos, 2002; Bortolini et al. 2003; Santos et al. 2007).

(15)

V. MATERIAL E MÉTODOS V.1 Amostragem

As análises foram feitas em 117 amostras do haplogrupo Q (Q-M242).Todas as amostras pertencem ao banco de dados do laboratório LBEM e foram obtidas através da colaboração dos seguintes pesquisadores:

. 33 amostras de DNA da localidade de Tayacaja, Andes Centrais do Peru.

- 19 amostras das localidades de Arequipa, nos Andes Meridionais do Peru, obtidas com a colaboração do Dr. Eduardo Tarazona-Santos com a colaboração de pesquisadores da Universidade Peruana Cayetano Herédia de Lima, Peru.

. 33 amostras de DNA colhidas no distrito de San Martín de Pangoa, na parte que compreende a selva do departamento Junín, Peru, obtidas com a colaboração da Dra. Lesly Solari Soto, do Projeto Malária da Marinha de Guerra dos Estados Unidos da América (Solari et al. 2002).

. 13 amostras de DNA de índios Coyama, região Tolima da Colômbia, cedidas pelo Professor Gustavo Adolfo Vallejo da Universidade del Tolima, Ibagué, Colômbia.

. 19 amostras de DNA de homens Inuits da Groenlândia, obtidas com a colaboração do Dr. Chris Tyler-Smith, Universidade de Oxford, Inglaterra.

Os indivíduos amostrados das localidades de Arequipa, Tayacaja possuem em comum a língua Quechua. Já os indivíduos de San Martín de Pangoa falam Quechua e Nomatsiguenga (Lewis et al. 2004,Fuselli et al. 2003). O quechua foi uma das línguas faladas durante o período do Império Inca (século XIII a XVI d.C.) na região dos Andes. Ao longo do tempo foram se incorporando a esta língua novos termos e variações fonéticas. Seu fortalecimento ganhou maiores proporções no período da colonização espanhola. Os espanhóis a utilizaram para suas relações com os habitantes andinos, sem diferenciá-los quanto a suas origens e culturas. O Quechua, portanto, é um grupo de línguas aparentadas. Ele é falado por comunidades distribuídas em um grande território no lado ocidental da América do sul, desde o sul da Colômbia até o norte da Argentina, e incluem Equador, Peru,

(16)

Bolívia e uma pequena região do Chile.

Basicamente três nichos ecológicos são encontrados nos Andes e diferenciados sobre 2.000 metros acima do mar: altiplano, vales temperados e yungas. Altiplano é uma planície entre 3.700 e 5.000 metros que se situa entre as cordilheiras andinas, com temperaturas anuais inferiores a 10°C. Vales temperados possuem altitudes dentro de 1.200 a 3.000 metros, com temperaturas médias anuais de 2 a 18°C; e Yungas, entre 800 a 2.000 metros com temperaturas superiores a 17°C ( www.Prodiversitas.bioetica.org/queChuas.html). Tayacaja é uma província do Peru situada na região de Huancavelica entre a cadeia central e a cadeia oriental da Cordilheira dos Andes. Possui as seguintes coordenadas geográficas: Latitude 12º 24´ S; Longitude 74º34´W e 3.600 metros é a Altitude máxima registrada em seu território (www.mutayacaja.gob.pe/datos_grls.php). Arequipa é uma província do Peru, capital da região de Arequipa, com Latitude 16º 23'S, Longitude71º 32'W e Altitude 2.335 m. Situa-se no sul do país, num vale de montanhas desérticas da Cordilheira dos Andes (www.muniarequipa.gob.pe) . San Martín de Pangoa é um distrito da província de Satipo do departamento de Junín , região centro-sul do Peru, Latitude 11º 25'S, Longitude 74º 29'W e Altitude 839 metros. Situa-se na Amazônia Peruana. A lingual nesta região é uma mistura de Quechua e Nomatsiguenga (Lewis et al. 2004,Fuselli et al. 2003).

Coyaima é um município da região de Tolima, sul da Colômbia, com Latitude 3° 50′N, Longitude 74° 5′ W e Altitude 385 metros. Os Coyaimas, do ponto de vista étnico, faziam parte de uma grande sociedade tribal, os Pijao. Segundo estudos históricos e arqueológicos, os Pijao pertenciam a um só tronco lingüístico, o Caribe, diferente do tronco lingüístico dos Andes. Devido a fatores de aculturação e dominação durante a colonização espanhola, atualmente não existem vestígios da língua ancestral, sendo falado o espanhol. Porém, os Coyaima, localizados atualmente, em território legalizado, ao sul do departamento de Tolima, conservaram por muito tempo um tipo de assentamento disperso, típico dos Pijao, segundo relatos antropológicos; seu padrão sofreu modificações ao longo do tempo, devido a perda territorial e crescimento populacional. Em 1608 foi fundado um povoado indígena que se denominou “Nuestra Señora Del Carmen de Coyaima” cuja formalização se deu 1621. Em 1863 o povoado se eleva à categoria de município com a denominação de Alcadia de Coyaima. Os povos Pijao possuíam muitas

(17)

rivalidades entre si, principalmente os Coymaima, que se situavam em vales de rios, e os Pijao da Serra. Quando a coroa espanhola começou a tentativa de domínio dos territórios dos Pijao, os Coyaima se converteram em aliados dos espanhóis. Os povos Pijao rivais ofereceram férrea resistência aos colonizadores. Mas os espanhóis declararam uma guerra de genocídio. Alguns outros indígenas do grupo Pijao e os Coyaimas conseguiram sobreviver etnicamente apesar das restrições territoriais, econômicas e sociais impostas pelos colonizadores (Oliveros, 2000, González, 2009).

Os Inuits da Groelândia falam a língua do grupo Esquímó-Aleuta (http://www.inuit.org/).

Legenda: Mapa com localidade das amostragens de indígenas da América do Sul: Coyaima (1), San Martín de Pangoa (2), Tayacaja (3) e Arequipa (4). Sem escala.

Figura 3: Mapa das localidades amostradas.

Na Fig. 3 visualíza-se que as amostragens de indígenas da América do Sul estão divididas em dois agrupamentos: Andes Peruanos (Arequipa, San Martin de Pangoa, Tayacaja) e Andes Colombianos (Coyaima).

(18)

V.2 Marcadores do Cromossomo Y:

V.2.1 Polimorfismos de ponto (SNPs)

V.2.1.1 SNP M242

O alelo derivado M242 T (Seielstad, 2003), SNP ID rs8179021, posição 13527976 do cromossomo Y, caracteriza o haplogrupo Q (Karafet et al. 2008) e foi genotipado através da amplificação por Reação de Cadeia Polimerase (PCR) e enzima de restrição. Iniciadores utilizados: M242F: AACTCTTGATAAACCGTGCTG e M242R:

TCCAATCTCAATTCATGCCTC. Condições da PCR: Tampão de Reação (Invitrogen) 1x, MgCl2 (Invitrogen) 1,5 mM, dNTPs (GE Healthcare) 200 µM, 1 µM de cada iniciador, Taq Polimerase Platinum (Invitrogen) 0,5 u/tubo, 40 ng DNA/tubo (1 µl), água milliQ autoclavada para completar o volume final de 12 µl. Utilizou-se o termociclador PTC-100 (MJ Research. INC.) nas seguintes temperaturas: 1 ciclo 95°C, 5 min, 35 ciclos 94°C, 1 min, 58°C, 1 min, 72°C, 1min, 1 ciclo 72°C, 10 min,1 ciclo de 4°C, 10 min. Tamanho do produto amplificado: 366 pb. As amplificações foram visualizadas em gel de agarose 0,9%, cuba horizontal, Tampão de corrida TAE 0,5%, 5 µl do produto da PCR , 0,5 µl do Tampão de amostra, Padrão 1 KB Plus DNA Ladder (Invitrogen), fonte Bio Rad,100 V, 20 minutos, coloração Brometo de Etídio, visualização UV (Equipamento Ultra – Lum, UV Transiluminator).

Os produtos amplificados pela PCR do marcador M242 foram tratados com a Enzima de Restrição Bsp1286I (Biolabs): Tampão 4 (Biolabs) 0,8 µl, BSA 0,08 µl, enzima 0,5 µl (1U enzima/amostra), produto de PCR 7 µl , 12 hrs banho maria, 37°C.

Os produtos tratados foram visualizados em gel de poliacrilamida 8% ou agarose 2% para visualização dos alelos ancestrais e derivados Os padrões de bandas dos alelos ancestrais e derivados foram visualizados em gel de poliacrilamida 8% não desnaturante, em cuba vertical, tampão de corrida TBE 1x, 5 µl do produto tratado com enzima, 0,5 µl do Tampão de amostra, Padrão 1 KB Plus DNA Ladder (Invitrogen), fonte Bio Rad, 40mA, por no mínimo 3 horas, coloração prata.

.

(19)

Sítio de Restrição da enzima Bsp1286I:

5’...GDGCH▼C...3’

3’...C▲HCGDG...5’

V.2.1.2 SNP M3

O alelo derivado M3 ou DYS199 T (Underhill et al. 1996), SNP ID rs3894, posição 17605757 do cromossomo Y, que caracteriza o sub-haplogrupo Q1a3a ou Q-M3 (Karafet et al.2008) foi genotipado através da amplificação por Reação de Cadeia Polimerase (PCR) e enzima de restrição. Iniciadores utilizados: M3F:

TAATCAGTCTCCTCCCAGCA (Underhill et al. 1996) e M3R modificado para reconhecimento o sítio de restrição da enzima MfeI: AGGTACCAGCTCTTCCCAATT (Santos et al. 1999a). O tamanho do produto amplificado é de 202 pb. Condições da PCR: Tampão de Reação (Invitrogen) 1x, MgCl2 (Invitrogen) 1,5 mM, dNTPs (GE Healthcare) 200 µM, 1 µM de cada iniciador, Taq Polimerase Platinum (Invitrogen) 0,5 u/tubo, 40 ng DNA/tubo (1µl), água milliQ autoclavada para completar o volume final de 12 µl. Utilizou-se o termociclador PTC-100 (MJ Research. INC.) nas seguintes temperaturas: 1 ciclo 94°C, 3 min, 30 ciclos 61°C, 20 seg, 72°C, 30 seg,94°C, 20 seg, 1 ciclo 72°C, 7 min,1 ciclo de 4°C, 10 min.

As amplificações foram visualizadas em gel de poliacrilamida 8%, em cuba vertical, tampão TBE 1x, 40 mA, por no mínimo 3 horas, coloração prata. Os produtos de PCR foram tratados com enzima MfeI (Biolabs): tampão 4 (Biolabs) 1,5 µl, água milliQ autoclavada 5,4 µl, MfeI 0,1 µl (0,5U/amostra), 5 µl do produto de PCR, banho maria 12hrs, 37°C. Os padrões de bandas foram visualizados em gel de poliacrilamida 8% não desnaturante, conforme já descrito.

Reconhecimento do sítio de restrição:

5’...C▼AATTG...3’

3’...GTTAA▲C…5’

(20)

V.2.2 Microssatélites:

V.2.2.1 Protocolo utilizado na genotipagem dos microssatélites: DYS389I, DYS389II, DYS390, DYS456, DYS19, DYS458, DYS437, DYS438, DYS448, GATA_H4, DYS391, DYS392, DYS393, DYS439, DYS635.

PCR multiplex: AmpFlSTR® Yfiler™ Kit A&B Applied Biosystems conforme instruções do fabricante.

Genotipagem: GeneScan™ -500 LIZ® Size Standard A&B Applied Biosystems conforme instruções do fabricante.

Equipamento: Sequenciador 3130xl Genetic Analyzer A&B Applied Biosystems.

Capilar 36cm Part No-4315931, Polímero POP 7 A&B Applied Biosystems.

V.2.2.2 Análise populacional de dados dos microssatélites:

A análise dos alelos dos 15 locos de microssatélites foi executada no Programa de Análise GeneMapper® ID Software Versions 3.2, Human Identification analysis A&B Applied Biosystems. Foram analisadas 33 amostras da população Tayacaja (QT), 33 amostras da população de San Martín de Pangoa (SM), 19 amostras da população de Arequipa (QA) e 13 amostras da população de Coyaima (CO), sendo que 5 amostras CO pertencem ao haplogrupo Q1a3a e 8 amostras pertencem ao paragrupo Q*, um total de 98 amostras.

Todas as análises populacionais foram executadas no Programa Arlequin (Excoffier,L. et al. 2006). A análise intrapopulacional foi estimada utilizando cálculos de diversidade haplotípica. Para análise de divergência interpopulacional foi feito um teste exato de diferenciação baseado na freqüência dos haplótipos utilizando 10.000 passos de cadeia de Markov (Raymond e Rousset, 1995). Para cálculos dos componentes da variância genética total foi utilizada a análise de variância molecular (AMOVA). Foram utilizadas as quatro populações: QT (33 amostras), SM (33 amostras), QA (19 amostras) e CO (5 amostras), um total de 90 amostras. As populações foram separadas em dois grupos para a análise do parâmetro RST, na

(21)

estrutura hierárquica QT+QA+SM x CO. As três populações foram grupadas por pertencerem geograficamente ao Peru. A população Coyaima é geograficamente distante das três populações e pertence à Colômbia. Também foram feitos o teste exato de diferenciação e análise de Rst par a par entre populações.

V.2.3 Estratégia de busca de novos SNPs

V.2.3.1 Construção de uma rede filogeográfica

Uma rede de haplótipos foi construída pelo método Median Joining usando o software Network 4.5.1.0 (Bandelt et al. 1999) com dados de 6 microssatélites (DYS19, DYS390, DYS391, DYS393, DYS389a e DYS389b) de 117 indígenas americanos com cromossomos Q* (n=14) ou Q-M3 (n=103) oriundos de distintas localidades (Andes Peruanos, Andes Colombianos e Inuits da Groenlândia).

V.2.3.2 Escolha das amostras

Foram selecionados indivíduos com haplótipos divergentes de acordo com sua distribuição na rede filogeográfica (círculos vermelhos na Fig.8), considerando também distintas origens geográficas. Metodologia utilizada: algorítimo Median Joining, software Network (Bandet et al.,1999).

(22)

V.2.3.3 Amplificação das amostras

As amostras dos indivíduos selecionados foram amplificadas com os iniciadores descritos em Karafet et al. (2008). Na Tab. 1 são visualizados: a nomenclatura dos marcadores utilizados (SNP), o Haplogrupo a que pertence o marcador, a posição do marcador no cromossomo Y, os iniciadores (primers) utilizados, o tamanho das amplificações em pares de bases, as referências bibliográficas para cada SNP (Karafet et al. 2008) e as temperaturas padronizadas (T°C) neste trabalho, para cada reação.

Tabela 1: Iniciadores utilizados nas PCRs:

SNP

Haplogrupo (YCC, 2008)

Posição -

Y Primers Forward Primers Reverse

T°C

PCR PCR (bp) Referência M19 Q1a3a1 20192619 ctggtcataacactggaaatc tgaacctacaaatgtgaaactc 50°C 333 Underhill et al. 1997 M25 Q1a2 20326052 aaagcgagagattcaatccag ttttagcaagttaagtcaccagc 52°C 340 Underhill et al. 2001 M120 Q1a1 20366782 gagcttggactttaggacgg aaactttaaggcacttctggc 50°C 495 Underhill et al. 2001 M143 Q1a2 20165365 catcttaaaatacatttcatagcttt gcttactattaggtctagcatcct 50°C 424 Underhill et al. 2001 M194 Q1a3a2 13523944 gcctggatgaggaagtgag gccttctccatttttgacct 57°C 426 Underhill et al. 2001 M199 Q1a3a3 13540505/4 tgaggtggaatgtatcagtatacc tgatttcaaggatttgttagtctt 55°C 444 Underhill et al. 2001 M323 Q1a6 20327106 gctggcaagacacttctga aatatgttcctgacaccttcc 57°C 352 Shen et al., 2004 M346 Q1a3 2947155 agatgggaaaggcagccaa tctgtccacatgtgtccgtg 57°C 419 Sengupta et al., 2006 M378 Q1b 13536901 tatgcatttgttgagtatatgtc gttctgaatgaaagttcaaacg 55°C 326 Sengupta et al., 2006 MEH2 Q1a 4985637 attcataatatttgattcagaacag taccatgaaaattcataatccaca 55°C 938 YCC, 2002

N14 Q1a1 13540044 ttagacaacttactactttg taaacattacatgagaaatt 55°C 445 Deng et al. 2004 P36.2 Q1 13006449 tgaaggacagtaagtacaca taagtccattgatctacaga 50°C 637 YCC, 2002 P48 Q1a4 13006660 tgaaggacagtaagtacaca taagtccattgatctacaga 55°C 637 Hammer et al. 2003 P89 Q1a5 13359859 acattacaggaccttgat tgcctaacaatactccc 55°C 857 Wilder et al. 2004 P106 Q1a3a3 13932316 ttattccacccagcactgtta aggcacaaatggtaaggtctt 57°C 1090 Karafet et al.2008 P292 Q1a3a3 13540161 tgaggtggaatgtatcagtatacc tgatttcaaggatttgttagtctt 55°C 444 Karafet et al.2008

(23)

Figura 4: Haplogrupo Q

Fonte: Reproduzido de Karafet et al. 2008.

Protocolo das reações de PCR: Tampão de Reação (Invitrogen) 1x/tubo, MgCl2 (Invitrogen) 1,5 mM/tubo, dNTPs (GE Healthcare) 200 µM/tubo, Primer F 1 µM/tubo, Primer R 1 µM/tubo, Taq Polimerase Platinum (Invitrogen) 0,5 u/tubo, Betaine 3,5µl/tubo, 40 ng DNA/tubo (1µl), água milliq autoclavada para completar o volume final de 20µl . Utilizou-se o termociclador PTC-100 (MJ Reserarch. INC.) nas seguintes temperaturas: 1 ciclo 95°C, 5 min, 35 ciclos nas temperaturas padronizadas para cada marcador (Fig. 1), 1 min, 58°C, 1 min, 72°C, 1min, 1 ciclo 72°C, 10 min,1 ciclo de 4°C, 10 min.As amplificações foram visualizadas em gel de agarose 0,9% conforme descrito anteriormente.

V.2.3.4 Sequenciamento das amostras amplificadas

Foram sequenciados 14 locos de cópia única do cromossomo Y nos indivíduos selecionados (totalizando ~6.000 nucleotídeos analisados). Reação de Sequenciamento: Kit DyEnamic™ ET dye terminator (GE Healthcare), volume final de reação de 10µl conforme instrução do fabricante. Matrix 93-79672 MegaBace

Haplogrupo Q (Karafet et al. 2008)

(24)

Long Read Matrix. Equipamento: Sequenciador MegaBACE 1000.

O marcador M194 teve reações de PCRs repetidas para a amostra de interesse de confirmação e seqüenciadas mais 60 amostras Q (dados não publicados) no Sequenciador 3130xl Genetic Analyzer A&B Applied Biosystems.

Capilar 36cm Part No-4315931, Polímero POP 7 A&B Applied Biosystems.

V.2.3.5 Alinhamento das sequências

O alinhamento das seqüências, comparação com sequências de referência e conferência dos polimorfismos foram feitas através dos programas Phred, Phrap, Consed e MEGA4 Clusta l (Tamura et al. 2007). Foi analisado um total de 112 sequências.

V.2.3.6 PCR TEMPO REAL

Foram testadas 52 amostras de ameríndios da região dos Andes Peruanos (dados não publicados), em PCR Tempo Real , dentre as quais 20 eram novas amostras Q- M3 para o novo polimorfismo encontrado.

Reação de genotipagem: 0,25 µl da solução de genotipagem TaqMan Genotyping Assay Mix (20x), contendo a sonda encomendada pelo grupo de trabalho à Applied Biosystems; 2,50 µl da solução de TaqMan Genotyping Assay Mix (20x); 2,25 µl de DNA (1 a 4 ng). Equipamento: 7900HT Fast Real time PCR System, Applied Biosystems.

(25)

VI. RESULTADOS:

VI.1 Genotipagem de SNPs do cromossomo Y

Na Fig. 5 são visualizados os alelos do polimorfismo M3. Todas as amostras já haviam sido tipadas pelo marcador DYS199 em trabalhos anteriores. Somente algumas poucas amostras da população Coyama foram examinadas novamente para fins de confirmação.

Figura 5: Alelos do polimorfismo M3 do cromossomo Y humano.

(26)

Na Fig. 6 visualiza-se os alelos do polimorfismo M242 .

Figura 6: Alelos do polimorfismo M242 do cromossomo Y humano.

Na Tab. 2 visualiza-se o número de indivíduos analisados em cada população, o valor absoluto de indivíduos pertencentes ao Haplogrupo Q1a3a e Paragrupo Q* ou (Haplogrupo Q menos Q1a3a).

Tabela 2: Número de indivíduos pertencentes ao Paragrupo Q* identificados com o marcador M242:

100 bp

0 0 0 0 0 1 1 Controle 0 Controle 1 1Kb

LEGENDA: amostras de produt o da PCR M242 tradadas com a Enzi ma de Restrição Bs p1286 12 hrs , 37° C. Alel o ancestral (0) do Polimorfismo M242: 164 e 149 bp (C/ G). Alelo derivado (1) do Polimorfismo M242: 336 bp que possui a mutaç ão (C/T). Observaç ão: o controle O que é Alelo ancestral (0) apresentou uma digestão parcial. As dua bandas 164 e 149 bp, como estão muito próximas, não são visualizadas neste gel de agarose 2%..

400 bp 300 bp 200 bp

100 bp

(27)

VI.2 Genotipagem de microssatélites do cromossomo Y

VI.2.1 Alelos dos microssatélites

Foram analisados 98 indivíduos do Haplogrupo Q-M3 ( cromossomos com o alelo derivado T de M3) nas quatro populações estudadas com 15 microssatélites:

DYS389I, DYS389II, DYS390, DYS456, DYS19, DYS458, DYS437, DYS438, DYS448, GATA_H4, DYS391, DYS392, DYS393, DYS439, DYS635. O Anexo II apresenta os resultados dos indivíduos genotipados com estes microssatélites. E o Anexo I a freqüência dos alelos dos 15 locos de microssatélites em cada população.

Foram observados 76 haplótipos de microssatélites presentes em cromossomos do Haplogrupo Q-M3. A diversidade haplotípica média total observada para as três populações dos Andes Peruanos que corresponde à população de Arequipa (QA), Tayacaja (QT) e San Martín de Pangoa (SM) foi de 0,9899 +/- 0,0147.

O Loco DYS437 foi o que apresentou menor variabilidade dentre todos os Locos , somente dois alelos, sendo que o alelo 14 ocorre em muito maior freqüência nas quatro populações. Um total de 6 Locos apresentaram 4 alelos: DYSGATA_H4, DYS389I, DYS438, DYS393, DYS635, DYS19. Alelos mais freqüentes: O alelo 12 do DYSGATA_H4; alelos 13 e 14 do DYS389I, alelo 11 do DYS438, sendo o único alelo que aparece na população Coyaima tanto nas amostras Q-M3, quanto nas Q*.

O alelo 13 do DYS393 é o mais freqüente, assim como o alelo 22 do DYS635 e o alelo 13 do DYS19. Os locos que apresentaram cinco alelos foram: DYS391, DYS389II, DYS456, DYS392 e DYS439. O alelo 10 do DYS391 foi o mais frequente nos indivíduos Q-M3. Observa-se que o alelo 6 desse loco aparece somente nos indivíduos de Coyaima Q*. O alelo 17 do DYS389II foi o mais frenquente também nos indivíduos Q-M3, o alelo 16 só aparece nos indivíduos Coyaima Q*. O alelo 15 do DYS456 apresenta a maior freqüência nas quatro populações. O alelo 14 se destaca para o loco DYS392. O loco DYS439 para a população de Arequipa apresenta 4 alelos proporcionalmente equilibrados. Na população de San Martín de Pangoa, o alelo 13 se destaca pela maior frequência, assim como o alelo 14 para a

(28)

população de Tayacaja. O loco DYS448 é o único que apresenta seis alelos, sendo que o alelo 20 se destaca nos indivíduos Q-M3 e o alelo 19 para as amostras Q* de Coyaima. Os locos DYS390 e DYS458 apresentaram sete alelos (maior variabilidade), destacando os alelos 23 e 24 do DYS390 e alelo 16 do DYS458 para indivíduos de Arequipa, San Martín de Pangoa e Tayacaja, sendo o alelo 15, o de maior frequência para indivíduos Q* de Coyaima.

VI.2.2 Análise populacional dos dados de microssatélites do Y

A AMOVA foi realizada com o programa Arlequin. A amostragem da população Q1a3a Coyaima (n=5) apresentou um Rst = 11,55 e P = 0,08 (não significativo).

Na Fig. 6 são visualizadas as significâncias para as análises de RST par a par (acima da diagonal) e para o Teste Exato de Diferenciação Populacional (abaixo da diagonal). A população Tayacaja é representada por QT, Arequipa por QA, San Martín de Pangoa por SM e Coyaima por CO.

QT QA SM CO QT - - + QA - - - SM + + + CO - - -

Legenda: Resultados da significância dos cálculos de distâncias (RST) entre pares de populações (acima da diagonal) e para o Teste Exato de Diferenciação Populacional (abaixo da diagonal), ambos calculados com o programa Arlequin. O símbolo + indica uma diferença significativa (P<0,05).

Figura 7: Análise populacional.

(29)

VI.3 Busca de novos marcadores do tipo SNP

VI.3.1 Redes de filogeográficas:

Na Fig. 8 são visualizadas duas redes filogeográficas: o Paragrupo Q* (Q-M242 menos Q-M3) e o Sub-haplogrupo Q1a3a (Q-M3). As amostras escolhidas para PCRs e sequenciamento pertencem aos haplótipos circulados de vermelho. Utilizou- se o método Median Joining usando o software Network 4.5.1.0 (Bandelt et al. 1999) com dados de 6 microssatélites (DYS19, DYS390, DYS391, DYS393, DYS389a e DYS389b) de 117 indígenas americanos com cromossomos Q* (n=14) ou Q-M3 (n=103) oriundos de distintas localidades: Andes Peruanos (Arequipa, San Martin de Pangoa e Tayacaja), Andes Colombianos (Coyaima) e Inuits da Groelândia (de Maat et al. 1999).

(30)

Figura 8: Rede filogeográfica I.

método Median Joining, software Network.

(31)

VI.3.2 Identificação de novos polimorfismos do tipo SNP

Na Fig. 9, visualiza-se o novo alelo derivado T, posição 263 do alinhamento encontrado próximo ao SNP M194 T>C, posição 101 do alinhamento. A amplificação foi de 360 pb. Os seqüenciamentos com todos os marcadores foram realizados no seqüenciador MegaBACE como, por exemplo, SM19 na terceira linha. Somente os seqüenciamentos do SNP M194 tiveram PCRs repetidas e seqüenciadas em um segundo seqüenciador,o ABI3130 XL: a amostra SM19 e mais 59 novas amostras Q* e Q1a3a (dados não publicados). O alinhamento das seqüências, a comparação com sequências de referência e conferência dos polimorfismos foram feitos através dos programas Phred, Phrap, Consed e MEGA4 Clustal (Tamura et al. 2007).

Legenda: Polimorfismo SA01 com transição de C>T próximo ao SNP M194. Alinhamento gerado com o programa Mega.

Figura 9: Polimorfismo SA01.

(32)

Na Fig. 10, é visualizada a genotipagem por RT-PCR dos alelos do novo polimorfismo C>T no marcador SA01. Os pontos vermelhos representam os indivíduos que possuem o alelo derivado T (alelo X) e os pontos azuis (alelo Y) representam indivíduos com o alelo ancestral (C). O ponto preto no canto esquerdo inferior do gráfico representa o controle do ensaio.

Figura 10: Plotagem de discriminação de alelos.

Método PCR Tempo Real.

Com a reação RT-PCR foram confirmadas as mutações dos três indivíduos visualizados na Fig. 8 e encontrados mais quatro indivíduos Q-M3 com polimorfismo novo. Ensaio realizado com 52 novas amostras.

(33)

Tabela 3: Sequência dos experimentos para a procura do novo SNP próximo ao SNP M194

Haplog. Amostras PCR M194 1o- Seq Result. 2o- Seq Result.

RT-

PCR Result. n Total Result. Freq.

Q* M242 (1) 1 1 0 47 0 20 0 68 0 0

Q1a3a M3 (1) 8 4 1 12 2 20 4 36 7 0,194

controle M242 (0) M3 (0) 0 0 0 1 0 12 0 12 0 0

Total 9 5 1 60 2 52 4 116 7 0,06

Na Fig. 11 é apresentada uma rede filogeográfica construída com haplótipos de algumas amostras Q* e Q1a3a. O posicionamento dos haplótipos de microssatélites das quatro amostras que possuem o alelo derivado T no loco SA01 é indicado pelo círculo vermelho.

Legenda: Rede filogeográfica construída pelo método Median Joining com o software Network.

Figura 11: Rede filogeográfica II.

(34)

VII. DISCUSSÃO FINAL

Nesta pesquisa foram selecionadas amostras pertencentes ao haplogrupo Q para um estudo específico de cromossomos Y de origem nativa americana. Neste haplogrupo foram estudados indivíduos do paragrupo Q* (Q-M242 menos Q-M3) e o Sub-haplogrupo Q-M3 (Q1a3a) em um banco de dados que já havia sido organizado e catalogado de forma que foi facilitada a continuidade de investigações anteriores realizadas no Laboratório LBEM. Neste estudo detalhado do haplogrupo Q procurou- se aumentar a resolução de linhagens, cuja última árvore filogenética detalhada do cromossomo Y foi publicada em 2008 (Karafet et al. 2008). Isto foi feito com a genotipagem de microssatélites e uma análise detalhada para identificação de novos SNPs discriminantes de sublinhagens do haplogrupo Q.

Devido à disponibilidade de amostras e o interesse na colonização da região andina, estudou-se principalmente populações dos Andes Peruanos (San Martin de Pangoa, Arequipa, Tayacaja) e da Colômbia (Coyaima). Estudos anteriores evidenciaram um modelo de povoamento diferenciado entre populações andinas e amazônicas, Fig. 2. (Tarazona–Santos et al. 2001). Esta evolução populacional distinta era devido a diferenças de tamanho efetivo populacional, fluxos gênicos e diversidades diferentes intrapopulacionais e interpopulacionais entre povos dos Andes e os demais povos nativos sul-americanos (Tarazona-Santos et al., 2001).

Dessa forma, discriminar mais linhagens nas populações andinas em comparação com linhagens de outras partes do continente deve permitir análises mais detalhadas do processo de evolução destas populações sul-americanas.

Quando observa-se a filogenia do cromossomo Y no YCC 2002 e Karafet et al. 2008, nota-se uma expansão recente do haplogrupo Q com várias sublinhagens independentes umas das outras. No anexo III observa-se a discriminação de 13 sub- haplogrupos resolvidos por 17 SNPs, além do paragrupo Q* (Karafet et al 2008). No entanto, faltam SNPs discriminantes de sublinhagens de Q e Q-M3, principalmente na América do Sul. Por isto, foram utilizados os iniciadores que constam na Tab. 1, empregados na procura de novos polimorfismos por sequenciamento. O novo SNP com a transição C>T chamado SA01 foi obtido através do seqüenciamento de toda a extensão amplificada do loco M194 e só foi encontrado em alguns indivíduos do sub-

(35)

haplogrupo Q-M3 (Q1a3a). Por esta razão considera-se o alelo T no marcador SA01 o identificador de um novo sub-haplogrupo de Q-M3, sendo que o alelo C é considerado ancestral e o alelo T como derivado, porque o alelo C é encontrado em uma freqüência maior (0,806) e nas outras linhagens do cromossomo Y (exceto Q- M3), enquanto o alelo T (0,194) se apresenta em uma fração dos indivíduos Q-M3, Tab. 3. Corrobora com esta conclusão o agrupamento das amostras que apresentaram o novo SNP na rede filogeográfica construída com haplótipos de microssatélites de Q-M3, Fig. 10. A mutação SA01 foi encontrada primeiramente na amostra SM19 pertencente à população de San Martín de Pangoa. As demais amostras testadas pertencem a outra amostragem de ameríndios peruanos e bolivianos (dados não publicados).

Em relação às análises populacionais com haplótípos de microssatélites, observa-se na AMOVA uma diferenciação moderada (11,5%) entre os grupos populacionais Andes Peruanos (QT+QA+SM) e Andes Colombianos (CO), mas que se mostrou não significativa (p = 0,08). No entanto, os Coyaima se mostraram significativamente diferenciados de duas das populações peruanas com a análise de FST (RST) entre pares de populações, mas que não apresentou significância com o Teste Exato de Diferenciação Populacional (Fig. 6). Uma diferenciação significativa entre as populações ameríndias do Peru e Colômbia era esperada, visto que estão em localidades muito distantes entre si, e os dois grupos são geograficamente distantes falam idiomas diferentes, além de outras peculiaridades históricas e culturais. As populações peruanas Tayacaja e Arequipa falam Quechua da família Andina de línguas, foram influenciados pelo domínio Inca e possuem uma cultura intrínseca do Altiplano peruano. San Martín de Pangoa é um município localizado na Amazônia Peruana, onde há indivíduos de ascendência Nomatsiguenga e Quechua.

O pequeno número amostral que foi analisado para os índios Coyaima dentro do haplogrupo Q-M3 (N=5) explica a falta de significância dos testes AMOVA e Exato de Diferenciação Populacional. Por outro lado a população de San Martín de Pangoa que possui um número populacional analisado expressivo (N=33), apresentou um p significativo no Teste Exato de diferenciação, distinguindo-se das populações Quéchuas de Arequipa e Tayacaja. As populações de Arequipa e Tayacaja situam- se nas regiões do altiplano andino, enquanto San Martín de Pangoa está numa região na floresta Amazônica. A localidade de San Martín de Pangoa difere

(36)

geograficamente das populações de Arequipa e Tayacaja; as duas últimas populações foram influenciadas pelo domínio Inca por se situarem no Altiplano andino enquanto San Martín de Pangoa situa-se na selva amazônica peruana numa baixa altitude, com indivíduos de ascendência Nomatsiguenga que tem alguns migrantes de ascendência Quechua, vindos do Altiplano. A diversidade haplotípica média total observada para as três populações dos Andes Peruanos de 0,9899 +/- 0,0147 corrobora com o modelo de ocupação das populações pré-colombianas nos Andes (Tarazona-Santos et al. 2001). Conclui-se que peculiaridades culturais podem ser comprovadas com um maior número de marcadores genéticos do tipo microssatélites como demonstrado para a população de San Martín de Pangoa.

O software de genotipagem foi eficiente quanto à reprodutibilidade dos resultados, especificidade e sensibilidade. A genotipagem de novos microssatélites foi informativa e permitiu discriminar mais haplótipos e aumentar a resolução de linhagens de cromossomo Y entre indígenas americanos.

As diferenças moleculares encontradas estão em acordo com as diferenças culturais destas populações, corroborando com o uso destes marcadores SNPs e microssatélites do cromossomo Y para o estudo histórico de populações nativas da América do Sul.

VIII. PERSPECTIVAS

A primeira perspectiva de continuidade deste trabalho é validar este novo SNP em uma maior amostragem para o uso como marcador de linhagem a partir de, genotipagem através de PCR tempo Real de um número maior de indivíduos nativo- americanos de diferentes localidades geográficas.

A segunda perspectiva é procurar novos polimorfismos do cromossomo y amplificando e seqüenciando cerca de 580 pb da região não recombinante da eucromatina do cromossomo Y que não possuem regiões repetitivas. As amostras seriam escolhidas nos diferentes grupos apontados pela análise de microssatélites analisados pelo programa Structure. A resolução de um número maior de linhagens paternas dentro do haplogrupo Q permitirá uma resposta mais detalhada e ajudará

(37)

a responder questionamentos relacionados ao povoamento pré-colombiano da América (Gonzalez-José et al. 2008).

A terceira perspectiva é aumentar a amostragem da população Coyaima com novas tentativas de amplificação dos microssatélites nas amostras que não obtiveram sucesso na genotipagem deste trabalho com uma metodologia de purificação de possíveis interferências na PCR multiplex.

IX. CONCLUSÕES

1. A utilização de locos de microssatélites do cromossomo Y para a construção da rede filogeográfica e escolha de amostras com haplótipos distantes mostrou-se eficiente.

2. A abordagem adotada neste estudo mostrou-se potencialmente útil para busca de novos polimorfismos específicos do cromossomo Y humano em linhagens com pouca resolução, a partir de um gasto relativamente pequeno de material de consumo, tempo, recursos financeiros e, principalmente, de DNA de amostras que podem ser extremamente valiosas devido a dificuldades de coleta.

3. O marcador do tipo SNP é capaz de identificar uma sublinhagem do haplogrupo Q-M3 que está presente nas populações andinas.

4. Os haplótipos de microssatélites do Y podem ser utilizados para análises populacionais detalhadas entre nativos americanos, cujos testes preliminares indicam uma correlação positiva com aspectos histórico-culturais.

Referências

Documentos relacionados

Desenvolver o Programa de Prevenção de Riscos Ambientais - PPRA em todas as áreas e funções de trabalho que ofereçam risco á saúde e integridade física dos

Podemos dizer que encontramos em São Gonçalo e Campanha uma estrutura semelhante em relação aos domicílios com crianças nas escolas, ou seja, havia um

§ 1º - A Assembleia Geral será instalada, em primeira convocação, com a presença da maioria simples dos seus membros com direito a voto, ou uma hora depois, em segunda e

A Figura 52 apresenta um exemplo de translação na região NCL, reposicionando em (0,0,-10) no seu sistema de coordenadas local. Figura 52 Exemplo de translação de uma região

[r]

Monteiro 8 AUDITOR ANGLOGOLD ASHANTI LAMEGO, QUEIRÓZ, CUIABÁ AND ENERGY PLANT – MG - BRAZIL ORE OPERATION MINE Julio C. Monteiro 8

Apoio a investimentos na implantação e modernização de infraestrutura e serviços necessários à dinamização econômica dos territórios rurais, ao fortalecimento

ano, permitida uma recondução consecutiva e eleita com os respectivos suplentes por seus pares. A eleição do CCPGG será solicitada ao Departamento de Geografia e ao corpo