• Nenhum resultado encontrado

Capítulo 1 Introdução

1.9. Marcadores de linhagem

Devido à não recombinação e a uma baixa taxa de mutação, os marcadores de linhagem são importantes para estudos evolutivos e em análises de parentesco, principalmente em casos em que as amostras de referência e a amostra para comparação se encontram separadas por várias gerações (Buckleton, Krawczak e Weir, 2011; Budowle e Daal, Van, 2008).

O ADN mitocondrial (ADNmt) e a porção não recombinante do cromossoma Y (NRY) são considerados marcadores de linhagem, uma vez que são transmitidos por via materna e por via paterna, respetivamente, sem a ocorrência de recombinação (figura 11) (Cockerton, McManus e Buckleton, 2012; Ennafaa et al., 2011; Salas et al., 2007). Normalmente, as distâncias genéticas entre populações são significativamente maiores para a NRY do que para o ADNmt, sendo este fenómeno explicado por uma menor taxa de migração por parte do sexo masculino do que do sexo feminino (Ennafaa et al., 2011). A existência de diferenças nas taxas de migração do sexo masculino e do sexo feminino influencia os padrões geográficos e, mais propriamente os níveis de diversidade genética da NRY e do ADNmt. Em 1998, Seielstad e colaboradores publicaram a primeira comparação entre a diversidade da NRY e do ADNmt, em que demonstraram que a taxa de migração do sexo feminino é oito vezes maior do que a do sexo masculino e que o fenómeno de “patrilocalidade” se encontra na base desta discrepância. Este fenómeno diz respeito à tendência do deslocamento das mulheres quando se casam para o local onde o marido reside, mais propriamente, para o local próximo da habitação dos seus parentes (Bentley, Layton e Tehrani, 2009; Seielstad, Minch e Cavalli-Sforza, 1998; Wilder et al., 2004). Assim, as distâncias genéticas entre pais e filhos é menor do que entre a mãe e as suas filhas e assim ao longo das gerações estas diferenças são mais notórias, uma vez que produzem diferenças no padrão geográfico da NRY e do ADNmt. Desde a publicação de Seielstad, inúmeros estudos têm sido realizados. Em alguns casos os resultados demonstram o efeito do fenómeno da “patrilocalidade” e outros refletem os eventos históricos, como por exemplo, o efeito das colonizações, mais propriamente, na migração por parte dos indivíduos do sexo masculino. Conclui-se assim a existência de resultados controversos acerca deste tipo de padrão geográfico, ou seja, para o facto das distâncias genéticas entre populações serem significativamente maiores para a NRY do que para o ADNmt (Wilkins e Marlowe, 2006).

Figura 11: Exemplos de transmissão uniparental, à esquerda, por via paterna, pelo cromossoma Y e, à direita, por via materna, ADN mitocondrial (□ – indivíduos do sexo masculino; ○ – indivíduos do sexo feminino) (Adaptado

de: Butler, 2012).

Os marcadores de linhagem tal como os marcadores autossómicos possuem vantagens e desvantagens. Estes, são abundantes no genoma, possuem elevado grau de polimorfismo e baixa taxa de mutação. Quanto às suas desvantagens, a principal é o facto de possuírem um baixo poder de discriminação devido à não ocorrência de recombinação (Pinheiro, 2010).

Os marcadores de linhagem, por não sofrerem recombinação, definem haplótipos que podem ser utilizados com êxito na reconstrução de linhagens, quer maternas, quer paternas (Butler, 2010). Existem grandes grupos ou linhagens - os Europeus, os Americanos, os Africanos e os Asiáticos -. Depois de estudada uma amostra de determinado indivíduo recorre-se à comparação do perfil genético com bases de dados existentes de haplótipos de modo a se chegar a uma conclusão sobre a linhagem a que pertence (Pinheiro, 2010).

É importante salientar que a informação obtida pelos dois sistemas genéticos uniparentais, pelo ADNmt e pelo NRY, por vezes é diferente, devido às diferentes forças demográficas que cada género sofreu (Underhill et al., 2001).

1.9.1. MARCADORES DO TIPO Y-SNP

O cromossoma Y é exclusivo dos indivíduos do sexo masculino, sendo um dos cromossomas que tem suscitado o interesse dos geneticistas forenses, uma vez que possui elevado potencial em estudos forenses, como por exemplo, em investigações de parentesco e em crimes sexuais. Encontra-se no núcleo e é um dos cromossomas mais pequenos, com cerca de 60 milhões de nucleótidos, e que possui três regiões distintas, duas homólogas ao

cromossoma X e, por isso, sujeitas a recombinação, e uma que não possui homologia, a região não recombinante do cromossoma Y, que não sofre recombinação com o cromossoma X.

Cada cromossoma possui a sua história resultante de milhões de anos de evolução e o cromossoma Y não é exceção, contando assim a história de uma linhagem. Após ter divergido do mesmo ancestral autossómico que o cromossoma X (Willard, 2003), o cromossoma Y foi passando de geração em geração sem alterações na sua porção não recombinante, com a exceção da ocorrência de mutações, sendo hoje possível identificar linhagens paternas.

O estudo do cromossoma Y possui três principais aplicações na área forense - determinação do sexo, identificação da linhagem masculina e identificação da possível

origem geográfica dessa linhagem/ancestralidade genética - (Pinheiro, 2010).

O estudo do cromossoma Y baseia-se no facto da informação contida na região não recombinante ser transmitida de pai para filho, sem sofrer qualquer alteração, exceto se ocorrerem mutações. Esta, é a principal razão para a utilização dos marcadores do cromossoma Y na genética forense (Jobling, Pandya e Tyler-Smith, 1997; Jobling e Tyler- Smith, 2003).

O princípio base do estudo do cromossoma Y é a reconstrução de linhagens paternas, mais precisamente a construção de árvores filogenéticas, de modo a perceber a história de determinada população. Estes estudos têm sido importantes pois complementam os dados da evolução humana obtidos pelo estudo do ADNmt e dos autossomas. Através da utilização de polimorfismos binários com baixas taxas de mutação, tais como os SNP, pode ser facilmente construída uma filogenia (Jobling e Tyler-Smith, 2003; Sobrino, Brión e Carracedo, 2005).

Atualmente, estão descritos vários SNP, definindo uma árvore de haplogrupos binários, com uma nomenclatura estabelecida pelo Y Chromosome Consortium (YCC) (Hammer, 2002). Em 2004, Vallone e colaboradores, de modo a avaliar a utilidade do cromossoma Y na identificação humana, estudaram cerca de 50 SNP diferentes em 229 amostras de indivíduos afro-americanos e caucasianos, em que foram identificados cerca de 18 haplogrupos consoante a nomenclatura descrita pelo YCC. Para além deste estudo, Underhill detetou mais de 200 variações bialélicas, com uma amostragem de cerca de 21 populações, o que também levou à definição dos 18 haplogrupos descritos em cima (Underhill

et al., 2001). É importante referir que a inclusão de uma amostra masculina em determinado

haplogrupo é útil na identificação da sua origem geográfica e que em combinação com os dados obtidos pelos STR do cromossoma Y é possível a alocação regional de qualquer amostra masculina (Pinheiro, 2008).

1.9.1.1.METODOLOGIA DE ANÁLISE

Nos últimos anos, um extenso trabalho tem sido realizado de modo a caracterizar um conjunto de SNP úteis ao desenvolvimento de ensaios em multiplex. Em 2003, um novo projeto denominado como SNPforID foi lançado de modo a desenvolver estes tipos de marcadores e ensaios a nível forense (Butler, 2012).

Um primeiro multiplex foi desenvolvido e descrito por Alessandrini e colaboradores, em 2004, com o intuito de definir haplogrupos característicos de europeus, R1, E3b, J2 e I, cujas frequências variam entre o Sul e o Norte da Europa (Pinheiro, 2008). O objetivo era a utilização de 7 SNP presentes nos ramos ancestrais da árvore filogenética, entre eles, M35, M89, M172, M170, M9, M173 e M45 (Alessandrini et al., 2004).

Brion e colaboradores, em 2004, selecionaram cerca de 30 marcadores a partir dos polimorfismos descritos pelo YCC, agrupando os mesmos em 4 multiplex de modo a determinar os haplogrupos mais frequentes na Europa (tabela 3 e tabela 4). Concluíram que bastava utilizar 1 ou 2 dos multiplex descritos, uma vez que, para definir um haplogrupo é necessário no mínimo cerca de 9 SNP e no máximo cerca de 17 SNP, sendo o objetivo começar por utilizar o multiplex 1 e se fosse necessário para discriminar o haplogrupo, utilizar os restantes multiplex disponíveis.

O método descrito por Brion e colaboradores, em 2004, e designadamente o multiplex 1, foi o utilizado para caracterizar as populações de imigrantes em estudo, Angola, Guiné-Bissau e Moçambique no nosso estudo.

Tabela 3: Descrição dos multiplex utilizados por Brion et al., em 2004, com respetivo marcador, sequência forward e reverse dos primers, tamanho e concentração. Adaptado de Brion et al., 2004.

SNP Primer (5’ → 3’) Tam. (pb) C. (µM) Forward Reverse 92R7 TGCATGAACACAAAAGACGTA GCATTGTTAAATATGACCAGC 55 0.20 Multiplex 1 M70 TCATAGCCCACTATACTTTGGAC CTGAGGGCTGGACTATAGGG 81 0.20 M22 GCTGATAGTCCTGGTTTCCCTA TGAGCATGCCTACAGCAGAC 106 0.20 Tat GACTCTGAGTGTAGACTTGTGA GAAGGTGCCGTAAAAGTGTGAA 112 0.20 P25 GGACCATCACCTGGGTAAAGT AGTGCTTGTCCAAGGCAGTA 121 0.20 SRY1532 TCCTTAGCAACCATTAATCTGG AAATAGCAAAAACTGACACAAGGC 167 0.20

M173 GCACAGTACTCACTTTAGGTTTGC GCAGTTTTCCCAGATCCTGA 172 0.20 M213 GGCCATATAAAAACGCAGCA TGAATGGCAAATTGATTCCA 208 0.30 M9 GCAGCATATAAAACTTTCAGG AAAACCTAACTTTGCTCAAGC 340 0.35 12f2 CACTGACTGATCAAAATGCTTACAGAT GGATCCCTTCCTTACACCTTATACA 90 0.25 Multiplex 2 M201 TCAAATTGTGACACTGCAATAGTT CATCCAACACTAAGTACCTATTACGAA 144 0.25 M26 AGCAGAAGAGACCAAGACAGC GACGAAATCTGCAGCAAAAA 147 0.25 M170 TGCAGCTCTTATTAAGTTATGTTTTCA CCAATTACTTTCAACATTTAAGACC 158 0.30 M172 TCCTCATTCACCTGCCTCTC TCCATGTTGGTTTGGAACAG 187 0.25 M62 ACTAAAACACCATTAGAAACAAAGG CTGAGCAACATAGTGACCCC 309 0.25 M96 GTGATGTGTAACTTGGAAAACAGG GGACCATATATTTTGCCATAGGTT 88 0.25 Multiplex 3 M34 CACAGTGTTTTCTCATGTTAATGC GGGGACCCCAATAATCATAA 92 0.25 M81 TTATAGTTTCAATCCCTCAGTAATTTT TGTTTCTTCTTGGTTTGTGTGAGTA 176 0.25 M35 GCATGGTCCCTTTCTATGGAT GAGAATGAATAGGCATGGGTTC 198 0.25 M123 CACAGAGCAAGTGACTCTCAAAG TCTTTCCCTCAACATAGTTATCTCA 248 0.25 M78 CTTCAGGCATTATTTTTTTTGGT ATAGTGTTCCTTCACCTTTCCTT 301 0.25 M65 AAGGCTACCCATTCCCAAAT AAGTCTGGCATCTGCAAAATC 71 0.15 Multiplex 4 M126 GTGCTTGAAACCGAGTTTGT TCGGGAAACACAATTAAGCA 83 0.15 M73-M160 AAAACAATAGTTCCAAAAACTTCTGA CCTTTGTGATTCCTCTGAACG 98 0.5 M37 ATGGAGCAAGGAACACAGAA AAGAAAGGAGATTGTTTTCAATTTT 124 0.3 M167 GAGGCTGGGCCAAGTTAAGG CTTCCTCGGAACCACTACCA 130 0.15 M17-M18 CTGGTCATAACACTGGAAATC AGCTGACCACAAACTGATGTAGA 171 0.10 M153 TCTGACTTGGAAAGGGGAAA TTTTCTCCTCATTATTTGTCTTCA 239 0.5

Tabela 4: Descrição das sequências de primers de minisequenciação utilizados na Single Base Extension (SBE) com respetivo marcador, tamanho e concentração para cada multiplex utilizado.

SNP Primers de minisequenciação (5’ → 3’) Tam.

(pb) C. (µM) M22 For CCGCCATTCCTGGTGGCTCT 20 0.10 Multiplex 1 P25 For CCCCCCCTCTGCCTGAAACCTGCCTG 26 0.15 92R7 Rer CCCCGCATGAACACAAAAGACGTAGAAG 28 0.20

SRY1532 For CCCCCCTTGTATCTGACTTTTTCACACAGT 30 0.20

M70 Rer CCCCCCCCTAGGGATTCTGTTGTGGTAGTCTTAG 34 0.15

M173 For CCCCCCCCCCTTACAATTCAAGGGCATTTAGAAC 34 0.20

Tat Rer CCCCCCCCCCCCCCCCCCTCTGAAATATTAAATTAAAACAAC 42 0.20 M213 Rer CCCCCCCCCCCCCCCCCCCCCTCAGAACTTAAAACATCTCGTTAC 45 0.25 M9 For CCCCCCCCCCCCCCCCCCCCCCCCCGAAACGGCCTAAGATGGTTGAA 48 0.20 M170 Rer ACACAACCCACACTGAAAAAAA 22 0.45 Multiplex 2 M62 Rer CCCCCCCCAATGTTTGTTGGCCATGGA 27 0.50 M172 For CCCCCCCCCCCCCCAAACCCATTTTGATGCTT 32 0.10 M26 Rer CCCCCCCCCCCCCCCATAGGCCATTCAGTGTTCTCTG 37 0.25 M201 For CCCCCCCCCCCCCCCGATCTAATAATCCAGTATCAACTGAGG 42 0.05 M34 Rev TTGCAGACACACCACATGTG 20 0.15 Multiplex 3 M81 For CCCCCCTAAATTTTGTCCTTTTTTGAA 27 0.20 M78 For CCCCCCCCCCACACTTAACAAAGATACTTCTTTC 34 0.35 M35 Rev CCCCCCCCCCCCCCCCCCCCAGTCTCTGCCTGTGTC 36 0.03 M96 For CCCCCCCCCCCGTAACTTGGAAAACAGGTCTCTCATAATA 40 0.05 M123 Rev CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCTTCTAGGTATTCAGGCGATG 51 0.35 M167 For CCCAAGCCCCACAGGGTGC 19 0.45 Multiplex 4 M153 For AAAGCTCAAAGGGTATGTGAACA 23 0.30 M17 For CCAAAATTCACTTAAAAAAACCC 23 0.20 M18 For CCCCAGTTTGTGGTTGCTGGTTGTTA 26 0.15 M126 For CCCCGCTTGAAACCGAGTTTGTACTTAATA 30 0.05 M37 For CCGGAACACAGAAAATAAAATCTATGTGTG 30 0.35 M73 Rev CCCCCCCCCCCGATTCCTCTGAACGTCTAACCA 33 0.30 M65 Rev CCCCCCCCCCCCCCCCCCCCCCCCACCCGCGGTAAG 36 0.05 M160 For CCCCCCCCTTACAAGTTTAATACATACAACTTCAATTTTC 40 0.20