• Nenhum resultado encontrado

Marcadores genéticos de previsão de fenótipos em contexto forense

N/A
N/A
Protected

Academic year: 2021

Share "Marcadores genéticos de previsão de fenótipos em contexto forense"

Copied!
190
0
0

Texto

(1)

Helena Natividade

Resende Costa

MARCADORES GENÉTICOS DE PREVISÃO DE

FENÓTIPOS EM CONTEXTO FORENSE

(2)

Helena Natividade

Resende Costa

MARCADORES GENÉTICOS DE PREVISÃO DE

FENÓTIPOS EM CONTEXTO FORENSE

Dissertação apresentada à Universidade de Aveiro para cumprimento dos requisitos necessários à obtenção do grau de Mestre em Biologia Molecular e Celular, realizada sob a orientação científica do Prof. Doutor Luís Souto Miranda, Professor Auxiliar Convidado do Departamento de Biologia da Universidade de Aveiro.

(3)

Dedico este trabalho aos meus pais pelas oportunidades de crescimento em conhecimento e em caráter que me proporcionaram.

(4)

O júri

Presidente Prof. Doutora Maria do Céu Gomes dos Santos

Professora Auxiliar Convidada do Departamento de Biologia da Universidade de Aveiro

Prof. Doutor Francisco Manuel Andrade Corte Real Gonçalves Professor Associado da Faculdade de Medicina da Universidade de Coimbra

Prof. Doutor Luís Manuel Souto de Miranda

(5)

Agradecimentos Agradeço, em primeiro lugar, ao Prof. Doutor Luís Souto, pela oportunidade de desenvolver o trabalho conducente à presente dissertação e pela orientação e acompanhamento prestados.

Agradeço também a um conjunto de pessoas que permitiram a obtenção de informação valiosa no âmbito da realização do presente trabalho, nomeadamente o Prof. Doutor Francisco Corte Real (Director da Delegação Centro do Instituto Nacional de Medicina Legal) o Dr. Bruno Antunes (Perito de Recolha de Vestígios no Local de Crime do Laboratório de Policia Científica da Policia Judiciária) a Mestre Inês Ferreira Leite (Professora Assistente de Direito Penal na Faculdade de Direito da Universidade de Lisboa), a Dra. Ana Luísa Zêzere (Procuradora do Ministério Público), a Prof. Doutora Helena Moniz (Professora Auxiliar da Faculdade de Direito da Universidade de Coimbra), o Prof. Doutor Guilherme de Oliveira (Professor Catedrático da Faculdade de Direito da Universidade de Coimbra) pelo encaminhamento das questões à Prof. Doutora Helena Moniz, e ao Dr. Sérgio Fernandes do Gabinete de Documentação e Direito Comparado.

Finalmente resta agradecer a todos os que, de alguma forma, me encorajaram a continuar a investir na minha formação e valorização pessoal, em particular a minha família e amigos.

(6)

Palavras-chave SNPs, AIMs, marcadores genéticos, previsão de fenótipos, genética forense, bioética, legislação.

Resumo A análise de DNA permite obter informações relativas à aparência dos

dadores das amostras biológicas que poderão ser úteis no âmbito forense quando a identidade do dador não pode ser estabelecida com base nos métodos de identificação tradicionais. Essas informações podem ser obtidas de forma direta, analisando marcadores diretamente relacionados com a característica que se pretende prever, ou indireta, com base na determinação da ancestralidade biogeográfica do indivíduo e, a partir desse dado, prevendo-se o provável fenótipo manifestado com baprevendo-se no facto de que determinadas características apresentam variação interpopulacional.

Apesar de constituir uma ferramenta com o potencial de fornecer pistas importantes, a previsão de fenótipos em contexto forense com base na análise de marcadores genéticos apresenta várias limitações técnicas, sendo possível apenas prever com elevado nível de precisão os traços relacionados com a pigmentação e o género.

Os avanços técnicos, em particular o desenvolvimento de tecnologias de sequenciação de próxima geração, prometem, por um lado, possibilitar a realização de mais estudos de associação que permitirão conhecer as bases genéticas de outros traços físicos, e por outro, facilitar a aplicação de marcadores de previsão na rotina forense depois de validados.

Para além das limitações técnicas, a aplicação dos métodos de previsão levanta também questões de ordem bioética, nomeadamente a possibilidade de exacerbar ideais racistas, e também de ordem legal, em particular no que toca a potenciais ameaças ao direito à privacidade, identidade e imagem, discriminação étnica e racial e também as restrições relacionadas com o tipo de marcadores que podem ser usados no âmbito da análise forense.

Em Portugal os estudos populacionais indicam uma diversidade genética limitada, comparativamente a outros países. Para além disso, apesar de não haver legislação específica para este tipo de marcadores, a legislação existente é muito restritiva no que toca ao tipo de marcadores que podem ser usados no âmbito da análise forense de DNA e também no que toca aos direitos dos cidadãos. Assim, a aplicação destes marcadores no nosso país implica o prévio debate público e posterior criação de legislação específica.

(7)

Keywords SNPs, AIMs, genetic markers, predicting phenotypes, forensic genetics, bioethics, legislation.

Abstract DNA analysis provides information concerning the appearance of donors of

biological samples that may be useful in forensics when the identity of the sample´s donor can´t be established based on traditional identification methods. This information can be obtained directly by analyzing markers directly related to the feature that is intended to predict, or indirect, based on the determination of the individual biogeographical ancestry, and from this data, predicting the probable phenotype expressed based on fact that certain characteristics show an interpopulation variation.

Although being a tool with the potential to provide important clues, predicting phenotypes in the forensic context based on the analysis of genetic markers has several technical limitations, and it´s only possible to predict with high accuracy the pigmentation-related traits and gender.

Technical advances, particularly the development of technologies for next generation sequencing, promise, on the one hand, enable further studies of association that will allow knowing the genetic basis of other physical features, and by the other hand, to facilitate the application of the prediction markers in the forensic routine once validated.

In addition to the technical limitations, the application of the prediction methods also raises bioethical issues, including the possibility of exacerbating racist ideals, and also legal issues, in particular with regard to potential threats to the right to privacy, identity and image, ethnic and racial discrimination and also restrictions related with the type of markers that can be used in the forensic analysis.

In Portugal, population studies indicate a limited genetic diversity, comparatively to other countries. In addition although there is no specific legislation for this type of markers, the existing legislation is very restrictive with regard to the type of markers that can be used in the forensic analysis of DNA and also with regard to the citizens’ rights. Thus, the application of these markers in our country requires the prior public debate and subsequent creation of specific legislation.

(8)
(9)

ÍNDICE DE FIGURAS ...V ÍNDICE DE TABELAS ... IX SIGLAS ... XI INTRODUÇÃO ... 1 OBJETIVOS ... 2 CAPÍTULO 1 ... 3

1. MARCADORES GENÉTICOS COM APLICAÇÃO FORENSE ... 3

1.1.CARACTERÍSTICAS GERAIS E PADRÕES DE HERANÇA DOS MARCADORES GENÉTICOS ... 5

1.1.1.MARCADORES AUTOSSÓMICOS ... 6

1.1.2.MARCADORES DO CROMOSSOMA X ... 9

1.1.3.MARCADORES MITOCONDRIAIS ... 11

1.1.4.MARCADORES DO CROMOSSOMA Y ... 13

1.2.POLIMORFISMOS DE DNA QUE SÃO USADOS COMO MARCADORES GENÉTICOS ... 14

1.2.1.SHORT TANDEM REPEATS (STRS) ... 15

1.2.1.1.A ORIGEM DE UM STR ... 17

1.2.1.2.CARACTERÍSTICAS DOS MARCADORES DE STR ... 18

1.2.2.SINGLE NUCLEOTIDE POLYMORPHISMS (SNPS) ... 20

1.2.2.1.DESEQUILÍBRIO DE LIGAÇÃO E HAPLÓTIPOS ... 23

1.2.2.2.CLASSIFICAÇÃO DOS SNPS EM CONTEXTO FORENSE ... 25

1.2.3.SNPS VS STRS ... 25

1.3.MARCADORES GENÉTICOS QUE REFLETEM A DIVERSIDADE INTERPOPULACIONAL ... 27

1.3.2.ORIGEM E EVOLUÇÃO DA ESPÉCIE HUMANA... 32

1.3.3.MARCADORES INFORMATIVOS DE ANCESTRALIDADE ... 36

(10)

2.1.REVERSE DOT BLOTS ... 48

2.2.PCR QUANTITATIVA EM TEMPO REAL ... 49

2.3.PIROSSEQUENCIAÇÃO ... 51

2.4.MINISSEQUENCIAÇÃO ... 52

2.5. ESPECTROMETRIA DE MASSA ... 54

2.6.MICROARRAYS DE DNA... 56

2.7.MÉTODOS DE SEQUENCIAÇÃO DE PRÓXIMA GERAÇÃO E PERSPETIVAS FUTURAS ... 58

CAPÍTULO 3 ... 61

3. APLICAÇÕES PRÁTICAS DOS MARCADORES GENÉTICOS EM CONTEXTO FORENSE ... 61

3.1.PREVISÃO DE FENÓTIPOS –MÉTODO DIRETO ... 61

3.1.1.GÉNERO OU SEXO ... 63

3.1.2.TRAÇOS RELACIONADOS COM A PIGMENTAÇÃO ... 64

3.1.2.1.COR DOS OLHOS ... 67 3.1.2.2.COR DO CABELO ... 71 3.1.2.3.TOM DE PELE... 74 3.1.2.4.ALTURA ... 76 3.1.2.5.TRAÇOS FACIAIS... 78 3.1.2.6.IDADE ... 79 3.2.ANCESTRALIDADE BIOGEOGRÁFICA ... 83 3.2.1.ANCESTRALIDADE INDIVIDUAL ... 83 3.2.2.PAINÉIS DE AIMS ... 86

3.2.2.1.PAINÉIS DE AIMS COM APLICAÇÃO FORENSE ... 90

3.2.3. PREVISÃO DE FENÓTIPOS A PARTIR DA ANCESTRALIDADE BIOGEOGRÁFICA – MÉTODO INDIRETO... 92

3.2.3.1.TRAÇOS RELACIONADOS COM A PIGMENTAÇÃO ... 93

3.2.3.2.MORFOLOGIA DO CABELO ... 100

3.2.3.3.ÍNDICE DE MASSA CORPORAL ... 102

3.2.3.4.TRAÇOS FACIAIS... 103

(11)

3.4.1.M A ... 108

3.4.2.MARCADORES DO CROMOSSOMA X ... 110

3.4.3.MARCADORES DO CROMOSSOMA Y ... 111

3.4.4.MARCADORES DO MTDNA ... 113

CAPÍTULO 4 ... 117

4. QUESTÕES BIOÉTICAS E LEGAIS ... 117

4.1.QUESTÕES BIOÉTICAS ... 117

4.4.LEGISLAÇÃO INTERNACIONAL ... 124

4.5.EM PORTUGAL ... 125

DISCUSSÃO, CONCLUSÕES E PERSPETIVAS FUTURAS ... 129

REFERÊNCIAS BIBLIOGRÁFICAS ... 137

(12)
(13)

Í

NDICE DE

F

IGURAS

Figura 1 – Porções das diferentes classes de sequências nos genoma nuclear e mitocondrial ... 5

Figura 2 – Cromossomas humanos ... 6

Figura 3 – Esquema ilustrativo dos fenómenos envolvidos na hereditariedade genética, nomeadamente a gemetogénese e a fecundação.. ... 7

Figura 4 – Mapas genéticos de três irmãos Jacob, Jolinard e Daniel O´Neil ... 8

Figura 5 – Esquema ilustrativo do modo de herança de um par de autossomas ... 9

Figura 6 – Esquemas ilustrativos do modo de transmissão do cromossoma X.. ... 10

Figura 7 – Representação esquemática do DNA mitocondrial humano. ... 11

Figura 8 – Esquema representativo da região de controlo (D-loop) onde se encontram descriminadas as regiões hipervariáveis (1 e 2). ... 12

Figura 9 – Árvore genealógica onde se encontra representado o modo de transmissão do mtDNA. 13 Figura 10 - Árvore genealógica onde se encontra representado o modo de transmissão do cromossoma Y. ... 14

Figura 11 – Esquema representativo da origem de um microssatélite documentada através da comparação da sequência de nucleótidos observada em diferentes espécies. ... 17

Figura 12 - Esquema ilustrativo do processo de derrapagem de replicação ... 18

Figura 13 – Esquema representativo da forma mais comum de SNP: susbtituição de um nucleótido ... 20

Figura 14 – Esquema ilustrativo das possíveis consequências da ocorrência de SNPs em diversos locais do genoma. ... 21

Figura 15 – Esquema representativo da distribuição genómica da densidade de SNPs nos cromossomas humanos 1 a 22 ... 23

Figura 16 – Esquema ilustrativo da organização do material genético em haploblocos em cromossomas de dois indivíduos diferentes ... 24

Figura 17 – Representação esquemática do efeito “gargalo de garrafa”... 29

Figura 18 – Gráfico de barras ilustrativo das proporções de mistura de populações ancestrais (representadas pelas diferentes cores) observadas em indivíduos de diferentes países ... 30

Figura 19 – Mapa representativo da migração do Homo sapiens moderno onde se encontram representadas as datas de chegada nas respetivas regiões de acordo com dados genéticos ... 34

Figura 20 – Esquema ilustrativo de dois modelos da origem dos seres humanos modernos – o modelo de evolução multirregional e o modelo “Arca de Noé” ... 35

Figura 21 – Mapa representativo da diversidade genética ... 36

Figura 22 – Esquemas representativos da filogenia do cromossoma Y ... 41

Figura 23 – Árvore filogenética simplificada onde se encontram os diversos haplogrupos do mtDNA representados pelas respetivas letras ... 42

Figura 24 – Árvore genealógica na qual estão representados os diferentes modos de herança dos marcadores autossómicos, NRY e mtDNA ... 43

Figura 25 – Esquemas ilustrativos de dois sistema de incorporação de fluorófos em reações PCR em tempo real ... 49

(14)

Figura 26 – Gráfico de amplificação de PCR em tempo real ... 50

Figura 27 – Esquema representativo do princípio do método de pirossequenciação ... 52

Figura 28 – Esquema representativo da minissequenciação ... 53

Figura 29 – Esquema ilustrativo do funcionamento de um espectrómetro de massa ... 54

Figura 30 – Representação esquemática da produção de partículas com carga e posterior representação gráfica dos resultados obtidos através de dois méodos de espectrometria de massa ... 55

Figura 31 – Representação esquemática do princípio de hibridização de microarray ... 57

Figura 32 – Estrutura molecular dos pigmentos melânicos ... 65

Figura 33 – Representação esquemática de um melanócito e vias de síntese de melanina. ... 66

Figura 34 – Representação esquemática da localização de um melanócito e outras estruturas intervenientes no processo de pigmentação da pele ... 67

Figura 35 – Figura ilustrativa da variação da cor da íris desde o azul ao castanho escuro passando por tons intermédios (cinza, verde, avelã e castanho claro) ... 70

Figura 36 – Criança com fissura labial ou “lábio leporino” ... 78

Figura 37 – Deteção da delecção 4.977 bp do mtDNA ... 80

Figura 38 – Esquema ilustrativo da localização dos telómeros num cromossoma e sequência repetitiva que os constitui ... 81

Figura 39 – Estrutura populacional estimada recorrendo à análise estatística com o STRUCTURE dos dados obtidos através da aplicação de um painel de 377 STRs autossomais ... 84

Figura 40 – Mapa representativo da variabilidade genética interpopulacional ... 85

Figura 41 – Mapas representativos da distribuição geográfica do nível médio de heterozigotia e LD em 23 sub-populações Europeias ... 86

Figura 42 – Representação esquemática da comparação da estrutura populacional de uma amostra em cinco grupos (k=5) quando analisada com marcadores mais e menos informativos recorrendo ao STRUCTURE ... 89

Figura 43 – Mapa representativo da caracterização da origem biogeográfica obtida com a aplicação dos kits Ancestry by DNA 2.5 e EurasianDNA 1.0 ... 90

Figura 44 – Representação esquemática dos dados genotípicos obtidos por (NOVEMBRE et al., 2008) recorrendo a uma abordagem de PCA em dois eixos ... 92

Figura 45 – Fotografia de vários antebraços representando a diversidade fenotípica do tom de pele do mais escuro ao mais claro ... 94

Figura 46 – Níveis médios aunuais de intensidade da radiação ultravioleta indicados por gradação de cor, sendo tanto mais elevados quanto mais clara a cor representada ... 95

Figura 47 – Distribuição do tom de pele nos seres humanos... 95

Figura 48 – Correlação entre o Índice de Melanina e a Ancestralidade Genómica Nativo Americana, Oeste-African e Europeia determinada com base na aplicação de um painel de 171 AIMs descrito por (FRUDAKIS, 2008) a uma amostra de mulheres Porto Riquenhas ... 96

Figura 49 – Distribuição geográfica das percentagens de frequência de olhos claros na Europa e norte de África ... 97

Figura 50 – Fotografias de indivíduos que surgiram como resultado de uma pesquisa feita na base de dados EURO 1.0 correspondendo ao critério de pesquisa “NOR≥75%” e “NOR≤ 30%” (NOR – ancestralidade genómica Norte-Europeia) ... 98

(15)

Figura 51 – Frequências dos alelos A e T do SNP rs 11803731 do gene TCHH com base no Human

Genome Diversity Project ... 101

Figura 52 – Exemplos ilustrativos da regra de Bergman. ... 102 Figura 53 – Utilização de base de dados para estabelecimento de relações entre diferentes proporções de origem biogeográfica Africana e características fenotípicas ... 104 Figura 54 – Exemplo de pesquisa e nove resultados obtidos na base de dados referida no trabalho de FRUDAKIS (2008) recorrendo a uma estimativa de mistura individal de ancestralidade genómicapara um indivíduo Caucasiano do sexo feminino ... 105 Figura 55 – Atentado de 11 de março de 2004 em Madrid ... 107 Figura 56 – Alinhamento de suspeitos para identificação ... 118 Figura 57 – Mapa no qual se encontra representada a distribuição geográfica das raças humanas definidas por Carleton Coon ... 122 Figura 58 – Dois exemplos do passado de situações extremas que constituíram consequências do domínio de ideais racistas: a subjugação de seres humanos – escravatura e o extremínio de um povo – Holocausto ... 123

(16)
(17)

Í

NDICE DE

T

ABELAS

Tabela 1 – Descrição e exemplos de fatores que inluenciam as características fenotípicas complexas ... 4 Tabela 2 – Características dos genomas nuclear e mitocondrial ... 6 Tabela 3 – Teor de STRs do genoma humano ... 16 Tabela 4 – Principais características que distinguem os STRs e os SNPs no âmbito da análise forense de DNA ... 27 Tabela 5 – Resumo das principais características das forças evolutivas relativamente aos efeitos das mesmas ao nível da diferenciação interpopulacional e da extensão de envolvimento do genoma. ... 32 Tabela 6 – Principais características relativas aos modelos de evolução dos humanos modernos. .. 35 Tabela 7 – Comparações de valores de FST baseada em 369 pares de SNPs de populações ao longo

das regiões major ... 38 Tabela 8 – Tabela onde estão representados as principais metodologias utilizados na genotipagem de SNPs no âmbito forense e respetivas características relativamente à discriminação alélica, formato da reação e mecanismos de deteção. ... 47 Tabela 9 – Relação entre a cor da íris e a concentração de eumelanina e feomelanina presentes nessa mesma estrutura. ... 68 Tabela 10 – Genes e respetivos SNPs presentes nos três mais recentes conjuntos de marcadores que permitem a previsão da cor dos olhos e cabelo e tom de pele. ... 74 Tabela 11 – Resumo dos dados relativos à percentagem da variação fenotípica associada ao número de marcadores utilizados de trabalhos relativos aos marcadores de DNA relacionados com a altura do adulto. ... 77 Tabela 12 – Lista de referêcias bibliográficas correspondentes a publicações de paineis de marcadores que permitem a determinação da origem biogeográfica de acordo com diferentes níveis de distinção... 87 Tabela 13 – Conjunto de 19 trabalhos relativos à pigmentação humana classificados de acordo com o tipo de estudo – previsão ou associação entre SNPs e fenótipo e relação entre SNPs de genes relacionados com a pigmentação e origem biogeográfica. ... 99 Tabela 14 – Principais sistemas de classificação racial com base em TISHKOFF et al. (2004). ... 121 Tabela A1 – Dados de 19 estudos relativos às bases genéticas dos traços de pigmentação (cor dos olhos, cor do cabelo e tom de pele) na qual se encontram descriminadas as associações estabelecidas entre diversos SNPs de vários genes e as referidas características bem como as populações nas quais essas relações foram estabelecidas ... 156 Tabela A2 – Estudos relativos a frequências alélicas de diversos marcadores que incluem amostras de populações Portuguesas ... 167 Tabela A2 – Estudos relativos às frequências alélicas de diversas populações Portuguesas classificados de acordo com as populações amostradas ... 169

(18)
(19)

S

IGLAS

ABI – Applied Biosystems ADN – Ácido Desoxirribonucleico AIM – Ancestry Informative Marker ALFRED – the Allele Frequency Database CNPD – Comissão Nacional de Proteção de Dados

CODIS – The Combined DNA Index System D-loop – Displacement loop

DNA – Deoxyribonucleic Acid (mesmo que ADN)

ESI – Electrospray Ionization

FBI – Federal Bureau of Investigation

Flow-FISH – Flow Fluorescent in-situ

Hybridization

FRET – Fluorescence Resonance Energy

Transfer

GIANT Genetic Investigation of Antrhopometric Traits

GWAS – Genome Wide Association Studies HGDP-CEPH – Human Genome Diversity Cell

Line Panel

HLA – Human Leukocyte Antigen HV – Hypervariable Region LD – Linkage Disequilibrium M – Índice de Melanina

MALDI Matrix-Assisted Laser

Desorption/Ionization

MHC – Major Histocompatibility Complex mRNA – Messenger Ribonucleic Acid

MSY – Male-Specific Region of the Y

Chromosome

mtDNA – Mitochondrial Deoxyribonucleic

Acid

NCBI - National Centre for Biotechnology

Information

NGS – Next-Generation Sequencing

NRPY – Non-Recombining Portion of the Y

Chromosome

NRY – Non-Recombining Region of the Y

Chromosome

OMIM – Online Mendelian Inheritance in Man PCA – Principal Component Analysis

PCR – Polymerase Chain Reaction

Q-FISH – Quantitative Fluorescent in-situ

Hybridization

Q-PCR – Quantitative Polymerase Chain

Reaction

rCRS – Revised Cambridge Reference Sequence RFLP – Restriction Fragment Length

Polymorphism

RNA – Ribonucleic Acid

rRNA – Ribosomal Ribonucleic Acid

SIDA – Síndrome da Imunodeficiência Adquirida

sjTRECs – Signal Joint T-cell Receptors

Excision Circles

SNP – Single Nucleotide Polymorphism STRs – Short Tandem Repeats

TCR – T-cell receptor TMB – Tetrametilbenzidina TOF – Time Of Light

tRNA – Transfer Ribonucleic Acid UV – Radiação Ultra Violeta UVA – Radiação Ultra Violeta A UVB – Radiação Ultra Violeta B

VNTR – Variable Number of Tandem Repeat YCC – Y Chromosome Consortium

YHRD – Y Chromosome Haplotype Reference

(20)
(21)

INTRODUÇÃO

Quando uma amostra problema (amostra sob investigação, cuja identificação se pretende estabelecer) dá entrada num serviço de genética forense é determinado o perfil de identificação dessa mesma amostra (amostra problema) que é posteriormente comparado com outros perfis (de amostras referência – amostras relativamente às quais se conhece a identidade dos dadores – e/ou os perfis que constam na base de dados nacional) com o objetivo de se proceder à identificação do dador da mesma (Lei n.º 5/2008 de 12 de Fevereiro). No entanto, muitos são os casos em que a identificação não é estabelecida por não haver correspondência entre o perfil da amostra problema e qualquer perfil das amostras referência e/ou perfis da base de dados (KAYSER et al., 2009).

A informação contida no material genético das amostras biológicas não se limita, no entanto, à identificação. De facto, muitas características físicas (cor dos olhos, do cabelo e da pele (REES, 2003, SULEM et al., 2007), altura (LANGO ALLEN et al., 2010), entre outras) e até comportamentais (comportamento suicida (BONDY et al., 2006, ÖZALP, 2009), comportamento agressivo (CRAIG et al., 2009), comportamento criminal (ALPER, 1998) dependência do álcool (WANG et al., 2011, ZUO et al., 2011), entre outros) têm por base fatores genéticos que, caso sejam conhecidos, podem ser utilizados para traçar um perfil do dador de uma amostra cuja identidade não foi possível estabelecer pela via da identificação genética. Para além disso, uma vez que determinadas características físicas apresentam um padrão geográfico de variação (sendo o tom de pele o exemplo mais evidente) a previsão dessas mesmas características pode ser feita de forma indireta com base na informação relativa à origem biogeográfica do indivíduo (FRUDAKIS, 2008, KAYSER et al., 2009).

A previsão de características físicas do dador de uma amostra a partir da análise do DNA, ao contrário do perfil de identificação, não tem por objetivo identificar inequivocamente o dador da amostra, mas sim limitar o número de suspeitos a considerar no âmbito de uma dada investigação criminal (FRUDAKIS, 2008, KAYSER et al., 2009).

Em Portugal não são realizadas análises de DNA no contexto de previsão de características fenotípicas, segundo as informações obtidas junto do Instituto Nacional de

(22)

Medicina Legal e Laboratório da Polícia Científica. O Prof. Doutor Francisco Corte Real1

mostrou-se bastante otimista relativamente às perspectivas de utilização destes marcadores na rotina forense, afirmando: “com o conhecimento cada vez maior das potencialidades deste tipo de marcadores, entendo que entrarão na rotina em breve”, ressalvando, no entanto que considera, nesta altura, precoce a sua utilização devido à “taxa de sucesso actualmente possível”. Por seu turno, o Dr. Bruno Antunes2 refere ainda

que a não utilização destes métodos de análise se deve por um lado, à inexistência de meios técnicos que possibilitem tais análises e, por outro, a limitações legais.

O presente trabalho visa, então, constituir uma revisão do conhecimento relativo à previsão de características fenotípicas úteis no contexto da investigação forense e sua aplicação em Portugal e noutros países, focando quatro aspetos fundamentais: conhecimentos teóricos relacionados com os marcadores genéticos de previsão, metodologias de análise desses mesmos marcadores (particularmente dos SNPs por serem os mais frequentemente aplicados na previsão direta e indireta), aplicações práticas dos marcadores de previsão em contexto forense e, finalmente, as questões bioéticas e legais subjacentes à previsão de fenótipos em contexto forense.

Nesse sentido, para além da pesquisa bibliográfica nas áreas da genética forense, antropologia molecular, bioética e direito foram também estabelecidos contactos com instituições de interesse no âmbito do trabalho, nomeadamente o Instituto Nacional de Medicina Legal, o Laboratório da Polícia Científica da Polícia Judiciária, o Ministério Público, a Comissão Nacional de Proteção de Dados e o Gabinete de Documentação e Direito Comparado.

O

BJETIVOS

O presente trabalho tem como objetivos: (1) descrever os aspetos teóricos, técnicos, bioéticos e legais subjacentes à previsão de ancestralidade e fenótipos a partir do DNA; (2) aferir a importância e a aplicabilidade do conhecimento relativo à previsão de ancestralidade e fenótipos na área forense em Portugal e noutros países.

1 Prof. Doutor Francisco Corte Real, Director da Delegação Centro do Instituto Nacional de Medicina

Legal – comunicação pessoal.

2 Dr. Bruno Antunes, Perito de Recolha de Vestígios no Local de Crime do Laboratório de Policia

(23)

C

APÍTULO

1

1. MARCADORES GENÉTICOS COM APLICAÇÃO FORENSE

As características observadas numa célula ou num organismo são o produto direto de atuação das proteínas que, por sua vez, são codificadas pelo DNA. Essas mesmas características correspondem ao fenótipo (STRACHAN et al., 2010). O conceito de fenótipo é, porém, um pouco mais amplo, incluindo não só as características bioquímicas ou fisiológicas, mas também a morfologia, o desenvolvimento e o comportamento do organismo. O fenótipo diz, então, respeito às características observáveis numa célula ou num organismo e resulta da expressão dos genes do mesmo e também da influência de fatores ambientais.

As características fenotípicas podem ser simples ou complexas, consoante sejam determinadas pela expressão de apenas um gene (características simples) ou sejam o resultado de vários fatores (PULKER et al., 2007), que se encontram descritos na Tabela 1 (características complexas).

A maioria das características físicas que definem a aparência dos seres humanos são características complexas, sendo, por isso, afetadas por um ou vários fatores (anteriormente referidos) o que dificulta a identificação dos fatores genéticos que estão na base dessas mesmas caraterísticas (PULKER et al., 2007). A identificação de fatores genéticos relacionados com as características fenotípicas implica o estudo de marcadores genéticos.

(24)

Tabela 1 – Descrição e exemplos de fatores que influenciam as características fenotípicas complexas (os fatores enumerados têm por base o trabalho de PULKER et al. (2007) e as descrições baseiam-se nas publicações de LENZ (1970) e STRACHAN et al (2010)).

Fator Descrição

Heterogeneidade alélica

Observa-se quando diferentes alelos do mesmo locus ou gene originam a mesma característica

Heterogeneidade

de locus Observa-se quando diferentes alelos de diferentes loci ou genes originam a mesma característica

Penetrância Fração de indivíduos que manifestam uma dada característica quando possuem um determinado gene

Expressividade Grau de efeito produzido pelo gene ou grau de manifestação clínica Interação entre

genes ou poligenia

Observa-se quando uma dada característica resulta da ação combinada de vários genes.

Interação entre

genes e ambiente Corresponde à forma como a expressão de um gene é condicionada por fatores ambientais

Fenocópia

Característica observada num organismo que, apesar de semelhante à determinada geneticamente, é determinada por fatores ambientais,

não sendo transmitida à descendência

Os marcadores genéticos são segmentos de DNA cuja sequência e posição no genoma são conhecidas. A análise de marcadores genéticos possibilita a realização de estudos em diversas áreas, nomeadamente na área forense (na identificação em casos de crimes, catástrofes ou pessoas desaparecidas, acidentes militares e testes de filiação e parentesco: questões de imigração e reivindicação de heranças) e na área biomédica (autenticação de linhas celulares humanas, monitorização de transplantes, deteção de tumores cancerígenos e mapeamento de doenças genéticas). Existe uma área de investigação – o estudo da diversidade das populações humanas – que tem interesse tanto do ponto de vista forense como clínico, visto ser uma área que permite obter informações valiosas no contexto da previsão da ancestralidade (com aplicações na área forense) e também no contexto de risco de doença associado com a origem biogeográfica. O conhecimento relativo à diversidade das populações tem também bastante relevância no contexto dos estudos acerca da evolução da espécie humana (BUTLER et al.).

(25)

Segue-se a descrição dos diversos tipos de marcadores quanto às características gerais e padrões de herança e quanto à sua natureza (polimorfismos de DNA).

1.1.

C

ARACTERÍSTICAS

G

ERAIS E

P

ADRÕES DE

H

ERANÇA DOS

M

ARCADORES

G

ENÉTICOS

O genoma humano subdivide-se em genoma nuclear, com cerca de 3,1 Gb que compreende os autossomas e cromossomas sexuais X e Y, e genoma mitocondrial com 16,6 kb (STRACHAN et al., 2010). Apesar do número de genes do genoma nuclear (cerca de 26.000) ser maior do que o observado no genoma mitocondrial (37), a percentagem que este tipo de sequência representa é francamente menor no genoma nuclear do que no genoma mitocondrial (STRACHAN et al., 2010) como é visível na Figura 1. As principais características que distinguem os genomas nucleares e mitocondrial encontram-se sumariadas na Tabela 2.

Figura 1 – Porções das diferentes classes de sequências nos genoma nuclear e mitocondrial. O pequeno ponto ao centro da figura representa o equivalente a 25 genomas mitocondriais à escala do genoma nuclear à esquerda. Outra diferença bem patente reside na predominância de sequências altamente conservadas no genoma mitocondrial que contrasta com o observado no genoma nuclear. Figura adaptada de STRACHAN et al. (2010).

(26)

Tabela 2 – Características dos genomas nuclear e mitocondrial. Adaptado de STRACHAN et al. (2010).

Características Genoma Nuclear Genoma Mitocondrial

Proteínas associadas Vários tipos (incluindo histonas) Praticamente livre de proteínas Número de genes que

codificam proteínas ~21.000 13

Número de Genes de RNA > 6.000 (incerto) 24

Densidade génica ~1/120 kb (incerto) 1/0,45 kb

DNA repetitivo >50% do genoma Muito pouco

Intrões Presentes na maioria dos genes Ausentes

Recombinação* cada par de cromossomas Pelo menos uma vez por

homólogos na meiose Não ocorre

Herança*

Mendeliana para o cromossoma X e autossomas; paterna para o

cromossoma Y

Materna

*Assuntos a desenvolver adiante.

1.1.1. MARCADORES AUTOSSÓMICOS

O DNA nuclear encontra-se organizado em 23 pares de cromossomas (Figura 2), sendo que 22 desses pares são autossomas e o par restante corresponde aos cromossomas sexuais (cromossoma X e cromossoma Y). Nos indivíduos do sexo feminino, a combinação de cromossomas sexuais observada é XX (dois cromossomas X) enquanto nos indivíduos do sexo masculino a combinação observada é XY (um cromossoma X e um cromossoma Y).

Figura 2 – Cromossomas humanos. Fotografia de um cariótipo humano (conjunto ordenado de cromossomas) na qual se podem observar os 22 pares de autossomas e os cromossomas sexuais X e Y; adaptado de NATIONAL GEOGRAPHIC SOCIETY.

(27)

Os autossomas (cromossomas 1 a 22) constituem a maior porção do património genético de cada ser humano. Um dos elementos de cada par de cromossomas é herdado do pai e o outro da mãe, sendo que este fenómeno é apenas possível graças ao processo de meiose que ocorre aquando da gametogénese (Figura 3). Este processo tem início numa célula diplóide e envolve a ocorrência de uma replicação do DNA seguida de duas divisões, o que se traduz num resultado final de quatro células haplóides, ou seja, células que contêm metade da quantidade de material genético da célula inicial. Quando se dá a fecundação entre os gâmetas (células haplóides) forma-se uma célula diplóide – ovo ou zigoto – cujo material genético provém dos dois progenitores em partes iguais (no que diz respeito aos autossomas).

Sob o ponto de vista da variabilidade genética, um dos fenómenos que ocorrem durante o processo de meiose que assume especial relevância é a ocorrência de recombinação (ou crossing over). Este fenómeno é o responsável pelo facto de irmãos, mesmo sendo do mesmo sexo (desde que não sejam gémeos homozigóticos) apresentarem diferentes características, visto que cada gâmeta possui uma combinação única de metade dos genes de cada progenitor. Em teoria, como cada indivíduo herda um conjunto de 23 cromossomas do pai e outro tanto da mãe (50% de cada progenitor), a percentagem relativamente aos avós seria de 25%, porém, na realidade não é isso que se observa. Na Figura 4 constam três esquemas onde estão representados os mapas genéticos dos cromossomas de três irmãos e a percentagem do material genético que cada um herdou dos pais e avós. A percentagem de material genético herdado de cada um dos avós, no

Figura 3 – Esquema ilustrativo dos fenómenos envolvidos na

hereditariedade genética,

nomeadamente a gemetogénese e a fecundação. As estruturas a

cor-de-rosa representam a

gametogénese feminina e as azuis a gametogénese masculina. 1 – célula-mãe; 2 – replicação do DNA; 3 e 4 – recombinação ou crossing over; 5 – primeira divisão celular; 6 – segunda divisão celular; 7 – fecundação; 8 – ovo ou zigoto. Fonte: CONE (2010).

(28)

exemplo em análise, varia entre os 22 e os 28%. Esta variação resulta da recombinação que ocorre na meiose (como foi já referido) e na junção aleatória dos gâmetas na fecundação.

À medida que se observam relações genéticas entre gerações mais distantes, as porções cromossómicas comuns são cada vez menores, como mostra a Figura 5.

O estudo de marcadores autossómicos é utilizado, em contexto forense, no âmbito da identificação e testes de paternidade, mas também no campo da previsão de ancestralidade e características fenotípicas, como será abordado adiante.

Figura 4 – Mapas genéticos de três irmãos Jacob, Jolinard e Daniel O´Neil. As diferentes cores representam as porções herdadas dos avós. Nas árvores genealógicas adjacentes a cada um dos esquemas encontram-se, para além da descrição da representação das cores do esquema, as proporções de herança do material genético. Fonte: CONE (2010).

(29)

1.1.2. MARCADORES DO CROMOSSOMA X

O cromossoma X é um dos cromossomas que determinam o sexo do indivíduo. Como foi anteriormente referido, os indivíduos do sexo feminino apresentam um par de cromossomas X, logo, nas mulheres o cromossoma X sofre recombinação e é transmitido à descendência tal como os autossomas (Figura 6, em cima). Nos homens, uma vez que o cromossoma X apresenta apenas uma cópia e não emparelha com o Y (à exceção de uma pequena porção), não ocorre recombinação, sendo que o cromossoma X é transmitido intacto para as descendentes do sexo feminino (visto que os descendentes do sexo masculino herdam o cromossoma Y do pai e não o X). Como consequência, o cromossoma X apresenta um modo de herança diferente dos autossomas (Figura 6, ao centro), sendo que as mulheres herdam um cromossoma X da mãe e um do pai, cromossomas esses que recombinam antes de serem transmitidos a todos os seus descendentes, enquanto os homens recebem apenas um cromossoma X da mãe que é posteriormente transmitido exclusivamente aos descendentes do sexo feminino sem sofrer recombinação. Pode assim concluir-se que, uma vez que o grau de recombinação ao qual está sujeito o cromossoma X é menor que os autossomas, o nível de segmentação observado é, consequentemente, menor, com é possível observar na Figura 6, em baixo.

Figura 5 – Esquema ilustrativo do modo de herança de um par de autossomas. Em cima –

Árvore genealógica com

representação de quatro

gerações, sendo que se

encontram representadas com diferentes cores as porções

cromossómicas que são

transmitidas a partir da primeira geração. Em baixo – esquema representativo de um par de cromossomas no qual as diferentes cores representam a contribuição genética dos antepassados, retrocedendo uma (a), duas (b) e três (c)

gerações. Fonte: (THE

(30)

Em contexto forense existem alguns cenários nos quais a análise de marcadores do cromossoma X é muito útil, especialmente em casos de testes de paternidade. SZIBOR et al. (2003 e 2007) referem alguns exemplos: (1) pretende-se determinar se uma menina é filha de um homem (pai putativo) mas só se pode testar o DNA da putativa avó paterna; neste caso, a probabilidade de correspondência de marcadores do cromossoma X é de 50%. (2) casos de alegado incesto que resultem no nascimento de uma menina; uma vez que o cromossoma X que o pai transmite aos descendentes é o mesmo, a filha e a neta/putativa filha apresentam um cromossoma X idêntico. (3) casos em que uma menina pode ser filha de um de dois homens, sendo que os putativos pais são pai e filho; neste caso, a análise de marcadores de cromossoma X é muito útil visto que esse cromossoma é diferente nos dois homens pois é sempre herdada da mãe. (4) pretende-se determinar se um homem é pai de uma menina mas apenas o DNA de uma filha do pai putativo está disponível para análise; visto que o cromossoma X é transmitido de forma integral de pai para filha, caso as duas meninas sejam irmãs (filhas do mesmo pai) herdaram o mesmo cromossoma.

Figura 6 – Esquemas ilustrativos do modo de transmissão do cromossoma X. Em cima – árvore genealógica

representativa do modo de

transmissão do cromossoma X onde estão representadas apenas duas gerações; é possível verificar que no caso da mãe o cromossoma X sofre

recombinação antes de ser

transmitido à descendência ao contrário do que se observa no pai. Ao centro – árvore genealógica onde está representado o modo de transmissão do cromossoma X ao longo de cinco gerações. Em baixo – Representação esquemática de um par de cromossomas X na qual as diferentes cores representam a

contribuição genética dos

antepassados, retrocedendo uma (a), duas (b), três (c) e quatro (d) gerações. Fonte: (THE UNIVERSITY OF UTAH, 2011).

(31)

1.1.3. MARCADORES MITOCONDRIAIS

Relativamente ao DNA mitocondrial (mtDNA), este apresenta-se sob a forma de molécula circular de DNA em cadeia dupla com 16.569 pares de bases (Figura 7) e localiza-se na matriz mitocondrial, estando, por vezes, ligado à membrana interna da mitocôndria (VIDEIRA, 1999). O genoma mitocondrial inclui 37 regiões codificantes (que codificam duas moléculas de rRNA, 22 moléculas de tRNA e 13 proteínas envolvidas no processo de fosforilação oxidativa), sendo que todos os transcritos e seus produtos de tradução permanecem no organelo, não se observando, portanto, exportação de RNA ou proteínas para o citoplasma (VAN OVEN et al., 2009, VIDEIRA, 1999).

As posições dos nucleótidos do mtDNA humano encontram-se numeradas de 1 a 16.569, por convenção, de acordo com a Sequência de Referência de Cambridge revista (rCRS) (ANDERSON et al., 1981, ANDREWS et al., 1999). A essa sequência de referência são posteriormente anotadas as diferenças detetadas (polimorfismos do tipo SNP ou mutações). O nível de variação não é constante ao longo da molécula de mtDNA, sendo que a taxa de variação na região de controlo (região não-codificante situada entre as bases 16.024 e 576 – Figura 8) é cerca de 10 vezes superior à observada na região codificante (região situada entre as bases 577 e 16.023) (VAN OVEN et al., 2009). Esta diferença é explicada pelo facto de a ocorrência de mutações em regiões codificantes ter como consequência alterações ao nível dos produtos de transcrição, e, por conseguinte, ao nível do funcionamento de processos vitais ao funcionamento celular. Relativamente à região de

Figura 7 – Representação

esquemática do DNA

mitocondrial humano. A – genes de RNA ribossomal; B – genes do complexo I (NADH desidrogenase); C – genes do complexo IV (citocromo C oxidase); E – genes do complexo III (ubiquinol-citocromo C oxidorredutase). Fonte: WITAS et al. (2004).

(32)

controlo, apesar de desempenhar um importante papel ao nível da replicação do mtDNA, observa-se, como foi anteriormente referido, uma maior taxa de variação, especialmente ao nível das regiões hipervariáveis (HV1 e HV2). No entanto, por não se tratar de uma região codificante, a maioria dessas mutações não tem consequências práticas ao nível do funcionamento celular, sendo permitida a sua acumulação nesta região.

As regiões hipervariáveis presentes na região de controlo (D-loop) caracterizam-se pela presença de um elevado número de polimorfismos do tipo SNP que se associam em estruturas designadas haplótipos (conjunto de marcadores genéticos intimamente ligados com localização próxima uns dos outros que tendem a ser herdados e transmitidos em conjunto/bloco, não sofrendo recombinação frequentemente). As regiões hipervariáveis (HV1 e HV2) (Figura 8) são, como o próprio nome indica, as regiões do mtDNA que apresentam maior variabilidade, no entanto, também na região codificante é possível encontrar SNPs que podem ser úteis na diferenciação de amostras que são semelhantes ao nível dos marcadores da região de controlo (NATIONAL FORENSIC SCIENCE TECHNOLOGY CENTER).

Figura 8 – Esquema representativo da região de controlo (D-loop) onde se encontram descriminadas as regiões hipervariáveis (1 e 2). Adaptado de NATIONAL FORENSIC SCIENCE TECHNOLOGY CENTER.

Relativamente ao modo de herança, visto que as mitocôndrias que formam o zigoto são provenientes do gâmeta feminino, o mtDNA de cada indivíduo é proveniente da mãe (salvo raras exceções nas quais se provou a herança de mtDNA paterno (SCHWARTZ et al., 2002) ou casos em que se observou a presença de mais do que um tipo de mtDNA num indivíduo devido à ocorrência de mutações (LI et al., 2010), fenómeno que toma o nome de heteroplasmia).

O mtDNA não sofre (em regra) recombinação, pelo que a análise deste tipo de material genético permite aceder diretamente à linhagem materna do indivíduo (Figura 9).

(33)

Figura 9 – Árvore genealógica onde se encontra representado o modo de transmissão do mtDNA. Fonte: THE UNIVERSITY OF UTAH (2011).

Uma importante vantagem do mtDNA é o facto de existir um elevado número (que pode variar entre as centenas e os milhares) de cópias por célula, dependendo do tipo de célula, enquanto os autossomas apresentam apenas duas cópias por célula e a porção não recombinante do cromossoma Y (NRY) apresenta apenas uma cópia por célula. Este facto torna a análise de mtDNA extremamente vantajosa no campo forense nos casos de análise de material post-mortem, em que os processos de degradação e quantidade limitada de material em análise limitam ou impossibilitam a análise de marcadores autossomais ou da NRY. Assim, a análise de mtDNA assume um papel preponderante na identificação de restos mortais humanos realizada a partir de ossos, cabelo ou dentes, sendo aplicada na identificação de vítimas de desastres em massa ou vítimas de guerra através da comparação com eventuais familiares maternos vivos (KAYSER, 2007).

1.1.4. MARCADORES DO CROMOSSOMA Y

O cromossoma Y é exclusivo dos elementos masculinos da população, sendo transmitido de pai para filho (Figura 10) Ao contrário dos restantes cromossomas, é constitutivamente haplóide, sendo que apenas dois segmentos (regiões pseudossomais) recombinam com o cromossoma X, o que representam cerca de 5 % do comprimento total do cromossoma (JOBLING et al., 2003). No entanto, quando se fala do cromossoma Y no contexto de estudos moleculares a referência diz geralmente respeito à porção do cromossoma que não sofre recombinação relativamente à qual existem, segundo JOBLING et al. (2003), várias possíveis designações: Y não recombinante (NRY), porção não recombinante do Y (NRPY) ou Y específico masculino (MSY).

(34)

Figura 10 - Árvore genealógica onde se encontra representado o modo de transmissão do cromossoma Y. Fonte THE UNIVERSITY OF UTAH (2011).

O estudo de marcadores do cromossoma Y tem, de acordo com (JOBLING et al., 2003), várias aplicações no campo forense, nomeadamente na análise de amostras de casos de violação e em casos de determinação de parentesco (de meninos) nos quais não se disponha de amostra de DNA do pai mas esteja disponível material genético de um familiar do sexo masculino de linhagem paterna (como por exemplo o avô paterno ou um irmão do pai).

1.2.

P

OLIMORFISMOS DE

DNA

QUE SÃO USADOS COMO MARCADORES GENÉTICOS

A miríade de pequenas e grandes diferenças na sequência nucleotídica entre os indivíduos são conhecidas como polimorfismos de DNA. Um polimorfismo de DNA corresponde, então, à existência simultânea de mais do que uma forma sequencial num determinado locus numa determinada população.

Na área forense, o primeiro método de estudo da variabilidade genética com a finalidade de realizar a identificação de indivíduos foi o RFLP (restriction fragment length polymorphism – polimorfismo de comprimento de fragmento de restrição). Neste método é realizada a tipagem de regiões do DNA nas quais se observam polimorfismos do tipo VNTR (variable number of tandem repeats – número variável de repetições em tandem). Este método foi posteriormente substituído por métodos com amplificação de loci de DNA por PCR (plymerase chain reaction – reação de polimerização de cadeia) seguida da tipagem de marcadores genéticos de STR (short tandem repeat – curtas repetições em

(35)

tandem). O novo método veio permitir a análise de amostras degradadas e de quantidade limitada, uma vez que a PCR permite aumentar o número de cópias das várias regiões de interesse (marcadores) e o comprimento dos fragmentos STR é menor do que os VNTR (BUDOWLE et al., 2008). Para além disso, o número de marcadores em estudo e as suas características permitem um maior poder de discriminação, como será abordado de seguida.

1.2.1. SHORT TANDEM REPEATS (STRS)

Os Short Tandem Repeats (STRs) são também designados microssatélites e consistem em sequências em que se observa a repetição de unidades de um a seis nucleótidos (mono-, di-, tri-, tetra-, penta-, ou hexanucleótidos). Alguns autores (INTERNATIONAL HUMAN GENOME SEQUENCING CONSORTIUM, 2001) defendem que os microssatélites podem apresentar entre 1 a 13 nucleótidos nas unidades repetitivas. Quando o número de nucleótidos presentes nas unidades repetitivas é superior passa a estar-se na presença de um minissatélite (13 a 500 nucleótidos segundo o INTERNATIONAL HUMAN GENOME SEQUENCING CONSORTIUM (2001)) ou, em última instância, um satélite de DNA quando o número de nucleótidos ultrapassa os 500 (BIRREN et al., 1997, ELLEGREN, 2004).

Segundo um estudo do INTERNATIONAL HUMAN GENOME SEQUENCING CONSORTIUM (2001) com base nos dados obtidos através da primeira sequenciação do genoma humano, os STR representam cerca de 3% do genoma humano (Tabela 3), sendo que as repetições dinucleotídicas são as mais frequentes (0,5%). Dentro das repetições dinucleotídicas, as mais frequentes são a AC (50%) e AT (35%), sendo a GC a menos frequente (0,1%). As repetições trinucleotídicas mais frequentes são a AAT e a AAC (33% e 21%, respetivamente) enquanto que as unidades repetitivas menos observadas, dentro deste tipo, são a ACT (1,4%) e a ACG (0,1%). Este estudo conclui que, de uma forma geral, os microssatélites com dois nucleótidos são mais frequentes do que os de três nucleótidos (Tabela 3).

(36)

Tabela 3 – Teor de STRs do genoma humano. Como é observável, os STRs mais comuns no genoma humano são as repetições de dinucleótidos. Informação adaptada de: INTERNATIONAL HUMAN GENOME SEQUENCING CONSORTIUM (2001).

Comprimento da unidade de repetição (bases) Média de bases por Mb Número médio de elementos STR por Mb 1 1.660 36,7 2 5.046 43,1 3 1.013 11,8 4 3.383 32,5 5 2.686 17,6 6 1.376 15,2 7 906 8,4 8 1.139 11,1 9 900 8,6 10 1.576 8,6 11 770 8,7

Os microssatélites ocorrem com maior frequência em regiões não-codificantes, quer nas regiões intergénicas, quer nos intrões. Assume-se que nestas regiões os STRs evoluem de forma neutra por não estarem sujeitos a pressões seletivas, sendo que os microssatélites usados como marcadores são normalmente deste tipo. Nas regiões codificantes a atuação da seleção natural contra mutações que originem frameshift dificulta o aparecimento de microssatélites è exceção das repetições de trinicleótidos (ELLEGREN, 2004). Este tipo de repetições não altera a forma como a sequência é posteriormente traduzida mas tem muitas vezes consequências ao nível do funcionamento da proteína codificada. A doença de Huntington, a atrofia muscular bolbo espinal (doença de Kennedy) e a ataxia espinocerebelar do tipo I são exemplos de doenças neurodegenerativas provocadas pela expansão (aumento do número de unidades repetitivas) de trinucleótidos “CAG” (BATES et al., 1994).

(37)

1.2.1.1.

A

ORIGEM DE UM

STR

A origem de um microssatélite pode ser consequência de um de dois tipos de mutações: mutações pontuais que originam duas ou três unidades repetitivas ou inserções de segmentos de DNA que são repetições da sequência adjacente. Um exemplo do primeiro mecanismo referido foi documentado por MESSIER et al. (1996) através da comparação da sequência de nucleótidos de um pseudogene de globulina de espécies de primatas e humanos (Figura 11). A sequência 5´-ATGTGTGT3` ocorre numa posição relevante em espécies de primatas com alguma distância filogenética dos humanos. Relativamente aos humanos e espécies filogeneticamente mais próximas, como o gorila e o chimpanzé, verificou-se a ocorrência de uma mutação pontual que modificou esta sequência para 5´-ATGTATGT3´, com subsequente expansão da unidade de repetição 5´-ATGT3´ através do processo de derrapagem de replicação (BROWN, 2002).

A derrapagem de replicação consiste na ocorrência de um erro ao nível do alinhamento aquando da re-hibridização após a dissociação transitória do DNA em processo de replicação, formando-se uma ansa de DNA, como mostra a Figura 12. Deste fenómeno pode resultar o aumento ou diminuição do número de unidades repetitivas que compõem o microssatélite consoante a ansa se formar na cadeia nascente ou na cadeia molde de DNA, respetivamente. O sistema de reparação que atua no sentido de corrigir erros que ocorrem no processo de replicação de DNA repara a maioria destas mutações, sendo que apenas uma pequena percentagem destas variações persiste (ELLEGREN, 2004). Figura 11 Esquema representativo da origem de um microssatélite documentada através da comparação da sequência de nucleótidos observada em diferentes

espécies. Adaptado de: BROWN (2002).

(38)

Figura 12 - Esquema ilustrativo do processo de derrapagem de replicação. Após a iniciação do processo de replicação de DNA há a possibilidade de ocorrer dissociação entre as cadeias; se, aquando da re-hibridização das cadeias, ocorrer um erro de alinhamento numa região onde se observe a ocorrência de um microssatélite que dê origem a uma ansa ou loop na cadeia nascente, o processo resultará no aumento do comprimento do STR; por outro lado, se o loop se formar na cadeia molde, o resultado será a diminuição do comprimento do STR. Figura adaptada de ELLEGREN (2004).

À medida que um STR se expande ao longo do tempo, a ocorrência de uma mutação pontual ao longo da sua extensão é uma obvia possibilidade e, quando ocorre, verifica-se uma irregularidade ao nível da sequência repetitiva que se traduz na alteração da estrutura ou composição do polimorfismo e na diminuição da taxa de mutação daquele alelo específico (BRINKMANN et al., 1998). Assim, a evolução dos microssatélites é um processo dinâmico, sendo que tanto o aumento ou a diminuição do número de repetições que os constituem como a variação da composição são característicos desse mesmo processo de evolução (ELLEGREN, 2004).

1.2.1.2.

C

ARACTERÍSTICAS DOS MARCADORES DE

STR

Os STRs apresentam uma frequência elevada e distribuição aleatória no genoma. (BIRREN et al., 1997). Para além disso, estes polimorfismos apresentam uma taxa de mutação que é diretamente proporcional ao número de unidades de repetição, o que é

(39)

previsível visto que quanto maior o número de unidades repetitivas maior a possibilidade de ocorrência de derrapagem de replicação. A elevada taxa de mutação que caracteriza os microssatélites leva, ao longo do tempo, a que se tornem altamente polimórficos dentro da população e, consequentemente, altamente informativos. Um STR é classificado como polimórfico se o número de unidades de repetição variar dentro da população com uma incidência superior a 1% (BIRREN et al., 1997, ELLEGREN, 2004, PANZER et al., 1995).

Contudo, o facto de apresentarem uma elevada taxa de mutação nem sempre constitui uma vantagem, uma vez que marcadores particularmente suscetíveis a mutações podem dificultar o mapeamento de traços por estudos de desequilíbrio de ligação (LD) (BIRREN et al., 1997). Outro facto relevante diz respeito ao relativamente reduzido comprimento que estes polimorfismos apresentam, o que torna possível a amplificação de fragmentos de DNA por PCR que contenham toda a extensão do STR e a sua posterior análise por eletroforese (em gel ou capilar), o que permite detetar diferenças de tamanho dos produtos de amplificação gerados, provenientes de diferentes fontes de DNA genómico (BIRREN et al., 1997, DALE et al., 2002, PANZER et al., 1995).

Assim, as vantagens principais dos STRs são o seu elevado poder informativo como marcadores genéticos, a conveniência da sua deteção por métodos baseados em PCR (sendo que é necessária uma quantidade relativamente pequena de DNA) e a possibilidade de transferir informação sobre os marcadores com base apenas em sequência de primers de PCR (BIRREN et al., 1997). Estas vantagens fazem dos STRs marcadores de eleição na identificação forense. A utilização de painéis de STRs (sob a forma de kits multiplex que amplificam vários loci em simultâneo) permite a obtenção de perfis que apresentam probabilidades de correspondência aleatória inferiores a 10-23 (JOBLING et al., 2004). O

desenvolvimento desses painéis em conjunto com os avanços técnicos, nomeadamente ao nível das tecnologias de sequenciação (em particular a eletroforese capilar), tornou possível o desenvolvimento de bases de dados de DNA nacionais que constituem importantes ferramentas na investigação forense (PHILLIPS, 2008).

Relativamente ao uso destes marcadores genéticos em estudos populacionais há que referir que o facto de se observarem taxas de mutação bastante heterogéneas entre diversos loci (e até entre alelos do mesmo locus (BRINKMANN et al., 1998)) torna difícil a tarefa de traduzir estimativas de distância genética em escalas temporais absolutas (ELLEGREN, 2004).

(40)

1.2.2. SINGLE NUCLEOTIDE POLYMORPHISMS (SNPS)

Cerca de 85 a 90% das variações ao nível da sequência de DNA corresponde a diferenças num único nucleótido (substituições, deleções ou inserções) e são designadas Single Nucleotide Polimorphisms (SNPs) (BIRREN et al., 1997, BUDOWLE et al., 2008, BUDOWLE et al., 2009, COLLINS et al., 1998). Alguns autores defendem que os SNPs correspondem apenas a polimorfismos de substituição (Figura 13), sendo que as inserções e deleções constituem um grupo separado designado “indels” (GONZALEZ et al., 2007, MILLS et al., 2006, MULLANEY et al., 2010). MULLANEY et al. (2010) define os “indels” como inserções ou deleções de 1 a 10.000 pares de bases de comprimento. Por seu turno, (GONZALEZ et al., 2007) definem “indel” como “uma mutação que resulta na deleção e inserção co-localizadas e no ganho ou perda de nucleótidos” adicionando ainda o termo “microindel” que, segundo os autores, corresponde a “um indel que resulta na perda ou ganho de 1 a 50 nucleótidos”. Assim, regra geral, as substituições e deleções são estudadas separadamente das substituições, considerando-se apenas as substituições nas referências aos SNPs.

A maioria dos SNPs apresenta apenas dois alelos, e por isso os SNPs são muitas vezes referidos como marcadores bialélicos. Com apenas dois alelos, o nível máximo de heterozigotia para cada marcador é de 50%, o que faz com que os SNPs sejam menos informativos do que os STRs, que tipicamente apresentam vários alelos e níveis de heterozigotia a rondar os 70% (BIRREN et al., 1997, BUDOWLE et al., 2009).

As consequências da alteração de uma única base na sequência de DNA (SNP) são variáveis (Figura 14), dependendo do local onde esta ocorre. Em primeiro lugar, a alteração pode ocorrer numa região não codificante; de facto, nos seres eucariotas, esta é a ocorrência mais comum (DALE et al., 2002, TISHKOFF et al., 2004). Este fenómeno deve-se

Figura 13 Esquema representativo da forma mais comum de SNP: substituição de um nucleótido. Adaptado de:

http://www.rikenresearch.riken .jp/images/figures/hi_3675.jpg

(41)

ao facto de a maior parte do DNA do genoma das células eucariotas corresponder a sequências não codificantes. Por outro lado, um polimorfismo que ocorra numa região não codificante apresenta uma menor probabilidade de causar efeitos negativos no funcionamento celular. Em segundo lugar, se a alteração ocorrer numa sequência codificante, podemos considerar dois cenários distintos: (1) a alteração ocorre num intrão – excetuando os casos em que a alteração ocorre no local de splicing, não há alteração no produto do gene; (2) a alteração ocorre num exão – mesmo neste caso pode não ocorrer alteração na sequência da proteína codificada pelo gene em causa. Uma vez que o código genético é redundante, ou seja, um aminoácido pode ser codificado por tripletos diferentes, quando a substituição de uma base origina um tripleto diferente, mas que codifica o mesmo aminoácido, as consequências ao nível do funcionamento da célula serão nulas, embora possa haver algum efeito na tradução do mRNA (como por exemplo, a leucina pode ser codificada pelo UUA e CUA), sendo que esta alteração é designada de substituição sinónima ou mutação silenciosa. Outras alterações podem também ser silenciosa, embora não sinónimas. A alteração do UUA por GUA iria substituir uma leucina por uma valina na proteína, o que pode representar consequências mínimas na estrutura e funcionamento da proteína (dependendo de quão crítica é a localização específica em causa), uma vez que a leucina e a valina são aminoácidos similares. Outras alterações, como o UUA pelo UCA (serina), têm uma probabilidade maior de comportar consequências mais graves ao nível estrutural e funcional da proteína, embora esta e outras alterações ainda mais radicais possam ser toleradas em algumas posições (DALE et al., 2002).

Figura 14 – Esquema ilustrativo das possíveis consequências da ocorrência de SNPs em diversos locais do genoma.

(42)

Como foi referido anteriormente, os SNPs podem ou não comprometer a estrutura e função de proteínas. Pontualmente, a ocorrência deste tipo de variação genética pode levar a uma alteração na função da proteína – por exemplo, uma enzima pode ser capaz de atuar sobre um substrato diferente. Um exemplo de região codificante que apresenta um elevado nível de variabilidade é o sistema HLA (antigénio leucocitário humano) (THE 1000 GENOMES PROJECT CONSORTIUM, 2010). Esta região representa o Complexo Major de Histocompatibilidade (MHC) nos seres humanos e localiza-se no braço curto do cromossoma 6. As proteínas codificadas pelos vários genes deste complexo exercem funções ao nível da apresentação de antigénios às células C (sistema imunitário) e moléculas intervenientes no processo inflamatório (GOLDSBY et al., 2004). Segundo dados de Julho de 2011 da base de dados IMGT/HLA, foram já identificados mais de 6.800 formas alélicas deste complexo (EUROPEAN BIOINFORMATIC INSTITUTE, 2011). A elevada variabilidade observada nesta região faz com que a sua análise seja útil não só em termos clínicos, mas também ao nível do estudo da história evolutiva do MHC humano e da variação genética entre populações (BUHLER et al., 2011).

Por outro lado existem também regiões do genoma implicadas no processamento de RNA ou na regulação da transcrição e desenvolvimento que se encontram altamente conservadas (inclusivamente ao nível não só da espécie, mas de todos os mamíferos), ou seja, o nível de variação observado é extremamente baixo (BEJERANO et al., 2004).

Assim, é de prever que a distribuição dos SNPs no genoma não seja homogénea. De facto, observam-se regiões nas quais a densidade deste tipo de polimorfismos é maior (por exemplo, junto aos telómeros, ou seja, perto das extremidades dos cromossomas) como pode observar-se na Figura 15.

O facto de os SNPs ocorrerem com grande frequência no genoma humano, faz com que constituam uma fonte valiosa de marcadores genéticos para testes de identidade, mapeamento de características simples ou complexas, estudos de associação genótipo-fenótipo e reconstrução da evolução humana.

(43)

1.2.2.1.

D

ESEQUILÍBRIO DE

L

IGAÇÃO E

H

APLÓTIPOS

Por se localizarem fisicamente próximos uns dos outros, alguns marcadores são tendencialmente transmitidos em bloco, o que significa que à presença de um alelo num determinado locus está associada a presença de um alelo específico noutro locus próximo. Os haplótipos são, então, conjuntos de marcadores intimamente ligados que são geralmente herdados em conjunto, ou, por outras palavras, são combinações de estados alélicos de um restrito número de loci próximos uns dos outros. Assim, os loci pertencentes a um determinado haplótipo encontram-se em desequilíbrio de ligação (LD).

Outro conceito importante a referir é o conceito de “haplogrupo” (Figura 16). Um haplogrupo é então a combinação de vários haplótipos e corresponde a um tipo de estrutura que assume especial relevância no estudo do DNA mitocondrial e do cromossoma Y, como será abordado adiante.

Figura 15 – Esquema representativo

da distribuição genómica da

densidade de SNPs nos cromossomas humanos 1 a 22. As áreas a vermelho representam regiões com elevada densidade de SNPs ao contrário das áreas a azul que representam regiões com baixa densidade de SNPs. Fonte: Sítio da Welcome Trust Sanger Institute - http://www.sanger.ac.uk/, consultado a 28/03/2011.

Referências

Documentos relacionados

Este último aspeto considero importante uma vez que as crianças necessitam de sentir limites delineados para os seus comportamentos como forma de se sentirem seguros nas

Assim, concordamos com Bianchetti (2008), para quem.. Uma educação que forme para a mudança social não pode ser medida como sendo de ‘boa ou má qualidade’, já que a sua

Por meio de uma pesquisa qualitativa com levantamento de dados foi possível verificar que os pesquisadores abordam diversas frentes diferentes em seus trabalhos, que passam

Afinal de contas, tanto uma quanto a outra são ferramentas essenciais para a compreensão da realidade, além de ser o principal motivo da re- pulsa pela matemática, uma vez que é

Controle Interno na Administração Indireta do Estado brasileiro: um estudo sobre as unidades de auditoria interna das instituições.. federais

Dessa maneira, os resultados desta tese são uma síntese que propõe o uso de índices não convencionais de conforto térmico, utilizando o Índice de Temperatura de Globo Negro e

Foram estimados os coeficientes de repetibilidade (), considerando o método de análise de variância para médias anuais de dois, três, quatro, cinco e seis anos.. Tais

Para tal foi utilizado uma placa metálica com vários furos de modo a permitir a passagem do feixe (fig.2.13). O diâmetro óptimo de cada furo não é trivial: um furo grande demais