• Nenhum resultado encontrado

Métodos estatísticos para análise de Y-STRs em genética forense

N/A
N/A
Protected

Academic year: 2021

Share "Métodos estatísticos para análise de Y-STRs em genética forense"

Copied!
105
0
0

Texto

(1)

UNIVERSIDADE DE LISBOA

FACULDADE DE CIÊNCIAS

DEPARTAMENTO DE ESTATÍSTICA E INVESTIGAÇÃO

OPERACIONAL

Métodos Estatísticos para análise

de Y-STRs

em Genética Forense

Cláudia Isabel Vieira da Silva

Mestrado em Bioestatística

2011

(2)

FACULDADE DE CIÊNCIAS

DEPARTAMENTO DE ESTATÍSTICA E INVESTIGAÇÃO

OPERACIONAL

Métodos Estatísticos para análise

de Y-STRs

em Genética Forense

Cláudia Isabel Vieira da Silva

Tese orientada por Prof. Maria Antónia Amaral Turkmann

Mestrado em Bioestatística

2011

(3)

Resumo

Cláudia Isabel Vieira da Silva iii

Resumo

A implementação dos marcadores de DNA nas ciências forenses consistiu no maior avanço nesta área nos últimos vinte anos. Os fenómenos de mutação e recombinação genética contribuem para uma grande diversidade genética, o que se traduz no facto de todos os indivíduos, com excepção de gémeos verdadeiros, apresentarem sequências de DNA diferentes entre si, mas invariváveis em todas as suas células. Estas características permitem a sua aplicação na área forense em investigações criminais, relações de parentesco, imigração, pessoas desaparecidas em acidentes de massa e estudos históricos\antropológicos. Nos últimos dez anos os marcadores de DNA específicos dos indivíduos do sexo masculino, Y-STRs, foram estudados e aplicados em diferentes laboratórios na área forense. Estes marcadores permitem a identificação das linhagens paternas do indivíduos e esta informação pode ser de grande importância nos casos de abuso sexual e de investigação de parentesco. No entanto a sua correcta aplicação nos casos do Serviço de Genética e Biologia Forense implica a implementação de um método científico adequado para avaliar a probabilidade de coincidência de dois perfis genéticos.

Para este objectivo foi implementado um kit de estudo de Y-STRs, designado por AmpFlSTR® Yfiler™ (Applied Biosystems), previamente desenvolvido e validado para a área forense e aplicado em 197 pares pai\filho, provenientes de uma base de dados da população de referência do Sul de Portugal. Este estudo permitiu realizar inferências populacionais, estimar taxas de mutação da linha germinal paterna e efectuar cálculos de probabilidade de coincidência de perfis genéticos (matching probabilities) em diferentes tipos de casos estudados. As inferências populacionais foram realizadas com diferentes conjuntos deY-STRs, designadas por Haplotipo mínimo, Haplotipo Estendido e Haplotipo completo, de forma a verificar qual o conjunto de Y STRs que permite obter a maior diversidade genética

A análise com os diferentes conjuntos de haplótipos revelou a presença de 171, 183 e 191 haplotipos diferentes, correspondendo a diversidades genéticas de 0.6411, 0.6403 e 0.6508.

No que diz respeito à metodologia aplicada recorrendo à formulação bayesiana, verificou-se que a metodologia recorrendo à distribuição a priori Beta permite estimar

(4)

valores de taxas de mutação mais próximos dos valores referenciados por outros autores, disponíveis no site www.yhrd.org. O valor mais baixo da taxa de mutação obtido foi de 6.010-4 (5.747-4 – 3.242-4 ) para o marcador DYS438.

Estes resultados contribuiram para a estimativa das probabilidades de coincidência de dois perfis genéticos. Estes cálculos foram efetuados recorrendo a diferentes metodologias, nomeadamente, método frequencista, método de “haplotype survyeing” e método de Charles Brenner.

Os resultados obtidos com as diferentes metodologias, permitiram concluir que a metodologia “Haplotype Surveying” é presentemente a mais adequada para aplicação na área forense como actualmente está implementada.

(5)

Abstract

Cláudia Isabel Vieira da Silva v

Abstract

DNA analysis has been the greatest technological advance in forensic science in the past twenty years. Due to mutation and recombination no two persons, except true twins, have the same DNA sequence, wich enables to determine DNA sequence in every biological sample, and this knowlodge can be used in the investigation of crime, kinship relationships, immigration, missing persons, mass disasters and historical cases. In the last ten years, among DNA markers with forensic interest, a few with potencial to identify male –specific DNA, Y-STRs, were described and implemented in most forensic genetic laboratorys. These markers are very important since they contribute to identify male lineages and this information can be invaluable in cases of sexual assault and in kinship testing, as well as in anthropological and population genetics studies. However to apply Y-STRs in Forensic Genetics Service from National Institute of Legal Medicine, it is convenient to have a scientific method to analyse and evaluate the evidential strength of a Y-haplotype match.

For this purpose, a 17 locus microsatellite kit, AmpFlSTR® Yfiler™ (Applied Biosystems), previously developed and validated for forensic cases, was adopted in a 197 father son\pairs south Portugal reference database, in order to make population inferences, Y-STR germline mutation rates estimation, and matching probabilities evaluations. Population inferences were done with different sets of Y STRs markers, classified as Complete Haplotype, Extended Haplotype and Minimal Haplotype, in order to study which set can give the strongest genetic diversity.

A total of 171,183, 191 haplotypes were observed when analysed the Minimal

Haplotype, Extended Haplotype and Complete Haplotype, respectively, corresponding

to genetic diversity 0.6411, 0.6403 and 0.6508.

The locus specific mutation rates were estimated with Bayesian formulation, and the best approximation was obtained with a priori Beta distribution.

These results contributed to estimate matching probabilities in different kind of cases, kinship and criminal ones, with three distinct methodologies, frequencist, haplotype surveying and Brenner’s, in order to distinguish the best one to apply in the laboratory.

(6)

Agradecimentos

À Prof. Maria Antónia Amaral Turkman pelo seu interesse neste trabalho de dissertação, e por todo o apoio dispensado na execução deste trabalho.

Ao Prof. Jorge Costa Santos, Director do Instituto Nacional de Medicina Legal IP, Delegação do Sul, pelo seu apoio e interesse na realização deste trabalho, pela autorização na disponibilização dos dados, sem os quais este trabalho nunca teria sido possível.

À Dra Rosa Maria Espinheira, Directora do Serviço de Genética e Biologia Forense da delegação do Sul do INML IP, pelo seu interesse neste trabalho, pelo apoio e confiança e pela disponibilização imediata dos dados do serviço para a realização deste trabalho.

Aos meus pais Fernando de Jesus Silva e Maria Isabel Lopes Vieira, a quem devo quase tudo na vida, pelo incentivo e apoio à minha formação contínua, pela compreensão dos muitos fins de semana ausentes e por estarem sempre presentes.

Aos meus amigos, sobretudo aos que se disponibilizaram desde o início para a leitura das extensas páginas deste trabalho, bem como a todos os outros que aceitaram as minhas muitas recusas para saídas e convívios, pelo apoio e carinho nos meus momentos de dúvida e incerteza, sem cuja força e incentivo, atingir a meta teria sido muito mais difícil.

(7)

Conteúdo

Cláudia Isabel Vieira da Silva vii

Conteúdo

Resumo ... iii Abstract ... v Agradecimentos ... vi Conteúdo ... vii Lista de Tabelas ... ix Lista de Figuras ... xi

Abreviaturas e Definições ... xii

Capítulo 1 ... 1

1. Introdução ... 1

A evolução da Genética Forense ... 1

A Estrutura do Genoma Humano e Hereditariedade ... 2

Classes de Polimorfismos de DNA ... 4

O cromossoma Y ... 6

Vantagens da aplicação dos marcadores do cromossoma Y ... 10

Desvantagens da utilização do cromossoma Y... 11

Análise dos resultados do Cromossoma Y ... 12

Taxas de Mutação dos Loci do cromossoma Y... 13

Valorização estatística dos resultados ... 14

Objectivo do Trabalho ... 15 Capítulo 2 ... 17 2. Material e Métodos... 17 Estudo Biológico ... 17 Amostras Biológicas... 17 A extracção de DNA... 17

Amplificação e Análise dos Y-STRs... 18

Análise dos produtos amplificados... 19

Análise Estatística ... 20

Análise Estatística Populacional... 20

Estudo das Taxas de Mutação ... 27

(8)

Estimativa do número de mutações assumindo uma distribuição de Poisson... 34

Probabilidade de Matching... 39

Princípios da probabilidade de transmissão alélica ... 39

Metodologia aplicada nos cálculos da probabilidade de paternidade em processos com trio Presumível Pai(A)/Mãe(B)/Filho(a) (C) ... 41

Aplicação dos Y-STRs nos casos de investigação de parentesco ... 43

A utilização dos Y-STRs nos casos criminais ... 46

Metodologias para estimativa da frequência dos haplótipos na população... 49

Método das Frequências ... 49

Método – Haplotype Surveying... 50

Método de Charles Brenner... 51

Análise de casos ... 53

Capítulo 3 ... 64

3. Resultados ... 64

Análise estatística populacional... 64

Análise das taxas de mutação ... 70

Análise de casos Práticos... 77

Capítulo 4 ... 82

4. Conclusões ... 82

(9)

Lista de Tabelas

Cláudia Isabel Vieira da Silva ix

Lista de Tabelas

Tabela 1- Y-STRs usados actualmente na rotina dos casos forenses incluídos no AmpFlSTR®Y filer® PCR amplification kit, estrutura da unidade de repetição e nº possível de repetições em cada um destes locus... 9

Tabela 2- Valores da taxa de mutação e respectivos intervalos de confiança para os marcadores Y-STRs em estudo obtidos no site www.yhrd.org... 31

Tabela 3– Informação relativa ao nº de mutações obtido em cada marcador genético e respectiva extrapolação para a amostra em estudo... 36

Tabela 4– resultados obtidos com os marcadores autossómicos ... 57

Tabela 5- resultados obtidos com Y-STRs... 58

Tabela 6- resultados obtidos com os marcadores autossómicos para o caso 2... 61

Tabela 7- resultados obtidos com os... 61

Tabela 8– resultados obtidos com os Y-STRs... 62

Tabela 9- resultados obtidos com os Y-STRs para o caso 4... 63

Tabela 10- Tabela do nº de características alélicas detectadas em cada Y-STR, ... 64

Tabela 11--Resultados da Diversidade Genética em cada locus... 66

Tabela 12- Resultados da Diversidade Genética média ... 66

Tabela 13- representação do nº médio de diferenças entre indivíduos uando estudados com diferentes conjuntos de Y-STRs e respetiva Diversidade Haplótipica ... 67

Tabela 14- haplotipos partilhados quando usados os Y-STRs do Haplotipo Mínimo... 69

Tabela 15- haplotipos partilhados quando quando usados os Y-STRs do Haplotipo Estendido ... 69

Tabela 16- haplótipos partilhados quando quando usados os Y-STRs do Haplotipo Completo... 70

Tabela 17– Valores dos parâmetros a priori e a posteriori para a priori Uniforme (1,1) e uniforme (1/2,1/2)... 71

Tabela 18- Valores estimados para o valor médio da taxa de mutação (µ), variância e respectivos intervalos de credibilidade com recurso à metodologia Bayesiana, com uma distribuição a priori uniforme (1,1). ... 71

Tabela 19- Valores estimados para o valor médio da taxa de mutação (µ), variância e respectivos intervalos de credibilidade com recurso à metodologia Bayesiana, com uma distribuição a priori uniforme (1/2,1/2)... 72

Tabela 20-– valores dos parâmetros α, β, e dos Hiperparâmetros A e B das distribuições a priori e a posteriori beta... 73

Tabela 21- Valores estimados para o valor médio da taxa de mutação (µ), variância e e respectivos intervalos de credibilidade com recurso à metodologia bayesiana, com uma distribuição a priori Beta... 73

Tabela 22– valores dos parâmetros g,h, e dos Hiperparâmetros G e H... 75

Tabela 23-– Registo dos valores estimados para a taxa de mutação e respectivos intervalos de confiança quando aplicada a distribuição a priori Gama usando o modelo de Poisson... 76

(10)

Tabela 24--cálculo da probabilidade de ocorrer coincidência de perfis genéticos presumindo a hipótese H0 em cada um dos

casos de investigação de parentesco em estudo... 77

Tabela 25- Probabilidade de encontrar na população um indivíduo com um perfil coincidente com o dos filhos intervenientes nos processos de investigação de parentesco P

[

Y|H1,I

]

... 78

Tabela 26-resultados do LRY com as taxas de mutação obtidas no site www.yhrd.org... 78

Tabela 27- resultados do LRY recorrendo às taxas de mutação estimadas recorrendo à metodologia Bayesiana... 79

Tabela 28- valores do LRAobtidos com o software “Familias”... 79

Tabela 29– resultados finais do valor de LRC, resultantes da multiplicação do LR dos marcadores autossómicos com as diferentes possibilidades de LR do cromossoma Y... 80

Tabela 30– resultados dos valores de probabilidade P

[

Y|H0,I

]

e P

[

Y|H1,I

]

, para os casos práticos criminais em estudo. ... 81

(11)

Lista de Figuras

Cláudia Isabel Vieira da Silva xi

Lista de Figuras

Figura 1-imagem representativa de ambos os cromossomas sexuais. O cromossoma X e o cromossoma Y... 6 Figura 2 - Esquema representativo da estrutura do cromossoma Y, com os seus braços curto (p) e longo(q), regiões de

recombinação genética (PAR1 e PAR2) e localização dos respectivos Y-STRs utilizados na área forense. ... 8 Figura 3- perfil genetico masculino obtido com o kit AmpFlSRT®Y Filer Plus (Applied Biosystems). ... 20 Figura 4- Representação gráfica do nº de diferenças alélicas entre indivíduos considerando os marcadores do Haplótipo Mínimo, do Haplótipo Estendido e do Haplótipo Total. ... 68 Figura 5- representação gráfica das densidades das distribuições a priori, verosimilhança e distribuição a posteriori nos marcadores sem mutações detectadas (DYS437, DYS439) e marcadores com mutações detectadas (DYS458 e GATA H4)... 74 Figura 6- representação gráfica das distribuições a posteriori considerando as distribuições Uniforme (1,1), Uniforme (½ , ½) e Beta(α,β)... 75 Figura 7- representação gráfica relativa à distribuição a priori e a posteriori Gama para o parâmetro λ... 76

(12)

A – Adenina

Amelogenina – gene, cujo fragmento amplificado tem 103 pares de bases no

cromossoma X e 106 pares de bases no cromossoma Y, permite a determinação do género de uma amostra biológica.

C – Citosina

Cromossoma – longa sequência de DNA, constituída por milhares de pares de

bases, estruturalmente dividida em duas partes designadas respectivamente por braço longo(q) e braço curto (p), separadas por uma região de constrição designada por centrómero.

Cromossoma Y – Cromossoma que determina o sexo masculino

D7A – desoxirribonucleic acid- ácido desoxirribonucleico – cadeia em dupla hélice

que codifica a informação genética necessária de cada organismo vivo.

G – Guanina

Genoma – património genético total de um organismo.

Genótipo – composição alélica de uma célula ou várias células obtida pelo estudo

de um determinado gene ou num conjunto de genes. Em genética forense corresponde à composição alélica das células do indivíduo quando estudado um ou vários marcadores em simultâneo.

Haplótipos – conjunto de alelos em dois ou mais loci de um cromossoma sem Heterozigótico – um indivíduo que tem um par de genes com diferentes sequências. Homozigótico – um indivíduo que tem um par de genes com sequências iguais. ISFG – Internacional Society for Forensic Genetics - Sociedade Internacional de

Genética Forense que promove o conhecimento científico na pesquisa de marcadores genéticos importantes para análise forense.

Loci – plural de locus

Locus – local específico ou segmento na sequência de DNA Meiose – método de divisão celular que ocorre nas células sexuais

Multiplex – reação química que permite amplificar em simultâneo vários sítios

específicos do Genoma.

Pb – pares de bases – unidade do comprimento da cadeia de DNA igual ao nº de

(13)

Abreviaturas e Definições

Cláudia Isabel Vieira da Silva xiii

PCR – Polymerase chain reaction- técnica in vitro que permite aumentar

exponencialmente o número de cópias de uma determinada sequência de DNA.

S7Ps – Single nucleotide polymorphisms- STRs – Short Tandem Repeats

SWGDAM – Scientific Working Group on DNA Analysis Methods – grupo de

aproximadamente 50 cientistas representantes de laboratórios de DNA forenses dos USA e Canadá.

T – Timina

V7TRs – Variable Number Tandem Repeats Y-STRs – Short Tandem Repeat do cromossoma Y.

(14)

A Razão é Incompetente para Determinar uma Verdade...

A razão, ou intelecto, nem percebe, nem cria; tão-somente compara, e, por comparação, rectifica e elabora os dados que os sentidos ministram.

A razão é, portanto, incompetente para determinar uma verdade, por isso que não pode determinar um facto, mas só compará-los com outros.

(15)

Capítulo 1

1. Introdução

A evolução da Genética Forense

A Genética e Biologia Forense é o ramo das Ciências Forenses dedicado à identificação biológica de indivíduos ou de amostras biológicas para fins jurídicos, quer no âmbito do direito civil, quer no âmbito do direito criminal. Para esse efeito, são realizados exames periciais em amostras com origem conhecida, que consistem actualmente, na determinação de um perfil genético ou perfil de DNA, contribuindo quer para o esclarecimento de relações biológicas de parentesco, paternidade ou maternidade na sua maioria, identificação de desconhecidos, ou identificação dos contribuintes de amostras biológicas relacionadas com processos de natureza criminal.

Esta área científica não é de todo actual, no entanto, nos últimos 20 anos, devido a um grande desenvolvimento científico e à descoberta de características especiais nas sequências de DNA, designadas por polimorfismos de DNA, toda a forma de realizar estudos nesta área foi revolucionada. Até 1985, os estudos das amostras biológicas forenses eram baseados na análise dos produtos genéticos na forma de grupos sanguíneos ou de proteínas sorológicas[1]. No entanto, estes marcadores apresentavam alguns incovenientes para utilização nesta área, nomeadamente baixo nível de polimorfismo e consequentemente poder de discriminação fraco entre os indivíduos, grande instabilidade molecular e relativa fiabilidade dos resultados, assim como limitações no tipo e quantidade de amostra biológica estudada. Em 1985, Allec Jefreys,

(16)

descobriu regiões de grande variabilidade no DNA entre os indivíduos, designadas genericamente por DNA fingerprinting, expressão amplamente difundida, embora, não muito correta do ponto de vista biológico. Esta descoberta constituiu os alicerces da genética forense moderna como actualmente é aplicada [1].

Estes polimorfismos são regiões de DNA não codificante, isto é, regiões não intervenientes na síntese proteica. Em simultâneo com esta descoberta surgiu uma nova metodologia laboratorial, designada por PCR (Polymerase Chain Reaction), técnica que permite a multiplicação exponencial do número de cópias de uma única molécula de DNA[2], contribuindo para a realização de análises em todo o tipo de amostras biológicas, mesmo com quantidades de material biológico exíguas. Estas características técnicas associadas à elevada precisão destas análises, contribuíram para o desenvolvimento de metodologias inovadoras fundamentais na genética forense atual[1], adequadas para a resolução de problemas judiciais outrora irresolúveis.

A Estrutura do Genoma Humano e Hereditariedade

Todos os organismos vivos, com excepção de alguns tipos de vírus, usam o DNA como o seu material genético. O DNA, acrónimo de Deoxyribonucleic Acid, é uma estrutura molecular que desempenha duas funções fundamentais: codificação genética da informação necessária para a construção e funcionamento de todas as células do organismo vivo, bem como, todas as instruções necessárias para a transmissão hereditária dessas mesmas características [3].

A estrutura do polímero de DNA é formada por uma sequência de unidades designadas por nucleótidos. Cada nucleótido é composto por uma molécula de açúcar,

desoxirribose, um grupo fosfato e uma outra molécula designada por base. As

diferenças entre os nucleótidos ocorrem devido à existência de quatro bases distintas designados por Adenina (A), Guanina(G), Citosina (C) e Timina (T). A ligação entre os diferentes nucleótidos forma aglomerados, constituíndo subestruturas designadas por

cromossomas.

Em todas as células da espécie humana a informação genética está armazenada em 46 cromossomas, com a excepção dos gâmetas, (óvulos e espermatozóides), cujo material genético está reduzido a metade, isto é 23 cromossomas, sendo por isso designadas por células haplóides. No momento da fecundação a fusão de um óvulo com

(17)

Introdução

Cláudia Isabel Vieira da Silva 3

um espermatozóide produz uma nova célula- zigoto- que irá dar origem a um novo indivíduo. Este, terá na sua génese os 46 cromossomas, isto é, 23 pares, 22 pares autossómicos, isto é não sexuais, e um par de cromossomas sexuais importantes para a determinação do sexo do indivíduo, designados por X ou Y. No caso dos indivíduos do sexo feminino dois cromossomas X, (genótipo XX) e no caso dos indivíduos do sexo masculino um cromossoma X e um cromossoma Y, (genótipo XY) [3,4].

Em cada cromossoma existem sequências específicas, designadas por genes nucleares, localizados em posições perfeitamente definidas, designados por locus (loci no plural) e são transmitidos por ambos os progenitores. Deste modo em cada locus de cada cromossoma existe uma forma génica de origem materna ou paterna, cuja informação codificada não é necessariamente igual. Cada uma das formas génicas localizada num determinado locus é designada por alelo. Assim, em cada locus pode existir uma ou duas formas génicas, uma de origem paterna e outra de origem materna. Se os alelos localizados em cada um desses locus apresentarem uma estrutura igual o indivíduo é Homozigótico para essa característica. Quando os alelos são diferentes o indivíduo é Heterozigótico para essa categoria [3].

Em todos os cromossomas existem sequências com função codificante e outras sequências com função não codificante. As regiões codificantes, correspondentes a 5% do genoma nuclear total e contêm a informação necessária para a síntese de proteínas [4]. As regiões não codificantes, correspondentes a 90-95% do genoma nuclear e têm permanecido com função desconhecida, apresentando grande variabilidade entre os indivíduos, excepto no caso de gémeos idênticos, sendo por esse motivo muito úteis na identificação genética dos indivíduos [1-2][4]. De salientar que esta região é constituida por sequências não repetitivas (70-75%) e sequências repetitivas (25-30%) [2] sendo estas, as que apresentam grande variabilidade e consequentemente um elevado nível de polimorfismo, com grande utilidade na identificação humana, consequentemente muito úteis para aplicação forense.

De salientar ainda, que o DNA é uma molécula invariável em todas as células do mesmo indivíduo transmissível de geração em geração com grande estabilidade o que permite a sua preservação mesmo em condições ambientais adversas, particularmente em condições de temperatura e humidade destrutivas para outras moléculas biológicas.

(18)

Classes de Polimorfismos de D7A

O potencial dos polimorfismos localizado nos diferentes cromossomas foi descoberto inicialmente por Jefreys e seus colaboradores em 1985. Jefreys verificou que existia um padrão aleatório de determinadas regiões de DNA diferente entre os indivíduos, localizado nas regiões não codificantes. Esta região não codificante é constituída por pequenos segmentos da cadeia repetidos em tandem, isto é, a mesma sequência repete-se um número variável de vezes na mesma região cromossómica. Cada um desses fragmentos é designado por unidade de repetição e o nº de repetições varia de indivíduo para indivíduo. Assim o perfil genético do indivíduo é caracterizado pelo nº de unidades de repetição que o seu genoma apresenta num determinado locus [5].

Em genética forense esta é a forma de distinguir dois indivíduos desde que não se tratem de gémeos homozigóticos.

De acordo com o tamanho do segmento de DNA que inclui as unidades de repetição, estas sequências polimórficas podem ser classificados em:

Minisatélites ou VNTRs –variable number of tandem repeats ou minisatélites –

Unidades de repetição com aproximadamente 20-70 pares de bases (pb), o que corresponde na prática a fragmentos de DNA com 500-20000 pb[5]. A sua utilização em genética forense não foi muito longa, devido ao tamanho dos fragmentos, o que tornava o seu estudo complexo e pouco fiável. Deste modo a sua aplicação forense é muito limitada, o que rapidamente contribuiu para a substituição destes marcadores por outros de menor tamanho[1,5]

Microsatélites ou STRs –Short tandem repeats- são unidades de repetição de pequeno

tamanho variável entre os 3 e os 7 pb que correspondem na prática a fragmentos de DNA com 50-500 pb [5] com grande dispersão no genoma humano. Estima-se que existam aproximadamente 500 000 STRs dispersos por todo o genoma humano, dos quais 6000-10000 são compostos por unidades de repetição com 3 ou 4 pb[6]. Estas unidades de repetição estão dispersas quer nos cromossomas autossómicos quer nos cromossomas sexuais. Estes fragmentos são relativamente pequenos, o que viabiliza com grande sucesso o seu estudo em amostras degradadas, sobretudo em amostras

(19)

Introdução

Cláudia Isabel Vieira da Silva 5

antigas e esqueletos humanos, com especial aplicação em estudos antropológicos e arqueológicos, contribuíndo para a reconstrução de genealogias históricas e estudos de genética populacional. Ao nível forense, estas características são particularmente úteis no estudo de amostras de cadávers em avançado estado de decomposição, quer em cadáveres sujeitos às mais diversas condições de degradação ambiental, isolados ou em valas comuns, tendo contribuído para o esclarecimento de alguns episódios menos positivos da história da humanidade.

SNPs- Single Nucleótide Polymorphims- consistem no estudo de uma única base

localizada num determinado fragmento de DNA. São Polimorfismos de posição em que a variabilidade genética é devida a uma alteração numa única base nucleotídica. Estes sistemas proporcionam o estudo de regiões de DNA mais pequenoas do que os fragmentos usados para o estudo dos STRs[7]. Os SNPs podem igualmente ser estudados quer nos cromossomas autossómicos quer nos cromossomas sexuais e no DNA mitocondrial e estão numa fase de estudo e implementação a nível mundial. Contribuem, tal como os STRs para estudos antropológicos e arqueológicos e apresentam grande utilidade em amostras degradadas. Devido ao seu fraco poder de discriminação comparativamente aos STRs, atualmente só devem ser estudados em conjunto com estes marcadores.

O estudo dos STRs e dos SNPs foi implementado devido à introdução de uma técnica laboratorial designada por PCR, descrita por Kary Mullis em 1985. Esta metodologia consiste na amplificação in vitro de sequências de DNA específicas, contribuíndo para o aumento exponencial do número de cópias de um segmento de DNA de interesse, com grande sucesso quer em amostras seguras quer em amostras degradadas ou diminutas. Além de grande sensibilidade, a sua completa automatização deste procedimento contribui para análises mais rápidas do genótipo do indivíduo[1,5].

Actualmente este procedimento laboratorial permite o estudo em simultâneo de vários loci, designadas por reacções multiplex, contribuindo para a preservação de amostras de evidências, pois é possível a obtenção de informação genética em muitos marcadores a partir de amostras diminutas. Na presente dissertação são estudados STRs específicos do cromossoma Y amplamente usados nos estudos de genética forense.

(20)

O cromossoma Y

Figura 11-imagem representativa de ambos os cromossomas sexuais. O

cromossoma X e o cromossoma Y

O cromossoma Y, caraterístico dos indivíduos do sexo masculino, é um dos cromossomas mais pequenos do genoma humano, representando aproximadamente 2% do total do material cromossómico nuclear [8]. Este cromossoma apresenta um tamanho aproximado de 60 milhões de pares de bases (pb) e apenas 161 genes codificantes localizados no braço mais pequeno, ou braço p, da sua estrutura [2,9].

Este cromossoma sexual está dividido em duas grandes regiões distintas, uma região de Eucromatina, região codificante, com tamanho fixo de aproximadamente 30 milhões de pares de bases e uma região de heterocromatina, região não codificante, com tamanho variável em cada indivíduo. Além das características referidas acresce a total ausência de recombinação genética com o cromossoma X, durante o processo de Meiose, excepto em duas pequenas regiões, localizadas nas extremidades do cromossoma, designadas respectivamente por PAR I e PAR II. A ausência de recombinação genética determina que todas as sequências localizadas fora dessas

1

(21)

Introdução

Cláudia Isabel Vieira da Silva 7

regiões, sejam transmitidas às gerações seguintes como um bloco, sem alterações genéticas a não ser que ocorra alguma mutação [8,9]. Desta forma é possível afirmar que este cromossoma é único nos indivíduos do sexo masculino, haplóide, por só existir um alelo em cada locus, salvo em situações de duplicação no mesmo locus, de herança uniparental paterna, sendo transmitido intacto de pai para filho, a não ser que ocorram fenómenos de mutação, quer por adição ou por deleção de unidades de repetição [9].

Estas características são de grande importância na genética forense. A ausência de recombinação genética implica que os haplótipos, isto é, o conjunto de características genéticas obtidas de um único cromossoma, com excepção das alterações apenas por mutação genética, permitem identificar linhagens paternas. De salientar que o cromossoma Y atual contém o registo de todas as mutações que ocorreram nas diferentes linhagens paternas ao longo da evolução, reflectindo a história das linhagens paternas [9].

O cromossoma Y, tal como os restantes cromossomas nucleares, apresenta sequências polimórficas traduzidas em variantes de comprimento como os microsatélites, designados por Y-STRs, em que as unidade de repetição podem variar tanto em número como em sequência [8] e variantes de posição designados por Y-SNPs, com baixas taxas de mutação e que permitem a construção de uma árvore filogenética única [9].

Os microsatélites definem variações no interior de determinados grupos populacionais, ou haplogrupos, permitindo a separação das populações humanas [10]. Os estudos iniciais com estes Y- STRs que constituem os marcadores genéticos, foram efectuados com um STR designado por DYS19, tendo sido descobertos e validados para a área forense um grande número de sequências polimórficas importantes, não só para esta área, mas também para estudos populacionais[8]. Os primeiros marcadores a serem recomendados para utilização forense foram os seguintes: DYS19, DYS385,DYS389I, DYS389 II, DYS390, DYS391, DYS392, DYS393. Com o objectivo de incrementar o poder discriminativo destes marcadores genéticos, foi recomendada a utilização dos marcadores DYS437, DYS438 e DYS439 selecionados pelo Scientific Working Group on DNA Analysis Methods e incluídos nos principais kits comerciais. Posteriomente a

(22)

estes 12 marcadores foram adicinados DYS448, DYS456, DYS458, DYS635 e GATA H4 para garantir um maior poder discriminativo entre as linhagens paternas [11].

A figura 2 consiste numa representação em esquema da estrutura de um cromossoma Y, com as suas diferentes regiões, braço p e braço q, com indicação da região onde estão localizados os marcadores genéticos referenciados anteriormente.

Figura 2 2- Esquema representativo da estrutura do cromossoma Y, com os seus braços curto (p) e

longo(q), regiões de recombinação genética (PAR1 e PAR2) e localização dos respectivos Y-STRs utilizados na área forense.

A região não recombinante do cromossoma Y está localizada em todo o cromossoma, com a exceção das extremidades representas na cor laranja na Figura 1. A região não recombinante apresenta vários tipos de polimorfismos referenciados anteriormente e com ampla aplicação nas diferentes áreas referenciadas. Os marcadores representados com a cor azul, correspondem aos primeiros Y-STRs aplicados nesta área, e o conjunto das suas características genéticas obtidas num indivíduo é designado por Haplótipo Mínimo. Ao conjunto dos resultados de Y-STRs obtido com os marcadores do haplótipo mínimo com os marcadores DYS437, DYS438, DYS439, resultando num Haplótipo com 11 características genéticas, é designado pelo Haplótipo

Estendido, incluídos num kit comercial com o nome Powerplex® Y System (Promega

Corporation). Actualmente, são estudados no laboratório, na rotina dos casos forenses os 17 marcadores representados na tabela 1, incluídos num kit comercial designado por

2

Retirado do site http://www.cstl.nist.gov/strbase/ystrpos1.htm em 17/07/2011

PAR I

PAR II Região de Heterocromatina

(23)

Introdução

Cláudia Isabel Vieira da Silva 9

AmpFlSTR®Y Filer® PCR amplification kit (Applied Biosystems™, Foster City

California), e que foram estudados no âmbito desta tese.

Na tabela 1 está representada a informação genética relativa aos Y-STRs usados neste trabalho, a sua respetiva designação técnica, estrutura genética da unidade de repetição e nº de repetições dessa mesma unidade descritas na literatura [12].

Tabela 1- Y-STRs usados actualmente na rotina dos casos forenses incluídos no AmpFlSTR®Y filer® PCR amplification kit, estrutura da unidade de repetição e nº possível de repetições em cada um destes locus.

Y-STRs Estrutura genética da unidade de repetição (STR) 7º de repetições

DYS19* (TAGA)3TAGG(TAGA)n 10-19

*DYS385a/b (AAGG)6-7(GAAA)n 7-25,28

*DYS389 I (TCTG)3(TCTA)n 9-17

*DYS389 II (TCTG)n(TCTA)nN28(TCTG)3(TCTA)n 23-34

*DYS390 (TCTA)2(TCTG)n(TCTA)n(TCTG)n(TCTA)nTCA(TCTA)2 17-28

*DYS391 (TCTG)3(TCTA)n 6-14

*DYS392 (TAT)n 6-18

*DYS393 (AGAT)n 8-17

**DYS438 (TTTTC)1(TTTTA)0-1(TTTTC)n 6-14

**DYS439 (GATA)n 8-15

DYS437 (TCTA)n(TCTG)1-3(TCTA)4 13-17

DYS448 (AGAGAT)nN42(AGAGAT)n 17-23

DYS456 (AGAT)n 14-19

DYS458 (GAAA)n 13-20

DYS635 (TCTA)4(TGTA)2(TCTA)2(TGTA)2(TCTA)2 (TGTA)0,2(TCTA)n

17,19–26 GATA H4 (AGAT)4CTAT(AGAT)2(AGGT)3(AGAT)nN24(ATAG)4

(ATAC)1(ATAG)2

(24)

Vantagens da aplicação dos marcadores do cromossoma Y

A aplicação dos marcadores específicos do cromossoma Y na área forense tem vindo a crescer significativamente na última década com a descoberta e validação de novos marcadores. O seu valor nesta área é apoiado no facto de grande parte dos crimes violentos ser efectivamente provocado por um ou vários indivíduos do sexo masculino[1], e como referenciado anteriormente a análise destes marcadores tem várias aplicações fundamentais, nomeadamente identificação da linhagem paterna de um indivíduo, a ancestralidade da mesma, bem como possivelmente a sua origem geográfica[13], o que pode contribuir para resolução de alguns tipos de crimes.

Nos casos de abuso sexual um agressor pode ser identificado pela detecção do seu haplótipo numa amostra recolhida no local do crime. Os resultados obtidos podem permitir a obtenção de uma coincidência de perfis genéticos entre o vestígio recolhido e um potencial suspeito[13]. Por outro lado a ausência de resultados pode indicar que o vestígio biológico em estudo apresenta somente DNA feminino. Estas características têm contribuído para a aplicação crescente nos casos de abuso sexual. Nas amostras biológicas provenientes destes casos, habitualmente, existe mistura de material celular da vítima e do suspeito, em quantidades desproporcionais, na grande maioria dos casos com quantidade de material celular feminino consideravelmente superior à do suspeito. Nestas circunstâncias o estudo dos marcadores específicos do cromossoma Y, permite a obtenção de um perfil genético masculino, em muitos dos casos em que somente é detetado o perfil genético feminino quando aplicados os marcadores autossómicos. Esta é em muitos casos a única possibilidade de identificar o agressor.

- A utilização destes marcadores pode ser útil na determinação do número de contribuintes masculinos para uma determinada amostra biológica. A presença de mistura de características masculinas nos diferentes marcadores pode indicar a presença de mais do que um contribuine do sexo masculino. Estes casos podem ser de difícil avaliação, na medida em que a obtenção de um perfil masculino do cromossoma Y na amostra, significa que foi identificada uma linhagem paterna e não um indivíduo específico.

(25)

Introdução

Cláudia Isabel Vieira da Silva 11

- A identificação da linhagem paterna em estudos de investigação de parentesco é mais uma aplicação forense destes marcadores. Estes podem ser particularmente úteis em casos de paternidade complexos com o presumível pai do filho do sexo masculino está ausente [13]. São frequentes os casos com recurso aos pretensos avós paternos para a determinação da paternidade do indivíduo. No entanto existem outras situações em que o recurso a esses familiares não é viável. A aplicação dos marcadores de cromossoma Y pode contribuir para a determinação da paternidade com recurso a outros familiares da mesma linhagem paterna. Como os perfis do cromossoma Y são idênticos na mesma linhagem paterna, a não ser que ocorra um fenómeno de mutação, a avaliação pode ser efectuada por observação da coincidência entre o perfil do presumível familiar e o perfil do filho. Nos casos de identificação de desconhecidos e sobretudo nos acidentes de massa, pode contribuir eficazmente para a identificação das linhas paternas nas vítimas.

- A aplicação na história evolutiva da humanidade e estudos migratórios, contribui para o esclarecimento da origem geográfica ancestral das linhagens masculinas e assim realizar estudos sobre os fluxos migratórios humanos nos últimos milhares de anos, bem como a compilação dessa informação em bases de dados internacionais. Estes conhecimentos podem ainda ser utilizados para a identificação do grupo étnico de determinado suspeito [13].

Desvantagens da utilização do cromossoma Y

Os marcadores genéticos do cromossoma Y não são independentes uns dos outros. A sua transmissão ocorre em bloco, designado por haplótipo, contribuindo para a identificação da linhagem paterna. No entanto, o facto de todos os indivíduos relacionados pela via paterna partilharem o mesmo perfil genético masculino, pode constituir uma limitação na sua aplicação, na medida em que inviabiliza a discriminação genética entre estes indivíduos. Mas apesar deste facto a sua utilidade em genética forense é contudo enorme, pois em muitos casos os resultados genéticos destes marcardores são a única prova baseada na evidência que permite estabelecer a ligação entre o suspeito e as amostras biológicas associadas ao processo criminal. No entanto

(26)

sempre que possível devem ser analisados em conjunto com os marcadores autossómicos [8].

Análise dos resultados do Cromossoma Y

Um perfil genético do cromossoma Y diz-se que é coincidente com o perfil da linhagem paterna se existir coincidência entre todos os alelos das amostras em comparação. No SGBF, essa análise é qualitativa e consiste unicamente em verificar se existe ou não coincidência entre todos os alelos, isto é se os perfis genéticos são coincidentes ou não são coincidentes, não existindo até à data nenhuma forma de efectuar uma avaliação matematica e consequentemente calcular a probabilidade de um indivíduo contribuir ou não para um determinado vestígio. Não existe no entanto consenso generalizado relativamente à aplicação destes marcadores genéticos. Nos casos em que não existe coincidência entre todos os marcadores genéticos, parece não existir dúvidas relativamente à exclusão de um determinado indivíduo de determinada linhagem paterna, mas não existe consenso na forma de utilização dessa informação em sede de tribunal, sempre que ocorre uma coincidência entre o perfil masculino do suspeito e a amostra de vestígio [10].

Nos casos de investigação de parentesco os marcadores masculinos podem ser particularmente úteis em casos cujo objectivo é analisar se dois indivíduos estão relacionados por via paterna, como por exemplo, num caso em que o presumível pai esteja desaparecido. Se existir uma coincidência entre o perfil masculino dos intervenientes poderá existir então um laço de parentesco entre eles pela via paterna. Se não existir essa coincidência será necessário avaliar quais os marcadores em que foi detetada alguma incompatibilidade, considerando a possibilidade de a mesma ser devida a mutação genética.

De salientar nestes casos que a distância entre gerações de indivíduos é um factor que contribui para aumentar a probabilidade de ocorrência de diferenças alélicas entre os indivíduos. Deste modo essas incompatibilidades observadas serão o resultado de alterações genéticas entre gerações e não devem ser avaliadas como se se tratassem de exclusões de laços de parentesco entre os indivíduos. Assim as taxas de mutação são

(27)

Introdução

Cláudia Isabel Vieira da Silva 13

particularmente importantes e devem ser obtidas para utilização na rotina dos casos forenses.

Taxas de Mutação dos Loci do cromossoma Y

Uma mutação é detectada se existirem diferenças num ou dois loci envolvendo uma ou duas unidades de repetição na transmissão hereditária destas características genéticas. Nestes casos a coincidência de perfis genéticos de dois indivíduos alegadamente pertencentes à mesma linhagem paterna deve ser reconsiderada, dada a informação existente relativa às taxas de mutação [14]. As mutações dos STRs nos marcadores autossómicos ou do cromossoma Y são o resultado de erros no DNA durante a fase da replicação, que normalmente implicam o ganho ou a perda de uma única unidade de repetição e são transmitidos à geração seguinte [14]

Em genética populacional, a estimativa aproximada das taxas de mutação dos marcadores de cromossoma Y é particularmente importante para a datação da origem das linhagens paternas, com importância em estudos antropológicos. Em termos forenses, o conhecimento das taxas de mutação é necessário para a interpretação mais correta dos dados relativos aos Y-STRs, sobretudo nos testes de investigação de parentesco [14] [15].,

As taxas de mutação relativas para os STRs autossómicos podem ser estimadas pela aplicação de modelos estatísticos, mas as estimativas obtidas a partir da observação directa em casos de investigação de parentesco produzem resultados mais fidedignos [14]. O mesmo princípio pode ser aplicado no caso dos Y-STRs, no entanto, em contraste com os estudos efectuados com os marcadores autossómicos existem poucos dados relativos aos marcadores do cromossoma Y.

A nível internacional existe um repositório relativo a marcadores do cromossoma Y, Y-STRs ou Y-SNPs, aplicados na área forense, localizado no domínio www.yhrd.org [16]. Este repositório reúne informação de todos os laboratórios associados que têm contribuido com os seus dados laboratoriais inclusive informação relativa às taxas de mutação. No entanto, tratam-se de taxas de mutação conjuntas, o

(28)

que devido à grande heterogeneidade populacional podem não corresponder às taxas de mutação do grupo populacional do sul de Portugal objecto deste trabalho. Essa informação pode ser obtida em cada laboratório recorrendo ao estudo de pares pai/filho com paternidade confirmada [14].

Valorização estatística dos resultados

As técnicas de análise genética altamente sensíveis permitem a obtenção de um perfil genético nas diferentes amostras em estudo, seja um vestígio recolhido no local do crime, sejam as amostras de referência dos intervenientes, quer dos exames de investigação de parentesco, quer dos intervenientes nos casos criminais.

Nos casos criminais o objectivo é verificar se o perfil genético do suspeito é ou não coincidente com o perfil obtido nos vestígios biológicos em estudo no âmbito do respectivo processo. Nos casos de parentesco é necessário verificar se existe ou não coincidência entre os perfis genéticos dos indivíduos em estudo. Actualmente essa avaliação é efectuada de forma qualitativa e as conclusões dos relatórios são baseadas unicamente na coincidência/não coincidência entre perfis genéticos, não existindo até à data uma forma de valorização estatística deste tipo de resultados.

É necessário encontrar uma metodologia que permita quantificar a relação entre perfis genéticos obtidos em amostras distintas, metodologia essa traduzida em valores de probabilidade, de alguma forma esclarecedores para quem terá de tomar a decisão em sede de tribunal. Em todos os casos existe sempre alguma incerteza e a incerteza é medida em termos de probabilidade [17].

Os resultados do DNA nas evidências biológicas são vistos como muito poderosos, quer para condenar, quer para ilibar um indivíduo [18], sobreduto porque em muitos dos casos de criminalidade, ou até mesmo nos casos de investigação de parentesco, não existem muitas evidências além dos exames genéticos.

O importante nestes casos, quando existe matching de um determinado perfil de DNA, não é o matching per si, mas a valorização matemática do mesmo [19]. Nos casos

(29)

Introdução

Cláudia Isabel Vieira da Silva 15

de investigação de parentesco a informação relativa aos marcadores autossómicos deve ser conjugada com a informação relativa aos marcadores do cromossoma Y. Nos casos criminais, na ausência de resultados de marcadores autossómicos, é necessário encontrar um modelo matemático que permita quantificar a associação entre perfil genético de uma amostra biológica coincidente com o perfil genético do suspeito sendo ele culpado ou não culpado [19].

Objectivo do Trabalho

O Serviço de Genética e Biologia Forense introduziu o estudo dos Y-STRs na sua rotina de exames periciais, sobretudo nos casos de abuso sexual, no entanto não existe até à presente data uma metodologia estatística que permita quantificar a coincidência de um perfil genético masculino obtido numa amostra biológica e o perfil genético de um suspeito. Nas investigações de parentesco complexos, com recurso a familiares da linha paterna, não existe igualmente implementado um procedimento para valorização estatística recorrendo aos marcadores do cromossoma Y. Neste sentido urge encontrar novas metodologias estatísticas capazes de resolver este problema.

Para a correta interpretação dos resultados de Y-STRs e a sua aplicação na rotina dos casos forenses é necessário conhecer a distribuição das características alélicas de Y-STR na população de referência que apresentam maior diversidade, isto é mais discriminativos, bem como quais os haplótipos mais frequentes. O estudo destes marcadores implica estudo das taxas de mutação para cada um dos marcadores em análise.

Os marcadores em estudo, atualmente aplicados na rotina dos casos forenses, são os recomendados pelas ISFG (international Society For Forensic genetics) incluídos no kit comercial AmpFlSTR®Y Filer®, designados por: DYS19, DYS385a/b, DYS389, DYS390, DYS391,DYS392,DYS393, DYS437, DYS438, DYS439, DYS456, DYS458, DYS635, GATA H4 e DYS448. O estudo populacional será efectuado através de uma pequena amostra de indivíduos do sexo masculino não aparentados, cujo critério de selecção foi terem recorrido ao SGBF para realização de exames de parentesco. As taxas de mutação, estudadas recorrendo aos pares pai/filho, com paternidade

(30)

comprovada recorrendo aos marcadores de STRs autossómicos, poderão ser estimadas recorrendo a metodologia bayesiana.

O conhecimento das características genéticas dos Y-STRs permitirá o cálculo das probabilidade de matching quer nos casos de investigação de parentesco, quer nos casos de criminalística biológica de forma a que as metodologias possam ser aplicadas na rotina dos casos forenses.

(31)

Capítulo 2

2. Material e Métodos

Estudo Biológico

Amostras Biológicas

A primeira fase deste trabalho, relativo ao estudo populacional e taxas de mutação foi realizada recorrendo à análise genética de 197 pares pai/filho, seleccionados a partir dos casos de rotina estudados no SGBF, cuja relação de paternidade foi previamente comprovada durante o respectivo processo de investigação de parentesco.

Em todos os intervenientes foi efectuada colheita de sangue em cartões

Whatman® bloodstain card e células da mucosa bucal em zaragatoa Whatman® sterile omniswab. As amostras foram armazenadas nas mesmas condições.

A extracção de D7A

A fase inicial do estudo de DNA consiste na separação desta molécula dos restantes constituintes celulares. Esta fase de procedimento laboratorial é designada por extracção de DNA. Nas amostras biológicas de referência foi aplicado o método de chelex® [20] e nas amostras de vestígios biológicos dos casos criminais foi aplicado o método de fenol/clorofórmio com purificação de

(32)

álcool isoamílico[21]. Ambos os métodos foram realizados a partir de protocolos existentes no serviço.

Amplificação e Análise dos Y-STRs

A análise dos marcadores de DNA é efectuada recorrendo à técnica de PCR. Esta metodologia consiste na amplificação, isto é na multiplicação do número de cópias de determinadas sequências de DNA, correspondentes aos marcadores genéticos validados para a área forense, contribuíndo para a sua análise posterior desses fragmentos amplificados. Todas as amostras estudadas neste trabalho foram sujeitas à mesma metodologia para obtenção dos resultados genéticos.

As amostras biológicas de pares Pai/Filho provenientes da população residente no sul de Portugal Continental, foram previamente estudadas no âmbito das investigações de parentesco, com dois kits multiplex, AmpFlSTR®Identifiler®PCR (Applied Biosystems, Inc, Foster City, CA, USA) amplification kit e Powerplex®16 system (Promega Corporation). Estes kits devidamente validados para a área forense, permitem a amplificação simultânea de 15 marcadores de STRs autossómicos bem como do locus da Amelogenina, gene localizado nos cromossomas sexuais utilizado para a determinação do género do indivíduo. Após a análise destes STRs é verificada a partilha de um dos alelos entre o pai e o filho em todos os loci e após esta fase é efectuado o cálculo da

Probabilidade de Paternidade e da Razão de Verosimilhança. Somente foram

usados neste estudo indivíduos cujos valores da probabilidade de paternidade é superior a 99,9999% com índices de paternidade superiores a 10000, conforme sugerido por outros autores, nomeadamente Gusmão et al [22].

As amostras selecionadas foram estudadas nos seguintes marcadores genéticos: DYS19, DYS385a\b, DYS389I, DYS389II, DYS390, DYS391, DYS392, DYS393, DYS437, DYS438, DYS439, DYS448, DYS456, DYS458, DYS635 e GATA-H4, incluídos no Kit Amp FlSTR® Y Filer (Applied Biosystems Inc, Foster City, CA, USA). A amplificação foi realizada com 1 µl de DNA extraído, num volume de reacção total de 12,5 µl, em vez dos 25 µl sugeridos

(33)

Material e Métodos

Cláudia Isabel Vieira da Silva 19

pelo fabricante. Esta reação foi realizada num termociclador 9700 GeneAmp®PCR system (Applied Biosystems, Inc, Foster City, CA, USA). Em todos estes marcadores genéticos, com excepção do marcador DYS385a/b é habitualmente obtida uma única característica genética, excepto os casos em que ocorre duplicação. O locus DYS385 é constituído por duas regiões de DNA separadas entre si por 40 pb o que inviabiliza o “desenho” de primers específicos para as diferentes regiões. Assim os resultados da sua análise têm a forma de um genótipo, constituído por dois alelos e não de um único alelo como é habitualmente observado nos restantes locus deste cromossoma[23].

Análise dos produtos amplificados

A separação e detecção dos productos amplificados foi efectuada por electroforese num sistema de 16 capilares ABI Prism 3130 xl com o polímero POP-4™ (Applied Biosystems, Inc, Foster City, CA, USA), usando o filtro G5. As amostras foram preparadas com 1 µl de producto amplificado com 10 µl de Hi-Di™ Formamida e 0.5 µl de GS500-LIZ internal Size Standard (Applied Biosystems, Inc, Foster City, CA, USA). Cada electroforese foi acompanhada com uma amostra de um ladder. Os resultados da electroforese foram analisados com o GeneMapper®ID software v 3.2. Todos os alelos obtidos foram considerados com uma escala superior a 1000 RFUs (Relative Fluorescence Units). A tipagem ou classificação dos alelos foi efectuada por comparação com o ladder alélico fornecido com o kit e a sua nomenclatura é efectuada de acordo com as recomendações da DNA Comission of the International Society of Forensic Genetics [24].

Na figura 3 está representado o perfil completo do cromossoma Y obtido com o kit AmpFlSRT®Y Filer Plus (Applied Biosystems). Em todos os marcadores foi obtida uma única característica com excepção do marcador DYS385, isto porque efectivamente este marcador representa duas regiões de STRs ligadas entre si, cujos resultados constituem um genótipo.

(34)

Figura 3- perfil genetico masculino obtido com o kit AmpFlSRT®Y Filer Plus (Applied Biosystems).

Análise Estatística

Como já referenciado, nos últimos anos ocorreram muitos desenvolvimentos científicos e tecnológicos, mas para um cientista forense a “força da evidência” deve ser expressa de forma numérica em tribunal.

A aplicação de uma metodologia matemática para valorização destes dados implica diversos procedimentos. É necessário abordar as diferentes áreas de tratamento de dados, desde o estudo populacional das características alélicas até à aplicação desses mesmos resultados com casos práticos retirados do SGBF.

Análise Estatística Populacional

O estudo genético das populações humanas tem interesse não só do ponto de vista forense como do ponto de vista antropológico. Nos processos de genética forense todos os cálculos para a valorização da prova, só podem ser realizados após o estudo das características genéticas da população à qual pertencem os intervenientes, designada por população de referência. Na prática, a não ser que estejamos a trabalhar com populações muito pequenas e confinadas num

(35)

Material e Métodos

Cláudia Isabel Vieira da Silva 21

determinado espaço geográfico, o tamanho populacional é infinito, pelo que não é possível estudar uma população completa, mas somente amostras de indivíduos seleccionados aleatoriamente. Os estudos populacionais realizados no SGBF, são efectuados a partir das amostras dos indivíduos intervenientes dos processos de investigação de parentesco, considerando que esta amostra é aleatória, na medida em que o critério de selecção é unicamente a existência de um processo de investigação de parentesco. A análise foi realizada baseada na suposição que a população sul de portugal é a população de referência para os estudos realizados no SGBF.

Os estudos populacionais referidos consistem na caracterização dos alelos em cada locus e qual a sua respectiva proporção. No caso dos Y-STRs, devido às suas características de transmissão genética, é necessário caracterizar os haplótipos populacionais e a respectiva proporção populacional. Neste estudo populacional em concreto, foi calculada a frequência relativa observada dos haplótipos detetados na amostra, bem como outros parâmetros estatísticos populacionais relevantes de acordo com este tipo de marcadores em estudo.

O modelo estatístico apropriado para os estudos genéticos populacionais assume que todos os indivíduos na amostra têm a mesma probabilidade de ter um determinado genótipo, ou haplótipo no caso de Y-STRs. A modelação do número de indivíduos com uma determinada característica genética, designada por Ai num determinado locus, l, é efectuada recorrendo ao modelo Multinomial [25] A construção do modelo multinomial, supõe que cada indivíduo ao acaso da população pode apresentar qualquer uma das k características genéticas em cada um dos locus genéticos.

A utilização deste modelo presume que todos os elementos da amostra são independentes entre si e em cada locus genético podem ser classificados em uma de k categorias mutuamente exclusivas. Cada indivíduo tem probabilidade

i

A

p de ser classificado numa determinada categoria Ai. Assim de acordo com o modelo

(36)

[

]

= = = = = k 1 i n i A k 1 i A A A A 1 i i k k 1 p ! n ! n n N ,... n N P , k n n 1 i Ai =

=

[

N1 nA1,...NAk nAk

]

P = = representa a probabilidade de haver

i

A

i n

N = indivíduos em cada categoria, com i=1,....k.[25].

Matematicamente, a frequência relativa observada do alelo i, fAi é obtida pelo quociente entre o nº de alelos i (nAi) detetada na amostra e o nº total de indivíduos em estudo (n) traduzido na seguinte fórmula [1]:

n n f p ˆ i i i A A A = = , i= 1... k, 0pˆAi1,

k corresponde ao número de categorias alélicas distintas detectadas no locus A,

i

A

n corresponde ao número de alelos observados na categoria i do locus A

n corresponde ao nº total de indivíduos da amostra.

Ainda, de acordo com o modelo multinomial, a distribuição do número de indivíduos que apresenta a característica genética Ai, é Binomial (n, pAi),

presumindo que o sucesso é a apresentação da característica genética Ai, com probabilidade

i

A

p e o insucesso é a não apresentação dessa mesma categoria genética, cuja probabilidade é 1- pAi. Consequentemente, o valor esperado e a variância do número de indivíduos que apresentam a característica Ai ,é dada pelas seguintes relações: i i A A ) np N ( E = , V(N ) np (1 p ) i i i A A A = − , i=1,...,k. Portanto, i i i A A A p n np ) p ˆ ( E = = e n ) p 1 ( p ) p ˆ ( V Ai Ai i A − = .

(37)

Material e Métodos

Cláudia Isabel Vieira da Silva 23

n p p ) N , N cov( Ai Aj j A i A − = i≠j.

Intervalos de confiança para

i

A

p , podem ser obtidos usando a teoria assintótica, já que as amostras têm em geral dimensão elevada (> 30). Um intervalo de confiança a 95% é então dado por [25]:

) p ˆ ( 96 , 1 p ˆ i A Ai ± .

Os estudos populacionais devem ser acompanhados da análise da variabilidade genética e como se trata de um estudo de haplótipos, neste caso, é de considerar igualmente a diversidade dos haplótipos. A variabilidade genética nos marcadores do cromossoma Y consiste no estudo da medida de Diversidade Genética (Dl) [25].

A Diversidade Genética num determinado locus, l, é dado pela seguinte expressão matemática:

= − = k 1 i 2 il A l 1 p D .

Este parâmetro corresponde à probabilidade de dois alelos escolhidos ao acaso na população serem diferentes [26][27]. Pode ser estimado com a informação relativa às frequências alélicas estimadas -

i

A p

ˆ , onde k corresponde ao número de categorias alélicas de um determinado locus-l

Exemplo da estimativa para o locus DYS19

Alelo - i fAi fAi2 13 0,1168 0,0137 14 0,5884 0,3457 15 0,2335 0,0548 16 0,0406 0,0017 17 0,0203 0,0004 soma 1 0,4163 5837 , 0 4163 , 0 1 DYS19 = − =

(38)

A forma de obtenção da estimativa deste parâmetro é através de informação disponível a partir da amostra, pelo que o mais correto é utilizar o parâmetro diversidade genética média por locus, a qual pode ser calculada usando a seguinte expressão matemática:

= − − = k 1 i 2 il A l (1 ) 1 n n .

É fácil de provar que Dˆ assim obtido é um estimador centrado de l Dl, com efeito:

(

)

− = 1 E(pˆ ) 1 n n ) ( E l 2 il A . Como

[ ]

2A A 2 il A il i p n 1 n n p p ˆ E = + − , tem-se       − − =

2 l Ail n pAil 1 n p n 1 1 1 n n ) ( E = −

2 il A p 1 =Dl .

Como as frequências alélicas da amostra são estimativas de máxima verosimilhança, a estimativa da Diversidade Genética e também uma estimativa de máxima verosimilhança.

O estudo da diversidade genética de um locus deve ser complementado com o estudo da diversidade genética média para os mloci estudados em conjunto. Uma das formas de efetuar essa estimativa consiste no cálculo da diversidade genética para um conjunto de m loci (Dl, com l=1,2...m), através do cálculo da média da diversidade genética nos m loci:

A diversidade genética média para os m loci:

= = m i l D m D 1 ˆ 1 ˆ

= − − = = m 1 i k 1 i 2 il A ) p ˆ 1 ( 1 n n m 1

Referências

Documentos relacionados

Nessa situação temos claramente a relação de tecnovívio apresentado por Dubatti (2012) operando, visto que nessa experiência ambos os atores tra- çam um diálogo que não se dá

A análise dos dados indica que funções semelhantes às de Meyer & Schilz (1980) não permitem eliminar-se a influência da massa específica aparente na determinação do teor

Partindo do controlador, definimos um CLP com as seguintes características: 8 portas de entradas analógicas, 8 portas de entradas digitais, 12 saídas digitais e

Considerando a contabilidade como centro de gestão da informação, os autores defendem o aprimoramento de uma visão sistêmica ao profissional, como também uma maior compreensão

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial

Realizar a manipulação, o armazenamento e o processamento dessa massa enorme de dados utilizando os bancos de dados relacionais se mostrou ineficiente, pois o

Não deve ser classificado como tóxico para órgãos-alvo específicos (exposição única). Não deve ser classificado como tóxico para órgãos-alvo específicos

Our first implementation shows that our architecture can improve privacy and identity management in open pervasive telecommunication platforms for the operator of the plat- form,