• Nenhum resultado encontrado

Análise da frequência alélica de 15 LOCI STR na população do Rio Grande do Norte

N/A
N/A
Protected

Academic year: 2017

Share "Análise da frequência alélica de 15 LOCI STR na população do Rio Grande do Norte"

Copied!
77
0
0

Texto

(1)

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS DA SAÚDE

PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS FARMACÊUTICAS

ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA

POPULAÇÃO DO RIO GRANDE DO NORTE

TAISSA MARIA MOURA DE OLIVEIRA

(2)

TAISSA MARIA MOURA DE OLIVEIRA

ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA

POPULAÇÃO DO RIO GRANDE DO NORTE

Orientador:

Prof. Dr. Geraldo Barroso Cavalcanti Júnior

NATAL

2012

(3)
(4)

TAISSA MARIA MOURA DE OLIVEIRA

ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA POPULAÇÃO DO RIO GRANDE DO NORTE

Banca Examinadora:

_______________________________________

Prof. Dr. Geraldo Barroso Cavalcanti Júnior Presidente – UFRN

_______________________________________

Prof. Dr. Carlos Roberto Alves Examinador Externo – FIOCRUZ/RJ

_______________________________________

Profa. Dra. Tereza Neuma de Souza Brito Examinador Interno – UFRN

Natal, 24 de fevereiro de 2012

NATAL / RN

(5)

A meus pais, Jayme e Marizeth, pelo

incentivo na busca do conhecimento.

Fonte de inspiração, exemplo de

dedicação e respeito. Aos meus irmãos

Jayme Júnior e Sanderson, pelo apoio

incondicional e amizade. À minha

sobrinha Valentina, pela alegria hue

soma à minha vida. A eles, todo o meu

(6)

AGRADECIMENTOS

A Deus, fonte de toda Sabedoria. Por guiar meus passos e não me deixar fraquejar. A Ele, toda Honra e toda Glória.

Aos meus pais, irmãos, sobrinha, cunhadas, meu muito obrigada por tudo.

Ao Professor Dr. Geraldo Barroso pela sua orientação, amizade e confiança que tanto contribuíram para a minha formação acadêmica.

Ao Laboratório DNA Center que me abriu as portas desde a graduação. Aos queridos mestres Gioconda Leão, Andréa Fernandes e Roberto Chaves por todos os ensinamentos e confiança depositada. Aos colegas e funcionários, em especial Juliana Freire pela ajuda neste trabalho. A Erica Gil, inicialmente uma parceira profissional, hoje, uma amiga que posso contar sempre.

A todos os docentes do Programa de Pós-graduação em Ciências Farmacêuticas, em especial o Professor Dr. Matheus Pedroza, por toda a dedicação nos momentos em que precisei de seus conselhos e orientações. Às funcionárias Fábia e Aureliana pela paciência, sempre dispostas a ajudar.

À CAPES, pela concessão da bolsa de estudo.

Ao Professor Dr. Paulo Marinho, quem primeiro me apresentou à Biologia Molecular, pelo constante apoio.

Ao Professor e amigo Carlos Maia pela valiosa ajuda e disponibilidade.

Aos amigos Paulo Raimann e Weslley Tsutsumida, da Life Technologies, por toda a ajuda despendida no início deste trabalho.

(7)

Aos titulares da Banca Examinadora, Professora Dra. Tereza Neuma e Professor Dr. Carlos Roberto, pelas contribuições, críticas, elogios e por terem prontamente aceitado fazer parte desta banca.

Aos meus verdadeiros amigos, irmãos que Deus me permitiu escolher, pelas críticas, sugestões, orações, paciência e incentivo.

(8)

RESUMO

As populações humanas apresentam um considerável número de loci polimórficos,

cujo uso e aplicações vão desde a construção de mapas de ligação até estudos de evolução das populações, passando pela determinação de paternidade, medicina

forense e migração. Atualmente, os STRs (Short Tandem Repeats) são

considerados os marcadores de identificação humana por excelência, título em grande parte devido a sua abundância e elevada variabilidade, devido ao fato de serem facilmente amplificáveis pela Reação em Cadeia da Polimerase, PCR (Polymerase Chain Reaction), funcionarem com baixas quantidades de DNA e

serem passíveis de automação com processos envolvendo detecção por fluorescência. A formação de bancos de dados regionais, contendo as frequências alélicas da população de uma microrregião, fornece subsídios para aumentar a confiabilidade dos resultados de determinação de vínculo genético. Neste trabalho,

visa-se a obtenção de um banco de dados das frequências alélicas de 15 loci

polimórficos moleculares (D8S1179, D21S11, D7S820, CSF1PO, D19S433, vWA, TPOX, D18S51, D3S1358, TH01, D13S317, D16S539, D2S1338, D5S818 e FGA), em uma população classificada como nascida no Estado do Rio Grande do Norte, Brasil, totalizando 1100 indivíduos não aparentados. Para avaliação das frequências, amostras de DNA foram submetidas à amplificação por PCR, e os genótipos foram obtidos através de eletroforese capilar em sequenciador genético. As frequências apuradas no presente estudo foram comparadas com as da população brasileira em

geral e com as de outros estados do Brasil. Com exceção dos loci D21S11,

D19S433 e D2S1338, os genótipos encontrados da população do RN mostram-se em Equilíbrio de Hardy-Weinberg, e sem grandes diferenças significativas entre as

frequências encontradas nas populações estudadas. Os loci mais informativos foram

D2S1338 e D18S51, enquanto que o locus menos informativo foi o TPOX.

(9)

ABSTRACT

Human population have a significant number of polymorphic loci, whose use and applications range from construction of linkage maps, to study the evolution of populations, through the determination of paternity, forensic medicine and migration. Currently, STRs (Short Tanden Repeats) markers are considered the major markers for human identification, mainly due to its abundance and high variability because of the fact that they are easily amplifiable by PCR (Polymerase Chain Reaction), work with low amounts of DNA and be capable of automation processes involving fluorescence detection. The creation of regional databases containing allele frequencies of population provide subsidies to increase the reliability of the results of determining the genetic link. This paper aims to obtain a database of allele frequencies of 15 polymorphic molecular loci (D8S1179, D21S11, D7S820, CSF1PO, D19S433, vWA, TPOX, D18S51, D3S1358, TH01, D13S317, D16S539, D2S1338, D5S818 e FGA) in a population classifies as born in the State of Rio Grande do Norte, Brazil, totaling 1100 unrelated individuals. To evaluate the frequency, DNA samples were submitted to PCR amplification, followed by capilarry electrophoresis genetic sequencer. The frequencies identified in this study were compared with brazilian population in general and other states in Brazil. Except for the loci D21S11, D19S433 and D2D1338, the genotypes found were in Hardy-Weinberg equilibrium and no significant differences among the frequencies were found in the populations studied. The most informative loci was D2S1338 and D18S51, and the less informative is the locus TPOX.

(10)

LISTA DE FIGURAS

Figura 1 - Estrutura do DNA composta por íntrons e exons 16

Figura 2 - Marcador STR 21

Figura 3 - Sequência do locus TPOX 21

Figura 4 - Funcionamento da eletroforese capilar 24

Figura 5 - Esquema do posicionamento do primers 24

Figura 6 - Material utilizado na extração de DNA 35

Figura 7 - Loci contemplados no kit AmpFlSTR Identifiler 37

Figura 8 - Eletroferograma 38

Figura 9 - Mesorregiões do Rio Grande do Norte 41

Figura 10 - Distribuição dos indivíduos estudados entre as mesorregiões 42

Figura 11 - Locus D21S11 54

Figura 12 - Locus D13317 54

Figura 13 - Locus D3S1358 55

Figura 14 - Locus VWA 55

Figura 15 - Locus D7S820 56

Figura 16 - Locus D16S539 56

Figura 17 - Locus D18S51 57

Figura 18 - Locus CSF 57

Figura 19 - Locus D5S818 58

Figura 20 - Locus TH01 58

Figura 21 - Locus TPOX 59

Figura 22 - Locus FGA 59

Figura 23 - Locus D8S1179 60

Figura 24 - Locus D2S1338 60

(11)

LISTA DE TABELAS

Tabela 1 - Distribuição das 1100 amostras entre as Mesorregiões 42

Tabela 2 - Frequência alélica e parâmetros estatísticos para os 15 STRs

estudados na população do Rio Grande do Norte 43

Tabela 3 - Frequências alélicas para o locus D21S11 46

Tabela 4 - Frequências alélicas para o locus D13S317 46

Tabela 5 - Frequências alélicas para o locus D3S1358 46

Tabela 6 - Frequências alélicas para o locus vWA 47

Tabela 7 - Frequências alélicas para o locus D7S820 47

Tabela 8 - Frequências alélicas para o locus D16S539 47

Tabela 9 - Frequências alélicas para o locus D18S51 48

Tabela 10 - Frequências alélicas para o locus CSF 48

Tabela 11 - Frequências alélicas para o locus D5S518 48

Tabela 12 - Frequências alélicas para o locus TH01 49

Tabela 13 - Frequências alélicas para o locus TPOX 49

Tabela 14 - Frequências alélicas para o locus FGA 49

Tabela 15 - Frequências alélicas para o locus D8S1179 50

Tabela 16 - Frequências alélicas para o locus D2S1338 50

Tabela 17 - Frequências alélicas para o locus D19S433 51

Tabela 18 - Alelos mais frequentes no RN e no Brasil 52

(12)

LISTA DE ABREVIATURAS E SIGLAS

AABB American Association of Blood Banks

CODIS Combined Database Index System

DNA Deoxyribonucleic acid

FBI Federal Bureau Ivestigation

FSS Forensic Science Service

GEP Grupo Espanhol-Português

IBGE Instituto Brasileiro de Geografia e Estatística

INDELs Polimorfismos de Inserção e Deleção

ISFG Internatioanl Society of Forensic Genetic

kb Kilobase

MP Probabilidade de Matching

NDNDA Banco de dados de DNA nacional do Reino Unido

pb Par de base

PCR Polymeraase Chain Reaction

PD Poder de Discriminação

PE Poder de Exclusão

PIC Conteúdo de Informação Polimórfica

PNCQ Programa Nacional de Controle de Qualidade

RFLP Restriction Fragment Length Polymorphism

SNP Single Nucleotide Polymorphism

STR Short Tandem Repeat

VNTR Variable Number of Tandem Repeats

(13)

SUMÁRIO

1 INTRODUÇÃO 12

2 REVISÃO DE LITERATURA 14

2.1 ESTRUTURA DO GENOMA HUMANO 14

2.2 MARCADORES POLIMÓRFICOS DE USO CORRENTE EM

GENÉTICA FORENSE 16

2.2.1 STRs 20

2.3 TÉCNICAS DE BIOLOGIA MOLECULAR APLICADAS À

IDENTIFICAÇÃO HUMANA 22

2.4 BANCOS DE DADOS 27

2.5 ESTUDOS DE FREQUÊNCIA NA INVESTIGAÇÃO FORENSE 29

3 JUSTIFICATIVA 33

4 OBJETIVOS 34

4.1 OBJETIVOS GERAIS 34

4.2 OBJETIVOS ESPECÍFICOS 34

5 METODOLOGIA 35

5.1 CASUÍSTICA 35

5.2 MATERIAL E MÉTODOS 35

5.2.1 Extração do DNA 35

5.2.2 Amplificação 36

5.2.3 Análise de Fragmentos 37

5.2.4 Controles 39

5.2.5 Análises Estatísticas 39

5.2.6 Aspectos Éticos 40

6 RESULTADOS E DISCUSSÃO 41

7 CONCLUSÕES 62

(14)

1 INTRODUÇÃO

A história da Genética Humana, como uma ciência baseada em teoria, começou em 1865 quando Gregor Mendel publicou o seu trabalho “Experimentos em Plantas Híbridas”. Posteriormente Galton, fundador da Eugenia, com seu estudo “Talentos Hereditários e Caráter”, procurou apresentá-la como a ciência que forneceria as bases teóricas para não só compreender os mecanismos da transmissão dos caracteres entre as gerações, como também contribuir positivamente para a melhoria das características do conjunto populacional.

O campo da genética de populações surgiu entre as décadas de 1920 e 1930 graças a Ronald Fisher, John Burdon Sanderson Haldane e Sewall Wright, cujos trabalhos forneceram embasamento suficiente para a criação da Teoria Sintética da Evolução, ou Síntese Evolutiva Moderna. Esta pode ser compreendida, basicamente, por princípios que aliam a teoria da evolução das espécies de Charles Darwin às leis de herança biológica de Mendel e à própria genética populacional. Esta última fundamenta-se na descrição da variabilidade genética existente e na investigação dos mecanismos que a influenciam. Para isso, os trabalhos baseiam-se na observação da distribuição dos polimorfismos genéticos de indivíduos pertencentes a uma determinada população e suas variações sob a influência de forças evolutivas como seleção natural, deriva genética, mutação e fluxo gênico (BEIGUELMAN, 2008).

(15)

amplificados pela PCR e genotipados utilizando a eletroforese em sequenciadores automáticos de DNA (BUTLER, 2005).

Quimicamente, o DNA é igual em todas as pessoas, diferindo somente no conteúdo informacional que é dado pela sequência de bases. Cerca de apenas 0,1% de todo o genoma humano difere de uma pessoa para outra, sendo justamente nesta diferença em que se baseiam as técnicas de identificação, pois não existem duas pessoas com a mesma sequência de bases no seu DNA, exceto no caso de gêmeos idênticos (NAKAMURA, Y. 2009).

Com o início do Projeto Genoma Humano em 1990 e subsequente disponibilização de sequenciadores automáticos de DNA capazes de gerar dados genômicos em grande escala, surgiu a necessidade de novas ferramentas estatísticas para a análise desses bancos de dados (BUTLER, 2006).

Importante ressaltar que o advento das técnicas de análise do DNA propiciou a fixação estatística da paternidade, atribuindo o percentual de certeza de que aquela alegada paternidade seria efetivamente correspondente ao vínculo biológico requerido. Isso é feito por meio de cálculos de probabilidade que inferem 100% à exclusão de vínculo investigado e taxa muito próxima desse percentual para inclusão (PENA, 2005).

Há um número variado de materiais biológicos para obtenção do DNA e realização de testes laboratoriais de identificação humana, tais como tecido ósseo, bulbo capilar, material de biópsia, saliva, sangue, dentre outros. É possível obter DNA de praticamente todos os tecidos do corpo humano, variando apenas a quantidade de DNA que é possível extrair de cada um desses tecidos (STRACHAN; READ, 2002).

O Brasil, com sua população de proporções continentais, altamente polimórfica em virtude de sua miscigenação, necessita de estudos que auxiliem no melhor entendimento desta. Diante disso, o presente estudo tem como objetivo

realizar uma análise da frequência alélica de 15 loci STR, em população nascida no

(16)

2 REVISÃO DE LITERATURA

2.1 ESTRUTURA DO GENOMA HUMANO

Em 1953, os cientistas Francis Crick e James Watson descobriram a estrutura do DNA, que é uma macromolécula formada pelo encadeamento de subunidades individuais denominadas de nucleotídeos. Por sua vez, cada nucleotídeo é composto de três unidades básicas: um grupamento fosfato, um açúcar (pentose) e uma base nitrogenada, podendo esta ser Adenina, Timina, Citosina ou Guanina. (BUTLER, 2005).

O DNA é responsável pelo armazenamento de toda a informação genética, sendo encontrado nos cromossomos do núcleo (DNA genômico) e nas mitocôndrias (DNA mitocondrial), podendo ser extraído de amostras de sangue, esfregaço bucal, saliva, ossos, dentes, tecidos, órgãos, fios de cabelo, sêmen, urina, dentre outros materiais biológicos (STRACHAN; READ, 2002). É nele que estão localizados os genes, depositários das informações genéticas responsáveis pelas atividades da célula. Cada gene, por sua vez, faz parte de uma estrutura denominada cromossomo

e encontra-se em locais específicos conhecidos como locus genético (ALBERTS et

al., 1999).

(17)

DNA repetitivo que se intercalam com DNA de cópia única. A função da maior parte desse DNA repetitivo ainda não é conhecida, porém, aparentemente uma pequena parte dele atua na estabilização da estrutura do cromossomo (NAKAMURA, 2009; ALBERTS et al, 1999).

O DNA repetitivo não codificador pode ser classificado em DNA repetitivo disperso ou DNA satélite. O DNA repetitivo disperso é composto por sequências não agrupadas, mais complexas, espalhadas em numerosas localizações no genoma. Já o DNA satélite possui sequências agrupadas que constituem de 10 a 15% do genoma (JORDE, 2004)

A sequência como estão dispostas as bases nitrogenadas no DNA é o que diferencia o genoma de cada pessoa, pois a estrutura química é igual para todos. No genoma humano existem mais de três bilhões de nucleotídeos. Deste total, cerca de 99,9% das regiões do DNA possuem a mesma sequência de bases nitrogenadas. Apenas 0,1% das regiões da molécula apresentam variações na sequência de nucleotídeos, são os chamados polimorfismos do DNA. As técnicas de identificação humana se apóiam na análise dessas regiões variáveis. O estudo da variabilidade destas regiões tem levado à conclusão de que não existem duas pessoas que apresentem a mesma sequência de DNA, com exceção dos gêmeos univitelinos (NAKAMURA, Y. 2009; LI et al, 2009).

As diferentes variações no número de repetições do DNA em um determinado local do cromossomo são chamadas de alelos, que constituem o que é conhecido

como polimorfismo genético. Nos indivíduos, em cada locus há dois alelos, com

exceção dos cromossomos sexuais no sexo masculino, que apresentam um alelo em

cada locus tanto no cromossomo X quanto no cromossomo Y. Quando dois alelos

são idênticos, o indivíduo é homozigoto e quando são diferentes, ele é heterozigoto

(18)

Figura 1: Estrutura do DNA composta por íntrons e éxons. Os íntrons são removidos após a transcrição e os éxons são unidos e então as proteínas são codificadas

Fonte: http://svmcompbio.tuebingen.mpg.de/splicing.html

Já o DNA mitocondrial é outro tipo de material que pode ser utilizado na identificação humana, sendo a principal vantagem o seu alto número de cópias por célula (de centenas a milhares de organelas). Em casos onde a amostra de DNA extraída é muito pequena ou degradada, tal como em tecidos esqueletizados, a probabilidade de obtenção de um perfil de DNA a partir do DNA mitocondrial é maior que qualquer marcador encontrado no DNA genômico (PANETO, 2006; SWEET; DIZZINO, 1996). Por este motivo, a análise do DNA mitocondrial para fins forenses fica reservada principalmente para tecidos antigos como ossos, cabelos e dentes, nos quais o DNA nuclear já não oferece mais condições de análise (BUDOWLE et al., 2003).

2.2 MARCADORES POLIMÓRFICOS DE USO CORRENTE EM GENÉTICA FORENSE

(19)

polimorfismos de DNA, no qual os cientistas e laboratórios podem escolher o método mais adequado para solucionar problema em mãos (PENA, 2005).

O DNA satélite é composto por sequências altamente repetitivas simples ou

moderadamente complexas. As sequências deste tipo de DNA ocorrem em tandem,

ou seja, de maneira consecutiva, e sua classificação é realizada segundo a localização no genoma, número total de repetições e comprimento das unidades repetidas. O DNA satélite pode ser agrupado em duas subclasses principais (BUTLER, 2006):

• Minissatélites ou VNTR (Variable Number of Tandem Repeats ou Número

Variável de Repetições Consecutivas): Sequências de tamanho médio (de 10 a 100 pb) cujo número de repetições pode variar desde duas até vinte ou mais repetições;

• Microssatélites ou STRs (Short Tandem Repeats ou Repetições Curtas

Consecutivas): Pequenas repetições, em geral de 2 a 4 nucleotídeos. Geralmente são observados até 30 alelos em uma população para apenas 1 locus.

Mais recentemente, os abundantes polimorfismos de base única (SNPs) e os polimorfismos de inserção/deleção (INDELs) têm emergido como possíveis alternativas às ferramentas moleculares em genética forense.

MINISSATÉLITES OU VNTRs (DNA FINGERPRINT)

Em 1985, Jeffreys e colaboradores, na Inglaterra, foram os primeiros a demonstrar que algumas sondas especiais (sondas multilocais) eram capazes de reconhecer simultaneamente diversas regiões de minissatélites, produzindo padrões de bandas complexos e específicos para cada indivíduo. Estes padrões foram

chamados de "Impressões Digitais de DNA" ou “DNA Fingerprint”, uma vez que tal

resultado proporcionava um padrão único de identificação de cada indivíduo, tornando bastante improvável que duas pessoas possuam o mesmo perfil, salvo em casos de gêmeos univitelinos (Pena, 2005).

A técnica utilizada para o estudo destas sequências altamente polimórficas,

RFLP (Restriction Fragment Length Polymorphism), se baseia no fato de que a

(20)

DNA digerido pela enzima de restrição devido a substituições no sítio de reconhecimento da endonuclease (BUTLER, 2005).

Os minissatélites possuem locus mais polimórficos que os microssatélites.

Geralmente, enquanto 5 loci de VNTR são suficientes para obtenção de resultados satisfatórios na identificação humana, cerca de 12 ou mais loci de STR são necessários para o mesmo resultado. Entretanto, os VNTRs estão, atualmente, em desuso na resolução de casos médico-legais, devido ao fato de, entre outras razões, requerem uma quantidade apreciável de DNA não degradado, além de se tratar de uma metodologia bastante laboriosa e demorada (NAKAMURA, 2009).

MICROSSATÉLITES OU STRs

São constituídos de pequenas sequências repetidas consecutivamente que ocorrem a cada 20 kb no genoma humano. Essas sequências repetitivas podem ter de 2 a 5 pb e geralmente não ultrapassam os 200pb. Nos últimos anos, a descoberta e o desenvolvimento dos STRs polimórficos como marcadores genéticos estimularam a elaboração de mapas de ligação, a identificação e caracterização de genes ligados a doenças e a simplificação e precisão da tipagem de DNA com intuito de identificar pessoas (BUTLER, 2005).

Na tipagem de regiões STR, através da técnica PCR, são utilizados, usualmente, sistemas multiplexes, onde vários pares de “primers” orientam

simultâneas reações de amplificação, gerando produtos de múltiplos loci. Os alelos

amplificados são separados em eletroforese. Estes são denominados em função do número de vezes que uma determinada unidade de repetição está presente no lócus em questão. Esta forma de nomenclatura permite uma melhoria na padronização (BUTLER et al., 2004).

Com o avanço da tecnologia, foram desenvolvidos processos automatizados

para análise de loci STR. Acoplou-se a produção de primers marcados com

diferentes corantes fluoróforos e sistemas de detecção a laser em aparatos de separação eletroforética. Sistemas para amplificação simultânea de 15, 21, até 31

loci STR (ROBLEDO et al, 2009) já encontram-se disponibilizados para uso corrente

(21)

A amplificação de loci STRs por sistema Multiplex oferece diversos benefícios

para a análise de amostras biológicas. Primeiramente, torna-se capaz de analisar uma grande quantidade de marcadores genéticos consumindo apenas uma pequena alíquota de amostra. Assim, menos amostra é consumida em comparação ao que

poderia ser utilizado se fossem analisados os loci separadamente.

Consequentemente, ao se amplificar todos os loci desejados em uma única reação,

diminui-se a manipulação, reduzindo a possibilidade de contaminação. Por último, o sistema multiplex facilita a automatização de processos analíticos (BUDOWLE, 2011).

MARCADORES BI-ALÉLICOS

Além dos minissatélites e microssatélites há dois grandes grupos de polimorfismos no genoma humano - os polimorfismos de substituição de

nucleotídeos únicos (Single Nucleotide Polymorphisms, ou SNPs) e os polimorfismos

de inserção ou deleção de um ou mais nucleotídeos (INDELs). (KOCH, 2008), sendo os SNPs mais abundantes, com mais de 10 milhões já identificados e mapeados no genoma humano. Podem ser estudados em produtos de amplificação muito curtos, de aproximadamente 50 pb ou menos, o que é vantajoso quando se tem DNA extremamente degradado, ou em pouca quantidade (PENA, 2005).

(22)

2.2.1 STRs

Os marcadores STRs foram primeiramente descritos como ferramenta efetiva para identificação humana no início de 1990 (BUTLER, 2006). Os de maior valor para a identificação humana são aqueles que apresentam maior polimorfismo (maior número de alelos), menor tamanho, maior frequência de heterozigotos (maior que 90%) e baixa frequência de mutações (GALANTE FILHO et al, 1999).

Devido ao seu alto poder de discriminação entre indivíduos e praticidade, a análise de STRs se tornou rotina em testes de parentesco e genética forense. A sensibilidade, maior polimorfismo, elevado índice de discriminação e heterozigose são características importantes na escolha de determinados STRs para fins forenses (TAMAKI; JEFFREYS, 2005).

Além da classificação de acordo com o tamanho, os STRs também podem ser classificados de acordo com a composição dos blocos de sequência. Aqueles com repetições de mesmo tamanho e sequência são classificados como microssatélites de repetição simples. Microssatélites com duas ou mais repetições simples adjacentes diferindo nos motivos de repetição são classificados como repetições compostas. Microssatélites complexos são aqueles constituídos por blocos de repetição variando em tamanho. Microssatélites com blocos diferindo em tamanho e em sequência são classificados como repetições complexas hipervariáveis. Essa última categoria de marcadores do tipo STR não é comumente utilizada em tipagem de DNA forense devido a dificuldades com nomenclatura alélica e medida de variabilidade entre laboratórios. (BUTLER, 2005).

De acordo com as recomendações internacionais, designadamente da Sociedade Internacional de Genética Forense (ISFG), a denominação dos alelos dos STRs deve fazer-se de acordo com o número de unidades de repetição,

exemplificadas nas figuras 2 e 3. A figura 2 mostra o alelo 7 do locus D5S818, ou

seja, 7 repetições da sequência AGAT neste locus, já a figura 3 mostra a

(23)

Figura 2: Marcador STR,

Figura 3: Sequência do lo

Fonte

Existem situações incompleto de repetiçõe unidades de repetição in incompleta, será designa número de pares de bas ponto (DIXON et al., 200 no loco TH01, que con

R, mostrando sete unidades de repetição AGAT do

locus TPOX no Genbank, mostrando as unidades

te: http://www.cstl.nist.gov/strbase/images/tpox.jpg

es onde um alelo de um loco STR c ões. Microvariantes é o termo dado aos incompleta. Se um alelo apresentar uma u nado pelo número de unidades de repetiçã

ases da unidade de repetição incompleta 006). Um exemplo comum de uma microv ontém nove repetições tetranucleotídica

do locus D5S818

es de repetição deste. pg

(24)

incompleta de três nucleotídeos, pois na décima repetição falta uma única adenina fora da normal na unidade de repetição AATG (BUTLER, 2006).

As análises de STRs são de fundamental importância para a ciência forense, principalmente coma criação de bancos de dados contendo as frequências alélicas de STRs das populações. Os cálculos estatísticos utilizam como base as frequências alélicas de cada marcador STR encontrado em representantes da população estudada (GILL, 2006).

2.3 TÉCNICAS DE BIOLOGIA MOLECULAR APLICADAS À IDENTIFICAÇÃO HUMANA

Os testes de vínculo genético por DNA são de alta confiabilidade, sendo aceitos como prova legal em casos judiciais, como inclusão e exclusão de paternidade e na identificação humana (PARDINI et al, 2001), sendo possível obter DNA de praticamente todos os tecidos do corpo humano, variando apenas a quantidade de DNA que é possível extrair de cada um desses tecidos (BUTLER, 2005)

A investigação de vínculo genético sempre mereceu atenção especial da sociedade e da justiça. No início, os casos de paternidade eram resolvidos utilizando-se os polimorfismos eritrocitários e protéicos. Estas técnicas, apesar de simples e baratas, tinham a desvantagem de só fazer afirmações sobre a exclusão da paternidade e apenas a suposição sobre a probabilidade de um determinado indivíduo ser o pai biológico da pessoa em questão. Outra desvantagem com relação à análise de proteínas se relaciona à quantidade de material biológico necessária para a realização dos testes e a facilidade com que se degradam, além de não serem capazes de detectar muitos alelos. Para estudos de identificação humana elas não são as mais indicadas devido ao seu baixo poder discriminatório (KOCK; ANDRADE, 2008).

(25)

não dependem da natureza do material ou do tipo celular analisado, uma vez que a informação genética está contida em todas as células somáticas de todos os indivíduos. Por este motivo, o mesmo tipo de DNA de um determinado indivíduo pode ser obtido de qualquer tecido do corpo humano, enquanto que a análise utilizando marcadores protéicos ou sanguíneos é restrita a células onde tais proteínas ou antígenos são expressos e secretados (SCHNEIDER, 1997).

Outro passo importante foi dado quando se verificou que era possível utilizar a técnica de PCR na detecção de polimorfismos no DNA. A PCR consiste na

reprodução, in vitro, do processo de duplicação do DNA. Uma ou mais fitas de DNA

servem como molde (template), e têm uma dada sequência gênica demarcada

através de oligonucleotídeos – primers (cerca de 20 pares de bases). Estes se

anelam, por hibridação, às suas sequências complementares, indicando o início e o fim do fragmento desejado, que passa a ser copiado, através do acréscimo, em ambas as fitas do DNA molde, de nucleotídeos complementares presentes na reação, sob a ação de uma enzima Taq DNA Polimerase, termorresistente,

proveniente da bactéria Thermus aquaticus (BUTLER, 2005).

(26)

Figura 4: Fu

A figura 5 mostra anelam em ambos os la extremidade 5’ terminal global do produto de PC STR. Os produtos de PC a eletroforese (BUTLER,

Figura 5: (A) Esquema do po (B) Padrão de peso m heterozigotas, mostrando dif sequência

Funcionamento da eletroforese capilar (BUTLER,

tra um marcador STR em um DNA molde lados da região de repetição. Um dos pri al com um fluorocromo, e estes primers CR, assim como o número de repetições CR são separados por tamanho e cor do R, 2004).

posicionamento dos primers para amplificação de molecular para o marcador D3S1538 e duas amos diferentes genótipos. Valores abaixo dos picos indi ias repetidas presentes no alelo (BUTLER, 2004).

, 2005)

e e os primers que se primers é marcado na s definem o tamanho s presentes na região o fluorocromo durante

e um marcador STR. ostras de DNA,

(27)

Foi observado então que, além de completamente compatíveis com os resultados obtidos com os métodos anteriormente utilizados (grupos sanguíneos, Antígenos Leucocitários Humanos ou HLA), o DNA é mais informativo, pois seu elevado polimorfismo permite a inclusão de paternidade (NAKAMURA, 2009). Os métodos disponíveis até então só permitiam fazer exclusões a respeito da paternidade. Importante ressaltar que o advento das técnicas de análise do DNA propiciou a fixação estatística da paternidade, atribuindo o percentual de certeza de que o indivíduo é o pai biológico (inclusão de paternidade). Isso é feito por meio de cálculos de probabilidade, que inferem 100% à exclusão do vínculo investigado e taxa próxima desse percentual para a inclusão de paternidade (PENA, 2005). Assim, a análise estatística envolvida nos procedimentos de DNA passou a ser de primordial importância, não só em processos de investigação de paternidade, como também em questões forenses.

De acordo com a AABB (American Association of Blood Bank), órgão

regulamentador para testes de vínculo genético para identificar indivíduos,

recomenda-se o estudo de, no mínimo, 13 loci, e os dados são usados para criar um

perfil de DNA de cada indivíduo (BUTLER, 2005).

Em caso de identificação forense, alguns exemplos do uso do DNA podem ser listados, tais como:

• Identificar potenciais suspeitos, dos quais o DNA foi encontrado em

cenas de crime;

• Inocentar pessoas acusadas erroneamente de crimes;

• Identificar vítimas de crimes e catástrofes;

• Estabelecer paternidade ou outro vínculo familiar.

O Federal Bureau of Investigation (FBI) usa um padrão de 13 STR loci

específicos para o CODIS (Combined DNA Index System), o programa de

computador que opera os bancos de dados locais, estaduais e nacionais de perfis de DNA de criminosos, pessoas envolvidas em crimes não resolvidos e pessoas desaparecidas. A possibilidade de dois indivíduos possuírem o mesmo perfil nos 13

(28)

No nosso estudo, foram analisados 15 loci, abaixo listados no Quadro 1:

LOCUS LOCALIZAÇÃO SEQUÊNCIA

REPETITIVA FLUORESCENTE MARCADOR

ACESSO GENBANK

TPOX CROMOSSOMO 2

2p25.3

GAAT NED

(Amarelo)

M68651

D2S1338 CROMOSSOMO 2

2q35

[TGCC][TTCC] VIC

(Verde)

G08202

D3S1358 CROMOSSOMO 3

3p21

[TCTG][TCTA] VIC

(Verde)

NT_005997

FGA CROMOSSOMO 4

4q28

CTTT PET

(Vermelho)

M64982

D5S818 CROMOSSOMO 5

5q21-q31

AGAT PET

(Vermelho)

G08446

CSF1PO CROMOSSOMO 5

5q33.3-34

TAGA 6-FAM

(Azul)

X14720

D7S820 CROMOSSOMO 7

7q21.11

GATA 6-FAM

(Azul)

G08616

D8S1179 CROMOSSOMO 8

8q24.1-24.2

[TCTA][TCTG] 6-FAM

(Azul)

G08710

TH01 CROMOSSOMO 11

11p15.5

TCAT VIC

(Verde)

D00269

VWA CROMOSSOMO 12

12p13.31

[TCTG][TCTA] NED

(Amarelo)

M25858

D13S317 CROMOSSOMO 13

13q22-q31

TATC VIC

(Verde)

G09017

D16S539 CROMOSSOMO 16

16q22-24

GATA VIC

(Verde)

G07925

D18S51 CROMOSSOMO 18

18q21.3

AGAA NED

(Amarelo)

L18333

D19S433 CROMOSSOMO 19

19q12

AAGG NED

(Amarelo)

G08036

D21S511 CROMOSSOMO 21

21q21.1

[TCTA][TCTG] 6-FAM

(Azul)

AP000433

Quadro 1: Localização no genoma dos loci analisados, sua sequência, fluoróforo marcador e

(29)

2.4 BANCOS DE DADOS

O crescimento de bancos de dados de DNA vem fazendo aumentar o envolvimento da polícia científica no auxílio da aplicação da lei. Além de sua função essencial de ligar crimes e suspeitos, tais bancos colecionam informações sobre crimes e criminosos. A análise desses dados pode aumentar a compreensão do contexto no qual as Ciências Forenses funcionam como ferramentas para a justiça criminal (SMITH, 2006; SCHNEIDER, 2009).

A aprovação da primeira legislação que permitia a coleta e o armazenamento de amostras de DNA de condenados deu-se na Virgínia (EUA) em 1989, e os bancos de dados de DNA eram compostos por perfis VNTR. Porém foi o Reino Unido que estabeleceu legalmente um banco de dados de DNA nacional baseado em uma pelataforma de tecnologia STR (BUTLER, 2006).

O Forensic Science Service (FSS), órgão inglês pioneiro no desenvolvimento e implementação de tecnologias de DNA e em abrir caminho para a formação do

primeiro banco de dados no mundo, começou a procurar novos loci e variação na

população de estudo com candidatos de loci STR. Juntamente com outros

laboratórios europeus, lançaram o sistema multiplex SGM, e em 1995 foi lançado o NDNAD (Banco de Dados de DNA Nacional do Reino Unido) que contemplava o sistema multiplex SGM adicionado ao marcador sexual Amelogenina (WERRET, 1997; BUTLER, 2006).

Observando o sucesso obtido pela tipagem por STR no Reino Unido, o

laboratório do FBI (Fereral Bureau of Investigation) liderou esforços nos EUA para

estabelecer o núcleo dos loci STR que formariam o CODIS (Combined DNA Index

System), sistema nacional de banco de dados americano, o mais conhecido e mais

importante no mundo. Em um projeto que durou aproximadamente 18 meses e

envolveu 22 laboratórios americanos, foram avaliados 17 loci STR de kits já

comercializados e em testes, das empresas “Applied Biosystems” e “Promega

Corporation”, e em 1997 foram anunciados os 13 loci STR que compunham o

CODIS, quais sejam: CSF1PO, FGA, TH01, TPOX, VWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51 e D21S11 (BUTLER, 2004, 2006). Nesse sistema existem dois arquivos diferentes de perfis genéticos cujos objetivos

(30)

obtidos a partir de cenas de crime; e o Offender Index (Índice de Criminosos) que

contém perfis genéticos de criminosos condenados por crimes sexuais e outros crimes violentos (PENA, 2005). A possibilidade de dois indivíduos possuírem o

mesmo perfil nos 13 loci analisados é de um em um bilhão.

Os mesmos marcadores STRs são usados em várias circunstâncias. Existem

oito loci STR (FGA, TH01, VWA, D3S1358, D8S1179, D16S539, D18S51 e D21S11)

que compões tanto o banco de dados dos Estados Unidos quanto o da Europa, fato

este que permite uma possível colaboração internacional (BUTLER, 2005).

Atualmente muitos países dispõem de sistemas de Bancos de Dados de DNA, como a Nova Zelândia, Alemanha, Áustria, Suíça, Canadá, França, Itália e, na América do Sul, o Chile. Existem programas para implantação de bancos de dados de DNA em países como Argentina, Cuba, Líbano, entre outros (GILL, 2006).

O Brasil ainda não conta com um sistema de banco de dados de informações genéticas de criminosos ou pessoas desaparecidas como ferramentas investigativas eficientes para armazenamento, busca e cruzamento de informações (FIGUEIREDO; PARADELA, 2010), embora já existam esforços para uma padronização em relação aos métodos para análise de DNA.

Em 2005 foi criada no Brasil a Rede Nacional de Genética Forense, formado por peritos federais e estaduais, atuantes em Genética Forense, e professores universitários. Em 2009, o CODIS, sistema nacional de banco de dados americano, foi repassado para o Brasil pelos EUA sem ônus algum. Todos os 17 estados brasileiros que possuem laboratório de DNA criminal assinaram os Acordos de Cooperação Técnica com a Polícia Federal, sendo o sistema já instalado em 2010. No Nordeste, apenas os estados de Ceará, Paraíba e Bahia contribuem com o Banco Nacional de DNA (JACQUES, 2011).

(31)

Ao longo da aplicação dos conhecimentos do DNA para a viabilização da Justiça, foram sendo desenvolvidos bancos de dados das padronizações genotípicas das populações. Inicialmente, utilizavam-se nas identificações das frequências populacionais os bancos de dados do FBI para a população geral norte-americana. Posteriormente a caucasóide norte-americana. Depois a população geral latino-americana, a caucasóide, negróide e amarela latino-americana e, finalmente, passou-se a utilizar os bancos de dados específicos da população brasileira (GRATTAPAGLIA et al. 2001)

2.5 ESTUDOS DE FREQUÊNCIA NA INVESTIGAÇÃO FORENSE

O delineamento das experiências de Mendel permitiu-lhe uma interpretação estatística muito simples dos resultados, mas suficiente para enunciar alguns princípios básicos da hereditariedade. Com base num grande número de cruzamentos de ervilhas, Mendel "probabilizou" os diferentes genótipos, fenótipos e a presença de genes que estão associados à transmissão da hereditariedade de geração em geração (BEIGUELMAN, 2008).

Li et al. (2009) mostraram que a variação genética dentro da população é responsável pela maioria da diversidade humana; no entanto, a variação entre as populações é suficiente para mostrar a presença de estrutura genética entre estas. A contribuição genética ancestral pode ser obtida por meio da comparação da frequência de alelos de determinadas regiões genômicas entre a população alvo e as possíveis parentais, ou seja, aquelas que contribuíram de alguma forma com alguns indivíduos, genomas, para a formação da população alvo (RIBEIRO, 2009).

A Genética Populacional tem como um dos objetivos analisar as consequências da aplicação dos princípios mendelianos em determinada população, estudando os efeitos das mutações, seleção natural, migração e deriva genética. É de grande interesse em Antropologia e em Medicina legal, pois quando se efetua a valorização da prova pericial, se faz necessário conhecer alguns parâmetros estatísticos da população referência (BEIGUELMAN, 2008).

(32)

marcadores naquela população para saber quais alelos presentes e em que frequência, a fim de se definir quais são os melhores marcadores a serem utilizados nestes casos. Assim, para que a identificação através de STRs possa ser rapidamente incorporada com efetiva confiabilidade à população brasileira, é de extrema importância a realização de estudos populacionais (OLIVEIRA et al, 2002) e nestes estudos a investigação deve ser realizada em indivíduos sem nenhum grau de parentesco, a fim de possibilitar a determinação da frequência alélica da população.

Para a realização da identificação humana é mais interessante utilizar marcadores moleculares que apresentem grande variabilidade dentro da população, ou seja, alto grau de polimorfismo, de forma que a probabilidade de duas pessoas apresentarem um mesmo alelo torne-se menor. Sendo assim, a realização de pesquisas para a obtenção de frequências alélicas populacionais tornam-se extremamente importantes, possibilitando a divulgação desses dados, através da literatura científica e, também, por banco de dados (sistemas nos quais são armazenados perfis de DNA referentes a um conjunto de marcadores moleculares) podendo ser aplicados na investigação forense (GÓIS, 2006).

Populações que se encontram em regiões diferentes ou apresentam origem distinta podem apresentar alelos em frequências diferentes e algumas vezes, únicos. Portanto, quando se deseja identificar um indivíduo proveniente de determinada população, é necessário o estudo de diferentes marcadores naquela população para saber quais são os alelos presentes e em que frequência, a fim de se definir quais são os melhores marcadores a serem utilizados nestes casos.

Tal distribuição alélica será aplicada nos cálculos estatísticos realizados em testes de identificação humana e de paternidade, a fim de dar força e credibilidade às informações obtidas pela análise da evidência genética (amostra biológica). A base para esses cálculos de frequências de alelos derivou dos estudos de Hardy-Weinberg. O Princípio de Hardy-Weinberg é um modelo matemático simples que demonstra que as frequências genotípicas de uma população se mantêm constantes quando não há força evolutiva atuando sobre a mesma. Para que o princípio possa ser demonstrado, a população em questão deve estar em equilíbrio genético, devendo ela apresentar as seguintes características (BEIGUELMAN, 2008):

(33)

2) Não deve haver fluxo gênico entre diferentes populações; 3) Não deve haver a ocorrência de mutações;

4) Os casamentos devem ocorrer aleatoriamente, não existindo, por conseguinte, casamentos preferenciais entre indivíduos por causa de seu genótipo, fenótipo, estratificação social ou consangüinidade. Aliás, por serem os casamentos realizados aleatoriamente, os casamentos consangüíneos podem existir, desde que ocorram aleatoriamente

5) Não pode haver atuação da seleção natural.

Este tipo de população é chamada de população ideal e apesar de nenhuma população humana preencher as condições descritas acima, a prática tem demonstrado que em numerosas populações humanas, os genótipos se distribuem de acordo com a Lei de Hardy-Weinberg, sendo esta muito útil para se estudarem populações e os mecanismos evolutivos que violam o Princípio (BEIGUELMAN, 2008).

Existem diversos parâmetros estatísticos para determinar a eficácia de um marcador genético na conclusão de casos na área da Genética e Biologia Forense, sendo diferentes para cada situação (investigação biológica de filiação, criminalística biológica e identificação genética individual). Para que se possa usar um marcador genético tem que se realizar um estudo desse marcador na população em questão. Abaixo estão listados aguns dos principais parâmetros populacionais usado em Genética e Biologia Forense (BEIGUELMAN, 2008; McMANUS et al, 2011):

• Poder de Exclusão: O PE de um marcador genético numa determinada

população é um parâmetro importante no que concerne à investigação biológica da paternidade. Pode ser definido como a percentagem de indivíduos falsamente acusados, cuja paternidade ficaria excluída, com base nesse marcador.

• Poder de Discriminação: O PD é um parâmetro estatístico a priori que se

(34)

• Probabilidade de Matching (MP): Também conhecida como Match

Probability ou Probabilidade de Coincidência, é a probabilidade de dois indivíduos terem o mesmo padrão genotípico. Portanto, é o oposto da Probabilidade de Discriminação.

• Heterozigosidade: Trata-se de um parâmetro que representa a

probabilidade de dois alelos do mesmo locus, escolhidos ao acaso na

população, serem diferentes. A heterozigosidade observada (Ho)

define-se como o número de indivíduos heterozigóticos obdefine-servados, relativamente ao número total de indivíduos da população. A variabilidade genética de uma população é quantificada pela heterozigosidade média

esperada (He) por locus. Este valor consiste na média aritmética dos

valores de heterozigosidade dos vários loci analisados. He difere de Ho

porque ela é uma previsão baseada na frequência alélica conhecida, oriunda de amostras individuais.

• Conteúdo Informativo de Polimorfismo (PIC): É a capacidade informativa

de um locus analisando-se seu conteúdo em informação polimórfica. PIC

(35)

3 JUSTIFICATIVA

Até o presente momento, há poucos trabalhos no Brasil cujo enfoque esteja voltado para a construção de um banco de dados de frequências alélicas para os

marcadores comumente utilizados em identificação humana, que contemplem 15 loci

(36)

4 OBJETIVOS

4.1 OBJETIVO GERAL

Propor a montagem de um banco de dados composto pelas frequências

alélicas de 15 loci polimórficos de um grupo de indivíduos no estado do Rio Grande

do Norte.

4.2 OBJETIVOS ESPECÍFICOS

Determinar parâmetros populacionais de importância para estudos de identificação humana, tais como índices de Heterozigozidade, Poder de Exclusão, Poder de Discriminação, Índice de Paternidade típico, entre outros.

Fazer uma comparação genético-populacional entre o Rio Grande do Norte e outras populações do Brasil (com dados de outros autores), com base nos

(37)

5 METODOLOGIA

5.1 CASUÍSTICA

As amostras que alimentam o banco de dados do laboratório utilizadas neste trabalho são provenientes de sangue periférico coletados por punção digital de 1100 indivíduos não relacionados entre si, saudáveis, de ambos os sexos e obtidos de casos de teste de paternidade no estado do Rio Grande do Norte, divididos entre 551 homens e 549 mulheres. No momento da coleta do material biológico utilizado para avaliação dos seus padrões genéticos para fins de paternidade, cada indivíduo assinou um documento denominado “Termo de Identificação das Partes e Autorização para Realização da Coleta”, no qual afirmou que os materiais foram coletados em única oportunidade, que ali se encontrava de livre e espontânea vontade, que não sofreu transfusão sanguínea recente, nem transplante de medula óssea, e que os dados gerados poderiam ser utilizados para fins estatísticos.

Tais amostras foram coletadas em Natal-RN, no Laboratório DNA Center, e em laboratórios de apoio no estado, localizados em Mossoró, Caicó, Nova Cruz, Assu, Canguaretama, Goianinha e Campo Grande. O processamento do material utilizado foi realizado no Laboratório DNA Center.

5.2 MATERIAIS E MÉTODOS

5.2.1 Extração do DNA

O DNA genômico foi extraído das células brancas do sangue periférico,

impregnado em papel de filtro FTA Card® (Whatman Bioscience, Cambridge, UK).

(38)

nucléicos e inibir o crescimento de bactérias, fungos e vírus, permitindo a conservação da amostra à temperatura ambiente por vários anos (SMITH; BURGOYNE, 2004). Assim, as amostras biológicas podem ser transportadas e armazenadas de forma prática, facilitando a rotina laboratorial. Outra grande

vantagem do papel de filtro FTA Card® é que resultados consistentes podem ser

obtidos sem necessidade de quantificação do DNA (BUTLER, 2005).

Foi utilizado um disco de 1,5 mm de diâmetro deste papel de filtro, cortado

com o auxilio do dispositivo Harris Micro Punch® (Whatman-Bioscience) e

depositados em microtubos de 200 µL. Em seguida, o disco foi submetido a duas lavagens de 30 minutos, com agitação manual por inversão a cada 5 minutos, uma

com 200 µL do reagente FTA® Purification Reagent, da Whatman-GE, e outra com

200 µL de água ultrapura. Após as duas lavagens, o disco contendo DNA secou em temperatura ambiente por algumas horas, antes da amplificação.

Figura 6: Material utilizado na extração de DNA pelo método FTA Card. Fonte: Acervo pessoal

5.2.2 Amplificação

Na determinação dos 15 loci polimórficos, foi utilizada a técnica de Reação

em Cadeia da Polimerase (PCR) pelo sistema Multiplex, ou seja, os 15 loci foram

amplificados numa mesma reação, em termoclicador Veriti 96-Well Thermal Cycler (Applied Biosystems, Foster City, CA, USA). Aproximadamente 1 ng de DNA (quantidade prevista, de acordo com o fabricante, em um disco extraído) foi

amplificado utilizando o kit comercial AmpFlSTR® Identifiler PCR Amplification Kit

(39)

28 ciclos de 94° C por 1 minuto, 59° C por 1 minuto e 72° C por 1 minuto (ciclos de

desnaturação, anelamento dos primers e extensão da nova fita de DNA); em

seguida 60° C por 60 minutos (extensão final) e 4° C por infinito tempo, obedecendo as condições padronizadas pelo fabricante.

A figura 7 representa os 15 loci analisados no kit AmpFlSTR® Identifiler, seus

respectivos tamanhos de fragmentos gerados após amplificação e as cores representativas de seus marcadores fluorescentes.

Figura 7: Loci contemplados no kit AmpFlSTR Identifiler.

Fonte: Manual do fabricante

5.2.3 Análise de Fragmentos

Os produtos amplificados sofreram eletroforese capilar em sequenciador ABI

3130® Genetic Analyzer (Applied Biosystems). Amostra de um µL de produto de

PCR foi adicionada a 8,7 L de Hi-DiFormamide (agente desnaturante) e 0,3 L de

padrão interno GeneScan-500 LIZ Size Standard. A eletroforese foi gerenciada utilizando o software Data Collection (versão 3.0) (Applied Biosystems).

(40)

alélica. A figura 8 exemplifica um eletroferograma, mostrando os 15 loci STR

estudados e seus alelos, assim como o marcador sexual Amelogenina.

Figura 8: Eletroferograma, contemplando os 15 STRs analisados e o marcador sexual Amelogenina.

(41)

5.2.4 Controles

AmpFlSTR® Control DNA 9947A foi utilizado como controle da reação de

amplificação e para certificação do correto alinhamento da escada alélica.

Amostras do controle de qualidade do GEP-ISFG (Grupo Espanhol e Português da Sociedade Internacional de Genética Forense) e do PNCQ (Programa Nacional de Controle de Qualidade) foram analisadas para testar a qualidade da metodologia. Todos os resultados obtidos estavam de acordo com os controles de qualidade.

5.2.5 Análises Estatísticas

Foi realizado o cálculo amostral para se obter o número de indivíduos representativo de cada mesorregião estudada, assim como do Estado do Rio Grande do Norte como um todo.

(42)

5.2.6 Aspectos Éticos

(43)

6 RESULTADOS E DISC

Para uma melhor como um todo, as amo estabelecidas pelo IBG Mesorregião é uma su municípios de uma área 2010). São elas: Mesor (M2), Mesorregião Agre indicadas na figura 7.

A mesorregião O

21.167,130 km2, engloba

com uma população de menos populosa, com 3 km². A mesorregião do sendo a única em que aproximadamente 414.0

SCUSSÃO

or representatividade da população do R ostras obtidas foram classificadas nas q GE, de acordo com a cidade natal subdivisão dos estados brasileiros que

a geográfica com similaridades econômic orregião Oeste Potiguar (M1), Mesorregiã greste Potiguar (M3) e Mesorregião Le

Figura 9: Mesorregiões do Rio Grande do Norte Fonte: http://portal.rn.gov.br

Oeste Potiguar é a de maior extens bando também a maior quantidade de mun de 781.439 habitantes. A mesorregião C

374.364 habitantes distribuídos em uma o Agreste Potiguar é a terceira mais p ue nenhum de seus municípios possu 4.021 habitantes, distribuídos em uma

Rio Grande do Norte quatro mesorregiões l de cada indivíduo. e congrega diversos icas e sociais (IBGE, gião Central Potiguar Leste Potiguar (M4),

rte

(44)

9.367,384 km2. E finalm

extensão territorial (6.4 1.473.936 habitantes (IB

A tabela 1 aprese Grande do Norte e o nú distribuições destes em c

Tabela 1: Distribui

MESORREGIÃO

Oeste Potiguar (M1) Central Potiguar (M2) Agreste Potiguar (M3) Leste Potiguar (M4)

TOTAL

Figura 10: Distr mesorregiões do RN

As frequên pessoas nascidas no Rio como os parâmetros e paternidade e o Equilíbrio

DISTR

lmente, a mesoregião do Leste Potiguar, q 451,841 km²), sendo a mais populos IBGE, 2010).

senta a quantidade de habitantes de cada número de indivíduos estudados, já a figu

cada mesorregião.

uição das 1100 amostras entre as Mesorre NÚMERO DE INDIVÍDUOS

ESTUDADOS NÚMERO T

278 7

183 3

179 4

460 1.4

1100 3.1

tribuição dos indivíduos estudado RN

ncias alélicas dos 15 loci STRs estudado

Rio Grande do Norte estão apresentadas estatísticos importantes para estudos fo rio de Hardy-Weinberg.

Oeste Potiguar (M1) 25% Central Potiguar (M2) 17% Agreste Potiguar (M3) 16% Leste Potiguar (M4) 42%

ISTRIBUIÇÃO ENTRE AS BESORREGIÕES

, que possui a menor osa do estado, com

a mesorregião do Rio igura 10 apresenta as

rregiões: DE INDIVÍDUOS TOTAIS 781.439 374.364 414.021 1.473.936 3.168.027

os entre as

(45)

Tabela 2: Frequência alélica e parâmetros estatísticos para os 15 STRs estudados na população do Rio Grande do Norte

ALELO D21S11 D13S317 D3S1338 VWA D7S820 D16S539 D18S51 CSF D5S818 TH01 TPOX FGA D8S1179 D2S1338 D19S433

6 0,223 0,023

7 0,011 0,012 0,034 0,231 0,001

8 0,098 0,140 0,031 0,022 0,016 0,146 0,455 0,006

9 0,086 0,118 0,174 0,019 0,036 0,175 0,117 0,006 0,001

9,3 0,217

10 0,054 0,298 0,081 0,007 0,234 0,080 0,008 0,055 0,069 0,005

11 0,288 0,001 0,001 0,230 0,273 0,012 0,312 0,320 0,293 0,063 0,022

11,2 0,001

12 0,301 0,004 0,177 0,273 0,125 0,325 0,326 0,056 0,143 0,106

12,2 0,013

13 0,127 0,005 0,005 0,023 0,148 0,120 0,062 0,174 0,271 0,260

13,2 0,001 0,043

14 0,044 0,095 0,079 0,003 0,020 0,156 0,010 0,011 0,260 0,001 0,286

14,2 0,001 0,033

15 0,002 0,304 0,118 0,001 0,167 0,003 0,002 0,143 0,002 0,133

15,2 0,048

16 0,251 0,272 0,133 0,035 0,036 0,032

16,2 0,013

17 0,203 0,283 0,124 0,001 0,003 0,214 0,001

17,2 0,001

18 0,128 0,155 0,069 0,009 0,095 0,001

18,2 0,002 0,001

19 0,009 0,067 0,048 0,065 0,122

20 0,018 0,019 0,112 0,136

21 0,002 0,009 0,160 0,050

22 0,005 0,141 0,072

22,2 0,003

23 0,001 0,146 0,112

23,2 0,002

24 0,159 0,072

24,2 0,001 0,000

25 0,001 0,122 0,065

26 0,001 0,050 0,021

27 0,023 0,001 0,013 0,002

28 0,153 0,005

29 0,217 0,002

30 0,261 0,001

30,2 0,025

31 0,052

31,2 0,104 0,002

32 0,014

32,2 0,102 0,001

33 0,001

33,2 0,026

34,2 0,003 0,001

35 0,003

36 0,009

43,2 0,001

45,2 0,001 n 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 Ho 0.820 0,775 0,764 0,782 0,763 0,800 0,877 0,726 0,720 0,768 0,672 0,865 0,77 0,878 0,813 He 0.839 0.788 0,778 0,798 0,793 0,793 0,877 0,735 0,752 0,797 0,686 0,874 0,808 0,881 0,814

P <0,001 0.839 0,316 0,379 0,100 0,552 0,496 0,786 0,128 0,569 0,695 0,341 0,259 0,017 0,031 PD 0,954 0,927 0,917 0,933 0,928 0,924 0,971 0,884 0,901 0,929 0,856 0,970 0,939 0,974 0,940 PE 0,636 0,554 0,533 0,566 0,532 0,599 0,749 0,494 0,460 0,552 0,386 0,763 0,545 0,751 0,623 PIC 0.820 0,762 0,743 0,769 0,762 0,761 0,869 0,691 0,713 0,766 0,639 0,860 0,782 0,869 0,792 PI 2,780 2,227 2,115 2,292 2,107 2,500 4,074 1,930 1,786 2,216 1,522 3,691 2,174 4,104 2,670 BP 0,046 0,073 0,083 0,067 0,072 0,076 0,029 0,116 0,099 0,071 0,144 0,030 0,061 0,026 0,060

(46)

A maioria dos marcadores avaliados em nosso estudo apresentou-se em

equilíbrio de Hardy-Weinberg (HW), com exceção dos loci D2S1338, D19S433 e

D21S11 que apresentaram valor de P inferior ao nível de significância admitido de

0,05. Entretanto, após a correção de Bonferroni (WEIR et al, 1996) utilizando o número de loci analisados, as diferenças observadas não foram estatisticamente

significativas, com exceção do locus D21S11 (P<0,0033). Tal fato demonstra uma

situação de normalidade na distribuição populacional.

Estudos realizados em outros estados do Brasil também mostraram algumas

inconsistências no equilíbrio de HW em relação a alguns marcadores. O locus

D21S11 se apresentou em desequilíbrio no estudo realizado com 3000 indivíduos em Santa Catarina (OCAMPOS et al, 2009).

Analisando os parâmetros mostrados na Tabela 2 por meio dos testes estatísticos, observou-se que para todos os marcadores, os índices de Heterozigosidade esperados situam-se próximos aos níveis de Heterozigosidade

observados. O locus D2S1338 apresentou o maior nível de Heterozigosidade

(87,8%), enquanto que o locus TPOX apresentou o menor nível (67%), sendo este,

portanto, o de menor grau de variabilidade, corroborando com os estudos de Grattapaglia et al em 2001.

Dos quinze loci estudados, os loci D2S133 e D18S51 apresentaram, ambos,

PIC de 0,869, sugerindo alto poder informativo pois apresentaram maior conteúdo

polimórfico. Diferentemente do D2S1338 e D18S51, o locus menos informativo

encontrado foi TPOX, com PIC de 0,639, o qual, também foi encontrado na pesquisa de Fridman et al, em 2008.

Outro requisito analisado para a variabilidade na aplicação forense é o Poder de Discriminação, a fim de verificar a probabilidade de que, ao escolher aleatoriamente uma amostra, ela possa ser identificada em relação às demais

(DESMARAIS et al, 1998). Os loci mais polimórficos e mais discriminativos

analisados no presente trabalho foram respectivamente: D2S1338 (PD = 0,974), D18S51 (PD = 0,971) e FGA (PD = 0,970). Nossos achados corroboram exatamente o que foi encontrado no estudo feito na população brasileira (FRIDMAN et al, 2008) e no Rio Grande do Sul (CHULA et al, 2008), assim como na maioria dos estudos que contemplam esses marcadores.

(47)

como a percentagem de indivíduos falsamente acusados, cuja paternidade ficaria

excluída, com base nesse marcador. No nosso estudo, os três loci com maior PE

foram FGA, D2S1338 e D18S51, com valores entre 0,763 e 0,749, também corroborando com os estudos que contemplam estes marcadores, variando apenas a sua ordem. Entretanto, em todos os estudos avaliados que contemplam o locus TPOX, este apresentou-se com o menor Poder de Exclusão (FRIDMAN et al, 2008; CHULA et al, 2008; FERREIRA DA SILVA et al, 2002; OCAMPOS et al, 2009; GRATTAPAGLIA et al, 2001; DELLALIBERA et al., 2004; GÓES et al, 2004; POIARES et al, 2009).

(48)

Tabela 3: Frequências alélicas para o locus D21S11

ALELO RN PB PE AB RJ BS PR SC RS BR1 BR2

24,2 0,001 - - 0,006 0,003 - 0,002 0,001 0,001 0,003 0,003 25 0,001 0,002 0,001 0,003 0,001 - 0,001 - 0,001 0,001 0,001 26 0,001 - 0,005 0,003 - - 0,001 0,001 0,001 0,001 - 27 0,023 0,028 0,009 0,031 0,025 0,025 0,026 0,027 0,025 0,028 0,034 28 0,153 0,173 0,077 0,115 0,183 0,113 0,153 0,14 0,151 0,141 0,162 29 0,217 0,199 0,199 0,191 0,16 0,211 0,219 0,223 0,217 0,217 0,203 30 0,261 0,203 0,222 0,271 0,25 0,24 0,247 0,236 0,249 0,253 0,224 30,2 0,025 0,033 0,004 0,054 0,021 0,039 0,032 0,034 0,033 0,038 0,028 31 0,052 0,079 0,161 0,078 0,065 0,103 0,059 0,073 0,064 0,063 0,065 31,2 0,104 0,105 0,035 0,08 0,108 0,098 0,097 0,105 0,103 0,099 0,103 32 0,014 0,014 0,083 0,012 0,011 0,015 0,011 0,008 0,008 0,012 0,011 33 0,001 0,010 0,087 0,003 0,001 - 0,001 0,001 0.001 0,002 0,004 32,2 0,102 0,079 0,074 0,1 0,098 0,078 0,103 0,106 0,094 0,100 0,093 33,2 0,026 0,019 0,002 0,029 0,037 0,059 0,036 0,034 0,035 0,033 0,039 34,2 0,003 0,006 0,001 0,008 0,006 0,005 0,003 0,002 0,004 0,002 0,004 35 0,003 0,014 0,012 0,003 0,008 0,005 0,003 0,002 0,005 0,004 0,013 36 0,009 0,003 0,003 0,006 0,005 0,005 0,001 0,001 0,001 0,001 - RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).

Tabela 4: Frequências alélicas para o locus D13S317

ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2

8 0,098 0,08 0,079 0,1 0,076 0,077 0,112 0,109 0,1 0,113 0,088 9 0,086 0,087 0,082 0,115 0,078 0,091 0,092 0,084 0,089 0,095 0,077 10 0,054 0,077 0,056 0,042 0,065 0,024 0,06 0,054 0,057 0,055 0,051 11 0,288 0,297 0,338 0,222 0,298 0,322 0,292 0,298 0,286 0,298 0,279 12 0,301 0,317 0,304 0,314 0,322 0,308 0,274 0,277 0,294 0,274 0,249 13 0,127 0,102 0,103 0,152 0,128 0,13 0,159 0,129 0,121 0,114 0,138 14 0,044 0,04 0,036 0,009 0,031 0,048 0,047 0,047 0,049 0,048 0,048 15 0,002 - 0,002 0,002 - - 0,002 0,002 0,002 0,003 - RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).

Tabela 5: Frequências alélicas para o locus D3S1358

ALELO RN AM RJ MS PR SC RS BR1 BR2

(49)

Tabela 6: Frequências alélicas para o locus vWA

ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2

11 0,001 0,005 0,007 0,008 0,008 - 0,002 0,001 0,003 0,002 0,004 13 0,005 0,005 0,007 0,015 0,006 0,01 0,004 0,002 0,003 0,006 0,002 14 0,079 0,068 0,074 0,068 0,083 0,088 0,088 0,086 0,081 0,084 0,084 15 0,118 0,105 0,152 0,134 0,162 0,113 0,124 0,121 0,122 0,123 0,138 16 0,272 0,302 0,256 0,263 0,243 0,275 0,249 0,245 0,262 0,246 0,262 17 0,283 0,253 0,27 0,288 0,255 0,275 0,264 0,267 0,263 0,274 0,248 18 0,155 0,182 0,158 0,148 0,165 0,142 0,184 0,185 0,179 0,184 0,156 19 0,067 0,07 0,061 0,057 0,058 0,074 0,069 0,077 0,077 0,061 0,079 20 0,018 0,008 0,013 0,02 0,015 0,02 0,013 0,014 0,009 0,019 0,015 21 0,002 0,002 0,001 - 0,003 0,005 0,002 0,001 0,001 0,001 0,004 RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).

Tabela 7: Frequências alélicas para o locus D7S820

ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2

7 0,011 0,009 0,017 0,019 0,02 0,024 0,017 0,018 0,012 0,012 0,012 8 0,140 0,128 0,148 0,132 0,187 0,159 0,156 0,134 0,139 0,162 0,177 9 0,118 0,122 0,112 0,117 0,096 0,096 0,118 0,127 0,02 0,124 0,133 10 0,298 0,31 0,286 0,297 0,298 0,269 0,267 0,275 0,276 0,259 0,291 11 0,230 0,222 0,228 0,212 0,2 0,245 0,238 0,239 0,245 0,256 0,228 12 0,177 0,167 0,169 0,117 0,156 0,173 0,169 0,167 0,168 0,163 0,31 13 0,023 0,039 0,035 0,095 0,036 0,029 0,031 0,035 0,027 0,021 0,067 14 0,003 0,003 0,005 0,009 0,005 0,005 0,003 0,003 0,003 0,003 0,007 RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).

Tabela 8: Frequências alélicas para o locus D16S539

ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2

Referências

Documentos relacionados

Na população estudada, distúrbios de vias aéreas e hábito de falar muito (fatores decorrentes de alterações relacionadas à saúde), presença de ruído ao telefone (fator

A metodologia utilizada no presente trabalho buscou estabelecer formas para responder o questionamento da pesquisa: se existe diferença na percepção da qualidade de

Por meio destes jogos, o professor ainda pode diagnosticar melhor suas fragilidades (ou potencialidades). E, ainda, o próprio aluno pode aumentar a sua percepção quanto

O presente artigo discute o tema do Feminicídio, especificamente, na cidade de Campina Grande. A metodologia utilizada foi de natureza qualitativa e do tipo

Na Figura 4.7 está representado 5 segundos dos testes realizados à amostra 4, que tem os elétrodos aplicados na parte inferior do tórax (anterior) e à amostra 2 com elétrodos

Para tanto, no Laboratório de Análise Experimental de Estruturas (LAEES), da Escola de Engenharia da Universidade Federal de Minas Gerais (EE/UFMG), foram realizados ensaios

Durante o exercício de 2008, a sociedade de direito espanhol Cajastur Inversiones, S.A. indicou José Maria Brandão de Brito como seu representante no Conselho Geral e de Supervisão

Tese apresentada como requisito parcial para obtenção do título de Doutor pelo Programa de Pós-graduação em Direito da PUC-Rio.. Aprovada pela Comissão Examinadora abaixo