II- Mineração de SNPs informativos de ancestralidade em locos ligados ao Glaucoma primário
7. Material e Métodos
7.3. Seleção de SNPs informativos de ancestralidade
Para cada loco analisado foi feita uma planilha no Microsoft Excel comparando as duas populações CEU e YRI. Os SNPs não pareados foram excluídos da análise ficando apenas aqueles recuperados em ambas populações. Em uma coluna separada, conseguiu-se o valor da diferença de freqüência alélica entre as duas populações efetuando a diferença da freqüência dos mesmos alelos nas duas populações. Aqueles que apresentaram valor acima de 0,5 foram selecionados, por serem considerados como potenciais marcadores informativos de ancestralidade.
Obtidos os resultados das planilhas, realizou-se uma busca no banco de dados de Smith et al., 2004 que contém 3,011 SNPs selecionados como informtivos de ancestralidade e aplicáveis a estudos de mapeamento por desequilíbrio de ligação gerado por miscigenação. Os SNPs recuperados foram separados por região e por diferença de freqüência e colocados em tabelas, com essa quantidade procurou-se pela posição de todos aqueles que apresentaram a diferença mais alta e observou-se se existem genes anotados para cada SNP
7.4. Resultados
Foram obtidos um total de 27.148 SNPs para todas regiões flanqueadas em 1Mpb com base no critério da diferença de frequencia alélica ( ) 0,5. Os locos foram então analisados por região sendo observadas sobreposições sendo mantidos apenas os SNPs presentes em ambas populações estudadas (Tabela 16).
Tabela 16: Locos de micossatélites e regiões ligadas com Glaucoma Primário de ângulo aberto.
Loco região Cromossomo
SNPs YRI CEU D2S117 194827117-195827116 2 1348 1401 D2S325 207479055 - 208479054 2 499 603 D2S2189 204186300 - 205186299 2 789 621 D2S364 182242974 -183242973 2 635 192 D3S1768 34099484- 35099483 3 363 322 D5S424 75693642 - 76693641 5 508 390 D5S2501 109564341 - 110564340 5 501 1234 D9S290 130067403 - 131067402 9 1651 1533 D10S211 21447977- 22447976 10 754 763 D10S192 101926355..102926354 10 1743 1319 D11S397 77032111 - 78032110 11 564 563 D10S548 18261324 - 19261323 10 672 673 D14S288 42671657- 43671656 14 792 663 D14S587 52936715- 53936714 14 621 424 D14S283 21257440 - 22257439 14 1149 2034
D2S364 e D2S117
Estas regiões estão localizadas no cromossomo 2 sendo flanqueadas por 1Mpb foram recuperados um total de 3845 SNPs. Foram recuperados para o loco D2S117 para ambas populações 2756 SNPs sendo que 18 foram selecionados com diferença de frequência maior ou igual a 0,50. Para a região D2S364 houve sobreposição para SNPs com freqüência 5 entre as populações YRI e CEU sendo recuperados 6 SNPs
Tabela 17:SNPs que apresentam valor de Delta maior ou igual a 0,5 apresentados por diferença de freqüência para as regiões D2S117 e D2S364
Diferença de Freqüência (DELTA) Quantidade de SNPs
0,5-0,581 12
0,6-0,695 6
0,7-0,786 4
0,8-0,982 1
D2S325 e D2S2189
As regiões D2S325 e D2S2189 estão localizadas no cromossomo 2 cerca de 437 SNPs foram recuperados para as regiões em ambas as populações. Mas apenas 7 marcadores cuja diferença de freqüência foi maior ou igual a 0,5. Os SNPs fixados em ambas populações não foram selecionados. Os SNPs selecionados foram agrupados de acordo com sua diferença de freqüência e colocados na tabela abaixo(Tabela 18).
Tabela 18:SNPs que apresentam valor de Delta maior ou igual a 0,5 apresentados por diferença de freqüência para a região D2S2189
Diferença de Freqüência (DELTA) Quantidade de SNPs
0,5-0,599 5
0,6-0,63 1
0,7-0,703 1
D3S1768 e D5S424
Figura 19: Ideogramas das regiões em A- D3S1768 e em B-D5S424 localizado no cromossomo 3 e 5 respectivamente
Ad regiões D3S1768 e D5S424 foram analisadas em conjunto. A região selecionada no cromossomo 3 flanqueada por 1Mpb apresenta LOD score de 1.67 sendo recuperados um total de 285 SNPs que mostraram sobreposição entre as populações Apenas 15 SNPs apresentaram diferença de freqüência maior do que 0,5 para as regiões e estes podem ser visualizados na tabela em anexo.
Para a região D5S424 foram recuperasos 13 SNPs. Os marcadores foram organizados de acordo com as diferenças de frequncia entre as populações YRI e CEU sendo estes visualidos na tabela abaixo.
Tabela 19: SNPs que apresentam valor de Delta maior ou igual a 0,5 apresentados por diferença de freqüência para a região D5S424 .
Diferença de Freqüência (DELTA) Quantidade de SNPs
0,5-0,573 10
0,6-0,668 3
0,7-0,753 2
0,5-0,573 10
D5S2501
Figura 20: Ideograma da região D5S2501 localizadas na região 5
A região D5S2501 apresenta LOD score de 2,5 sendo que esta foi flanqueada por 1 Mbp e está localizada no braço longo do cromossomo 5. Foram recuperados 96 SNPs(tabela em anexo) em ambas poulações com a diferença de freqüência estabelecida para análise. Os SNPs selecionados foram agrupados de acordo com sua diferença de freqüência (Tabela 23).
Tabela 20:SNPs que apresentam valor de Delta maior ou igual a 0,5 apresentados por diferença de freqüência para a região D5S2501.
Diferença de Freqüência (DELTA) Quantidade de SNPs
0,5-0,599 33
0,6-0,696 29
0,7-0,794 30
0,8-0,845 4
D9S290
Figura 21: Ideograma da região D9S290 localizada no cromossomo 9.
A região D9S290 possui LOD score de 1,16 sendo um dos marcadores associados com o glaucoma primário de ângulo aberto. Foram recuperados 49 SNPs flaquenados nesta região com diferença de freqüência acima de 0,5 (Tabela em anexo).Os maracdores selecionados foram organizados de acordo com a diferença de freqüência alélica observada (Tabela 24).
Tabela 21:SNPs que apresentam valor de Delta maior ou igual a 0,5 apresentados por diferença de freqüência para a região D9S290.
Diferença de Freqüência (DELTA) Quantidade de SNPs
0,5-0,592 8 0,6-0,691 4 0,7-0,792 23 0,8-0,883 6 0,9-0,992 6 D10S192 e D10S548
Figura 22:Ideograma das regiões A-D10S192 e B-D10S548.
Nessas regiões, flanqueadas em 1Mpb foram recuperados 1688 SNPs Os SNPs selecionados foram agrupados de acordo com sua diferença de freqüência para as regiões descritas apenas 5 marcadores foram slecionados cuja diferença de freqüência variou entre 0,5 a 0,49. Os marcadores selecionados pelas regiões podem ser vistos na tabela em anexo.
Figura 23:Ideograma da região D10S211 localizada no cromossomo10.
Nessa região flanqueada em 1Mpb foram minerados cerca de 585 SNPs em ambas populações mas apenas 18 SNPs se apresentaram dentro do que foi estabelecido. Os SNPs selecionados foram agrupados de acordo com sua diferença de freqüência e colocados na tabela abaixo Os marcadores que apresentaram-se dentro dos critérios de seleção podem ser visualizados na tabela em anexo.
Tabela 22:SNPs que apresentam valor de Delta maior ou igual a 0,5 apresentados por diferença de freqüência para a região D10S211.
Diferença de Freqüência (DELTA) Quantidade de SNPs
0,5-0,599 13
D11S937
Figura 24:Ideograma da região D11S937 localizada no cromossomo 11.
Nessa região flanqueada em 1Mpb foram recuperados apenas 8 SNPs informativos. Estes maracadores foram agrupados de acordo com sua diferença de freqüência e colocados na tabela abaixo.Poucos maracdores para esta região foram selecionados. Estes podem ser visualizados na tabela em anexo.
Tabela 23:SNPs que apresentam valor de Delta maior ou igual a 0,5 apresentados por diferença de freqüência para a região D11S937.
Diferença de Freqüência (DELTA) Quantidade de SNPs
0,5-0,583 2
0,6-0,684 5
D14S288 e D14S283
Figura 25: Ideograma das regiões A- D14S283 e B- D14S288 localizadas no cromossomo 14.
As regiões referentes aos locos de microssatelites D14S283 e D14S288 por estarem próximas foram analisadas em conjunto. Estas regiões apresentam sobreposições e estão relacionadas com o GPAA (Wiggs, Allingham et al., 2000) sendo o loco D14S283 está mais relacionado com esta patologia (Nemesure, Jiao et al., 2003)
Foram recuperados um total 36 SNPs para ambas regiões com diferença de freqüência alélica acima de 0,5(Tabela em anexo).. Os SNPs foram agrupados de acordo com as freqüências.
Tabela 24:SNPs que apresentam valor de Delta maior ou igual a 0,5 apresentados por diferença de freqüência para a região D14S288 e D14S283
Diferença de Freqüência (DELTA) Quantidade de SNPs
0,5-0,581 15
0,6-0,691 6
0,7-0,789 4
0,8-0,855 3
D14S587
Figura 26:Ideograma da região D14S287 localizada no cromossomo 14.
Para região referente ao microssatelite D14S587 foram recuperados 5 SNPs informativos de ancestralidade nas populações CEU e YRI. Estes apresentaram diferença de freqencia entre 0,507 a 0,658.
7.5. Discussão
Alguns locos de microssatélites e regiões localizadas em alguns destes marcadores apresentam ligação com glaucoma primário de ângulo aberto. As regiões selecionadas referentes aos microssatélites já estudados em Barbados ((Nemesure, Jiao et al., 2003) e com africanos (Rotimi, Chen; et al., (2006)) apresentaram LOD score acima de 1,02 evidenciando uma ligação destas regiões com o glaucoma primário de ângulo aberto. Estas regiões foram então analisadas flaqueando 1Mpb em 5Mpb a 5’ e 3’ O microssatélite com maior pico de ligação em populações Européias (CEU) e Africanas (YRI).
Uma mineração utilizando o banco de dados HapMap na segunda fase de 23 de março foi realizada em busca por marcadores do tipo SNPs flanquedados por 1Mpb nas regiões dos microssatélites cujo critério de seleção se baseou na diferença de freqüência (Delta) maior ou igual a 0,50 para montagem de um painel que contenham marcadores informativos de ancestralidade biogeográfica. A ancestralidade biogegráfica pode ser estimada pela genotipagem de um conjunto de marcadores que posuam diferença de freqüência alélica significativa entre os grupos populacionais que constituem a população humana (Rosenberg, 2002)
De acordo com a ocorrência de variação da estrutura genética da população, há possibilidade de obter marcadores com diferenças de freqüência alélica altas que podem determinar a contribuição de cada população parental em grupos miscigenados. Os AIM´s capturam as informações de frequencia alélica entre os grupos populacionais (Shriver, Smith et
al., 1997; Halder, Shriver et al., 2008).
O marcador bi-alélico considerado ideal para distinguir uma população de outras populações, ou estimar proporções de ancestralidade em amostras miscigenadas, seria aquele em que um alelo se encontre altamente fixado para uma população fazendo com que a diferença de freqüência alélica (delta) seja igual a 1,0. Entretanto, tais loci são relativamente raros (Pfaff et
al., 2004). A diferença de freqüência alélica atualmente indicada para um AIM de grande informação e correta atribuição é 0,60 (Hoggart et al., 2003; Rosenberg et al., 2003).
Os SNPs recuperados nesta mineração podem ser de grande valia para o estudo de mapeamento por desequilíbrio de ligação gerado por misicigenação na população brasileira. Um total de 23.381 SNPs foram recuperados referentes as regiões dos locos de microssatélites utilizadas neste estudo. Algumas regiões não apresentaram SNPs com sobreposição para as populações CEU e YRI. As regiões D2S364 e D2S117 apresentaram poucos SNPs com diferença de freqüência acima de 0,5. Destes SNPs apenas 23 em ambas regiões foram observados para compor um painel dentro do critério de seleção.
Para as regiões D2S325 e D2S2189 foram recuperados 7 SNPs invormativos. No cromossomo 3 na região D3S1768 flanqueada houve a captura de 2 SNPs com diferença de freqüência maior do que 0,50 sendo esta região considerada uma das indicadas para compor o painel por apresentar em outro estudo pico de ligação com GPAA.
A região D5S424 foi analisada em conjunto apresentando um total de 13 SNPs com diferença de freqüência alélica maior ou igual a 0,50. A região D5S2501 apresentou 96 SNPs dentro do critério estabelcido sendo umas das regiões que apresentou o maor número de
marcadores informativos. A região D9S290 apesar de apresentar pico de ligação menor que 1,16 foram recuperados 2696 SNPs e destes apenas 47 apresentaram diferença de freqüência alélica com 0,5.
O cromossomo 10 apresentou LOD score (LOD score = 2.14) maior que os demais que estavam sendo analisados. A explicação é que a região D10S548 estava próxima a D10S192 região telomérica de D10S548. Isso pode ter interferido não só no valor do LOD score, como também na quantidade de SNPs encontrados para essa região que é a maior de todas estudadas nesta investigação (Nemesure, Jiao et al., 2003). Estas regiões apresentaram 18 SNPs com diferença de freqüência alélica acima de 0,5
A região D11S397 localizada no cromossomo 11 foram recuperados 37 SNPs dentro dos critérios estabelecidos de busca. As regiões D14S288 e D14S283 apresentaram uma média de 1,30 de pico de ligação (LOD score). sendo recuperados nesta análise 19 SNPs presentes em ambas populações com diferença de freqüência acima de 0,50. Para a região D14S587 foram observados 5 SNPs acima de 0,5 presentes em amabas as populações não sendo esta região portanto selecionada para o painel.
Um subconjunto de marcadores para estudos de MALD podem ser utilizados para estimar a proporção de ancestralidade individual e riscos genéticos em relação á doença investigada. Estudos evidenciaram a associação genética para doenças como o câncer de próstata e lúpus com o grupo populacional de africanos (Shriver, Parra et al., 2003; Smith, Patterson et al., 2004).
A vantagem do estudos por mapeamento por desequilíbrio de ligação é a utilização de marcadoores informativos de ancestralidade para estimar a acesdencia genética individual ou do grupo populacional em relação a determinada patologia além de ser uma abordagem econômica para a identificação de genes e regiões genômicas em populações miscigenadas ((Reich e Patterson, 2005) (Bercovici, Geiger et al., 2008)
De acordo com os resultados obtidos as regiões realacionadas com o GPAA cujos marcadores mais informativos que irão compor um painel pertecem as regiões flanqueadas pertencentes aos microssatélites D5S2501, D14S288, D14S283 e D9S290. Após realizada a mineração pertencentes a estas regiões um painel com os marcadores informativos de ancestralidade ligados ao GPAA foi montado contendo cerca de 291 SNPs com diferença de freqüência maior ou iguela a 0,50.
Portanto, dentre deste contexto, a busca por SNPs informativos de ancestralidade para estudos de MALD para investigar a associação de genes e locos ligados ao GPAA bem como a ancestralidade biogeográfica e grupos de afrodescendentes é de grande importância uma vez que o glaucoma primário de ângulo aberto é uma doença freqüente também pela ausência de investigações com esta abordagem no Brasil .uma vez que esses SNPs são importantes candidatos a explicar a maior incidência de GPAA em famílias africanas e afro-descendentes.