2. MATERIAIS E MÉTODOS
2.5. Variabilidade genética das subpopulações
2.5.2. Variabilidade genética entre as subpopulações
Em populações naturais, as freqüências genotípicas em cada subpopulação não necessariamente encontram-se nas proporçoões de Hardy- Weinberg, em função de forças não seletivas como a deriva genética e a endogamia. Ambos os fatores agem reduzindo a quantidade de heterozigosidade e aumentando a homozigosidade, efeitos que tendem a se acentuar à medida que a população se torne estruturada, quando os cruzamentos e a dispersão ocorrem somente nas vizinhanças de cada indivíduo. Wright (1951, 1969) propôs que os desvios das freqüências genotípicas em uma população subdividida podem ser medidos em termos de três parâmetros, FIS, FIT e FST, denominados índices de fixação, assim
relacionados:
1- FIT = (1- FIS)(1- FST)
Na definição de Wright FIS e FIT estimam a correlação da união de
gametas em relação a subpopulação e em relação à população total, respectivamente, enquanto FST é a correlação entre dois gametas retirados ao
acaso de cada subpopulação.
A idéia básica na abordagem de Wright assume que as populações e subpopulações analisadas derivaram de uma população ancestral comum ao mesmo tempo e que todas as poulações são igualmente relacionadas, quer haja ou não migração entre as populações. Ou seja, as populações são consideradas como uma amostra randômica de um conjunto de infitas populações igualmente relacionadas. Nesse contexto, Weir & Cocherhan (1984) desenvolveram um sistema baseado na análise de variâncias que permite a um só tempo estimar e testar o nível de significância dos diversos índices de fixação F.
Entretanto, considerando que a maioria das populações naturais apresenta relações filogenéticas que não se adequam ao modelo proposto por Wright, Nei (1977) redefiniu os índices de fixação sem usar o conceito de correlação na união de gametas. O autor mostrou que a relação entre os diferentes índices F se mantêm em qualquer situação a despeito das relações filogenéticas, padrão de migração, número de alelos, havendo ou não seleção.
Nessa abordagem, todos os índices de fixação podem ser definidos a partir das heterozigosidades observada e esperada para a população investigada, como se verá a seguir.
No presente estudo adotou-se as duas abordagens (Wright, 1951 e Nei, 1977) para avaliar a diferenciação entre as subpopulações e grupos de subpopulações. Para tanto empregou-se o program Fstat, ver.2.9.3 (Goudet, 2001), para calcular os índices de fixação de Wiright (1969), estimados pelas estatísticas globais de Nei (1987) e Weir & Cockerhan (1984).
Estatísticas de Nei
Foram estimados para cada loco e para o conjunto das amostras as estatísticas a seguir definidas:
HO: proporção observada de indivíduos heterozigotos
Ho = 1 – Σ Σ Pkii/np,
Onde Pkii é a frequênciado genótipo AiAi na amostra k e np é o número de
amostras.
HS: é a heterozigosidade esperada (não viesada) dentro da amostra, nesse contexto, freqüentemente chamada de diversidade genética.
onde np é o número de amostras e ñ é a média harmônica de nk
HT: é a heterozigosidade total esperada, ou diversidade total do conjunto.
onde
DST: estima a quantidade de diversidade entre as amostras. pi2 = Σkpki2/np, pi = Σkpki /np, HT = 1- Σi pi2 + HS/2ñnp Hs = ñ[1- Σi pi2 – Ho/2ñ]/(ñ-1) DST = HT – HS
DST’: diversidade entre as amostras independente d número de amostras.
HT’: diversidade total independente do tamanho da amostra
GST: coeficiente de diversidade relativa entre as populações – estimador de Fst.
GST’: Gst corrigido independente do número de amostras.
GIS: é um esimador do índice de fixação Fis.
Estatíticas de Weir & Cockerhan:
Os estimadores F, θ e f, correspondentes aos índices de fixação de Wright, foram calcaulados pelo programa Fstat, ver.2.9.3 (Goudet, 2001), através da partição da variância total das freqüências alélicas nos componentes relativos a variância entre as populações (σ2P), variância entre os
indivíduos dentro da população (σ2I) e variância dentro dos indivíduos (σ2G), as
quais são estimadas a partir dos respectivos quadrados médios observados para populações (QMP), indivíduos (QMI) e alelos (MSG):
σ2G = QMG σ2I = ½(QMI-QMG) σ2P = (1/2nc)(QMP – QMI)
obtendo-se as medidas de diferenciação a partir das relações entre os componentes da variância: σ2P σ2P + σ2I +σ2G θ = DST DST’ = nnp-1 σ2P + σ2I σ2P + σ2I +σ2G F = f = F - θ1 - θ HT’= HS + DST’ GST = (HT – HS)/HT = DST/HT GST’ = (HT’ – HS)/HT’ = DST’/HT’ GIS = (HS – HO)/HS = 1- HO/HS
A probabilidade de estas estatísticas diferirem de zero foi determinada após 10.000 permutações e intervalos de confiança de 95%, associados a cada índice foram gerados após 10.000 bootstrap (Goudet, 2001). Para f (FIS) os
alelos são permutados entre indivíduos dentro das amostras; para F (FIT) os
alelos são permutados entre amostras. Para θ (FST), permutam-se os alelos
entre amostras, quando FIS não difere de zero, ou permutam-se os genótipos
quando FIS é significativo.
O programa calculou ainda o coeficiente de parentesco (Hamilton’s, 1971) - REL = 2θ /(1+F) - estimado segundo Queller & Goodnight, 1989). Essa
medida estima o parentesco médio dos indivíduos dentro das amostras em relação ao todo.
As estimativas de FST (θ) entre pares de amostras, bem como a partição
da variação entre subpopulações, entre grupos de subpopulações e entre subpopulações dentro dos grupos, foram determinadas pelo programa Arlequin ver. 2000, através da análise de variância hierarquizada de Weir & Cocherhan (1984), conforme desscrito acima.
A contribuição relativa de cada amostra para a variabilidade total das amostras em conjunto foi estimada para os indicadores de riqueza alélica padronizada (R(g)) e diversidade genética (Hnb), conforme Petit et al. (1998). O
procedimento consiste em se estimar os indicadores de variabilidade para o conjunto de todas as populações, exceto aquela que se quer avaliar a contribuição relativa. Conforme as relações seguintes:
CT(k) = (XT – XT/k)/XT,
onde :
CT(k) - contribuição relativa da população k;
XT - representa a diversidade total ou a riqueza alélica total;
XT/k - representa a diversidade ou riqueza alélica total no conjunto de
todas as populações exceto a população k;
Adotando o mesmo procedimento, essa contribuição pode ser particionada em dois componentes:
CS(k) - contribuição da população k à diversidade total, ou à riqueza
CS(k) = (Xk – XS/k)/n = (Xk – XS)/(n-1),
onde:
Xk - diversidade ou riqueza alélica da população k;
XS - diversidade ou riqueza alélica média de todas as
populações.
CD(k) - contribuição da população k à diversidade total ou à riqueza
alélica total devido a sua divergência, obtido pela diferença: CD(k) = CT(k) - CS(k)