Variabilidade genética entre as subpopulações

2. MATERIAIS E MÉTODOS

2.5. Variabilidade genética das subpopulações

2.5.2. Variabilidade genética entre as subpopulações

Em populações naturais, as freqüências genotípicas em cada subpopulação não necessariamente encontram-se nas proporçoões de Hardy- Weinberg, em função de forças não seletivas como a deriva genética e a endogamia. Ambos os fatores agem reduzindo a quantidade de heterozigosidade e aumentando a homozigosidade, efeitos que tendem a se acentuar à medida que a população se torne estruturada, quando os cruzamentos e a dispersão ocorrem somente nas vizinhanças de cada indivíduo. Wright (1951, 1969) propôs que os desvios das freqüências genotípicas em uma população subdividida podem ser medidos em termos de três parâmetros, FIS, FIT e FST, denominados índices de fixação, assim

relacionados:

1- FIT = (1- FIS)(1- FST)

Na definição de Wright FIS e FIT estimam a correlação da união de

gametas em relação a subpopulação e em relação à população total, respectivamente, enquanto FST é a correlação entre dois gametas retirados ao

acaso de cada subpopulação.

A idéia básica na abordagem de Wright assume que as populações e subpopulações analisadas derivaram de uma população ancestral comum ao mesmo tempo e que todas as poulações são igualmente relacionadas, quer haja ou não migração entre as populações. Ou seja, as populações são consideradas como uma amostra randômica de um conjunto de infitas populações igualmente relacionadas. Nesse contexto, Weir & Cocherhan (1984) desenvolveram um sistema baseado na análise de variâncias que permite a um só tempo estimar e testar o nível de significância dos diversos índices de fixação F.

Entretanto, considerando que a maioria das populações naturais apresenta relações filogenéticas que não se adequam ao modelo proposto por Wright, Nei (1977) redefiniu os índices de fixação sem usar o conceito de correlação na união de gametas. O autor mostrou que a relação entre os diferentes índices F se mantêm em qualquer situação a despeito das relações filogenéticas, padrão de migração, número de alelos, havendo ou não seleção.

Nessa abordagem, todos os índices de fixação podem ser definidos a partir das heterozigosidades observada e esperada para a população investigada, como se verá a seguir.

No presente estudo adotou-se as duas abordagens (Wright, 1951 e Nei, 1977) para avaliar a diferenciação entre as subpopulações e grupos de subpopulações. Para tanto empregou-se o program Fstat, ver.2.9.3 (Goudet, 2001), para calcular os índices de fixação de Wiright (1969), estimados pelas estatísticas globais de Nei (1987) e Weir & Cockerhan (1984).

Estatísticas de Nei

Foram estimados para cada loco e para o conjunto das amostras as estatísticas a seguir definidas:

HO: proporção observada de indivíduos heterozigotos

Ho = 1 – Σ Σ Pkii/np,

Onde Pkii é a frequênciado genótipo AiAi na amostra k e np é o número de

amostras.

HS: é a heterozigosidade esperada (não viesada) dentro da amostra, nesse contexto, freqüentemente chamada de diversidade genética.

onde np é o número de amostras e ñ é a média harmônica de nk

HT: é a heterozigosidade total esperada, ou diversidade total do conjunto.

onde

DST: estima a quantidade de diversidade entre as amostras. pi2 = Σkpki2/np, pi = Σkpki /np, HT = 1- Σi pi2 + HS/2ñnp Hs = ñ[1- Σi pi2 – Ho/2ñ]/(ñ-1) DST = HT – HS

DST’: diversidade entre as amostras independente d número de amostras.

HT’: diversidade total independente do tamanho da amostra

GST: coeficiente de diversidade relativa entre as populações – estimador de Fst.

GST’: Gst corrigido independente do número de amostras.

GIS: é um esimador do índice de fixação Fis.

Estatíticas de Weir & Cockerhan:

Os estimadores F, θ e f, correspondentes aos índices de fixação de Wright, foram calcaulados pelo programa Fstat, ver.2.9.3 (Goudet, 2001), através da partição da variância total das freqüências alélicas nos componentes relativos a variância entre as populações (σ2P), variância entre os

indivíduos dentro da população (σ2I) e variância dentro dos indivíduos (σ2G), as

quais são estimadas a partir dos respectivos quadrados médios observados para populações (QMP), indivíduos (QMI) e alelos (MSG):

σ2G = QMG σ2I = ½(QMI-QMG) σ2P = (1/2nc)(QMP – QMI)

obtendo-se as medidas de diferenciação a partir das relações entre os componentes da variância: σ2P σ2P + σ2I +σ2G θ = DST DST’ = n_np-1 σ2P + σ2I σ2P + σ2I +σ2G F = f = F - θ_{1 - θ} HT’= HS + DST’ GST = (HT – HS)/HT = DST/HT GST’ = (HT’ – HS)/HT’ = DST’/HT’ GIS = (HS – HO)/HS = 1- HO/HS

A probabilidade de estas estatísticas diferirem de zero foi determinada após 10.000 permutações e intervalos de confiança de 95%, associados a cada índice foram gerados após 10.000 bootstrap (Goudet, 2001). Para f (FIS) os

alelos são permutados entre indivíduos dentro das amostras; para F (FIT) os

alelos são permutados entre amostras. Para θ (FST), permutam-se os alelos

entre amostras, quando FIS não difere de zero, ou permutam-se os genótipos

quando FIS é significativo.

O programa calculou ainda o coeficiente de parentesco (Hamilton’s, 1971) - REL = 2θ /(1+F) - estimado segundo Queller & Goodnight, 1989). Essa

medida estima o parentesco médio dos indivíduos dentro das amostras em relação ao todo.

As estimativas de FST (θ) entre pares de amostras, bem como a partição

da variação entre subpopulações, entre grupos de subpopulações e entre subpopulações dentro dos grupos, foram determinadas pelo programa Arlequin ver. 2000, através da análise de variância hierarquizada de Weir & Cocherhan (1984), conforme desscrito acima.

A contribuição relativa de cada amostra para a variabilidade total das amostras em conjunto foi estimada para os indicadores de riqueza alélica padronizada (R(g)) e diversidade genética (Hnb), conforme Petit et al. (1998). O

procedimento consiste em se estimar os indicadores de variabilidade para o conjunto de todas as populações, exceto aquela que se quer avaliar a contribuição relativa. Conforme as relações seguintes:

CT(k) = (XT – XT/k)/XT,

onde :

CT(k) - contribuição relativa da população k;

XT - representa a diversidade total ou a riqueza alélica total;

XT/k - representa a diversidade ou riqueza alélica total no conjunto de

todas as populações exceto a população k;

Adotando o mesmo procedimento, essa contribuição pode ser particionada em dois componentes:

CS(k) - contribuição da população k à diversidade total, ou à riqueza

CS(k) = (Xk – XS/k)/n = (Xk – XS)/(n-1),

onde:

Xk - diversidade ou riqueza alélica da população k;

XS - diversidade ou riqueza alélica média de todas as

populações.

CD(k) - contribuição da população k à diversidade total ou à riqueza

alélica total devido a sua divergência, obtido pela diferença: CD(k) = CT(k) - CS(k)

No documento Análise da diversidade genética de germoplasma de Theobroma cacao L. da Amazônia Brasileira por microssatélitesGenetic diversity analysis of Theobroma cacao L. germplasm from Brazilian Amazon with microsatellites (páginas 32-36)