• Nenhum resultado encontrado

A abordagem Bayesiana a ser utilizada neste caso, em conformidade com o ponto de vista de Shoemaker et al. (1998), consiste em se obter uma distribuic¸˜ao de proba- bilidade, associada aos diferentes valores que o parˆametro de interesse pode assumir, de modo a representar o grau de credibilidade associado a cada um deles, dado o conjunto de dados observado. O ponto de partida ´e uma func¸˜ao densidade de probabilidade, dita a priori, obtida de considerac¸ ˜oes anteriores `a observac¸˜ao dos gen ´otipos. Esta func¸˜ao den- sidade de probabilidade pode ent˜ao ser atualizada pela utilizac¸˜ao do teorema de Bayes, de modo que as informac¸ ˜oes contidas nas observac¸ ˜oes possam exercer sua influˆencia.

Seja φ(θ) a func¸˜ao densidade de probabilidade a priori associada a um ve- tor de parˆametros (θ). A func¸˜ao densidade de probabilidade a posteriori condicional ao conjunto de dados observados (X), neste caso ´e expressa por:

φ(θ|X) = φ(θ).φ(X|θ)

φ(X) (41)

A func¸˜ao densidade de probabilidade a priori a ser adotada deve refletir necessariamente o grau de conhecimento dispon´ıvel acerca dos parˆametros de interesse. ´E interessante observar que a express˜ao φ(X|θ) refere-se `a func¸˜ao que descreve a probabi- lidade de ocorrˆencia dos dados condicional aos valores dos parˆametros que comp ˜oem θ, e, em termos pr´aticos, tem a mesma forma da func¸˜ao de verossimilhanc¸a dos parˆametros. Diversos m´etodos tˆem sido empregados na obtenc¸˜ao das distribuic¸ ˜oes de

probabilidade a posteriori φ(θ|X), incluindo aqueles que, por utilizarem func¸ ˜oes den- sidade de probabilidade a priori adequadas, fornecem express ˜oes alg´ebricas expl´ıcitas, como em Shoemaker et al. (1998), e aqueles que obt´em distribuic¸ ˜oes de probabilidade emp´ıricas baseadas em algoritmos de randomizac¸˜ao via Cadeias de Markov, como o de Metropolis-Hastings, utilizado em Ayres & Balding (1998).

Conforme salientam Baldi & Brunak (1999), o algoritmo de Metropolis- Hastings, utilizado para a obtenc¸˜ao da distribuic¸˜ao marginal a posteriori de θ exige so- mente que a func¸˜ao de verossimilhanc¸a seja expressa algebricamente. A func¸˜ao de den- sidade de probabilidade a priori φ(θ) ´e levada em considerac¸˜ao na obtenc¸˜ao dos estados sugeridos da Cadeia de Markov, enquanto que a express˜ao alg´ebrica da func¸˜ao φ(X) n˜ao ´e exigida.

4.2.1 Modelo Probabil´ıstico de An´alise de Locos Individuais

O modelo aqui descrito para a an´alise de locos individuais difere daquele apresentado em Ayres & Balding (1998) por levar em considerac¸˜ao o fato de que somente locos polim ´orficos s˜ao utilizados no processo de estimac¸˜ao.

Neste caso, a estimac¸˜ao das freq ¨uˆencias gˆenicas, embora n˜ao seja de inte- resse prim´ario, ´e tamb´em necess´aria para a estimac¸˜ao de f . Parˆametros como as freq ¨uˆen- cias gˆenicas nesta situac¸˜ao s˜ao ditos parˆametros nuisance (Shoemaker et al., 1999). A abor- dagem Bayesiana disp ˜oe de m´etodos convenientes de se lidar com estes parˆametros, j´a que permite a obtenc¸˜ao da distribuic¸˜ao de probabilidade marginal de f levando-se em conta a incerteza na estimac¸˜ao dos parˆametros nuisance (Shoemaker et al., 1998). Dada a condicionalidade ao polimorfismo no modelo a ser descrito, os valores poss´ıveis das freq ¨uˆencias gˆenicas est˜ao restritos ao intervalo [0; 1], excluindo-se os limites do intervalo. Temos que a func¸˜ao de probabilidade, associada aos diferentes valores que f pode assumir, ´e dada por:

φ(f, p|X, pol) = φ(f, p|pol).φ(X|f, p, pol)

φ(X|pol) (42)

sendo:

φ(f, p|X,pol) a func¸˜ao densidade de probabilidade a posteriori dos parˆametros, condicional aos dados observados e ao polimorfismo;

φ(f, p|pol) a func¸˜ao densidade de probabilidade a priori dos parˆametros, condicional ao polimorfismo;

φ(X|pol) a probabilidade de ocorrˆencia do conjunto de dados observa- dos X condicional ao polimorfismo;

φ(X|f, p,pol) a probabilidade de ocorrˆencia do conjunto de dados observa- dos X condicional aos valores de f , p e ao polimorfismo, neste caso dada por:

φ(X|f, p, pol) = n! Q u,vnuv! Q u,vPuvnuv 1 −P uPuun (43) em que:

n ´e o n ´umero de indiv´ıduos observados;

nuv ´e o valor observado da freq ¨uˆencia absoluta do gen ´otipo uv;

Puv ´e a probabilidade de ocorrˆencia do gen ´otipo uv na populac¸˜ao;

sendo Puv = p2u + pu(1 − pu)f para u = v e Puv = 2pupv(1 − f ) para u 6= v, com pu

representando a probabilidade de ocorrˆencia do alelo u na populac¸˜ao.

Com base nestas express ˜oes ´e poss´ıvel, de modo an´alogo ao procedimento adotado em Ayres & Balding (1998), implementar um algoritmo do tipo Metropolis-Has- tings (Metropolis et al., 1953; Hastings, 1970; Smith & Roberts, 1993), que possibilita a obtenc¸˜ao da func¸˜ao densidade de probabilidade a posteriori utilizando um m´etodo de ran- domizac¸˜ao de Monte Carlo via Cadeias de Markov, comumente denominado de algoritmo MCMC (Monte Carlo Markov Chains).

4.2.2 Modelo Probabil´ıstico de An´alise de M ´ultiplos Locos

O modelo gen´etico-estat´ıstico adequado para a an´alise de m ´ultiplos lo- cos deve levar em considerac¸˜ao tanto os efeitos resultantes da amostragem gen´etica, que ocorre ao longo das gerac¸ ˜oes, quando aqueles decorrentes da amostragem estat´ıstica, de- corrente do fato de que somente parte dos indiv´ıduos da populac¸˜ao s˜ao observados. Este modelo pode ser obtido associando-se aos valores de f de locos diferentes uma distribui- c¸˜ao de probabilidade. Assim, se fifor considerado como sendo o ´ındice de fixac¸˜ao em um

dado loco i, tem-se que a func¸˜ao densidade de probabilidade associada aos seus poss´ıveis valores pode ser expressa por φ(fi|θ), em que θ representa o conjunto de hiperparˆametros,

neste caso, definidos como sendo func¸˜ao do sistema reprodutivo predominante na po- pulac¸˜ao.

A especificac¸˜ao completa da distribuic¸˜ao a priori ´e, neste caso, dada por:

φ(fi, θ) = φ(θ) · φ(fi|θ) (44)

que, utilizando o teorema de Bayes, fornece a distribuic¸˜ao a posteriori dos parˆametros de interesse, dado o conjunto de valores observados X:

φ(fi, θ|X) =

φ(θ) · φ(fi|θ) · φ(X|fi, θ)

φ(X) (45)

A utilizac¸˜ao desta abordagem permite que se associe `a variac¸˜ao dos valores observados de f dois componentes: um primeiro, resultante da amostragem gen´etica, que promove um comportamento dinˆamico nos valores de fi em locos diferentes ao longo

das gerac¸ ˜oes, motivando a distribuic¸˜ao φ(fi|θ), e um segundo, resultante da amostragem

estat´ıstica, expresso em φ(X|fi, θ).

Coelho & Vencovsky1 sugerem que uma distribuic¸˜ao adequada para os valores de f em locos diferentes de uma dada populac¸˜ao ´e a distribuic¸˜ao obtida a partir da func¸˜ao densidade de probabilidade Beta definida para os valores da taxa de fecundac¸˜ao cruzada aparente (t) ao longo do intervalo (0, N ). A func¸˜ao densidade de probabilidade de interesse, expressa em termos de f ´e dada por:

φ(fi|α, β) = Γ(α + β) Γ(α)Γ(β)  1−fi 1+fi α−1 N − 1−fi 1+fi β−1 Nα+β−1 (46) com hiperparˆametros: α = 1 N   (1 − f )2(1 + f )2N − 1−f1+f 4 · V ar(fi) −1 − f 1 + f   β = N α(1 + f ) 1 − f − α (47) Cumpre observar que, em condic¸ ˜oes em que as taxas de fecundac¸˜ao cru- zada s˜ao tomadas como aproximadamente constantes entre indiv´ıduos e gerac¸ ˜oes, a vari- ˆancia de fi se deve exclusivamente a efeitos de estocasticidade demogr´afica e o termo 1COELHO, A.S.G.; VENCOVSKY, R. Dinˆamica do ´ındice de fixac¸˜ao intrapopulacional em populac¸ ˜oes finitas

V ar(fi) pode ser expresso como sendo func¸˜ao do n ´umero efetivo de indiv´ıduos reprodu-

tivamente ativos em uma dada populac¸˜ao (N ):

V ar(fi) =

(1 − f )2(1 − 2f )

N +

f (1 − f )(2 − f )

2N pu(1 − pu) (48)

F ´ormula que originalmente foi obtida por Fyfe & Bailey (1951), para a variˆancia de valores estimados de f .

O modelo probabil´ıstico de an´alise para m ´ultiplos locos, j´a expressando os hiperparˆametros α e β como func¸ ˜oes de f , N e das freq ¨uˆencias al´elicas piu, e levando-se em conta a condicionalidade ao polimorfismo, pode ent˜ao ser descrito como:

φ(fi, f, N, piu|X, pol) =

φ(f, N, piu|pol) · φ(fi|f, N, piu, pol) · φ(X|fi, f, N, piu, pol)

φ(X, pol) (49)

4.2.3 Procedimento de Estimac¸˜ao

O processo de estimac¸˜ao neste caso consiste na aplicac¸˜ao do algoritmo de Metropolis-Hastings de modo a se produzir a distribuic¸˜ao de probabilidade a posteriori associada aos diferentes valores dos parˆametros de interesse.

O algoritmo consiste em se produzir um conjunto de valores simulados para a func¸˜ao densidade de probabilidade a posteriori φ(θ|X), utilizando uma Cadeia de Markov, em que a probabilidade de transic¸˜ao de um determinado estado (x) para um estado subseq ¨uente (x′) ´e dada por:

min φ(x′)q(x|x′) φ(x)q(x′|x), 1



(50)

em que:

φ(x) ´e a densidade de probabilidade associada ao estado x;

q(x′|x) ´e a probabilidade de que o estado xseja sugerido, estando-se em x. De modo

geral, se novos estados s˜ao sugeridos por uma distribuic¸˜ao uniforme q(x′|x) =

q(x|x′) e os termos se cancelam.

No presente artigo, dada a ausˆencia de informac¸ ˜oes pr´evias sobre o com- portamento dos parˆametros, utilizou-se uma distribuic¸˜ao uniforme, tanto para os valores de f e N , quanto para os poss´ıveis valores das freq ¨uˆencias gˆenicas. No caso do n ´umero

efetivo de indiv´ıduos reprodutivamente ativos (N ) definiu-se uma distribuic¸˜ao uniforme no intervalo (1, 1.000.000). Assim, a partir de um ponto qualquer do espac¸o param´etrico (x), valores aleat ´orios eram sugeridos pela distribuic¸˜ao a priori. O novo estado era ent˜ao aceito ou n˜ao com probabilidade dada pela probabilidade de transic¸˜ao. O conjunto fi- nal de valores assim obtidos representa uma amostra de observac¸ ˜oes da distribuic¸˜ao a posteriori.

As an´alises foram realizadas utilizando o software MCMC-f, desenvolvido especificamente para a aplicac¸˜ao do modelo sugerido. No intuito de se minimizar os efeitos do estado inicial (observado) os 10.000 primeiros passos da Cadeia de Markov (burn-in=10.000) foram eliminados. Considerou-se ainda um intervalo entre ”registros”de posic¸˜ao de 100 passos (step=100), afim de se promover a independˆencia entre as ob- servac¸ ˜oes. No sentido de incrementar a eficiˆencia do caminhamento ao longo do espac¸o param´etrico, foi adotado um procedimento an´alogo `aquele sugerido em Ayres & Bal- ding (1998). Sem que as propriedades estat´ısticas do algoritmo MCMC fossem afetadas, utilizou-se um mecanismo que estabelece o alcance para novos valores sugeridos ao longo da cadeia. A magnitude deste alcance, dada pelo parˆametro ǫ foi empiricamente esta- belecida (ǫ = 0, 01). As distribuic¸ ˜oes a posteriori foram representadas por amostras de 1.000.000 observac¸ ˜oes.

Documentos relacionados