• Nenhum resultado encontrado

x : variável indicadora para o j-ésimo indivíduo, que assume valores em função do genótipo

dos QTL’s, inferidos indiretamente a partir dos marcadores flanqueadores;

j

e

: resíduo para o j-ésimo indivíduo.

A grande diferença entre os modelos lineares empregados na análise de marcas simples e os modelos de mapeamento por intervalo é que nestes é possível separar a localização do QTL de seu efeito, o que torna o mapeamento mais preciso (Lynch e Walsh, 1997; Liu, 1998; Zeng, 2001).

Isso pode ser entendido quando nota-se que a variável *j

x

do modelo é função de

θ

,

uma vez que o genótipo do QTL é inferido indiretamente, com base nas probabilidades condicionais.

Estatisticamente, esse modelo é dito modelo de misturas, pois envolve classes desconhecidas, cada uma com sua distribuição. No caso de retrocruzamentos, por exemplo, tem-se duas classes,

QQ

e

Qq

, desconhecidas, mas que podem ser inferidas indiretamente.

A utilização de estatísticas baseadas em verossimilhança no desenvolvimento do modelo de mapeamento por intervalo permite estimar todos os parâmetros envolvidos. A partir do modelo, num único procedimento, é possível estimar a média (

µ

), o efeito dos QTL's ( *

b

), a

variância (

σ

2) e a distância entre o QTL e a marca ( 1

θ

ou

θ

2) (Lynch e Walsh, 1997; Zeng, 2001).

A significância desses parâmetros pode ser testada com base em testes de razão de verossimilhança ou, de forma equivalente, com testes de LOD score. Como é possível realizar um teste para cada valor estipulado de

θ

, é possível construir curvas, formadas pelos valores calculados de cada razão de verossimilhança ou LOD em função das distâncias do cromossomo (Figura 3) (Morton, 1955; Lander e Botstein 1989; Lynch e Walsh, 1997; Zeng, 2001).

0 1 2 3 4 5 6 7 8 9 10 11 0 10 20 30 40 50 60 70 80 Distância (cM) LOD  

Figura 3: Mapeamento de QTL’s, ilustrando o método de mapeamento por intervalo. No eixo da distância, estão indicadas as estimativas das posições das marcas (×) e dos QTL's (•).

Todo valor da razão de verossimilhança maior que o valor do limite de significância adotado indica a possível presença de QTL. Em cada intervalo, a posição estimada do QTL no cromossomo é indicada no valor da máxima verossimilhança, que corresponde ao maior valor

calculado da estatística (Lynch e Walsh, 1997). Na Figura 3, por exemplo, foram mapeados dois QTL’s.

O desenvolvimento do método de mapeamento por intervalo ocorreu paralelamente ao desenvolvimento das técnicas de obtenção dos marcadores moleculares, o que permitiu que fosse bastante empregado no mapeamento de QTL's, a partir de mapas de ligação saturados. Além disso, o aumento de precisão das análises em relação ao método anterior e o desenvolvimento computacional também contribuíram na disseminação de sua utilização. Foi baseado nesse método que surgiu o MAPMAKER/QTL, primeiro programa específico para mapeamento de QTL's (Paterson et al., 1988; Lander et al., 1987; Lander e Botstein, 1989; Lincoln

et al., 1992).

Embora o ganho de precisão proporcionado por esse método tenha sido considerável em relação aos métodos de análise de marcas simples, as estimativas obtidas pela razão de verossimilhança requerem recursos computacionais mais avançados, o que pode limitar seu emprego (Lynch e Walsh, 1997). Atualmente, esse problema é minimizado.

Contudo, sua principal desvantagem é o de isolar o intervalo analisado do restante do genoma, ou seja, o método não permite considerar os efeitos de outros QTL's sobre o QTL do intervalo sob investigação. Isso comumente causa o surgimento de “QTL’s fantasmas”, provenientes da indicação de valores de razões de verossimilhança maiores que o limite de significância, em regiões genômicas onde não há QTL's (Paterson et al., 1988, Jansen e Stam, 1994; Zeng 1994; Lynch e Walsh, 1997).

A detecção de falsos QTL's é um problema importante, uma vez que os objetivos posteriores do mapeamento normalmente visam a clonagem e a introgressão de QTL's, além da seleção assistida por marcadores. Dessa forma, o mapeamento por intervalo também serviu de base para o desenvolvimento de análises mais sofisticadas, na tentativa de contornar esse problema, como será visto a seguir.

3 .4 .2 .3 . M a p e a me n t o p o r In te rv a lo C o mp o s to

Conforme já visto, o método de mapeamento por intervalo permite detectar a presença de um único QTL ligado a marcadores flanqueadores (Figura 2). Como a análise é realizada para um intervalo de cada vez, o efeito do QTL do intervalo é isolado dos efeitos dos demais QTL's do genoma (Lynch e Walsh, 1997).

Tal isolamento não permite determinar se efeitos significativos de intervalos adjacentes são devidos a um único QTL, comum a tais intervalos, ou se há vários QTL's ligados, um em cada intervalo. Além disso, como o isolamento não permite que sejam considerados os efeitos

significativos de outros QTL's, as estimativas da posição e do efeito do QTL do intervalo podem ser imprecisas, diminuindo o poder de detecção do método (Lynch e Walsh, 1997).

Assim, foi proposta uma extensão ao mapeamento por intervalo, denominada mapeamento por intervalo composto (Jansen e Stam,1994; Zeng, 1994). Neste método, além dos pares de marcadores adjacentes, marcas são selecionadas como cofatores, o que permite controlar os efeitos de outros QTL’s enquanto o QTL do intervalo de interesse é investigado (Lynch e Walsh, 1997; Zeng, 2001).

A inclusão de marcas com efeitos significativos sobre o QTL do intervalo analisado diminui o resíduo do modelo, aumentando sensivelmente o poder de detecção de QTL's, além de melhorar a precisão das estimativas do efeito e da posição do QTL. Dessa forma, o critério para a seleção das marcas que serão utilizadas como cofatores é importante, pois pode determinar a precisão do mapeamento (Lynch e Walsh, 1997).

Se o intervalo for flanqueado pelos marcadores

M

i e

M

i+1, a inclusão das marcas 1

i

M

e

M

i+2 incorpora todos os QTL's ligados à esquerda de

M

i−1 e à direita de

M

i+2 sem,

contudo, incorporar o efeito dos QTL's ligados dos intervalos imediatamente adjacentes ao intervalo de interesse (Figura 4) (Zeng, 1994; Lynch e Walsh, 1997).



Figura 4: Representação do método de mapeamento por intervalo composto, que permite investigar o QTL (

Q

j) localizado entre as marcas flanqueadoras (

M

i e

M

i+1), considerando

também as marcas

M

i−1 e

M

i+2 como cofatores.

Nesse caso, os efeitos dos QTL's

Q

j−3,

Q

j−2,

Q

j+2 e

Q

j+3 são incorporados pelos

marcadores

M

i−1 e

M

i+2. Contudo, os efeitos QTL's

Q

j−1 e

Q

j+1 não são incorporados aos

cofatores, por pertencerem aos intervalos (

M

i−1

,M

i) e (

M

i+1

,M

i+2), respectivamente (Lynch e

Walsh, 1997).

Embora o efeito de QTL's ligados seja, normalmente, maior que o efeito de QTL's não ligados, estes também contribuem para a diminuição do resíduo do modelo. Porém, a definição do número de marcadores associados a QTL's não ligados que deve ser utilizado como cofator não é simples, uma vez que a inclusão de muitos QTL's não ligados como cofatores reduz sensivelmente a precisão do método (Zeng, 1994; Lynch e Walsh, 1997).

Uma forma de determinar os cofatores é empregar uma análise de regressão múltipla, que permite selecionar as marcas com efeitos significativos sobre o QTL do intervalo analisado, sejam elas associadas a QTL's ligados ou não (Jansen, 1992, 1993; Jansen e Stam, 1994; Zeng, 1994; Lynch e Walsh, 1997).

Assim, considerando que o intervalo de interesse seja flanqueado pelos marcadores

i

M

e

M

i+1, o modelo desse método pode ser representado por (Zeng, 2001)

+ ≠

+

+

+

=

1 , * * i i k j kj k j j

b

x

b

x

e

y

µ

, em que j

y

: valor fenotípico do caráter do j-ésimo indivíduo;

µ

: média do modelo; *

b

: efeito dos genótipos dos QTL's;

*

j

x

: variável indicadora para o j-ésimo indivíduo, que assume valores em função do genótipo

dos QTL’s, inferidos indiretamente a partir dos marcadores flanqueadores,

M

i e

M

i+1;

k

b

: efeito do genótipo do marcador

k

, para

kM

i

,M

i+1;

kj

x

: variável codificadora para o j-ésimo indivíduo, que indica o genótipo do marcador para

cada um dos

k

marcadores,

k

M

i

,M

i+1;

j

e

: resíduo para o j-ésimo indivíduo.

Da mesma forma que no mapeamento por intervalo, o modelo do método de mapeamento por intervalo composto é dito modelo de misturas, pois também envolve classes genotípicas desconhecidas, agrupadas em *