Algumas considerações sobre REML - Teoria dos modelos mistos

2.3 Teoria dos modelos mistos

2.3.3 Algumas considerações sobre REML

O uso das equações de modelos mistos para predição de valores genéticos por meio do BLUP requer o conhecimento prévio dos componentes de variância e covariância e, como isto não é possível, devem-se utilizar estimativas desses valores, as quais devem ser obtidas com a maior precisão e acurácia possíveis.

Há diversas metodologias com o propósito de estimar componentes de variância, sendo universalmente consagrados nove métodos derivados de três conceitos de estimação (Marcelino & Iemma, 2002). São eles: o método da ANOVA de Fisher e os métodos I, II e III de Henderson (Henderson, 1953), que são derivados no método dos momentos (ou quadrados mínimos); o método

Maximum likelihood ou ML, de Hartley e Rao (Hartley & Rao, 1967) e o

método Maximum likelihood restricted ou REML de Patterson e Thompson (Patterson & Thompson, 1971), derivados da função de verossimilhança; os métodos Minimun norm quadratic unbiased estimation ou MINQUE (Rao, 1971a), Minimum variance quadratic estimation ou MIVQUE (Rao, 1971b); o

Minimun norm quadratic unbiased estimation iterative ou I-MINQUE de Searle

(Searle et al., 1992), derivados de funções quadráticas, e ainda os estimadores de Bayes.

Cabe ressaltar que, em dados não balanceados, a estimativa desses componentes é função do método de estimação de componentes de variância (Marcelino & Iemma, 2002), o que, de certa forma, merece a atenção dos

usuários das ciências aplicadas na hora da escolha de um desses métodos ao utilizar aplicativos computacionais de estatística.

Dentre os métodos citados, os derivados da função de verossimilhança são os mais recomendados para a estimação de componentes de variância em avaliações genéticas, especialmente com dados não balanceados, pois fornecem estimativas não-negativas de componentes de variância, elimina o viés atribuído às mudanças alélicas nas frequências gênicas se o parentesco entre os indivíduos for considerado (Martins et al., 1998) e, mais ainda, no caso da REML, considera a perda de graus de liberdade, resultante da estimação dos efeitos fixos do modelo.

Marcelino & Iemma (2002) realizaram uma investigação sobre os métodos de estimação de componentes de variância em modelos mistos desbalanceados, com o objetivo de torná-los mais claros aos usuários das ciências aplicadas. Os autores apresentam detalhes sobre os métodos mais comuns de estimação, comparando-os entre si. Para isso, utilizaram um exemplo de dois fatores com interação, no intuito de aproximar esses métodos da realidade do pesquisador. Os autores discutem cada método individualmente, levantando questões como suas propriedades estatísticas e suas utilidades. No geral, concluíram que o método REML, apesar de exigir normalidade dos dados, o que nem sempre ocorre nas pesquisas de campo, possui as melhores propriedades para estimar componentes de variância, especialmente em virtude de desbalanceamento.

No método REML, cada observação é dividida em duas partes independentes, uma referente aos efeitos fixos e outra referente aos efeitos aleatórios, de maneira que a função de verossimilhança de cada observação é dada pela soma das funções densidades de cada parte.

O método REML foi desenvolvido por Patterson & Thompson (1971) e, como já enfatizado, tem as propriedades ótimas, sendo o mais indicado para se

obter estimativas de componentes de variância em dados não balanceados. Esse método permite, sob algumas condições, que todos os efeitos de seleção sejam considerados e todas as informações que contribuíram para tal seleção sejam incluídas na análise, exceto se essas informações não forem correlacionadas com o caráter sob análise. Mesmo que essas condições sejam apenas parcialmente atendidas, o método fornece estimativas menos tendenciosas que outros, como o III de Henderson e a ANOVA (Resende, 2002a).

Como já salientado, o método REML estima componentes de variância por meio da subdivisão da função de verossimilhança em duas partes independentes, uma referente aos efeitos fixos (L'') e outra referente aos efeitos aleatórios (L'). Os componentes de variância referentes aos efeitos aleatórios,

2 e

σ

2g, são estimados pela maximização de L' e os efeitos fixos b, pela

maximização de L'' (Marcelino & Iemma, 2002; Searle et al., 1992), como é mostrado a seguir:

(

)

1 1 2 ' 2

lo g

e 2

lo g

e L = − n q π − Z G Z + R

(

)

(

)

(

)

1 ' ' 2 ' ' ' ' ' Y ZGZ R − Y Y ZGZ R − X

β β

X ZGZ R − X

β

⎡ ⎤ −_⎣ + − + + + _⎦ % % % _{% %} _% Sendo dividida em L’,

( )

(

)

(

)

1 1 1 ' 2 ' ' 2

lo g

e 2

lo g

e L = −

ρ

π

− X Z G Z + R − X

(

)

(

)

(

)

{

1 1 1 1 ' ' ' ' ' ' 2 Y Z G Z R X X Z G Z R X X Z G Z R Y − − _⎡ − _⎤ − − + _⎣ + _⎦ + % %

(

)

(

)

(

)

1 2 'Y Z G Z ' R X X ' Z G Z ' R X X ' Z G Z ' R X

β

− − _⎡ − _⎤ − − + _⎣ + _⎦ + % _%

(

)

(

)

(

)

}

' 'X ZGZ' R X X' ZGZ' R X X' ZGZ' R X

β

− _⎡ − _⎤− −

β

+ + _⎣ + _⎦ + % % e L’’,

(

)

{

}

(

)

1 '' ' ' ' 2 2

l o g

e L = −

ρ

K ⎡_⎣K Z G Z + R K ⎤_⎦− K

π

(

)

1 ' ' 2

lo g

e k Z G Z R K − +

(

)

{

}

1 ' ' ' ' 2 Y K K Z G Z R K K Y − ⎡ ⎤ − _⎣ + _⎦ % %

em que ρ simboliza o posto de uma matriz e k é a matriz que estabelece os contrastes linearmente independentes entre as partes aleatórias das observações. Martins et al. (1998), Searle et al. (1992) e Resende (2002a) detalham melhor esses procedimentos.

A maximização da função densidade de probabilidade referente aos efeitos aleatórios, em relação aos componentes de variância, elimina o viés resultante da perda de graus de liberdade na estimação dos efeitos fixos do modelo. Então, fica fácil notar que é uma verossimilhança associada aos resíduos. Essa verossimilhança é, por isso, chamada de máxima verossimilhança restrita ou residual (Camarinha Filho, 2002).

As vantagens do método REML no melhoramento de plantas, descritas por Resende (2007a), são as seguintes:

• pode ser aplicada a dados desbalanceados;

• é uma generalização do método ANOVA para contemplar situações mais complexas e também pode ser derivada sob o enfoque bayesiano, fato que confirma a sua generalidade;

• permite o ajuste de vários modelos alternativos, podendo-se escolher o que se ajusta melhor aos dados e, ao mesmo tempo, é parcimonioso (apresenta menor numero de parâmetros);

• lida com estruturas complexas de dados (medidas repetidas, diferentes anos, locais e delineamentos);

• utiliza simultaneamente grande número de informações provenientes de diferentes gerações, locais e idades, gerando estimativas e predições mais precisas;

• permite a estimação dos efeitos de dominância e epistáticos, como também os aditivos, pois utiliza maior número de informações de parentesco;

• compara indivíduos através do tempo e do espaço;

• possibilita a simultânea correção para os efeitos ambientais, estimação de componentes de variância e predição de valores genéticos.

Vários algoritmos computacionais para a obtenção de componentes de variância pelo método REML têm sido desenvolvidos, assim como comparações entre estes (Resende, 2007a). De modo geral, os algoritmos e os aplicativos mais utilizados têm sido EM, DF no DF-REML, AI no AI-REML, a combinação PX- EM/AI no aplicativo WOMBAT e AS no aplicativo ASREML. O aplicativo SELEGEN, utilizado para as análises neste trabalho, conforme Resende (2002a), combina o método de Takahashi e o método da bifatoração esparsa (SB) no algoritmo EM, ou seja, seu algoritmo é do tipo SB-EM.

O método da máxima verossimilhança restrita é realizado por iteração (repetição de uma ou mais ações) e, como ressalta Resende (2002a), a implementação computacional da metodologia de modelos mistos baseia-se fortemente em métodos de álgebra linear numérica para a obtenção iterativa das soluções das equações de modelo misto (obtenção do BLUP) e cálculo numérico

para a maximização/minimização de funções de várias variáveis, visando à obtenção das estimativas REML.

No processo iterativo, o ponto de máximo é obtido pela derivação da função densidade de probabilidade da parte referente aos efeitos aleatórios, em relação aos componentes de variância, solucionando-se, em seguida, o sistema de equações resultantes, de maneira iterativa. Esse processo é denominado de

expectation maximun ou REML–EM (maximização da esperança) (Martins,

1995). De acordo com este autor, esse método tem o inconveniente de exigir grande esforço computacional, se o número de dados for elevado.

O processo de Graser et al. (1987), conforme Martins (1995), é livre de derivação e, por isso, é denominado derivative free ou REML–DF. Esse método é próprio para dados de estrutura univariada, apresentando grande vantagem em relação ao de Patterson & Thompson (1971), mas, em dados de estrutura multivariada, fica comprometido, devido aos erros de arredondamento gerados durante a absorção (Lopes et al., 1998). Como o próprio nome indica, o algoritmo de Graser et al. (1987) não envolve derivação da função densidade de probabilidade, em relação aos componentes de variância, para o estabelecimento do sistema de equações a ser utilizado no processo iterativo (Martins et al., 1998). De acordo com esses autores, esse método é utilizado da seguinte maneira:

- avalia-se a função a partir de três valores iniciais de r, que é uma função da herdabilidade;

- calcula-se a equação quadrática que descreve L como uma função de r; - calcula-se o valor de r que maximiza L;

- recalcula-se a equação quadrática usando esse valor de r e os dois adjacentes dentre os três anteriores;

- repete-se o procedimento até que haja convergência no valor da herdabilidade, sendo h2_{= r/(1+r).}

De modo mais abrangente, conforme Patterson & Thompson (1971): • definir o modelo matemático misto de análise de variância dos dados; • estabelecer a função de verossimilhança, a qual permite estimar a

plausibilidade de o vetor de parâmetros explicar os dados observados. Esta função é proveniente do produtório das densidades associadas a cada observação da amostra aleatória. Vale lembrar que os termos da função de verossimilhança são semelhantes aos termos da função de distribuição normal, em que a média da amostra é substituída pelo valor esperado (y – Xb) e a variância, pela matriz V (matriz de variância e covariância dos dados) e que no termo constante dessa função é incluído o determinante da matriz V;

• aplica-se uma restrição na função de verossimilhança, que passa a ser subdividida em duas funções de densidade de probabilidade independentes, sendo uma relacionada aos efeitos fixos do modelo e a outra, aos efeitos aleatórios.

Como a função de verossimilhança envolve produto de termos, é conveniente transformá-la, mediante logaritmo.

• Para se obter a estimativa do valor máximo dessa função, deriva-se parcialmente em relação aos termos fixos, aleatórios e erro experimental, iguala-se a zero e resolvem-se os sistemas de equações. • O sistema de equações formado pelas derivadas não tem solução

explícita, ou seja, o estimador de cada componente está em função dos estimadores dos outros componentes. Neste ponto, é necessária a utilização de processo iterativo para se obter as estimativas de componentes de variância.

No processo iterativo, adotam-se valores iniciais aleatórios ou previamente selecionados, obtendo-se as primeiras estimativas de componentes de variância desejados. Com estes novos valores, repete-se a estimação. O

processo de iteração cessa quando os valores da penúltima estimação são praticamente iguais aos da última (cada software tem um critério de semelhança; p. e., o SELEGEN REML/BLUP é de 10-5_{ou 1/10}5_).

• Para constatar se as estimativas obtidas conferem ponto de máximo à função de verossimilhança, é necessário efetuar a segunda derivada em relação aos parâmetros e verificar se esta derivada é negativa. Se o for, a condição de máximo está satisfeita. A derivada segunda forma a matriz Hessiano (matriz H).

• As estimativas de componentes de variância são obtidas simultaneamente por processo de otimização, baseado em função de verossimilhança restrita, envolvendo iteração. Como já relatado, por esse método todas as estimativas são não negativas.

A literatura brasileira, assim como a mundial, é vasta em trabalhos com REML, especialmente os ligados à ciência estatística ou ao melhoramento animal e, mais recentemente, em plantas perenes e anuais. Porém, no Brasil, o uso desta metodologia em plantas anuais ainda é raro, apesar dos avanços em plantas perenes. No melhoramento do café, Resende et al. (2001) aplicaram o método REML/BLUP na estimação de parâmetros genéticos e predição de valores genotípicos. Pelos resultados obtidos, os autores concluíram que o método se mostrou adequado à estimação de parâmetros genéticos e predição de valores genotípicos no melhoramento do cafeeiro, podendo ser empregado rotineiramente.

Em um trabalho com Pinus, Resende et al. (1996) comparam três procedimentos de estimação de componentes de variância, visando à predição de valores genéticos, a saber: quadrados mínimos (LS), máxima verossimilhança (ML) e máxima verossimilhança restrita (REML), e concluíram que REML foi o mais preciso.

Barbosa et al. (2005) utilizaram REML/BLUP na seleção de famílias e de genitores e concluíram que componentes de médias estimados via BLUP possibilitaram a seleção de famílias e de genitores superiores.

2.4 Avaliação de adaptabilidade e estabilidade genotípica usando modelos

No documento TESE_Avaliação genotípica de linhagens de arroz de terras altas via metodologia de modelos mistos (páginas 40-48)