Análise de Modelos Estatísticos no Estudo Genético Quantitativo da Longevidade de Vacas da Raça Nelore
Eliane Carolina Almeida Rizzo1 Henrique Nunes Oliveira2 Alencariano José da Silva Falcão1
1 - Introdução
Nos sistemas de produção de bovinos de corte, a longevidade das matrizes tem um efeito significativo sobre a eficiência econômica da atividade. Para um rebanho ser rentável, o número de vacas que permanecem em produção, acima da idade em que seus custos de recria e manutenção foram pagos, devem compensar aquelas descartadas prematuramente (SNELLING et al., 1995). O aumento da longevidade das vacas reduz os custos de produção anual decorrentes do aumento da taxa de reposição, aumenta o número de vacas adultas produtivas e reduz o descarte involuntário. O principal problema relacionado com as medidas das características indicadoras de longevidade, como o tempo de vida produtiva da vaca no rebanho, é a necessidade de que o animal seja descartado para expressar a característica. Como, via de regra, isto não é viável uma vez que a avaliação dos animais seria extremamente tardia, vários animais ainda estarão no rebanho ao final do período estudado e então os dados são censurados.
As técnicas de análise de sobrevivência pode combinar registros completos de animais que não estão mais no rebanho ou que completaram seu ciclo de vida útil e dados censurados de animais ainda em reprodução, muito utilizada para estudar a ocorrência de eventos ao longo do tempo, permitindo o tratamento adequado de dados censurados.
O objetivo deste estudo foi fazer o estudo genético quantitativo da longevidade em fêmeas da raça nelore, empregando diferentes metodologias de análise com ou sem dados censurados.
2 - Material e métodos
Foram utilizados 58.835 dados de fêmeas da raça Nelore, nascidas entre 1985 e 2012, criadas exclusivamente em regime de pasto em fazendas dos estados do Tocantins, Pará, Acre e Roraima. A habilidade de permanência (HP) e o tempo em que a vaca permanecia no rebanho
1 EMVZ-UFT, elianerizzootecnista@yahoo.com.br
2 UNESP-Jaboticabal, oliveira.hn@gmail.com
1 EMVZ-UFT, alencariano@uft.edu.br
produzindo (TP) foram usadas como características indicadoras da longevidade. A HP foi definida como uma variável binária onde se atribuiu 1 para vacas que permaneceram no rebanho até os seis anos e que haviam parido ao menos três vezes e zero para as vacas que tiveram menos de três partos no rebanho. A longevidade também foi definida pelo tempo em que a vaca permanecia no rebanho produzindo. A data do último parto no rebanho foi considerada para cálculo da idade da vaca ao descarte.
Três modelos para análise de longevidade foram comparados: modelo de limiar (ML), modelo linear bayesiano censurado (MBC) e análise de sobrevivência com distribuição de Weibull com (MWC) e sem covariável (MWS) de tempo dependente. Para o modelo de limiar, utilizou-se a definição de HP, enquanto que para os modelos bayesiano e de sobrevivência, a longevidade foi considerada como o tempo, em dias, em que a vaca permanece no rebanho produzindo. A covariável de tempo dependente foi definida pela verificação gráfica da distribuição de Weibull, onde os diferentes períodos verificados na curva, definiram o efeito fixo de tempo-dependente (período).
No ML assume-se que a escala subjacente apresenta distribuição contínua, sendo representada como:
U
/
q
~
N
(
Wq
,
Is
e2)
, em que, U é o vetor da escala base de ordem r;q=(b,s) é vetor dos parâmetros de locação; W é a matriz de incidência conhecida; I é uma matriz de incidência e
s
e2 é a variância residual. Dado que a variável na distribuição subjacente não éobservável, a parametrização
s
e2=1 é, geralmente, adotada no sentido de se obteridentiafibilidade na função de verossimilhança (GIANOLA; SORENSEN, 2002). As análises foram realizadas utilizando o programa THRGIBBSF90 (MISZTAL, 2012), o qual implementa o amostrador de Gibbs. Foi gerada uma cadeia de 400.000 amostras, com burn-in de 40.000 ciclos e intervalo de coleta a cada 10 amostras. O diagnóstico de convergência foi realizado por inspeções gráficas e pelo teste de Geweke (1992).
A metodologia aplicada em dados censurados em modelos lineares, usando inferência bayesiana, consistiu na aplicação de uma distribuição normal truncada à metodologia de aumento de dados
(GONZALEZ-RÉCIO et al., 2006) de forma que:
∏
N 1 + q = i 2 e ' u , i ' h , i i i i 0 2 u 2 h 2 e i|
β
,
h
,
u
,
σ
,
σ
,
σ
,
y
=
l
(
w
≥
c
)
N
(
x
β
+
z
h
+
z
u
,
σ
)
w
[III], em queβ
é ovetor de efeitos sistemáticos; h e u são os vetores de efeitos aleatórios de rebanho e touro, respectivamente; x’i, z’i,h e z’i,u são vetores linhas de incidência que relacionam
β
, h e u com yo;yo é o vetor de registros observadose w é o vetor de registros aumentados não observados; ci são
os valores censurados observados; q e N são número de dados não censurados e total de registros, respectivamente; l é uma matriz indicadora, assumindo o valor 1 se i registros
aumentados forem maiores que ci e 0 caso contrário; 2 e
σ
é a variância residual;σ
2ué a variânciade rebanho e
σ
2hé a variância do touro. A análise foi realizada gerando uma cadeia de 200.000iterações, considerando um período de burn-in de 50.000 amostras. A herdabilidade foi calculada como segue,
h
(
j
)
=
σ
(
j
)
+
4
σ
σ
(
(
j
j
)
)
+
σ
2(
j
)
e 2 h 2 u 2 u 2 , em que j = 1,..., 150.000 é a amostra proveniente da distribuição a posteriori dos componentes de variância correspondentes.
O modelo utilizado para a análise de sobrevivência foi o modelo de risco proporcional de Cox, sendo o risco base dado por uma distribuição Weibull, dado por:
( )
t exp{z(t)'β} λ = ) z ; t (λ 0 , em que, λ(t;z) é a função de risco do animal (probabilidade
instantânea do descarte) para uma dada vaca no tempo t; t é o tempo (em dias) do primeiro parto até a morte, descarte ou censura; λ0(t) é a função de risco base (relacionada ao envelhecimento
do animal), expressa por p 1 0(t) p( t)
−
=λ λ
λ no caso em que t segue a distribuição de Weibull com parâmetros de escala e forma λ e ρ, respectivamente. Estas análises foi utilizado o programa Survival Kit versão 3.12 (DUCROCQ; SOLKNER, 1998).
3 - Resultados e discussões
De acordo com Figura 1, pode-se verificar que as cadeias geradas para o ML apresentaram-se mais consistentes, quando comparadas ao MBC, em virtude da maior auto-correlação entre as amostras neste último modelo, o que também implica em um menor número de amostras efetivas. Além disso, as cadeias geradas para todos os parâmetros do ML oscilaram menos em torno das médias a posteriori que nos modelos MBC.
A análise gráfica do modelo de Weibull (Figura 2) mostrou que não ocorreu linearidade, entretanto foi possível distinguir dois períodos distintos em que a linearidade poderia ser grosseiramente considerada. A delimitação entre estes períodos foi feita em log(período)=7 correspondente ao período de 1.100 dias. Esta variável foi incluída no modelo como um efeito fixo tempo-dependente que permite levar em consideração um mesmo ρ para todo o período, mas com médias distintas.
Quando são analisados apenas os modelos de sobrevivência, dados pela distribuição de risco de Weibull, os parâmetros ρ obtidos nos dois modelos (MWC e MWS) mostram valores maiores que 1, demonstrando que, como esperado, a taxa de risco aumenta com o tempo. O parâmetro ρ está associado à inclinação da curva determinando a taxa de risco de um animal ser descartado. A variável tempo dependente incluída no modelo permite um ajuste melhor do modelo, uma vez que para um único valor de ρ ajusta inclinações diferentes em períodos
diferentes, conforme pode ser observado na Figura 2. Quando a covariável de tempo dependente não é considerada no modelo, esta inclinação é maior, indicando um risco subestimado no primeiro período e superestimado no segundo.
Ao comparar-se os modelos de sobrevivência com o modelo de limiar e o linear bayesiano censurado, os valores de herdabilidade foram próximos para o modelo de sobrevivência e para o de ML (0,15 e 0,22, respectivamente) e inferiores para o modelo linear bayesiano censurado (0,07). Comparando-se os modelos por meio dos valores genéticos (VG), obtidos utilizando os diferentes modelos, verifica-se uma forte associação entre as predições (Figura 3) para as diferentes metodologias, a exceção das relações que envolvem a ML. Os menores valores de correlação encontrados, quando se relacionam os VG’s preditos por meio do ML, pode ser primeiramente explicado pelo fato desta metodologia não ser baseada em análises de dados censurados, embora seja uma metodologia para analise de longevidade. Outro ponto que deve contribuir é a definição de ML empregada, na qual não se leva em consideração apenas o tempo de permanência, mas também um componente relacionado à produtividade.
4 – Conclusões
As estimativas de herdabilidade do modelo limiar e do modelo de sobrevivência, indicam que a característica longevidade na raça Nelore, apresenta de médio a alto potencial de resposta à seleção. Quanto ao modelo bayesiano censurado indica herdabilidade baixa.
Os valores altos de correlação entre os valores genéticos utilizando a metodologia de aumento de dados em métodos bayesianos e os modelos de Weibull indicam que ambas apresentam resultados similares na análise de dados censurados, de forma que ambos tendem a selecionar os mesmos animais.
5 – Bibliografia
SNELLING, W.M.; GOLDEN, B.L.; BOURDON, R.M. Within-herd genetic analyses of stayability of beef females. Journal of Animal Science, v.73, p.993-1001, 1995.
GIANOLA D.; SORENSEN, D. Likelihood, Bayesian, and MCMC methods in quantitative genetics.Statistics for Biology and Health. Springer. 2.ed, 740p, 2002.
MISZTAL, I. [2007]. BLUPF90 family of programs. Disponível em <http://nce.ads.uga.edu/~ignancy/ newprograms.html>. Acesso em: 12/10/2012.
GONZALÉZ- RECIO,O.; CHANG, Y.M.; GIANOLA, D.; WEIGEL, K. A. Comparison of models using different censoring scenarios for days open in Spanish Holstein cows. British Society of Animal Science. v.82, p.233–239, 2006.
DUCROCQ, V.; SOLKNER, J. The survival kit (v. 3.0): a Fortran package for the analysis of survival data. In: WORLD CONGRESS OF GENETIC APPLIED TO LIVESTOCK PRODUCTION, 6. Australia. Proceedings. Armidale,1998.
σS2 σ2R h2
Figura 1- Traço das cadeias geradas pelo amostrador de Gibbs dos parâmetros estimados nos modelos MBC e ML. 2
S
σ =variância de touro;
σ
R2= variância residual; h2= herdabilidade.Figura 2 – Dispersão de log[-log S(t)] em função de log t (tempos) para a longevidade, em que S(t) é função de
sobrevivência pelo estimador de Kaplan-Meier, onde a linha vertical delimita período de linearidade.
MBC/WSC MBC/WCC MBC/ML -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 -0,40 -0,30 -0,20 -0,10 0,00 0,10 0,20 0,30 0,40 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 WSC/ML WCC/ML WSC/WCC -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8
Figura 3 – correlação dos valores genéticos dos modelos bayesiano censurado (MBC), modelo de Weibull sem censura (WSC), modelo de Weibull com cencura (WCC).
MBC