REFINAMENTOS PARA TESTES DE HIP ´OTESES
NO MODELO DE REGRESS ˜AO DE WEIBULL
Michel Ferreira da Silva
Departamento de Estat´ıstica, ICEx, Universidade Federal de Minas Gerais Campus Pampulha, Belo Horizonte/MG, CEP 31270-901
email: michel@est.ufmg.br Silvia L.P. Ferrari
Departamento de Estat´ıstica, IME, Universidade de S˜ao Paulo Caixa Postal 66281, S˜ao Paulo/SP, CEP 05311–970
email: sferrari@ime.usp.br Francisco Cribari–Neto
Departamento de Estat´ıstica, CCEN, Universidade Federal de Pernambuco Cidade Universit´aria, Recife/PE, CEP 50740–540
email: cribari@ufpe.br
RESUMO
Este trabalho apresenta v´arios m´etodos de melhorias para testes da raz˜ao de verossi-milhan¸cas sobre os coeficientes do modelo de regress˜ao de Weibull, considerando dados completos e censurados. Simulaes de Monte Carlo s˜ao realizadas a fim de comparar os seguintes testes: teste usual (sem corre¸c˜ao), testes baseados em verossimilhan¸cas perfiladas ajustadas, testes modificados por corre¸c˜oes de Bartlett e testes baseados no m´etodo boot-strap. Os resultados num´ericos apresentados sugerem que o teste obtido da verossimilhan¸ca perfilada ajustada proposta em Fraser e Reid (1995) e Fraser et al. (1999) supera o teste da raz˜ao de verossimilhan¸cas usual.
PALAVRAS CHAVE. Modelo de Weibull. Teste da raz˜ao de verossimilhan¸cas.
Verossimilhan¸cas perfiladas ajustadas. EST-Estat´ıstica.
ABSTRACT
This paper presents several methods to improve likelihood ratio tests on the Weibull regression coefficients with noncensored and censored data. Monte Carlo simulations are carried out in order to compare the following tests: usual test (without correction), the ones based on adjusted profile likelihoods, the ones obtained by Bartlett corrections and the ones based on bootstrap method. The numerical results shown suggest that the test based on adjusted profile likelihood proposed in Fraser and Reid (1995) and by Fraser et al. (1999) outperforms the usual test.
KEYWORDS. Adjusted profile likelihoods. Likelihood ratio test. Weibull
1. Introdu¸c˜ao
Quando o interesse ´e o tempo at´e a ocorrˆencia de um determinado evento (tempo de falha), como, por exemplo, a falha de um componente eletrˆonico ou a morte de um paciente, freq¨uentemente existem observa¸c˜oes censuradas, principal caracter´ıstica de dados de sobrevivˆencia. Modelos param´etricos consistem em distribui¸c˜oes de probabilidade para o tempo de falha e s˜ao usados com freq¨uˆencia na ´area industrial. A distribui¸c˜ao de Weibull ´e largamente utilizada em confiabilidade por causa da sua flexibilidade em modelar taxas de falhas crescente, decrescente e constante, dependendo do valor do seu parˆametro de forma. Para algumas aplica¸c˜oes, ver Mann et al. (1974), Gross & Clark (1975), Lawless (1982) e Klein & Moeschberger (1997).
Os estudos na ´area m´edica muitas vezes envolvem covari´aveis que podem estar rela-cionadas com o tempo de sobrevivˆencia. Em v´arias situa¸c˜oes, fatores de heterogeneidade s˜ao medidos em componentes industriais e devem ser incorporados na an´alise estat´ıstica dos dados. A forma mais eficiente de acomodar o efeito destas covari´aveis ´e utilizar um modelo de regress˜ao apropriado para dados censurados.
Em muitas aplica¸c˜oes, uma estrutura de regress˜ao ´e usada para modelar a dependˆencia do parˆametro de escala da distribui¸c˜ao de Weibull, α, com rela¸c˜ao a covariadas, produzindo o que ´e conhecido como modelo de regress˜ao de Weibull. Assim, seja t ∼ W (α(x), β), onde x = (x1, x2, . . . , xp) ´e uma cole¸c˜ao de covari´aveis e W (α, β) denota uma distribui¸c˜ao de
Weibull com parˆametro de forma β e parˆametro de escala α. Por conseguinte, log t = y ∼ V E(η(x), σ), ou seja, y tem distribui¸c˜ao valor extremo com parˆametros de loca¸c˜ao η(x) e de escala σ, mais precisamente,
y = log t = η(x) + σϑ, (1)
onde ϑ ∼ V E(0, 1). A fun¸c˜ao de densidade de y ´e dada por
p(y; η(x), σ) = 1 σexp ½ y − η(x) σ − exp µ y − η(x) σ ¶¾ ,
em que −∞ < y < ∞, η(x) = log α(x) e σ = β−1. A fun¸c˜ao distribui¸c˜ao ´e F (y; η(x), σ) =
1 − R(y; η(x), σ), onde R(y; η(x), σ) = exp ( − exp " y − η(x) σ #)
´e a fun¸c˜ao de confiabilidade (ou de sobrevivˆencia). Neste trabalho, η(x) = xφ, onde φ = (φ1, φ2, . . . , φp)>. Da rela¸c˜ao (1), observe que t = tx= exp(η(x)) × exp(σϑ) = exp(xφ) × t0. Assim, se xφ < 0, ent˜ao tx< t0; isto ´e, as covariadas “aceleram” o tempo at´e a falha. Por isto, tal modelo ´e conhecido como modelo de tempo de vida acelerado.
Os parˆametros que indexam o modelo podem ser estimados pelo m´etodo da m´axima verossimilhan¸ca. Contudo, em pequenas amostras, os estimadores resultantes podem ser consideravelmente viesados e os testes da raz˜ao de verossimilhan¸cas podem apresentar dis-tor¸c˜oes de tamanho (probabilidade do erro tipo I) substanciais.
Um procedimento comumente utilizado quando o modelo a ser ajustado envolve a estima¸c˜ao de parˆametros de perturba¸c˜ao ´e a elimina¸c˜ao de tais parˆametros substituindo-os na fun¸c˜ao de verossimilhan¸ca por suas respectivas estimativas de m´axima verossimilhan-¸ca para valores fixados dos parˆametros de interesse. A fun¸c˜ao resultante, chamada de fun¸c˜ao de verossimilhan¸ca perfilada, depende, portanto, somente dos parˆametros de inte-resse. Evidentemente, essa fun¸c˜ao de verossimilhan¸ca n˜ao ´e uma verossimilhan¸ca genu´ına e, assim, n˜ao possui propriedades b´asicas de fun¸c˜oes de verossimilhan¸ca. Por exemplo, a fun¸c˜ao escore n˜ao tem necessariamente m´edia nula e a igualdade da informa¸c˜ao pode n˜ao ser obedecida. Isto pode acarretar alguns problemas, como, por exemplo, inconsistˆencia e ineficiˆencia de estimadores. Outro problema comum refere-se `a aproxima¸c˜ao usual da distribui¸c˜ao da estat´ıstica da raz˜ao de verossimilhan¸cas pela distribui¸c˜ao qui-quadrado,
que, dependendo da quantidade de parˆametros de perturba¸c˜ao, pode ser bastante pobre. Desta forma, torna-se importante obter ajustes para tal fun¸c˜ao. V´arios pesquisadores, incluindo Barndorff–Nielsen (1983), Cox & Reid (1987), McCullagh & Tibishirani (1990) e Stern (1997), propuseram ajustes `a fun¸c˜ao de verossimilhan¸ca perfilada. Paralelamente a estes trabalhos, DiCiccio & Stern (1994) mostraram que ´e poss´ıvel obter corre¸c˜ao de Bartlett para a estat´ıstica da raz˜ao de verossimilhan¸cas proveniente de uma verossimilhan¸ca perfilada ajustada. O objetivo desta corre¸c˜ao ´e a redu¸c˜ao na distor¸c˜ao de tamanho do teste em amostras de tamanho t´ıpico atrav´es de uma acelera¸c˜ao da taxa de convergˆencia do tamanho verdadeiro para o tamanho nominal (assint´otico).
Este trabalho consiste de um estudo de v´arios m´etodos de melhorias para testes da raz˜ao de verossimilhan¸cas sobre os parˆametros da parte sistem´atica do modelo de regress˜ao de Weibull. Aqui y1, . . . , yns˜ao vari´aveis aleat´orias independentes com distribui¸c˜oes valores
extremos de parˆametros de loca¸c˜ao xjφ e de escala σ, para j = 1, . . . , n. Neste texto, y
denota tanto a vari´avel aleat´oria quanto seu valor observado.
Dentro deste contexto, s˜ao estudados ajustamentos da verossimilhan¸ca perfilada e obti-das corre¸c˜oes de Bartlett para as estat´ısticas da raz˜ao de verossimilhan¸cas correspondentes. Simula¸c˜oes de Monte Carlo s˜ao realizadas a fim de comparar os desempenhos do teste origi-nal (sem corre¸c˜ao), dos testes baseados em verossimilhan¸cas perfiladas ajustadas, dos testes modificados por corre¸c˜oes de Bartlett e do teste que emprega valor cr´ıtico proveniente de um esquema de bootstrap. O bootstrap consiste de um esquema de reamostragem dos dados (sob a hip´otese nula em teste) realizado um grande n´umero de vezes a fim de se estimar, a partir das v´arias realiza¸c˜oes, alguma caracter´ıstica de interesse da quantidade sob estudo (ver Efron & Tibshirani, 1993). Aqui o interesse reside na obten¸c˜ao de um valor cr´ıtico correspondente a um n´ıvel de significˆancia predeterminado a partir da distribui¸c˜ao nula estimada com base no esquema iterativo de constru¸c˜ao de pseudo-amostras e poste-rior constru¸c˜ao da quantidade de interesse para cada uma destas amostras. Os resultados num´ericos s˜ao indicativos dos m´eritos relativos de cada um dos m´etodos. S˜ao gerados dados completos e dados censurados. Tamb´em ´e realizada uma aplica¸c˜ao com dados reais. 2. Resultados Num´ericos
Esta se¸c˜ao apresenta alguns resultados num´ericos relativos a testes da raz˜ao de veros-similhan¸cas realizados sobre o vetor param´etrico φ. Todas as simula¸c˜oes foram realizadas usando a linguagem de programa¸c˜ao matricial Ox (Doornik, 2001). Esses resultados s˜ao baseados em 10000 (dez mil) amostras de Monte Carlo. Foram considerados dois mode-los de regress˜ao, denominados modelo 1 e modelo 2, cujas partes sistem´aticas s˜ao dadas, respectivamente, por
η(x) = φ1+ φ2x2 e η(x) = φ1+ φ2x2+ φ3x3+ φ4x4.
Por economia de espa¸co, entre as alternativas ao teste da raz˜ao de verossimilhan¸cas original, denotado por `, s˜ao mostrados apenas resultados relativos ao teste baseado numa aproxima¸c˜ao para o ajuste proposto em Barndorff-Nielsen (1983), denotado aqui por ˜`BN.
A verossimilhan¸ca perfilada modificada proposta em Barndorff-Nielsen (1983) ´e freq¨ uen-temente dif´ıcil de ser calculada, por isso v´arias propostas de aproxima¸c˜ao desta fun¸c˜ao foram desenvolvidas e algumas destas est˜ao descritas em Severini (2000). Aqui ´e usada a aproxima¸c˜ao derivada dos resultados de Fraser & Reid (1995) e Fraser et al. (1999).
Considerando o modelo 1, os valores atribu´ıdos a x2 s˜ao realiza¸c˜oes independentes de uma vari´avel aleat´oria com distribui¸c˜ao uniforme cont´ınua U (0, 100). Os resultados s˜ao baseados numa amostra de tamanho n = 20 e, para dados censurados, s˜ao considerados dois n´ıveis de censura: 25% e 50%. Aqui σ = 1 (modelo exponencial), assim como todos os componentes do vetor φ, φi= 1 ∀i.
Para dados com presen¸ca de censura do tipo II, (n, r) = (20, 10), onde r ´e o n´umero de falhas, a Tabela 1 apresenta taxas de rejei¸c˜ao sob a hip´otese nula de diferentes testes da raz˜ao de verossimilhan¸cas com distintos n´ıveis de significˆancia. Note que os testes baseados em ˜`BN apresentaram taxas mais pr´oximas aos n´ıveis nominais. Por exemplo,
Tabela 1. Taxas de rejei¸c˜ao da hip´otese nula de diferentes testes da raz˜ao de verossimilhan¸cas, σ = 1, dados censurados tipo II, (n, r) = (20, 10). modelo 1 n´ıvel nominal H0 : φ2= 1 H0 : φ1 = φ2= 1 ` ˜`BN ` ˜`BN 10% 15.530 9.060 16.170 10.570 5% 9.020 4.420 9.650 5.470 1% 2.420 0.700 2.690 1.140 0.1% 0.330 0.020 0.390 0.100
para H0 : φ1 = φ2 = 1 e n´ıvel de significˆancia de 0.1%, tal teste apresentou taxa igual ao n´ıvel nominal, enquanto o teste original apresentou taxa igual a 0.390%.
Supondo qualquer uma das verossimilhan¸cas e denotando o quantil amostral de ordem q do conjunto de valores da respectiva estat´ıstica de teste por RV (q) e o correspondente quan-til da distribui¸c˜ao qui-quadrado limite por χ2(q), a discrepˆancia relativa entre os quantis amostrais e assint´oticos das estat´ısticas de teste ´e definida como [RV (q) − χ2(q)]/χ2(q).
O gr´afico da Figura 1 apresenta as curvas de discrepˆancias relativas de quantis das estat´ısticas de teste baseadas na verossimilhan¸ca original ` (original) e no ajuste sobre a verossimilhan¸ca perfilada denotado por ˜`BN (aprox BN), cuja curva, por estar mais pr´oxima `a ordenada nula, ratifica os resultados da Tabela 1, como a melhor aproxima¸c˜ao da dis-tribui¸c˜ao nula da estat´ıstica de teste pela disdis-tribui¸c˜ao qui-quadrado.
Figura 1. Gr´afico das discrepˆancias relativas de quantis, σ = 1,
η(x) = φ1+ φ2x2, H0 : φ1 = φ2 = 1, dados censurados tipo II,
(n, r) = (20, 10). 2 4 6 8 10 12 0.00 0.05 0.10 0.15 0.20 0.25 0.30 quantil assintotico
discrepancia relativa de quantis
original aprox BN
Agora considere dados com presen¸ca de censura do tipo I. Diferentemente dos dados com censura do tipo II, n˜ao ´e poss´ıvel fixar o n´umero de falhas numa amostra Monte Carlo, ou seja, a propor¸c˜ao de observa¸c˜oes censuradas. Assim, empiricamente, foi usada a seguinte express˜ao para c (tempo de censura): c = α[1−p]( − log p)1/β, onde α[1−p] denota o quantil
Tabela 2. Taxas de rejei¸c˜ao da hip´otese nula de diferentes testes da raz˜ao de verossimilhan¸cas, σ = 1, dados censurados tipo I, n = 20,
p = 0.25. modelo 1 n´ıvel nominal H0 : φ2= 1 H0 : φ1 = φ2= 1 ` ˜`BN ` ˜`BN 10% 13.590 9.600 13.020 8.440 5% 7.420 4.790 7.540 4.230 1% 1.830 0.910 1.710 0.650 0.1% 0.220 0.070 0.250 0.060
amostral de ordem (1 − p) do conjunto {α(x1), . . . , α(xn)} e p, a propor¸c˜ao nominal de censura desejada.
Ainda sob o modelo exponencial, para p = 0.25, a Tabela 2 apresenta taxas de rejei¸c˜ao sob a hip´otese nula de diferentes testes da raz˜ao de verossimilhan¸cas com distintos n´ıveis de significˆancia. Note que os testes baseados em ˜`BN apresentaram taxas mais pr´oximas aos
n´ıveis nominais. Por exemplo, para H0 : φ1 = φ2 = 1 e n´ıvel de significˆancia de 10%, tal teste apresentou taxa igual a 8.440% (conservador), enquanto o teste original apresentou taxa igual a 13.020% (liberal).
O gr´afico da Figura 2 apresenta as curvas de discrepˆancias relativas de quantis das estat´ısticas de teste. Note que a distribui¸c˜ao nula da estat´ıstica de teste baseada em ˜`BN
(aprox BN) ´e bem aproximada pela distribui¸c˜ao qui-quadrado χ2 2.
Figura 2. Gr´afico das discrepˆancias relativas de quantis, σ = 1,
η(x) = φ1+ φ2x2, H0 : φ1 = φ2 = 1, dados censurados tipo I, p = 0.25. 2 4 6 8 10 12 −0.10 −0.05 0.00 0.05 0.10 0.15 quantil assintotico
discrepancia relativa de quantis
original aprox BN
Para o modelo 2 e dados com presen¸ca de censura do tipo II (n´ıvel de censura = 30%, n = 50), a Tabela 3 apresenta taxas de rejei¸c˜ao sob a hip´otese nula de diferentes testes da raz˜ao de verossimilhan¸cas com distintos n´ıveis de significˆancia. Para σ = 2 (β = 0.5), os valores das covariadas x2, x3 e x4 s˜ao realiza¸c˜oes independentes de uma vari´avel aleat´oria com distribui¸c˜ao de Cauchy, enquanto para σ = 0.2 (β = 5), s˜ao realiza¸c˜oes de uma vari´avel
aleat´oria com distribui¸c˜ao uniforme cont´ınua U (0, 100). A utiliza¸c˜ao de observa¸c˜oes de uma vari´avel com distribui¸c˜ao de Cauchy na matriz de especifica¸c˜ao do modelo X tem, por objetivo, gerar um conjunto de dados com a presen¸ca de pontos de alavanca. Aqui φi = 3 ∀i.
Para σ = 2, note as deteriora¸c˜oes das taxas de rejei¸c˜ao dos testes baseados em ˜`BN com o aumento do n´umero de parˆametros testados. Isto n˜ao ocorre quando σ = 0.2
(x2, x3, x4 ∼ U (0, 100)). Neste caso, os resultados s˜ao semelhantes `as situa¸c˜oes em que
σ = 1 (modelo exponencial) e φi = 1 ∀i. Observe que os testes baseados em ˜`BN
apresen-taram desempenhos superiores aos testes usuais.
Tabela 3. Taxas de rejei¸c˜ao da hip´otese nula de diferentes testes da raz˜ao de verossimilhan-¸cas, dados censurados tipo II, (n, r) = (50, 35).
modelo 2 σ n´ıvel nominal H0: φ4= 3 H0: φ3= φ4= 3 H0: φ2= φ3= φ4= 3 ` ˜`BN ` ˜`BN ` ˜`BN 2 10% 12.640 9.880 15.100 12.080 15.060 12.620 5% 7.440 5.140 8.340 6.260 8.580 6.780 1% 1.920 1.160 2.140 1.300 2.220 1.580 0.1% 0.380 0.140 0.280 0.120 0.340 0.200 0.2 10% 13.420 10.220 13.500 9.620 12.980 10.040 5% 7.320 5.160 7.100 4.860 7.500 5.520 1% 1.880 1.060 1.920 0.920 1.720 1.200 0.1% 0.220 0.120 0.240 0.100 0.160 0.120 3. Conclus˜oes
Na se¸c˜ao anterior, os testes baseados em ˜`BN apresentaram taxas de rejei¸c˜ao sob a
hip´otese nula mais pr´oximas aos n´ıveis nominais. Os testes baseados em ` rejeitaram demais.
Portanto, considerando observa¸c˜oes independentes, mas n˜ao identicamente distribu´ı-das, ao realizar testes sobre os parˆametros da parte sistem´atica do modelo de regress˜ao de Weibull, resultados satisfat´orios podem ser obtidos a partir de testes da raz˜ao de verossimi-lhan¸cas baseados no ajuste proposto por Fraser & Reid (1995) e Fraser et al. (1999). Vale destacar que tal ajuste n˜ao requer a ortogonalidade dos parˆametros de interesse e de incˆomodo, diferentemente do ajuste derivado em Cox & Reid (1987), e nem a especifica¸c˜ao de uma estat´ıstica ancilar, exigida pelo ajuste apresentado em Barndorff-Nielsen (1983).
Para pesquisas futuras, seria interessante obter ajustes similares para extens˜oes da tradicional distribui¸c˜ao de Weibull biparam´etrica. Em Lai et al. (2004), s˜ao descritas, de maneira unificada, algumas dessas extens˜oes; ver tamb´em Murthy et al. (2003), Xie et al. (2003) e Xie et al. (2002).
Referˆencias Bibliogr´aficas
Barndorff-Nielsen, O.E. (1983). On a formula for the distribution of the maximum likelihood estimator. Biometrika, 70, 343–365.
Cox, D.R. & Reid, N. (1987). Parameter orthogonality and approximate conditional inference. Journal of the Royal Statistical Society B, 49, 1–39.
DiCiccio, T.J. & Stern, S.E. (1994). Frequentist and Bayesian Bartlett correction of test statistics based on adjusted profile likelihoods. Journal of the Royal Statistical Society B, 56, 397–498.
Doornik, J.A. (2001). Ox: an Object-oriented Matrix Programming Language, 4th edi-tion. London: Timberlake Consultants and Oxford: http://www.doornik.com.
Efron, B. & Tibshirani, R.J. (1993). An Introduction to the Bootstrap. New York: Chapman & Hall.
Fraser, D.A.S. & Reid, N. (1995). Ancillaries and third-order significance. Utilitas Mathematica, 47, 33–53.
Fraser, D.A.S., Reid, N., Wu, J. (1999). A simple formula for tail probabilities for frequentist and Bayesian inference. Biometrika, 86, 655–661.
Gross, A.J. & Clark, V.A. (1975). Survival Distribution: Reliability Applications in the Biomedical Sciences. New York: Wiley.
Klein, J.P. & Moeschberger, M. (1997). Survival Analysis. New York: Springer– Verlag.
Lai, C.D., Zhang, L., Xie, M. (2004). Mean residual life and other properties of Weibull related bathtub shape failure rate distributions. International Journal of Reliability, Qual-ity and Safety Engineering, 11, 113–132.
Lawless, J.F. (1982). Statistical Models and Methods for Lifetime Data. New York: Wiley. Mann, N.R., Schafer, R.E., Singpurwalla, N.D. (1974). Methods for Statistical Anal-ysis and Reliability and Life Data. New York: Wiley.
McCullagh, P. & Tibishirani, R. (1990). A simple method for the adjustment of profile likelihood. Journal of the Royal Statistical Society B, 52, 325–344.
Murthy, D.N.P., Xie, M., Jiang, R. (2003). Weibull Models. New York: Wiley. Severini, T.A. (2000). Likelihood Methods in Statistics. Oxford: Oxford University Press. Stern, S.E. (1997). A second-order adjustment to the profile likelihood in the case of a multidimensional parameter of interest. Journal of the Royal Statistical Society B, 59, 653–665.
Xie, M., Goh, T.N., Tang, Y. (2002). A modified Weibull extension with bathtub-shapedfailure rate function. Reliability Engineering and Systems Safety, 76, 279–285. Xie, M., Lai, C.D., Murthy, D.N.P. (2003). Weibull-related distributions with bathtub shaped failure rate functions. In: Mathematical and Statistical Methods in Reliability, vol. 7, eds. K. Doksum and B. Lindqvist, Singapore: World Scientific Publishing Co., 283–297.