RESUMO. PALAVRAS CHAVE. Modelo de Weibull. Teste da razão de verossimilhanças. Verossimilhanças perfiladas ajustadas. EST-Estatística.

(1)

REFINAMENTOS PARA TESTES DE HIP ´OTESES

NO MODELO DE REGRESS ˜AO DE WEIBULL

Michel Ferreira da Silva

Departamento de Estat´ıstica, ICEx, Universidade Federal de Minas Gerais Campus Pampulha, Belo Horizonte/MG, CEP 31270-901

email: michel@est.ufmg.br Silvia L.P. Ferrari

Departamento de Estat´ıstica, IME, Universidade de S˜ao Paulo Caixa Postal 66281, S˜ao Paulo/SP, CEP 05311–970

email: sferrari@ime.usp.br Francisco Cribari–Neto

Departamento de Estat´ıstica, CCEN, Universidade Federal de Pernambuco Cidade Universit´aria, Recife/PE, CEP 50740–540

email: cribari@ufpe.br

RESUMO

Este trabalho apresenta vários métodos de melhorias para testes da razão de verossi-milhan¸cas sobre os coeficientes do modelo de regressão de Weibull, considerando dados completos e censurados. Simulaes de Monte Carlo são realizadas a fim de comparar os seguintes testes: teste usual (sem corre¸cão), testes baseados em verossimilhan¸cas perfiladas ajustadas, testes modificados por corre¸cões de Bartlett e testes baseados no método boot-strap. Os resultados numéricos apresentados sugerem que o teste obtido da verossimilhan¸ca perfilada ajustada proposta em Fraser e Reid (1995) e Fraser et al. (1999) supera o teste da razão de verossimilhan¸cas usual.

PALAVRAS CHAVE. Modelo de Weibull. Teste da raz˜ao de verossimilhan¸cas.

Verossimilhan¸cas perfiladas ajustadas. EST-Estat´ıstica.

ABSTRACT

This paper presents several methods to improve likelihood ratio tests on the Weibull regression coefficients with noncensored and censored data. Monte Carlo simulations are carried out in order to compare the following tests: usual test (without correction), the ones based on adjusted profile likelihoods, the ones obtained by Bartlett corrections and the ones based on bootstrap method. The numerical results shown suggest that the test based on adjusted profile likelihood proposed in Fraser and Reid (1995) and by Fraser et al. (1999) outperforms the usual test.

KEYWORDS. Adjusted profile likelihoods. Likelihood ratio test. Weibull

(2)

1. Introdu¸c˜ao

Quando o interesse é o tempo até a ocorrência de um determinado evento (tempo de falha), como, por exemplo, a falha de um componente eletrônico ou a morte de um paciente, freqüentemente existem observa¸cões censuradas, principal caracter´ıstica de dados de sobrevivência. Modelos paramétricos consistem em distribui¸cões de probabilidade para o tempo de falha e são usados com freqüência na área industrial. A distribui¸cão de Weibull é largamente utilizada em confiabilidade por causa da sua flexibilidade em modelar taxas de falhas crescente, decrescente e constante, dependendo do valor do seu parâmetro de forma. Para algumas aplica¸cões, ver Mann et al. (1974), Gross & Clark (1975), Lawless (1982) e Klein & Moeschberger (1997).

Os estudos na área médica muitas vezes envolvem covariáveis que podem estar rela-cionadas com o tempo de sobrevivência. Em várias situa¸cões, fatores de heterogeneidade são medidos em componentes industriais e devem ser incorporados na análise estat´ıstica dos dados. A forma mais eficiente de acomodar o efeito destas covariáveis é utilizar um modelo de regressão apropriado para dados censurados.

Em muitas aplica¸cões, uma estrutura de regressão é usada para modelar a dependência do parâmetro de escala da distribui¸cão de Weibull, α, com rela¸cão a covariadas, produzindo o que é conhecido como modelo de regressão de Weibull. Assim, seja t ∼ W (α(x), β), onde x = (x1, x2, . . . , xp) é uma cole¸cão de covariáveis e W (α, β) denota uma distribui¸cão de

Weibull com parâmetro de forma β e parâmetro de escala α. Por conseguinte, log t = y ∼ V E(η(x), σ), ou seja, y tem distribui¸cão valor extremo com parâmetros de loca¸cão η(x) e de escala σ, mais precisamente,

y = log t = η(x) + σϑ, (1)

onde ϑ ∼ V E(0, 1). A fun¸c˜ao de densidade de y ´e dada por

p(y; η(x), σ) = 1 σexp ½ y − η(x) σ − exp µ y − η(x) σ ¶¾ ,

em que −∞ < y < ∞, η(x) = log α(x) e σ = β−1_{. A fun¸cão distribui¸cão é F (y; η(x), σ) =}

1 − R(y; η(x), σ), onde R(y; η(x), σ) = exp ( − exp " y − η(x) σ #)

é a fun¸cão de confiabilidade (ou de sobrevivência). Neste trabalho, η(x) = xφ, onde φ = (φ1, φ2, . . . , φp)>. Da rela¸cão (1), observe que t = tx= exp(η(x)) × exp(σϑ) = exp(xφ) × t0. Assim, se xφ < 0, então tx< t0; isto é, as covariadas “aceleram” o tempo até a falha. Por isto, tal modelo é conhecido como modelo de tempo de vida acelerado.

Os parâmetros que indexam o modelo podem ser estimados pelo método da máxima verossimilhan¸ca. Contudo, em pequenas amostras, os estimadores resultantes podem ser consideravelmente viesados e os testes da razão de verossimilhan¸cas podem apresentar dis-tor¸cões de tamanho (probabilidade do erro tipo I) substanciais.

Um procedimento comumente utilizado quando o modelo a ser ajustado envolve a estima¸cão de parâmetros de perturba¸cão é a elimina¸cão de tais parâmetros substituindo-os na fun¸cão de verossimilhan¸ca por suas respectivas estimativas de máxima verossimilhan-¸ca para valores fixados dos parâmetros de interesse. A fun¸cão resultante, chamada de fun¸cão de verossimilhan¸ca perfilada, depende, portanto, somente dos parâmetros de inte-resse. Evidentemente, essa fun¸cão de verossimilhan¸ca não é uma verossimilhan¸ca genu´ına e, assim, não possui propriedades básicas de fun¸cões de verossimilhan¸ca. Por exemplo, a fun¸cão escore não tem necessariamente média nula e a igualdade da informa¸cão pode não ser obedecida. Isto pode acarretar alguns problemas, como, por exemplo, inconsistência e ineficiência de estimadores. Outro problema comum refere-se à aproxima¸cão usual da distribui¸cão da estat´ıstica da razão de verossimilhan¸cas pela distribui¸cão qui-quadrado,

(3)

que, dependendo da quantidade de parâmetros de perturba¸cão, pode ser bastante pobre. Desta forma, torna-se importante obter ajustes para tal fun¸cão. Vários pesquisadores, incluindo Barndorff–Nielsen (1983), Cox & Reid (1987), McCullagh & Tibishirani (1990) e Stern (1997), propuseram ajustes à fun¸cão de verossimilhan¸ca perfilada. Paralelamente a estes trabalhos, DiCiccio & Stern (1994) mostraram que é poss´ıvel obter corre¸cão de Bartlett para a estat´ıstica da razão de verossimilhan¸cas proveniente de uma verossimilhan¸ca perfilada ajustada. O objetivo desta corre¸cão é a redu¸cão na distor¸cão de tamanho do teste em amostras de tamanho t´ıpico através de uma acelera¸cão da taxa de convergência do tamanho verdadeiro para o tamanho nominal (assintótico).

Este trabalho consiste de um estudo de vários métodos de melhorias para testes da razão de verossimilhan¸cas sobre os parâmetros da parte sistemática do modelo de regressão de Weibull. Aqui y1, . . . , ynsão variáveis aleatórias independentes com distribui¸cões valores

extremos de parˆametros de loca¸c˜ao xjφ e de escala σ, para j = 1, . . . , n. Neste texto, y

denota tanto a vari´avel aleat´oria quanto seu valor observado.

Dentro deste contexto, são estudados ajustamentos da verossimilhan¸ca perfilada e obti-das corre¸cões de Bartlett para as estat´ısticas da razão de verossimilhan¸cas correspondentes. Simula¸cões de Monte Carlo são realizadas a fim de comparar os desempenhos do teste origi-nal (sem corre¸cão), dos testes baseados em verossimilhan¸cas perfiladas ajustadas, dos testes modificados por corre¸cões de Bartlett e do teste que emprega valor cr´ıtico proveniente de um esquema de bootstrap. O bootstrap consiste de um esquema de reamostragem dos dados (sob a hipótese nula em teste) realizado um grande número de vezes a fim de se estimar, a partir das várias realiza¸cões, alguma caracter´ıstica de interesse da quantidade sob estudo (ver Efron & Tibshirani, 1993). Aqui o interesse reside na obten¸cão de um valor cr´ıtico correspondente a um n´ıvel de significância predeterminado a partir da distribui¸cão nula estimada com base no esquema iterativo de constru¸cão de pseudo-amostras e poste-rior constru¸cão da quantidade de interesse para cada uma destas amostras. Os resultados numéricos são indicativos dos méritos relativos de cada um dos métodos. São gerados dados completos e dados censurados. Também é realizada uma aplica¸cão com dados reais. 2. Resultados Numéricos

Esta se¸cão apresenta alguns resultados numéricos relativos a testes da razão de veros-similhan¸cas realizados sobre o vetor paramétrico φ. Todas as simula¸cões foram realizadas usando a linguagem de programa¸cão matricial Ox (Doornik, 2001). Esses resultados são baseados em 10000 (dez mil) amostras de Monte Carlo. Foram considerados dois mode-los de regressão, denominados modelo 1 e modelo 2, cujas partes sistemáticas são dadas, respectivamente, por

η(x) = φ1+ φ2x2 e η(x) = φ1+ φ2x2+ φ3x3+ φ4x4.

Por economia de espa¸co, entre as alternativas ao teste da razão de verossimilhan¸cas original, denotado por `, são mostrados apenas resultados relativos ao teste baseado numa aproxima¸cão para o ajuste proposto em Barndorff-Nielsen (1983), denotado aqui por ˜`BN.

A verossimilhan¸ca perfilada modificada proposta em Barndorff-Nielsen (1983) é freq¨ uen-temente dif´ıcil de ser calculada, por isso várias propostas de aproxima¸cão desta fun¸cão foram desenvolvidas e algumas destas estão descritas em Severini (2000). Aqui é usada a aproxima¸cão derivada dos resultados de Fraser & Reid (1995) e Fraser et al. (1999).

Considerando o modelo 1, os valores atribu´ıdos a x₂ são realiza¸cões independentes de uma variável aleatória com distribui¸cão uniforme cont´ınua U (0, 100). Os resultados são baseados numa amostra de tamanho n = 20 e, para dados censurados, são considerados dois n´ıveis de censura: 25% e 50%. Aqui σ = 1 (modelo exponencial), assim como todos os componentes do vetor φ, φi= 1 ∀i.

Para dados com presen¸ca de censura do tipo II, (n, r) = (20, 10), onde r é o n´umero de falhas, a Tabela 1 apresenta taxas de rejei¸cão sob a hipótese nula de diferentes testes da razão de verossimilhan¸cas com distintos n´ıveis de significância. Note que os testes baseados em ˜`BN apresentaram taxas mais próximas aos n´ıveis nominais. Por exemplo,

(4)

Tabela 1. Taxas de rejei¸cão da hipótese nula de diferentes testes da razão de verossimilhan¸cas, σ = 1, dados censurados tipo II, (n, r) = (20, 10). modelo 1 n´ıvel nominal H0 : φ2= 1 H0 : φ1 = φ2= 1 ` ˜`_BN ` ˜`_BN 10% 15.530 9.060 16.170 10.570 5% 9.020 4.420 9.650 5.470 1% 2.420 0.700 2.690 1.140 0.1% 0.330 0.020 0.390 0.100

para H0 : φ1 = φ2 = 1 e n´ıvel de significˆancia de 0.1%, tal teste apresentou taxa igual ao n´ıvel nominal, enquanto o teste original apresentou taxa igual a 0.390%.

Supondo qualquer uma das verossimilhan¸cas e denotando o quantil amostral de ordem q do conjunto de valores da respectiva estat´ıstica de teste por RV (q) e o correspondente quan-til da distribui¸cão qui-quadrado limite por χ2_{(q), a discrepância relativa entre os quantis} amostrais e assintóticos das estat´ısticas de teste é definida como [RV (q) − χ2_(q)]/χ2_(q).

O gráfico da Figura 1 apresenta as curvas de discrepâncias relativas de quantis das estat´ısticas de teste baseadas na verossimilhan¸ca original ` (original) e no ajuste sobre a verossimilhan¸ca perfilada denotado por ˜`_BN (aprox BN), cuja curva, por estar mais próxima à ordenada nula, ratifica os resultados da Tabela 1, como a melhor aproxima¸cão da dis-tribui¸cão nula da estat´ıstica de teste pela disdis-tribui¸cão qui-quadrado.

Figura 1. Gr´afico das discrepˆancias relativas de quantis, σ = 1,

η(x) = φ1+ φ2x2, H0 : φ1 = φ2 = 1, dados censurados tipo II,

(n, r) = (20, 10). 2 4 6 8 10 12 0.00 0.05 0.10 0.15 0.20 0.25 0.30 quantil assintotico

discrepancia relativa de quantis

original aprox BN

Agora considere dados com presen¸ca de censura do tipo I. Diferentemente dos dados com censura do tipo II, não é poss´ıvel fixar o número de falhas numa amostra Monte Carlo, ou seja, a propor¸cão de observa¸cões censuradas. Assim, empiricamente, foi usada a seguinte expressão para c (tempo de censura): c = α_[1−p]( − log p)1/β, onde α_[1−p] denota o quantil

(5)

Tabela 2. Taxas de rejei¸cão da hipótese nula de diferentes testes da razão de verossimilhan¸cas, σ = 1, dados censurados tipo I, n = 20,

p = 0.25. modelo 1 n´ıvel nominal H0 : φ2= 1 H0 : φ1 = φ2= 1 ` ˜`_BN ` ˜`_BN 10% 13.590 9.600 13.020 8.440 5% 7.420 4.790 7.540 4.230 1% 1.830 0.910 1.710 0.650 0.1% 0.220 0.070 0.250 0.060

amostral de ordem (1 − p) do conjunto {α(x₁), . . . , α(x_n)} e p, a propor¸c˜ao nominal de censura desejada.

Ainda sob o modelo exponencial, para p = 0.25, a Tabela 2 apresenta taxas de rejei¸cão sob a hipótese nula de diferentes testes da razão de verossimilhan¸cas com distintos n´ıveis de significância. Note que os testes baseados em ˜`BN apresentaram taxas mais próximas aos

n´ıveis nominais. Por exemplo, para H0 : φ1 = φ2 = 1 e n´ıvel de significˆancia de 10%, tal teste apresentou taxa igual a 8.440% (conservador), enquanto o teste original apresentou taxa igual a 13.020% (liberal).

O gráfico da Figura 2 apresenta as curvas de discrepâncias relativas de quantis das estat´ısticas de teste. Note que a distribui¸cão nula da estat´ıstica de teste baseada em ˜`BN

(aprox BN) ´e bem aproximada pela distribui¸c˜ao qui-quadrado χ2 2.

Figura 2. Gr´afico das discrepˆancias relativas de quantis, σ = 1,

η(x) = φ1+ φ2x2, H0 : φ1 = φ2 = 1, dados censurados tipo I, p = 0.25. 2 4 6 8 10 12 −0.10 −0.05 0.00 0.05 0.10 0.15 quantil assintotico

discrepancia relativa de quantis

original aprox BN

Para o modelo 2 e dados com presen¸ca de censura do tipo II (n´ıvel de censura = 30%, n = 50), a Tabela 3 apresenta taxas de rejei¸cão sob a hipótese nula de diferentes testes da razão de verossimilhan¸cas com distintos n´ıveis de significância. Para σ = 2 (β = 0.5), os valores das covariadas x2, x3 e x4 são realiza¸cões independentes de uma variável aleatória com distribui¸cão de Cauchy, enquanto para σ = 0.2 (β = 5), são realiza¸cões de uma variável

(6)

aleatória com distribui¸cão uniforme cont´ınua U (0, 100). A utiliza¸cão de observa¸cões de uma variável com distribui¸cão de Cauchy na matriz de especifica¸cão do modelo X tem, por objetivo, gerar um conjunto de dados com a presen¸ca de pontos de alavanca. Aqui φ_i = 3 ∀i.

Para σ = 2, note as deteriora¸cões das taxas de rejei¸cão dos testes baseados em ˜`_BN com o aumento do n´umero de parâmetros testados. Isto não ocorre quando σ = 0.2

(x2, x3, x4 ∼ U (0, 100)). Neste caso, os resultados são semelhantes às situa¸cões em que

σ = 1 (modelo exponencial) e φi = 1 ∀i. Observe que os testes baseados em ˜`BN

apresen-taram desempenhos superiores aos testes usuais.

Tabela 3. Taxas de rejei¸cão da hipótese nula de diferentes testes da razão de verossimilhan-¸cas, dados censurados tipo II, (n, r) = (50, 35).

modelo 2 σ n´ıvel nominal H0: φ4= 3 H0: φ3= φ4= 3 H0: φ2= φ3= φ4= 3 ` ˜`_BN ` ˜`_BN ` ˜`_BN 2 10% 12.640 9.880 15.100 12.080 15.060 12.620 5% 7.440 5.140 8.340 6.260 8.580 6.780 1% 1.920 1.160 2.140 1.300 2.220 1.580 0.1% 0.380 0.140 0.280 0.120 0.340 0.200 0.2 10% 13.420 10.220 13.500 9.620 12.980 10.040 5% 7.320 5.160 7.100 4.860 7.500 5.520 1% 1.880 1.060 1.920 0.920 1.720 1.200 0.1% 0.220 0.120 0.240 0.100 0.160 0.120 3. Conclus˜oes

Na se¸c˜ao anterior, os testes baseados em ˜`BN apresentaram taxas de rejei¸c˜ao sob a

hip´otese nula mais pr´oximas aos n´ıveis nominais. Os testes baseados em ` rejeitaram demais.

Portanto, considerando observa¸cões independentes, mas não identicamente distribu´ı-das, ao realizar testes sobre os parâmetros da parte sistemática do modelo de regressão de Weibull, resultados satisfatórios podem ser obtidos a partir de testes da razão de verossimi-lhan¸cas baseados no ajuste proposto por Fraser & Reid (1995) e Fraser et al. (1999). Vale destacar que tal ajuste não requer a ortogonalidade dos parâmetros de interesse e de incômodo, diferentemente do ajuste derivado em Cox & Reid (1987), e nem a especifica¸cão de uma estat´ıstica ancilar, exigida pelo ajuste apresentado em Barndorff-Nielsen (1983).

Para pesquisas futuras, seria interessante obter ajustes similares para extensões da tradicional distribui¸cão de Weibull biparamétrica. Em Lai et al. (2004), são descritas, de maneira unificada, algumas dessas extensões; ver também Murthy et al. (2003), Xie et al. (2003) e Xie et al. (2002).

Referˆencias Bibliogr´aficas

Barndorff-Nielsen, O.E. (1983). On a formula for the distribution of the maximum likelihood estimator. Biometrika, 70, 343–365.

Cox, D.R. & Reid, N. (1987). Parameter orthogonality and approximate conditional inference. Journal of the Royal Statistical Society B, 49, 1–39.

DiCiccio, T.J. & Stern, S.E. (1994). Frequentist and Bayesian Bartlett correction of test statistics based on adjusted profile likelihoods. Journal of the Royal Statistical Society B, 56, 397–498.

(7)

Doornik, J.A. (2001). Ox: an Object-oriented Matrix Programming Language, 4th edi-tion. London: Timberlake Consultants and Oxford: http://www.doornik.com.

Efron, B. & Tibshirani, R.J. (1993). An Introduction to the Bootstrap. New York: Chapman & Hall.

Fraser, D.A.S. & Reid, N. (1995). Ancillaries and third-order significance. Utilitas Mathematica, 47, 33–53.

Fraser, D.A.S., Reid, N., Wu, J. (1999). A simple formula for tail probabilities for frequentist and Bayesian inference. Biometrika, 86, 655–661.

Gross, A.J. & Clark, V.A. (1975). Survival Distribution: Reliability Applications in the Biomedical Sciences. New York: Wiley.

Klein, J.P. & Moeschberger, M. (1997). Survival Analysis. New York: Springer– Verlag.

Lai, C.D., Zhang, L., Xie, M. (2004). Mean residual life and other properties of Weibull related bathtub shape failure rate distributions. International Journal of Reliability, Qual-ity and Safety Engineering, 11, 113–132.

Lawless, J.F. (1982). Statistical Models and Methods for Lifetime Data. New York: Wiley. Mann, N.R., Schafer, R.E., Singpurwalla, N.D. (1974). Methods for Statistical Anal-ysis and Reliability and Life Data. New York: Wiley.

McCullagh, P. & Tibishirani, R. (1990). A simple method for the adjustment of profile likelihood. Journal of the Royal Statistical Society B, 52, 325–344.

Murthy, D.N.P., Xie, M., Jiang, R. (2003). Weibull Models. New York: Wiley. Severini, T.A. (2000). Likelihood Methods in Statistics. Oxford: Oxford University Press. Stern, S.E. (1997). A second-order adjustment to the profile likelihood in the case of a multidimensional parameter of interest. Journal of the Royal Statistical Society B, 59, 653–665.

Xie, M., Goh, T.N., Tang, Y. (2002). A modified Weibull extension with bathtub-shapedfailure rate function. Reliability Engineering and Systems Safety, 76, 279–285. Xie, M., Lai, C.D., Murthy, D.N.P. (2003). Weibull-related distributions with bathtub shaped failure rate functions. In: Mathematical and Statistical Methods in Reliability, vol. 7, eds. K. Doksum and B. Lindqvist, Singapore: World Scientific Publishing Co., 283–297.