Download/Open

Texto

(1)KATIA PIRES DO NASCIMENTO. CORREÇÃO TIPO–BARTLETT EM MODELOS NÃO LINEARES SIMÉTRICOS HETEROSCEDÁSTICOS. RECIFE – FEVEREIRO/2010.

(2) UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO EM BIOMETRIA E ESTATÍSTICA APLICADA. CORREÇÃO TIPO–BARTLETT EM MODELOS NÃO LINEARES SIMÉTRICOS HETEROSCEDÁSTICOS. Dissertação apresentada ao Programa de Pós-Graduação em Biometria e Estatística Aplicada como exigência parcial à obtenção do título de Mestre.. Área de Concentração: Modelagem Estatística e Computacional Orientadora: Profa. Dra. Laélia P. B. Campos dos Santos. Co-orientadora: Profa. Dra. Audrey Helen Mariz de Aquino Cysneiros. RECIFE – FEVEREIRO/2010..

(3) UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO PROGRAMA DE PÓS-GRADUAÇÃO EM BIOMETRIA E ESTATÍSTICA APLICADA. CORREÇÃO TIPO–BARTLETT EM MODELOS NÃO LINEARES SIMÉTRICOS HETEROSCEDÁSTICOS. KATIA PIRES DO NASCIMENTO. Dissertação julgada adequada para obtenção do título de mestre em Biometria e Estatística Aplicada, defendida e aprovada por unanimidade em 25/02/2010 pela Comissão Examinadora.. Orientador:. Profa. Dra. Laélia P. B. Campos dos Santos Universidade Federal Rural de Pernambuco. Banca Examinadora:. Profa. Dra. Audrey Helen Mariz de Aquino Cysneiros Universidade Federal de Pernambuco. Prof. Dr. Francisco José de Azevêdo Cysneiros Universidade Federal de Pernambuco. Prof. Dr. Mário de Castro Andrade Filho Universidade de São Paulo.

(4) iii. Aos meus pais José e Lúcia e ao meu companheiro Vinicius, com muito amor..

(5) iv. Agradecimentos. Agradeço primeiramente a DEUS, por me conceder a vida. Aos meus pais José Pires e Lúcia Soares pelo amor, carinho e dedicação na formação de meu caráter, e por tudo que sou. Ao meu companheiro Vinicius, pelo amor, ajuda, companherismo, apoio incondicional. Aos meus irmãos Amanda Pires e Luciano Pires, pelo carinho e apoio. À minha co-orientadora, Audrey Helen Mariz de Aquino Cysneiros, por ter me concedido um trabalho maravilhoso, pela sua excelente orientação, paciência, disposição, assistência, apoio e amizade, sempre. Ao Prof. Gauss Moutinho Cordeiro por ensinar de forma a estimular nos alunos a necessidade de fazer pesquisa. À Profa . Laélia P. B. Campos dos Santos pela assistência. Ao Prof. Borko Stošic´ pelo ensino e assistência. Ao Prof. Tatijana Stošic´ pelo ensino e assistência. Ao Secretário Marco Antônio dos Santos pela sua assistência. À Zuleide pela amizade e carinho durante esses dois anos. Aos colegas, Alessandra Esteban, Amanda Lira, Edleide, Francisco Guedes e Leila. Ao REUNE pelo apoio financeiro e ao Programa de Pós-Graduação em Biometria e Estatística Aplicada pelo suporte logístico e intelectual..

(6) v. Resumo. Essa dissertação tem dois objetivos. O primeiro é a obtenção de expressões matriciais para o fator de correção tipo–Bartlett para a estatística escore nos modelos não–lineares simétricos heteroscedásticos, com funções de ligação quaisquer para a média e para o parâmetro de dispersão. O segundo é apresentar resultados de simulação de forma a verificar a influência da correção nos modelos em estudo. Palavras-chave: Correção tipo–Bartlett, Distribuições simétricas, Modelos heteroscedásticos, Modelos não–lineares, Teste escore..

(7) vi. Abstract. This manuscript has two aims. First, we derive general matrix formulae to Bartlett–type correction to the score statistic in a class of heteroscedastic symmetric nonlinear regression models, with link functions any for both mean and dispersion parameter. In the second part Monte Carlo simulations are also performed to assess the influence of the correction in the models studied.. Keywords: Bartlett-type correction, Heteroscedastic model, Nonlinear model, Score test, Symmetric distribution..

(8) Lista de Tabelas 2.1 Expressões para g(z),. g0 (z) g(z). e s para algumas distribuições simétricas . . . .. 20. 4.1 Tamanho dos testes – modelo normal não–linear com p = 1 e diversos valores para (n, α).. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 44. 4.2 Tamanho dos testes – modelo logístico tipo I não–linear com p = 1 e diversos valores para (n, α). . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 45. 4.3 Tamanho dos testes – modelos não–lineares logístico tipo I e exponencial potência, respectivamente, com k = 0, 1 p = 1 n = 40 e α . . . . . . . . . . .. 45. 4.4 Poder dos testes – modelo normal não–linear com n = 40, p = 1, α = 5% e. α = 10%, respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . . . .. 45. 4.5 Poder dos testes – modelo logístico tipo I não–linear com n = 30, p = 1,. α = 5% e α = 10%, respectivamente. . . . . . . . . . . . . . . . . . . . . .. 46. 4.6 Poder dos testes – modelo exponencial potência não–linear com k = 0, 1. p = 1 n = 40, α = 5%, 10%, respectivamente. . . . . . . . . . . . . . . . . .. 46. 4.7 Médias e variâncias – modelos não–lineares normal, logístico tipo I e exponencial potência, respectivamente. . . . . . . . . . . . . . . . . . . . . . . .. 46.

(9) Sumário. 1 Introdução. 12. 2 Modelos Não–lineares Simétricos Heteroscedásticos. 15. 2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 15. 2.2 Definição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 16. 2.3 Função de Verossimilhança e Função Escore . . . . . . . . . . . . . . . . .. 18. 2.4 Informação de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 21. 2.5 Métodos Iterativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 22. 2.6 Teste Escore em Modelos Não–lineares Simétricos Heteroscedásticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 24. 2.6.1 Testes simultâneos sobre a média e o parâmetro de precisão . . . .. 24. 2.6.2 Testes de hipóteses sobre o parâmetro de precisão . . . . . . . . . .. 25. 2.6.3 Testes de hipóteses sobre a média . . . . . . . . . . . . . . . . . . .. 26. 3 Correção Tipo–Bartlett Para a Estatística Escore. 29. 3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 29. 3.2 Correção Tipo–Bartlett . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 30. 3.3 Correção tipo–Bartlett à estatística escore envolvendo a média e o parâmetro de precisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 32. 3.4 Correção tipo–Bartlett à estatística escore envolvendo o parâmetro de precisão 38 3.5 Correção tipo–Bartlett à estatística escore envolvendo a média . . . . . . . 4 Estudo de Simulação. 40 42.

(10) 5 Conclusões. 47. Apêndice. 47. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Apêndice A. 48. Apêndice B. 51. B.1 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 51. B.2 Distribuição de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 52. B.3 Distribuição t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 52. B.4 Distribuição t de Student generalizada . . . . . . . . . . . . . . . . . . . . .. 53. B.5 Distribuição Logística Tipo I . . . . . . . . . . . . . . . . . . . . . . . . . . .. 54. B.6 Distribuição Logística Tipo II . . . . . . . . . . . . . . . . . . . . . . . . . .. 55. B.7 Exponencial Potência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 56. Referências Bibliográficas. 58.

(11) 12. 1. Introdução. A suposição de normalidade sempre foi muito atrativa para os erros de modelos de regressão com resposta contínua e, mesmo quando não era alcançada, procurava-se alguma transformação na resposta no sentido de obter-se pelo menos a simetria. Contudo, com o passar do tempo, verificou-se que as estimativas obtidas para os coeficientes dos modelos normais mostraram-se sensíveis a observações extremas, comumente chamadas de observações aberrantes, incentivando o desenvolvimento de metodologias robustas contra tais observações. Na linha de modelos robustos, alternativas à suposição de erros normais têm sido propostas na literatura. Uma dessas alternativas é assumir para os erros distribuições com caudas mais pesadas do que a normal, a fim de reduzir a influência de pontos aberrantes. Na última década, diversos resultados de natureza teórica e aplicada surgiram como alternativas à modelagem com erros normais como, por exemplo, o uso de distribuições simétricas (ou elípticas). Grande parte desses resultados podem ser encontrados em Fang et al. (1990) e Fang e Anderson (1990). Esta classe de distribuições contempla distribuições de caudas leves e pesadas, tais como, t de Student, Logística tipo I e II, Normal, Normal Contaminada, dentre outras. Sob a suposição de heteroscedastidade, Cysneiros et al. (2005) propuseram a classe de modelos de regressão lineares simétricos heteroscedásticos. Nesta direção, como estamos interessados em fazer inferências que envolvam alguns, mas não todos os parâmetros do modelo não–linear simétrico heteroscedástico, refinamentos de testes são necessários. Neste caso dizemos que os parâmetros envolvidos são parâmetros de interesse, enquanto que os demais são chamados de parâmetros de perturbação. Em problemas regulares, a estatística escore (SR ) tem, sob a hipótese nula, uma distribuição χq2 aproximadamente, em grandes amostras, ou seja, χ 2 com q graus de liberdade, em que q é a diferença entre as dimensões dos espaços paramétricos sob as hipóteses alternativa e nula. Em geral, há uma grande dificuldade em se determinar a distribuição exata da estatística SR , razão pela qual os testes têm sidos construídos com base em resultados assintóticos. Os testes são comumente baseados na comparação das estatísticas.

(12) 1 Introdução. 13. com valores críticos obtidos na distribuição χ 2 de referência para níveis de significância nominais fixados. Em pequenas amostras ou mesmo em amostras de tamanho moderado, a aproximação pode não ser satisfatória, podendo conduzir a taxa de rejeição, sob a hipótese nula, bastante distorcida. Para melhorar a qualidade da aproximação da distribuição da estatística SR pela distribuição qui-quadrado é utilizada a chamada correção tipo–Bartlett. Uribe–Opazo (1997) obteve fatores de correção de Bartlett e tipo–Bartlett para as estatísticas da razão de verossimilhanças e escore nos modelos lineares simétricos homoscedásticos, respectivamente. Fioresi (2000) obteve fatores de correção de Bartlett e tipo–Bartlett para vários testes de hipóteses em modelos normais lineares heteroscedásticos, considerando funções de ligação quaisquer para a média e para a variância. Cordeiro (2004) obteve um fator de correção de Bartlett para a estatística da razão de verossimilhanças em modelos não–lineares simétricos homoscedásticos. Cysneiros et al. (2008) apresentaram, em notação matricial, um fator de correção tipo–Bartlett para a estatística escore nos modelos não–lineares simétricos homoscedásticos. Brito (2007) obteve um fator de correção de Bartlett para a estatística da razão de verossimilhanças em modelos não–lineares simétricos heteroscedásticos. Dando continuidade a estes trabalhos, temos como objetivo principal desta dissertação a obtenção de um refinamento para testes de hipóteses em modelos não–lineares simétricos heteroscedásticos. Mais especificamente, obtemos um fator de correção tipo–Bartlett para a estatística escore original nesta classe de modelos. Estudos de simulação de Monte Carlo serão desenvolvidos para avaliar e comparar numericamente os desempenhos dos testes em amostras finitas. Esta dissertação de mestrado está organizada da seguinte forma: No Capítulo 2, revisamos os principais resultados teóricos relacionados com os modelos de regressão não–lineares simétricos heteroscedásticos. Em particular, discutimos a aplicação do teste escore a esta classe de modelos. No Capítulo 3, desenvolvemos um fator de correção tipo–Bartlett para a estatística escore, recorrendo a proposta de Cordeiro e Ferrari (1991), nos modelos não lineares simétricos heteroscedásticos. A fórmula da correção é dada em notação matricial e pode ser implementada em um sistema de computação algébrica para se obter expressão em forma fechada quando aplicada a modelos especiais. Este fator de correção obtido generaliza o resultado em Cysneiros et al. (2008), já que estes autores desenvolveram um fator de correção tipo–Bartlett para a estatística escore nos modelos não–lineares simétricos homoscedásticos. Vale salientar que este capítulo é a principal contribuição teórica desta dissertação..

(13) 1 Introdução. 14. No Capítulo 4, apresentamos resultados de simulação para avaliar o desempenho dos testes escore usual, escore corrigido via correção tipo–Bartlett e suas versões alternativas. O desempenho dos testes foi avaliado segundo a probabilidade do erro tipo I, em um estudo de simulação. Avaliamos também o poder dos testes em estudo sob algumas situações. As simulações foram realizadas usando a linguagem de programação matricial Ox (Doornik, 2001), versão 4.10 para o sistema operacional Windows. Finalmente, no Capítulo 5, apresentamos algumas conclusões com os principais resultados e contribuições desta dissertação. Os desenvolvimentos algébricos dos capítulos citados acima se encontram nos apêndices..

(14) 15. 2. Modelos Não–lineares Simétricos Heteroscedásticos. 2.1. Introdução. A modelagem de dados simétricos é, frequentemente, baseada na suposição de variância constante para os erros. Contudo, em muitas situações práticas essa suposição é dificilmente verificada. A procura de uma transformação na variável resposta para estabilizar a variância nem sempre tem seu sucesso alcançado ou mesmo é recomendável. Quando a suposição de homoscedasticidade do modelo não é verificada, modelos heteroscedásticos são propostos em que a variância do modelo está relacionada, através de uma função de ligação, com um conjunto de variáveis explicativas. Esta é uma das formas de lidar com o problema. A modelagem da variância tem sido largamente discutida principalmente na área de Econometria. Sob erros normais, por exemplo, Cook e Weisberg (1982) e Atkinson (1985) apresentam alguns métodos gráficos para detectar heteroscedasticidade. Importante passo foi dado por Aitkin (1987) que desenvolveu rotinas computacionais no GLIM para a estimação de máxima verossimilhança para modelagem da variância sob erros normais. Verbyla (1993) compara as estimativas de máxima verossimilhança completa e residual, em que o primeiro método estima todos os parâmetros envolvidos no modelo, e o segundo estima os parâmetros de variância. baseando-se na deleção de casos e no afastamento da verossimilhança. Taylor e Verbyla (2004) propõem a modelagem conjunta dos parâmetros de locação e escala no modelo de regressão linear com erros t de Student. Na classe dos modelos não–lineares simétricos, abordamos a situação em que os parâmetros de dispersão não são constantes para todas as observações, havendo assim uma estrutura heteroscedástica. Analogamente à estrutura estabelecida para a variância no modelo linear, admitimos a determinação de uma forma funcional que relaciona os parâmetros de dispersão com alguns parâmetros desconhecidos, que não dependem do vetor de parâmetros de regressão, e algumas variáveis auxiliares. Sendo assim, temos como um dos objetivos dessa dissertação obter refinamento de testes de hipóteses nesta.

(15) 16. 2.2 Definição. classe de modelos.. 2.2. Definição. No modelo de distribuição, tratado neste texto, as variáveis aleatórias Y1 , · · · ,Yn são assumidas como sendo independentes e cada observação Yl tem uma distribuição simétrica, com parâmetros de locação µl ∈ R e de escala φl > 0, dado por. 1 π(yl ; µl , φl ) = √ g (ul ) , yl ∈ R, φl sendo g : R → [0, ∞) tal que. R∞ 0. (2.1). g(u)du < ∞ e ul = φl−1 (y − µl )2 . A função g(·) é tipicamente. conhecida como função geradora de densidades, com g(u) ≥ 0. Será denotado que Yl ∼. S(µl , φl , g). A função característica ψy (t) = E eitYl é dada por ψy (t) = eitµl ϕ(t 2 φl ), t ∈ R, para al-. . guma função ϕ , com ϕ(x) ∈ R e x > 0. Desde que os dois primeiros momentos existam, 0. E(Yl ) = µl e Var(Yl ) = kφl , em que k = −2ϕ (0) é uma constante positiva que não depende 0. de µl e φl e ϕ (0) = dϕ(u)/du |u=0 . Vale ressaltar que, para encontrar o primeiro momento da variável aleatória Y , deve existir o primeiro momento de u; e para encontrar o segundo momento da variável aleatória Y , deve existir o segundo momento de u. Mais detalhes podem ser escontrados em Fang et al. (1990). Por exemplo, tem-se a distribuição t de Student com υ > 2 graus de liberdade para k = υ/(υ − 2) . Além disso, se a distribuição S(µl , φl , g) tiver r momentos, então x−(r+1)/2 g(x) é integrável. A função densidade de probabilidade de. √ Zl = (Yl − µl )/ φl é dada por π(u; 0, 1) = g(u2 ), u ∈ R, isto é Zl ∼ S(0, 1, g). É introduzida . . ∂ k t(Zl ) , k = 1, 2, 3, · · · e αr,s = E t r (Zl )Zls e βr,s a notação t(Zl ) = log g(Zl2 ) e t (k) (Zl ) = k ∂Z l. = E {t r (zl )t s (Zl )} para r, s = 0, 1, 2, 3, α e β dependem de l , l = 1 · · · , n. A família simétrica (2.1) mantém a estrutura da distribuição normal, mas elimina a forma específica da densidade normal. Isto inclui todas as distribuições simétricas contínuas com caudas mais pesadas do que a normal e tem uma vasta gama de aplicações em vários campos tais como engenharia, biologia, medicina e economia. A classe de distribuições simétricas definidas em (2.1) tem sido estudada por diversos autores (Kelker, 1970; Cambanis et al., 1981). As propriedades destas distribuições, foram exploradas por Muirhead (1980), Berkane e Bentler (1986) e Fang et al. (1990), Johson, et al. (1995). Uma revisão de diferentes áreas em que as distribuições simétricas são aplicados é dada por Chmielewski (1981). As distribuições simétricas mais conhecidas são a normal ou gaussiana e a t de Stu-.

(16) 17. 2.2 Definição. dent, mas também existem outras distribuições simétricas, como por exemplo, exponencial potencia, Kotz, Kotz generalizada e a t de Student generalizada, sendo importante ressaltar que algumas das propriedades clássicas da distribuição normal são válidas para todas as distribuições simétricas. Na classe dos modelos simétricos (2.1), serão introduzidas duas estruturas de regressão. Primeiramente, é assumido que a resposta média seja µ = (µ1 , · · · , µn )> com. µl = f (xl ; β ), em que β é um vetor coluna, com parâmetros de regressão desconhecidos a serem estimados, dado por. " β=. β1. #> ,. β2 sendo β1 vetor de parâmetros de interesse de dimensão p1 ×1, com p1 ≤ p e β2 vetor de parâmetros de perturbação de dimensão (p − p1 )×1, f (.; .) é uma função, possivelmente não–linear no segundo argumento, contínua e duplamente diferenciável em β e. xl = (xl1 , · · · , xlm )> é um vetor de dimensão m×1 de variáveis explicativas, associadas com a i-ésima resposta. Além disso, a matriz de derivadas, de dimensão n×p, de µ com res-. e = ∂ µ/∂ β é suposta tendo posto completo, isto é, posto(X) ˜ = p, peito a β , denotada por X para todo β . A matriz X˜ tem elementos que são, em geral, funções do vetor de parâmetros. β desconhecidos. A segunda estrutura de regressão a ser introduzida, é uma componente sistemática para o vetor de parâmetro de dispersão φ = (φ1 , · · · , φn )> dado por. φl = h(τl ), sendo que h(·) é uma função monótona conhecida, contínua e diferenciável, do preditor > linear de dispersão definida por τl = z> l γ , sendo zl = (zl1 , · · · , zlq ) um vetor de dimensão q. ×1 de variáveis explicativas que podem ter componentes em comum com xl e γ , um vetor de parâmetros desconhecidos a serem estimados, dado por. " γ=. γ1. #> ,. γ2 com γ1 sendo o vetor de parâmetros de interesse de dimensão q1 ×1, com q1 ≤ q e γ2 sendo o vetor de parâmetros de perturbação de dimensão (q − q1 )×1. A função h(·) é habitualmente chamada de função de ligação de dispersão φl , com h(·) > 0. Uma pos-.

(17) 18. 2.3 Função de Verossimilhança e Função Escore. sível escolha da função h(·) seria h(τ) = exp(τ). As variáveis de dispersão zl 0 s não são necessariamente as mesmas variáveis de locação xl 0 s. Denotamos por Yl ∼ S(µl , φl , g) e denominamos de variável aleatória simétrica, para l = 1, · · · , n, com ambos os parâmetros de locação µl e parâmetros de dispersão φl > 0 variando com as observações. Consideremos um modelo não–linear simétrico heteroscedástico definido por (2.1) e com as duas estruturas não–lineares dadas acima, em relação a µl e φl .. 2.3. Função de Verossimilhança e Função Escore. Sejam Y1 , · · · ,Yn n variáveis aleatórias independentes tais que yl ∼ S(µl , φl , g) com a função de densidade de probabilidade dada por (2.1). Dado o vetor de observações. y1 , · · · , yn do modelo (2.1), sendo θ = (β > , φ > )T a função de verossimilhança é dada por n. L(θ ) = ∏ π(yl ; µl , φl ). l=1. Seja `(θ ) o logaritmo da função de verossimilhança, definido como n. `(θ ) =. . ∑ log l=1. com ul =. (yl −µl )2 , φl. g(ul ) √ , φl. µl = f (xl ; β ) e φl = h(τl ) sendo τl = z> l γ . Temos que `(θ ) pode ser. escrita da forma. `(θ ) = −. em que t (zl ) = log g z2l , com zl =. . n 1 n logφ + ∑ l ∑ t (zl ) 2 l=1 l=1. √ ul =. (2.2). y√ l −µl . φl. A função `(θ ) é assumida regular (vide Cox e Hinkley, 1974, cap. 9) com respeito às derivadas dos componentes de β e φ até a quarta ordem. Para a obtenção dos estimadores de máxima verossimilhança, da estatística escore e do fator de correção tipo–Bartlett é necessário calcular as derivadas do logaritmo da função de verossimilhança com relação aos parâmetros desconhecidos e, também, alguns momentos destas derivadas. Então, assume–se que tais derivadas e momentos existem. Todavia, não serão consideradas, nesta dissertação, distribuições simétricas que não satisfazem as condições de regularidade, como por exemplo a exponencial dupla. Foram reservados os índices minúsculos r, s, υ, · · · , como notação padrão adotado nas derivadas da função suporte, com relação aos componentes de β ; e os índices maiúsculos R, S, T ,.

(18) 19. 2.3 Função de Verossimilhança e Função Escore. etc, para denotar componentes do vetor γ , então. Ur = ∂ `(θ )/∂ βr , UrS = ∂ 2 `(θ )/∂ βr ∂ γS , UrST = ∂ 3 `(θ )/∂ βr ∂ γS ∂ γT , etc, e, de maneira análoga, é possível calcular as demais derivadas, com relação aos parâmetros β e γ . Os cumulantes conjunto das derivadas do logaritmo da função de verossimilhança são dados por: κrs = E(Urs ), κr,s = E(UrUs ), κrsT = E(UrsT ), etc, em que todos os 0. κ s referem-se a um total em cima da amostra e são, em geral, de ordem n. Além disso, (T ). (υ). são definidas as derivadas dos cumulantes por κrs = ∂ κrs /∂ βυ , κrs = ∂ κrs /∂ γT , etc. As notações utilizadas para indicar as derivadas de µ com relação aos parâmetros de β são. (r)l = ∂ µl /∂ βr , (rs)l = ∂ 2 µl /∂ βr ∂ βs , (r, sυ)l = ∂ µl /∂ βr ∂ 2 µl /∂ βs ∂ βυ , etc, e com relação aos parâmetros de γ ,. (R)l = ∂ τl /∂ γR , (RS)l = ∂ 2 τl /∂ γR ∂ γS , (RS, T )l = ∂ 2 τl /∂ γR ∂ γS ∂ τl /∂ γT . As primeiras derivadas do logaritmo da função de de verossimilhança em (2.2) com relação à β e a γ são obtidas, respectivamente, por. Ur =. n ∂ `(θ ) (1) 1 = − ∑ tz(l) √ (r)l , r = 1, · · · , p, ∂ βr φl l=1. e. 0. 0. h ∂ `(θ ) 1 n 1 n h UR = = − ∑ l (Rl ) − ∑ t (1) (zl ) l (Rl ), R = 1, · · · , q, ∂ γR 2 l=1 φl 2 l=1 φl (1). sendo t(z ) = ∂t (zl )/∂ zl , com l = 1, · · · , n l. As funções escore para β e γ , em notação matricial, tomam, respectivamente, as formas. Ur = X˜ > S Λ (y − µ) ,. (2.3). e. 1 1 1 (2.4) UR = − P˜ > ΛF1 1 + P˜ > ΛSF1 u = − P˜ > Λ (SF1 u − F1 ι) , 2 2 2 n o ˜ = ∂ φ , X˜ = ∂ µ Λ = diag 1 , · · · , 1 , S = em que P é uma matriz n × q com linhas z> , P l φ1 φn ∂γ ∂β n 0 o 0 2 0 (yl −µl ) (ul ) diag {s1 , · · · , sn }, sl = −2g , F1 = diag h1 , · · · , hn , u = (u1 , · · · , un )> , e ι φl g(u ) com ul = l. é um vetor n × 1 de uns, e de agora em diante o “0” em cima de hl denota a derivada com respeito a τl para l = 1, · · · , n. Características de algumas distribuições simétricas são apresentadas na Tabela 2.1..

(19) ν+1 − 2(ν+z 2) ν+1 (ν+z2 ). 1 − 1+z 2. 2 1+z2. − 12. 1. s. ν+1. g0 (z) g(z). ν. ν 2 [ν+z2 ]− 2 B(1/2,ν/2). t de Student. g(z). 1 2−1 ) π (1 + z. Cauchy. −2z exp √ 2π. 1 2. Normal. g0 (z) g(z). r. r+1. r+1 (w+z2 ). r+1 − 2(w+z 2). w 2 [w+z2 ]− 2 B(1/2,r/2). 2. exp−z 2 (1+exp−z )2. |z|−1). (exp |z|−1) (|z| exp |z|+1). 2(1−exp −z2 ) 1+exp −z2. (exp − 21 (|z| exp |z|+1). exp−z (1+exp−z )2. Logística TipoII. 2. 1−exp −z − 1+exp −z2. c. Logística TipoI. e s para algumas distribuições simétricas. t de Student Generalizada. Tabela 2.1: Expressões para g(z),. 2.3 Função de Verossimilhança e Função Escore 20.

(20) 21. 2.4 Informação de Fisher. 2.4. Informação de Fisher. Nesta seção, será calculada a matriz de informação de Fisher, que será utilizada no processo iterativo de estimação através do método escore de Fisher, mais a diante. As segundas derivadas do logaritmo da função da verossimilhança têm as formas n n ∂ 2 ` (θ ) (2) 1 (1) 1 = ∑ t(z ) (r, s)l − ∑ tzl √ (rs)l , ∂ βr ∂ βs l=1 l φl φl l=1 0. 0. 1 n (1) hl ∂ 2 ` (θ ) 1 n (2) hl = ∑ t(z ) zl 3/2 (S)l (r)l + ∑ t(z ) 3/2 (S)l (r)l , ∂ βr ∂ φS 2 l=1 l φ 2 l=1 l φ l. e. 00. l. 0. 0. 00. 0. ∂ 2 ` (θ ) 1 n h φl − h 2 1 n (2) h 2 1 n (1) 2h φl − 3h 2 = − ∑ l 2 l + ∑ t(z ) z2l l2 + ∑ t(z ) zl l 2 l . ∂ φR ∂ φS 2 l=1 4 l=1 l φl 4 l=1 l φl φl A matriz de informação de Fisher de dimensão quadrada (q + p)×(q + p) , contida nos. dados y, é definida por. n o K (θ ) = E U (θ )U (θ )> ,. (2.5). sendo U (θ ) o vetor escore da superfície suporte de θ . A matriz de primeiras derivadas da função escore com sinal negativo J = − ∂ 2 `(θ ). ∂U(θ )> ∂θ. =. − ∂ θ ∂ θ > é denominada matriz de informação observada. Obtém-se a matriz de informação para θ calculando E(J) = K(θ ). Deste modo, a matriz de informação total de Fisher para. θ na classe dos modelos simétricos é dada por  2 K(θ ) = −E . ∂ `(θ ) ∂ βr β s ∂ 2 `(θ ) ∂ φR ∂ βs. ∂ 2 `(θ ) ∂ βr ∂ φS ∂ 2 `(θ ) ∂ φR φ S.  .. Deste modo, a matriz de informação total de Fisher K = K(β , γ) para (β > , γ > )> é diagonal em blocos com submatrizes. Kγ,γ. ∂ 2 `(θ ) e Kβ ,β = −Kβ β = E − = δ(2,0,0,0,0) Xe> ΛX, ∂ βr ∂ βs 2 δ(2,0,0,0,2) − 1 > ∂ `(θ ) = −Kγγ = E = P Λ5 P = P> V P, ∂ φR ∂ φS 4. e. ∂ 2 `(θ ) E = 0, ∂ φR ∂ β s. (2.6). (2.7). . (2.8). e foi definida na seção 2.2 , P foi definida na seção 2.3, V = diag {v1 , · · · , vn } e em que X 0 (δ(2,0,0,0,2) −1) h2 vl = Λ5 , Λ5 = φl2 , para l = 1, · · · , n. 4 l.

(21) 22. 2.5 Métodos Iterativos. Os parâmetros β e γ são globalmente ortogonais e os estimadores de máxima verossimilhança βb e γb são assintoticamente independentes. Substituindo os resultados obtidos acima na matriz de informação tem-se. " K(θ ) =. δ(2,0,0,0,0) Xe> ΛXe. 0. 0. P> V P. # ,. uma vez que está sendo utilizada a seguinte notação. n o δ (a, b, c, d, e) = E t (1)at (2)bt (3)ct (4)d zel ,. (2.9). com a, b, c, d, e = 1, 2, 3, 4, t (k) = ∂ k t/∂ zk , k = 1, · · · , 4. Pelas condições de regularidade (vide Cox e Hinkley, 1974, Cap. 9), tem-se que δ(1,0,0,0,0) = 0 e δ(0,1,0,0,0) = −δ(2,0,0,0,0) . A função δ(a,b,c,d,e) definida em (2.9) é de grande utilidade para os cálculos das correções tipo–Bartlett para a estatística escore na família de distribuições simétricas. No Apêndice B são dados os δ 0 s necessários à obtenção de algorítmos para o cálculo em algumas distribuições. A seguir apresentaremos alguns algoritmos iterativos para a obtenção dos estimadores de máxima verossimilhança.. 2.5. Métodos Iterativos. O processo iterativo de Newton-Raphson para obter a estimativa de máxima verossimilhança de θ é definido expandindo-se a função escore, em função de θ , em série de Taylor em torno de um valor inicial θ (0) de modo que. (m) 0 (m) (m) ∼ U (θ ) = U θ +U θ θ −θ , m = 0, 1, · · · , sendo U 0 (θ ) correspondente à primeira derivada de U(θ ) com respeito a θ . Assim, como U(θˆ ) = 0 , chega-se ao seguinte processo iterativo n o−1 θ (m+1) = θ (m) + −U 0 θ (m) U θ (m) , . com m = 0, 1, · · · . Como a matriz −U 0 θ (m). . pode não ser positiva definida, a aplicação. do método escore de Fisher substituindo a matriz. −U 0. (m) θ pelo correspondente valor. esperado, pode ser mais adequado. Resultando no seguinte processo iterativo. −1 θ (m+1) = θ (m) + K θ (m) U θ (m) ,.

(22) 23. 2.5 Métodos Iterativos. m = 0, 1, · · · , ou equivalentemente  −1   β (m+1) = β (m) + K β (m) U(β (m) ) −1   γ (m+1) = γ (m) + K γ (m) U(γ (m) ), que em forma matricial é dada por. β (m+1) = β (m) +. n o−1 1 Xe(m)> Λ(m) Xe(m) Xe(m)> S(m) Λ(m) y − µ (m) δ (0, 1, 0, 0, 0). (2.10). e. −1 γ (m+1) = P>V m P P>V (m) η (m) + δ (m) ,. (2.11). e , ι é um vetor de uns, as matrizes S, F1 , Λ e os vetores sl , ul m = 0, 1, · · · , sendo η = Zγ foram definidos na seção 2.3, a matriz V foi definido na Seção 2.4. Além disso, se o logaritmo da função de verossimilhança, definida na seção 2.4, satisfaz as condições de regularidade sob as quais o EMV de θ = (β > , φ > )> é assintoticamente normal, então. > > > b> > > −1 b β ,φ ∼ A N p+1 β , φ ,K , n. o. −1 em que K −1 = Diag K−1 β ,β , Kφ ,φ , com Kβ ,β e Kφ ,φ dadas em (2.6) e (2.7), respectiva-. mente, na matriz de informação. As equações (2.7) e (2.8) mostram que qualquer linguagem que tenha uma rotina de regressão linear ponderada pode ser usada para calcular os EMVs βˆ e γˆ iterativamente.. e(1) , Aproximações iniciais β (1) e γ (1) para o algoritmo iterativo são usados para avaliar X µ (1) , Λ(1) , V (1) , η (1) , F (1) , u(1) e γ (1) das quais essas equações são utilizadas para obter e, µ , Λ, V , η , as próximas estimativas de β (2) e γ (2) . Esses novos valores atualizam X F , u e γ e, então, as iterações continuam até a convergência ser atingida. As matrizes −1 b −1 Xe c −1 = −δ −1 Xe> Λ cγ −1 = Z > Vb Z −1 , de covariâncias assintótica de βb e γb são K eK β. 2,0. respectivamente. Vale, ainda, acrescentar que quando existirem nos modelos outros parâmetros tais como graus de liberdade, é necessário obter a matriz de informação para todos os parâmetros e estimá-los. Outra alternativa, talvez, seria repetir o processo iterativo para uma gama de valores para os parâmetros extras e escolher aquele valor que produz o maior valor para a função de verossimilhança. Assumimos então que nosso modelo satisfaz as suposições habituais da teoria de verossimilhança em amostras de tamanho grande..

(23) 24. 2.6 Teste Escore em Modelos Não–lineares SimétricosHeteroscedásticos. 2.6. Teste Escore em Modelos Não–lineares Simétricos Heteroscedásticos. Nesta seção, obteremos a estatística escore para testes simultâneos sobre a média e o parâmetro de precisão, ou seja, sobre β1> , γ1>. >. , dos modelos não–lineares simétri-. cos heteroscedásticos, definidos em (2.1). Considere o vetor y = (y1 , · · · , yn )> representando n observações independentes em que cada yl tem uma função densidade na família simétrica definida em (2.1). Assumimos que a função `(β ) em (2.2) é regular com respeito às derivadas em relação aos componentes de β até a quarta ordem, consideremos as seguintes partições β = β1> , β2>. γ=. T γ1> , γ2> ,. T. sendo γ1 = γ1 , · · · , γq1. , em que β1 = (β1 , · · · , β p1 )> , β2 = β p1 +1 , · · · , β p. >. e γq1 +1 = γ1 , · · · , γq. >. >. ,. , com p1 ≤ p e q1 ≤ q.. Neste trabalho não consideraremos modificações no valor crítico da estatística escore, restringiremos o escopo do estudos de correções na própria estatística e teremos resultados com relação à monotonicidade destas estatística apenas via simulação.. 2.6.1. Testes simultâneos sobre a média e o parâmetro de precisão (0). Para o modelo (2.1) estamos interessados em testar a hipótese H01 : β1 = β1 , γ1 = (0). (0). (0). γ1 , contra H11 : pelo menos uma das igualdades é violada, em que β1 e γ1 são vetores fixos de dimensões p1 × 1 e q1 × 1, respectivamente. Considerando p1 = p−1 e q1 = q−1, queremos testar, em particular, a hipótese H01 : β1 = 0, γ1 = 0, com xl p = 1 e zl p = 1, com. l = 1, · · · , n. O teste de H01 equivale a testar se as variáveis y1 , · · · , yn são equivalentes, ou seja i.i.d. Seguindo as partições induzidas por H01 , considere X = (X1 , X2 ) e P = (P1 , P2 ) sendo as matrizes particionadas correspondentes ao modelo, em que X1 , X2 , P1 e P2 são respectivamente, n × p1 , n × (p − p1 ), n × q1 e n × (q − q1 ) matrizes de posto completo. A função escore, correspondente é dada por. > U = Uβ>1 (β1 , β2 , γ1 , γ2 ), Uβ>2 (β1 , β2 , γ1 , γ2 ), Uγ>1 (β1 , β2 , γ1 , γ2 ), Uγ>2 (β1 , β2 , γ1 , γ2 ) . A matriz de informação total de Fisher K = K(β , γ), para (β > , γ > )> é diagonal em blocos com submatrizes. Kβ ,β =. Kβ11 Kβ12. ! e Kγ,γ =. Kβ21 Kβ22. Kγ11 Kγ12. ! ,. Kγ21 Kγ22. sendo Kβ11 = δ(2,0,0,0,0) X1> ΛX1 , Kβ12 = Kβ> = δ(2,0,0,0,0) X1> ΛX2 , Kβ22 = δ(2,0,0,0,0) X2> ΛX2 , 21.

(24) 25. 2.6 Teste Escore em Modelos Não–lineares SimétricosHeteroscedásticos. Kγ11 = (δ(2,0,0,0,2) − 1)/4 P1> Λ5 P1 e Kγ12 = Kγ>21 = (δ(2,0,0,0,2) − 1)/4 P1> Λ5 P2 , Kγ22 = (δ(2,0,0,0,2) − 1)/4 P2> Λ5 P2 . (0). (0). A estatística escore para testar a hipótese H01 : β1 = β1 , γ1 = γ1. é. > −1 e U(θe), SR = U(θe) K. que pode ser escrita como a soma de duas formas quadráticas, a saber. r SR = e r> Xe1 (Xe1> ΛXe1 )−1 Xe1>e. −1 > e e> e e Pe1> ζe, + ζ P1 P1 Λ5 P1. (2.12). −1/2. em que r = (r1 , · · · , rn )> , com rl = Λ1/2 sl zl δ(2,0,0,0,0) , ζ = (ζ1 , · · · , ζn )> , sendo ζl = (u> F1 S> −. F1> 1)(δ(2,0,0,0,2) − 1)−1/2 Λ. Os vetores sl , zl e Λ foram definidos na Seção 2.3, Λ5 na Seção (2.4), bem como as matrizes F1 e S foram definidas na Seção 2.6. (0). (0). A estatística escore para testar a hipótese H01 : β1 = β1 , γ1 = γ1 , originalmente sugerida por Rao (1947), é dada por. SR = U1> (θe)K 11 (θe)U1 (θe),. (2.13). em que U1> (θe) e K 11 (θe) são, respectivamente, a função escore e a inversa da matriz de informação total de Fisher para β e γ. avaliadas sob H01 , com θe =. (0) > (0) > > > e e β , γ = (β1 , βe2> , γ1 ,. γe2> )> , sendo βe2 e γe2 os estimador de máxima verossimilhança de β2 e γ2 , respectivamente, sob a hipótese nula. Assintoticamente e sob a hipótese nula, temos que D. SR → χ p21 +q1 ,. quando n → ∞,. ou equivalentemente, que a estatística escore converge em distribuição para a distribuição qui-quadrado com p1 + q1 graus de liberdade.. 2.6.2. Testes de hipóteses sobre o parâmetro de precisão (0). Para o modelo (2.1) estamos interessados em testar a hipótese H02 : γ1 = γ1 hipótese alternativa H12 : γ1 6=. (0) γ1 ,. sendo. (0) γ1. contra a. vetor fixado de dimensão q1 × 1. Supondo. p1 = 0 e q1 = q − 1, um caso especial, diz respeito a testar a hipótese H00 2 : γ1 = 0, com zlq = 1, para l = 1, · · · , n. A hipótese H00 2 equivale à homoscedasticidade, ou seja, Y1 , · · · ,Yn têm a mesma variância. (0). A estatística escore SR para testar a hipótese nula H02 : γ1 = γ1 alternativa H12 : γ1 6=. (0) γ1 ,. contra a hipótese (0). com β representando o parâmetro de perturbação e γ1. valor fixo positivo, tem a forma. é um.

(25) 26. 2.6 Teste Escore em Modelos Não–lineares SimétricosHeteroscedásticos. e11 (γe)U1 (γe), SR = U1> (γe)K. (2.14). ˜ e a inversa da matriz de informação total de Fisher para γ em que a função escore U1 (γ) > ˜ estão avaliadas em βe> , γ1(0)T , γe2> , sendo βe e γe2 os estimadores de máxima K11 (γ) (2). verossimilhança de β e γ2 sob H0 . Assintoticamente e sob a hipótese nula, temos que D. SR → χq21 ,. quando n → ∞,. sendo q1 o número de graus de liberdade. Assim, substituindo os valores de U1 (γ) e −1 K11 (γ) na equação 2.14, tem-se. −1 > e e> e e SR = ζ P1 P1 Λ5 P1 Pe1> ζe,. (2.15). sendo o vetor ζ definido na Subseção 2.6.1, as matrizes P e Λ5 definidas na Seção 2.3 e. 2.4, respectivamente.. 2.6.3. Testes de hipóteses sobre a média (0). O principal objetivo é testar a hipótese composta H03 : β1 = β1 (0). β1. contra H13 : β1 6=. em que o vetor de parâmetros fixos β com p componentes é particionado como. β = (β1> , β2> )> , sendo β1 = (β1 , β2 , · · · , β p1 )> o vetor de parâmetros de interesse e β2 = (0) (β p1 +1 , β p1 +2 , · · · , β p )> e γ = γ1 , · · · , γq são vetores de parâmetros de perturbação e β1 é um vetor especificado de dimensão p1 × 1, com (p1 ≤ p). A matriz de planejamento. . . e = Xe1 , Xe2 . Denota-se que é particionada de acordo com a partição de β , isto é, X > > > > b b b θ = β1 , β2 , γb é o estimador de máxima verossimilhança irrestrito de θ e por θe o estimador de máxima verossimilhança de θ restrito à hipótese nula.. >. A função escore para β pode ser particionada como U(β ) = U1> (β ),U2> (β ). , sendo. U1 (β ) = X˜1> S Λ (y − µ) e U2 (β ) = X˜2> Λ S (y − µ); a matriz Λ foi definida na Seção 2.4. A matriz de informação de Fisher correspondente ao parâmetro de β supondo φ conhecido é dada por. " K(β ) =. K11 K12 K21 K22. # ,.

(26) 2.6 Teste Escore em Modelos Não–lineares SimétricosHeteroscedásticos. 27. com a matriz K(β ) positiva e definida da seguinte forma. K11 (β ) = −δ(0,1,0,0,0) Xe1> ΛXe1 , K22 (β ) = −δ(0,1,0,0,0) Xe2> ΛXe2 , e. K21 (β ) = K12 (β ) = −δ(0,1,0,0,0) Xe1> ΛXe2 . em que. " K(β )−1 =. K 11 K 12 K 21 K 22. # ,. sendo. K. 11. 12. −1 (β ) = −δ(0,1,0,0,0). K (β ) = K. 21. −1 > e e X1 ΛX1 ,. −1 (β ) = −δ(0,1,0,0,0). −1 > e e X1 ΛX2 ,. e. −1 −1 Xe2> ΛXe2 K22 (β ) = −δ(0,1,0,0,0) . Para testar a hipótese nula H03 versus a alternativa H13 será utilizada a estatística escore SR , que em problemas regulares, tem, segundo a hipótese nula H03 , distribuição assintótica qui-quadrado com q graus de liberdade, sendo que q é a diferença entre as dimensões dos espaços paramétricos sob a hipótese alternativa e nula. A estatística escore, originalmente sugerida por Rao (1947), é dada por. SR = U1> (θe)K 11 (θe)U1 (θe),. (2.16). (0)> ˜ > > > e ˜ em que θ = β1 , β2 , γ e β˜2> e γ˜> são os estimadores de máxima verossimilhança 3 . Assintoticamente e sob a hipótese nula, temos que de θ sob H(0) D. SR → χ p21 ,. quando n → ∞,. sendo p o número de graus de liberdade. Então, substituindo os valores de U1 (β˜ ) e K 11 (β˜ ) na estatística escore (2.16) para testar H03 versus H13 , tem-se. SR = e r> Xe1 (Xe1> ΛXe1 )−1 Xe1>e r,. (2.17).

(27) 2.6 Teste Escore em Modelos Não–lineares SimétricosHeteroscedásticos. 28. em que a função escore U1 (β˜ ) e o inversa da matriz de informação total de Fisher para. > (0)T β K 11 (β˜ ) estão avaliadas em β1 , β˜2> , γ˜> , sendo βe2 e γ˜ é o estimador de máxima. 3 , o vetor r foi dado na Subseção 2.6.1. verossimilhança de θ sob H(0). No próximo capítulo desenvolvemos um fator de correção tipo–Bartlett, em notação matricial, para a estatística escore, via Cordeiro e Ferrari (1991)..

(28) 29. 3. Correção Tipo–Bartlett Para a Estatística Escore. 3.1. Introdução. Este capítulo visa a obter ajustes para estatísticas de teste. Mais especificamente, enfocaremos a estatística escore, SR , (Rao, 1947). Nos casos em que a estimação sob a hipótes alternativa é complicada, o teste baseado na estatística escore apresenta vantagem computacional em relação a outros testes pois requer apenas a estimação dos parâmetros sob a hipótese nula. Sabe-se que os testes baseados nas estatísticas da razão de verossimilhanças (LR), SR e Wald (W ) são equivalentes em grandes amostras e, em problemas regulares, convergem segundo a hipótese nula H0 para a distribuição χq2 , em que q é o número de restrições impostas por H0 . Entretanto, em pequenas amostras, a aproximação da distribuição da estatística de teste pela distribuição χ 2 pode não ser satisfatória. A primeira idéia para melhorar as propriedades de estatísticas de testes foi proposta por Bartlett (1953) considerando apenas a estatística da razão de verossimilhanças, computando o seu valor esperado segundo a hipótese nula até a ordem n−1 , em que n é o tamanho da amostra. Harris (1985) obteve uma expansão assintótica para a distribuição da estatística escore SR até ordem n−1 . Honda (1988) derivou a correção do valor crítico da estatística SR para o teste de homoscedasticidade no modelo normal heteroscedástico. Através do trabalho de Harris (1985), Cordeiro e Ferrari (1991) demonstraram que, sob condições gerais de regularidade, qualquer estatística cuja distribuição assintótica é quiquadrado pode ser aperfeiçoada por um fator de correção multiplicativo expresso como um polinômio de segundo grau na própria estatística. Baseado no trabalho de Cordeiro e Ferrari (1991), muitos resultados têm sido publicados envolvendo estatísticas escore aperfeiçoadas por fatores de correções tipo–Bartlett em várias classes de modelos de regressão. Ferrari e Cordeiro (1994) desenvolveram expressões matriciais para o fator de correção tipo–Bartlett da estatística escore em problemas com parâmetros globalmente ortogonais. Cribari-Neto e Ferrari (1995a) aperfeiçoaram o teste escore nos modelos li-.

(29) 30. 3.2 Correção Tipo–Bartlett. neares heteroscedásticos. Similarmente, correções tipo–Bartlett para a estatística escore em alguns modelos de regressão multivariados foram obtidas por Cribari-Neto e Zarkos (1999). Cribari-Neto e Ferrari (1995b) obtiveram um fator de correção tipo–Bartlett para a estatística escore em modelos normais lineares heteroscedásticos. Uribe-Opazo (1997) obteve um fator de correção de Bartlett para a estatística da razão de verossimilhanças, generalizando o trabalho de Ferrari e Arellano-Valle (1996); e, ainda, a correção tipo–Bartlett nos modelos lineares simétricos homoscedásticos, sob o enfoque de Cordeiro e Ferrari (1991). Cordeiro et al. (2000) obtiveram a correção de viés dos estimadores de máxima verossimilhança na classe dos modelos de regressão não–lineares simétricos homoscedásticos. Fioresi (2000) obteve fatores de correção de Bartlett e tipo–Bartlett para as estatísticas da razão de verossimilhanças e escore, respectivamente, na classe dos modelos normais heterocedásticos com funcões de ligação quaisquer para a média e para o parâmetro de precisão. Um fator de correção tipo–Bartlett para a estatística escore em modelos de regressão não–lineares simétricos homoscedásticos foram desenvolvidas por Cysneiros et al. (2008). Neste capítulo, obteremos um fator de correção tipo–Bartlett para a estatística escore para vários testes de hipóteses: sobre a média e/ou o parâmetro de precisão, em modelos não–lineares simétricos heteroscedásticos. Generalizamos, portanto, os resultados de Uribe-Opazo et al. (2008), Fioresi (2000) e Cysneiros et al. (2008).. 3.2. Correção Tipo–Bartlett. Cordeiro e Ferrari (1991) mostraram que, em problemas regulares, a estatística escore,. SR , pode ser melhorada por uma correção tipo–Bartlett que não é exatamente a correção de Bartlett porque envolve um polinômio de segundo grau na estatística original, produzindo uma estatística escore modificada ajustada com distribuição χ 2 até ordem n−1 , segundo a hipótese nula. Cordeiro e Ferrari (1991) propuseram a estatística escore modificada, dada por. SR∗. = SR 1 −. A3 A2 − 2A3 A1 − A2 + A3 2 S − SR − , 12u(u + 2)(u + 4) R 12(u + 2) 12u. (3.1). sendo A1 , A2 , e A3 funções de cumulantes conjuntos de derivadas do logaritmo da função de verossimilhança. Fórmulas matriciais para estas funções relativas aos testes escores são dadas, em generalidade, por Ferrari e Cordeiro (1994). Os coeficientes A1 , A2 e A3 , na forma matricial, podem ser escritos como.

(30) 31. 3.2 Correção Tipo–Bartlett. A1 = 3 ∑ β ,γ κl1 l2 l3 + 2κl1 ,l2 l3. . κl4 l5 l6 + 2κl4 ,l5 l6 al1 l2 al5 l6 ml3 l4. l. −6 ∑ β ,γ κl1 l2 l3 + 2κl1 ,l2 l3 κl4 ,l5 ,l6 al1 l2 al3 l4 ml5 l6 l. +6 ∑ β ,γ κl1 ,l2 l3 − 2κl1 ,l2 ,l3. . κl4 l5 l6 + 2κl4 l5 ,l6 al2 l5 al3 l6 ml1 l4. l. +6 ∑ β ,γ κl1 l2 l3 l4 + κl1 ,l2 ,l3 l4 al3 l4 ml1 l2 , l. = A11 + A12 + A13 + A14 ,. (3.2). A2 = −3 ∑ β ,γ κl1 ,l2 ,l3 κl4 ,l5 ,l6 al3 l4 ml1 l2 ml5 l6 l. +6 ∑ β ,γ κl1 l2 l3 + 2κl1 ,l2 l3 κl4 ,l5 ,l6 al1 l2 ml3 l4 ml5 l6 l. −6 ∑ β ,γ κl1 ,l2 ,l3 κl4 ,l5 ,l6 al3 l6 ml1 l4 ml2 l5 l. +3 ∑ β ,γ κl1 ,l2 ,l3 l4 ml1 l2 ml3 l4 , l. = A21 + A22 + A23 + A24 ,. (3.3). A3 = 3 ∑ β ,γ κl1 ,l2 ,l3 κl4 ,l5 ,l6 ml1 l2 ml3 l4 ml5 l6 l. +2 ∑ β ,γ κl1 ,l2 ,l3 κl4 ,l5 ,l6 ml1 l4 ml2 l5 ml3 l6 , l. = A31 + A32 ,. (3.4). sendo que os índices l1 , · · · , l6 variam sobre todos os componentes dos vetores β e γ , e. ∑ β ,γ denota todas as possíveis combinações de p+q parâmetros de β1 , · · · , β p e γ1 , · · · , γq . Para o modelo (2.1), as parcelas de A1 , A2 e A3 foram desenvolvidos substituindo cumulantes de até quarta ordem. Portanto, um teste escore aperfeiçoado pode ser encontrado utilizando-se a estatística SR∗ e a distribuição χq2 de referência ou usando a estatística. SR juntamente com os valores críticos corrigidos. Entretanto, a estatística escore aperfeiçoada (SR∗ ) nem sempre é uma transformação monótona, assim, para solucionar esse problema Kakizawa (1996) sugeriu uma transformação monótona dada por K = SR∗ + P(SR ), ∗ ) dada por envolvendo a própria estatística escore e os coeficientes a, b e c, sendo P(SR1 ∗ SR1. 1 2 4 2 3 9 5 2 4 = c SR + 2bcSR + 2ac + b SR + 3abSR + SR . 4 3 5. Posteriormente, Cordeiro et al. (1998) também apresentaram uma fórmula para a estatística escore aperfeiçoada, de modo que também fosse uma transformação monótona.

(31) 3.3 Correção tipo–Bartlett à estatística escore envolvendo a média e o parâmetro de precisão. 32. ∗ é expressa em termos da função da distribuição normal de SR . A estatística alternativa SR2. padrão Φ na forma.  q 2 b π   exp − c ×  3a 3a  q  √ q ∗ 2 2 SR2 = Φ 6aSR + 3a b − Φ , se a > 0, 3a b      1 exp(−c) {1 − exp(−2bSR )}, se a = 0 e b 6= 0. 2b ∗ = S (1 − c), e não é necessário definir uma Observe que se a = 0 e b = 0, temos SR2 R. estatística escore alternativa.. 3.3. Correção tipo–Bartlett à estatística escore envolvendo a média e o parâmetro de precisão. Consideraremos o modelo não–linear simétrico definido em (2.1) e as seguintes partições β = β1> , β2>. T. , em que β1 = (β1 , · · · , β p1 )> , β2 = β p1 +1 , · · · , β p. sendo γ1 = γ1 , · · · , γq1. >. e γ2 = γq1 +1 , · · · , γq. >. >. , γ = γ1> , γ2>. T. ,. , com p1 ≤ p e q1 ≤ q. Tais decomposições. induzem as seguintes partições X = (X1 , X2 ) , P = (P1 , P2 ), U = U1> ,U2>. >. , ou seja. > U = Uβ>1 (β1 , β2 , γ1 , γ2 ), Uβ>2 (β1 , β2 , γ1 , γ2 ), Uγ>1 (β1 , β2 , γ1 , γ2 ), Uγ>2 (β1 , β2 , γ1 , γ2 ) , de modo que X1 , X2 , P1 e P2 são matrizes conhecidas de posto completo e dimensões. n × p1 , n × (p − p1 ), n × q1 e n × (q − q1 ), respectivamente. O objetivo dessa seção é encontrar o fator de correção tipo–Bartlett para a estatística (0). escore dada por (2.10). Estamos interessados em testar a hipótese H01 : β1 = β1 , γ1 = (0). (0). (0). γ1 contra H11 : pelo menos uma das igualdades é violada, em que β1 e γ1 são vetores fixados de dimensões p1 e q1 , respectivamente. A matriz de informação total de Fisher correspondente é dada por.  K=. K11 K12 K21 K22. !. Kβ11. 0.   0 Kγ11  =  Kβ 0 21  0 Kγ21. Kβ12. 0. 0. Kγ12. Kβ22. 0. 0. Kγ22.     ,  . sendo que as matrizes Kβ11 , Kβ12 = Kβ> , Kβ22 , Kγ11 , Kγ12 = Kγ>21 , Kγ22 estão definidas na 21. Seção (2.8). Definimos, também, as matrizes.

(32) 3.3 Correção tipo–Bartlett à estatística escore envolvendo a média e o parâmetro de precisão. B=. 0. 0. ! ,. −1 0 K22. −1 K22. =. K β22. 0. 0. K γ22. 33. ! ,. e M = K −1 − B, para. K. −1. =. K 11 K 12 K 21 K 22. ! .. Por simplicidade, apresentamos somente as expressões do fator tipo–Bartlett para os modelos não–lineares simétricos heteroscedásticos. Detalhes sobre o desenvolvimento destas deduções encontram-se no Apêndice A. Para os modelos não–lineares simétricos heteroscedásticos, definido em (2.1), os elementos A11 , · · · , A14 , A21 , · · · , A24 , A31 e. A32 foram desenvolvidos substituindo os cumulantes apresentados na seção 3.2 nas expressões (3.2) até (3.4). Após extensas manipulações algébricas, obtemos as seguintes expressões para os A0 s. A11 = 3(δ(2,0,0,0,0) )−1 (ι > Q2 Λ6 (Zβ − Z2β )Λ6 Q2 ι) n +b1 − δ(0,0,1,0,1) + 2δ(0,1,0,0,0) ι > Λ4 Z2β d (Zγ − Z2γ )Z2β d Λ4 ι + (7 − 9δ(0,1,0,0,2) − δ(0,0,1,0,3) )ι > Λ4 Z2β d (Zγ − Z2γ )Z2γd Λ1 ι o + 6(−1 + δ(0,1,0,0,2) )ι > Λ1 Z2β d (Zγ − Z2γ )Z2γd Λ2 1 n +b2 7 − 9δ(0,1,0,0,2) − δ(0,0,1,0,3) ι > Λ1 Z2γd (Zγ − Z2γ )Z2β d Λ4 ι o − 6(−1 + δ(0,1,0,0,2) )ι > Λ2 Z2γd (Zγ − Z2γ )Z2β d Λ4 ι +b16 ι > Λ1 Z2γd (Zγ − Z2γ )Z2γd Λ1 ι + b17 ι > Λ1 Z2γd (Zγ − Z2γ )Z2γd Λ2 ι +b18 ι > Λ2 Z2γd (Zγ − Z2γ )Z2γd Λ1 ι + b19 Λ2 Z2γd (Zγ − Z2γ )Z2γd Λ2 ι,. A12 = b10. . (3.5). (δ(2,0,0,0,2) − 1)/δ(2,0,0,0,0) (δ(3,0,0,0,1) − δ(0,1,0,0,0) )ι > Λ4 Z2β d. ∗Z2γ (Zβ − Z2β d )Λ4 ι. + (1 − 3δ(0,1,0,0,2) − δ(0,0,1,0,3) ) ι > Λ4 Z2β d Z2γ (Zγd − Z2γd )Λ1 ι δ(2,0,0,0,2) −b11 (7 − 9δ(0,1,0,0,2) − δ(0,0,1,0,3) ) ι > Λ1 Z2γd Z2γ (δ(2,0,0,0,2) − 1) ∗(Zβ d − Z2β d )Λ4 ι o − 6(δ(0,1,0,0,2) − 1)ι > Λ2 Z2γd Z2γ (Zβ d − Z2β d )Λ4 ι +b9 7 − 9δ(0,1,0,0,2) − δ(0,0,1,0,3) ι > Λ1 Z2γd Z2γ (Zγd − Z2γd )Λ1 ι +6(−1 + δ(0,1,0,0,2) )ι > Λ2 Z2γd Z2γ (Zγd − Z2γd )Λ1 ι } ,. (3.6).

(33) 3.3 Correção tipo–Bartlett à estatística escore envolvendo a média e o parâmetro de precisão. 34. A13 = −6ι > Λ6 (Zβ − Z2β )(Zβ − Z2β )Λ6

(34) Jι +2b1 (δ((1,1,0,0,1) − δ(3,0,0,0,1) ) ι > Λ4 Z2β

(35) (Zβ − Z2β )

(36) Z2γ Λ4 ι + 3(δ(3,0,0,0,1) − δ(1,0,0,0,1) ) ι > Λ4 Z2β

(37) (Zγ − Z2γ )

(38) Z2β Λ4 ι +b5 1> Λ1 Z2γ

(39) (Zγ − Z2γ )

(40) Z2γ Λ1 ι + b6 ι > Λ2 Z2γ (Zγ − Z2γ )Z2γ Λ2 ι + b7 1> Λ1 Z2γ

(41) (Zγ − Z2γ )

(42) Z2γ Λ2 ι + b8 1> Λ2 Z2γ (Zγ − Z2γ )Z2γ Λ1 ι,. (3.7). . A14 = b15tr Λ6 Z2β d (Zβ d − Z2β d ) . +b12 tr Λ7 Z2γd (Zβ d − Z2β d ) . −2b11 δ(2,0,0,0,0)tr Λ8 Z2γd (Zβ d − Z2β d ) +b13 tr{Λ9 Z2γd (Zγd − Z2γd )} 12(2 − 3δ(2,0,0,0,2) + δ(3,0,0,0,3) ) tr{Λ3 Z2γd (Zγd − Z2γd )} − (δ(2,0,0,0,2) − 1)2 +b14 tr{Λ7 Z2β d (Zγd − Z2γd )},. (3.8). A21 = 2b11 ι > Λ4 (Zβ d − Z2β d )Z2γ (Zβ d − Z2β d )Λ4 ι +b9 (1 − 3δ(0,1,0,0,2) − δ(0,0,1,0,3) )1> Λ1 (Zγd − Z2γd )Zγ (Zγd − Z2γd )Λ1 ι −b10 (δ(2,0,0,0,2) − 1)(1 − 3δ(0,1,0,0,2) − δ(0,0,1,0,3) ) ∗ι > Λ1 (Zγd − Z2γd )Zγ (Zβ d − Z2β d )Λ4 ι,. (3.9). A22 = 2b1 (δ(3,0,0,0,1) − δ(0,1,0,0,0) )ι > Λ4 Z2β d (Zγ − Z2γ )(Zβ d − Z2β d )Λ4 ι 4 b1 δ(2,0,0,0,0) − (1 − 3δ(0,1,0,0,2) − δ(0,0,1,0,3) )ι > Λ4 Z2β d (Zγ − Z2γ ) (δ(2,0,0,0,2) − 1) ∗(Zγd − Z2γd )Λ1 ι b11 δ(2,0,0,0,0) n − (1 − 9δ(0,1,0,0,2) + δ(0,0,1,0,3) )ι > Λ1 Z2γd (Zγ − Z2γ ) (δ(2,0,0,0,2) − 1) ∗(Zβ d − Z2β d )Λ4 ι o + 2(−1 + 8δ(0,1,0,0,2) )ι > Λ4 Z2γd (Zγ − Z2γ )(Zβ d − Z2β d )Λ2 ι −b9 (1 − 9δ(0,1,0,0,2) − δ(0,0,1,0,3) ) ι > Λ1 Z2γd (Zγ − Z2γ )(Zγd − Z2γd )Λ1 ι +2(−1 + 8δ(0,1,0,0,2) )ι > Λ2 Z2γd (Zγ − Z2γ )(Zγd − Z2γd )Λ1 ι } ,. (3.10).

(43) 3.3 Correção tipo–Bartlett à estatística escore envolvendo a média e o parâmetro de precisão. 35. n A23 = b11 (δ(3,0,0,0,1) − δ(0,1,0,0,0) )ι > Λ4 (Zβ − Z2β )

(44) Z2γ (Zβ − Z2β )Λ4 ι o > + 2 ι Λ4 (Zβ − Z2β )

(45) Z2β (Zγ − Z2γ )Λ4 ι +2 b9 ι > Λ1 (Zγ − Zγ )

(46) Z2γ (Zγ − Zγ )Λ1 ι,. A24. (3.11). 2 ) 3(δ(4,0,0,0,0) − 3δ(0,1,0,0,0). 2 = tr Λ (Z − Z ) 6 β d 2β d 2 δ(2,0,0,0,0) . 3 δ(0,1,0,0,2) + 2δ(3,0,0,0,1) + δ(4,0,0,0,2) + tr Λ7 (Zβ d − Z2β d )(Zγd − Z2γd ) (δ(2,0,0,0,2) − 1)δ(2,0,0,0,0) 3 {−6 + δ(2,0,0,0,2) (12 − 3δ(2,0,0,0,2) ) + (δ(2,0,0,0,2) − 1)2. +4δ(3,0,0,0,3) + δ(4,0,0,0,4) }tr{Λ9 (Zγd − Z2γd )2 },. (3.12). b11. (δ − δ(0,1,0,0,0) )ι > Λ5 (Zβ d − Z2β d )(Zγ − Z2γ ) 2δ(2,0,0,0,2) (3,0,0,0,1) (Zβ d − Z2β d )Λ5 ι b11 δ(2,0,0,0,2) − (−1 + 3δ(0,1,0,0,2) + δ(0,0,1,0,3) )ι > Λ1 (Zγd − Z2γd ) (δ(2,0,0,0,2) − 1) (Zγ − Z2γ )(Zβ d − Z2β d )Λ4 ι b10 δ(2,0,0,0,2) (1 − 3δ(0,1,0,0,2) − δ(0,0,1,0,3) )2 ι > Λ1 (Zβ d − Z2β d ) − 18 (δ(2,0,0,0,2) − 1) (Zγ − Z2γ )(Zγd − Z2γd )Λ4 ι. A31 = −. −b9 1 − 3δ(0,1,0,0,2) − δ(0,0,1,0,3) ) ι > Λ1 (Zγd − Z2γd )(Zγ − Z2γ ) (Zγd − Z2γd )Λ1 ι,. (3.13). e. A32 = −b11 (δ(3,0,0,0,1) − δ(0,1,0,0,0) ) ι > Λ4 (Zβ − Z2β )

(47) (Zγ − Z2γ )

(48) (Zβ − Z2β )ι 2 b9 − (1 − 3δ(0,1,0,0,2) − δ(0,0,1,0,3) )ι > Λ1 (Zγ − Z2γ )

(49) 3 (Zγ − Z2γ )

(50) (Zγ − Z2γ )ι.. (3.14). Todas as matrizes envolvidas, são avaliadas sob o modelo restrito à hipótese nula H01 , e são definidas do seguinte modo. −1 −1 > −1 > Zβ = X Kβ β X = δ(2,0,0,0,0) X X ΛX X >,.

(51) 3.3 Correção tipo–Bartlett à estatística escore envolvendo a média e o parâmetro de precisão. se p1 ≤ p. Z2β. 36. −1 −1 > −1 > X2> , = X2 Kβ22 X2 = δ(2,0,0,0,0) X2 X2 ΛX2. e. −1 −1 > −1 Zγ = P Kγγ P> = 4 δ(2,0,0,0,2) − 1 P P Λ5 P P> , se q1 ≤ q. −1 −1 > > P2> , Λ P P = 4 δ − 1 P P Z2γ = P2 Kγ−1 2 (2,0,0,0,2) 2 5 2 2 22. que são as matrizes de covariância assintóticas de X βb correspondentes a Zβ e Z2β e Pγb retativo a Zγ e Z2γ . A notação

(52) indica a operação de produto direto entre matrizes e ι é um vetor n×1 de valores iguais a 1. As matrizes diagonal Λ0 s presentes nas expressões acima são dadas por. (. Λ1 = Λ3 = Λ5 = Λ7 = Λ9 =. h0l 3 φl 3. ). h0l h00l diag , Λ2 = diag , φl 2 ) ( 0 hl h0l h00l 2 , Λ = diag . diag 4 φl 3 φl 2 ( ) h0l 2 1 , Λ = diag , 6 φl 2 φl 2 ( ) 00 h0l 2 hl diag , Λ8 = diag , 3 φl φl 2 ( ) h0l 4 diag . φl 4 . (3.15). Com a finalidade de tornar mais atraente as expressões matricias de A11 até A32 , foram utilizadas substituições para as quantidades b1 até b19 com os valores dados a seguir.