Estimação dos parâmetros de um círculo para modelos heteroscedásticos de regressão
Texto
(2) 2.
(3) 3.
(4) c Copyright by FRANCISCO EDUARDO ROMERO MORALES 2006 Todos os direitos reservados Typeset by LATEX.
(5) A Carmen y Francisco, que me han dado lo mejor posible. A la memoria de familiares y amigos Cristian, Empera, Nohemi, Blanca, Marcos y Miguel.. iii.
(6) AGRADECIMENTOS. A Deus principal fonte de sabidur´ıa. Aos meus pais que me han dado amor incondicionalmente. A minhas irm˜ as e familia que estiveram presentes em minha forma¸c˜ao. Aos professores Klaus Vasconcellos e Francisco Cribari Neto, pelo profissionalismo e orienta¸c˜ ao. A Val´eria, por sua amabilidade e bom esp´ırito de colabora¸c˜ao. A colegas e amigos de mestrado N´ataly, Daniela, Renata, Fabio, Tiago, Carlos, Camilo e Artur pelos horas de divers˜ ao, companherismo e orienta¸co˜es. ´ Coordena¸c˜ A ao de Aperfeicoamento de Pessoal de Nivel Superior, CAPES, pelo apoio financiero.. iv.
(7) RESUMO. T´ecnicas cl´ assicas de regress˜ao linear assumem que os erros, que representam a componente aleat´ oria do modelo, tˆem variˆ ancia constante, ou seja, assumem homoscedasticidade. Esta ´e uma suposi¸c˜ ao bastante forte e, em grande parte dos problemas pr´ aticos, pouco razo´ avel. Um estimador consistente da matriz de variˆ ancias e covariˆancias do estimador do vetor de parˆ ametros foi proposto por Halbert White e ´e conhecido como HC0. Algumas formas alternativas deste estimador foram propostas na literatura, dentre as quais destacam-se HC1, HC2, HC3 e HC4. Os estimadores HC’s usam os quadrados dos res´ıduos irrestritos; n´ os apresentamos tamb´em variantes que usam os quadrados dos res´ıduos restritos, denotadas por HCR0, HCR1, HCR2, HCR3 e HCR4. O objetivo da presente disserta¸c˜ao ´e, atrav´es de uso de m´etodos num´ericos, estudar o comportamento, sob heteroscedasticiadade, de inferˆencia sobre os parˆ ametros de um c´ırculo mediante um modelo de regress˜ao e mediante o uso dos estimadores consistentes da matriz de variˆ ancia e covariˆ ancias do estimador do vetor de parˆ ametros de regress˜ao.. v.
(8) ABSTRACT. This thesis considers the have issue of performing inference on the parameters of a circle through a regression model. We focus on the situation where the erros are heteroskedastic and the functional form of heteroskedasticity is unknown. We evaluate the finite-sample performance of tests based on different consistent estimators of the variance-covariance matrix of the vector of least squares parameter estimators.. vi.
(9) ´Indice. 1 Introdu¸ c˜ ao 1.1 Considera¸c˜ oes iniciais 1.2 Organiza¸c˜ ao da disserta¸c˜ao 1.3 Suporte computacional. 1 1 3 3. 2 Modelo de regress˜ ao 2.1 Introdu¸c˜ ao 2.2 O modelo de regress˜ao linear e seus estimadores 2.3 Dados direcionais 2.3.1 Introdu¸c˜ ao 2.3.2 Estat´ısticas descritivas de dados circulares 2.3.3 Algumas distribui¸c˜oes de probabilidade circulares 2.3.4 Modelos de regress˜ao 2.4 O modelo estudado e suas estimativas. 4 4 6 20 20 20 24 29 32. 3 Avalia¸ c˜ ao num´ erica 3.1 Introdu¸c˜ ao 3.2 Metodologia 3.3 Resultados num´ericos 3.4 Medidas descritivas da distribui¸c˜ao emp´ırica das estat´ısticas de teste. 37 37 38 41 68. 4 Conclus˜ oes. 87. Referˆ encias Bibliogr´ aficas. 89. vii.
(10) CAP´ITULO. 1. Introdu¸c˜ao. 1.1. Considera¸ c˜ oes iniciais An´alise de regress˜ao ´e uma ferramenta estat´ıstica que explora a rela¸c˜ao entre vari´ aveis. quantitativas (ou qualitativas). Foi primeiro desenvolvida pelo pesquisador britˆ anico Sir Francis Galton (1822-1911), num estudo das alturas m´edias dos filhos e pais muito altos e muito baixos. Ele descobriu que filhos de pais muito altos ou muito baixos tendiam a ser altos ou baixos, respectivamente, mas n˜ ao t˜ao altos ou t˜ao baixos quanto seus pais. Essa tendˆencia de se mover afastando-se dos extremos em dire¸c˜ao `a m´edia foi chamada de regress˜ ao. O estudo foi publicado em 1885 e denominado de Regress˜ ao em Dire¸ca ˜o a ` Mediocridade na Estatura Heredit´ aria. A inferˆencia estat´ıstica tradicional sobre o modelo de regress˜ao linear est´ a funda1.
(11) mentada em suposi¸c˜ oes muito estritas sobre a componente aleat´oria, que na pr´ atica s˜ ao freq¨ uentemente violadas. Em particular, ao se utilizar o modelo de regress˜ao cl´assico, ´e usual assumir que os erros tˆem variˆ ancia constante, caso em que se diz haver homoscedasticidade; esta suposi¸c˜ ao n˜ ao ´e verificada em muitas situa¸c˜oes pr´ aticas. Na presen¸ca de heteroscedasticidade, a estimativa pelo m´etodo de m´ınimos quadrados ordin´arios da matriz de variˆ ancias e covariˆ ancias dos estimadores dos parˆ ametros de regress˜ao torna-se imprecisa, podendo conduzir a conclus˜oes incorretas a respeito da rela¸c˜ao entre as vari´ aveis dependente e explicativas do modelo. Isso ocorre porque os testes t associados requerem estimativas confi´ aveis das variˆ ancias dos estimadores dos parˆ ametros. Uma poss´ıvel solu¸c˜ ao ´e usar estimadores consistentes da matriz de variˆ ancias e covariˆ ancias, os estimadores HC’s, que funcionam bem tanto sob homoscedasticidade quanto sob heteroscedasticidade (Long & Ervin 2000). Os estimadores HC’s usam os quadrados dos res´ıduos irrestritos; em contraste, as variantes que usam quadrados dos res´ıduos restritos, denotadas por HCR0, HCR1, HCR2, HCR3 e HCR4, funcionam bem em amostras finitas com diferen¸cas pequenas entre elas (Godfrey 2005). Nosso objetivo ´e realizar uma compara¸c˜ao dos testes de hip´ oteses baseados nos diferentes estimadores da matriz de variˆ ancias e covariˆ ancias do estimador do vetor de parˆ ametros, com base em um conjunto de dados circulares usando modelos de regress˜ao linear com estrutura de variˆ ancia heterosced´astica quando as diferen¸cas angulares entre dois pontos quaisquer s˜ ao conhecidas.. 2.
(12) 1.2. Organiza¸ c˜ ao da disserta¸ c˜ ao A presente disserta¸c˜ ao de mestrado est´ a dividida em quatro cap´ıtulos. No segundo. cap´ıtulo ´e apresentado formalmente o modelo de regress˜ao linear e algumas de suas propriedades quando tem-se estrutura de variˆ ancia homosced´ astica e heterosced´astica. Faz-se ´ uma breve descri¸c˜ ao dos dados direcionais, e as suposi¸c˜oes que, em geral s˜ ao feitas. E apresentado o modelo no que ´e baseada a presente disserta¸c˜ao. No terceiro cap´ıtulo s˜ ao apresentados os resultados num´ericos, onde ´e feita uma compara¸c˜ao entre os desempenhos dos testes baseados nos diferentes estimadores da matriz de variˆ ancias e covariˆ ancias, HC0, HC2, HC3 e HC4, e os testes baseados nos estimadores restritos da matriz de variˆ ancias e covariˆ ancias HCR0, HCR2, HCR3 e HCR4. No quarto cap´ıtulo s˜ ao apresentadas as conclus˜oes obtidas ao longo desta disserta¸c˜ao.. 1.3. Suporte computacional A linguagem de programa¸c˜ao matricial Ox, criada por Jurgen Doornik em 1994,. constitui a plataforma computacional utilizada no desenvolvimento da presente disserta¸c˜ ao de mestrado. Esta ´e uma linguagem bastante flex´ıvel e que permite a implementa¸c˜ ao de t´ecnicas estat´ısticas com grande facilidade e eficiˆencia. Ela ´e distribuida gratuitamente para uso acadˆemico no endere¸co: http://www.doornik.com. Detalhes sobre esta linguagem de programa¸c˜ ao podem ser encontrados em Doornik (2001).. 3.
(13) CAP´ITULO. 2. Modelo de regress˜ao. 2.1. Introdu¸ c˜ ao An´alise de regress˜ao ´e uma ferramenta estat´ıstica que explora a rela¸c˜ao entre vari´ aveis. quantitativas (ou qualitativas). T´ecnicas cl´assicas de regress˜ao linear tipicamente assumem que os erros, que correspondem `a componente aleat´oria do modelo, tˆem variˆ ancia constante, ou seja, apresentam a propriedade de homoscedasticidade. Esta suposi¸c˜ao ´e bastante forte e em muitos problemas pr´ aticos ´e pouco razo´ avel. Para a estima¸c˜ ao dos parˆ ametros ´e comum usar o m´etodo de m´ınimos quadrados ordin´ arios (MQO), o qual fornece estimadores que possuem propriedades desej´aveis, como n˜ ao-vi´es, consistˆencia e eficiˆencia, al´em da f´acil implementa¸c˜ao computacional. Quando a suposi¸c˜ ao de homoscedasticidade ´e violada, ou seja, a variˆ ancia dos erros n˜ ao ´e constante, 4.
(14) dizemos que h´ a heteroscedasticidade no modelo. Sob heteroscedasticidade, o estimador de m´ınimos quadrados ordin´ arios (EMQO) do vetor de parˆ ametros de regress˜ao mant´em algumas propriedades, ele ´e n˜ ao-viesado e consistente, tornando-se ineficiente, i.e., n˜ ao sendo mais o melhor estimador linear n˜ ao-viesado. O estimador usual de sua matriz de variˆ ancias e covariˆ ancias passa a ser viesado e n˜ aoconsistente, tornando, assim, pouco confi´ aveis estimativas intervalares e testes de hip´ oteses (tais como o teste t) que utilizam estes valores. Torna-se necess´aria a obten¸c˜ao de um m´etodo de estima¸c˜ ao alternativo para a matriz de variˆ ancias e covariˆ ancias dos estimadores dos parˆ ametros da regress˜ao. Dessa forma, ´e poss´ıvel realizar inferˆencias assintoticamente v´alidas. A estima¸c˜ ao dos parˆ ametros do c´ırculo pode ser feita com base no melhor estimador linear n˜ ao-viesado (BLUE), via estima¸c˜ao de m´ınimos quadrados (EMQO) ou atrav´es de estima¸c˜ ao em duas etapas (TSE), esta u ´ltima tendo sido proposta por Yin & Wang (2004). Na literatura h´ a uma grande variedade de m´etodos para estima¸c˜ao no c´ırculo, algumas delas fazendo uso de modelos estat´ısticos; ver, por exemplo, Chan (1965), Anderson (1981), Berman & Culpin (1986) e Wu (1997). Sejam (xi , yi ) as coordenadas x e y do i-´esimo dado, n o n´ umero de dados, (ξ1 , ξ2 ) as coordenadas do centro e ρ o raio do c´ırculo. Para o c´alculo estat´ıstico, Berman & Somlo (1986) assumem que todos os xi e yi s˜ ao vari´ aveis aleat´orias com variˆ ancia comum. Em algumas situa¸c˜ oes pr´ aticas esta suposi¸c˜ao pode ser violada; como notou Kasa (1976), em engenharia de microondas. Um dos exemplos de aplica¸c˜ao para este tipo de modelo ´e a calibra¸c˜ ao de um instrumento de medi¸c˜ao da impedˆ ancia. O Laborat´ orio de Microondas no. 5.
(15) Laborat´ orio de Medidas Nacional CSIRO tem um instrumento o qual ´e usado para medir a impedˆ ancia (um n´ umero complexo) nas freq¨ uˆencias de microonda. Este instrumento deve ser calibrado (Somlo & Hunter 1982). No processo de calibra¸c˜ao, diversas se¸c˜oes de linha da transmiss˜ ao da precis˜ao variando comprimentos e termina¸c˜oes com impedˆ ancia comum s˜ ao conectadas ao instrumento. A conex˜ao de cada se¸c˜ao produz um n´ umero complexo chamado coeficiente de reflex˜ ao. De acordo com a teoria f´ısica, o coeficiente de reflex˜ao fica num c´ırculo com centro e radio desconhecido, j´a que a solu¸c˜ao de este sistema corresponde `as equa¸c˜ oes de um c´ırculo, mas devido a v´arias causas as leituras est˜ ao sujeitas a uma componente aleat´ oria (s˜ ao ruidosas). A calibra¸c˜ao do instrumento requer a estima¸c˜ ao do centro do c´ırculo te´ orico. Igualmente, as diferen¸cas angulares entre os coeficientes de reflex˜ao est˜ ao funcionalmente relacionadas aos comprimentos da correspondente se¸c˜ao da linha de transmiss˜ ao de uma maneira sabida. Daqui, um conhecimento dos comprimentos das se¸c˜oes permite um uso do modelo a estudar para estimar o centro do c´ırculo. Neste cap´ıtulo estudaremos a estima¸c˜ ao do c´ırculo por um modelo de regress˜ao que foi introduzido em Berman & Somlo (1986) e Berman (1983); por enquanto, n˜ ao assumimos que xi e yi tˆem variˆ ancia comum.. 2.2. O modelo de regress˜ ao linear e seus estimadores Consideramos o modelo de regress˜ao linear definido como y = Xβ + ε,. (2.1). onde y = (y1 , y2 , . . . , yn )⊤ ´e um vetor contendo n observa¸c˜oes da vari´ avel dependente, X ´e uma matriz n × p (p. <. n) de regressores fixos, de posto coluna completo, 6.
(16) β. =. (β1 , β2 , . . . , βp )⊤ ´e um vetor contendo os p parˆ ametros desconhecidos e. ε = (ε1 , ε2 , . . . , εn )⊤ ´e um vetor de erros aleat´orios. As seguintes suposi¸c˜ oes s˜ ao feitas: 1. E(εi ) = 0,. i = 1, 2, . . . , n;. 2. E(ε2i ) = σi2 ,. 0 < σi2 < ∞, i = 1, 2, . . . , n;. 3. E(εi εj ) = 0,. ∀i 6= j;. 4. lim. n→∞. 1 ⊤ nX X. =L,. onde L ´e uma matriz positiva definida;. As suposi¸c˜ oes (1) − (3) garantem que o vetor de erros do modelo ε tem m´edia zero e matriz de variˆ ancias e covariˆ ancias diagonal, que definiremos como . cov[ ε ] = Ω = diag σ12 , σ22 , . . . , σn2 ,. (2.2). onde cada elemento σi2 representa a i-´esima variˆ ancia, i.e., σi2 = var(εi ), i = 1, 2, . . . , n. Em caso de homoscedasticidade, todos os elementos diagonais da matriz (2.2) s˜ ao iguais, ou seja, Ω = σ 2 In . A condi¸c˜ ao de regularidade assint´otica sobre a matriz X na suposi¸c˜ ao (4) indica que, quando n cresce, os elementos de X⊤ X n˜ ao crescem a uma raz˜ ao maior do que n e que, no limite, os regressores s˜ ao linearmente independentes. Consideremos ainda a seguinte suposi¸c˜ao: 5. lim. n→∞. 1 ⊤ n X ΩX. = M,. onde M ´e uma matriz positiva definida.. O vetor de parˆ ametros desconhecidos β representa os efeitos dos regressores considerados sobre a m´edia da vari´ avel dependente. Um dos objetivos centrais em modelagem de regress˜ao ´e fazer inferˆencias sobre este vetor de parˆametros. O m´etodo de MQO ´e o mais. 7.
(17) utilizado para estimar os parˆ ametros do modelo (2.1). O estimador MQO de β ´e obtido minimizando-se a soma de quadrados dos erros do modelo (SQ), dada por SQ = ε⊤ ε (2.3) = (y − Xβ)⊤ (y − Xβ). O EMQO de β ´e βb = (X⊤ X)−1 X⊤ y.. (2.4). Uma vez que βb ´e uma fun¸c˜ ao do vetor aleat´orio y, βb tamb´em ´e uma vari´ avel aleat´ oria.. Duas quantidades de interesse podem ser calculadas a partir da estima¸c˜ao de β e da matriz de regressores X; s˜ ao elas, o vetor de valores preditos,. b = Xβb = Hy, y. (2.5). b = (In − H)y = H∗ y, εb = y − y. (2.6). onde H = X(X⊤ X)−1 X⊤ , e o vetor de res´ıduos de MQO,. onde H∗ = In − H. A matriz H ´e chamada de matriz chap´eu por possuir a caracter´ıstica b como em (2.5), tamb´em sendo conhecida de que, quando multiplicada por y, fornece y como matriz proje¸ca ˜o. As matrizes H∗ e H s˜ ao sim´etricas e idempotentes. O i-´esimo elemento da diagonal da matriz H, hi , ´e usado como uma medida de influˆencia da i-´esima observa¸c˜ ao sobre o respectivo valor ajustado, assumindo valores no intervalo [0,1] (Hoaglin & Welsch 1978), em especial quando hi ´e grande, i.e., hi >. 2p n,. acostuma-se dizer que ´e. ponto de alavanca. Para avaliar a qualidade do estimador encontrado, devemos investigar as proprieb dades amostrais de β. 8.
(18) O estimador βb pode ser escrito como. βb = (X⊤ X)−1 X⊤ y,. de (2.4). = (X⊤ X)−1 X⊤ (Xβ + ε),. por (2.1) (2.7). ⊤. −1. = (X X). ⊤. ⊤. −1. X Xβ + (X X). ⊤. X ε. = β + (X⊤ X)−1 X⊤ ε. Usando o fato de que X ´e uma matriz de regressores fixos, podemos obter o valor b esperado de β:. E [ βb ] = E [ β + (X⊤ X)−1 X⊤ ε ] = β + (X⊤ X)−1 X⊤ E (ε) = β,. (2.8). pela suposi¸c˜ao (1).. Um estimador qualquer θb ´e dito ser n˜ ao-viesado para um parˆ ametro θ se E( θb) = θ,. (Hogg & Craig 1995). A partir de (2.8), conclui-se que o EMQO ´e n˜ ao-viesado para β, ou seja, a m´edia de βb ´e igual ao verdadeiro valor do parˆ ametro.. Observe que para estabelecer a propriedade de n˜ ao-vi´es do EMQO, n˜ ao foi necess´ario. assumir homoscedasticidade. Utilizou-se apenas que os erros tˆem m´edia zero, al´em da suposi¸c˜ ao b´ asica de que o modelo sendo o estimado ´e o correto. Sob heteroscedasticidade, al´em de ser n˜ ao-viesado, o EMQO ´e consistente para β, i.e., quando o tamanho amostral n aumenta, βb converge em probabilidade para β, denotado plim βb = β, onde “plim”. ´ poss´ıvel provar este resultado utilizando o teorepresenta o limite em probabilidade. E rema que garante que se g(·) ´e uma fun¸c˜ao cont´ınua e zn ´e qualquer seq¨ uˆencia de vetores aleat´ orios, ent˜ ao plim g(zn ) = g [ plim(zn ) ] 9.
(19) se plim(zn ) existe (Rao 1973). Por (2.7), temos que plim( βb ) = plim( β + (X⊤ X)−1 X⊤ ε ) . −1 = β + plim n1 X⊤ X plim n1 X⊤ ε .. (2.9). Utilizando o fato de que o limite em probabilidade de uma seq¨ uˆencia n˜ ao-estoc´ astica ´e igual a seu limite e aplicando o teorema citado, tem-se que plim. . 1 ⊤ X X n. −1. −1 = plim n1 X⊤ X =. . lim. n→∞. = L−1 ,. 1 ⊤ X X n. −1. (2.10). por (4).. Al´em disso, ε ´e um vetor de vari´ aveis aleat´orias n˜ ao-correlacionadas que possuem variˆ ancias finitas e X⊤ ε =. Pn. ⊤ i=1 X(i) εi ,. onde X⊤ e a i-´esima linha da matriz X e εi ´e o i-´esimo (i) ´. P elemento do vetor ε, sendo E X⊤ ε = ni=1 X⊤ ao, pela Lei Fraca (i) E(εi ) = 0 por (1). Ent˜ de Chebyshev (Rao 1973) e por (5), temos que plim. . . 1 ⊤ X ε n. = 0;. (2.11). logo, por (2.10) e (2.11) segue que plim( βb ) = β, ou seja, βb ´e consistente para β.. Para avaliar a precis˜ao do EMQO no modelo (2.1), ser´ a obtida sua matriz de variˆ an-. cias e covariˆ ancias: Ψ = cov[ βb ]. = cov[ β + (X⊤ X)−1 X⊤ ε ],. por (2.7) (2.12). = cov[ (X⊤ X)−1 X⊤ ε ] = (X⊤ X)−1 X⊤ cov[ ε ] X(X⊤ X)−1 = (X⊤ X)−1 X⊤ ΩX (X⊤ X)−1 , 10. por (2.2)..
(20) Se o modelo for homosced´astico, a matriz de variˆ ancias e covariˆ ancias dos erros ser´ a dada por Ω = σ 2 In . Neste caso, tem-se que Ψ = (X⊤ X)−1 X⊤ σ 2 In X (X⊤ X)−1 = σ 2 (X⊤ X)−1 X⊤ X(X⊤ X)−1. (2.13). = σ 2 (X⊤ X)−1 . O Teorema de Gauss-Markov, enunciado a seguir, garante que a matriz em (2.13) b dentro da classe de estimadores lineares e ´e m´ınima, ou seja, garante a eficiˆencia de β, n˜ ao-viesados para β.. Teorema 1 (Gauss-Markov).. Seja β ∗ = C⊤ y, onde C ´e uma matriz (p × n) de. constantes tais que C⊤ X = In , e sejam v´alidas as suposi¸c˜oes (1), (2) e (3). Ent˜ao, βb ´e. mais preciso do que β ∗ se βb 6= β ∗ , ou seja,. cov(β ∗ ) = cov( βb ) + B, onde B ´e uma matriz positiva-definida. Uma implica¸c˜ ao do Teorema de Gauss-Markov ´e que, quando h´ a homoscedasticidade, o EMQO apresenta propriedades amostrais superiores a qualquer outro estimador para β que seja linear e n˜ ao-viesado. Agora, nosso interesse reside em verificar o que acontece quando a suposi¸c˜ao (2) ´e violada, ou seja, queremos analisar as conseq¨ uˆencias dos erros serem heterosced´asticos sobre o processo de estima¸c˜ ao de β. Para isso, ´e necess´ario definir o estimador de m´ınimos quadrados generalizados (EMQG). Seja o modelo (2.1) e as suposi¸c˜oes para ele estabelecidas (de (1) at´e (5)). Dado que Ω ´e uma matriz positiva definida e Ω = Ω⊤ , sua inversa existe (pela propriedade de seus 11.
(21) menores principais) e Ω−1 = (Ω−1 )⊤ , sendo Ω−1 uma matriz positiva definida. Ent˜ ao, existe uma matriz P de dimens˜ao (n × n) n˜ ao-singular (Harville 1997, p. 219) tal que Ω−1 = P⊤ P,. (2.14). PΩP⊤ = In .. (2.15). o que implica que. Assim, podemos transformar o modelo (2.1) usando a matriz P da seguinte forma: Py = PXβ + Pε, ou, fazendo uma mudan¸ca de vari´ aveis, y∗ = X∗ β + ε∗ ,. (2.16). onde y∗ = Py, X∗ = PX e ε∗ = Pε. O vetor de erros transformado ε∗ tem m´edia zero, pois pela suposi¸c˜ ao (1),. E( ε∗ ) = E( Pε ) = P E( ε ) = 0.. (2.17). A matriz de variˆ ancias e covariˆ ancias ε∗ ´e dada por. cov(ε∗ ) = E [ ε∗ ε∗T ] = E [ Pεε⊤ P⊤ ] = PΩP⊤ = I.. (2.18). Assim, o modelo transformado ´e equivalente ao modelo (2.1), exceto pela estrutura homosced´astica dos erros. Utilizando o crit´erio de m´ınimos quadrados, o estimador para o vetor de parˆ ametros β no modelo (2.16) ´e dado por βbG = X∗T X∗ 12. −1. X∗T y∗ ,.
(22) podendo ser escrito da forma b = X⊤ P⊤ PX β G = X⊤ Ω−1 X. −1. −1. X⊤ P⊤ Py (2.19). X⊤ Ω−1 y,. por (2.14).. Esse ´e o EMQG. Utilizando as suposi¸c˜oes do modelo, pode-se mostrar que βbG ´e um. estimador n˜ ao-viesado para β, ou seja,. E ( βbG ) = X⊤ Ω−1 X = X⊤ Ω−1 X. −1. −1. X⊤ Ω−1 E (y) X⊤ Ω−1 Xβ. =β e que ΨG = cov [ βbG ] = X⊤ Ω−1 X. −1. .. Assumindo que a matriz de variˆ ancias e covariˆ ancias Ω ´e conhecida e que X∗ satis-. faz as mesmas condi¸c˜ oes que X, verifica-se que βbG ´e consistente para β. Outro resultado. ´e oferecido pelo Teorema 1, estabelecendo que βbG ´e o melhor estimador linear n˜ ao-. viesado de β (BLUE, Best Linear Unbiased estimador). Como conseq¨ uˆencia, temos que. cov(βbG ) 6 cov( βb ), ou seja. −1 −1 −1 X⊤ X X⊤ ΩX X⊤ X − X⊤ Ω−1 X. ´e uma matriz positiva semi-definida. b sob heteroscedasticidade, apesar de n˜ Conclu´ımos, ent˜ ao, que o EMQO β, ao-viesado. ´e, em geral, ineficiente.. A utiliza¸c˜ ao do EMQG ´e invibilizada pelo fato de que, na pr´ atica, a matriz Ω ´e desconhecida, sendo necess´ario fazer alguma suposi¸c˜ao sobre a forma da heteroscedasticidade. Uma alternativa ´e substituir a matriz de variˆ ancias e covariˆ ancias Ω por algum 13.
(23) b obtendo-se o estimador de m´ınimos quadrados generalizado vi´ estimador consistente Ω, avel (EMQGV):. b b −1 X βb = X⊤ Ω. −1. −1. b X⊤ Ω. (2.20). y.. Usualmente sup˜oe-se que os elementos de Ω s˜ ao fun¸c˜oes de um n´ umero pequeno de parˆ ametros desconhecidos. parˆ ametros.. b ´e obtido atrav´es da estima¸c˜ao desses Sendo assim, Ω. Utilizar o EMQGV para β resolve um problema de implementa¸c˜ao pr´ atica da estima¸c˜ ao, mas as propriedades amostrais desse estimador n˜ ao s˜ ao facilmente estabelecidas. b e y s˜ b depende das obIsto deve-se ao fato de que Ω ao correlacionados, dado que Ω b −1 em (2.20) como uma matriz serva¸c˜ oes amostrais, n˜ ao sendo portanto poss´ıvel tratar Ω. b de elementos fixos, tornando at´e mesmo dif´ıcil a obten¸c˜ao de E βb .. Outro aspecto ´e que, ap´ os estimar o vetor de parˆ ametros βb para v´arios modelos,. considerando diferentes estruturas ced´ asticas, torna-se necess´ario aplicar algum teste de heteroscedasticidade para determinar se a heteroscedasticidade foi, de fato, eliminada. O que se faz mais comumente na pr´ atica ´e utilizar o. EMQO. para o vetor de. parˆ ametros da regress˜ao, que permanece n˜ ao-viesado e consistente, mesmo que nem sempre seja eficiente. Al´em disso, utiliza-se um estimador para sua matriz de variˆ ancias e covariˆ ancias que possua propriedades assint´oticas desej´aveis. Para a estima¸c˜ ao da matriz de variˆ ancias e covariˆ ancias de βb poder´ıamos pensar no. seu estimador usual, dado por. σ b 2 X⊤ X. 14. −1. ,. (2.21).
(24) com σ b2 =. 1 n−p. εb ⊤ εb,. onde εb representa o vetor de res´ıduos de MQO dado em (2.6).. Ainda, quando. cov(ε) = Ω 6= σ 2 In , ou seja, na presen¸ca de heteroscedasticidade, pode-se mostrar que E (n − p)b σ 2 = E εb ⊤ εb. = E y⊤ H∗⊤ H∗ y , por (2.6) ⊤. ∗. . =E y H y , H = tr H∗ Ω .. Assim,. 2 ⊤ −1 E σ b (X X) =E =. 1 n−p. 1 n−p. ∗. ´e sim´etrica e idempotente,. εb ⊤ εb (X⊤ X)−1 ,. ⊤. −1. (X X). (2.22). ∗. tr (H Ω),. por (2.21) (2.23) por (2.22),. que difere da matriz de variˆ ancias e covariˆ ancias Ψ dada em (2.12). Al´em disso, Ψ n˜ ao ´e estimada consistentemente quando (2.21) ´e utilizado, pois, sob algums suposi¸c˜oes, temos plim σ b2 =. 1 lim n n→∞. tr H∗ Ω ;. com isso, plim σ b2 (X⊤ X)−1 ´e diferente de (2.12).. Como o estimador usual da matriz de variˆ ancias e covariˆ ancias de βb n˜ ao apre-. senta propriedades desej´ aveis, nosso problema reside na estima¸c˜ao consistente da matriz. de variˆ ancias e covariˆ ancias do EMQO na presen¸ca de heteroscedasticidade de forma desconhecida. Um estimador consistente muito utilizado ´e o proposto por Halbert White (White 1980). Para estimar consistentemente a matriz de variˆ ancias e covariˆ ancias em (2.12) poder´ıamos tentar estimar de forma consistente Ω, a matriz de variˆ ancias e covariˆ ancias do 15.
(25) vetor de erros da regress˜ao. Note que Ω possui n variˆ ancias desconhecidas, o que torna imposs´ıvel sua estima¸c˜ ao consistentemente, j´a que dispomos de exatamente n observa¸c˜ oes. A id´eia de Halbert White foi obter um estimador para a matriz sim´etrica X⊤ ΩX, j´a que esta cont´em. p(p+1) 2. elementos distintos para qualquer tamanho amostral, e, assim, ´e poss´ıvel. ter plim. . . 1 ⊤b X ΩX n. = plim. . . 1 ⊤ X ΩX n. .. Desta forma, b = n X⊤ X Ψ = X⊤ X. −1. −1. . 1 ⊤b X ΩX n. −1 X⊤ X. b X⊤ X X⊤ ΩX. −1. (2.24). pode ser utilizado como um estimador para a matriz de variˆ ancias e covariˆ ancias de βb. (Greene 1997, p. 548).. O estimador de White, denominado HC0, ´e obtido simplesmente substituindo o i´esimo elemento da diagonal de Ω pelo quadrado do i-´esimo res´ıduo, ou seja, usando . b = diag εb 2 , . . . , εb 2 . Ω 1 n. (2.25). O estimador resultante ´e consistente para a matriz de variˆ ancias e covariˆ ancias de βb tanto. sob heteroscedasticidade como sob homoscedasticidade (White 1980), mas tende a subestimar a variˆ ancia do EMQO (Judge, Griffiths, Hill, L¨ utkepohl & Lee 1985, p. 367), o que o torna viesado. Isto foi verificado por Cribari-Neto & Zarkos (1999) e por MacKinnon & White (1985) atrav´es de simula¸c˜ oes de Monte Carlo. Chester & Jewitt (1987) investigaram o vi´es do estimador HC0 e conclu´ıram que este pode ser substancial, mesmo em grandes amostras. 16.
(26) e mesmo quando os erros s˜ ao homosced´asticos. Estes autores chamaram aten¸c˜ao para o fato de que a estrutura da matriz de regressores de X ´e importante para determinar a adequa¸c˜ ao do estimador quanto ao tamanho da amostra. Modelos que apresentam desenho contendo observa¸c˜ oes de alta alavancagem, ou seja, de influˆencia elevada para o respectivo valor predito, podem contribuir para que HC0 apresente vi´es expressivo. Desta forma, o uso deste estimador pode levar `a identifica¸c˜ao de rela¸c˜oes esp´ urias entre os regressores e a vari´ avel resposta. MacKinnon & White (1985) consideram trˆes estimadores alternativos para melhorar as propriedades de HC0 em amostras pequenas. Um ajustamento simples para HC0, sugerido por Hinkley (1977), ´e usar uma corre¸c˜ao de graus de liberdade multiplicando HC0 por. n n−p ;. em amostras finitas este fator ´e um n´ umero maior que um, portanto, tudo que. ele faz ´e inflar as estimativas fornecidas pelo estimador HC0. O estimador resultante ´e HC1 =. n n−p. X⊤ X. −1. b X⊤ X −1 X⊤ ΩX. (2.26). b ´e definido como em (2.25). onde Ω. Um segundo estimador ´e o proposto por Horn, Horn & Duncan (1975), conhecido. como HC2, onde o i-´esimo elemento da diagonal da matriz Ω, σi2 , ´e estimado por εbi2 , 1 − hi. σ bi2 =. sendo hi o i-´esimo elemento da diagonal da matriz H. Logo, HC2 = X⊤ X. −1. b 2 X X⊤ X −1 , X⊤ Ω. (2.27). onde b 2 = diag Ω. n. εb12 εbn2 , . . . , 1−h 1−h1 n. 17. o. .. (2.28).
(27) Note que, sob homoscedasticidade, E( εb εb ⊤ ) = E [H∗ y][H∗ y]⊤ ,. por (2.6). = E [H∗ yy⊤ H∗⊤ ]. (2.29) = H∗ E (yy⊤ )H∗ ⊤ = σ 2 H∗ . Assim, E(b ε2i ) = σ 2 h∗i = σ 2 (1 − hi ). Portanto, HC2 ´e n˜ ao-viesado quando h´ a homoscedasticidade. Um terceiro estimador modificado a partir de HC0 ´e obtido atrav´es da t´ecnica denominada jackknife. Recalculamos n vezes as estimativas de MQO para o vetor β, cada vez retirando uma observa¸c˜ ao; ao final do processo, calculamos a variabilidade das estimativas obtidas como uma estimativa da variˆ ancia do EMQO original. Davidson & MacKinnon (1993) propuseram o estimador HC3, que ´e uma aproxima¸c˜ao ao estimador jackknife, sendo dado por HC3 = X⊤ X. −1. b 3 X X⊤ X −1 , X⊤ Ω. (2.30). onde n o εb12 εbn2 b 3 = diag Ω , . . . , . 2 2 (1−h1 ) (1−hn ). (2.31). Cribari-Neto (2004) propˆos o estimador HC4, uma modifica¸c˜ao do estimador HC3, que leva em considera¸c˜ ao o impacto de observa¸c˜oes com alta alavancagem sobre a inferˆencia resultante em amostras finitas. O estimador HC4 incorpora fatores de desconto definidos pela raz˜ ao entre os graus individuais de alavancagem e o grau m´edio de alavancagem. A 18.
(28) importˆ ancia de considerar o efeito de alta alavancagem ´e discutida em Cribari-Neto & Zarkos (2001). O estimador HC4 ´e definido como HC4 = X⊤ X. −1. b 4 X X⊤ X −1 , X⊤ Ω. (2.32). onde b 4 = diag Ω. n. 2 εb12 , . . . , (1−hεbnn )δn (1−h1 )δ1. o. n X. hi. n o δi = min 4, hhi. h=. e. 1 n. ,. (2.33). =. 1 n. p.. i=1. O expoente δi controla o n´ıvel de desconto do quadrado do i-´esimo res´ıduo. Como. 0 < 1 − hi < 1 e δi > 0, ent˜ao 0 < (1 − hi )δi < 1. Quanto maior o. grau de alavancagem individual hi em compara¸c˜ao ao grau m´edio de alavancagem h, mais fortemente o i-´esimo res´ıduo ao quadrado ser´ a inflacionado. Na defini¸c˜ao do estimador HC4 existe um truncamento no exponente, no m´ aximo igual a 4, ou equivalente ao dobro do desconto usado pelo estimador HC3. Segundo Godfrey (2005), os testes HC’s que usam os quadrados dos res´ıduos irrestritos conduzem a resultados similares aos obtidos por MacKinnon & White (1985): HC0 pode ser pouco confi´ avel e superado por HC1, que ´e, por sua vez inferior ao HC2, que em termos da confiabilidade ´e dominado por HC3. Os resultados num´ericos em Cribari-Neto (2004) mostraram que os testes baseados em HC4 produzem inferˆencias mais confi´ aveis do que aquelas obtidas com testes que usam HC3.. 19.
(29) 2.3 2.3.1. Dados direcionais Introdu¸ c˜ ao Em algumas ´ areas da investiga¸c˜ao cient´ıfica ´e necess´aria a aplica¸c˜ao de m´etodos es-. tat´ısticos a conjuntos de dados em que algumas vari´ aveis possuem caracter´ısticas circulares. As duas principais situa¸c˜ oes em que aparecem dados circulares correspondem aos instrumentos de medida circular: o compasso e o rel´ ogio. Medidas de observa¸c˜oes por compasso podem ser, por exemplo, a dire¸c˜ao do vento ou dire¸c˜ao de vˆoo de aves. Observa¸c˜oes pelo rel´ ogio podem ser, por exemplo, o n´ umero de ocorrˆencias de algum evento durante um determinado per´ıodo de tempo, como ´e o hor´ ario de chegada (considerado sob 24 horas) de pacientes a um hospital. Se os eventos s˜ ao peri´ odicos, estes podem ser reperesentados sobre um c´ırculo, a circunferˆencia correspondendo ao per´ıodo, por exemplo, horas do dia, dias da semana, etc. De maneira um pouco mais geral, h´ a vari´ aveis que podem ser representadas sobre a superf´ıcie de uma hiper-esfera de grau p. Estes dados s˜ ao denominados direcionais (Mardia & Jupp 2000); quando p = 2, s˜ ao dados circulares e quando p = 3, s˜ ao dados esf´ericos. Em diversos textos, como Jammalamadaka & SenGupta (2001), Mardia & Jupp (2000) e Fisher (1993), s˜ ao apresentadas modifica¸c˜oes adequadas sobre as estat´ısticas cl´assicas para este tipo de dados.. 2.3.2. Estat´ısticas descritivas de dados circulares Dados circulares podem ser representados como ˆangulos ou como pontos sobre uma. circunferˆencia. A posi¸c˜ ao direcional possui representa¸c˜ao u ´nica num sistema coordenado de. 20.
(30) duas dimens˜oes, isto ´e, qualquer ponto P sobre o plano pode ser representado como (X, Y ) em termos de coordenadas retangulares ou como (r, α) em termos de coordenadas polares, onde r ´e a distˆ ancia do ponto ` a origem e α ´e a dire¸c˜ao. Para o ponto origem, tem-se que r = 0 e n˜ ao h´ a dire¸c˜ ao, i.e., α n˜ ao est´ a definido. Dire¸c˜ oes no plano podem ser representadas como vetores unit´ arios x ou, equivalentemente, como pontos no c´ırculo unit´ ario (i.e., c´ırculo com centro origem de raio um). Outras duas formas de observar tais dire¸c˜oes s˜ ao como ˆangulos ou como n´ umeros complexos de m´ odulo um. Escolhendo uma dire¸c˜ao inicial e uma orienta¸c˜ao para o c´ırculo unit´ ario (o que equivale a escolher um sistema coordenado ortogonal no plano), cada ponto pode ser representado como um ˆ angulo θ (ver figura 2.1) ou, equivalentemente, como um n´ umero complexo z, relacionados como x = ( cosθ, sinθ)⊤ e, z = eiθ = cosθ + i sinθ. i z. sinθ O. θ cosθ. 1. Figura 2.1: Representa¸c˜ ao da dire¸c˜ao x pelo ˆangulo θ e pelo n´ umero complexo z = cos θ + i sin θ.. 21.
(31) Observe que: 1. θ e θ + 2π s˜ ao o mesmo ponto. Assim, a aritm´etica que n´ os faremos no c´ırculo ser´ a de modulo 2π. 2. A representa¸c˜ ao de dire¸c˜ oes por ˆangulos ou por n´ umeros complexos unit´ arios depende da escolha da dire¸c˜ ao inicial e da orienta¸c˜ao.. A m´ edia direcional Sejam os vetores unit´ arios x1 , x2 , . . . , xn com os correspondentes ˆangulos θi , i = 1, 2, . . . , n.. A m´edia direcional. x1 + x2 + . . . + xn de x1 , x2 , . . . , xn .. de. θ de. θ 1 , θ 2 , . . . , θn. ´e a dire¸c˜ao da resultante. x1 , x2 , . . . , xn , o que equivale `a dire¸c˜ao de centro de massa x. Como as coordenadas de xj s˜ ao (cosθj , sinθj ), para j = 1, 2, . . . , n, as. coordenadas cartesianas do centro de massa s˜ ao (C, S), onde n. n. 1X C= cos θj , n j=1. 1X S= sin θj . n. (2.34). S = R sin θ,. (2.35). j=1. ao das equa¸c˜ oes Seja θ a solu¸c˜ C = R cos θ. e. com R > 0, onde a longitude da resultante m´edia R ´e dada por 2. 2. R = (C + S )1/2 . Note que θ n˜ ao est´ a definido quando R = 0.. 22. (2.36).
(32) Uma defini¸c˜ ao dada por Fisher (1993) para θ se tan−1 (S/C) π/2 se θ = tan−1 (S/C) + π se tan−1 (S/C) + 2π se ao-definida se n˜. ´e a seguinte: C > 0, S ≥ 0, C = 0, S > 0, C < 0, C ≥ 0, S < 0, C = 0, S = 0,. onde a fun¸c˜ ao tangente inversa (tan−1 ) assume valores em (−π/2, π/2). Note que θ n˜ ao ´e a m´edia dos θi ’s, ou seja, θ n˜ ao ´e igual a (θ1 + θ2 + . . . , θn )/n. Al´em de (2.34) e (2.35), tem-se que n. 1X cos (θi − θ) = R n. (2.37). i=1. e (para R > 0) n X. sin (θi − θ) = 0.. (2.38). i=1. A equa¸c˜ ao (2.38) ´e an´ aloga a n X. (xi − x) = 0,. (2.39). i=1. para observa¸c˜ oes. x1 , x2 , . . . , xn. na reta com a m´edia amostral x. As equa¸c˜oes (2.38) e. (2.39) expressam que a soma dos desvios ao redor da m´edia ´e zero.. A mediana direcional ∼. Esta medida ´e u ´til para estima¸c˜ao robusta. A dire¸c˜ao mediana amostral θ dos ˆangulos θ1 , θ2 , . . . , θn ´e qualquer ˆangulo φ tal que (i) metade dos dados ficam no arco [φ, φ + π) e (ii) a maioria dos pontos de dados est´ a mais pr´ oxima de φ do que de φ + π. 23.
(33) Quando o tamanho da amostra n ´e ´ımpar, a mediana amostral ´e um dos dados; quando n ´e par, ´e conveniente tomar a mediana amostral como o ponto m´edio de dois pontos adjacentes apropriados.. Longitude da resultante m´ edia a dada em (2.36) como o comprimento do centro A longitude da resultante m´edia R est´ de massa. Adicionalmente, os vetores x1 , x2 , . . . , xn s˜ ao vetores unit´ arios. Portanto, 0 < R < 1.. (2.40). a quase igual a 1, e se Se as dire¸c˜ oes θ1 , θ2 , . . . , θn estiverem aglomeradas, ent˜ao R ser´ θ1 , θ2 , . . . , θn estiverem dispersos, ent˜ao R ser´ a quase igual a zero. Por´em, R ´e uma medida de concentra¸ca ˜o para o conjunto de dados. Observe que qualquer conjunto de dados da forma θ1 , θ2 , . . . , θn , θ1 + π, θ2 + π, . . . , θn + π. tem R = 0. Assim,. R ≃ 0. (≃ significando. “aproximadamente igual”) n˜ ao implica que as dire¸c˜oes s˜ ao distribu´ıdas quase uniformente ao redor do c´ırculo. Cumpre ainda notar que R ´e invariante sob rota¸c˜oes.. Variˆ ancia circular Uma forma simples de definir a variˆ ancia ´e V = 1 − R.. 2.3.3. Note que 0 ≤ V ≤ 1.. Algumas distribui¸c˜ oes de probabilidade circulares A seguir, apresentaremos alguns conceitos e alguns modelos de dados circulares. O. modelo central para dados circulares ´e a distribui¸c˜ao von Mises. Outras distribui¸c˜oes no. 24.
(34) c´ırculo podem ser constru´ıdas por proje¸c˜ao radial de distribui¸c˜oes no plano ou envolvendo (“wrapping”) distribui¸c˜ oes da reta no c´ırculo.. Fun¸ c˜ ao de distribui¸ c˜ ao Suponha que a dire¸c˜ ao inicial e a orienta¸c˜ao no c´ırculo s˜ ao escolhidos, ent˜ao a fun¸c˜ ao de distribui¸c˜ ao considerada para um ˆangulo aleat´orio θ ´e dada por F (x) = Pr(0 < θ ≤ x),. 0 ≤ x ≤ 2π,. e F (x + 2π) − F (x) = 1,. −∞ < x < ∞.. (2.41). Esta equa¸c˜ ao nos diz que o arco de longitude 2π sobre o c´ırculo unit´ ario tem probabilidade 1 (j´a que este arco ´e a circunferˆencia total do c´ırculo). Para α ≤ β ≤ α + 2π, Pr(α < θ ≤ β) = F (β) − F (α) =. Z. β. dF (x),. (2.42). α. onde a integral ´e de Lebesgue-Stieltjes. A fun¸c˜ao de distribui¸c˜ao F ´e cont´ınua `a direita. Em contraste ` a fun¸c˜ ao de distribui¸c˜ao na reta, temos que lim F (x) = ∞,. lim F (x) = −∞.. x→∞. x→−∞. (2.43). Por defini¸c˜ ao, F (0) = 0. e. F (2π) = 1.. Note que, embora a fun¸c˜ ao F dependa da escolha da dire¸c˜ao zero, (2.42) mostra que F (β) − F (α) ´e independente da escolha. Assim, mudando a dire¸c˜ao zero, simplesmente adicionamos uma constante a F . 25.
(35) Se a fun¸c˜ ao de distribui¸c˜ao de probabilidade F for absolutamente cont´ınua, ent˜ ao sua fun¸c˜ ao de densidade de probabilidade f ´e tal que Z. β. f (θ)dθ = F (β) − F (α),. −∞ < α ≤ β < ∞.. α. A fun¸c˜ ao f ´e uma fun¸ca ˜o de densidade de probabilidade de uma distribui¸c˜ao absolutamente cont´ınua se e s´ o se 1. f (θ) ≥ 0,. em quase toda parte sobre (−∞, ∞),. 2. f (θ + 2π) = f (θ), 3.. R 2π 0. em quase toda parte sobre (−∞, ∞),. f (θ)dθ = 1.. Distribui¸ c˜ ao uniforme A distribui¸c˜ ao uniforme ´e a mais b´ asica. Ela ´e a u ´nica distribui¸c˜ao que ´e invariante sob rota¸c˜ ao e reflex˜ ao. Sua fun¸c˜ao de densidade de probabilidade ´e f (θ) =. 1 . 2π. (2.44). Assim, para α ≤ β ≤ α + 2π, temos Pr(α < θ ≤ β) =. β−α , 2π. i.e., a probabilidade ´e proporcional ao comprimento do arco.. Distribui¸ c˜ ao cardi´ oide Perturba¸c˜ oes da fun¸c˜ ao de densidade de probabilidade uniforme mediante uma func¸˜ao cosseno produz a distribui¸ca ˜o cardi´ oide C(µ, ρ), que tem fun¸c˜ao de densidade de pro26.
(36) babilidade f (θ) =. 1 {1 + 2ρ cos (θ − µ)}, 2π. |ρ| <. 1 . 2. (2.45). O nome vem do fato de que a curva dada em coordenadas polares por r = f (θ), com f como em (2.45), ´e a curva cardi´ oide. A distribui¸c˜ao foi introduzida por Jeffreys (1948, p. 302). A longitude resultante m´edia de C(µ, ρ) ´e ρ e (se ρ > 0) a m´edia direcional ´e µ. A distribui¸c˜ ao ´e sim´etrica e unimodal com moda em µ (se ρ > 0). Para ρ = 0, a distribui¸c˜ ao cardi´ oide se reduz ` a distribui¸c˜ ao uniforme. O principal uso da distribui¸c˜ao cardi´ oide s˜ ao as aproxima¸c˜ oes para pequenas concentra¸c˜oes da distribui¸c˜ao von Mises.. Distribui¸ c˜ ao von Mises Do ponto de vista de inferˆencia, a distribui¸c˜ao von Mises M(µ,k) ´e a distribui¸c˜ao mais usada no c´ırculo, de forma an´ aloga `a distribui¸c˜ao normal na reta (Mardia & Jupp 2000, p.32). Sua fun¸c˜ ao de densidade de probabilidade ´e g(θ; µ, k) =. 1 ek cos (θ−µ) , 2πI0 (k). θ ∈ (0, 2π),. (2.46). onde I0 denota a fun¸c˜ ao de Bessel modificada do primeiro tipo e ordem zero, definida como 1 I0 (k) = 2π. Z. 2π. ekcos θ dθ.. (2.47). 0. Sua expans˜ ao em s´eries de potˆencias ´e I0 (k) =. ∞ X r=0. 1 k 2r . (r!)2 2. (2.48). A fun¸c˜ ao de Bessel de primeiro tipo e ordem p ´e definida como Ip (k) =. 1 2π. Z. 2π. cos pθ ekcos θ dθ,. 0. 27. (2.49).
(37) sua expans˜ ao em s´eries de potˆencias sendo dada por Ip (k) =. ∞ X r=0. k 2r+p 1 . Γ(p + r + 1)Γ(r + 1) 2. (2.50). O parˆ ametro µ ´e a dire¸ca ˜o m´edia e o parˆ ametro k ´e o parˆ ametro de concentra¸ca ˜o. A longitude resultante m´edia ρ ´e A(k), definida como A(k) =. I1 (k) . I0 (k). (2.51). Note que M (µ + π, k) e M (µ, −k) s˜ ao a mesma distribui¸c˜ao. Para eliminar essa indetermina¸c˜ ao dos parˆ ametros µ, k ´e usual tomar k ≥ 0. Esta distribui¸c˜ao foi introduzida por von Mises (1918) para estudar os desvios dos pesos atˆomicos. A distribui¸c˜ ao ´e unimodal e sim´etrica ao redor de θ = µ. A moda est´ a em θ = µ e a anti-moda em θ = µ + π. A fun¸c˜ ao de distribui¸c˜ ao da distribui¸c˜ao von Mises M (0, k) ´e. 1 F (θ; 0, k) = I0 (k). Z. θ. ek cos u du.. (2.52). 0. Ela n˜ ao ´e facilmente avaliada numericamente. A fun¸c˜ao de distribui¸c˜ao da distribui¸c˜ ao N (0, k−1 ) ´e uma boa aproxima¸c˜ao `a fun¸c˜ao de distribui¸c˜ao M (0, k); para k > 10, esta aproxima¸c˜ ao ´e razoavelmente precisa (Mardia & Jupp 2000, p. 44).. Rela¸ c˜ ao com outras distribui¸ co ˜es Quando k = 0 a distribui¸c˜ao von Mises se reduz `a distribui¸c˜ao uniforme. A aproxima¸c˜ao exp(x) ≃ 1 + x mostra que, para pequenos valores de k, M (µ, k) ≃ C(µ, k/2), 28. (2.53).
(38) onde. C(µ, k/2) denota a distribui¸c˜ao cardi´ oide. Assim, a distribui¸c˜ao von Mises com. parˆ ametro de concentra¸c˜ ao pequeno aproxima a distribui¸c˜ao cardi´ oide com a mesma dire¸c˜ ao m´edia e longitude resultante m´edia. Quando k → ∞, a distribui¸c˜ao se concentra ao redor do ponto θ = µ. Assuma que k ´e grande e seja ξ = k1/2 (θ − µ). Ent˜ao, de (2.46) a fun¸c˜ ao de densidade de probabilidade de ξ ´e proporcional a exp{−k[1 − cos (k−1/2 ξ)]}.. (2.54). Para grandes valores de k, 1 1 − cos (k−1/2 ξ) = k−1 ξ 2 + O(k−2 ). 2 Ent˜ao, de (2.54) temos que. ξ ∼: N (0, 1) (∼: significando “aproximadamente distribu´ıdo. como”). Portanto, θ ∼: M (µ, k). 2.3.4. ⇒. k−1/2 (θ − µ) ∼: N (0, 1),. k → ∞.. (2.55). Modelos de regress˜ ao A maioria da aplica¸c˜ ao destes modelos fazem referˆencia `as posi¸c˜oes e localiza¸c˜oes de. objetos com respeito a um sistema de referˆencia. H´a v´arios tipos de modelos, os quais ficam dependendo do tipo de vari´ avel resposta. 1. Resposta linear Um modelo de regress˜ao de uma variavel X sobre uma variavel angular θ ´e X | θ ∼ N (α + β1 cosθ + β2 sinθ, σ 2 ) 29. (2.56).
(39) introduzido por Mardia (1976) (modelo de regress˜ao linear multiple de X sob ( cosθ, sinθ)). Extens˜ ao e aplica¸c˜ ao para estudos da polui¸c˜ao do ar ´e dado em Johnson & Wehrly (1978). 2. Resposta circular Considere uma variavel resposta Θ, a qual ´e medida em valores x1 , . . . , xn de uma vari´ avel explicativa X de dimens˜ao k.. Fun¸ co ˜es helicoidais do regress˜ ao Se k = 1, a ideia ´e envolver “wrapping” a reta no c´ırculo, o que conduz aos modelos de regress˜ao de Gould (Gould 1969), no qual Θi ∼ M (µ + βxi , k), i = 1, . . . , n,. (2.57). os Θi ’s s˜ ao independentes e µ, β e k s˜ ao parˆ ametros desconhecidos (veja tamb´em Laycock (1975)). Porque a curva de regress˜ao dada por (2.57) ´e helicoidal, este modelo ´e algumas vezes conhecido como o modelo p´ olo do barbeiro “pole baber’s”. A maior desventagem de (2.57) ´e que a fun¸c˜ ao de verossimilha¸ca tem muitos m´ aximos. Al´em disso, se x1 , . . . , xn s˜ ao igualmente espaciados ent˜ ao β n˜ ao ´e identific´ avel.. Regress˜ ao usando a fun¸ co ˜es de liga¸ c˜ ao A fun¸c˜ ao de regress˜ao helicoidal aplica x 7→ βx (mod 2π), i.e., aplica a reta real infinitas veces aorededor do c´ırculo. Para evitar este problema, se sugere substituir esta fun¸c˜ ao por uma fun¸c˜ ao injectiva (sugerencia dada por Fisher & Lee (1992)). Esta fun¸c˜ ao injectiva g, ´e tal que g : R → (−π, π), e satisfaz, g(0) = 0, pode ser a fun¸c˜ao tangente inversa g(x) = 2tan−1 x, 30. (2.58).
(40) ou a fun¸c˜ ao probit escalonada g(x) = 2π(Φ(x) − 0.5).. (2.59). 3. Resposta esf´erica. Regress˜ ao usando rota¸ c˜ ao Regress˜ ao de uma vari´ avel aleat´oria esf´erica y em S p−1 (esfera unitaria em Rp ) sobre uma preditora x em S p−1 acontece em varios campos. Algums destos exemplos s˜ ao o seguintes. Um problema importante en cristalografia ´e de relacionar o eixo y de um cristal com o eixo x de um sistema coordenado padr˜ao (Mackenzie 1957). Determina¸c˜ao da orienta¸c˜ ao de um satelite, involucra comparar dire¸c˜oes y de estrelas no sistema coordenado do sat´elite com as correspondentes dire¸c˜oes x num sistema coordenado terrestre (Wahba 1966). Avaliando “integridade geom´etrica” em control de calidade industrial ´e conseguido comparando dire¸c˜ oes normais y de uma parte feita `a m´ aquina com a correspondente dire¸c˜ ao x num desenho especificado no computador (Chapman, Chen & Kim 1995). Muitas aplica¸c˜ oes de vis˜ao de maquinas involucra compara¸c˜oes de dire¸c˜oes y de objetos detectados por um sensor com as correspondentes dire¸c˜oes x detectadas por outro sensor (Kanatani 1993). Um problema em geof´ısica ´e o de estimar a rota¸c˜ao de uma placa tect´onica relativa a outra, este ´e dado comparando as posi¸c˜ oes y de pontos sobre a superficie da terra (interse¸c˜oes de zonas de fraturas com anomalias magn´eticas) numa placa com as posi¸c˜oes x das correspondentes posi¸c˜ oes de pontos em outra placa (Chang 1993). A fun¸c˜ ao de regress˜ao mais simples para uma vari´ avel aleat´oria esf´erica y em S p−1. 31.
(41) sobre uma preditora esf´erica x em S p−1 ´e da forma b = Ax y. (2.60). para alguma rota¸c˜ ao A em SO(p) (grupo das matrizes de rota¸c˜ao de ordem p × p). Uma classe de modelos de regress˜ao com fun¸c˜oes de regress˜ao da forma (2.60) s˜ ao os modelos de Chang (1986) no qual a distribui¸c˜ao condicional de y dado x ´e circular sim´etrica com a dire¸c˜ ao m´edia Ax.. Modelos de regress˜ ao para estimar o centro Em algums contextos, tais como o de estimar a fonte de uma sinal a ou o centro de uma explos˜ ao, dire¸c˜ oes yi em S p−1 s˜ ao observadas com posi¸c˜oes xi em Rp . Um modelo conveniente para isto ´e y | x ∼ Mp (kx − ak−1 (x − a), k0 + kkx − akc ),. (2.61). asimm que y | x tem uma distribui¸c˜ao von Mises-Fisher com dire¸c˜ao m´edia que aponta para o “centro” desconheciado a. Varios casos part´ıculares de (2.61) com k0 = 0 s˜ ao aplicados em Lenth (1981), Jupp (1987), e Jupp & Spurr (1989).. 2.4. O modelo estudado e suas estimativas Considere o seguinte modelo para os dados (xi , yi ), i = 1, 2, . . . , n, os quais s˜ ao. tomados de uma circunferˆencia: xi = ξ1 + ρ cos φi + ε1i , (2.62) yi = ξ2 + ρ sin φi + ε2i , 32.
(42) onde (ξ1 , ξ2 ) s˜ ao as coordenadas do centro do c´ırculo, ρ ´e o raio do c´ırculo, φi ´e a fase ou ˆangulo da i-´esima observa¸c˜ ao, ε1i e ε2i s˜ ao vari´ aveis aleat´orias independentes normais de m´edia zero e variˆ ancias σ12 e σ22 , respectivamente, i.e., ε1i ∼ N(0, σ12 ), e ε2i ∼ N(0, σ22 ), i = 1, 2, . . . , n. Este modelo ´e o mesmo que foi tratado em Berman & Somlo (1986) com a diferen¸ca de que aqui assumimos que as variˆ ancias σ12 e σ22 s˜ ao diferentes. Em muitos casos as medidas das fases φi , i = 1, 2, . . . , n, s˜ ao desconhecidas (Berman 1983), mas as mudan¸cas φi+1 − φi , i = 1, 2, . . . , n, s˜ ao conhecidas. Neste caso, φi , i = 1, 2, . . . , n, pode ser expresso como φi = θ0 + θi , i = 1, 2, . . . , n, onde θi ´e conhecido e θ0 ´e desconhecido. Portanto, o modelo (2.62) pode ser escrito como: xi = ξ1 + α1 cosθi − α2 sinθi + ε1i , (2.63) yi = ξ2 + α1 sinθi + α2 cosθi + ε2i , i = 1, 2, . . ., n, onde α1 = ρ cosθ0 , α2 = ρ sinθ0 .. Como os θi s˜ ao conhecidos, o mo-. delo (2.63) ´e um modelo linear com parˆ ametros ξ1 , ξ2 , α1 e α2 e estrutura de variˆ ancia heterosced´astica. Para simplificar a nota¸c˜ ao, introduzimos os seguintes vetores: x = (x1 , x2 , . . . , xn )⊤ ,. y = (y1 , y2 , . . . , yn )⊤ ,. c = (cos θ1 , cos θ2 , . . . , cos θn )⊤ ,. s = (sin θ1 , sin θ2 , . . . , sin θn )⊤ ,. ε1 = (ε11 , ε12 , . . . , ε1n )⊤ ,. ε2 = (ε21 , ε22 , . . . , ε2n )⊤ .. Portanto, o modelo (2.63) pode ser escrito como . . . . x 1n 0 ξ1 c −s α1 ε1 = + + , y 0 1n ξ2 s c α2 ε2 33. (2.64).
(43) onde 1n denota um vetor n × 1 de uns. A matriz de variˆ ancias e covariˆ ancias dos erros aleat´ orios no modelo (2.64) ´e dada por . . . . σ12. 0 σ12 In 2 In 0 = σ22 σ2 = σ22 V(ω). 0 σ22 In 0 In Fazendo ω = σ12 /σ22 , tem-se que V(ω) = diag{ωIn , In }, In sendo a matriz identidade de ordem n. Para o modelo (2.64) com estrutura de variˆ ancia heterosced´astica, se as variˆ ancias σ12 e σ22 ou a raz˜ ao ω = σ12 /σ22 forem conhecidas, o melhor estimador linear n˜ ao-viesado do vetor de parˆ ametros β = (ξ1 , ξ2 , α1 , α2 )⊤ , denotado por β ∗ = (ξ1∗ , ξ2∗ , α∗1 , α∗2 )⊤ , pode ser obtido pelo processo de m´ınimos quadrados ponderados. N´os obtemos a seguintes express˜ oes para tal estimador no modelo (2.64): ξ1∗ = x − cα∗1 + sα∗2 , ξ2∗ = y − sα∗1 − cα∗2 , i 1 1 h v⊤ v + u⊤ u Z1 + − 1 (u⊤ v)Z2 , = d(ω) ω ω h i ⊤ 1 u u 1 α∗2 = + v⊤ v Z2 + − 1 (u⊤ v)Z1 , d(ω) ω ω. α∗1. onde x=. n X xi i=1. n. ,. n X cos θi c= , n. y= s=. i=1. d(ω) =. u⊤ u ω. + v⊤ v. u = c − c1n , Z1 =. x⊤ u + y⊤ v, ω. n X yi i=1 n X. n. i=1. ,. sin θi , n. v⊤ v. 1 2 + u⊤ u − − 1 (u⊤ v)2 , ω ω v = s − s1n , Z2 = −. 34. x⊤ v + y⊤ u. ω. (2.65).
(44) Note que quando σ12 = σ22 , temos ω = 1 e os estimadores acima se reduzem aos estimadores b = (ξb1 , ξb2 , α de m´ınimos quadrados ordin´arios, β c1 , α c2 )⊤ , discutidos em Berman & Somlo (1986).. Na pr´ atica, σ12 e σ22 s˜ ao desconhecidos e, portanto, temos que substitu´ı-los por estimativas. Estimativas u ´teis podem ser obtidas pelo processo de m´ınimos quadrados ordin´arios a partir dos seguintes modelos de regress˜ao de cada coordenada: x = (1n , c, −s)(ξ1 , α1 , α2 )⊤ + ε1 , y = (1n , s, c)(ξ2 , α1 , α2 )⊤ + ε2 , onde εi ∼ N(0, σi2 In ), i = 1, 2, s˜ ao independentes. As estimativas de σ12 e σ22 s˜ ao dadas por c12 = σ. c22 = σ. 1 x⊤ [In n−3. −1 − X1 (X⊤ X1 ]x, 1 X1 ). 1 y⊤ [In n−3. −1 − X2 (X⊤ X2 ]y, 2 X2 ). onde X1 = (1n , c, −s) e X2 = (1n , s, c). c12 /σ c22 . O estimador em duas etapas, Assim, uma estimativa de ω ´e dada por ω b=σ. ˜ = (ξ˜1 , ξ˜2 , α˜1 , α˜2 )⊤ , ´e obtido substituindo ω em (2.65) por ω denotado por β b.. Para o c´ alculo da matriz de variˆ ancias e covariˆ ancias dos estimadores do vetor de. parˆ ametros precisamos do seguinte lema. Lema 1. Suponha que a matriz A ´e n˜ ao-sigular e ´e particionada como A11 A12 . A= A21 A22. 35.
(45) Se A−1 ao 11 existe, ent˜. . . . . −1 −1 A11 0 A11 A12 −1 A (A−1 A12 | −I), + A−1 = 22.1 11 −I 0 0. onde A22.1 = A22 − A21 A−1 11 A12 . A prova deste lema pode ser obtida diretamente da aplica¸c˜ ao do Teorema 8.5.11 de Harville (1997, p. 99). Seja. . . 1n 0 c −s . X= 0 1n s c Aplicando o Lema 1 ` a matriz X⊤ V−1 (ω)X, obtemos as seguintes express˜ oes para as matrizes de variˆ ancias e covariˆ ancias dos estimadores BLUE, MQO e TSE: Cov(β ∗ ) = M + σ22. B A(ω) B⊤ , d(ω). (2.66). B C(ω) B⊤ , d(1) h ω ) C(ω/b ω 2 ) A(b ω ) B⊤ i ˜ = M + σ22 E B A(b , Cov(β) d2 (b ω) b = M + σ22 Cov(β). (2.67) (2.68). respectivamente, onde M = diag. n σ2 1. n. ,. σ22 n. o , 0, 0 ,. . 1 ⊤ ⊤ ωv v + u u A(ω) = 1 − 1 u⊤ v ω. . ⊤ ⊤ ωu u + v v C(ω) = (1 − ω)u⊤ v. . . − 1 u⊤ v , 1 ⊤ ⊤v u u + v ω 1 ω. . (1 − ω)u⊤ v ⊤ ⊤ ωv v + u u 36. . . −c s −s −c , B(ω) = 0 1 0 1. = B⊤ X⊤ V⊤ (ω)XB..
(46) CAP´ITULO. 3. Avalia¸c˜ao num´erica. 3.1. Introdu¸ c˜ ao O Estimador de M´ınimos Quadrados Ordin´arios (EMQO) ´e rotineiramente utilizado. para estimar os parˆ ametros do modelo de regress˜ao linear. Ao se utilizar o modelo de regress˜ao cl´ assico ´e comum assumir que os erros tˆem variˆ ancia constante. Contudo, tal suposi¸c˜ ao n˜ ao ´e verificada muitas vezes na pr´ atica. Na presen¸ca de heteroscedasticidade, o EMQO da matriz de variˆ ancias e covariˆ ancias torna-se impreciso, podendo conduzir a conclus˜ oes incorretas a respeito da rela¸c˜ao entre as vari´ aveis resposta e explicativas do modelo. Isto acontece porque os testes t associados requerem estimativas confi´ aveis das variˆ ancias dos estimadores dos parˆ ametros. Uma poss´ıvel solu¸c˜ao neste caso ´e usar estimadores consistentes da matriz de variˆ ancias e covariˆ ancias, i.e., utilizar os HC’s (estimadores consistentes 37.
(47) na presen¸ca de heteroscedasticidade −“heteroskedasticity consistent”) que funcionam bem mesmo sob homoscedasticidade (Long & Ervin, 2000). Na realiza¸c˜ ao dos testes de hip´ oteses sobre os parˆ ametros do modelo de regress˜ao linear do tipo H0 : βi = β (0) contra H1 : βi 6= β (0) , em que β (0) ´e uma constante conhecida, tem-se que βbi − β (0) D τ=q −→ N (0, 1), b var( c βi ). onde var( c βbi ) ´e um estimador consistente para var(βbi ). Mesmo em amostras de tamanho pequeno ou moderado, s˜ ao freq¨ uentemente utilizados valores cr´ıticos assint´oticos obtidos da distribui¸c˜ ao normal padr˜ao, o que pode ser uma fonte de imprecis˜ao. Al´em disso, os graus de alavancagem das diferentes observa¸c˜oes tamb´em podem influir na qualidade da aproxima¸c˜ ao da distribui¸c˜ ao nula de τ pela distribui¸cao normal padr˜ao.. 3.2. Metodologia Apresentaremos a seguir resultados num´ericos baseados no modelo: xi = ξ1 + α1 cosθi − α2 senθi + ε1i , yi = ξ2 + α1 senθi + α2 cosθi + ε2i ,. para i = 1, 2, . . . , n, em que α1 = ρ cosθ0 , α2 = ρ senθ0 , ρ representa o raio do c´ırculo, os θi ’s, s˜ ao conhecidos, o vetor de parˆ ametros ´e β = (ξ1 , ξ2 , α1 , α2 )⊤ = (β1 , β2 , β3 , β4 )⊤ , ε1i e ε2i s˜ ao vari´ aveis aleat´ orias independentes com distribui¸c˜ao normal de m´edia zero e variˆ ancias σ12 e σ22 , respectivamente, i.e., ε1i ∼ N (0, σ12 ) e ε2i ∼ N (0, σ22 ), εji , j = 1, 2, i = 1, 2, . . . , n, sendo n˜ ao-correlacionados (maiores detalhes Se¸c˜ao 2.4). 38.
(48) Consideramos ω = σ12 /σ22 = 1/10000, 1/100, 1, 100 e 10000, com a finalidade de obter diferentes graus de heteroscedasticidade. Consideramos ainda quatro tamanhos amostrais: n = 20, 40, 60 e 100. Para n = 20, as covariadas (os θ’s) foram geradas a partir da distribui¸c˜ ao von Mises (M (µ, k)) veja se¸c˜ao 2.3; neste caso usamos a dire¸c˜ao m´edia zero (µ = 0) e parˆ ametro de concentra¸c˜ ao com valores k = 0.5, 2 e 4. Os demais tamanhos amostrais foram obtidos replicando-se as vinte primeiras observa¸co˜es tantas vezes quanto necess´ario para atingir o tamanho desejado, de modo que o grau de heteroscedasticidade fosse mantido constante com o aumento do tamanho amostral. Para cada tamanho de amostra h´ a dois valores correspondentes `as vari´ aveis explicativas que s˜ ao pr´e-determinados na simula¸c˜ao. O primeiro deles ´e θ0 ; lembre que as diferen¸cas angulares entre pontos ´e conhecida, i.e., φi+1 − φi ´e conhecido; temos que φi = θ0 − θi , com θ0 desconhecido e θi conhecido; o segundo valor corresponde a θn , que ´e a dire¸c˜ao associada ao n-´esimo ponto. A dire¸c˜ ao para o primeiro valor ´e zero i.e., (θ0 = 0), com a finalidade de realizar testes para o parˆ ametro α2 ; lembre que α2 = ρ senθ0 . O u ´ltimo ponto (θn ) foi fixado no ˆ angulo de 180o , com o objetivo de se avaliar as taxas de rejei¸c˜ao dos testes quando s˜ ao usados diferentes estimadores da matriz de variˆ ancias e covariˆ ancias do estimador do vetor de parˆ ametros tendo conhecimento da presen¸ca de um ponto de alavanca. Intuitivamente, um ponto de alavanca tem sua medida de influˆencia aumentada quando sua dire¸c˜ ao se afasta da m´edia direcional (considerando todos os pontos). Assim, um ponto alcan¸ca seu maior grau de influˆencia no caso em que se encontra do lado oposto da m´edia direcional. Quando geramos os dados a partir de uma distribui¸c˜ao M (0, k), temos que, `a medida. 39.
(49) que o tamanho amostral aumenta, a dire¸c˜ao m´edia dos dados tende a zero. Um crit´erio de qualidade para um estimador da matriz de covariˆ ancias ´e o desempenho do teste quasi-t, com rela¸c˜ao ao tamanho, associado em amostras finitas. Nas tabelas da se¸c˜ ao 3.3 apresentamos resultados num´ericos ao desempenho dos diferentes testes aqui estudados. Em algumas tabelas usamos nota¸c˜oes como “HCj = HCi”, i 6= j, i = 0, 2, 3 e 4, j = 0, 2, 3 e 4, indicando com isso que as taxas de rejei¸c˜ao emp´ıricas obtidas nos testes baseados nesses estimadores para a matriz de variˆ ancias e covariˆ ancias s˜ ao iguais, al´em de serem as mais pr´ oximas de 5% (tamanho nominal); ou a nota¸ca˜o “HCj / HCi”, indicando que a diferen¸ca (em m´ odulo) entre as taxas de rejei¸c˜ao do teste baseado em HCj e o tamanho nominal (5%) ´e menor do que a correspondente diferen¸ca para HCi (|HCj − 5| < |HCi − 5|) e, adicionalmente, que a diferen¸ca destas diferen¸cas, em m´ odulo, ´e menor ou igual a 0.01 (||HCj − 5| − |HCi − 5|| ≤ 0.01); esta mesma nota¸c˜ao ´e empregada para o caso em que o melhor estimador ´e o EMQO (substituindo algum dos HCi’s por EMQO). Outro caso que consideramos ´e o de hip´ oteses restritas, no qual levamos em conta que um parˆ ametro ´e conhecido e igual a zero. Para identificar o parˆ ametro que foi “retirado”empregaremos a nota¸c˜ ao Rξ1 , Rξ2 e Rα2 quando ´e retirado o parˆ ametro ξ1 , ξ2 e α2 , respectivamente. O caso de retirar o parˆ ametro α1 implicaria que θ0 = 90o ou 270o , caso que n˜ ao trataremos neste trabalho. Os efeitos de usar o quadrado do res´ıduo restrito, i.e., os res´ıduos de MQO do modelo nulo, s˜ ao explorados em Davidson & MacKinnon (1985). As duas estrat´egias s˜ ao assint´ oticamente equivalentes sob a hip´ otese nula (Godfrey 2005).. 40.
(50) Nossas simula¸c˜ oes de Monte Carlo foram baseadas em dez mil (10,000) r´eplicas com ξ1 = ξ2 = α2 = 0, α1 = ρ. Deseja-se testar. H0 : βi = 0 contra H1 : βi 6= 0, i = 1, 2. e 4 (lembremos que β = (ξ1 , ξ2 , α1 , α2 )⊤ ), com εji ∼ N (0, σj2 ), j = 1, 2, i = 1, 2, . . . , n. Todas as simula¸c˜ oes foram realizadas usando a linguagem de programa¸c˜ao matricial Ox (Doornik 2001). Ao todo, foram realizadas 600 simula¸c˜oes que combinam quatro tamanhos amostrais, cinco graus de heteroscedasticidade, trˆes parˆ ametros de concentra¸c˜ao, um ˆangulo de ponto influente de duas formas, a saber: garantindo ou n˜ ao um u ´nico ponto influente e a restri¸c˜ ao imposta por cada um dos parˆ ametros . Ap´os a realiza¸c˜ ao de todas as simula¸c˜oes, foi realizada a modelagem estat´ıstica onde as quantidades de interesse s˜ ao as taxas de rejei¸c˜ao emp´ıricas correspondentes aos testes que utilizam EMQO, HC0, HC2, HC3, HC4 e os HCR’s considerando como tamanho do teste α = 5%.. 3.3. Resultados num´ ericos Quando ω 6= 1, h´ a heteroscedasticidade, o que significa que o componente em y para. cada uma das observa¸c˜ oes tem maior variabilidade em compara¸c˜ao com o componente em x (caso em que ω < 1), ou que o componente em x para cada um dos dados tem maior variabilidade em compara¸c˜ ao com o componente em y (caso no que ω > 1). No caso em que ω = 1, h´ a homoscedasticidade, i.e., os dois componentes tˆem a mesma variabilidade. Em algumas tabelas n˜ ao ´e poss´ıvel garantir que θn seja o u ´nico ponto de alavanca (os dados foram gerados da distribui¸c˜ao von Mises), j´a que a probabilidade de que algum. 41.
(51) Tabela 3.1: Quantis (em graus) da M (0, k) ao n´ıvel de 5%. k 0.5 1 2 3 4 5. α = 0.05 15.7 29.6 77.3 103.3 118.3 126.2. dos primeiros n − 1 pontos tenha dire¸c˜ao mais afastada (comparado com o n-´esimo ponto), com respeito ` a dire¸c˜ ao m´edia, ´e maior que zero. Este fato pode ser notado a partir dos quantis δ (tabela 3.1) da distribui¸c˜ao von Mises, em especial da distribui¸c˜ao M (0, k), em que Pr(−180◦ < θ < −180◦ + δ) = α/2 (´area que fica acima da dire¸c˜ao de 180◦ ) e Pr(180◦ − δ < θ < 180◦ ) = α/2 (´area abaixo da dire¸c˜ao de 180◦ ). Nas tabelas 3.2 a 3.6, em que n˜ ao se garante a existˆencia de um u ´nico ponto de alavanca, s˜ ao apresentadas as probabilidades de rejei¸ca˜o emp´ıricas de H0 : ξ1 = 0 correspondentes aos diferentes estimadores da matriz de variˆ ancias e covariˆ ancias dos estimadores dos parˆ ametros do modelo de regress˜ao. Adicionalmente, s˜ ao apresentadas as taxas de rejei¸c˜ao quando s˜ ao estimados os modelos completo e restritos. Os modelos restritos para este caso s˜ ao o modelo com a restri¸c˜ao ξ2 = 0, que denotaremos por (Rξ2 ) e o modelo com a restri¸c˜ ao α2 = 0 denotado por (Rα2 ). Na tabela 3.7 ´e apresentado um resumo das tabelas 3.2 at´e 3.6; naquela tabela s˜ ao listados os estimadores da matriz de variˆ ancias e covariˆ ancias que se revelaram mais confi´ aveis no que diz respeito `as distor¸c˜oes de tamanho dos testes associados. Estes resultados s˜ ao obtidos para diferentes graus de heteroscedasticidade (ω), valores do parˆ ametro de concentra¸c˜ao, tamanhos de amostras e ˆangulo correspondente ao ponto influente (que neste caso ´e de 180o ). 42.
Documentos relacionados
Com base na literatura revisada, conclui-se pela importância da implantação de um protocolo de atendimento e execução de exame de Ressonância Magnética em
Nessa situação temos claramente a relação de tecnovívio apresentado por Dubatti (2012) operando, visto que nessa experiência ambos os atores tra- çam um diálogo que não se dá
Segundo Éric Laurent, a psicose ordinária se caracteriza pela não resposta aos significantes-mestres tradicionais, manifestando o fim do poder do Nome-do-Pai como
servidores, software, equipamento de rede, etc, clientes da IaaS essencialmente alugam estes recursos como um serviço terceirizado completo...
1- Indica com P, se a frase estiver na voz passiva e com A se estiver na ativa. Depois, passa-as para a outra forma. a) Vimos um cisne moribundo.. Assinala com um X o
A espectrofotometria é uma técnica quantitativa e qualitativa, a qual se A espectrofotometria é uma técnica quantitativa e qualitativa, a qual se baseia no fato de que uma
Almanya'da olduğu gibi, burada da bu terimin hiçbir ayrım gütmeden, modern eğilimleri simgeleyen tüm sanatçılar için geçerli olduğu anlaşılıyor.. SSCB'de ilk halk
Na apresentação dos dados estatísticos, ficou demonstrada à todos os participantes a dimensão da pesquisa, abrangendo o setor produtivo como um todo, enfocando a produção