• Nenhum resultado encontrado

Análise de influência baseada na curvatura normal conforme para o modelo de regressão Dirichlet

N/A
N/A
Protected

Academic year: 2021

Share "Análise de influência baseada na curvatura normal conforme para o modelo de regressão Dirichlet"

Copied!
106
0
0

Texto

(1)´ ˆ ANALISE DE INFLUENCIA BASEADA NA CURVATURA NORMAL ˜ DIRICHLET CONFORME PARA UM MODELO DE REGRESSAO. ´ LUZ MILENA ZEA FERNANDEZ. Orientador: Prof. Dr. Klaus Leite Pinto Vasconcellos ´ Area de concentrac¸a˜ o: Estat´ıstica Matem´atica. Dissertac¸a˜ o submetida como requerimento parcial para obtenc¸a˜ o do grau de Mestre em Estat´ıstica pela Universidade Federal de Pernambuco. Recife/PE Dezembro de 2005.

(2)

(3)

(4) Aos meus pais, eles s˜ao a raz˜ao da minha vida e a for¸ca que me impulsiona a continuar cada dia.. i.

(5) ii. Agradecimentos A Deus por ter-me dado a vida, a capacidade para alcanc¸ar esta meta e sempre estar ao meu lado nesta caminhada que a` s vezes parecia muito dif´ıcil. Aos meus pais e aos meus irm˜aos pelo amor, pela dedicac¸a˜ o e por estar sempre torcendo em minha casa para que tudo desse certo. Ao meu orientador Klaus Leite Pinto Vasconcellos, pela atenc¸a˜ o, dedicac¸a˜ o, boa orientac¸a˜ o no decorrer deste trabalho e por ter acreditado em mim. A Nicol´as pelo amor, atenc¸a˜ o, compress˜ao, por toda ajuda, pelos nossos longos papos e por estar do meu lado sempre que precisei. Ao professor Francisco Cribari Neto, pelos conhecimentos transmitidos, dedicac¸a˜ o e eficiˆencia que o caracterizam. Aos professores do departamento de estat´ıstica da UFPE que colaboraram para meu crescimento profissional. Aos meus grandes amigos que considero como meus irm˜aos Dany, Renata, Carlos e Tiago por todo o carinho, forc¸a, ajuda, amizade, companhia e atenc¸a˜ o que me brindaram em minha estadia aqui no Brasil. A todos os demais colegas do mestrado pela convivˆencia e pelos momentos de descontrac¸a˜ o que vivemos juntos. ˆ A todos meus colegas de Colombia que moram aqui no Brasil, pelas nossas reu˜ ˜ e os momentos de divers˜ao, especialmente a minha nioes, as longas conversac¸oes amiga Laura. ` Val´eria Bittencourt, pela atenc¸a˜ o que me deu desde minha chegada ao Brasil, pelo A carinho e por ser muito competente em seu trabalho. ˜ Aos participantes da banca examinadora, pelas sugestoes. Ao CNPq, pelo apoio financiero..

(6) Se tens conhecimento, deixa que os demais acendam suas velas nele. –Thomas Fuller. iii.

(7) iv. Resumo Neste trabalho apresentamos um estudo de influˆencia local no modelo de regress˜ao Dirichlet proposto em Silva (2004) usando a curvatura normal conforme proposta por Poon & Poon (1999). Perturbamos o modelo segundo quatro esquemas de perturbac¸a˜ o diferentes, a saber: a log-verossimilhanc¸a de forma multiplicativa, as vari´aveis explicativas de forma aditiva e multiplicativa e, finalmente, as vari´aveis resposta de forma ´ aditiva. No desenvolvimento deste ultimo esquema nos encontramos frente a um pro˜ blema de maximizac¸a˜ o sujeito a restric¸oes, resolvemos o problema e encontramos a soluc¸a˜ o. A partir da´ı conseguimos enunciar e provar um Teorema que nos d´a uma ˜ satisfazem um conjunto forma de realizar an´alise de influˆencia quando as perturbac¸oes ˜ lineares; al´em disso, estendemos o conceito de contribuic¸a˜ o agregada para de restric¸oes modelos multivariados. Apresentamos tamb´em um exemplo de an´alise de influˆencia para dados reais usando o modelo de regress˜ao Dirichlet. Neste exemplo, verificamos que uma observac¸a˜ o se destaca como influente nos quatro esquemas de perturbac¸a˜ o e ˜ e´ maior para maiores valores das vari´aveis explicatique a influˆencia das observac¸oes vas..

(8) v. Abstract This work presents a local influence study for the Dirichlet regression model proposed in Silva (2004), by using the conformal normal curvature proposed in Poon & Poon (1999). Four different perturbation schemes are considered: the log-likelihood terms in the multiplicative form, the explanatory variables in additive and multiplicative forms and, finally, the response variables in additive form. In order to perform the last perturbation scheme, we solve a maximization problem with restrictions. We then obtain a theorem that gives us a form of performing influence analysis under linear constraints in the perturbation scheme. We also propose an influence analysis for multivariate data. An example with real data is presented for which we detect an observation as particularly influent and for which the influence of the observation is larger for larger values of the explanatory variables..

(9) Sum´ario. 1. Introdu¸ca˜ o 1.1. 1.2. 1.3 2. Introduc¸a˜ o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. 1.1.1. Organizac¸a˜ o da dissertac¸a˜ o . . . . . . . . . . . . . . . . . . . . . .. 3. 1.1.2. Suporte computacional . . . . . . . . . . . . . . . . . . . . . . . .. 3. Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. 1.2.1. Estimadores de m´axima verossimilhanc¸a . . . . . . . . . . . . . .. 4. Otimizac¸a˜ o n˜ao-linear em inferˆencia estat´ıstica . . . . . . . . . . . . . . .. 5. O modelo de regress˜ao Dirichlet. 6. 2.1. Modelo beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7. Definic¸a˜ o e estimac¸a˜ o . . . . . . . . . . . . . . . . . . . . . . . . .. 7. Modelo Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 11. Definic¸a˜ o e estimac¸a˜ o . . . . . . . . . . . . . . . . . . . . . . . . .. 12. 2.1.1 2.2. 2.2.1 3. 1. Curvatura normal conforme e influˆencia local. 18. 3.1. Influˆencia local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 20. 3.2. Curvatura normal conforme . . . . . . . . . . . . . . . . . . . . . . . . . .. 21. vi.

(10) ´ SUMARIO 3.3. 3.4 4. 5. vii. Avaliac¸a˜ o da influˆencia local . . . . . . . . . . . . . . . . . . . . . . . . . .. 22. 3.3.1. Influˆencia de autovetor individual . . . . . . . . . . . . . . . . . .. 23. 3.3.2. Contribuic¸a˜ o agregada de vetores de perturbac¸a˜ o b´asicos . . . .. 23. Esquemas de perturbac¸a˜ o . . . . . . . . . . . . . . . . . . . . . . . . . . .. 25. Aplica¸coes ˜. 38. 4.1. Introduc¸a˜ o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 38. 4.2. Composic¸a˜ o de sedimentos . . . . . . . . . . . . . . . . . . . . . . . . . .. 40. 4.2.1. Esquema de perturbac¸a˜ o I . . . . . . . . . . . . . . . . . . . . . .. 40. 4.2.2. Esquema de perturbac¸a˜ o II . . . . . . . . . . . . . . . . . . . . . .. 46. 4.2.3. Esquema de perturbac¸a˜ o III . . . . . . . . . . . . . . . . . . . . . .. 52. 4.2.4. Esquema de perturbac¸a˜ o IV . . . . . . . . . . . . . . . . . . . . .. 58. Conclusoes ˜. 64. Apˆendice. 65. A Derivadas. 66. A.1 Esquema de perturbac¸a˜ o I . . . . . . . . . . . . . . . . . . . . . . . . . . .. 67. A.2 Esquema de perturbac¸a˜ o II . . . . . . . . . . . . . . . . . . . . . . . . . . .. 68. A.3 Esquema de perturbac¸a˜ o III . . . . . . . . . . . . . . . . . . . . . . . . . .. 73. A.4 Esquema de perturbac¸a˜ o IV . . . . . . . . . . . . . . . . . . . . . . . . . .. 80. B Dados. 83. C Programa. 85.

(11) ´ SUMARIO. viii. Refˆerencias. 91.

(12) Cap´ıtulo 1 Introdu¸ca˜ o 1.1 Introdu¸ca˜ o Os modelos de regress˜ao d˜ao aos pesquisadores ferramentas poderosas que per˜ entre vari´aveis, e fazer predic¸oes ˜ de eventos do pasmitem estudar e modelar relac¸oes sado, do presente ou do futuro usando a informac¸a˜ o do passado ou presente. Por isto, s˜ao largamente utilizados em muitas a´ reas do conhecimento. Durante muitos anos, os modelos normais lineares simples e multivariados foram utilizados para descrever ˆ ´ ˆ a maioria dos fenomenos aleatorios, mesmo quando o fenomeno sob estudo apresentava uma resposta para a qual n˜ao fosse razo´avel a suposic¸a˜ o de normalidade ou que estivesse restrita ao intervalo (0,1). O modelo de regress˜ao Dirichlet, recentemente proposto em Silva (2004), oferece grande utilidade quando as vari´aveis resposta s˜ao ˜ proporc¸oes, pois, diferentemente do modelo de regress˜ao linear, permite assimetrias, ˜ o que e´ muito comum quando se trabalha com proporc¸oes. Existe uma grande quan´ tidade de trabalhos teoricos que envolvem a distribuic¸a˜ o Dirichlet, por´em, s˜ao poucos ˜ pr´aticas. Esta falha pode ser devida ao os trabalhos que tˆem sido feitos em aplicac¸oes fato de que esta distribuic¸a˜ o n˜ao e´ familiar para muitos cientistas. ´ ´ Um topico importante na an´alise de diagnostico em regress˜ao e´ a detecc¸a˜ o de ob˜ influentes, ou seja, de pontos que podem exercer forte influˆencia nas estiservac¸oes mativas dos parˆametros do modelo. Uma das id´eias mais inovadoras foi apresentada 1.

(13) ´ ˜ CAPITULO 1. INTRODUC ¸ AO. 2. ˜ verificar a existˆencia de pontos que sob modificac¸oes ˜ mopor Cook (1986), que propoe ˜ desproporcionais nos resultados, ao inv´es da avaliac¸a˜ o pela destas causam variac¸oes retirada individual ou conjunta de pontos. Este m´etodo se denomina influˆencia local e teve uma grande receptividade entre os usu´arios e pesquisadores da a´ rea de regress˜ao, motivando muitos artigos onde se aplica a metodologia em modelos particulares ou ˜ extensoes ˜ da t´ecnica, como ser´a visto no Cap´ıtulo 3. Apesar do m´etodo de se propoe Cook, baseado na curvatura normal, ser de grande utilidade, o m´etodo tem alguns inconvenientes; por exemplo, a curvatura normal pode tomar qualquer valor e n˜ao e´ invariante sob uma mudanc¸a uniforme de escala. Recentemente, Poon & Poon (1999) propuseram uma medida chamada “curvatura normal conforme”, e, sobre esta medida definiram a contribuic¸a˜ o agregada para cada vetor de perturbac¸a˜ o b´asico, fornecendo um ponto de partida objetivo para julgar a grandeza da curvatura. Nesta dissertac¸a˜ o apresentamos a an´alise de influˆencia local utilizando a curvatura normal conforme para o modelo de regress˜ao Dirichlet. Estudamos quatro esquemas de perturbac¸a˜ o, onde perturbamos a log-verossimilhanc¸a multiplicativamente, as ´ vari´aveis explicativas de forma aditiva e multiplicativa e por ultimo perturbamos as ´ vari´aveis resposta de forma aditiva. No desenvolvimento deste ultimo esquema de ˜ perturbac¸a˜ o nos encontramos com um problema de maximizac¸a˜ o com restric¸oes, resolvemos o problema e encontramos sua soluc¸a˜ o anal´ıtica. Neste sentido enunciamos um Teorema e apresentamos a demonstrac¸a˜ o. A partir deste Teorema, temos como primeiro resultado desta dissertac¸a˜ o uma proposta geral para an´alise de influˆencia ˜ lineares hoquando o espac¸o de perturbac¸a˜ o e´ sujeito a um conjunto de restric¸oes mogˆeneas. O segundo resultado que apresentamos e´ uma proposta de an´alise de in˜ para modelos multivariados. Por ultimo, ´ fluˆencia de observac¸oes analisamos um conjunto de dados reais com o modelo de regress˜ao Dirichlet, para o qual encontramos uma observac¸a˜ o que se destaca das outras em todos os esquemas de perturbac¸a˜ o, al´em ˜ correspondentes a valores maiores das vari´aveis de verificarmos que as observac¸oes explicativas s˜ao as mais influentes..

(14) ´ ˜ CAPITULO 1. INTRODUC ¸ AO. 1.1.1. 3. Organiza¸ca˜ o da disserta¸ca˜ o. A estrutura do restante desta dissertac¸a˜ o est´a organizada da seguinte forma. No ˜ beta e Dirichlet, assim como algumas Cap´ıtulo 2 est˜ao apresentadas as distribuic¸oes ˜ propriedades destas distribuic¸oes. No Cap´ıtulo 3 est´a apresentada a construc¸a˜ o da curvatura normal conforme, a contribuic¸a˜ o agregada individual dos vetores de per´ turbac¸a˜ o b´asicos, o Teorema que enunciamos e demonstramos, e, por ultimo a nossa proposta de an´alise de influˆencia para modelos multivariados. No Cap´ıtulo 4 apresentamos a an´alise de influˆencia aplicada ao modelo de regress˜ao Dirichlet para um con˜ desta dissertac¸a˜ o s˜ao junto de dados reais tomado de Aitchison (2003). As conclusoes apresentadas no Cap´ıtulo 5. Finalmente, no Apˆendice A est˜ao apresentados os c´alculos das derivadas necess´arias para fazer a an´alise de influˆencia segundo cada esquema de perturbac¸a˜ o, no Apˆendice B est´a apresentado o conjunto de dados reais estudado e o Apˆendice C apresenta o programa utilizado para fazer a an´alise de influˆencia no modelo de regress˜ao Dirichlet.. 1.1.2. Suporte computacional. As ferramentas computacionais utilizadas no desenvolvimento desta dissertac¸a˜ o foram a linguagem de programac¸a˜ o matricial Ox em sua vers˜ao 3.40 e o programa R em sua vers˜ao 2.0.1. Ox est´a disponivel gratuitamente para uso acadˆemico no site http://www.nuff.ox.ac.uk/Users/Doornik e possui uma abrangente biblioteca de fun˜ estat´ısticas e matem´aticas. Os gr´aficos apresentados nesta dissertac¸a˜ o foram feitos c¸oes utilizando a ferramenta computacional R.. 1.2 Preliminares Uns dos principais problemas da Inferˆencia Estat´ıstica e´ a estimac¸a˜ o de parˆametros, pois, na Inferˆencia Param´etrica, para inferir sobre o comportamento de uma populac¸a˜ o a partir do conhecimento de uma amostra, e´ necessario encontrar estimadores dos ´ parˆametros. Mais especificamente, dado um vetor aleatorio (Y1 , · · · , Y N ), com dis-.

(15) ´ ˜ CAPITULO 1. INTRODUC ¸ AO. 4. tribuic¸a˜ o conjunta conhecida e caracterizada por uma func¸a˜ o de probabilidade ou y ; θ ), dependente de um vetor de parˆametros desconhecide densidade conjunta f (∼ ∼ θ, ∼ θ ∈ Θ ⊂ R p , a tarefa de fazer inferˆencia inclui estimar o valor deste vetor dos ∼ de parˆametros. Para este fim, na literatura estat´ıstica existem diversos m´etodos que podem ser usados, uns dos m´etodos mais aplicados sendo a estimac¸a˜ o por m´axima verossimilhanc¸a. Os estimadores de m´axima verossimilhanc¸a podem ser calculados atrav´es da soluc¸a˜ o de um problema de otimizac¸a˜ o; em alguns casos este problema ˜ por´em, pode ser transformado em um problema de soluc¸a˜ o de um sistema de equac¸oes, e´ muito comum que os estimadores de m´axima verossimilhanc¸a n˜ao possuam forma fechada. Assim, as estimativas devem ser obtidas a partir da maximizac¸a˜ o num´erica da func¸a˜ o de verossimilhanc¸a ou da func¸a˜ o de log-verossimilhanc¸a.. 1.2.1. Estimadores de m´axima verossimilhan¸ca. O m´etodo de m´axima verossimilhanc¸a objetiva escolher os valores dos parˆametros que d˜ao a chance mais prov´avel de que novamente ocorram os fatos que ocorreram. A y = (y1 , . . . , y N ), e´ definida θ , baseada na observac¸a˜ o ∼ func¸a˜ o de verossimilhanc¸a para ∼ como y ) = f ( y , θ ), θ ∈ Θ, θ ) ≡ L(∼ θ;∼ L(∼ ∼ ∼ ∼ y fixo. Dada a func¸a˜ o L( θ ), o estimador de θ para ∼ sendo interpretada como func¸a˜ o de ∼ ∼ b θ e´ o valor que maximiza a func¸a˜ o de verossimilhanc¸a L(∼ θ ). m´axima verossimilhanc¸a ∼ Formalmente, o estimador de m´axima verossimilhanc¸a e´ definido como a vari´avel ´ aleatoria b θ = argmax L(∼ θ ). ∼ θ ∈Θ ∼. Geralmente o processo de maximizac¸a˜ o e´ melhor conduzido trabalhando-se com o θ ) = log( L(∼ θ )). logaritmo natural da func¸a˜ o de verossimilhanc¸a, denotado por l (∼ θ ) e l (∼ θ ) em Θ s˜ao ´ Como a func¸a˜ o logaritmo e´ monotona crescente, maximizar L(∼ θ) ˜ s˜ao independentes segue-se que l (∼ processos equivalentes. Quando as observac¸oes. θ ), onde f i representa a densidade individual θ ) = ∑iN=1 log f i (yi ; ∼ e´ aditiva, ou seja, l (∼ da observac¸a˜ o i..

(16) ´ ˜ CAPITULO 1. INTRODUC ¸ AO. 5. 1.3 Otimiza¸ca˜ o n˜ao-linear em inferˆencia estat´ıstica Para encontrar as estimativas de m´axima verossimilhanc¸a em modelos estat´ısticos e´ preciso fazer maximizac¸a˜ o de uma func¸a˜ o espec´ıfica. Quando o estimador de m´axima verossimilhanc¸a n˜ao possui forma fechada, as estimativas devem ser obtidas a partir da maximizac¸a˜ o num´erica da func¸a˜ o de verossimilhanc¸a ou da func¸a˜ o de log´ verossimilhanc¸a. Para este proposito, algoritmos iterativos podem ser empregados. A literatura divide as t´ecnicas de maximizac¸a˜ o em classes, sendo as mais utilizadas a classe de m´etodos gradiente e a classe de algoritmos quasi-Newton. Na primeira classe se faz uso da matriz hessiana e os m´etodos mais conhecidos s˜ao steepest ascent, NewtonRaphson e escore de Fischer. A segunda classe elimina a necessidade do c´alculo de segundas derivadas, pois usa uma aproximac¸a˜ o da matriz hessiana constru´ıda de forma iterativa. Entre os algoritmos que pertencem a esta classe tem-se o algoritmo DFP (Davidon, Fletcher e Powell) e o algoritmo BFGS (Broyden, Fletcher, Goldfarb e Shanno). No decorrer deste trabalho usa-se a t´ecnica de maximizac¸a˜ o BFGS..

(17) Cap´ıtulo 2 O modelo de regress˜ao Dirichlet Os modelos de regress˜ao d˜ao aos pesquisadores ferramentas poderosas que per˜ entre vari´aveis, e fazer predic¸oes ˜ de eventos do pasmitem estudar e modelar relac¸oes sado, do presente ou do futuro usando a informac¸a˜ o do passado ou presente. Por isto, ´ s˜ao largamente utilizados em muitas a´ reas do conhecimento, tais como: saude, biologia, agronomia, computac¸a˜ o, administrac¸a˜ o, engenharias, sociologia, etc. Durante muitos anos, os modelos normais lineares foram utilizados para descrever a maioria ˆ ´ ˆ dos fenomenos aleatorios, mesmo quando o fenomeno sob estudo apresentava uma resposta para a qual n˜ao fosse razo´avel a suposic¸a˜ o de normalidade ou que estivesse restrita ao intervalo (0,1). No primeiro caso tentava-se algum tipo de transformac¸a˜ o no sentido de alcanc¸ar a normalidade procurada, e, no segundo, uma possibilidade era transformar a vari´avel resposta para que assumisse valores na reta real e ent˜ao modelar a m´edia da resposta transformada com um preditor linear baseado em um conjunto de vari´aveis explicativas. Por´em, sob esta modelagem os parˆametros do modelo nem sempre podem ser facilmente interpretados em termos da resposta original; al´em ˜ tipicamente apresentam assimetria. Assim, inferˆencias baseadas disso, as proporc¸oes na suposic¸a˜ o de normalidade podem estar erradas. Uma proposta muito interessante e inovadora no assunto foi apresentada por Nelder e Wedderburn (1972), que propuseram os modelos lineares generalizados ˜ para a distribuic¸a˜ o da (MLGs). A id´eia b´asica consiste em abrir o leque de opc¸oes vari´avel resposta, permitindo que a mesma pertenc¸a a` fam´ılia exponencial de dis6.

(18) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO. 7. ˜ tribuic¸oes, bem como dar maior flexibilidade para a relac¸a˜ o funcional entre a m´edia da vari´avel resposta e o preditor linear. Uma outra posibilidade s˜ao os modelos aditivos generalizados, veja Hastie & Tibshirani (1990).. 2.1 Modelo beta ´ A distribuic¸a˜ o beta e´ uma das mais usadas para modelar experimentos aleatorios que produzem resultados no intervalo (0, 1) devido a` grande flexibilidade de ajuste de seus parˆametros. Ferrari & Cribari-Neto (2004) usam uma parametrizac¸a˜ o definida ˜ pela m´edia e por um parˆametro de dispers˜ao para a modelagem de taxas e proporc¸oes. Achcar & Netto (2003) estudam a prevalˆencia da tuberculose usando m´etodos bayesianos onde a distribuic¸a˜ o beta e´ tomada como distribuic¸ao a priori. Bury (1999) lista um ˜ da distribuic¸a˜ o beta em engenharia. Janardan & Padmanabhan conjunto de aplicac¸oes ´ (1986) modelam vari´aveis hidrologicas usando a distribuic¸a˜ o beta. Mc-Nally (1990) utiliza a distribuic¸a˜ o beta no estudo de algumas vari´aveis que afetam a reprodutibilidade de vacas. Graham & Hollands (1990) e Milyutin & Yaromenko (1991) usam a distribuic¸a˜ o beta para estudar ´ındices relacionados a` transmiss˜ao de radiac¸a˜ o solar. Wiley, Herschokoru & Padiau (1989) desenvolvem um modelo beta para estimar a probabilidade de transmiss˜ao de HIV durante o contato sexual entre um indiv´ıduo infectado e um indiv´ıduo sadio. A seguir, consideram-se algumas propriedades da distribuic¸a˜ o beta, como sua func¸a˜ o de densidade e seus primeiros momentos.. 2.1.1. Defini¸ca˜ o e estima¸ca˜ o. ´ Seja Y uma vari´avel aleatoria cont´ınua. Diz-se que Y tem distribuic¸a˜ o beta com parˆametros α1 , α2 > 0, denotado por Y∼ β(α1 , α2 ), se sua func¸a˜ o de densidade e´ da seguinte forma. f (y; α1 , α2 ) =. Γ ( α 1 + α 2 ) α1 −1 y (1 − y)α2 −1 I(0,1) (y), Γ ( α1 ) Γ ( α2 ). (2.1).

(19) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO onde Γ(.) e´ a func¸a˜ o gama, definida como Γ(t) =. R∞ 0. 8. yt−1 e−y dy e I A (.) representa a. func¸a˜ o indicadora, que para um conjunto A ⊂ R corresponde a  1 se x ∈ A, I A (x) = 0 se x ∈ / A. ˜ n˜ao-negativas; al´em disso, Note inicialmente que f (y) ≥ 0, pois e´ o produto de func¸oes R∞ −∞ f (y ) dy = 1. De fato, Z ∞ −∞. f (y)dy =. Z 1 Γ ( α 1 + α 2 ) α1 −1 y (1 − y)α2 −1 dy,. Γ ( α1 ) Γ ( α2 ) Z Γ ( α 1 + α 2 ) 1 α1 −1 = y (1 − y)α2 −1 dy. Γ ( α1 ) Γ ( α2 ) 0 0. (2.2). Usando a func¸a˜ o Beta definida por B( a, b) =. 1. Z c. c a + b −1. 0. y a−1 (c − y)b−1 dy,. ∀c > 0. (2.3). e a seguinte propriedade desta func¸a˜ o: B( a, b) =. Γ( a)Γ(b) , Γ( a + b). (2.4). tem-se que para c = 1, a = α1 e b = α2 , Z 1 0. yα1 −1 (1 − y)α2 −1 dy =. portanto, temos na equac¸a˜ o (2.2) que. R∞ −∞. Γ ( α1 ) Γ ( α2 ) , Γ ( α1 + α2 ). f (y)dy = 1. Logo, a func¸a˜ o f (.) e´ efetiva-. mente uma func¸a˜ o de densidade. O momento de ordem n em torno de zero da distribuic¸a˜ o β(α1 , α2 ) e´ obtido como.

(20) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO. 9. segue: n. E (Y ) =. =. Z 1 0. Z 1 0. yn f (y)dy, yn. Γ ( α 1 + α 2 ) α1 −1 y (1 − y)α2 −1 dy, Γ ( α1 ) Γ ( α2 ). Γ ( α1 + α2 ) = Γ ( α1 ) Γ ( α2 ). Z 1 0. yn+α1 −1 (1 − y)α2 −1 dy,. =. Γ ( α1 + α2 ) B ( n + α1 , α2 ), Γ ( α1 ) Γ ( α2 ). =. Γ ( α1 + α2 ) Γ ( n + α1 ) Γ ( α2 ) , Γ ( α1 ) Γ ( α2 ) Γ ( n + α1 + α2 ). =. Γ ( α1 + α2 ) Γ ( n + α1 ) . Γ ( α1 ) Γ ( n + α1 + α2 ). Esta express˜ao pode ser simplificada usando a propriedade da func¸a˜ o gama que afirma que Γ(z + 1) = zΓ(z), ∀z > 0. Assim, E (Yn ) =. α1 (α1 + 1)(α1 + 2) · · · (α1 + n − 1) . (α1 + α2 )(α1 + α2 + 1)(α1 + α2 + 2) · · · (α1 + α2 + n − 1). Da´ı, pode-se encontrar que a m´edia e a variˆancia da vari´avel Y com distribuic¸a˜ o β(α1 , α2 ) s˜ao respectivamente E (Y) =. α1 , α1 + α2. V (Y) =. α1 α2 2 ( α1 + α2 ) ( α1 + α2. + 1). .. Os parˆametros α1 e α2 s˜ao parˆametros de ajuste, pois atrav´es dos diferentes valo˜ no intervalo (0, 1). res dados para α1 e α2 podem ser obtidas diferentes distribuic¸oes Quando α1 = α2 = 1/2 a distribuic¸a˜ o beta e´ conhecida como “distribuic¸a˜ o arco ´ seno”, a qual e´ de grande utilidade no estudo de passeios aleatorios. No caso em que ˜ “arco seno generalizadas”. As denα1 + α2 = 1 com α1 6= 1/2 tem-se as distribuic¸oes sidades sim´etricas em torno de 1/2 correspondem a α1 = α2 e quando α1 = α2 = 1 tem-se a conhecida distribuic¸a˜ o uniforme no intervalo (0, 1). Assim, a distribuic¸a˜ o beta ˜ e´ na realidade uma fam´ılia de distribuic¸oes, isto pode ser observado na Figura 2.1..

(21) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO. 10. 4. 5. Figura 2.1.1: Gr´afico da densidade beta para diferentes valores de α1 e α2 .. 3. (1,7). (20,20). (7,1). (0.5,0.5) (5, 2). 2. f(y). (2, 5). 0. 1. (1, 1). 0.0. 0.2. 0.4. 0.6. 0.8. 1.0. y. Note-se que a` medida que os parˆametros α1 e α2 aumentam, a variabilidade da densidade diminui; este fato e´ confirmado pela express˜ao da variˆancia. Para encontrar os estimadores de m´axima verossimilhanc¸a dos parˆametros α1 e α2 e´ necess´ario encontrar a func¸a˜ o de verossimilhanc¸a e a seguir encontrar os valores dos parˆametros que maximizam esta func¸a˜ o. Para isto se procede da seguinte maneira. ´ Sejam Y1 , · · · , Y N , vari´aveis aleatorias independentes, onde Yi ∼ β(α1 , α2 ), para i = 1, · · · , N, e sejam y1 , · · · , y N os valores observados destas vari´aveis. Ent˜ao a func¸a˜ o de verossimilhanc¸a e´ dada pela seguinte express˜ao N. L ( α1 , α2 ) =. ∏ i =1. N. f ( y i ; α1 , α2 ) =. Γ ( α1 + α2 ). α −1. ∏ Γ ( α1 ) Γ ( α2 ) y i 1 i =1. ( 1 − y i ) α2 −1 ..

(22) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO. 11. Logo a func¸a˜ o de log-verossimilhanc¸a e´ da forma ½. N. `(α1 , α2 ) = log( L(α1 , α2 )) =. ∑ log. i =1 N. =. ∑. ½. µ log. Γ ( α1 + α2 ) Γ ( α1 ) Γ ( α2 ). µ. ¶. i =1. = N log. Γ ( α1 + α2 ) Γ ( α1 ) Γ ( α2 ). Γ ( α 1 + α 2 ) α1 −1 yi ( 1 − y i ) α2 −1 Γ ( α1 ) Γ ( α2 ). ¾. ¶. ¾. + (α1 − 1) log yi + (α2 − 1) log(1 − yi ) N. N. i =1. i =1. + (α1 − 1) ∑ log yi + (α2 − 1) ∑ log(1 − yi ).. Dessa forma, µ. `(α1 , α2 ) = N log. Γ ( α1 + α2 ) Γ ( α1 ) Γ ( α2 ). ¶. + ( α 1 − 1 ) g 1 + ( α 2 − 1 ) g2. onde g1 = ∑iN=1 log yi e g2 = ∑iN=1 log(1 − yi ). Os estimadores de m´axima verossimilhanc¸a αb1 , αb2 s˜ao obtidos pela soluc¸a˜ o do sistema n˜ao linear. N (ψ(α1 ) − ψ(α1 + α2 )) = g1 , N (ψ(α2 ) − ψ(α1 + α2 )) = g2 ,. onde ψ(.) e´ a func¸a˜ o digamma, ou seja, ψ(z) =. d log Γ(z) dz. para z > 0.. 2.2 Modelo Dirichlet A distribuic¸a˜ o Dirichlet e´ uma generalizac¸a˜ o multivariada da distribuic¸a˜ o beta que ˜ oferece muita flexibilidade e facilidade de uso. Em contraste com outras distribuic¸oes, ´ a distribuic¸a˜ o Dirichlet permite multiplas assimetrias e simetrias; de fato, pode ser viesada a` direita, viesada a` esquerda ou sim´etrica. Existe uma grande quantidade de ´ trabalhos teoricos que envolvem a distribuic¸a˜ o Dirichlet, por´em, s˜ao poucos os traba˜ pr´aticas. Esta falha pode ser devida ao fato de lhos que tˆem sido feitos em aplicac¸oes que esta distribuic¸a˜ o n˜ao e´ familiar para muitos cientistas. Entretanto, Bouguila, Ziou.

(23) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO. 12. ˜ & Vaillancourt (2004) propoem um modelo para estimar os parˆametros de misturas ˜ tais como estimac¸a˜ o de hisde Dirichlet e testam o m´etodo para diferentes aplicac¸oes togramas, descric¸a˜ o sucinta de dados de imagem via retenc¸a˜ o eficiente de informac¸a˜ o e detec¸a˜ o de pele humana em conjuntos de dados de multimidia. Bouguila & Ziou (2004) apresentam um modelo misto robusto de probabilidade baseado em uma generalizac¸a˜ o da distribuic¸a˜ o Dirichlet, neste caso, a proposta para estudar os parˆametros de um modelo Dirichlet misto e´ baseada em m´etodos de m´axima verossimilhanc¸a e Fisher escore e os resultados experimentais envolvem modelamento da cor da pele hu˜ a` detec¸a˜ o da pele em imagens. Esta distribuic¸a˜ o e´ tamb´em de grande mana e aplicac¸oes utilidade na estat´ıstica bayesiana. Merwe & Pretorius (2003) apresentam um estudo de estimac¸a˜ o bayesiana na reproduc¸a˜ o de animais usando um processo de Dirichlet a ´ priori para os efeitos aleatorios correlacionados. Boys, Henderson & Wilkinson (2000) apresentam uma soluc¸a˜ o bayesiana ao problema da detecc¸a˜ o de segmentos homogˆeneos de DNA usando como informac¸a˜ o a priori a distribuic¸a˜ o Dirichlet. Mazzuchi & Soyer (1993) apresentam uma proposta completa baseada em uma vers˜ao bayesiana do modelo de crescimento-confiabilidade de Barlow-Scheuer para analisar a confiabilidade de produtos durante o desenvolvimento da fase, a distribuic¸a˜ o Dirichlet sendo usada como distribuic¸a˜ o a priori para uma transformac¸a˜ o das probabilidades de fracasso.. 2.2.1. Defini¸ca˜ o e estima¸ca˜ o. Defini¸ca˜ o 1. Sejam Y1 , · · · , Y p vari´aveis aleat´orias.. Diz-se que o vetor aleat´orio. (Y1 , · · · , Y p−1 ), com Y1 + · · · + Y p = 1, tem distribui¸ca˜ o Dirichlet com parˆametros α1 > 0, · · · , α p > 0, se sua fun¸ca˜ o de densidade e´ da forma. f ( y 1 , . . . , y p −1 ; α 1 , . . . , α p ) =.  p Γ(∑ α)   p j =1 j ∏ p −1 y j α j −1 ( 1 − ∑ p −1 y j ) α p − 1 j =1 j =1 Γ(α ) ∏. y ∈ S, se ∼.  0. y∈ / S, se ∼. j =1. j. y = (y1 , . . . , y p−1 ) e S e´ a regi˜ao dada por onde ∼ ( S=. ( y 1 , . . . , y p −1 ) ∈ R p −1 ; y j > 0 e. p −1. ∑ yj < 1. j =1. ) .. (2.5).

(24) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO. 13. ˜ positivas em S Note inicialmente que f (y1 , . . . , y p−1 ) ≥ 0, pois e´ o produto de func¸oes p −1. e (1 − ∑ j=1 y j ) > 0. Al´em disso, Z. Z. ···. f (y1 , . . . , y p−1 ; α1 , . . . , α p )dy1 . . . dy p−1 = 1.. R p −1. ˜ mostra-se para o caso em que p = 3; a prova para o Por simplicidade nas operac¸oes caso geral e´ uma simples generalizac¸a˜ o. Ent˜ao, se quer provar que. Z ∞ Z ∞ −∞ −∞. f (y1 , y2 ; α1 , α2 , α3 )dy1 dy2 = 1,. Tem-se que. Z ∞ Z ∞ −∞ −∞. f (y1 , y2 ; α1 , α2 , α3 )dy1 dy2 =. 1 Z 1− y2 2. Γ(∑3j=1 α j ) Z ∏3j=1 Γ(α j ). 0. ∏ y j α j −1. 0. j =1. 2. (1 − ∑ y j )α3 −1 dy1 dy2 j =1. Γ ( α1 + α2 + α3 ) = Γ ( α1 ) Γ ( α2 ) Γ ( α3 ) Γ ( α1 + α2 + α3 ) = Γ ( α1 ) Γ ( α2 ) Γ ( α3 ). Z 1 Z 1− y2 0. 0. y1α1 −1 y2α2 −1 (1 − y1 − y2 )α3 −1 dy1 dy2. Z 1 · Z 1− y2 0. 0. ¸ y1α1 −1 (1 − y1. − y2 ). α3 −1. dy1 y2α2 −1 dy2 .. (2.6). Lembrando a definic¸a˜ o da func¸a˜ o beta B( a, b) em (2.3) e considerando a = α1 , b = α3 e c = 1 − y2 , tem-se que Z 1− y2 0. y1α1 −1 (1 − y1 − y2 )α3 −1 dy1 = B(α1 , α3 )(1 − y2 )(α1 +α3 −1) .. Substituindo este resultado, (2.6) pode ser escrita como Γ ( α1 + α2 + α3 ) B ( α1 , α3 ) Γ ( α1 ) Γ ( α2 ) Γ ( α3 ). Z 1 0. y2α2 −1 (1 − y2 )(α1 +α3 −1) dy2. e recorrendo novamente a` func¸a˜ o beta B( a, b) com a = α2 , b = α1 + α3 e c = 1 tem-se que. Z 1 0. y2α2 −1 (1 − y2 )(α1 +α3 −1) dy2 = B(α2 , α1 + α3 )..

(25) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO. 14. Portanto, Z ∞ Z ∞ −∞ −∞. Γ ( α1 + α2 + α3 ) B ( α1 , α3 ) B ( α2 , α1 + α3 ). Γ ( α1 ) Γ ( α2 ) Γ ( α3 ). f (y1 , y2 ; α1 , α2 , α3 )dy1 dy2 =. Aplicando a propriedade da func¸a˜ o beta em (2.4) Z ∞ Z ∞ −∞ −∞. f (y1 , y2 ; α1 , α2 , α3 )dy1 dy2 =. =. Γ ( α1 + α2 + α3 ) Γ ( α1 ) Γ ( α3 ) Γ ( α2 ) Γ ( α1 + α3 ) , Γ ( α1 ) Γ ( α2 ) Γ ( α3 ) Γ ( α1 + α3 ) Γ ( α1 + α2 + α3 ) Γ ( α1 + α2 + α3 ) Γ ( α1 ) Γ ( α2 ) Γ ( α3 ) = 1. Γ ( α1 ) Γ ( α2 ) Γ ( α3 ) Γ ( α1 + α2 + α3 ). ¤ X Portanto, pode-se concluir que a func¸a˜ o dada em (2.5) e´ efetivamente uma func¸a˜ o de densidade. A seguir ser˜ao apresentadas algumas propriedades da Distribuic¸a˜ o Dirichlet, como as m´edias, as variˆancias e covariˆancias. Comec¸ando pelo momento de ordem n em torno de zero na distribuic¸a˜ o Dirichlet, tem-se que E(Ynj ) =. Γ ( α1 + · · · + α p ) Γ ( α j + 1) , com j = 1, · · · , p. Γ ( α1 + · · · + α p + n ) Γ ( α j ). Da´ı, o valor esperado de Y j , com j = 1, · · · , p e´ E (Y j ) =. αj , p ∑ t =1 α t. a variˆancia de Y j , com j = 1, · · · , p, corresponde a V (Y j ) = E (Y j 2 ) − E (Y j )2. =. α j ( α j + 1) p. p. (∑t=1 αt )(∑t=1 αt + 1). −. α2j p. ( ∑ t =1 α t ) 2. p. =. α j ( ∑t6= j αt ) p. p. ( ∑ t =1 α t ) 2 ( ∑ t =1 α t + 1 ). e a covariˆancia entre Y j e Y j∗ , com j 6= j∗, j, j∗ = 1, · · · , p e´ Cov(Y j , Y j∗ ) = −. α j α j∗ p p 2 ( ∑ t =1 α t ) ( ∑ t =1 α t. + 1). .. (2.7).

(26) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO. 15. ´ Sejam (Yi1 , . . . , Yip ), i = 1, · · · , N, N vetores aleatorios independentes com distribuic¸a˜ o Dirichlet e parˆametros αi1 , . . . , αip , com func¸a˜ o de densidade dada por (2.5). ´ Ent˜ao, a log-densidade para cada vetor aleatorio e´ dada pela seguinte express˜ao à ! p. `i (αi1 , . . . , αip ) = log Γ. p. ∑ αij. j =1. p. − ∑ log Γ(αij ) + ∑ (αij − 1) log yij ; j =1. i = 1, . . . , N.. j =1. (2.8) Assim, a func¸a˜ o de log-verossimilhanc¸a e´ dada por N. αp) = α1 , · · · , ∼ `(∼. ∑ `i (αi1, . . . , αip ),. i =1. α1 = (α11 , . . . , α N1 )> , . . . , ∼ α p = (α1p , . . . , α N p )> , ou seja, onde ∼ ( à ! p. N. α1 , . . . , ∼ αp) = `(∼. ∑. i =1. log Γ. p. ∑ αij. j =1. p. − ∑ log Γ(αij ) + ∑ (αij − 1) log yij j =1. ) .. (2.9). j =1. ´ Para obter uma estrutura de regress˜ao que permita modelar vari´aveis aleatorias regidas pela distribuic¸a˜ o Dirichlet, considera-se αij = g(ηij ), onde ηij = xi1 β 1j +. · · · + xik β kj ; xi1 , . . . , xik s˜ao k covari´aveis, β 1j , . . . , β kj s˜ao os parˆametros da regress˜ao j = 1, · · · , p e g(.) e´ uma func¸a˜ o de ligac¸a˜ o conhecida que assume valores reais em ˆ (0, ∞), estritamente monotonica e duas vezes diferenci´avel; neste trabalho considerase g(ηij ) = eηij . Ou seja, a m´edia µij de cada Yij pode ser escrita como µij =. g(ηij ) . g(ηi1 ) + · · · + g(ηip ). A parametrizac¸a˜ o do modelo de regress˜ao Dirichlet apresentada aqui corresponde ao modelo 2 proposto em Silva (2004), onde tamb´em e´ estudada outra parametrizac¸a˜ o em que se modela a m´edia das vari´aveis resposta; este modelo e´ chamado naquele trabalho modelo 1. Nesta dissertac¸a˜ o n˜ao consideramos o modelo 1 dado que pela construc¸a˜ o daquele modelo se usa a m´edia da vari´avel Y1 para modelar a m´edia da vari´avel Y2 e assim por diante, criando uma hierarquia entre as componentes. Nas Figuras 2.2.1 e 2.2.2 est˜ao apresentados os gr´aficos das densidades Dirichlet quando p e´ trˆes, para diferentes valores dos parametros α1 , α2 e α3 . Note-se que a` medida que os parˆametros aumentam, a variabilidade da densidade diminui; este fato pode ser verificado pela express˜ao da variˆancia..

(27) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO. 16. Figura 2.2.1: Gr´aficos das densidades Dirichlet quando p = 3 para diferentes valores de α1 , α2 e α3 .. (0.5, 0.5, 10). (1, 1, 1). y2. y2. f(y1,y2). f(y1,y2). y1. y1. (0.4, 0.4, 0.4). (0.7, 1, 1). y1. y2. y2. f(y1,y2). f(y1,y2). y1.

(28) ´ ˜ DIRICHLET CAPITULO 2. O MODELO DE REGRESSAO. 17. Figura 2.2.2: Gr´aficos das densidades Dirichlet quando p = 3 para diferentes valores de α1 , α2 e α3 .. (0.5, 0.5, 10). (1, 1, 1). y2. y2. f(y1,y2). f(y1,y2). y1. y1. (0.4, 0.4, 0.4). (0.7, 1, 1). y1. y2. y2. f(y1,y2). f(y1,y2). y1.

(29) Cap´ıtulo 3 Curvatura normal conforme e influˆencia local ´ ´ Um topico importante na an´alise de diagnostico em regress˜ao e´ a detecc¸a˜ o de ob˜ influentes, ou seja, de pontos que podem exercer forte influˆencia nas estiservac¸oes mativas dos coeficientes da regress˜ao. Durante a d´ecada de 70 surgiram v´arias pro˜ nas estimativas dos coeficientes postas relacionadas com a influˆencia das observac¸oes do modelo normal linear. A eliminac¸a˜ o de pontos talvez seja a t´ecnica mais conhecida para avaliar o impacto de uma observac¸a˜ o particular nas estimativas da regress˜ao. Um problema que pode ocorrer com a retirada individual de pontos e´ o que se denomina em inglˆes masking effect, ou seja, deixar de detectar pontos conjuntamente discrepantes. ˜ avaUma das id´eias mais inovadoras foi apresentada por Cook (1986), que propoe ˜ sob pequenas perturbac¸oes ˜ nos dados ou no liar a influˆencia conjunta das observac¸oes ˜ modestas causam modelo, isto e´ , verificar a existˆencia de pontos que sob modificac¸oes ˜ desproporcionais nos resultados, ao inv´es da avaliac¸a˜ o pela retirada indivariac¸oes vidual ou conjunta de pontos. Este m´etodo se denomina influˆencia local e teve uma grande receptividade entre os usu´arios e pesquisadores da a´ rea de regress˜ao, motivando muitos artigos onde se aplica a metodologia em modelos particulares ou se ˜ extensoes ˜ da t´ecnica. Por exemplo, Galea, Paula & Bolfarine (1997), Liu (2000) propoe e Galea, Paula & Uribe-Opazo (2003) apresentam estudos de influˆencia local em modelos el´ıpticos lineares e novamente Liu (2002) apresenta um estudo da influˆencia lo18.

(30) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL. 19. cal destes modelos no caso multivariado, enquanto Kwan & Fung (1998) aplicam a ˆ metodologia em an´alise fatorial, Gu & Fung (1998) em an´alise de correlac¸a˜ o canonica, ´ Paula (1996) em modelos proprios de dispers˜ao, Ortega, Bolfarine & Paula (2003) em modelos log-gama generalizados com dados censurados, Jansen, Molenberghs, Aerts, Thijs & Steen (2003) em um estudo psiqui´atrico de dados bin´arios e Shi & Wang (1999) em regress˜ao ridge. Na classe de erros normais, Lawrence (1988) investiga a aplicac¸a˜ o de influˆencia local em modelos lineares com parˆametros na transformac¸a˜ o da resposta, Beckman, Nachtsheim & Cook (1987) apresentam estudos de influˆencia em modelos de an´alise de variˆancia com efeito misto, Tsai & Wu (1992) investigam influˆencia local em modelos auto-regressivos de primeira ordem e modelos heterosced´asticos e Paula ˜ nos parˆametros na (1993) aplica influˆencia local em modelos lineares com restric¸oes forma de desigualdades lineares. Para maiores detalhes veja Paula (2004), Cook & Weisberg (1982) e Wei (1998). Mais especificamente, o conceito de influˆencia local est´a baseado na curvatura da superf´ıcie de log-verossimilhanc¸a. Apesar do m´etodo de Cook, baseado na curvatura normal, ser de grande utilidade, apresenta alguns inconvenientes; por exemplo, a curvatura normal pode tomar qualquer valor e n˜ao e´ invariante sob uma mudanc¸a uniforme de escala. Assim, n˜ao foi ao princ´ıpio proposto um crit´erio objetivo para avaliar a grandeza da curvatura normal. Com o decorrer do tempo, diferentes autores tentaram dar uma soluc¸a˜ o a este problema; por exemplo, Fung & Kwan (1997) apresentam uma discuss˜ao do uso da influˆencia local baseada na curvatura normal calculada a partir da perturbac¸a˜ o de outras quantidades al´em da verossimilhanc¸a deslocada, tais como estimadores de parˆametros ou estat´ısticas de teste. Eles encontraram que a influˆencia local baseada na curvatura normal n˜ao e´ suficientemente bem fun´ damentada para gerar resultados uteis quando a primeira derivada com respeito aos parˆametros de perturbac¸a˜ o n˜ao e´ nula. Schall & Dunne (1992) mostraram que existe uma relac¸a˜ o ´ıntima entre os conceitos de colinearidade de parˆametros e influˆencia local ´ em diagnostico de regress˜ao, e introduziram uma modificac¸a˜ o da curvatura normal de Cook, a saber, a curvatura escalonada. Poon & Poon (1999) constru´ıram uma medida que e´ uma func¸a˜ o injetiva da curvatura normal assumindo valores no intervalo [0, 1], chamada curvatura normal conforme, e, sobre esta medida constru´ıram a contribuic¸a˜ o agregada para cada vetor de perturbac¸a˜ o b´asico, fornecendo um ponto de partida.

(31) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL. 20. objetivo para julgar a grandeza da curvatura.. 3.1 Influˆencia local θ ) a log-verossimilhanc¸a para um modelo postulado, onde ∼ θ ∈ R p e´ um Seja `(∼ θ|∼ w ) a log-verossimilhanc¸a corresponvetor de parˆametros desconhecidos. Seja `(∼. w dado, onde ∼ w ∈ Ω, Ω ⊂ Rr representando o dente ao modelo perturbado para um ∼ ˜ relevantes ( r n˜ao necessariamente representa o tamanho da conjunto de perturbac¸oes b w0 tal que `(∼ θ|∼ w0 ) = `(∼ θ ) para todo ∼ θ . Sejam ∼ θ e amostra). E´ assumido que existe ∼ c θw os estimadores de m´axima verossimilhanc¸a de ∼ θ sob `(∼ θ|∼ w0 ) e `(∼ θ|∼ w ) respectiva∼ w poderia ser estudada mente. Cook (1986) sugeriu que a influˆencia da perturbac¸a˜ o ∼ usando a func¸a˜ o de verossimilhanc¸a deslocada ³ ´ b c w ) = 2 `(∼ θ ) − `(∼ θw ) . LD (∼ (3.1) w podem ser representados por uma superf´ıcie Os valores de LD como uma func¸a˜ o de ∼ w , LD (∼ w )); LD (∼ w ) tem um valor m´ınimo de 0 em ∼ w =∼ w0 . O comportade pontos (∼ ˜ planas, isto e´ , considerando seus valores mento de (3.1) e´ investigado tomando sec¸oes d passando por ∼ w0 , ou seja, ao longo de uma reta em Ω na direc¸a˜ o de um vetor unit´ario ∼ w ( a) = ∼ w0 + a∼ d , a ∈ R. O resultado e´ uma curva plana ( a, LD (∼ w ( a))) cujo ao longo de ∼ comportamento como uma func¸a˜ o de a e em torno de a = 0 e´ estudado. A curvatura d no ponto ∼ w =∼ w0 e´ estudada por Cook (1986) como uma medida normal na direc¸a˜ o ∼ de influˆencia e e´ dada por d > F¨ ∼ d) C d = −2( ∼ (3.2) onde. ¯ c θw ) ¯¯ ∂2 `(∼ F¨ = ¯ w ∂∼ w> ¯ ∂∼. k · k denotando a norma euclideana. e. d k = 1, k∼. w =∼ w0 ∼ em Rr .. Sejam as matrizes ∆ e L¨ definidas como ¯ θ|∼ w ) ¯¯ ∂2 `(∼ , ∆= ¯ θ ∂∼ w> ¯ ∂∼ b θ =∼ θ, ∼ w =∼ w0 ∼. ¯ θ|∼ w ) ¯¯ ∂2 `(∼ L¨ = ; ¯ θ ∂∼ θ> ¯ = b , = ∂∼ θ ∼ θ ∼ w ∼ w0 ∼.

(32) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL. 21. ent˜ao, segundo Cook (1986), a equac¸a˜ o (3.2) pode ser escrita como ¯ ¯ ¯ d >∆> ( L¨ )−1 ∆ ∼ d )¯ C d = −2( ∼ . ¯ b θ =∼ θ, ∼ w =∼ w0 ∼. Cook (1986) sugeriu que a direc¸a˜ o dmax da curvatura m´axima C max cont´em valiosa ´ informac¸a˜ o sobre diagnostico. A curvatura m´axima e´ igual ao maior autovalor λmax de −∆> ( L¨ )−1 ∆ e dmax e´ o autovetor associado. Se o valor absoluto do i-´esimo elemento de dmax e´ o maior, ent˜ao, deve prestar-se atenc¸a˜ o ao elemento perturbado por wi , a iw . Embora esta proposta seja muito util, ´ e´ sima componente do vetor ∼ apresenta alguns inconvenientes como os mencionados anteriormente. A seguir introduz-se a curvatura normal conforme proposta por Poon & Poon (1999), como uma poss´ıvel soluc¸a˜ o para estes inconvenientes.. 3.2 Curvatura normal conforme d no ponto ∼ w =∼ w0 e´ definida por Poon A curvatura normal conforme Bd na direc¸a˜ o ∼ ∼. & Poon (1999) como ¯ ¯ >¨ > > ¨ −1 ¯ ¯ d d d d F ( ∆ ( L ) ∆ ) ¯ ¯ ∼ ∼ ∼ ∼ Bd = − q = −q ¯ ¯ ∼ ¯ ¯ tr( F¨ 2 ) w = w0 tr{(∆> ( L¨ )−1 ∆)2 } θ = bθ , w = w0. (3.3). ∼ ∼ ∼ ∼. ∼ ∼. ¨ ∆, L¨ s˜ao definidas como na sec¸a˜ o (3.1) e k d k=1. onde as matrizes F, ∼ Note-se da equac¸a˜ o (3.3) que o c´alculo de Bd n˜ao requer mais esforc¸o que o de C d . ∼. ∼. Al´em disso, a curvatura normal conforme desfruta de muitas propriedades, que s˜ao resumidas em poucos teoremas e est˜ao apresentadas em Poon & Poon (1999). Duas destas propriedades s˜ao apresentadas a seguir. ˜ Seja Ω o conjunto de todas as perturbac¸oes. Uma reparametrizac¸a˜ o e´ uma func¸a˜ o suave φ : Ω −→ Λ, Λ com a mesma dimens˜ao de Ω, tal que a matriz jacobiana de ˜ como “modificac¸oes ˜ do φ e´ n˜ao singular em todo Ω. Considera-se reparametrizac¸oes esquema de perturbac¸a˜ o”. Al´em disso, diz-se que uma matriz M de dimens˜ao r × r ´ e´ uma matriz conforme se existe um numero inteiro positivo a tal que MM> = aIr ,.

(33) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL. 22. onde Ir representa a matriz identidade de dimens˜ao r × r. Uma reparametrizac¸a˜ o e´ w0 se a matriz jacobiana em ∼ w0 e´ uma matriz conforme; al´em disso, se conforme em ∼ w0 no gr´afico de LD sobre uma reparametrizac¸a˜ o de Ω e´ conforme em um ponto cr´ıtico ∼ w0 e´ invariante sob a Ω, ent˜ao a curvatura normal conforme em qualquer direc¸a˜ o em ∼ w) = M ∼ w +c, tal reparametrizac¸a˜ o. Um exemplo de reparametrizac¸a˜ o conforme e´ φ(∼ que M e´ uma matriz conforme. d , Bd safisfaz a condic¸a˜ o 0 ≤ | Bd | ≤ 1, onde | · | representa Para qualquer direc¸a˜ o ∼ ∼. ∼. a func¸a˜ o valor absoluto. Ou seja, Bd e´ uma medida normalizada e, assim, torna-se ∼ mais f´acil interpretar seu valor. Ainda, se {λl , . . . , λr } s˜ao os autovalores da matriz F¨ e 1, . . . , ∼ e r }, tem-se que B e i e´ igual ao com correspondentes autovetores normalizados {∼ ∼ autovalor normalizado b λi , que corresponde a λ b . λi = p r i ∑n=1 λ2n Da´ı, ∑ri=1 B2e i = 1, e, assim, se a curvatura normal conforme e´ igual para todos os ∼. autovetores, ent˜ao o valor comum e´. √1 . r. Com estas propriedades da curvatura nor-. mal conforme, a avaliac¸a˜ o da influˆencia local pode ser feita de forma mais objetiva e sistem´atica.. 3.3 Avalia¸ca˜ o da influˆencia local d s˜ao usadas para Como foi visto na sec¸a˜ o (3.1), a curvatura normal C d e a direc¸a˜ o ∼ ∼. avaliar a influˆencia local. Mais especificamente, Cook (1986) sugeriu inspecionar o autovetor emax com m´axima curvatura normal C max sem considerar seu tamanho, lem¨ Como a curvatura brando que C max e´ igual ao maior autovalor λmax da matriz − F. normal e a curvatura normal conforme diferem so´ por um fator positivo, as duas ´ curvaturas s˜ao medidas de diagnostico equivalentes e o autovetor emax d´a tamb´em a m´axima curvatura normal conforme. Entretanto, a curvatura normal conforme e´ preferida porque suas propriedades de invariˆancia e natureza normalizada facilitam sua interpretac¸a˜ o. Todavia, a discuss˜ao na sec¸a˜ o anterior sugere que um valor de referˆencia para julgar o efeito de B e i e Bd em diferentes n´ıveis pode ser determinado ∼. ∼.

(34) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL. 23. usando o conceito geom´etrico de curvatura. Assim, a seguinte definic¸a˜ o e´ estabelee e´ q-influente se | B e | ≥ cida: um autovetor ∼ ∼. √q. r. .. 3.3.1 Influˆencia de autovetor individual E1 , . . . , ∼ Er } a base canonica ˆ Um autovetor influente pode ser examinado. Seja ξ = {∼ Et de t-´esimo vetor de perturbac¸a˜ o b´asico do espac¸o de perturbade Rr . Chama-se ∼ c¸a˜ o. Para analisar a contribuic¸a˜ o de vetores de perturbac¸a˜ o b´asicos a` influˆencia de um e , pode-se encontrar os vetores de perturbac¸a˜ o b´asicos que est˜ao autovetor influente ∼ e. ´ proximos a∼ Sejam b λ1 , . . . , b λ r os autovalores normalizados de F¨ com correspondentes autovetores e 1, . . . , ∼ e r . Como ξ e´ uma base de Rr tem-se para cada i = 1, . . . , r normalizados ∼ r. e i= ∼. Et ; ∑ ait ∼. t =1. e i k = 1, ent˜ao, ∑rt=1 a2it = 1. al´em disso, como k ∼ Da´ı, para cada i fixo, se a contribuic¸a˜ o de todos os ait e´ uniforme, ent˜ao, | ait | =. √1 . r. Isto pode ser usado na construc¸a˜ o de um ponto de referˆencia para julgar a grandeza. e i e´ proxima Et se | ait | e´ proximo ´ ´ a` reta gerada por ∼ Al´em do mais, a reta gerada por ∼ de 1. Este m´etodo pode ser usado para estudar emax ou qualquer autovetor influente individual .. 3.3.2 Contribui¸ca˜ o agregada de vetores de perturba¸ca˜ o b´asicos De modo geral, pode-se analisar a contribuic¸a˜ o de vetores de perturbac¸a˜ o b´asicos para todos os autovetores influentes. Para isto, Poon & Poon (1999) definem a contribuic¸a˜ o agregada dos vetores de perturbac¸a˜ o b´asicos para todos os autovetores q˜ influentes e propoem um ponto de referˆencia para avaliar a influˆencia. A seguir, apresenta-se a metodologia usada por Poon & Poon (1999)..

(35) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL. 24. Define-se µi = |b λi | e posteriormente ordena-se estes valores da seguinte forma q µmax = µ1 ≥ · · · ≥ µν ≥ √ > µν+1 · · · ≥ µr ≥ 0. r Da sec¸a˜ o anterior tem-se que r. e i= ∼. Et = ai1∼ E1 + · · · + air∼ Er = ( ai1 , . . . , air ), ∑ ait∼. t =1. logo, ait denota a t-´esima coordenada do autovetor normalizado correspondente a e r s˜ao autovetores normalizados, ent˜ao, para cada i = e 1, . . . , ∼ µi . Al´em disso, como ∼ e i k = 1, da´ı ∑rt=1 a2it = 1. 1, . . . , r, k ∼ A contribuic¸a˜ o agregada do t-´esimo vetor de perturbac¸a˜ o b´asico para todos os autovetores q-influentes e´ definida como s. ν. ∑ µi a2it .. m[q]t =. i =1. Como r. ∑ ( m [ q ] t )2 =. t =1. r. ∑. t =1. Ã. !. ν. ∑ µi a2it. ν. =. ∑ µi. i =1. i =1. Ã. r. !. ∑ a2it. ν. =. t =1. ∑ µ i · (1) =. i =1. ν. ∑ µi ,. i =1. ent˜ao, se a contribuic¸a˜ o de todos os vetores de perturbac¸a˜ o b´asicos e´ a mesma, cada uma e´ igual a. v à ! u ν u1 m[q] = t µi . r i∑ =1. ¨ Consequentemente, para determinar a significˆancia da contribuic¸a˜ o individual dos vetores de perturbac¸a˜ o b´asicos usa-se m[q]. H´a dois casos extremos a considerar ao usar esta metodologia. O primeiro e´ permitir q suficientemente grande tal que se considere a contribuic¸a˜ o individual dos vetores de perturbac¸a˜ o b´asicos somente para emax . Neste caso, q √ m[q]t = µ1 a21t = µ1 | a1t |, e. r m[q] =. 1 √ 1 µ1 = √ µ1 , r r.

(36) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL logo, este m´etodo e´ equivalente a comparar | a1t | com. √1 r. 25. como foi sugerido na sec¸a˜ o. (3.3.1). O outro caso extremo e´ permitir q = 0, assim, todos os autovalores s˜ao inclu´ıdos na an´alise. Neste caso m[0]t e´ chamada a contribuic¸a˜ o total, que se denota por mt e corresponde a. s mt =. r. ∑ µi a2it .. i =1. ˜ b´asicas e´ a mesma, ent˜ao cada uma e´ igual Se a contribuic¸a˜ o de todas as perturbac¸oes a. s m = m [0] =. v u r |λ | 1 r u ∑ i =1 i . µ = t q i ∑ r i =1 r 2 r ∑ i =1 λ i. A contribuic¸a˜ o total mt e a curvatura normal conforme BEt do vetor de perturbac¸a˜ o ∼. Et est˜ao altamente relacionadas. Como todos os autovalores s˜ao n˜ao-negativos, b´asico ∼ BEt e´ igual ao quadrado da contribuic¸a˜ o total do t-´esimo vetor de perturbac¸a˜ o b´asico. ∼ Ou seja, como a matriz − F¨ e´ semi-definida positiva e todos os autovalores s˜ao n˜ao negativos, ent˜ao m2t = BEt , para todo t. ∼. ¨. tr ( F ) Se a contribuic¸a˜ o total de todos os BEt e´ a mesma, ent˜ao cada uma e´ igual a b = √ ¨ 2 .. ∼. r. tr ( F ). Portanto, tem-se que m = BEt . Assim b pode ser utilizado como valor cr´ıtico para as ∼. curvaturas dos vetores de perturbac¸a˜ o b´asicos. Segundo a pr´atica comum, se a contribuic¸a˜ o agregada e´ maior que duas vezes a m´edia, ent˜ao a observac¸a˜ o correspondente e´ considerada influente. Utiliza-se 2b e √ √ 2m[q] como valores cr´ıticos para B Et e m[q]t , respectivamente. Usa-se 2 ao inv´es ∼. de 2 nos valores cr´ıticos para m[q]t devido a` relac¸a˜ o quadr´atica entre mt e B Et . ∼. 3.4 Esquemas de perturba¸ca˜ o Existem diferentes formas de se fazer a avaliac¸a˜ o da influˆencia de pequenas pertur˜ num modelo. Pode-se, por exemplo, perturbar a func¸a˜ o de log-verossimilhanbac¸oes c¸a, ou as vari´aveis explicativas de maneira coletiva ou individualmente, ou pode-se ˜ podem ser tamb´em perturbar as vari´aveis resposta. Al´em disso, essas perturbac¸oes feitas de maneira aditiva ou de maneira multiplicativa..

(37) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL. 26. Neste trabalho os esquemas de perturbac¸a˜ o que se consideram s˜ao os seguintes: • Esquema de perturba¸ca˜ o I Perturbac¸a˜ o da func¸a˜ o de log-verossimilhanc¸a de forma multiplicativa. • Esquema de perturba¸ca˜ o II perturbac¸a˜ o nas vari´aveis explicativas de forma multiplicativa. • Esquema de perturba¸ca˜ o III perturbac¸a˜ o nas vari´aveis explicativas de forma aditiva. • Esquema de perturba¸ca˜ o IV perturbac¸a˜ o nas vari´aveis resposta de forma aditiva. Considere-se o modelo de regress˜ao Dirichlet definido na sec¸a˜ o (2.2.1). α1 , . . . , ∼ α p ) = ∑iN=1 `i (αi1 , . . . , αip ) a func¸a˜ o de log-verossimilhanc¸a corresponSeja `(∼ ˜ dente a uma amostra de N observac¸oes, i = 1, . . . , N, seja X a matriz de dimens˜ao N × k cuja i-´esima linha representa os valores das k vari´aveis explicativas para a i-´esima observac¸a˜ o, seja Y a matriz de dimens˜ao N × p cuja i-´esima linha representa os valores das p vari´aveis resposta para a i-´esima observac¸a˜ o e seja B a matriz de dimens˜ao k × p correspondente aos parˆametros desconhecidos da regress˜ao. A seguir apresenta-se a forma como cada esquema foi trabalhado. Esquema de perturba¸ca˜ o I Neste caso a dimens˜ao do espac¸o de perturbac¸a˜ o Ω e´ igual ao tamanho da amostra, w, ∼ w ∈ Ω, seja `(B| ∼ w ) a log-verossimilhanc¸a correspondente ao ou seja, r = N. Dado ∼ modelo perturbado, ent˜ao, N. w) = `(B| ∼. ∑ wi `i (αi1, . . . , αip ),. i =1. w. onde wi e´ o i-´esimo elemento do vetor ∼ Esquema de perturba¸ca˜ o II Como no esquema anterior, a dimens˜ao de Ω, o espac¸o de perturbac¸a˜ o, coincide com w dado, onde o tamanho da amostra, ou seja, r = N. No modelo perturbado, para um ∼ w ∈ Ω, a matriz X e´ substitu´ıda pela matriz X w , que corresponde a ∼ ∼.

(38) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL .  w1 x11. Xw. ∼. 27. w1 x12. ···.  w x  2 21 w2 x22 · · · = . ..  .. .  w N x N1 w N x N2 · · ·. w1 x1k w2 x2k .. ..    .  . w N x Nk. Esquema de perturba¸ca˜ o III Diferentemente dos dois esquemas de perturbac¸a˜ o anteriores, neste esquema a di´ mens˜ao do espac¸o de perturbac¸a˜ o varia de acordo com o numero de vari´aveis perturbadas. Mais especificamente, no caso em que se perturbam as k covari´aveis, a dimens˜ao de Ω ser´a Nk, ou seja, r = Nk. Assim, a dimens˜ao do espac¸o de perturbac¸a˜ o ´ vai coincidir com o tamanho da amostra quando se perturba uma unica vari´avel explicativa; neste caso, ter-se-´a r = N. w dado, ∼ w ∈ Ω, a matriz X e´ substitu´ıda pela matriz No modelo perturbado, para um ∼ w = vec(W ), W e´ a matriz de perturbac¸oes ˜ de dimens˜ao N × k, X w = X + W S, onde ∼ ∼. e S e´ uma matriz diagonal S = diag{s1 , . . . , sk } tal que cada sm converte a perturbac¸a˜ o wim no tamanho e unidade apropriados para que wim sm seja compat´ıvel com o (i, m)e´ simo elemento de X, ou seja, com xim . Tem-se que .  x11 + w11 s1. Xw. ∼. x12 + w12 s2. ···.   x +w s x22 + w22 s2 · · · 21 1  21 = . .. ..  .  x N1 + w N1 s1 x N2 + w N2 s2 · · ·. x1k + w1k sk x2k + w2k sk .. ..    .  . x Nk + w Nk sk. Fazendo alguns dos sm iguais a 0, somente algumas das vari´aveis explicativas s˜ao perturbadas. ˜ IV Esquema de perturbac¸ao Este m´etodo de perturbac¸a˜ o e´ diferente dos anteriores, pois ao perturbar as vari´aveis ˜ resposta de forma aditiva, os vetores perturbados devem continuar a ser proporc¸oes, ˜ ¨ encia estaremos frente assim, e´ necess´ario considerar algumas restric¸oes, e em consequˆ ˜ a um problema de maximizac¸a˜ o com restric¸oes. Neste caso, a m´axima curvatura j´a n˜ao > − ser´a mais o maior autovalor da matriz −∆ ( L¨ ) 1 ∆. Ao contr´ario, como veremos mais.

(39) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL. 28. ˜ impostas estar´a associada ao maior adiante, a m´axima curvatura sujeita a` s restric¸oes autovalor de uma nova matriz e a` direc¸a˜ o normalizada associada a este autovalor. ˜ Cabe ressaltar que tanto o desenvolvimento da soluc¸a˜ o da maximizac¸a˜ o com restric¸oes como a definic¸a˜ o de observac¸a˜ o influente e contribuic¸a˜ o agregada neste novo esquema ´ de perturbac¸a˜ o foram propostos por nos. Para este esquema de perturbac¸a˜ o, a dimens˜ao de Ω, o espac¸o de perturbac¸a˜ o, e´ r = N p. A seguir explicamos em detalhe qual e´ o procedimento desenvolvido neste caso. w dado, ∼ w ∈ Ω, a matriz Y e´ substitu´ıda pela matriz No modelo perturbado, para um ∼ Y w , que corresponde a ∼. .  y11 + w11. y12 + w12. ···.   y +w y22 + w22 · · · 21  21 Yw =  . .. ∼ ..  .  y N1 + w N1 y N2 + w N2 · · ·. y1p + w1p y2p + w2p .. ..    ,  . yN p + wN p. ˜ sujeita a` s restric¸oes p. p. p. ∑ w1j = 0, ∑ w2j = 0, . . . , ∑ w Nj = 0. j =1. j =1. j =1. e a direc¸a˜ o que d´a a m´axima curvatura deve ser buscada entre os vetores de norma um. Seja W ≡ (wij ), ou seja, W e´ uma matriz de dimens˜ao N × p onde o (i, j)-´esimo z = vec(W ) podemos escrever nosso problema elemento corresponde a wij . Fazendo ∼ da seguinte maneira: maximizar a forma quadr´atica z > (∆> L¨ −1 ∆) ∼ z −∼ ˜ sujeita a` s restric¸oes p. ∑ z1j = 0,. j =1. p. ∑ z2j = 0, . . . ,. j =1. p. ∑ z Nj = 0,. j =1. z k = 1. k∼. (3.4).

(40) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL. 29. Logo, podemos escrever nosso problema da seguinte forma: z ) =∼ z >A ∼ z sujeito a` s restri¸co˜ es gn (∼ z ) = 0, n = 1, . . . , N; maximizar f (∼. z) = 0 h(∼. p. z ) = ∑ j=1 znj , n = 1, . . . , N e h(∼ z ) =∼ z>∼ z −1. onde A = −(∆> L¨ −1 ∆), gn (∼ Para encontrar a soluc¸a˜ o do problema anterior vamos utilizar o m´etodo dos multiplicadores de Lagrange. Assim, precisamos encontrar a soluc¸a˜ o do sistema z ) = 0, n = 1, . . . , N gn ( ∼ z) = 0 h(∼ N. z) = ∇ f (∼. ∑ δn ∇ gn (∼z ) + φ∇h(∼z ). n =1. onde ∇ f representa o gradiente da func¸a˜ o f e δ1 , . . . , δN , φ s˜ao conhecidos como os multiplicadores de Lagrange. Se definimos a matriz C de dimens˜ao N × N p como   1 0···0 1 0···0 ··· 1 0···0   0 1 · · · 0 0 1 · · · 0 · · · 0 1 · · · 0   C=  . . . .. .. ..     0 0···1 0 0···1 ··· 0 0···1 ou seja,. ³. (3.5). N×N p. ´. C = IN IN · · · tem-se satisfeito que. ,. IN. . N×N p. ,.  z) g1 ( ∼.   g (z) 2   z =  .∼  . C∼  ..    z) g N (∼ z e´ v´alido que ∇ gn (∼ z ) e´ igual a` n-´esima linha da matriz Portanto, para qualquer ∼ En o n-´esimo vetor da base canonica ˆ C, n = 1, . . . , N. Seja ∼ de R N . Ent˜ao a n-´esima linha da matriz C e´ precisamente o vetor escrito de forma particionada como ³ ´ E E E · · · ∼n ∼n ∼n ,.

(41) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL logo,. ³ z ) = En En · · · ∇ gn ( ∼ ∼ ∼ z) = Por outro lado, como A e´ sim´etrica, ent˜ao ∇ f (∼. 30. ´ E ∼n . z >A e ∇ h(∼ z) = 2∼ z > . Logo, o 2∼. sistema acima pode ser escrito da seguinte forma z =0 C∼ z >∼ z =1 ∼ z >A = 2∼. (3.6) (3.7). N. ∑ δn. ³ En ∼ En · · · ∼. n =1. ´ z> E n ∼ + 2φ∼. (3.8). Escrevendo δn = 2φn , temos que (3.8) fica como segue N. z>. ∼ A=. ∑ φn. n =1. ³. ´. z >. En ∼ En · · · ∼ En + φ∼ ∼. (3.9). Mas ´ ³ ´ N N N = E E E E φ φ · · · φ ∑ ∑ ∑ n=1 n ∼n n=1 n ∼n n=1 n ∼n ∼n n =1 ³ ´ = (φ1 , . . . , φN ), (φ1 , . . . , φN ), . . . , (φ1 , . . . , φN ) = (Φ, Φ, . . . , Φ), N. ∑ φn. ³. En ∼ En · · · ∼. onde Φ = (φ1 , . . . , φN ). Ent˜ao a equac¸a˜ o (3.9) fica da seguinte forma z > A = (Φ, Φ, . . . , Φ) + φ∼ z >. ∼. (3.10). Multiplicando a` direita por C> a equac¸a˜ o (3.10) e usando a equac¸a˜ o (3.6) obtemos z > AC> = (Φ, Φ, . . . , Φ)C> . ∼. (3.11). Por outro lado e´ facil ver que CC> = pIN , enquanto C> C e´ uma matriz composta por p × p blocos iguais a IN .. . IN IN · · ·  . .. > . C C= .  . IN IN · · ·.  IN ..  .   IN. .. (3.12). N p× N p. Multiplicando a` direita por C na equac¸a˜ o (3.11) obtemos que   IN IN · · · IN  . .. ..  > >  .. z AC C = ( Φ, Φ, . . . , Φ ) . . .    = p(Φ, Φ, . . . , Φ). ∼ IN IN · · · IN. (3.13).

(42) ´ ˆ CAPITULO 3. CURVATURA NORMAL CONFORME E INFLUENCIA LOCAL. 31. z e usando (3.6), (3.7) e (3.13) Multiplicando (3.10) a` direita por ∼ 1 > > z AC C ∼ z +φ = φ. z ) =∼ z >A ∼ z = (Φ, Φ, . . . , Φ) ∼ z +φ = ∼ f (∼ p. (3.14). Substituindo (3.13) em (3.10) obtemos 1 > > > z z AC C + φ ∼ z >. A = ∼ ∼ p ´ Tomando transposta nesta ultima equac¸a˜ o 1 z = C> CA ∼ z +φ ∼ z . A∼ p ´ Podemos escrever esta ultima equac¸a˜ o como z = φ∼ z = f (∼ z )∼ z, QA ∼. onde. 1 Q = IN p − C> C p. (3.15). z ) e´ um autovalor φ de QA, e que ∼ z e´ um autovetor Assim, podemos concluir que f (∼ correspondente. ¯ > © ª z ∈ RN p ¯ ∼ z ∼ z = 1, C ∼ z = 0 e´ fechado e limitado em R N p , logo, Dado que S = ∼ z ) =∼ z >A ∼ z alcanc¸a um m´aximo ∼ z 0 neste concompacto, ent˜ao a func¸a˜ o cont´ınua f (∼ ˜ junto, veja Apostol (1977), Teorema 4-20. Tal ponto maximizador satifaz as equac¸oes (3.6)-(3.8) para alguns valores φ1 , . . . , φN , φ, veja Lima (1981). Dado que o posto de QA e´ no m´aximo kp, temos n˜ao mais do que kp autovalores de QA diferentes de zero. Seja τ o maior autovalor de QA, suponha τ 6= 0. Queremos z 0 ) = τ. Pelo argumento anterior, vimos que f (∼ z 0 ) ser´a um autovalor provar que f (∼ z 0 ) ≤ τ. Falta provar agora que existe ∼ v ∈ S tal que f (∼ v ) = τ, assim, de QA, logo f (∼ z 0 maximizador global de f em S teremos que f (∼ z 0 ) ≥ f (∼ v ) = τ e ficar´a por ser ∼ provado o resultado. v que satisfaz h(∼ v ) =∼ v >∼ v −1 = 0 e tal que QA ∼ v = τ∼ v . Queremos Seja ent˜ao ∼ v = 0 e al´em disso que f (∼ v ) = τ. QA∼ v = τ∼ v pode escrever-se como provar que C∼ 1 v = C> CA ∼ v +τ∼ v . A∼ p Multiplicando (3.16) a` esquerda por C e usando que CC> = pIN obtemos que v= CA ∼. 1 v +τC ∼ v = CA ∼ v +τC ∼ v, pIN CA ∼ p. (3.16).

Referências

Documentos relacionados

Analysis of relief and toponymy of the landscape based on the interpretation of the military topographic survey: Altimetry, Hypsometry, Hydrography, Slopes, Solar orientation,

servidores, software, equipamento de rede, etc, clientes da IaaS essencialmente alugam estes recursos como um serviço terceirizado completo...

[r]

O padre veio para eles e abraçou-se também, subitamente perturbado por uma analogia, assim dissera o italiano, Deus ele próprio, Baltasar seu filho, Blimunda

Os elementos caracterizadores da obra são: a presença constante de componentes da tragédia clássica e o fatalismo, onde o destino acompanha todos os momentos das vidas das

1- Indica com P, se a frase estiver na voz passiva e com A se estiver na ativa. Depois, passa-as para a outra forma. a) Vimos um cisne moribundo.. Assinala com um X o

1- Indica com P, se a frase estiver na voz passiva e com A se estiver na ativa. Depois, passa-as para a outra forma.. Assinala com um X o retângulo correspondente.. Derivada

De seguida, vamos adaptar a nossa demonstrac¸ ˜ao da f ´ormula de M ¨untz, partindo de outras transformadas aritm ´eticas diferentes da transformada de M ¨obius, para dedu-