Qualifica¸c˜ ao das solu¸c˜ oes como minimizantes globais

A.3 Caso da regress˜ ao linear geral

A.3.3 Qualifica¸c˜ ao das solu¸c˜ oes como minimizantes globais

Tendo agora em conta a discussão tida na seçcão 2.3.3, podemos verificar que, em todos os casos, as solu¸cões do sistema normal é sempre um ponto de estacionariedade que ´

e um minimizante global da fun¸cão S definida em (1.21). Na verdade, a matriz Hessiana da fun¸cão S é semidefinida positiva. Isso decorre de A = ZTZ definida por (A.6) ser semidefinida positiva. Resulta que a fun¸cão S é sempre convexa. O conjunto dos seus minimizantes é convexo, logo conexo.

Ordens de Convergˆencia

No decorrer da nossa exposi¸cão várias vezes referimos a ordem e razão de convergência de uma sucessão convergente. Por isso achamos necessário fazer uma breve abordagem sobre esses conceitos muito usados para classificar a eficiência de algoritmos. Na literatura encontramos abordagens e nota¸cões diferentes. Nós aqui basearemos essencialmente em [41, 11, 43, 29, 34].

Defini¸c˜_{ao B.1 Seja D um subconjunto de R}n_{e {x}k_{} uma sequˆ}_{encia de pontos pertencentes}

a D. Diz-se que {xk_{} converge para um ponto x}∗ _{e escreve-se}

lim

k→∞x k_{= x}∗

se para qualquer ε > 0, existir um ´ındice m tal que

kxk− x∗k ≤ ε, ∀ k ≥ m.

Estando estabelecida a convergência de um dado algoritmo, coloca-se a questão do de- sempenho desse algoritmo. Em princ´ıpio, seria prefer´ıvel um algoritmo cuja implementa¸cão exige um menor número de itera¸cões para obter o ótimo x∗, de acordo com um certo critério de paragem estabelecido. Infelizmente esse critério não permite comparar globalmente algoritmos, uma vez que o número de itera¸cões depende do tipo de fun¸cões em causa, da escolha da aproxima¸cão inicial e do custo computacional de cada itera¸cão para algoritmos diferenciados. Mesmo assim, é necessário estabelecer critérios de compara¸cão de algoritmos com algum significado universal. Para isso devemos analisar a ordem de convergência, isto ´

e, se xk _{→ x}∗_{, estamos interessados em saber o qu˜}_{ao “r´}_{apido” isso acontece.}

Consideremos o espa¸co Rn, onde k.k representa a norma Euclidiana.

Defini¸c˜ao B.2 Seja xk _{uma sequˆ}_{encia em R}n _{que converge para x}∗_{. Dizemos que a con-}

vergˆencia ´e linear se existe uma constante real r ∈]0, 1[ tal que kxk+1_{− x}∗_k

kxk_{− x}∗_k ≤ r, para todo k suficientemente grande. (B.1)

Quando a convergência é linear, o erro absoluto relativamente a x∗decresce a cada itera¸cão, no m´ınimo, por um fator constante. Havendo convergência linear diz-se que a ordem de convergência é um.

Defini¸cão B.3 A convergência de uma sequência {xk} é dita superlinear se lim

k→∞

kxk+1_{− x}∗_k

kxk_{− x}∗_k = 0. (B.2)

Defini¸cão B.4 A convergência é chamada quadrática se existe um real positivo M tal que kxk+1_{− x}∗_k

kxk_{− x}∗_k2 ≤ M, para todo k suficientemente grande. (B.3)

De forma análoga definem-se ordens de convergência três, quatro, etc, mas essas ordens de convergência raramente são utilizadas em otimiza¸cão.

De um modo geral, diz-se que que a ordem de convergˆencia ´e p (com p ≥ 1) se existe uma constante positiva M tal que

kxk+1_{− x}∗_k

kxk_{− x}∗_kp ≤ M, para todo k suficientemente grande. (B.4)

Por vezes usa-se a designa¸cão q-ordem de convergência (q-linear, q-superlinear e q-quadrática) para indicar que o tipo de convergência é definido por quociente entre erros consecutivos.

Toda sequência que converge quadraticamente também converge superlinearmente, e por sua vez, a convergência superlinear implica a convergência linear.

Exemplo B.1 Cada uma das sequˆencias seguintes xk _{converge para x}∗ _dado.

xk ₌ 1 k −→ x ∗ _{= 0} xk _{= 1 + 10}−k _{−→ x}∗ _{= 1} xk _{= 1 +} 1 2 2k −→ x∗ _{= 1} ( xk+1 = 1₅ln(xk+ 1) x0 = 1 −→ x ∗ _{= 0}

(a) Prove que a sequência xk = _k1 não converge para zero q-linearmente. (b) Indique a ordem de convergência para as outras sequências.

Resolu¸cão: (a) kxk+1_k kxk_k = k k + 1 −→ 1. Logo, a sequência não converge para zero q-linearmente.

(b) kxk+1_{− 1k} kxk_{− 1k} = 10−k−1 10−k = 10 −1_.

A sequência converge q-linearmente para 1, com razão de convergência r = 10−1. kxk+1_{− 1k} kxk_{− 1k}2 = 1 2 2k+1 h 1 2 2ki2 = 1,

logo a sequˆencia converge q-quadraticamente para 1. kxk+1_k kxk_k = 1 5ln(x k_{+ 1)} xk −→ 1 5, visto que x k _{→ 0.}

A sequencia converge para zero q-linearmente, com raz˜ao de convergˆencia 1₅.

Alguns autores definem outro tipo de convergência caracterizada pelo prefixo “r” (raiz). É uma forma mais fraca de convergência que é usada para caraterizar taxas de convergência de algoritmos quando a convergência é não monótona.

Defini¸c˜ao B.5 Dada uma sucess˜_{ao em R}n_{que converge para x}∗_{, diz-se que a convergˆ}_encia

e r-quadrática se existir uma sucessão de números reais {αk} que converge q-quadraticamente

para zero, tal que para todo k

kxk_{− x}∗_{k ≤ α} k.

[1] Ben-Israel A. On iterative methods for solving nonlinear least squares problems over convex sets. Israel Journal of Mathematics, 5(4):211–224, 1967.

[2] Horn R. A. and Johnson C. R. Matrix Analysis. Cambrigde University Press, U.K., 1st edition, 1985.

[3] A. Antoniou and W. Lu. Practical Optimization, Algorithms and Engineering Appli- cations. Springer, New York, 2007.

[4] A. C. Barbero, J. L. H. Pagoaga, and J. R. T. Sánchez. Cálculo Numérico, Teor´ıa y Problemas. Editorial de la Universidad Politécnica de Valencia, Valencia, 2nd edition, 2004.

[5] P. T. Boggs and J. E. Rogers. Orthogonal distance regression. Technical report, Applied and Computational Mathematics Division, U.S Department of Commerce, National Institute of Standards and Technology, Gaithersburg, 1990.

[6] S. C. Chapra and R. P. Canale. Métodos Numéricos para Engenharia. McGraw-Hill, Av. Brigadeiro Faria Lima, São Paulo, 5th edition, 2008.

[7] Jukiˇc D., Sabo K., and Scitovski R. A review of existence criteria for parameter estimation of the Michaelis-Menten regression model. Annals of university of Ferrara, 53:281–291, 2007.

[8] Jukiˇc D. and Scitovski R. Existence of optimal solution for exponential model by least squares. Journal of Computational and Applied Mathematics, 78:317–328, 1997. [9] Jukiˇc D. and Scitovski R. Solution of the least-squares problem for logistic function.

Journal of Computational and Applied Mathematics, 156:159–177, 2003.

[10] Jukiˇc D. and Scitovski R. Least squares fitting gaussian type curve. Applied Mathe- matics and Computation, 167:286–298, 2005.

[11] J. E. Dennis and R. B. Schnabel. Numerical Methods for Unconstrained Optimization and Nonlinear Equations. SIAM, New York, 1996.

[13] Demidenko E. Criteria for global minimum of sum of squares in nonlinear regression. Computational Statistics and Data Analysis, 51:1739–1753, 2006.

[14] Dubeau E. and Youness M. I. R. Existence of optimal weighted least squares estimate for three-parametric exponential model. Communications in Statistics - Theory and Methods, 37(9):1383–1398, 2008.

[15] Gill P. E. and Murray W. Algorithms for the nonlinear least-squares problem. SIAM Journal of Numerical Analysis, 15(5):977–992, 1978.

[16] J. S. Esteves. Apontamentos de Otimiza¸c˜ao Num´erica. Universidade de Aveiro, 2012. Notas de aula.

[17] E. M. Fernandes. Computa¸c˜ao Num´erica. Universidade do Minho, Braga, 2nd edition, 1997.

[18] Ramsin H and Wedin P. A comparison of some algorithms for the nonlinear least squares problem. BIT Numerical Mathematics, 17(1):72–90, 1977.

[19] G. Iezzi and S. Hazzan. Fundamentos de Matemática Elementar. Atual Edi¸cão, São Paulo–Brasil, 2nd edition, 1977.

[20] Herskovits J., Veranise D., Soares C. M. M., and Ara´ujo A. Interior point algorithms for nonlinear constrained least squares problems. Inverse Problems in Science and Engineering, 12(2):211–223, 2004.

[21] A. Jalid. Nouvelle méthode d’estimation des paramètres de surface et incertitudes associées. In 19ême Congrés Fran¸cais de Mécanique, Douai, France, 2009.

[22] Madsen K., Nielsen H. B., and Tingleff O. Methods for non-linear least squares problems. Informatics and Mathematical Modeling, Technical University of Denmark, Matematiktorvet, Lyngby, Denmark, 2004.

[23] C. T. Kelley. Iterative methods for optimization: Matlab codes. http://www4.ncsu. edu/~ctk/matlab_darts.htm, 1999. [Acedido a 17 de Maio de 2013].

[24] P. Lancaster and M. Tismenetsky. The Theory of Matrices. Academic Press, San Diego CA, USA, 2nd edition, 1984.

[25] D. G. Luenberger and Y. Ye. Nonlinear Programming. Dept. of Management Science and Engineering, Stanford University, Stanford, CA, USA, 3rd edition, 2008.

[26] Nesam M. and Bartels R. H. Constrained nonlinear least squares: An exact penalty approach with projected structured quasi-newton updates. ACM Transactions on Mathematical Software, 15(3):220–242, 1989.

[27] H. J. Mart´ınez and I. Rivas. El Problema de M´ınimos Cuadrados no Lineales: Metodos de Solucion. Universidad de los Andes, Colombia, 2005.

[28] F. M. Mello and R. C. Guimarães. Optimiza¸cão Numérica com Aplica¸cões na Mo- dela¸cão Hidrológica. Edi¸cões S´ılabo, Lisboa, 2008.

[29] J. Nocedal and S. J. Wright. Numerical Optimization. Springer, New York, 2nd edition, 1999.

[30] Guller O. Foundations of Optimization. Graduate Texts in Mathematics 258. Springer, New York, 2010.

[31] H. Pina. M´etodos Num´ericos. Escolar Editora, Rua do Vale Formoso, 37, Lisboa, 2nd edition, 2010.

[32] A. Quarteroni, R. Sacco, and F. Saleri. Numerical Mathematics. Springer, New York, 2nd edition, 2006.

[33] S. S. Rao. Engineering Optimization, Theory and Practice. John Wiley & Sons, Hoboken, United States of America, 4th edition, 2009.

[34] A. A. Ribeiro and E. W. Karas. Um curso de Otimiza¸c˜ao. Universidade de Curitiba, Curitiba, Brasil, 2001.

[35] R. Rodrigues and A. Pereira. Apontamentos de An´alise Num´erica. Universidade de Aveiro, Aveiro, 2010. Notas de aula.

[36] A. C. Santo. Modela¸cão e Estima¸cão de Parâmetros. Universidade do Minho, Braga, 2001.

[37] F. M. C. Santos. Fundamentos de Análise Numérica. Edi¸cões S´ılabo, R. Cidade de Manchester, 2, Lisboa, 1st edition, 2002.

[38] S. Shan. A Levenberg-Marquardt method for large-scale bound-constrained nonlinear least-squares. Master thesis in computer science, The University of British Columbia, Vancouver, 2008.

[39] Soares, J. L. C. Métodos de Newton para Optimiza¸cão com Restri¸cões Simples. De- partamento de Matemática, Faculdade de Ciências e Tecnologia da Universidade de Coimbra, 1993. Provas de Aptidão Cient´ıfica.

[40] Carlos Sousa. Apontamentos de Complementos de Matem´atica. Universidade do Al- garve, Escola Superior de Tecnologia, 2007. Notas de aula.

[41] T. Tchemisova. Otimiza¸c˜ao em Redes e N˜ao Linear. Universidade de Aveiro, 2008. Notas de aula.

[42] J. Tvrdik and I. Kriv. Nonlinear Regression (14 difficult models). University of Ostrava, Ostrava, Czech Republic, 2000.

[43] L. N. Vicente. Apontamentos de Matemática Numérica II. Departamento de Ma- temática, Faculdade de Ciências e Tecnologia da Universidade de Coimbra, 2006. Notas de aula.

[44] Marquardt D. W. An algorithm for least-squares estimation of nonlinear parameters. SIAM Journal, 11(2):431–414, 1963.

[45] Yuan Y. Recent advances in numerical methods for nonlinear equations and nonlinear least squares. Numerical algebra, control and optimization, 1(1):15–34, 2011.

No documento Otimização não linear de mínimos quadrados (páginas 123-132)