• Nenhum resultado encontrado

Filtragem estocástica : variação da estimativa como fonte de incerteza

N/A
N/A
Protected

Academic year: 2021

Share "Filtragem estocástica : variação da estimativa como fonte de incerteza"

Copied!
77
0
0

Texto

(1)

UNIVERSIDADE ESTADUAL DE CAMPINAS

Faculdade de Engenharia Elétrica e de Computação

Marcos Rogério Fernandes

Filtragem Estocástica: Variação da Estimativa

como Fonte de Incerteza

Campinas

2019

(2)

Marcos Rogério Fernandes

Filtragem Estocástica: Variação da Estimativa como Fonte

de Incerteza

Dissertação apresentada à Faculdade de Enge-nharia Elétrica e de Computação da Univer-sidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestre em Engenharia Elétrica, na Área de Automação.

Orientador: Prof. Dr. João Bosco Ribeiro do Val

Coorientador Prof. Dr. Rafael Fontes Souto

Este exemplar corresponde à versão final da dissertação defendida pelo aluno Marcos Rogério Fernandes, e orientada pelo Prof. Dr. João Bosco Ribeiro do Val

Campinas

2019

(3)

Ficha catalográfica

Universidade Estadual de Campinas Biblioteca da Área de Engenharia e Arquitetura

Rose Meire da Silva - CRB 8/5974

Fernandes, Marcos Rogério,

F391f FerFiltragem estocástica : variação da estimativa como fonte de incerteza / Marcos Rogério Fernandes. – Campinas, SP : [s.n.], 2019.

FerOrientador: João Bosco Ribeiro do Val. FerCoorientador: Rafael Fontes Souto.

FerDissertação (mestrado) – Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação.

Fer1. Kalman, Filtragem de. 2. Teoria da estimativa. 3. Estatística robusta. I. Val, João Bosco Ribeiro do, 1955-. II. Souto, Rafael Fontes, 1984-. III. Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação. IV. Título.

Informações para Biblioteca Digital

Título em outro idioma: Stochastic Filtering : estimation variation as source of uncertainty Palavras-chave em inglês:

Kalman Filtering Estimation theory Robust statistic

Área de concentração: Automação Titulação: Mestre em Engenharia Elétrica Banca examinadora:

João Bosco Ribeiro do Val [Orientador] Luis Antonio Aguirre

Ricardo Coração de Leão Fontoura de Oliveira

Data de defesa: 11-03-2019

Programa de Pós-Graduação: Engenharia Elétrica

Identificação e informações acadêmicas do(a) aluno(a) - ORCID do autor: https://orcid.org/0000-0002-4848-1398

- Currículo Lattes do autor: http://lattes.cnpq.br/8922874435141893

(4)

COMISSÃO JULGADORA - DISSERTAÇÃO DE MESTRADO

Candidato: Marcos Rogério Fernandes RA: 192684 Data da defesa: 11 de março de 2019

Título da tese:

“Filtragem Estocástica: Variação da Estimativa como Fonte de Incerteza”

Prof. Dr. João Bosco Ribeiro do Val (presidente, FEEC/UNICAMP)

Prof. Dr. Luis Antonio Aguirre (UFMG)

Prof. Dr. Ricardo Coração de Leão Fontoura de Oliveira (FEEC/UNICAMP)

A ata de defesa, com as respectivas assinaturas dos membros da Comissão Julga-dora, encontra-se no SIGA (Sistema de Fluxo de Dissertação/Tese) e na Secretária de Pós-Graduação da Faculdade de Engenharia Elétrica e de Computação.

(5)

Dedico este trabalho aos meus pais: Mario Aparecido Fernandes e Marli Taborda Fernandes.

(6)

Agradecimentos

Sou grato aos meus familiares e colegas que de uma forma direta ou indireta contri-buíram para o sucesso deste trabalho.

Gostaria de agradecer, principalmente, ao Prof. João Bosco e Prof. Rafael Souto pela oportunidade de desenvolver este trabalho em conjunto. Também sou grato pela confiança de-positada em minha pessoa e nas excelentes conversas que tivemos durante o desenvolvimento do trabalho. O conhecimento que tive o privilégio de adquirir é minha maior recompensa. No entanto, se cheguei até aqui foi por que estava no ombro de gigantes. Obrigado Prof. João e Prof. Rafael.

O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001.

(7)

The physical world has been and continues to be the primary source of intriguing and significant mathematical problems. –Richard Bellman

(8)

Resumo

Esta dissertação apresenta uma nova classe de estimadores em que a Variação da Estimativa pode Aumentar a Incerteza, denominada Estimadores EVIU (em inglês, Estimation

Vari-ation Increase the Uncertainty). Esta nova classe de estimadores é aplicada na filtragem e

predição do estado de sistemas, cuja dinâmica não é completamente conhecida, considerando que apenas um conjunto limitado de informações sobre o sistema verdadeiro está disponível. Estudos aqui apresentados indicam que esta abordagem pode produzir resultados melhores, quando comparados com outros métodos da literatura. Essa forma de tratar o problema de estimação toma como base resultados obtidos na área de Controle Estocástico no qual a Variação do Controle ou do Estado podem Aumentar a Incerteza, denominado Controle CVIU (Control or State Variation Increase the Uncertainty). A principal estratégia adotada para essa nova classe de estimadores no contexto de filtragem é a formulação do problema de Mínimos Quadrados Regularizados com a adição de ruídos dependentes do valor absoluto da variação da estimativa, de forma a compensar incertezas de modelagem. Tal abordagem cria um novo paradigma para tratar o problema de estimação de sistemas subdeterminados e apresenta características inéditas, como uma região no espaço de inovação em que a não-variação da estimativa é a solução ótima. Baseado no método aqui proposto, uma não-variação do Filtro de Kalman é desenvolvida de forma a tratar sistemas cuja dinâmica é pouco conhecida. Ademais, uma extensão para tratar sistemas não-lineares também é desenvolvida. Aplicações típicas em que a estimação de estados é amplamente utilizada englobam sistemas na área de Engenharia Elétrica tais como rastreamento e navegação, robótica, controle e processamento de sinais, bem como aplicações em contextos biológicos e econômicos. Para ilustrar os benefí-cios do método proposto, ao final são realizados experimentos numéricos que são comparados com a literatura.

(9)

Abstract

This work shows a new class of estimators in which the Estimation Variation might Increase the Uncertainty, named EVIU Estimator. This new class of estimators is employed to filtering and prediction of stochastic dynamic systems when just a rough model or only some historical information about the real system are available. This work shows that this approach can yield better results when compared with other methods from the literature. This alternative way to deal with the Estimation Problem has motivation from results achieved in the Stochastic Control context where the Control or State Variation Increase the Uncertainty, named CVIU. The main strategy adopted for this new approach on filtering problems is a modified version of the Regularized Least Square Problem with the introduction of an extra noise term de-pendent on the absolute value of estimation variation to compensate modeling uncertainties. Therefore, a novel paradigm to deal with the estimation of a poorly known dynamic system is provided. In addition, this approach indicates a region in the inovation space where the non-variation of the estimate is optimal. Based on such approach, a Kalman-type filter is provided for filtering of poorly known dynamic systems. An extension to a non-linear system is also included. Typical applications of this approach in electrical engineering problems are tracking systems, robotic navigation, state feedback control, and signal processing, besides unusual applications in Economic and Biologic System might also be employed. In order to demonstrate the benefits of this new approach, numerical experiments and comparisons are provided.

(10)

Lista de ilustrações

Figura 1 – Etapas do Filtro de Kalman.. . . 27

Figura 2 – Aumento da incerteza de modelo conforme 𝑥 se afasta de 𝑥0. As elipses indicam a região de incerteza. . . 34

Figura 3 – Comportamento da 𝜕𝑣𝑖𝐽 (𝑣, 𝑧) para 𝑧 em diferentes regiões do R 𝑚. Na situação (c), tem-se 𝑣* 𝑖 = 0. . . 42

Figura 4 – Ilustração das regiões 𝒵𝑖+, 𝒵𝑖− e 𝒵0 𝑖. . . 43

Figura 5 – Ilustração da Região de Inação 𝒵0 = ∩2 𝑖=1𝒵𝑖0. . . 44

Figura 6 – Etapas do Filtro EVIU. . . 44

Figura 7 – Desempenho para 𝛿 ∈ [−1, 1]. . . . 57

Figura 8 – Desempenho para 𝛿 sorteado uniformemente entre [0, 1]. . . . 58

Figura 9 – Desempenho para 𝛿 sorteado uniformemente entre [−1, 0]. . . . 59

Figura 10 – Desempenho para 𝛿 sorteado uniformemente entre [−1, 1]. . . . 59

Figura 11 – Desempenho para 𝛿 = 1. . . . 60

Figura 12 – Desempenho para 𝛿 = −1. . . . 61

Figura 13 – Variação da estimativa do FK (lado esquerdo) e do Filtro EVIU (lado direito) com 𝛿 = 1. . . . 62

Figura 14 – Trajetórias estimadas pelo FK e pelo Filtro EVIU com 𝛿 = 1. . . . 63

Figura 15 – Ilustração do modelo cinemático. . . 64

Figura 16 – Curvas do MSE relativas ao FKE e ao Filtro EVIU. As sombras indicam o intervalo de confiança de 95%. . . 65

Figura 17 – Trajetórias estimadas pelo FKE e Filtro EVIU para uma realização do sistema com ^𝑥0|0 = [45 45 0]|. A tracejada em preto indica a trajetória real. 66 Figura 18 – Comparação entre Folded Distribution e Distribuição Normal com 𝜇 = 0, 𝜎2 = 1.. . . . 75

(11)

Lista de Símbolos e Acrônimos

Diag{·} Matriz formada apenas pelas entradas da diagonal principal.

^

𝑥 Estimador de 𝑥.

E{·} Operador Esperança Matemática.

R𝑛 Espaço Euclidiano usual com 𝑛 dimensões.

𝒩 (𝑚, Σ) Distribuição Normal com média 𝑚 e variância Σ.

𝜕{·} Operador subdiferencial.

tr{·} Operador traço.

‖𝑥‖2

𝑊 Subnorma de 𝑥 ponderada por 𝑊 (𝑥𝑊 𝑥).

𝑝𝑥(𝑥) Função de densidade de probabilidade de 𝑥.

CVIU Control Variation Increase the Uncertainty

EVIU Estimation Variation Increase the Uncertainty

FK Filtro de Kalman

FKE Filtro de Kalman Estendido

GPS Global Position System.

MSE Mean Squared Error (Erro Médio Quadrático)

NASA National Agency of Space and Aeronautic.

RLS Regularized Least Square (Mínimos Quadrados Regularizado).

(12)

Sumário

1 Introdução. . . . 14

1.1 Contextualização . . . 14

1.2 Uma Visão Histórica . . . 16

1.3 Contribuições deste Trabalho . . . 19

1.4 Publicações resultantes deste trabalho . . . 20

1.5 Estrutura da Dissertação . . . 20

I

Fundamentos Teóricos

21

2 Teoria de Estimação . . . . 22 2.0.1 Esperança Matemática . . . 22 2.0.2 Processo Estocástico . . . 23 2.1 Estimadores . . . 23

2.1.1 Estimador de Mínimo Erro Médio Quadrático . . . 24

2.1.2 Estimador de Mínimos Quadrados . . . 24

2.2 Filtragem Estocástica . . . 26

2.2.1 Filtro de Kalman . . . 26

2.2.2 Filtro de Kalman Estendido . . . 29

II Contribuições

32

3 Uma nova estratégia de Estimação . . . . 33

3.1 Representação das Incertezas. . . 33

3.2 Variação da Estimativa Como Fonte de Incerteza . . . 35

3.2.1 Solução . . . 36

3.2.2 Obtendo o vetor de sinais . . . 41

3.3 Construção do algoritmo de Filtragem . . . 44

3.3.1 Etapa de Predição . . . 44

3.3.2 Etapa de Atualização . . . 47

3.3.3 Implementação . . . 49

3.4 Tratando o caso do FKE . . . 50

3.4.1 Predição . . . 51

3.4.2 Atualização . . . 52

(13)

4.1 Caso Linear . . . 56

4.2 Caso Não-linear . . . 63

5 Conclusões . . . . 67

Referências . . . . 69

APÊNDICE A Noções de Probabilidade . . . . 72

APÊNDICE B Folded Distribution . . . . 75

(14)

14

1 Introdução

Este capítulo apresenta uma contextualização do tema a ser explorado e ilustra a motivação para o desenvolvimento deste trabalho. Em seguida, uma breve revisão histórica da área de filtragem é fornecida. Ao final do capítulo, são expostas as principais contribuições alcançadas, as publicações geradas e a estrutura da dissertação.

1.1

Contextualização

A Teoria de Estimação é uma das principais ferramentas da Engenharia Elétrica. Tendo suas origens no contexto astronômico, ela vem ganhando cada vez mais importância em diversas aplicações modernas como GPS (Global Position System), robótica móvel, ras-treamento de alvos (RISTIC et al., 2003), recepção de sinais (HAYKIN, 2014), sistemas de aero-navegação (GIBBS,2011;GREWAL; ANDREWS,2010), controle de processos industri-ais além de aplicações em contextos não usuindustri-ais tindustri-ais como a previsão de flutuações econômicas (WELLS, 1996) e sistemas biológicos (JULIUS et al., 2008).

Conforme discutido por Bar-Shalom et al. (2004), Estimação consiste no processo de inferir o valor de uma certa quantidade de interesse a partir de observações que podem conter ruído. Ou seja, busca-se maximizar o conhecimento sobre um parâmetro, estado ou sinal de interesse pelo processamento de um conjunto de medições disponíveis.

Supondo um histórico de observações 𝑌𝑘 = {𝑦

0, 𝑦1, . . . , 𝑦𝑘}, o estimador ^𝑥𝑙|𝑘 é dito ser

um filtro se 𝑙 = 𝑘, um preditor se 𝑙 > 𝑘 ou suavizador se 𝑙 < 𝑘. Em particular, este trabalho se dedica ao estudo de preditores e filtros em que a variável de interesse consiste no vetor de estados1 de um sistema dinâmico estocástico.

De modo geral, a teoria de estimação busca o desenvolvimento de estimadores que sejam ótimos em relação a um certo critério de desempenho. Assim, por meio de um conjunto de observações, o estimador deve ser capaz de produzir estimativas da variável de interesse otimizando uma medida de desempenho. Uma vez que, geralmente, trabalha-se com modelos cuja natureza é estocástica, é comum utilizar-se como métrica de desempenho parâmetros estatísticos do estimador, tais como média e variância. Nesse sentido, fundamenta-se o famoso Filtro de Kalman (FK), apresentado em Kalman (1960).

O FK apresenta o mínimo Erro Médio Quadrático (MSE) quando aplicado a siste-1 O vetor de estados é uma coleção de variáveis dinâmicas que descrevem completamente um sistema.

(15)

Capítulo 1. Introdução 15

mas lineares, precisamente conhecidos e cujos ruídos ou distúrbios aleatórios seguem uma distribuição Gaussiana não correlacionada entre si.

No entanto, conforme discutido porD’Appolito e Hutchinson (1969), o FK apresenta uma sensibilidade considerável ao modelo dinâmico. Assim, caso não se tenha à disposição o conhecimento preciso dos parâmetros do sistema (e.x. massa, resistência elétrica, coefici-entes de atrito, densidade etc.) ou mesmo a própria estrutura do modelo (incertezas não-paramétricas), a qualidade das estimativas pode-se deteriorar expressivamente.

Inúmeras abordagens, denominadas de Filtragem Robusta, foram proposta nas últimas décadas para contornar a sensibilidade do FK tradicional. Em sua maioria, tais abordagens tratam o problema de sensibilidade do ponto de vista determinístico, assumindo que as in-certezas presentes no modelo são limitadas a um certo intervalo ou conjunto e, dessa forma, representam uma família de modelos. Os algoritmos de filtragem são então elaborados de forma a satisfazer determinado critério de desempenho (e.x. Norma ℋ2 ou ℋ∞.) para o pior caso dentro dessa família. Alguns exemplos são: Fu et al. (1992), Li e Fu (1997), Geromel

(1999), Sun e Packard (2005),Lacerda et al. (2011).

Além da adoção das normas, outras abordagens buscam encontrar filtros que garantam uma covariância mínima para todos os possíveis elementos da família, chamados de Filtros de

Mínima Covariância, alguns exemplos são:Shaked e Souza(1995),Theodor e Shaked(1996),

Shaked et al. (2001).

Uma abordagem diferente das já citadas é apresentada em Sayed (2001), Ishihara

et al. (2015), Abolhasani e Rahmani (2018). Nesses casos, os algoritmos são obtidos pela formulação de um problema de otimização baseado no Mínimos Quadrados Regularizado (RLS).

Existem ainda sistemas mais desafiadores, do ponto de vista de modelagem, geral-mente de origens não-convencionais, tais como Sistemas Biológicos (KITANO,2002;JULIUS

et al., 2008) e Econômicos (WELLS, 1996) ou mesmo Plantas Industriais que operam em condições críticas as quais não podem ser submetidas a ensaios. Para esses casos, torna-se inviável ou mesmo impossível construir modelos dinâmicos por meio de técnicas convenci-onais de identificação. Assim, apenas um conjunto limitado de informações do histórico do sistema estão disponíveis. Para tratar essas classes de sistema, via métodos baseados em mo-delos, pode ser mais eficiente a adoção de estratégias cautelosas, tanto para controle quanto estimação.

Em do Val e Souto (2017), Pedrosa et al. (2017), uma nova forma de representar as incertezas de modelagem, denominada Modelo CVIU (Control and State Variation Increase

(16)

Capítulo 1. Introdução 16

Pouco Conhecida. Nesse modelo, conjectura-se que a própria variação do estado ou do controle atue como fontes de incertezas. O modelo CVIU quando aplicado à formulação do problema de Controle Ótimo dá origem a uma nova estratégia de controle, denominada de Controle

CVIU. Uma característica do Controle CVIU é o surgimento de uma região no espaço de

estados em que a solução ótima é a não-variação da ação de controle. Dessa forma, o Controle CVIU pode ser interpretado como a formulação matemática para um controlador cauteloso (NEREU, 2018).

Motivado por esses trabalhos, objetiva-se aqui desenvolver uma estratégia “dual” a do controle para tratar o Problema de Filtragem de Sistemas com Dinâmica Pouco Conhecida.

1.2

Uma Visão Histórica

“To understand a science it is necessary to know its history.”

—Auguste Comte (1798-1857)

As mais antigas motivações para o desenvolvimento da teoria de estimação, aparen-temente, são atribuídas a estudos astronômicos, os quais buscavam determinar o movimento da Lua, planetas e cometas no céu usando medidas feitas com telescópios.

A origem da teoria de estimação linear é creditada a Carl Friedrich Gauss que em 1795, aos 18 anos, supostamente usou pela primeira vez o método dos mínimos quadrados (HAYKIN, 2014; GIBBS, 2011). No entanto, esta técnica ganhou notoriedade somente em 1801 quando Gauss realizou previsões da trajetória do asteroide Ceres com mais precisão do que todos os outros astrônomos da época. Nesse meio tempo, Adrien-Marie Legendre, independentemente, desenvolveu o mesmo método de Gauss — também com interesse em movimento de objetos celestes — e fez a publicação em um livro no ano de 1806. Gauss, no entanto, continuou aprimorando seu método e apenas o publicou em 1809 no livro intitulado

Theoria Motus no qual incluiu a descrição detalhada do método de mínimos quadrados.

Em seu livro, diferentemente de Legendre, Gauss foi o primeiro a argumentar que a determinação do valor mais provável implicava minimizar os resíduos de observação. Baseado em suas análises, Gauss propôs uma distribuição de probabilidade que hoje conhecemos como distribuição Gaussiana. Após as publicações das ideias de Gauss, muitos outros trabalhos relacionados foram desenvolvidos. Porém, nenhuma nova grande contribuição para a teoria de estimação foi apresentada até meados de 1940.

Somente cerca de 140 anos após os trabalhos de Gauss foi que surgiram trabalhos relevantes sobre processos estocásticos. As grandes contribuições nessa época foram feitas, principalmente, por Kolmogorov, Klein e Wiener (GIBBS, 2011).

(17)

Capítulo 1. Introdução 17

Kolmogorov, inspirado por alguns trabalhos da época, desenvolveu um rigoroso tra-tamento do problema de predição linear de sistemas estocásticos a tempo discreto. Klein foi quem estendeu os trabalhos de Kolmogorov para tratar o caso a tempo contínuo. Por outro lado, Wiener trabalhando de forma independente formulou o problema de predição linear com ruído aditivo, o que ficou conhecido como Filtro de Wiener. O principal objetivo de Wiener era estimar um sinal contaminado por ruído fazendo comparação com um sinal de referência. Wiener demonstrou que a solução ótima para o problema pode ser obtida pelo o que ficou conhecido como Equação de Wiener-Hopf. Posteriormente, Levinson estendeu o Filtro de Wiener para o caso a tempo discreto e desenvolveu uma elegante solução recursiva (HAYKIN, 2014).

Com o advento da era espacial, ao final da década de 50, diversas extensões do Filtro de Wiener foram propostas, no entanto, a abordagem de Wiener era restrita a processos estocásticos estacionários e era demasiadamente complicada de resolver conforme se aumen-tava o número de observações do processo. Isto a tornava inviável para certas aplicações que surgiam na época, como a determinação da órbita de satélites e aero-navegação.

Foi Rudolf Emil Kalman2 quem reformulou as ideias do Filtro de Wiener para o caso

não-estacionário, apresentando o famoso artigo intitulado A New Approach to Linear

Filte-ring and Prediction Problems (KALMAN,1960). Inicialmente, Kalman realizou o desenvolvi-mento do algoritmo de filtragem de mínima variância para sistemas lineares a tempo discreto. Posteriormente, com a colaboração de Bucy, desenvolveu também o caso a tempo contínuo resultando no trabalho Kalman e Bucy (1961). O Filtro de Kalman (FK) foi rapidamente reconhecido como uma ferramenta de grande importância prática. É interessante notar que o problema de determinação de órbitas pode ter sido uma das principais motivações tanto para Gauss no século XVIII quanto para Kalman no século XX.

Kalman, diferentemente da forma como era usual na época, adotou a representação em espaço de estados cuja análise era feita exclusivamente no domínio do tempo. Em seu artigo, Kalman também apresentou uma relação surpreendente entre o Problema de Filtragem e o Controle Ótimo. Para o caso de sistemas lineares com custo quadrático, Kalman verificou que a filtragem e o controle eram problemas de naturezas duais. As contribuições feitas por Kalman são reconhecidas como umas das mais importantes já realizadas na área de controle e sistemas modernos (PETERSEN; SAVKIN, 1999).

No entanto, uma vez que a maioria dos sistemas reais são de natureza não-linear, Stan-ley Schmidt, trabalhando para Administração Nacional da Aeronáutica e Espaço (NASA), percebeu que, do ponto de vista prático, era mais apropriado escrever as equações do FK 2 Rudol E. Kalman (1930-2016), foi professor de matemática na Universidade da Florida e na Universidade

(18)

Capítulo 1. Introdução 18

em duas etapas, uma de predição e outra de atualização. Dessa forma, era possível esten-der a abordagem de Kalman para modelos não-lineares, dando origem ao Filtro de Kalman Estendido (FKE). Assim, com as contribuições de Schmidt, a NASA adotou o FK para imple-mentar o sistema de navegação do Projeto Apollo, conforme discutido por McGee e Schmidt

(1985), fazendo com que o FK se tornasse amplamente conhecido.

Mais informações históricas sobre a teoria clássica de estimação e suas aplicações podem ser encontradas por Kailath et al. (2000), Anderson e Moore (1979),Haykin (2014),

Gibbs (2011), Grewal e Andrews(2010).

Apesar da otimalidade apresentada pelo FK, em termos de Erro Médio e Variância, o FK apresenta significativa sensibilidade ao modelo do sistema, portanto, faz-se necessário desenvolver estratégias para tornar o FK menos sensível a incertezas de modelagem, dando origem à Filtragem Robusta.

Historicamente, principalmente na área de sistemas de controle, a robustez recebeu enorme atenção a partir da década de 60. Um grande marco aconteceu em meados dos anos 70 quando foi reconhecido que o problema de minimização de sensibilidade para controla-dores poderia ser resolvido de forma fechada para alguns casos. Isso abriu as portas para o desenvolvimento de estratégias de otimização robusta, principalmente com a publicação dos trabalhos de George Zames (HAYKIN, 2014; ZAMES, 1998).

Zames se dedicou ao entendimento e quantificação das limitações inerentes aos sis-temas de controle diante de incertezas de modelagem. Sua contribuição mais notável para análise robusta foi o artigo intitulado “Feedback and Optimal Sensitivity: Model Reference

Transformations, Multiplicative Seminorms and Approximate Inverses” publicado pela IEEE Transactions on Automatic Control em 1981. Pela primeira vez, foram apresentadas as ideias

que vieram a se tornar a Teoria de Controle ℋ∞ (ZAMES, 1998).

Porém, foi somente após cerca de uma década que a comunidade de Processamento de Sinais e Filtragem percebeu que as mesmas ideias já desenvolvidas para o problema de Controle Robusto podiam também ser aplicadas ao caso de Filtragem Robusta (HAYKIN,

2014). Assim, uma das primeiras estratégias para Filtragem Robusta foi a adoção da norma ℋ∞ como medida de desempenho. Nessa abordagem, o principal objetivo é minimizar a norma ℋ∞ considerando o ruído de entrada e o erro de estimação. Uma das peculiaridades da Filtragem ℋ∞ é que não se faz necessária a consideração de características estatísticas do sistema a ser filtrado (PETERSEN; SAVKIN, 1999). Apesar de inúmeras abordagens disponíveis na literatura para tratar o problema de Filtragem Robusta, os métodos existentes apresentam um nível significativo de conservadorismo e restrições, sendo, portanto, uma área ainda em constante evolução e com grandes desafios em aberto.

(19)

Capítulo 1. Introdução 19

1.3

Contribuições deste Trabalho

A principal contribuição deste trabalho é o desenvolvimento de uma nova abordagem para o problema de Filtragem Robusta empregando o conceito de que a Variação da Estima-tiva pode Aumentar a Incerteza. Uma solução para esta abordagem é proposta por meio da formulação do Problema de Mínimos Quadrados Regularizados (RLS) em que as incertezas são modeladas por meio da adição de ruídos dependente do valor absoluto da variação da estimativa.

Como resultado, verifica-se o surgimento de uma região no espaço de inovação em que a solução ótima é a não-variação da estimativa. Portanto, nesse sentido, esta abordagem apresenta características “duais” ao Controle CVIU, apresentado por do Val e Souto (2017), em que existe no espaço de estados uma região na qual a solução ótima é a não-variação da ação de controle.

Além do mais, diferentemente da maioria das abordagens encontradas na literatura, neste trabalho é desenvolvida uma estratégia de Filtragem Robusta partindo de um ponto de vista estocástico, buscando, assim, otimizar o valor esperado de desempenho ao invés do pior caso. Por fim, é verificado por meio de experimentos numéricos que tais ideias são aplicáveis e podem produzir melhores resultados que outras estratégias existentes na literatura.

É importante mencionar que, até o momento, desconhece-se na literatura uma formu-lação para o Problema de Filtragem em que exista tal comportamento de “inação” como na estrutura aqui proposta. Assim, as ideias desenvolvidas neste trabalho são uma novidade na literatura para o contexto de Filtragem Robusta.

Possíveis aplicações em que este trabalho pode ser inserido residem em sistemas de rastreamento, controle via realimentação de estados e processamento de sinais em geral.

(20)

Capítulo 1. Introdução 20

1.4

Publicações resultantes deste trabalho

Este trabalho resultou no desenvolvimento de um artigo apresentado em Congresso Internacional, outro apresentado em Congresso Nacional e um terceiro trabalho submetido a um Periódico Internacional.

1. M. R. Fernandes, J. B. R. do Val, e R. F. Souto, “Filtering of poorly known systems: Variation of the estimation as source of uncertainty,” in 57th Annual Conference on Decision and Control (CDC), IEEE, Miami, FL, USA, Dezembro, 2018.

2. M. R. Fernandes, J. B. R. do Val, e R. F. Souto, “Filtragem não-linear: Variação da estimativa como fonte de incerteza,” in Anais do XXII Congresso Brasileiro de Automática (CBA), João Pessoa, PB, BR, Setembro, 2018.

3. M. R. Fernandes, J. B. R. do Val, e R. F. Souto, “Filtering and estimating based on Poorly Known Dynamic System Models” Systems & Control Letters, [submetido] Dezembro, 2018.

1.5

Estrutura da Dissertação

Esta dissertação é dividida em duas partes: Fundamentos Teóricos e Contribuições. A primeira parte é composta pelo Capítulo 2 e a segunda parte pelos Capítulos de 3, 4 e 5. A seguir, é dado uma breve descrição de cada capítulo.

Capítulo 2: apresenta os fundamentos teóricos necessários para a compreensão dos

resultados alcançados neste trabalho, assim como estabelece a notação adotada;

Capítulo 3: contém o desenvolvimento das contribuições do trabalho, como a

cons-trução de um novo critério de desempenho para estimação de sistemas com dinâmica pouco conhecida. Apresenta também uma variação do Filtro de Kalman e Filtro de Kalman Es-tendido em que é embutida a noção de que a Variação da Estimativa pode Aumentar a Incerteza;

Capítulo 4: demonstra por meio de experimentos numéricos os benefícios da

abor-dagem proposta.

Capítulo 5: As considerações finais são apresentadas juntamente com possíveis

(21)

21

Parte I

(22)

22

2 Teoria de Estimação

O texto a seguir consiste, essencialmente, em uma coleção de conceitos e ferramentas disponíveis na literatura na área de estimação. Além disso, este capítulo também estabelece a notação utilizada ao longo da dissertação.

2.0.1

Esperança Matemática

Definição 2.0.1 (Esperança matemática). Para uma variável aleatória 𝑋 com função de

densidade 𝑝𝑋(𝑥) conhecida e uma função 𝑔(·) mensurável, define-se o operador Esperança

Matemática por

E{𝑔(𝑋)} =

∫︁ +∞

−∞

𝑔(𝑋)𝑝𝑋(𝑥)𝑑𝑥.

Propriedade 2.0.1 (Linearidade da Esperança Matemática). Para 𝑋 e 𝑌 variáveis

aleató-rias, 𝐴 e 𝐵 constantes determinísticas, tem-se

E{𝐴𝑋 + 𝑌 + 𝐵} = 𝐴E{𝑋} + E{𝑌 } + 𝐵.

Definição 2.0.2 (Valor Esperado Condicional). Para 𝑋, 𝑌 variáveis aleatórias (v.a.) com

distribuição de probabilidade conhecida, define-se o valor esperado condicional de 𝑋 dado 𝑌 por

E{𝑋|𝑌 } =

∫︁ +∞

−∞ 𝑥𝑝𝑋|𝑌(𝑥|𝑦)𝑑𝑥.

Definição 2.0.3 (Momentos). Considere a v.a. 𝑋 com função de densidade conhecida,

define-se o 𝑛-ésimo momento de 𝑋 por

E{𝑋𝑛} =

∫︁ +∞

−∞

𝑥𝑛𝑝𝑋(𝑥)𝑑𝑥.

Em particular, para 𝑛 = 2, tem-se

E{𝑋2} = cov(𝑋) + ¯𝑋2,

em que cov(𝑋) = E{(𝑋 − ¯𝑋)2} e ¯𝑋 = E{𝑋} indicam, respectivamente, covariância e média de 𝑋.

Definição 2.0.4 (Variável Aleatória Multidimensional). Uma v.a. multidimensional é um

vetor 𝑋 ∈ R𝑛em que cada componente é uma v.a. escalar. Assim, para 𝑋 = [𝑋

1𝑋2 · · · 𝑋𝑛]𝑇,

define-se a função de densidade de 𝑋 pela função de densidade conjunta de todas as suas componentes

(23)

Capítulo 2. Teoria de Estimação 23

Dessa forma, considerando uma aplicação da forma 𝑌 = 𝑔(𝑋), o valor médio de 𝑌 é dado por ¯ 𝑌 = E{𝑔(𝑋)} = ∫︁ +∞ −∞ ∫︁ +∞ −∞ · · · ∫︁ +∞ −∞ 𝑔(𝑋1, 𝑋2, · · · , 𝑋𝑛 )𝑝𝑋(𝑥1, 𝑥2, · · · , 𝑥𝑛)𝑑𝑥1𝑑𝑥2· · · 𝑑𝑥𝑛, e a covariância por 𝑃 = E{(𝑌 − ¯𝑌 )(𝑌 − ¯𝑌 )𝑇}.

Definição 2.0.5 (Distribuição Gaussiana). Para a v.a. 𝑋 ∈ R𝑛, define-se a distribuição

Gaussiana por 𝑝𝑋(𝑋) = 1 √︁ 2𝜋|𝑃 | 𝑒−12(𝑋− ¯𝑋) 𝑇𝑃−1(𝑋− ¯𝑋) ,

em que |𝑃 | = det(𝑃 ). Nesse caso, 𝑋 é dito ser normalmente distribuído e denota-se por

𝑋 ∼ 𝒩 ( ¯𝑋, 𝑃 ).

2.0.2

Processo Estocástico

Definição 2.0.6 (Processo Estocástico). Um processo estocástico {𝑋𝑡, 𝑡 ∈ 𝑇 } é uma coleção

de variáveis aleatórias indexadas por um conjunto 𝑇 . Se 𝑇 = [𝑎, 𝑏] ⊆ R, então, tem-se um processo a tempo contínuo. Se 𝑇 ⊆ Z, então, tem-se um processo a tempo discreto. Denota-se

𝑋𝑡 = 𝑋(𝑡, 𝜔) em que 𝜔 indica uma realização do experimento. Para 𝑡 fixo, 𝑋(·, 𝜔) é uma

variável aleatória. Para 𝜔 fixo, 𝑋(𝑡, ·) indica uma trajetória do processo estocástico.

Definição 2.0.7 (Função Média e Função Covariância). Para um processo estocástico 𝑋𝑡,

define-se a função média por

¯

𝑋𝑡= E{𝑋𝑡 = 𝑋(·, 𝜔)}. (2.2)

De forma similar, define-se a função covariância de 𝑋𝑡 por

𝑃𝑡= E{(𝑋𝑡− ¯𝑋𝑡)(𝑋𝑡− ¯𝑋𝑡)𝑇}. (2.3)

2.1

Estimadores

Nessa seção, são apresentadas duas técnicas básicas de estimação que são essenciais para o desenvolvimento do estimador proposto neste trabalho. Inicialmente, apresenta-se uma abordagem Bayesiana de estimação cujo critério de desempenho é o MSE. Em seguida, é discutida uma abordagem determinística ou Não-Bayesiana, em que o critério de desempenho é o Erro Quadrático do resíduo de observação.

(24)

Capítulo 2. Teoria de Estimação 24

Para tal, considere um processo estocástico {𝑥𝑘, 𝑘 ∈ K ⊆ Z} e um conjunto finito de

observações 𝑌𝑘 = {𝑦

0, 𝑦1, . . . , 𝑦𝑘}. O objetivo é construir a melhor estimativa de 𝑥𝑘, denotado

por ^𝑥𝑘, para um dado instante de tempo 𝑘 ∈ K tendo em vista um conjunto de observações.

Considere ainda que as obervações são descritas, omitindo o índice de tempo, por

𝑦 = 𝐻𝑥 + 𝜀, (2.4)

no qual 𝐻 ∈ R𝑚×𝑛 é a matriz de medição, 𝑥 ∈ R𝑛 é estado a ser estimado e 𝜀 ∈ R𝑚 é o ruído

de medição.

2.1.1

Estimador de Mínimo Erro Médio Quadrático

Assumindo uma distribuição de probabilidade para o ruído contido na equação (2.4) e uma medida 𝑦 disponível, pode-se construir o estimador ^𝑥 de forma a otimizar o critério

𝐽 = E{‖𝑥 − ^𝑥‖22|𝑦}.

Tomando 𝑑𝐽𝑑^𝑥 = 0 e resolvendo para ^𝑥, obtém-se o Estimador de Mínimo Erro Médio Quadrá-tico (ANDERSON; MOORE, 1979)

^

𝑥 = E{𝑥|𝑦} =

∫︁

𝑥𝑝𝑥|𝑦(𝑥|𝑦)𝑑𝑥. (2.5)

Contudo, note que para obter a solução é necessário conhecer a distribuição 𝑝𝑥|𝑦. Para o caso

Gaussiano, conforme descrito em (BAR-SHALOM et al.,2004), tem-se a média e covariância

a posteriori

^

𝑥 = ¯𝑥 + 𝑃𝑥𝑦𝑃𝑦𝑦−1(𝑦 − ¯𝑦),

𝑃𝑥|𝑦 = 𝑃𝑥𝑥− 𝑃𝑥𝑦𝑃𝑦𝑦−1𝑃𝑥𝑦,

em que ¯𝑥 = E{𝑥}, ¯𝑦 = E{𝑦}, 𝑃𝑥𝑦 = E{(𝑥 − ¯𝑥)(𝑦 − ¯𝑦)|}, 𝑃𝑦𝑦 = E{(𝑦 − ¯𝑦)(𝑦 − ¯𝑦)|} e

𝑃𝑥𝑥 = E{(𝑥 − ¯𝑥)(𝑥 − ¯𝑥)|}.

2.1.2

Estimador de Mínimos Quadrados

Caso não se tenha à disposição uma distribuição de probabilidade para a equação de saída (2.4), pode-se adotar uma visão determinística para o problema e definir um custo em relação ao erro quadrático do estimador. Dado o valor de ^𝑥, a saída aproximada é

^

𝑦 = 𝐻 ^𝑥. (2.6)

Assim, definindo o resíduo de observação 𝑒𝑦

Δ

= 𝑦 − ^𝑦, de forma a refletir a discrepância entre a

(25)

Capítulo 2. Teoria de Estimação 25

ao resíduo de observação

𝐽𝑦 = 𝑒|𝑦𝑒𝑦 = (𝑦 − 𝐻 ^𝑥)|(𝑦 − 𝐻 ^𝑥).

Dessa forma, minimizando 𝐽𝑦 em relação a ^𝑥, assumindo que 𝐻 possui posto completo

de coluna, obtém-se

^

𝑥 = (𝐻|𝐻)−1𝐻|𝑦. (2.7)

Tal solução é conhecida como Estimador de Mínimos Quadrados (BRYSON, 1975). Pode ocorrer, no entanto, ser mais adequado atribuir pesos diferentes para cada componente do vetor de resíduo. Neste caso, define-se o custo quadrático ponderado

𝐽𝑊 = 𝑒|𝑦𝑊 𝑒𝑦 = (𝑦 − 𝐻 ^𝑥)|𝑊 (𝑦 − 𝐻 ^𝑥), (2.8)

com 𝑊 ⪰ 0. Assim, a solução se torna ^𝑥 = (𝐻|𝑊 𝐻)−1𝐻|𝑊 𝑦.

Partindo para uma extensão de forma a incluir uma estimativa a priori, define-se o custo de Mínimos Quadrados Regularizado, ou do Inglês Regularized Least Square (RLS) (KAILATH et al.,2000, p. 51), por

𝐽 (𝑥, 𝑦) = ‖𝑥 − 𝑥Δ 0‖2𝐺+ ‖𝑦 − 𝐻𝑥‖

2

𝑊, (2.9)

em que 𝑥0 ∈ R𝑛 é uma estimativa de 𝑥 conhecida a priori, 𝐺 ∈ R𝑛×𝑛 é uma matriz definida positiva e 𝑊 ∈ R𝑚×𝑚 semi-definida positiva. O estimador é obtido então pela otimização

^

𝑥 = arg min

𝑥 𝐽 (𝑥, 𝑦), (2.10)

conforme apresentado no lema a seguir.

Lema 2.1 (Solução RLS). A solução ^𝑥 para (2.10) é ^

𝑥 = 𝑥0+ (𝐺 + 𝐻|𝑊 𝐻)−1𝐻|𝑊 (𝑦 − 𝐻𝑥0). (2.11)

Demonstração. Expandindo (2.9), tem-se

𝐽 (𝑥, 𝑦) = 𝑥|(𝐺 + 𝐻|𝑊 𝐻)𝑥 − 2(𝑦|𝑊 𝐻 + 𝑥|0𝐺)𝑥 + 𝑦|𝑊 𝑦 + 𝑥|0𝐺𝑥0. (2.12)

Considere as variáveis auxiliares

𝐴 = 𝐺 + 𝐻|𝑊 𝐻, 𝑏 = 𝐻|𝑊 𝑦 + 𝐺𝑥0, 𝑐 = 𝑦|𝑊 𝑦 + 𝑥|0𝐺𝑥0. (2.13)

Como 𝐴 ≻ 0, note que

(26)

Capítulo 2. Teoria de Estimação 26

Portanto, o mínimo em 𝑥 é alcançado fazendo 𝑥* = 𝐴−1𝑏, o que resulta em

𝑥* = ^𝑥 = (𝐺 + 𝐻|𝑊 𝐻)−1(𝐻|𝑊 𝑦 + 𝐺𝑥0).

Reescrevendo a solução de forma alternativa, tem-se

(𝐺 + 𝐻|𝑊 𝐻)^𝑥 = 𝐻|𝑊 𝑦 + 𝐺𝑥0± 𝐻|𝑊 𝐻𝑥0 ⇒ (𝐺 + 𝐻|𝑊 𝐻)(^𝑥 − 𝑥

0) = 𝐻|𝑊 (𝑦 − 𝐻𝑥0) ⇒ ^𝑥 − 𝑥0 = (𝐺 + 𝐻|𝑊 𝐻)−1𝐻|𝑊 (𝑦 − 𝐻𝑥0)

⇒ ^𝑥 = 𝑥0+ (𝐺 + 𝐻|𝑊 𝐻)−1𝐻|𝑊 (𝑦 − 𝐻𝑥0).

Note que para 𝑥0 ≡ 0 e 𝐺 ≡ 1𝜖𝐼 com 𝜖 → ∞ recupera-se o Estimador de Mínimos

Quadrados Ponderado. E ainda, se 𝑊 ≡ 𝐼 então recupera-se o Estimador de Mínimos Qua-drados. Assim, o RLS pode ser interpretado como uma generalização de ambos. Contudo,

utilizando o funcional (2.9) se torna possível obter uma solução única para ^𝑥, mesmo quando 𝐻 não possuir posto completo de coluna. Caso 𝐻 seja de posto completo, esse estimador

apresenta comportamento numérico superior. Outra vantagem é que o termo ‖𝑥 − 𝑥0‖2𝐺

pos-sibilita o uso de informações a priori para a formulação do problema e 𝐺 indica a confiança nessa informação. Pode-se mostrar ainda que, para o caso de v.a. Gaussianas, a solução do problema RLS coincide com a do Estimador MAP (Máximo A Posteriori) (KAILATH et al.,

2000, pg. 51).

2.2

Filtragem Estocástica

2.2.1

Filtro de Kalman

Nessa seção, é apresentado Filtro de Kalman Tradicional. Para isso, considere o sis-tema estocástico descrito por

𝑥𝑘+1 = 𝐴𝑥𝑘+ 𝜎𝑤𝑘, 𝑥0 = ¯𝑥, (2.14)

𝑦𝑘 = 𝐻𝑥𝑘+ 𝜈𝜀𝑘, (2.15)

em que 𝐴 ∈ R𝑛×𝑛, 𝑥

𝑘 ∈ R𝑛, 𝐻 ∈ R𝑚×𝑛, 𝑦𝑘 ∈ R𝑚, 𝜎 ∈ R𝑛×𝑛, 𝜈 ∈ R𝑚×𝑛 e {𝑤𝑘}, {𝜀𝑘} são

processos Gaussianos multidimensionais, independentes e identicamente distribuídos (i.i.d.) (ver apêndice A.0.10), com média nula e satisfazem

(27)

Capítulo 2. Teoria de Estimação 27

As matrizes 𝑅 = 𝜈𝜈|, 𝑄 = 𝜎𝜎| indicam, respectivamente, a covariância do ruído de medição e a do modelo1.

O FK é, usualmente, implementado no formato de predição-atualização. De forma que, inicialmente, baseando-se na estimativa atual do estado, realiza-se uma etapa de predição. Em seguida, ao receber uma nova medição, realiza-se uma etapa de atualização. A Figura 1

ilustra o funcionamento do filtro.

Predição Atualização ^

𝑥+1|𝑘 𝑥^+1|+1

Figura 1 – Etapas do Filtro de Kalman.

Para simplificar a notação, é empregado ‘+1’ ao invés de ‘𝑘 + 1’ sempre que possível. Na etapa de predição, denota-se a estimativa de 𝑥𝑘+1 dado 𝑌𝑘 por ^𝑥+1|𝑘 em que 𝑌𝑘 = {𝑦0, 𝑦1, . . . , 𝑦𝑘} é o conjunto de medições até o instante atual. De forma similar, na etapa de

atualização, denota-se a estimativa de 𝑥𝑘+1 dado 𝑌𝑘+1 por ^𝑥+1|+1.

Adotando como critério de desempenho o MSE, tem-se o filtro ótimo dado por ^𝑥+1|𝑘 = E{𝑥𝑘+1 ⃒ ⃒ ⃒𝑌 𝑘} e ^𝑥 +1|+1 = E{𝑥𝑘+1 ⃒ ⃒ ⃒𝑌

+1}. E para avaliar a sua qualidade, calcula-se as covari-âncias 𝑃+1|𝑘 = E{(𝑥𝑘+1 − ^𝑥𝑘+1|𝑘)(𝑥𝑘+1 − ^𝑥𝑘+1|𝑘)| ⃒ ⃒ ⃒𝑌 𝑘} e 𝑃 𝑘+1 = E{(𝑥𝑘+1 − ^𝑥+1|+1)(𝑥𝑘+1 − ^ 𝑥+1|+1)| ⃒ ⃒ ⃒𝑌

𝑘+1}. Assim, uma vez que os ruídos presentes no sistema são processos

Gaussia-nos, obtém-se as equações de filtragem conforme (SÄRKKÄ, 2013, p. 56)

^ 𝑥+1|𝑘 = 𝐴^𝑥𝑘|𝑘, (2.16) 𝑃+1|𝑘 = 𝐴𝑃𝑘𝐴|+ 𝑄, (2.17) 𝐾+1= 𝑃+1|𝑘𝐻|[𝑅 + 𝐻𝑃+1|𝑘𝐻|]−1, (2.18) ^ 𝑥+1|+1= ^𝑥+1|𝑘 + 𝐾+1(𝑦+1− 𝐻 ^𝑥+1|𝑘), (2.19) 𝑃+1= [𝐼 − 𝐾+1𝐻]𝑃+1|𝑘. (2.20)

Note que substituindo (2.18) em (2.20) resulta em

𝑃+1 = 𝑃+1|𝑘 − 𝑃+1|𝑘𝐻|[𝑅 + 𝐻𝑃+1|𝑘𝐻|]−1𝑃+1|𝑘. (2.21) E substituindo (2.21) em (2.17), com 𝑆𝑘 ≡ 𝑃𝑘|𝑘−1, obtém-se a Equação a Diferenças de Riccati

associada ao problema de Filtragem Ótima

𝑆𝑘+1 = 𝐴𝑆𝑘𝐴|− 𝐴𝑆𝑘𝐻|(𝑅 + 𝐻𝑆𝑘𝐻|)−1𝐻𝑆𝑘𝐴|+ 𝑄. (2.22)

(28)

Capítulo 2. Teoria de Estimação 28

A equação (2.22) é essencial para a análise de estabilidade do Filtro de Kalman (KARVONEN,

2014).

É possível, ainda, escrever de forma alternativa o ganho (2.18), conforme (KAILATH

et al., 2000, pg. 328), por

𝐾+1 = 𝑃+1𝐻|𝑅−1 (2.23)

Assim, de forma resumida, o FK pode ser implementado para um horizonte de 𝑁 passos pelo pseudo-código 2.1.

Pseudocódigo 2.1 Filtro de Kalman Tradicional Require: ^𝑥0|0, 𝑃0|0 1: for 𝑘 = 0 até 𝑁 do 2: 𝑥^+1|𝑘 ← 𝐴^𝑥𝑘|𝑘 3: 𝑃+1|𝑘 ← 𝐴𝑃𝑘𝐴|+ 𝑄 4: 𝑃+1 ← 𝑃+1|𝑘 − 𝑃+1|𝑘𝐻|(𝑅 + 𝐻𝑃+1|𝑘𝐻|)−1𝐻𝑃+1|𝑘 5: 𝐾+1 ← 𝑃+1𝐻|𝑅−1 6: 𝑥^+1|+1 ← ^𝑥+1|𝑘 + 𝐾+1(𝑦+1− 𝐻 ^𝑥+1|𝑘) 7: end for

EmBryson(1975, p. 341), é demonstrado que existe uma forte ligação entre o Filtro de Kalman e o Problema de Mínimos Quadrados Regularizado. De fato, a etapa de atualização do FK pode ser derivada por meio da minimização do funcional (2.9) com uma escolha particular de 𝐺, 𝑊 e 𝑥0, conforme indicado no próximo lema.

Lema 2.2 (FK via RLS). Assumindo que a estimativa a priori ^𝑥+1|𝑘 e sua matriz de

cova-riância 𝑃+1|𝑘 estejam à disposição, a etapa de atualização do FK é equivalente à solução de (2.9) com as associações 𝑥0 ← ^𝑥+1|𝑘, 𝐺 ← 𝑃+1|𝑘−1 , 𝑊 ← 𝑅 −1. Demonstração. De (2.9), tem-se ^ 𝑥 = arg min 𝑥 ‖𝑥 − ^𝑥+1|𝑘‖ 2 𝑃+1|𝑘−1 + ‖𝑦+1− 𝐻𝑥‖ 2 𝑅−1,

dessa forma, a estimativa a posteriori é dada por

^

𝑥 = ^𝑥+1|𝑘 + [𝑃+1|𝑘−1 + 𝐻|𝑅 −1

𝐻]−1𝐻|𝑅−1(𝑦+1− 𝐻 ^𝑥+1|𝑘). (2.24) Fazendo 𝑃+1 = (𝑃+1|𝑘−1 + 𝐻|𝑅

−1𝐻)−1 e aplicando o Lema da Inversa (MEYER,2000, p. 124), obtém-se

𝑃+1 = 𝑃+1|𝑘 − 𝑃+1|𝑘𝐻|(𝑅 + 𝐻𝑃+1|𝑘𝐻|)−1𝐻𝑃+1|𝑘. (2.25) Portanto, o resultado (2.24) coincide com (2.19) (considerando o ganho na forma (2.23)) e (2.25) coincide com (2.20) (considerando o ganho na forma (2.18)).

(29)

Capítulo 2. Teoria de Estimação 29

2.2.2

Filtro de Kalman Estendido

Considere agora, um sistema estocástico, possivelmente não-linear, dado por

𝑥𝑘+1 = 𝑓𝑘(𝑥𝑘) + 𝜎𝑤𝑘, (2.26)

𝑦𝑘 = ℎ𝑘(𝑥𝑘) + 𝜈𝜀𝑘, (2.27)

no qual 𝑓𝑘 : R𝑛 → R𝑛 e ℎ𝑘 : R𝑛 → R𝑚 são funções diferenciáveis, 𝜎 ∈ R𝑛×𝑛, 𝜈 ∈ R𝑚×𝑛 e

{𝑤𝑘}, {𝜀𝑘} são processos Gaussianos multidimensionais, i.i.d., com média nula semelhantes

aos presentes em (2.14)-(2.15). O problema de filtragem não-linear, da mesma forma que no caso linear, consiste em obter a melhor estimativa do estado 𝑥𝑘, atendendo a um critério de

desempenho por meio de um conjunto de medidas 𝑌𝑘. No entanto, conforme discutido em Ristic et al. (2003), este problema geralmente não possui solução analítica.

Contudo, uma forma de tratar esse problema é buscar por aproximações lineares para o modelo dinâmico. Desse modo, assumindo a disponibilidade das estimativas ^𝑥𝑘|𝑘 e

^

𝑥𝑘|𝑘−1, aplica-se a expansão em série de Taylor em (2.26) e (2.27) ao redor de ^𝑥𝑘|𝑘 e ^𝑥𝑘|𝑘−1,

respectivamente, conforme apresentado em (ANDERSON; MOORE, 1979, p. 195), o que resulta em 𝑥𝑘+1 = 𝐴𝑘𝑥𝑘+ 𝜃𝑘+ 𝜎𝑤𝑘+ 𝛿𝑓𝑘(𝑒𝑘), (2.28) 𝑦𝑘 = 𝐻𝑘𝑥𝑘+ Ω𝑘+ 𝜈𝜀𝑘+ 𝛿ℎ𝑘(𝑒𝑘), (2.29) em que 𝑒𝑘= 𝑥𝑘− ^𝑥𝑘|𝑘, 𝑒𝑘 = 𝑥𝑘− ^𝑥𝑘|𝑘−1 e com 𝜃𝑘 = 𝑓𝑘(^𝑥𝑘|𝑘) − 𝐴𝑘𝑥^𝑘|𝑘, Ω𝑘 = ℎ𝑘(^𝑥𝑘|𝑘−1) − 𝐻𝑘𝑥^𝑘|𝑘−1, 𝐴𝑘 = [︃ 𝜕𝑓𝑘(𝑥𝑘) 𝜕𝑥𝑘 ]︃ 𝑥𝑘=^𝑥𝑘|𝑘 , 𝐻𝑘 = [︃ 𝜕ℎ𝑘(𝑥𝑘) 𝜕𝑥𝑘 ]︃ 𝑥𝑘=^𝑥𝑘|𝑘−1 .

de forma que para

𝑓𝑘(𝑥𝑘) = ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ 𝑓1,𝑘(𝑥𝑘) 𝑓2,𝑘(𝑥𝑘) .. . 𝑓𝑛,𝑘(𝑥𝑘) ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ , ℎ𝑘(𝑥𝑘) = ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ℎ1,𝑘(𝑥𝑘) ℎ2,𝑘(𝑥𝑘) .. . ℎ𝑚,𝑘(𝑥𝑘) ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ , tem-se [︃ 𝜕𝑓𝑘(𝑥𝑘) 𝜕𝑥𝑘 ]︃ 𝑥𝑘=^𝑥𝑘|𝑘 = ⎡ ⎢ ⎢ ⎢ ⎢ ⎣ 𝜕𝑓1,𝑘(𝑥𝑘) 𝜕𝑥1,𝑘 𝜕𝑓1,𝑘(𝑥𝑘) 𝜕𝑥2,𝑘 . . . 𝜕𝑓1,𝑘(𝑥𝑘) 𝜕𝑥𝑛,𝑘 .. . ... . .. ... 𝜕𝑓𝑛,𝑘(𝑥𝑘) 𝜕𝑥1,𝑘 𝜕𝑓𝑛,𝑘(𝑥𝑘) 𝜕𝑥2,𝑘 . . . 𝜕𝑓𝑛,𝑘(𝑥𝑘) 𝜕𝑥𝑛,𝑘 ⎤ ⎥ ⎥ ⎥ ⎥ ⎦ 𝑥𝑘=^𝑥𝑘|𝑘

(30)

Capítulo 2. Teoria de Estimação 30 [︃ 𝜕ℎ𝑘(𝑥𝑘) 𝜕𝑥𝑘 ]︃ 𝑥𝑘=^𝑥𝑘|𝑘−1 = ⎡ ⎢ ⎢ ⎢ ⎢ ⎣ 𝜕ℎ1,𝑘(𝑥𝑘) 𝜕𝑥1,𝑘 𝜕ℎ1,𝑘(𝑥𝑘) 𝜕𝑥2,𝑘 . . . 𝜕ℎ1,𝑘(𝑥𝑘) 𝜕𝑥𝑛,𝑘 .. . ... . .. ... 𝜕ℎ𝑚,𝑘(𝑥𝑘) 𝜕𝑥1,𝑘 𝜕ℎ𝑚,𝑘(𝑥𝑘) 𝜕𝑥2,𝑘 . . . 𝜕ℎ𝑚,𝑘(𝑥𝑘) 𝜕𝑥𝑛,𝑘 ⎤ ⎥ ⎥ ⎥ ⎥ ⎦ 𝑥𝑘=^𝑥𝑘|𝑘−1

Note que 𝛿𝑓𝑘(𝑒𝑘) e 𝛿ℎ𝑘(𝑒𝑘) representam os termos de ordem superiores não

conside-rados da série, como também possíveis imprecisões de modelagem

𝛿𝑓𝑘(𝑒𝑘) = ∞ ∑︁ 𝑛=2 1 𝑛! 𝜕𝑛𝑓𝑘(𝑥𝑘) 𝜕𝑥𝑛 𝑘 ⃒ ⃒ ⃒𝑥 𝑘=^𝑥𝑘|𝑘 (𝑒𝑘)𝑛, 𝛿ℎ𝑘(𝑒𝑘) = ∞ ∑︁ 𝑛=2 1 𝑛! 𝜕𝑛ℎ𝑘(𝑥𝑘) 𝜕𝑥𝑛 𝑘 ⃒ ⃒ ⃒𝑥 𝑘=^𝑥𝑘|𝑘−1 (𝑒𝑘)𝑛. (2.30)

Assumindo que E{𝑥𝑘− ^𝑥𝑘|𝑘 ⃒ ⃒ ⃒𝑌 𝑘 } = E{𝑥𝑘− ^𝑥𝑘|𝑘−1 ⃒ ⃒ ⃒𝑌 𝑘−1} ≡ 0 e desconsiderando 𝛿𝑓 𝑘(𝑒𝑘)

e 𝛿ℎ𝑘(𝑒𝑘) em (2.28)-(2.29), pode-se empregar FK usual resultando nas equação de filtragem

do Filtro de Kalman Estendido (FKE)

^ 𝑥+1|𝑘 = 𝑓𝑘(^𝑥𝑘|𝑘), (2.31) 𝑃+1|𝑘 = 𝐴𝑘𝑃𝑘𝐴|𝑘+ 𝑄, (2.32) 𝑃+1 = 𝑃+1|𝑘− 𝑃+1|𝑘𝐻+1| (𝑅 + 𝐻+1𝑃+1|𝑘𝐻+1| ) −1 𝐻+1𝑃+1|𝑘 (2.33) 𝐾+1 = 𝑃+1𝐻+1| 𝑅 −1 , (2.34) ^ 𝑥+1|𝑘+1 = ^𝑥+1|𝑘 + 𝐾+1 (︁ 𝑦+1− ℎ+1(^𝑥+1|𝑘) )︁ , (2.35)

De forma resumida, o FKE é implementado, para um horizonte de 𝑁 passos, pelo pseudo-código 2.2.

Pseudocódigo 2.2 Filtro de Kalman Estendido Require: ^𝑥0|0, 𝑃0|0 1: for 𝑘 = 0 até 𝑁 do 2: 𝑥^+1|𝑘 ← 𝑓𝑘(^𝑥𝑘|𝑘) 3: 𝐴𝑘𝜕𝑓𝜕𝑥𝑘(𝑥𝑘) 𝑘 ⃒ ⃒ ⃒𝑥 𝑘=^𝑥𝑘|𝑘 4: 𝐻+1 ← 𝜕ℎ+1𝜕𝑥(𝑥𝑘+1) +1 ⃒ ⃒ ⃒𝑥 +1=^𝑥+1|𝑘 5: 𝑃+1|𝑘 ← 𝐴𝑘𝑃𝑘𝐴|𝑘+ 𝑄 6: 𝑃+1 ← 𝑃+1|𝑘 − 𝑃+1|𝑘𝐻+1| (𝑅 + 𝐻+1𝑃+1|𝑘𝐻+1| )−1𝐻+1𝑃+1|𝑘 7: 𝐾+1 ← 𝑃+1𝐻+1| 𝑅 −1 8: 𝑥^+1|+1 ← ^𝑥+1|𝑘 + 𝐾+1 (︁ 𝑦+1− ℎ+1(^𝑥+1|𝑘) )︁ 9: end for

O FKE é, provavelmente, a implementação mais utilizada do FK (GIBBS, 2011). Porém, é importante ressaltar que tais aproximações são feitas em torno das estimativas ^𝑥𝑘|𝑘

e ^𝑥𝑘|𝑘−1, que por sua vez possuem, inerentemente, certo grau de imprecisão. Sabe-se, também,

(31)

Capítulo 2. Teoria de Estimação 31

maior do que o previsto pela matriz de covariância. Esse problema é, geralmente, causado pelos erros introduzidos na linearização (𝛿𝑓𝑘(𝑒𝑘) e 𝛿ℎ𝑘(𝑒𝑘)). Outra dificuldade é a possível

instabilidade numérica devido, em muitos casos, à perda de simetria da matriz de covariância

(32)

32

Parte II

Contribuições

(33)

33

3 Uma nova estratégia de Estimação

Neste capítulo são apresentados os principais resultados alcançados neste trabalho. Deriva-se uma nova estratégia de estimação robusta para aplicações em que não se possui um modelo preciso da dinâmica do sistema. Inicialmente, define-se o problema a ser tratado e discute-se um modelo estocástico para a representação das incertezas de modelagem. Em seguida, apresenta-se uma metodologia em que se conjectura que a própria Variação da Estimativa pode Aumentar a Incerteza. Ao final, desenvolve-se um algoritmo de filtragem, similar ao Filtro de Kalman, em que tal conceito é explorado tanto para modelos lineares quanto não-lineares.

3.1

Representação das Incertezas

O primeiro passo para obter um estimador robusto é definir o modelo para as incer-tezas presentes. No entanto, se o modelo adotado não for adequado, pode-se obter ao final um estimador com desempenho pobre. Aqui, desempenho refere-se a qualidade da estimativa gerada pelo estimador do ponto de vista de erro médio quadrático. Portanto, é importante adotar um modelo que reflita de forma consistente as incertezas envolvidas. Em muitas situ-ações práticas, o modelo de um canal de medida é da forma

𝑦 = ℎ(𝑥) + 𝜀, (3.1)

com ℎ(·) não-linear e 𝜀 ∼ 𝒩 (0, 𝐼) representando o ruído de medição. Tomando a expansão em Séries de Taylor de (3.1), obtém-se

𝑦 = ℎ(𝑥0) + 𝐻(𝑥 − 𝑥0) + 𝒪(‖𝑥 − 𝑥0‖2) + 𝜀,

no qual 𝐻 = 𝜕ℎ𝜕𝑥|𝑥=𝑥0 e 𝑥0 é o ponto de linearização adotado (podendo ser escolhido com base

em conhecimento a priori do sistema). Se a distância ‖𝑥 − 𝑥0‖2 for suficientemente pequena, os termos de ordem superior 𝒪(‖𝑥 − 𝑥0‖2) podem ser desprezados e se obtém um modelo linearizado satisfatório para o canal de medição.

Porém, caso não se conheça perfeitamente o valor de 𝐻 e seja empregada apenas uma aproximação dada por um valor nominal 𝐻0, de forma que 𝐻 = 𝐻0+ 𝛿𝐻, o estimador projetado somente com o valor nominal poderá apresentar considerável nível de deterioração no desempenho. E ainda, a incerteza de modelagem irá aumentar conforme 𝑥 se afastar de

(34)

Capítulo 3. Uma nova estratégia de Estimação 34 𝑥0 𝑥1 𝑥2 ℎ(𝑥) 𝑦 = ℎ(𝑥0) + 𝐻(𝑥 − 𝑥0)

Figura 2 – Aumento da incerteza de modelo conforme 𝑥 se afasta de 𝑥0. As elipses indicam a região de incerteza.

Assim, o grande desafio que se coloca é: qual a melhor maneira de considerar tais incertezas de modelagem?

Neste trabalho, motivado pelos modelos desenvolvidos na área de Controle Estocás-tico, denominado Modelo CVIU, adota-se uma representação alternativa para as incertezas de modelagem da forma

𝑦 = ℎ(𝑥0) + 𝐻(𝑥 − 𝑥0) + (𝜎𝑦 + ¯𝜎𝑦diag(|𝑥 − 𝑥0|))𝜀𝑦+ 𝜀, (3.2) no qual 𝜀𝑦 ∼ 𝒩 (0, 𝐼) é um ruído Gaussiano independente de 𝑥. Além do mais, 𝜎

𝑦, ¯𝜎𝑦 ∈ R𝑚×𝑛

são parâmetros do modelo e diag : R𝑛→ R𝑛×𝑛 é uma matriz diagonal da forma

diag(|𝑥|) = ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ |𝑥1| 0 . . . 0 0 |𝑥2| . . . 0 0 0 . .. ... 0 0 · · · |𝑥𝑛| ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ .

Daqui em diante, o modelo (3.2) é referenciado por SVIU (State Variation Increase

the Uncertainty). Para fins de ilustração, suponha um caso com dois estados, uma saída e 𝑥0 = ℎ(𝑥0) = 0. O modelo SVIU é então dado por

𝑦 =[︁𝐻11 𝐻12 ]︁ ⎡ ⎣ 𝑥1 𝑥2 ⎤ ⎦+ ⎛ ⎝ [︁ 𝜎(1) 𝑦 𝜎𝑦(2) ]︁ +[︁¯𝜎(1) 𝑦 𝜎¯𝑦(2) ]︁ ⎡ ⎣ |𝑥1| 0 0 |𝑥2| ⎤ ⎦ ⎞ ⎠ ⎡ ⎣ 𝜀𝑦1 𝜀𝑦2 ⎤ ⎦+ 𝜀 ⇒ 𝑦 = 𝐻11𝑥1+ 𝐻12𝑥2+ (𝜎𝑦(1)+ ¯𝜎 (1) 𝑦 |𝑥1|)𝜀 𝑦 1 + (𝜎 (2) 𝑦 + ¯𝜎 (2) 𝑦 |𝑥2|)𝜀 𝑦 2+ 𝜀. Fazendo 𝜎(𝑖)

𝑦 ≡ 0, verifica-se que o modelo SVIU é estatisticamente equivalente ao

modelo de ruído dependente do estado, conforme apresentado em Silva et al. (2017). Isso se deve à simetria da distribuição Gaussiana e, portanto, pode-se estabelecer a relação

¯

(35)

Capítulo 3. Uma nova estratégia de Estimação 35

Conforme será explorado na próxima seção, devido à presença da função módulo o modelo SVIU apresenta características interessantes do ponto de vista matemático quando aplicado a problemas de otimização.

3.2

Variação da Estimativa Como Fonte de Incerteza

Muitos problemas de estimação podem ser resolvidos por meio do Mínimos Quadrados Regularizados. No entanto, sabe-se que a solução (2.10) apresenta significativa deterioração caso existam incertezas de modelagem (paramétricas ou não-paramétricas). Em Sayed et

al. (2002) uma versão robusta de (2.11) foi proposta, baseando-se em um novo critério de desempenho para considerar incertezas limitadas, chamada de BDU Design (Bounded Data

Uncertainty Design), e a solução é obtida via otimização minimax.

Neste trabalho, uma forma alternativa é proposta por meio de uma variação do cri-tério (2.9) de forma a considerar as incertezas de modelagem partindo de uma abordagem estocástica. Para tal, note que o custo (2.9) equivale a

𝐽 = ‖𝑥 − 𝑥0‖2𝐺+ ‖𝜀‖2𝑊, (3.4)

em que 𝜀 representa o “ruído da natureza” presente na medição. Portanto, de (3.2), conclui-se

𝐽 = ‖𝑥 − 𝑥0‖2𝐺+ ‖𝑦 − ℎ(𝑥0) − 𝐻(𝑥 − 𝑥0) + (𝜎𝑦 + ¯𝜎𝑦diag(|𝑥 − 𝑥0|))𝜀𝑦‖2𝑊, (3.5)

Dessa forma, custo (2.9) pode ser reescrito como

𝐽 (𝑣, 𝑧)= EΔ {︁‖𝑣‖2

𝐺+ ‖𝑧 − 𝐻𝑣 + (𝜎𝑣+ ¯𝜎𝑣diag(|𝑣|))𝜀𝑦‖2𝑊 }︁

, (3.6)

no qual 𝑣 = 𝑥 − 𝑥0 é a Variação da Estimativa, 𝑧 = 𝑦 − ℎ(𝑥0) é o resíduo do estimador e

𝜎𝑣, ¯𝜎𝑣 ∈ R𝑚×𝑛 são os parâmetros de ajuste do modelo. Lembrando que 𝑥0 representa uma estimativa conhecida a priori. Dessa forma, a solução passa a ser dada por ^𝑥 = 𝑥0 + 𝑣* em que

𝑣* = arg min

𝑣 𝐽 (𝑣, 𝑧). (3.7)

Note que agora o problema RLS é formulado explicitamente em termos da variação entre a estimativa a priori e a posteriori. E ainda, o termo (𝜎𝑣 + ¯𝜎𝑣diag(|𝑣|))𝜀𝑦 representa

as incertezas de modelagem. Em particular, as incertezas introduzidas por uma escolha ina-dequada de 𝑥0 e 𝐻 são representadas pela parte independente 𝜎𝑣𝜀𝑦. E o termo dependente

do valor absoluto da variação da estimativa ¯𝜎𝑣diag(|𝑣|)𝜀𝑦 busca capturar o incremento de

incerteza de modelagem, conforme ilustrado na Figura2. Dessa forma, o termo extra de ruído descreve as incertezas de modelagem através de um ponto de vista probabilístico em que sua

(36)

Capítulo 3. Uma nova estratégia de Estimação 36

variância ou espalhamento aumenta com a “distância” |𝑣𝑖| = |𝑥𝑖−𝑥𝑖,0|, 𝑖 = 1, . . . , 𝑛. Para esta

nova formulação, é cunhado o termo EVIU (Estimation Variation Increase the Uncertainty), em paralelo ao acrônimo CVIU (Control and State Variation Increase the Uncertainty) para o Problema de Controle Ótimo apresentado em do Val e Souto (2017).

Com o novo critério de desempenho (3.6) definido, o problema de estimação se torna computar 𝑣* = arg min𝑣𝐽 (𝑣, 𝑧), e a estimativa final é dada por ^𝑥 = 𝑥0 + 𝑣*. Porém, pelo fato de a função módulo ser não-diferenciável na origem, este problema precisa ser tratado através de ferramentas de análise não-suave (ROCKAFELLAR,1970;CLARKE et al.,2008), conforme apresentado na próxima seção.

3.2.1

Solução

Antes de determinar a solução, considere o seguinte lema auxiliar desenvolvido.

Lema 3.1 (Não-singularidade). Para Φ = diag([11· · · 1𝑛]) uma matriz diagonal com 1𝑖 = 0

ou = +1, 𝑖 = 1, . . . , 𝑛, se 𝑀 ≻ 0, então [𝐼 − Φ + Φ𝑀 ] é não-singular.

Demonstração. Para verificar se a matriz [𝐼 − Φ + Φ𝑀 ] é não-singular, deve-se garantir que

|𝐼 − Φ + Φ𝑀 | ̸= 0 em que | · | indica o operador determinante matricial. Para Φ ≡ 0 ou Φ ≡ 𝐼 o resultado é trivial. Para os demais casos, note que o determinante de qualquer matriz quadrada 𝐴 = [𝑎𝑖𝑗] pode ser obtido pela expansão em cofatores dada por

|𝐴| =

𝑛 ∑︁

𝑗=1

(−1)𝑖+𝑗𝑎𝑖𝑗|𝐴|𝑖𝑗,

com 𝑖 = 1, . . . , 𝑛 fixo e no qual |𝐴|𝑖𝑗 indica o determinante da submatriz obtida removendo-se

a 𝑖-ésima linha e 𝑗-ésima coluna de 𝐴. Uma vez que a matriz Φ é da forma

Φ = ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ 11 0 . . . 0 0 12 . . . 0 .. . ... . .. ... 0 0 . . . 1𝑛 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ , com 1𝑖 = 0 ou 1𝑖 = +1, a expressão [𝐼 − Φ + Φ𝑀 ] resulta em 𝐼 − Φ + Φ𝑀 = ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ 1 − 11 0 . . . 0 0 1 − 12 . . . 0 .. . ... . .. ... 0 0 . . . 1 − 1𝑛 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ + ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ 11𝑀1 12𝑀2 .. . 1𝑛𝑀𝑛 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ,

(37)

Capítulo 3. Uma nova estratégia de Estimação 37

em que 𝑀𝑖 indica a 𝑖-ésima linha de 𝑀 . Desse modo, definindo o conjunto de índices ℐ0 := {1𝑖 = 0, 𝑖 = 1, . . . , 𝑛}, verifica-se que para qualquer escolha 𝑖 ∈ ℐ0 resulta em

|𝐼 − Φ + Φ𝑀 | = (−1)(2𝑖)(1)|𝐼 − Φ + Φ𝑀 |

𝑖𝑖= |𝐼 − Φ + Φ𝑀 |𝑖𝑖, (3.8)

em que |𝐼 − Φ + Φ𝑀 |𝑖𝑖 indica o determinante da submatriz obtida removendo-se a 𝑖-ésima

linha e coluna de 𝐼 − Φ + Φ𝑀 . Além do mais, uma vez que está sendo removido a 𝑖-ésima linha e coluna, conclui-se que (3.8) coincide com um menor principal1 de tamanho 𝑘 de 𝑀 ,

no qual 𝑘 = |ℐ0| (cardinalidade de ℐ0). Assim, pelo fato de 𝑀 ≻ 0, sabe-se que todos os menores principais de 𝑀 são estritamente positivos (HORN; JOHNSON, 2013, p. 430) e, portanto, tem-se

|𝐼 − Φ + Φ𝑀 | ̸= 0, o que finaliza o resultado.

Para ilustrar a aplicação do Lema 3.1, considere um caso de dimensão 3 com Φ = diag([1 1 0]), para esse caso, tem-se

𝐼 − Φ + Φ𝑀 = ⎡ ⎢ ⎢ ⎢ ⎣ 1 − 1 0 0 0 1 − 1 0 0 0 1 − 0 ⎤ ⎥ ⎥ ⎥ ⎦ + ⎡ ⎢ ⎢ ⎢ ⎣ 1𝑀1 1𝑀2 0𝑀3 ⎤ ⎥ ⎥ ⎥ ⎦ = ⎡ ⎢ ⎢ ⎢ ⎣ 𝑀11 𝑀12 𝑀13 𝑀21 𝑀22 𝑀23 0 0 1 ⎤ ⎥ ⎥ ⎥ ⎦ ,

Dessa forma, escolhendo convenientemente 𝑖 = 3, o determinante de [𝐼 − Φ + Φ𝑀 ] resulta em |𝐼 − Φ + Φ𝑀 | = ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ 𝑀11 𝑀12 𝑀13 𝑀21 𝑀22 𝑀23 0 0 1 ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ = (−1)3+3(1) ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ 𝑀11 𝑀12 𝑀21 𝑀22 ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ > 0.

De forma similar, para Φ = diag([0 1 0]), tem-se

|𝐼 − Φ + Φ𝑀 | = ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ 1 0 0 𝑀21 𝑀22 𝑀23 0 0 1 ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ = (−1)3+3(1) ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ 1 0 𝑀21 𝑀22 ⃒ ⃒ ⃒ ⃒ ⃒ ⃒ = 𝑀22 > 0.

Agora, considere as relações envolvendo o traço de uma matriz quadrada 𝐴 e um vetor

𝑢 de dimensões compatíveis

𝑢|𝐴𝑢 = tr(𝐴𝑢𝑢|), (3.9) tr(︁𝐴 diag(|𝑢|)2)︁= 𝑢|Diag(𝐴)𝑢. (3.10)

1 Os menores principais de uma matriz são todos os determinantes das submatrizes que contém parte ou

(38)

Capítulo 3. Uma nova estratégia de Estimação 38

Juntamente, considere os seguintes operadores Λ, Δ, Diag : R𝑛×𝑛 → R𝑛×𝑛, tal que para

𝑊 ∈ R𝑛×𝑛, tem-se

Λ(𝑊 ) = Diag(¯𝜎|𝑣𝑊 ¯𝜎𝑣) + 𝐻|𝑊 𝐻, (3.11)

Δ(𝑊 ) = Diag(𝜎|𝑣𝑊 ¯𝜎𝑣+ ¯𝜎|𝑣𝑊 𝜎𝑣). (3.12)

Antes de obter a solução ótima, deve-se avaliar a geometria do problema. O lema a seguir estabelece a convexidade do problema.

Lema 3.2 (Convexidade). A função custo (3.6) é convexa em relação a 𝑣.

Demonstração. Expandindo (3.6) e aplicando as relações (3.9),(3.10), obtém-se

𝐽 (𝑣, 𝑧) = 𝑣|(𝐺 + Λ(𝑊 ))𝑣 + 𝑧|𝑊 𝑧 + tr(𝜎|𝑣𝑊 𝜎𝑣) − 2𝑧|𝑊 𝐻𝑣+

tr[(𝜎|𝑣𝑊 ¯𝜎𝑣+ ¯𝜎|𝑣𝑊 𝜎𝑣) diag(|𝑣|)]. (3.13)

Partindo da definição de convexidade (BOYD; VANDENBERGHE, 2010), se 𝐽 (𝑣, 𝑧) é con-vexo em 𝑣, então deve satisfazer, para qualquer 𝑥, 𝑦 ∈ R𝑛, a desigualdade

𝐽 (𝛼𝑥 + (1 − 𝛼)𝑦, 𝑧) ≤ 𝛼𝐽 (𝑥, 𝑧) + (1 − 𝛼)𝐽 (𝑦, 𝑧), 𝛼 ∈ [0, 1].

De (3.13), tem-se

𝐽 (𝛼𝑥 + (1 − 𝛼)𝑦, 𝑧) = (𝛼𝑥 + (1 − 𝛼)𝑦)|(𝐺 + Λ(𝑊 ))(𝛼𝑥 + (1 − 𝛼)𝑦) + 𝑧|𝑊 𝑧 + tr(𝜎|𝑣𝑊 𝜎𝑣)

− 2𝑧|𝑊 𝐻(𝛼𝑥 + (1 − 𝛼)𝑦) + tr [(𝜎|

𝑣𝑊 ¯𝜎𝑣+ ¯𝜎𝑣|𝑊 𝜎𝑣) diag(|𝛼𝑥 + (1 − 𝛼)𝑦|)] .

Pela desigualdade triangular, sabe-se que

|𝛼𝑥 + (1 − 𝛼)𝑦| ≤ 𝛼|𝑥| + (1 − 𝛼)|𝑦|, Portanto, obtém-se

𝐽 (𝛼𝑥+(1−𝛼)𝑦, 𝑧) ≤ 𝛼𝑥(𝐺+Λ(𝑊 ))𝛼𝑥+(1−𝛼)𝑦|(𝐺+Λ(𝑊 ))(1−𝛼)𝑦+𝑧|𝑊 𝑧 +tr(𝜎|𝑣𝑊 𝜎𝑣)−

− 2𝑧|𝑊 𝐻(𝛼𝑥 + (1 − 𝛼)𝑦) + tr [(𝜎|

𝑣𝑊 ¯𝜎𝑣 + ¯𝜎𝑣|𝑊 𝜎𝑣) diag(𝛼|𝑥| + (1 − 𝛼)|𝑦|)] .

Como a função traço é linear, chega-se em

𝐽 (𝛼𝑥 + (1 − 𝛼)𝑦, 𝑧) ≤

𝛼 (𝑥(𝐺 + Λ(𝑊 ))𝑥 + 𝑧|𝑊 𝑧 + tr(𝜎|𝑣𝑊 𝜎𝑣) − 2𝑧|𝑊 𝐻𝑥 + tr [(𝜎𝑣|𝑊 ¯𝜎𝑣+ ¯𝜎𝑣|𝑊 𝜎𝑣) diag(|𝑥|)]) +

+(1−𝛼) (𝑦|(𝐺 + Λ(𝑊 ))𝑦 + 𝑧|𝑊 𝑧 + tr(𝜎𝑣|𝑊 𝜎𝑣) − 2𝑧|𝑊 𝐻𝑦 + tr [(𝜎𝑣|𝑊 ¯𝜎𝑣+ ¯𝜎𝑣|𝑊 𝜎𝑣) diag(|𝑦|)])

⇒ 𝐽(𝛼𝑥 + (1 − 𝛼)𝑦, 𝑧) ≤ 𝛼𝐽(𝑥, 𝑧) + (1 − 𝛼)𝐽(𝑦, 𝑧). Logo, a inclusão do ruído dependente do módulo da variação da estimativa preserva a con-vexidade do problema.

Referências

Documentos relacionados

(W +H) φ with the F redholm index of the Wiener-Hopf minus Hankel operator (W −H) φ based on the winding number of a pie ewise almost periodi fun tion ( onstru ted from the. initial

Distribuições das deformações ao longo da sobreposição de uma junta com t = 5 mm e L = 12.5 mm, obtidas por modelos de EF com análises elasto-plásticas para a carga de

Além disso, é também de referir que ao longo do estágio, foram-me regularmente colocadas questões e pequenos trabalhos de pesquisa, relativos a vários produtos (quer

6 Num regime monárquico e de desigualdade social, sem partidos políticos, uma carta outor- gada pelo rei nada tinha realmente com o povo, considerado como o conjunto de

2 REVISÂO BIBLIOGRÁFICA 2.1 CONSUMO DE ENERGIA E EMISSÃO DE POLUENTES PARA MATERIAIS DE CONSTRUÇÃO Ao buscar determinar o consumo de energia e a emissão de gases do efeito estufa

In this work, TiO2 nanoparticles were dispersed and stabilized in water using a novel type of dispersant based on tailor-made amphiphilic block copolymers of

For additional support to design options the structural analysis of the Vila Fria bridge was carried out using a 3D structural numerical model using the finite element method by