• Nenhum resultado encontrado

Aplicação do Filtro de Kalman Estendido para estimação de populações em modelos epidemiológicos

N/A
N/A
Protected

Academic year: 2021

Share "Aplicação do Filtro de Kalman Estendido para estimação de populações em modelos epidemiológicos"

Copied!
71
0
0

Texto

(1)

UNIVERSIDADE ESTADUAL DE CAMPINAS

Faculdade de Engenharia Elétrica e de Computação

Fernanda Paula Rocha

Aplicação do Filtro de Kalman Estendido para

estimação de populações em modelos

epidemiológicos

Campinas

2019

(2)

UNIVERSIDADE ESTADUAL DE CAMPINAS

Faculdade de Engenharia Elétrica e de

Computação

Fernanda Paula Rocha

Aplicação do Filtro de Kalman Estendido para

estimação de populações em modelos epidemiológicos

Dissertação apresentada à Faculdade de Enge-nharia Elétrica e de Computação da Universi-dade Estadual de Campinas como parte dos re-quisitos exigidos para a obtenção do título de Mestra em Engenharia Elétrica, na área de auto-mação.

Orientador: Mateus Giesbrecht

Coorientador: João Frederico da Costa Azevedo Meyer

Este exemplar corresponde à versão

fi-nal da Dissertação defendida pela aluna

Fernanda Paula Rocha e orientada pelo

Prof. Dr. Mateus Giesbrecht.

Campinas

2019

(3)

Ficha catalográfica

Universidade Estadual de Campinas Biblioteca da Área de Engenharia e Arquitetura

Luciana Pietrosanto Milla - CRB 8/8129

Rocha, Fernanda Paula,

R582a RocAplicação do Filtro de Kalman Estendido para estimação de populações em modelos epidemiológicos / Fernanda Paula Rocha. – Campinas, SP : [s.n.], 2019.

RocOrientador: Mateus Giesbrecht.

RocCoorientador: João Frederico da Costa Azevedo Meyer.

RocDissertação (mestrado) – Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação.

Roc1. Modelos epidemiológicos SIR. 2. Dinâmica populacional. 3. Filtro de Kalman Estendido. 4. Mosquito - Controle. 5. Febre amarela. I. Giesbrecht, Mateus, 1984-. II. Meyer, João Frederico da Costa Azevedo, 1947-. III. Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação. IV. Título.

Informações para Biblioteca Digital

Título em outro idioma: Application of an Extended Kalman Filter for population estimation in an epidemiological model

Palavras-chave em inglês: SIR epidemiological model Dynamic population Extended Kalman Filters Mosquito - Control Yellow fever

Área de concentração: Automação Titulação: Mestra em Engenharia Elétrica Banca examinadora:

Mateus Giesbrecht [Orientador] Rodney Carlos Bassanezi Gilmar Barreto

Data de defesa: 15-07-2019

Programa de Pós-Graduação: Engenharia Elétrica

Identificação e informações acadêmicas do(a) aluno(a)

- ORCID do autor: https://orcid.org/0000-0003-3913-0147 - Currículo Lattes do autor: http://lattes.cnpq.br/1109424085323484

(4)

COMISSÃO JULGADORA - DISSERTAÇÃO DE MESTRADO

Candidato:Fernanda Paula Rocha RA: 179097 Data da Defesa:15 de julho de 2019

Título da Tese:"Aplicação do Filtro de Kalman Estendido para estimação de populações em modelos epidemiológicos”.

Prof. Dr. Mateus Giesbrecht (Presidente, FEEC/ UNICAMP) Prof. Dr. Rodney Carlos Bassanezi (IMECC/UNICAMP) Prof. Dr. Gilmar Barreto (FEEC/UNICAMP)

A ata de defesa, com as respectivas assinaturas dos membros da Comissão Julgadora, encontra-se no SIGA (Sistema de Fluxo de Dissertação/Tese) e na Secretaria de Pós- Graduação da Faculdade de Engenharia Elétrica e de Computação.

(5)

Dedico este trabalho à minha mãe, mulher guerreira e de fibra que se esforçou para me proporcionar a melhor educação.

(6)

Agradecimentos

Agradeço imensamente a minha mãe, por toda paciência, apoio integral e ajuda envolvida para elaboração deste trabalho. Aos meus queridos orientadores, que sempre abordaram as nossas reuniões de trabalho da melhor maneira possível, sem nunca ter permitido que o desalento se instalasse, mesmo quando as coisas não corriam bem.

Aos meus amigos Silvia, Vini, Nilmara, Lisbeth, Priscila, Tiese, Ana Claudia, David, Ricardo e Celso, que passaram por esse momento tão difícil da minha vida sendo companheiros e belos ouvintes. Agradeço as longas conversas, os telefonemas e preocupação, assim como o incentivo ao desenvolvimento deste trabalho. Agradecimentos especiais a minha namorada Laila, pelo apoio incondicional durante essa jornada.

Agradeço o apoio parcial da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES), este não sendo bolsa.

Agradeço pela concessão da bolsa de estudos pelo Conselho Nacional de Desenvol-vimento Científico e Tecnológico (CNPq) - Processo no132599/2017-1.

Agradeço a Universidade Estadual de Campinas (UNICAMP), ao programa de pós-graduação da Faculdade de Engenharia Elétrica e de Computação e ao Departamento de Componentes Semicondutores, Instrumentos e Fotônica (DSIF).

(7)

"Acredito que, no correr do próximo século, a ideia de que é dever da mulher ter filhos mudará, e abrirá caminho para o respeito e admiração a todas as mulheres, que carregam seus fardos

sem reclamar e sem um monte de palavras pomposas!" Anne Frank

(8)

Resumo

Pretende-se neste trabalho, estimar a população dos mosquitos transmissores da febre amarela no Brasil através de observadores de estado aplicados a um modelo epidemiológico estendido SIR. Nesse modelo são utilizados dados estatísticos informados por órgãos oficiais do governo e taxas de natalidade, mortalidade, infecção e recuperação e, a partir desses dados, consegue-se estimar a população de mosquitos. A dinâmica das classes de populações (humanos e mosquitos) é interligada, sendo representada por um modelo contínuo não linear, em que cada população é representada por uma equação diferencial ordinária, compondo assim um sistema cuja apresentação é realizada em espaço de estado, tendo como estados as classes de populações e como parâmetros as taxas de natalidade, mortalidade, infecção e recuperação. O modelo contínuo foi discretizado e em seguida, foi aplicado um observador de estado para sistemas não lineares, sendo ele o Filtro de Kalman Estendido, para estimar a quantidade de indivíduos em cada classe da população dos mosquitos. O comportamento dinâmico estimado para as classes de população de mosquitos foi conforme o esperado, comprovando que os observadores de estado podem ser usados para estimar esse tipo de variável. A estimativa permite que se criem políticas públicas efetivas de controle.

Palavras-chave: Modelos epidemiológicos SIR, Dinâmica populacional de mosqui-tos, Estimações de estado, Febre amarela, Filtro de Kalman Estendido.

(9)

Abstract

In this master’s thesis we estimate the number of the population of mosquitoes of yel-low fever in Brazil, based on state observers applied in the extended SIR epidemiological model. In this proposed model we use statistical data of birth, mortality, infection, and recovery rates, which are provided by official government agencies, in order to estimate the mosquitoes popula-tion. The dynamics of the classes of populations (humans and mosquitoes) are interconnected, represented by a non-linear continuous model what each population is described by an ordinary differential equation, composing a state-space system with states given by the subclasses of populations and the parameters given by the aforementioned rates. We discretize the continuous model and apply a state observer, called Extended Kalman Filter, for the non-linear system in order to estimate the number of individuals of each population of mosquitoes. The estimated dynamical behaviour corroborates that the state observers may be used to estimate these types of variables. The estimation allows for the planning of effective public control policies.

Keywords: SIR epidemiological model, Dynamic population of mosquitoes, Esti-mation of states, Yellow fever, Kalman Filter Extended.

(10)

Lista de ilustrações

Figura 1 – Dados da população de suscetíveis obtidos do Instituto Brasileiro de

Geogra-fia e Estatística do período de 1980 a 2017. . . 14

Figura 2 – Dados da população de infectados e recuperados obtidos do Ministério da Saúde do período de 1980 a 2017. . . 15

Figura 3 – Diagrama compartimental do modelo 𝑆𝐼𝑆. . . 16

Figura 4 – Diagrama compartimental do modelo 𝑆𝐸𝐼𝑅. . . 16

Figura 5 – Diagrama compartimental do modelo 𝑆𝐼𝑅. . . 41

Figura 6 – Diagrama compartimental do modelo que indica as interações entre as popu-lações de humanos e mosquitos. Fonte: autoria própria. . . 45

Figura 7 – Solução numérica da população de suscetíveis ao longo de 350 meses. . . . 57

Figura 8 – Solução numérica da população de infectados e recuperados ao longo de 350 meses. . . 58

Figura 9 – Solução numérica da população de mosquitos portadores e não portadores da doença ao longo de 350 meses. . . 58

Figura 10 – Solução numérica da população de suscetíveis ao longo de 350 meses. . . . 59

Figura 11 – Solução numérica da população de infectados e recuperados ao longo de 350 meses. . . 59

Figura 12 – Solução numérica da população de mosquitos portadores e não portadores do vírus ao longo de 350 meses. . . 60

Figura 13 – Estimativas das populações de humanos suscetíveis a doença no período de 1980 a 2017. . . 62

Figura 14 – Estimativas das populações de humanos que foram infectados pelo vírus no período de 1980 a 2017. . . 62

Figura 15 – Estimativas das populações de humanos que se recuperaram da doença no período de 1980 a 2017. . . 63

Figura 16 – Estimativas das populações de mosquitos não portadores do vírus no período de 1980 a 2017. . . 63

Figura 17 – Estimativas das populações de mosquitos portadores do vírus no período de 1980 a 2017. . . 64

(11)

Sumário

1 Introdução . . . . 13

1.1 Febre amarela no Brasil . . . 14

1.2 Modelos epidemiológicos . . . 15

1.3 Estudo de sistemas dinâmicos em engenharia . . . 17

1.4 Organização da dissertação . . . 18

2 Sistemas dinâmicos discretos . . . . 19

2.1 Modelos matemáticos para descrição de sistemas dinâmicos . . . 19

2.2 Conceitos básicos de espaço de estados . . . 20

2.3 Sistemas dinâmicos discretos . . . 22

2.4 Modelos matemáticos . . . 24

2.5 Conclusão . . . 25

3 Observadores de estados . . . . 26

3.1 Estimação por projeção ortogonal . . . 26

3.2 Filtro de Kalman . . . 29

3.3 Filtro de Kalman Estendido . . . 34

3.3.1 Linearização . . . 35

3.3.2 Linearização de sistemas em espaço de estados . . . 35

3.4 Estimadores de estado para sistemas não lineares . . . 36

3.5 Conclusão . . . 37

4 Modelos Epidemiológicos . . . . 39

4.1 Algumas doenças infecciosas e sua modelagem . . . 39

4.2 Modelo SIR . . . 40

4.3 Conclusão . . . 43

5 Metodologia . . . . 44

5.1 Descrição do Modelo Matemático . . . 45

5.2 Análise de estabilidade dos pontos estacionários do modelo contínuo . . . . 47

5.2.1 Equilíbrio trivial . . . 50

5.2.2 Equilíbrio livre do mosquito . . . 50

5.2.3 Equilíbrio do mosquito . . . 51

5.2.4 Equilíbrio livre da doença . . . 52

5.3 Modelo contínuo no espaço de estado . . . 53

5.4 Discretização do modelo contínuo . . . 54

5.5 Pontos estacionários do modelo discreto . . . 54

5.6 Modelo discreto no espaço de estados . . . 56

(12)

6 Resultados . . . . 57

6.1 Realização do ajuste de parâmetros . . . 57

6.2 Estimando as populações de mosquitos . . . 60

6.2.1 Resultado da simulação . . . 61

6.3 Conclusão . . . 64

7 Conclusão . . . . 66

(13)

13

Capítulo 1

Introdução

A Epidemiologia consiste no estudo dos fatores relacionados à saúde de uma deter-minada população, visando prevenir e controlar problemas de saúde. Desta forma, esta ciência tem sido fundamental ao longo dos anos, uma vez que permite a compreensão do comportamento de uma doença em relação a uma população específica.

Para estudar analítica e numericamente determinada população exposta a uma doença, é necessário compreender previamente o impacto desta última sobre os indivíduos acometidos. Partindo de informações empíricas, observações biológicas, acerca da ação de risco, é então possível decidir em quantos e quais compartimentos é ideal subdividir a população a fim de obter uma caracterização rica o suficiente para que o modelo possa fornecer bons resultados, que indiquem o comportamento futuro da doença, e simples o suficiente para que o problema seja matematicamente tratável, criando simulações úteis para a saúde pública (YANG,2001).

Este trabalho versa sobre a análise do comportamento da febre amarela entre os períodos de 1980 a 2017, com o monitoramento realizado pelo Instituto Brasileiro de Geografia e Estatística (IBGE) e pelo Ministério da Saúde (MS), conforme pode ser visto nas Figuras

1e2, respectivamente. Através de conhecimentos biológicos básicos da dinâmica da doença, desenvolve-se um modelo matemático que representa a sua dinâmica na população. Após sua elaboração, foram aplicados os observadores de estados, realizando as estimações das populações de mosquitos portadores e não portadores do vírus em questão.

Pensou-se em retratar este cenário usando modelagem matemática, considerando quais as ferramentas mais adequadas. Neste caso, optou-se por realizar as estimações das populações de mosquitos portadores e não portadores do vírus de um modelo matemático que explique a evolução da febre amarela no país, com a finalidade de analisar o comportamento da doença ao longo de um período determinado.

(14)

Capítulo 1. Introdução 14

1.1

Febre amarela no Brasil

Atualmente, o Brasil enfrenta um dos maiores surtos de febre amarela, após um período em que a doença parecia estar controlada. Apesar dos esforços do governo para vacinar as populações que estão em áreas consideradas de risco, o vírus aumentou sua área de circulação. Novas áreas foram surgindo a medida que novos casos foram detectados em locais que ainda não

1980 1984 1988 1992 1996 2000 2004 2008 2012 2016 0 1x10 8 2x10 8 N ú m e r o d e i n d i v í d u o s Ano Suscetíveis

Figura 1 – Dados da população de suscetíveis obtidos do Instituto Brasileiro de Geografia e Estatística do período de 1980 a 2017.

tinham sido afetados pela epidemia (BRASIL,2017). O vírus expandiu sua área de circulação no Brasil, mais especificamente em alguns estados no sul e sudeste do país, atingindo números alarmantes de casos no período de 2017, contribuindo para o aumento da epidemia, o que pode ser verificado na Figura2.

Em um estudo realizado por pesquisadores do Instituto Oswaldo Cruz (IOC/Fiocruz) e publicado por (ABREU et al.,2019), foi realizada a análise do genoma de vírus coletados entre os períodos de 2015 e 2018, constatando que os mosquitos silvestres Haemagogus janthinomys e Haemagogus leucocelaenus são os principais vetores que ocasionaram o recente surto de febre amarela que atingiu principalmente a região da mata atlântica, que não possuía registros da doença desde a década de 40. Em (FARIA et al.,2018), reforça-se a ideia que o vírus foi introduzido em Minas Gerais, com início na região Norte do Brasil, se espalhando rapidamente após os primeiros casos, percorrendo em média 4,5 km por dia.

(15)

Capítulo 1. Introdução 15 1980 1984 1988 1992 1996 2000 2004 2008 2012 2016 0 100 200 300 400 N ú m e r o d e I n d i v í d u o s Ano Infectados Recuperados

Figura 2 – Dados da população de infectados e recuperados obtidos do Ministério da Saúde do período de 1980 a 2017.

Dados coletados indicam que atualmente estamos no ciclo silvestre. Nesta fase a doença é adquirida por primatas que, portadores do vírus, permitem que mais mosquitos se tornem portadores. Uma suposição para o rápido avanço do vírus, considerando a locomoção natural de macacos e mosquitos na região, é também o tráfico de animais ou veículos transportando insetos infectados, acelerando a dispersão do vírus. Nesta situação, os macacos servem como alertas, por serem vítimas da doença podem indicar um possível foco da doença e e ajudar em seu controle. A falta deles leva a um desequilíbrio ambiental, já que os mosquitos transmissores que habitam o alto das árvores onde preferem picar macacos, com sua ausência, optam por voar mais baixo e procurar outra fonte de alimentação. E é a partir da picada em outros animais ou pessoas que o ciclo se renova e mais mosquitos podem contrair o vírus e continuar a aumentar o seu número significativamente.

1.2

Modelos epidemiológicos

O estudo da dinâmica de uma doença através de modelos matemáticos tem grande importância ao se observar sua proliferação e com isso ter uma melhor compreensão dos seus mecanismos de transmissão e assim conseguir planejar estratégias de controle mais efetivas, auxiliando na análise do comportamento de epidemias em humanos e animais (CLANCY,

(16)

Capítulo 1. Introdução 16

1999). Nesta jornada de compreensão do comportamento de doenças, existem alguns modelos matemáticos epidemiológicos na literatura que contribuem para o seu entendimento, como o modelo 𝑆𝐼𝑆, que divide a população em suscetíveis e infectados, considerando que os indivíduos que se recuperam da doença não obtêm imunidade. Esta análise pode ser melhor visualizada na Figura3, com o parâmetro 𝛽 denotando a taxa dos indivíduos suscetíveis que contraem a doença e tornam-se infectados e 𝜎 referindo-se ao indivíduo que se recupera da enfermidade e rapidamente torna-se suscetível. Do contrário, o modelo 𝑆𝐼𝑅, que serve de base na elaboração do modelo epidemiológico da febre amarela neste trabalho, considera que após a infecção o indivíduo adquire imunidade ao menos temporária. Mais informações deste quadro são apresentadas no Capítulo4. Este modelo também tem como característica as doenças que causam num indivíduo a capacidade de infectar outras pessoas imediatamente após a sua infecção.

Figura 3 – Diagrama compartimental do modelo 𝑆𝐼𝑆.

Algumas doenças têm o que se chama de fase latente ou exposta, que é quando o agente causador da doença permanece inativo durante algum tempo, durante o qual é dito que o indivíduo está infectado mas não infeccioso, sendo o modelo 𝑆𝐸𝐼𝑅 o mais recomendado em casos com estas características. Por exemplo, a catapora e até mesmo as doenças transmitidas por vetores, como a febre hemorrágica da dengue, têm uma longa duração de incubação em que o indivíduo ainda não pode transmitir o agente patogênico a outras pessoas. A Figura4mostra como os indivíduos se deslocam através de cada compartimento no modelo. Deste modo, a taxa de infecção 𝛽 representa a probabilidade de transmissão da doença entre um indivíduo suscetível e um indivíduo infeccioso. A taxa de incubação 𝛾 representa os indivíduos latentes se tornando infecciosos e a taxa de recuperação 𝛿.

Figura 4 – Diagrama compartimental do modelo 𝑆𝐸𝐼𝑅.

Estes e muito outros modelos que auxiliam na modelagem epidemiológica com base nas suas principais características envolvidas podem ser encontrados em (MARTCHEVA,2015) que realiza uma introdução para os métodos e ferramentas que são hoje amplamente usados na literatura de epidemiologia matemática. O livro começa tratando de conceitos básicos na modelagem epidemiológica e ao final tornando o assunto mais complexo e abrangente. Outra referência importante e amplamente usada no estudo de modelagem é (EDELSTEIN-KESHET,

(17)

Capítulo 1. Introdução 17

2015), que se concentra na área de biologia matemática, com um tratamento introdutório de modelos de equações diferenciais parciais nos capítulos finais. Por mais que se trate de modelagem biológica em sua maioria, a modelagem matemática de doenças tem fundamentos na modelagem de sistemas ecológicos, principalmente em situações em que se deseja estudar a dinâmica da interação entre duas ou mais espécies que se relacionam entre si, como por exemplo o vírus e o ser humano. Outra referência de igual importância é de (MURRAY,2007), neste apenas alguns dos conceitos básicos de modelagem são discutidos, como na ecologia e, em menor grau, na epidemiologia. Em (EARN et al.,2008), são apresentadas as principais ferramentas matemáticas que serão úteis na análise de modelos e alguns estudos de caso como exemplos.

Em (CAPASSO, 1993) pode ser encontrada diversas abordagens que fornecem um sistema

para organizar e analisar muitos modelos epidemiológicos. Um estudo sobre a estimação da população de mosquitos da febre amarela é realizado em (ROCHA; GIESBRECHT; MEYER,

2019). Por fim, em (CHOWELL et al.,2009) é apresentada como uma opção ao leitor o estudo da modelagem epidemiológica estocástica.

Deve-se ressaltar, entretanto, que as descrições matemáticas nos modelos epidemio-lógicos, bem como nos modelos biológicos em geral, não explicitam totalmente as características reais da doença, mas procuram aproximar características importantes na sua realização. Modelos matemáticos como um todo são desenvolvidos para ajudar a explicar um sistema, estudar os efei-tos de seus vários componentes e fazer previsões sobre o seu comportamento e, claro, relacionar esses resultados com a biologia real ou epidêmica.

1.3

Estudo de sistemas dinâmicos em engenharia

Nessa parte do capítulo, se faz necessária uma breve explanação sobre a contribuição da engenharia no estudo de sistemas dinâmicos, com estes sendo descritos através de modelos em espaço de estado. Algumas opções para realizar um estudo introdutório são (GEROMEL;

PALHARES,2004) e (AGUIRRE,2015). Como os estados normalmente não são mensuráveis,

foi desenvolvida uma série de algoritmos para realizar a observação de estado tanto para o caso linear, um exemplo é o Filtro de Kalman (FK), desenvolvido por (KALMAN,1960), quanto no caso não linear, como o Filtro de Kalman Estendido (FKE) (SMITH; SCHMIDT; MCGEE,

1962), o Filtro de Kalman Unscented (FKU) proposto por (JULIER; UHLMANN, 1997) e o Filtro de Partículas (FP) apresentado por (GORDON; SALMOND; SMITH,1993). Outros trabalhos foram desenvolvidos pelo grupo de pesquisa do Laboratório de Controle e Sistemas Inteligentes - LCSI, do qual esta pesquisadora faz parte, para a modelagem de sistemas dinâmicos em espaço de estado desde o início dos anos 2000, como (GIESBRECHT,2013), (BARRETO,

2002) e também para a observação de estados, como (BERCI,2008).

Os modelos epidemiológicos em geral podem ser vistos como modelos em espaço de estado e o uso de estimadores de estado neste tipo de modelo é de grande importância, com este

(18)

Capítulo 1. Introdução 18

podem obter informações sobre variáveis do modelo que não são diretamente mensuráveis. A construção de instrumentos com variáveis que possuem essa característica é objeto de estudo há muitos anos, com o objetivo principal de medir grandezas que não são mensuráveis diretamente.

Nesta pesquisa é desenvolvida a relação entre duas áreas de grande importância, com o objetivo principal sendo a análise e o controle da febre amarela. A biomatemática é responsável pelo estudo da doença e na construção do seu modelo e, na área de controle e automação, é desenvolvida a parte das estimações da população dos mosquitos transmissores da doença e dos não transmissores através do Filtro de Kalman Estendido (FKE). Essas estimações são realizadas considerando dados que foram obtidos por órgãos oficiais do governo e tendo como variáveis desconhecidas as populações que são estimadas ao longo do período.

1.4

Organização da dissertação

Este trabalho estar estruturado de forma que todos os conhecimentos abordados para sua conclusão sejam explicitados ao longo do mesmo. No Capítulo2 tem-se uma breve explicação sobre sistemas dinâmicos discretos e conceitos básicos de espaço de estados, que serão necessários para melhor entendimento nos capítulos que se seguem. Em especial, no Capítulo3, é elucidado o observador de estado que será usado para realizar as estimações das populações de mosquitos entre os períodos de 1980 a 2017, sendo este o Filtro de Kalman Estendido (FKE). No Capítulo4são explanados alguns modelos epidemiológicos e em particular o modelo que serve de base para a construção do modelo epidemiológico da febre amarela. No capítulo seguinte, são apresentadas as características da doença que foram consideradas para o desenvolvimento do modelo e sua estrutura.

O Capítulo6compreende todos os resultados e simulações realizadas, incluindo o modelo do Capítulo5em espaço de estados. Após este capítulo são realizados comentários e apresentadas as conclusões do trabalho.

(19)

19

Capítulo 2

Sistemas dinâmicos discretos

O principal objetivo deste capítulo é deixar o leitor suficientemente à vontade com a modelagem matemática e, com isso entender o que foi proposto para a construção inicial deste trabalho. Para que isso ocorra, na Seção2.1será introduzida a ideia de modelo matemático em aspectos gerais, bem como a introdução de conceitos básicos de espaço de estados com respeito a sistemas dinâmicos e sua representação em tempo contínuo na Seção2.2. Por fim, na Seção

2.3é realizada a descrição de sistemas dinâmicos discretos e sua representação em espaço de estados pois, ao longo do trabalho, a modelagem realizada será relacionada com esse tipo de situação. Seu escopo será ainda mais ilustrado por capítulos subsequentes.

2.1

Modelos matemáticos para descrição de sistemas

dinâmicos

Segundo (OGATA; YANG, 2002), define-se o modelo matemático de sistemas dinâmicos como sendo o conjunto de equações que representam a dinâmica de um sistema. O modelo matemático é o primeiro passo para a realização de sistemas dinâmicos e, para criar um modelo matemático para um sistema dinâmico, precisamos decidir qual é a variável que irá evoluir com o tempo e qual é a regra que especifica como esse sistema físico evolui com o tempo.

É preciso entender que um modelo matemático é, na melhor das hipóteses, um conjunto de fórmulas e/ou equações independentes, baseado em uma descrição quantitativa aproximada dos fenômenos reais e criado na esperança de que o comportamento previsto seja consistente com o comportamento real em que se baseia. Sua precisão está sujeita às suposições e exigências feitas pelo pesquisador. Neste caso, usa-se um modelo compartimental SIR, o qual será apresentado com mais detalhes no Capítulo4, com interpretações próximas às características gerais da febre amarela, a fim de obter uma melhor modelagem do problema.

Uma boa ferramenta de modelagem de sistema dinâmicos multivariáveis, ou seja, com mais de uma entrada e/ou mais de uma saída, é a abordagem em espaço de estados. Esse

(20)

Capítulo 2. Sistemas dinâmicos discretos 20

método é utilizado neste trabalho conforme exposto detalhadamente na Seção6.2.

Para (LEDDER,2013), o sucesso da modelagem surge da interação de duas ações: teoria e observação. Teoria sem observação nada mais é que uma fábula, e observação sem teoria nada mais é do que uma coleção de fatos desarticulados, sendo o progresso na ciência possível apenas combinando-os. A teoria é usada para explicar e unificar observações e prever resultados de experimentos futuros e as observações são usadas para motivar e verificar a teoria. A conexão entre as duas ações rege o comportamento da modelagem matemática. Ressaltando que o uso da palavra "observação" neste texto caracteriza tanto as observações do mundo natural quanto a observações dirigidas por experimentos.

Na realização da modelagem, alguns esforços devem ser necessários, como determi-nar valores de parâmetros e/ou interpretar resultados em contexto, mas todo ou a maior parte do esforço em problemas de aplicação é na obtenção de soluções matemáticas. Podemos usá-las para questões restritas que exijam respostas numéricas, mas também para questões gerais sobre comportamento geral (por exemplo, para quais faixas de valores de parâmetros uma população será extinta?).

Com o intuito de prever ou estimar o crescimento de uma dada população, é neces-sário um modelo dinâmico, tais modelos também podem ser úteis caso se pretenda estimar a densidade de mosquitos aedes aegypti em uma comunidade afetada pela dengue, como realizado

em (MASSAD et al.,2017). Esses modelos também podem ser usados para avaliar outras

di-nâmicas biológicas, por exemplo, o controle na gestão das pescas em que se pretende manter a pesca a um nível sustentável e maximizar a captura média durante longos períodos de tempo, como realizado em (SOUZA,2018). No entanto, este trabalho se preocupa com a modelagem de doenças infecciosas e sua disseminação em populações, mas em princípio a modelagem matemática pode ser aplicada a qualquer sistema, biológico ou não.

2.2

Conceitos básicos de espaço de estados

De acordo com (OGATA; YANG,2002), a tendência nos sistemas de engenharia é se tornarem mais complexos do que já são, devido principalmente ao fato de que tarefas mais complexas e precisas são cada vez necessárias. Sistemas complexos podem ter múltiplas entradas e múltiplas saídas que podem ser variantes ao longo do tempo. Devido à necessidade de atender requisitos cada vez mais rigorosos no comportamento dos sistemas de controle, ao aumento da complexidade dos sistemas e ao acesso a computadores digitais, a moderna teoria de controle, que é uma abordagem para análise e projeto de sistemas de controle complexos, foi desenvolvida a partir de meados do século passado. Esta nova abordagem é baseada no conceito de estado. O conceito de estado por si só não é novo, já que existe há algum tempo no campo da dinâmica clássica e em outros campos.

(21)

Capítulo 2. Sistemas dinâmicos discretos 21

Para analisar tal sistema, é essencial reduzir a complexidade nas expressões ma-temáticas e, quando necessário (e possível) recorrer a computadores para realizar os cálculos complexos daí inerentes. A abordagem de espaço de estados para análise de sistemas pode ser mais adequada sob este ponto de vista.

O espaço de estados de um sistema dinâmico é o conjunto de todos os estados possíveis do sistema. Cada coordenada é uma variável de estado e os valores de todas as variáveis de estado descrevem completamente o estado do sistema. Em outras palavras, cada ponto no espaço de estados corresponde a um estado diferente do sistema.

É indispensável que se definam alguns conceitos básicos de espaço de estados, como estado, variáveis de estado, vetor de estados e espaços de estados (OGATA; YANG, 2002), visto que os mesmos serão utilizados para auxiliar na resolução do problema em questão nesta pesquisa.

O estado de um sistema dinâmico é o menor conjunto de variáveis, que são chamadas variáveis de estado, tal que o conhecimento do modelo do sistema, destas variáveis em 𝑡 = 𝑡0

juntamente com a entrada para 𝑡 ≥ 𝑡0, estabeleça completamente o comportamento do sistema

para qualquer instante 𝑡 ≥ 𝑡0. Consequentemente, o estado de um sistema dinâmico causal no

instante 𝑡 é determinado pelo estado no instante 𝑡0 e a entrada para 𝑡 ≥ 𝑡0.

As variáveis de estado são o menor conjunto de variáveis que determina o estado do sistema dinâmico. Se pelo menos 𝑛 variáveis 𝑥1, 𝑥2, · · · , 𝑥𝑛 descrevem completamente o

comportamento de um sistema dinâmico (de modo que, uma vez dados a entrada para 𝑡 ≥ 𝑡0 e o

estado inicial em 𝑡 = 𝑡0, o estado futuro do sistema é determinado completamente), então essas

𝑛 variáveis são um conjunto de variáveis de estado.

Se 𝑛 variáveis de estado são necessárias para descrever completamente o comporta-mento de um dado sistema, então estas 𝑛 variáveis de estado podem ser consideradas como as 𝑛 componentes de um vetor 𝑥(𝑡), tal vetor é chamado de vetor de estados.

O espaço 𝑛-dimensional cujos os eixos e coordenadas são os eixos 𝑥1, 𝑥2, · · · , 𝑥𝑛é

chamado de um espaço de estados.

A representação do modelo contínuo no espaço de estados é da forma:

9𝑥(𝑡) = 𝐴𝑐𝑥(𝑡) + 𝐵𝑐𝑢(𝑡), (2.1)

𝑦(𝑡) = 𝐶𝑐𝑥(𝑡) (2.2)

com 𝑡 ∈ R+.

Sendo 𝐴𝑐∈ R𝑛×𝑛a matriz de transição de estado, 𝐵𝑐∈ R𝑛×𝑚a matriz de entrada,

9𝑥(𝑡) é a derivada da variável de estado no tempo, 𝑦(𝑡) ∈ R𝑝×1

é o vetor de saída, 𝑥(𝑡) ∈ R𝑛×1é o vetor de estado, 𝑢(𝑡) ∈ R𝑚×1 o vetor de entrada, e a matriz de saída 𝐶𝑐∈ R𝑝×𝑛.

(22)

Capítulo 2. Sistemas dinâmicos discretos 22

ou biológico com as variáveis de entrada, saída e estado compostas por equações diferenciais de primeira ordem. A representação do espaço de estados oferece uma maneira adequada e compacta de modelar e analisar sistemas com múltiplas entradas e saídas.

2.3

Sistemas dinâmicos discretos

Na tentativa de descrever matematicamente uma situação, deve-se optar entre mo-delos discretos ou contínuos, que lidam com o evento estudado em valores absolutos ou com a densidade de eventos respectivamente. Modelos contínuos recorrem a equações diferenciais enquanto modelos discretos fazem uso de equações de diferenças.

Equações diferenciais são às vezes mais passíveis de solução analítica do que as equações de diferenças. Por exemplo, a equação diferencial logística de fato tem uma solução explícita (ou seja, uma fórmula que fornece o valor da população em todos os momentos). Talvez por isso, antes da chegada dos computadores digitais, as equações diferenciais eram a principal escolha na construção de um modelo matemático (ALLMAN; RHODES,2004).

Ainda para (ALLMAN; RHODES, 2004), as equações de diferenças são mais apropriadas em situações nas quais existem passos de tempo discretos naturais, um exemplo seria modelar populações de insetos, que tendem a ter históricos de vida bastante rígidos, com estágios de desenvolvimento bem definidos e expectativa de vida. Também pode ocorrer que as informações sejam fornecidas apenas discretamente, dificultando o uso de soluções contínuas, tornando as equações de diferenças bem mais adequadas na modelagem. Agora que os computadores estão prontamente disponíveis, as equações de diferenças podem também serem estudadas através de experimentos numéricos.

Assim, sistemas dinâmicos representam a evolução de algumas quantidades ao longo do tempo, essa evolução pode ocorrer continuamente ou em etapas discretas. Aqui, nós introduzimos sistemas dinâmicos em que o estado do sistema evolui em etapas de tempo discreto, isto é, o modelo de tempo contínuo será modificado para um modelo de tempo discreto, como enunciado anteriormente. Deste modo, o sistema tem seu estado modificado durante os instantes de tempo {𝑡0, 𝑡1, 𝑡2, . . .}. No intervalo de tempo entre dois desses momentos, é suposto que o

estado e a entrada permaneçam constantes (hipótese do segurador de ordem zero) e o intervalo de tempo entre diferentes pares de instantes sucessivos 𝑡𝑛e 𝑡𝑛+1não tem que ser o mesmo.

Explora-se o uso desse sistema na modelagem de fenômenos biológicos como a dinâmica populacional e a epidemiologia, mostrando o efeito no comportamento dos modelos decorrente da variação das constantes associadas a cada equação. A ideia é que existem ações relativamente curtas e sincronizadas (por exemplo, estações de reprodução) que permitem ignorar o comportamento dentro do período de tempo para o propósito do modelo. Uma visão alternativa de modelos discretos é que eles são discretizações de modelos de tempo contínuo. Ou seja, nós

(23)

Capítulo 2. Sistemas dinâmicos discretos 23

não podemos realmente observar os organismos continuamente, então apenas monitoramos as quantidades de interesse em intervalos discretos. Um exemplo seria a localização de indivíduos (que se movem continuamente, mas só observamos em intervalos discretos). Esta é a noção básica da análise de séries temporais, que são abordagens estatísticas para descrever, prever e controlar o comportamento de um sistema que dependente do tempo.

Na verdade, como a maioria dos modelos mais elaborados de equações diferenciais não são explicitamente solucionáveis, aqueles que os utilizam frequentemente recorrem atu-almente ao uso de computadores digitais para efetuar simulações, o que é realizado ao longo deste trabalho. Como os computadores digitais funcionam discretamente, os modelos devem primeiro ser traduzidos em uma forma discreta, isso pode significar usar uma abordagem como um método de Euler para aproximar as equações diferenciais, por exemplo, simulando a equação diferencial por meio de uma equação a diferenças. No final, ambas as equações a diferenças e diferenciais são ferramentas valiosas para investigar sistemas biológicos.

Uma vez elaborado o modelo matemático, é necessário aplicar o observador de estado, a fim de realizar as estimações que são estudo deste trabalho. Neste caso é realizada a discretização do sistema que está em tempo contínuo para um sistema em tempo discreto. Portanto, resolve-se a equação diferencial de forma aproximada, pelo método numérico que, neste caso, é realizada pela aproximação explícita de Euler

9𝑥 ≈ 𝑥(𝑘 + 1) − 𝑥(𝑘)

ℎ ,

sendo que ℎ é o intervalo de integração. Supõe-se que este intervalo seja suficientemente pequeno de forma que a equação de diferenças aproxime a equação diferencial.

Deste modo, o modelo de sistema dinâmico discreto pode ser representado matema-ticamente no espaço de estados pelas relações abaixo:

𝑥(𝑘 + 1) = 𝐴𝑑𝑥(𝑘) + 𝐵𝑑𝑢(𝑘), (2.3)

𝑦(𝑘) = 𝐶𝑑𝑥(𝑘) (2.4)

e com 𝑘 ∈ Z+.

Sendo 𝐴𝑑 ∈ R𝑛×𝑛 a matriz de transição de estado, 𝐵𝑑∈ R𝑛×𝑚a matriz de entrada,

9𝑥(𝑘 + 1) é o vetor de estado no instante de tempo 𝑘 + 1, 𝑦(𝑘) ∈ R𝑝×1

é o vetor de saída, 𝑥(𝑘) ∈ R𝑛×1 é o vetor de estado no instante 𝑘, 𝑢(𝑘) ∈ R𝑚×1 o vetor de entrada, e a matriz de saída 𝐶𝑑 ∈ R𝑝×𝑛.

Nesta dissertação é desenvolvido um modelo epidemiológico em tempo contínuo, como normalmente é apresentado na literatura (EDELSTEIN-KESHET,2015), (HETHCOTE,

2000), (MARTCHEVA,2015), (MURRAY,2007), (SEGEL; EDELSTEIN-KESHET,2009),

dentre outras. Mas os dados apresentados por uma doença são geralmente expressos em tempo discreto e, consequentemente, o sistema apresentado no Capítulo 5 (em tempo contínuo) é

(24)

Capítulo 2. Sistemas dinâmicos discretos 24

transformado em um sistema discreto na Subseção5.4, para realizar a aplicação de um observador de estado no sistema, o que será explicado no próximo capítulo. Ao logo da dissertação esses passos serão explicitado em mais detalhes.

2.4

Modelos matemáticos

Modelos matemáticos são uma parte essencial para simulação e determinação de sistemas. Seu objetivo é representar de forma simplificada a realidade, para reproduzir as características relevantes do sistema que está sendo analisado, em que fenômenos do mundo real são traduzidos em um mundo conceitual. Este processo é iniciado observando os fenômenos, aplicando-lhes um modelo matemático e predizendo seu comportamento por meio de simulação. Dentre muitas técnicas utilizadas na obtenção de modelos matemáticos, uma delas é a de modelagem caixa branca. Neste modelo, o sistema é descrito usando equações decorrentes da física e sistemas que são modelados inteiramente com base em princípios físicos (equações) e nas características físicas dos materiais envolvidos (parâmetros) são chamados de modelos caixa branca. Isso significa que o modelador possui todos os detalhes sobre como o sistema funciona.

Por outro lado, pode-se obter um modelo matemático através de identificação de sistemas, nisto se estudam métodos alternativos para que isso ocorra. Neste caso, o modelo do sistema é encontrado através de um conjunto de medições, cada uma registrando a resposta do sistema (saída) para diferentes estímulos e perturbações (entradas). Estes sistemas que são modelados inteiramente com base em dados experimentais, isto é, com as medições de entrada e saída, são chamados de modelos de caixa preta. Isto significa que o modelador pode observar a saída do modelo para um determinado estímulo na entrada, mas não possui informações sobre o sistema internamente. Segundo (AGUIRRE,2015), em muitos casos será preferível usar técnicas de identificação de sistemas. Sendo que, para identificar o modelo, é necessário um grande conjunto de dados e a definição do modelo mais apropriado requer um julgamento do modelador de acordo com os objetivos definidos.

Entre esses dois tipos de modelo, está o modelo caixa cinza, para este tipo sabe-se qual a estrutura do sistema que está sabe-sendo analisado, mas não sabe-se dispõem dos parâmetros

(GIESBRECHT,2007).

Apesar do modelo matemático utilizado nesta dissertação possuir uma estrutura que foi obtida com base em características físicas e biológicas da doença em questão, os parâmetros utilizados neste trabalho foram obtidos através de dados oficiais e de estimativas que fazem com que o sistema tenha o comportamento esperado. Ainda assim, o modelo não desfruta de todas as informações, pois parte das variáveis de estado do problema, que são as populações de agentes transmissores, não são mensuráveis, sendo a estimativa dessas populações o principal objetivo do trabalho. Portanto, o método de modelagem que é usado está entre o caixa cinza e o caixa

(25)

Capítulo 2. Sistemas dinâmicos discretos 25

branca, uma vez que a estrutura do modelo e parte dos parâmetros são conhecidos.

2.5

Conclusão

Neste capítulo foram apresentados conceitos para a realização de modelos mate-máticos de sistemas dinâmicos, introduzindo as definições de espaço de estados e o porquê de sua vasta aplicação, se tornando um bom instrumento na modelagem de sistemas dinâmicos multivariáveis. O sistema resultante pode ser representado em espaço de estados em tempo contínuo e/ou em tempo discreto, este último se faz necessário nesta dissertação devido às características dos dados obtidos. Por fim, uma pequena discussão foi realizada na Seção2.4, referenciando algumas formas de se obter um modelo matemático. Um observador de estado específico é apresentado no capítulo seguinte, a fim de conceituar a parte teórica antes de sua aplicação no modelo elaborado.

(26)

26

Capítulo 3

Observadores de estados

Na teoria de controle, um observador de estado é um algoritmo que fornece uma estimativa do estado interno de um dado sistema real, a partir de medições da entrada e saída desse sistema. O problema da observação de estados para sistemas não lineares é de grande importância na área de controle, sendo muitas as contribuições apresentadas nas literaturas que abordam este tema. Algumas dessas abordagens são apresentadas no decorrer deste capítulo, possuindo grande importância na obtenção de parâmetros do modelo proposto na Seção5.1. Portanto, o capítulo fornece uma visão geral do Filtro de Kalman (FK) a partir da predição de estados um passo a frente pelo método da projeção ortogonal ótima, tendo como introdução a Seção3.1e, à medida que o conteúdo do capítulo avança, o leitor é contemplado com uma das extensões do filtro aplicado a sistemas não lineares, sendo este o Filtro de Kalman Estendido (FKE) na Seção3.3. Na seção seguinte há um pequena introdução de alguns estimadores de estado para sistemas não lineares. Apesar de ser possível definir o Filtro de Kalman para sistemas contínuos (KALMAN; BUCY,1961), neste capítulo somente será mostrado o caso discreto

(KALMAN,1960).

3.1

Estimação por projeção ortogonal

Antes de estudar o Filtro de Kalman (FK), é necessário pontuar algumas ferramentas de estimação de estados. Cada método de estimação de estado por projeção ortogonal tem suas peculiaridades, porém todas são lineares. Ressaltando que o método utilizado nesta dissertação para estimação de estados é designado para modelos não lineares, que precisará ser linearizado, algo a ser detalhado na Seção6.2. Mas neste ponto inicial é necessário um maior detalhamento em relação aos casos lineares, para melhor entendimento do leitor em relação as futuras estimações realizadas no Capítulo6, para os casos não lineares.

Retornando, o problema de estimação por projeção ortogonal tem sua base teórica de um espaço vetorial de variáveis aleatórias. Este espaço é determinado como espaço de Hilbert ℋ. Tomando duas variáveis aleatórias deste espaço, estas sendo 𝑥 ∈ ℋ e 𝑦 ∈ ℋ, o produto interno

(27)

Capítulo 3. Observadores de estados 27

entre elas é igual à esperança condicional entre as mesmas, como pode ser visto abaixo

(𝑥, 𝑦)ℋ= E[𝑥𝑦]. (3.1)

Neste ponto, (GIESBRECHT,2013) ressalta que, por 𝑥 e 𝑦 serem elementos de um espaço vetorial em que é definido um produto interno, pode-se chamar os mesmos de vetores do espaço de Hilbert ℋ, mesmo estas sendo variáveis aleatórias, e não vetores de variáveis aleatórias. Estes casos são diferentes, sendo que um vetor de um espaço de variável aleatória é uma variável aleatória e um conjunto de variáveis aleatórias é formada por vetores de variáveis aleatórias. Para o caso aqui, trata-se de vetores de um espaço vetorial de variáveis aleatórias.

Outra propriedade importante a ressaltar que justifica o nome desta seção é a ortogo-nalidade, ocorrendo quando o produto interno entre dois vetores for igual a zero. Ainda se tem, por definição, que o espaço de Hilbert ℋ é finito e, sendo ℋ um espaço vetorial com produto interno, a norma do vetor 𝑥 ∈ ℋ, denotada por ||𝑥||, é definida como:

||𝑥||ℋ=

a

E[𝑥𝑥]. (3.2)

Aqui, E é o operador de esperança matemática. Por definição, neste espaço são contidos vetores de norma finita, ou seja, para que 𝑥 ∈ ℋ, 𝑥 deve satisfazer:

||𝑥||ℋ=

a

E[𝑥𝑥] < ∞. (3.3)

No caso de vetores de variáveis aleatórias, para que todos os 𝑛 elementos do vetor 𝑥 ∈ R𝑛sejam ortogonais a todos os 𝑝 elementos do vetor 𝑦, tem-se que

(𝑥𝑖, 𝑦𝑗)ℋ = E[𝑥𝑖𝑦𝑗] = 0, (3.4)

com 𝑖 = 1, . . . , 𝑛 e 𝑗 = 1, . . . , 𝑝, isto é, a matriz E[𝑥𝑖𝑦𝑗] se torna o zero do espaço R𝑛×𝑝.

Seja 𝒴 ⊂ ℋ, sendo 𝒴 um subespaço próprio de ℋ constituído de vetores 𝑦𝑗, existe

um vetor 𝑥 no espaço ℋ, que não está contido no subespaço 𝒴. A projeção ortogonal de 𝑥 em 𝒴 é representada pela variável aleatória ˆ𝑥, tal que o erro ||𝑥 − ˜𝑥|| satisfaz

||𝑥 − ˆ𝑥||ℋ= min

𝑦∈𝒴||𝑥 − 𝑦||. (3.5)

Com 𝑥 sendo vetor de variáveis aleatórias com cada 𝑥𝑖 possuindo 𝑛 elementos, e

cada elemento terá projeção em 𝒴 que é um subespaço formado pelas 𝑝 variáveis do vetor 𝑦𝑗,

o subespaço 𝒴 é formado pelas variáveis do vetor 𝑦. Desta forma, a projeção de um vetor de variáveis aleatórias 𝑥 no espaço formado por um vetor de variáveis aleatórias 𝑦 é dada pela seguinte expressão:

ˆ

(28)

Capítulo 3. Observadores de estados 28

com a matriz 𝐴 ∈ R𝑛×𝑝possuindo os termos 𝑎𝑖𝑗 que representam o componente de cada 𝑥𝑖 na

direção de 𝑦𝑗.

Como os vetores de variáveis aleatórias envolvidos no problema podem ter médias não nulas, introduz-se uma constante 𝑏, de forma que 𝑥 não é mais formado por elementos que são combinações lineares das variáveis aleatórias 𝑦𝑗 , mas sim variedades lineares destas

variáveis aleatórias, ou seja:

ˆ

𝑥 = 𝐴𝑦 + 𝑏. (3.7)

Como visto anteriormente, pelas propriedades inerentes do espaço vetorial, tem-se que para ˜𝑥 ser ortogonal a qualquer vetor 𝑦 ∈ 𝒴, deve valer a seguinte expressão deve ocorrer:

E[˜𝑥𝑦] = 0, (3.8)

para qualquer 𝑦 ∈ 𝒴. Como já designamos o valor de ˜𝑥 = 𝑥 − ˆ𝑥, substituindo na equação (3.8), tem-se:

E[(𝑥 − ˆ𝑥)𝑦𝑇], (3.9)

e substituindo o valor de ˆ𝑥 dado em (3.7) na equação (3.9), tem-se

E[(𝑥 − 𝐴𝑦 − 𝑏)𝑦𝑇] = 0 ⇒ (3.10) E[𝑥𝑦𝑇] − 𝐴E[𝑦𝑦𝑇] − 𝑏𝜇𝑇𝑦 = 0, pois E[𝑦

𝑇] = 𝜇𝑇 𝑦. (3.11) Daí, Σ𝑥𝑦+ 𝜇𝑥𝜇𝑇𝑦 − 𝐴Σ𝑦𝑦− 𝐴𝜇𝑦𝜇𝑇𝑦 − 𝑏𝜇 𝑇 𝑦 = 0 (3.12) em que Σ𝑥𝑦 = E[(𝑥 − 𝜇𝑥)(𝑦 − 𝜇𝑦)], (3.13) Σ𝑦𝑦 = E[(𝑦 − 𝜇𝑦)(𝑦 − 𝜇𝑦)𝑇], (3.14) 𝜇𝑦 = E[(𝑦 − 𝜇𝑦)2] e (3.15) 𝜇𝑥 = E[(𝑥 − 𝜇𝑥)2], (3.16) com (Σ𝑥𝑦− 𝐴Σ𝑦𝑦) + (𝜇𝑥− 𝐴𝜇𝑦− 𝑏)𝜇𝑇𝑦 = 0, (3.17) então: Σ𝑥𝑦− 𝐴Σ𝑦𝑦 = 0 ⇒ 𝐴 = Σ𝑥𝑦Σ−1𝑦𝑦 (3.18)

(29)

Capítulo 3. Observadores de estados 29

e

(𝜇𝑥− 𝐴𝜇𝑦 − 𝑏)𝜇𝑇𝑦 = 0 ⇒ 𝑏 = 𝜇𝑥− 𝐴𝜇𝑦. (3.19)

Pode-se notar também que, se os vetores de média 𝜇𝑥 e 𝜇𝑦 forem nulos, o vetor 𝑏

também será nulo, provando que este termo está envolvido no problema apenas para que se levem em conta as médias dos processos 𝑥 e 𝑦.

Portanto, o estimador ˆ𝑥 que representa a projeção ortogonal de 𝑥 em 𝒴 é: ˆ

𝑥 = 𝐴𝑦 + 𝑏 = 𝐴𝑦 + 𝜇𝑥− 𝐴𝜇𝑦 (3.20)

= 𝜇𝑥+ 𝐴(𝑦 − 𝜇𝑦) = (3.21)

= 𝜇𝑥+ Σ𝑥𝑦Σ−1𝑦𝑦(𝑦 − 𝜇𝑦). (3.22)

Analisando a equação (3.22) com o estimador de mínima variância encontrado em

(KATAYAMA,2006) e (GIESBRECHT,2013), chega-se à conclusão de que o estimador por

projeção ortogonal é igual ao estimador linear de mínima variância.

3.2

Filtro de Kalman

Em 1960, Rudolf Kalman publicou seu famoso artigo (KALMAN,1960) descre-vendo uma solução recursiva para o problema de filtragem linear de dados discretos. Desde então, devido em grande parte aos avanços na computação digital, o Filtro de Kalman tem sido objeto de extensa pesquisa e aplicação.

De acordo com (AGUIRRE,2015), o Filtro de Kalman é um estimador recursivo ótimo para estados de um sistema linear descrito por um modelo em espaço de estados. O filtro estima o estado de um sistema dinâmico linear a partir de uma série de medições ruidosas. Este utiliza-se de um conjunto de equações para estimar estados de um processo, mesmo quando este processo apresenta incertezas, sejam elas a não medição de algum ou todos os estados do processo, ou medições ruidosas, isto só é possível graças a sua natureza estocástica.

Para (MAYBECK,1979), o Filtro de Kalman é um algoritmo recursivo de proces-samento de dados, em que a palavra recursivo significa que, ao contrário de alguns conceitos de processamento de dados, o filtro não exige que todos os dados anteriores sejam mantidos no armazenamento e reprocessados toda vez que uma nova medição é executada.

Uma introdução muito didática à ideia geral do Filtro de Kalman baseada na teoria de Bayes pode ser encontrada em (MAYBECK,1979), enquanto uma discussão introdutória mais completa pode ser encontrada em (SORENSON,1970).

Nesta seção, o algoritmo será abordado seguindo a metodologia adotada por (

GIES-BRECHT,2013), sendo apresentado em tempo discreto, considerando que tanto o modelo que é

(30)

Capítulo 3. Observadores de estados 30

forma de tempo discreto:

𝑥(𝑘 + 1) = 𝐴𝑑(𝑘)𝑥(𝑘) + 𝐵𝑑(𝑘)𝑢(𝑘), 𝑢(𝑘) ∼ 𝑁 (0, 𝑄(𝑘)) e (3.23)

𝑦(𝑘) = 𝐶𝑑(𝑘)𝑥(𝑘) + 𝑒(𝑘), 𝑒(𝑘) ∼ 𝑁 (0, 𝑅(𝑘)) (3.24)

onde 𝑢(𝑘) é um vetor de processos estocásticos de ruído de transição de estado possuindo média nula, sendo o vetor de estado 𝑥(𝑘) ∈ R𝑛, o vetor de saída 𝑦(𝑘) ∈ R𝑚, as matrizes de transição de estado 𝐴𝑑(𝑘) e 𝐶𝑑(𝑘) e a matriz de entrada de controle 𝐵𝑑(𝑘) são conhecidas, têm dimensões

apropriadas e são funções determinísticas do tempo, e a matriz de covariância do processo é denotada por 𝑄(𝑘). Estas matrizes podem variar ou não com o tempo.

Umas das primeiras coisas a saber sobre o Filtro de Kalman, é que este funciona com a distribuição normal ou gaussiana. Pensando em um gráfico contínuo, os dados podem ser dis-tribuídos de diferentes maneiras, podendo ser dispersos para a esquerda, direita ou desordenados. Mas há casos em que os dados tendem a ficarem em torno de um valor central, sem tendência a esquerda ou direita e a distribuição resultante é chamada de distribuição normal. Há uma vasta literatura sobre o tema e, neste trabalho, foi utilizado especialmente o texto de (WASSERMAN,

2013) para melhor entendimento do assunto a ser aplicado.

A distribuição gaussiana no Filtro de Kalman representa o valor previsto, e será aqui denotado por estado previsto, com ruído/erro na previsão, sendo o estado previsto centrado em torno da média com a dimensão de sua variância denotando a incerteza no estado. Basicamente, a distribuição gaussiana informa o quanto se está certo de um determinado estado para este ser verdade e, quanto maior a variância da variável aleatória gaussiana, maior será a incerteza sobre este estado.

O FK é um processo iterativo, sendo divido em duas etapas: predição e atualização. Na etapa de predição, é utilizada a estimativa do estado no passo anterior para obter uma estimativa do estado no tempo atual, esta predição é chamada de estimativa a priori, pois não inclui a informação vinda da observação do estado atual. Na fase de atualização, a predição a priorié combinada com a inovação vinda da observação atual para refinar a estimativa do estado. A estimativa refinada é chamada de estimativa a posteriori. A seguir é mostrado o algoritmo do FK, através da predição ótima de estados um passo a frente pelo método da projeção ortogonal.

Na predição de um passo a frente deseja-se encontrar uma recursão para a estimativa do estado no instante 𝑘 + 1 dados os valores da série até o instante 𝑘. Deste modo, tomando as equações (3.23) e (3.24) formando um modelo para o qual, para iniciar o processo de estimação, deve considerar algumas propriedades. Como a média do estado inicial e a variância do estado inicial sendo conhecidos, isto é, 𝑥(1) ∼ 𝑁 (ˆ𝑥(1), 𝑃 (1)), as matrizes do sistema escolhido também são, os ruídos de entrada são brancos com matrizes de covariância conhecidas e os ruídos são descorrelacionados com os estados e entre si.

Assim, a dedução do algoritmo de estimação é realizado como se segue, entrando no conceito de ortogonalidade entre inovação e projeção da saída no instante 𝑘 no espaço gerado

(31)

Capítulo 3. Observadores de estados 31

pelas saídas até o instante 𝑘 − 1.

Antes de avançar para o tema desta seção, precisa-se estabelecer o conceito que se denomina inovação. Supondo que se tenha um conjunto de vetores 𝑦1, . . . , 𝑦𝑁 com dimensão 𝑝,

e que também existe outro conjunto de vetores ˜𝑦1, . . . , ˜𝑦𝑁 com a mesma dimensão e linearmente

independentes entre si. Com isso as 𝜎-álgebras desses dois conjuntos de vetores vão ser iguais aos vetores do segundo conjunto, e os vetores deste segundo conjunto são chamadas de inovações. Um exemplo com mais detalhes é exposto em (GIESBRECHT,2013), para melhor compreensão do leitor. Nas mesmas referências encontra-se uma explicação com maior riqueza de detalhes do que foi dito aqui e da breve discussão realizada nesta seção.

Após esta breve introdução do conceito de inovação, temos que o estimador de mínima variância ˆ𝑥(𝑘 + 1|𝑘) para o estado 𝑥(𝑘 + 1), dadas as observações da saída 𝑦(𝑘) de um determinado modelo até o instante 𝑘, será determinado a seguir.

Define-se 𝑣(𝑘) como a inovação trazida ao espaço 𝒴𝑘−1 por uma leitura 𝑦(𝑘), ou

seja,

𝑣(𝑘) = 𝑦(𝑘) − E[𝑦(𝑘)|𝒴𝑘−1]. (3.25)

A estimativa do estado 𝑥(𝑘 + 1), dadas as observações até o instante 𝑘, se torna ˆ

𝑥(𝑘 + 1|𝑘) = E[ˆ𝑥(𝑘 + 1)|𝒴𝑘] (3.26)

= E[𝐴(𝑘)𝑥(𝑘) + 𝐵(𝑘)𝑢(𝑘)|𝒴𝑘] (3.27)

= 𝐴(𝑘)E[𝑥(𝑘)|𝒴𝑘] (3.28)

= 𝐴(𝑘)ˆ𝑥(𝑘|𝑘), (3.29)

uma vez que a entrada 𝑢(𝑘) é suposta descorrelacionada. Ao calcular a estimativa do estado no instante 𝑘, tem-se

ˆ

𝑥(𝑘|𝑘) = E[𝑥(𝑘)|𝒴𝑘] = E[𝑥(𝑘)|𝒴𝑘−1⊕ 𝑣(𝑘)] (3.30)

= E[𝑥(𝑘)|𝒴𝑘−1] + E[𝑥(𝑘)|𝑣(𝑘)]. (3.31)

Como as inovações 𝑣(𝑘) foram definidas inicialmente pela equação (3.25) e, tomando a mesma equação e substituindo o valor de 𝑦(𝑘) pela equação (3.24), pode-se escrever

𝑣(𝑘) = 𝑦(𝑘) − E[𝑦(𝑘)|𝒴𝑘−1] (3.32)

= 𝐶(𝑘)𝑥(𝑘) + 𝑒(𝑘) − E[𝐶(𝑘)𝑥(𝑘) + 𝑒(𝑘)|𝒴𝑘−1] (3.33)

= 𝐶(𝑘)𝑥(𝑘) + 𝑒(𝑘) − 𝐶(𝑘)E[𝑥(𝑘)|𝒴𝑘−1] (3.34)

= 𝐶(𝑘)p𝑥(𝑘) − ˆ𝑥(𝑘|𝑘 − 1)q + 𝑒(𝑘) (3.35)

= 𝐶(𝑘)˜𝑥(𝑘) + 𝑒(𝑘). (3.36)

O termo na direção de 𝑣(𝑘) pode ser estimado de forma linear, ou seja, como sendo uma constante que multiplica 𝑣(𝑘) e, retornando à equação (3.31) e tomando o segundo termo, tem-se:

(32)

Capítulo 3. Observadores de estados 32

Em (3.37) substituindo o segundo termo da equação anterior por (3.31) e, dada a esperança do estado no instante 𝑘 e dadas todas as observações até o instante 𝑘 − 1, tem-se que a estimativa do estado será ˆ𝑥(𝑘|𝑘 − 1). Realizando esta substituição, tem-se que

ˆ

𝑥(𝑘|𝑘) = 𝑥(𝑘|𝑘 − 1) + 𝐾(𝑘)𝑣(𝑘).ˆ (3.38)

Se 𝐾(𝑘) for definida de forma que a estimativa do estado seja ortogonal ao erro, esta constante implicará na solução de menor variância para o problema de se estimar o estado. Isto é, para realizar a estimação ótima, o erro da estimação deve ser ortogonal ao espaço gerado pela inovação. A constante que garante esta propriedade é conhecida como ganho de Kalman, sendo calculada da seguinte forma:

𝑥(𝑘) − E[𝑥(𝑘)|𝑣(𝑘)]⊥𝑣(𝑘), (3.39)

𝑥(𝑘) − 𝐾(𝑘)𝑣(𝑘)⊥𝑣(𝑘), (3.40)

onde E[𝑥(𝑘)|𝑣(𝑘)] foi substituída pelo valor encontrado da equação anterior.

Pela ortogonalidade do espaço de Hilbert, o produto interno entre dois vetores ortogonais é nulo. Então, aplicando o produto interno, tem-se a seguinte relação:

E[p𝑥(𝑘) − 𝐾(𝑘)𝑣(𝑘)q 𝑣(𝑘)𝑇] = 0, (3.41) E[𝑥(𝑘)𝑣(𝑘)𝑇] − 𝐾(𝑘)E[𝑣(𝑘)𝑣(𝑘)𝑇] = 0, (3.42) o que implica

𝐾(𝑘) = E[𝑥(𝑘)𝑣(𝑘)𝑇]E[𝑣(𝑘)𝑣(𝑘)𝑇]−1e (3.43)

𝐾(𝑘) = 𝑀 (𝑘)𝐹 (𝑘)−1, (3.44)

com 𝑀 (𝑘) = E[𝑥(𝑘)𝑣(𝑘)𝑇] e 𝐹 (𝑘) = E[𝑣(𝑘)𝑣(𝑘)𝑇]. No entanto^, ao substituir 𝑣(𝑘) e 𝑥(𝑘) em 𝑀 (𝑘), tem-se 𝑀 (𝑘) = E[𝑥(𝑘) p𝐶(𝑘)˜𝑥(𝑘) + 𝑒(𝑘)q𝑇] (3.45) = E[p˜𝑥(𝑘) + ˆ𝑥(𝑘|𝑘 − 1)q p𝐶(𝑘)˜𝑥(𝑘) + 𝑒(𝑘)q𝑇] (3.46) = E[˜𝑥(𝑘)˜𝑥(𝑘)𝑇]𝐶(𝑘)𝑇 + E[ˆ𝑥(𝑘|𝑘 − 1)˜𝑥(𝑘)𝑇]𝐶(𝑘)𝑇 (3.47) = E[˜𝑥(𝑘)˜𝑥(𝑘)𝑇]𝐶(𝑘)𝑇 (3.48) = 𝑃 (𝑘)𝐶(𝑘)𝑇. (3.49)

E, obtendo o 𝐹 (𝑘) substituindo pela equação (3.36), tem-se

𝐹 (𝑘) = E[𝑣(𝑘)𝑣(𝑘)𝑇] (3.50)

= E[p𝐶(𝑘)˜𝑥(𝑘) + 𝑒(𝑘)q p𝐶(𝑘)˜𝑥(𝑘) + 𝑒(𝑘)q𝑇] (3.51) = 𝐶(𝑘)E[˜𝑥(𝑘)˜𝑥(𝑘)𝑇]𝐶(𝑘)𝑇 + E[𝑣(𝑘)𝑣(𝑘)𝑇] (3.52)

(33)

Capítulo 3. Observadores de estados 33

Tomando a equação (3.29) e substituindo nela a estimativa no instante 𝑘, pela equação (3.38), tem-se ˆ 𝑥(𝑘 + 1|𝑘) = 𝐴(𝑘)ˆ𝑥(𝑘|𝑘) (3.54) = 𝐴(𝑘)pˆ𝑥(𝑘|𝑘 − 1) + 𝐾(𝑘)𝑣(𝑘)q . (3.55) Como 𝐾(𝑘) = 𝑀 (𝑘)𝐹 (𝑘)−1, então ˆ 𝑥(𝑘 + 1|𝑘) = 𝐴(𝑘) ˆ𝑥(𝑘|𝑘 − 1) + 𝑀 (𝑘)𝐹 (𝑘)−1𝑣(𝑘) (3.56) = 𝐴(𝑘) ˆ𝑥(𝑘|𝑘 − 1) + 𝑃 (𝑘)𝐶(𝑘)𝑇𝐹 (𝑘)−1𝑣(𝑘) (3.57) = 𝐴(𝑘)ˆ𝑥(𝑘|𝑘 − 1) + 𝐴(𝑘)𝑃 (𝑘)𝐶(𝑘)𝑇𝐹 (𝑘)−1𝑣(𝑘) (3.58) = 𝐴(𝑘)ˆ𝑥(𝑘|𝑘 − 1) + 𝐾(𝑘)𝑣(𝑘) (3.59) em que 𝐾(𝑘) = 𝐴(𝑘)𝑃 (𝑘)𝐶(𝑘)𝑇𝐹 (𝑘)−1 (3.60) = 𝐴(𝑘)𝑃 (𝑘)𝐶(𝑘)𝑇(𝐶(𝑘)𝑃 (𝑘)𝐶(𝑘)𝑇 + 𝑅(𝑘))−1 (3.61) = 𝐴(𝑘)𝑀 (𝑘)𝐹 (𝑘)−1. (3.62)

Desta equação, nota-se que o ganho de Kalman é função das matrizes conhecidas do sistema e da matriz de covariância do erro de estimação de estado.

A equação recursiva da covariância do erro ˜𝑥(𝑘 + 1), definida por 𝑃 (𝑘 + 1|𝑘) do instante 𝑘 + 1, dado 𝑘, é dada por:

𝑃 (𝑘 + 1|𝑘) = E[˜𝑥(𝑘 + 1)˜𝑥(𝑘 + 1)𝑇] (3.63) = E[(𝑥(𝑘 + 1) − ˆ𝑥(𝑘 + 1|𝑘))˜𝑥(𝑘 + 1)𝑇] (3.64) = E[𝑥(𝑘 + 1)˜𝑥(𝑘 + 1)𝑇] (3.65) = E[𝑥(𝑘 + 1) p𝑥(𝑘 + 1) − ˆ𝑥(𝑘 + 1|𝑘)q𝑇] (3.66) = E[p𝑦(𝑘)q p𝐴(𝑘)𝑥(𝑘) + 𝐵(𝑘)𝑢(𝑘) − 𝐴(𝑘)ˆ𝑥(𝑘|𝑘 − 1) − 𝐾(𝑘)𝑣(𝑘)q𝑇(3.67)] = 𝐴(𝑘)𝑃 (𝑘|𝑘 − 1)𝐿(𝑘)𝑇 + 𝐵(𝑘)𝑄(𝑘)𝐵(𝑘)𝑇, (3.68) com 𝐿(𝑘) = 𝐴(𝑘) − 𝐾(𝑘)𝐶(𝑘) e 𝑦(𝑘) = 𝐴(𝑘)𝑥(𝑘) + 𝐵(𝑘)𝑢(𝑘).

Agora, para obter a equação recursiva de 𝑃 (𝑘|𝑘), deve-se ter,

𝑃 (𝑘|𝑘) = E[˜𝑥(𝑘)˜𝑥(𝑘)𝑇] = 𝐸[(𝑥(𝑘) − ˆ𝑥(𝑘|𝑘))˜𝑥(𝑘)𝑇] (3.69) = E[𝑥(𝑘)˜𝑥(𝑘)𝑇] − E[ˆ𝑥(𝑘)˜𝑥(𝑘)𝑇]. (3.70) Como 𝑥(𝑘) = ˜𝑥(𝑘) + ˆ𝑥(𝑘) e ˆ𝑥(𝑘|𝑘) é ortogonal a ˜𝑥(𝑘), tem-se

𝑃 (𝑘|𝑘) = E[𝑥(𝑘)˜𝑥(𝑘)𝑇] (3.71)

= E[𝑥(𝑘)(𝑥(𝑘) − ˆ𝑥(𝑘|𝑘))𝑇] (3.72)

(34)

Capítulo 3. Observadores de estados 34

tem-se que ˆ𝑥(𝑘|𝑘) = ˆ𝑥(𝑘|𝑘 − 1) + 𝐾(𝑘)𝑣(𝑘) e 𝑣(𝑘) = 𝐶(𝑘)˜𝑥(𝑘) + 𝑒(𝑘). Substituindo na equação anterior, obtém-se

𝑃 (𝑘|𝑘) = E[𝑥(𝑘)𝑥(𝑘)𝑇] − E[𝑥(𝑘)(ˆ𝑥(𝑘|𝑘 − 1) + 𝐾(𝑘)𝑣(𝑘))𝑇] (3.74) = E[𝑥(𝑘)𝑥(𝑘)𝑇] − E[𝑥(𝑘)(ˆ𝑥(𝑘|𝑘 − 1) + 𝐾(𝑘)(𝐶(𝑘)˜𝑥(𝑘) + 𝑒(𝑘)))𝑇] (3.75) = E[𝑥(𝑘)𝑥(𝑘)𝑇] − E[𝑥(𝑘)(𝑥(𝑘) + ˆ𝑥(𝑘|𝑘))𝑇𝐴(𝑘)𝑇𝐹 (𝑘)−1𝑀 (𝑘)𝑇] (3.76) = 𝑃 (𝑘) − 𝑃 (𝑘|𝑘)𝐴(𝑘)𝑇𝐹 (𝑘)−1𝑀 (𝑘)𝑇. (3.77) Desta forma, tendo deduzidas todas as equações, segue o algoritmo:

Filtro de Kalman Etapa de predição 𝑣(𝑘) = 𝐶(𝑘)˜𝑥(𝑘) + 𝑒(𝑘), (3.78) 𝐹 (𝑘) = 𝐶(𝑘)𝑃 (𝑘)𝐶(𝑘)𝑇 + 𝑅(𝑘), (3.79) 𝑀 (𝑘) = 𝑃 (𝑘)𝐶(𝑘)𝑇, (3.80) ˆ 𝑥(𝑘|𝑘) = ˆ𝑥(𝑘) + 𝑀 (𝑘)𝐹 (𝑘)−1𝑣(𝑘) e (3.81) 𝑃 (𝑘|𝑘) = 𝑃 (𝑘) − 𝑃 (𝑘|𝑘)𝐴(𝑘)𝑇𝐹 (𝑘)−1𝑀 (𝑘)𝑇. (3.82) Etapa de Correção/Atualização ˆ 𝑥(𝑘 + 1|𝑘) = 𝐴(𝑘)˜𝑥(𝑘|𝑘 − 1) + 𝐴(𝑘)𝑀 (𝑘)𝐹 (𝑘)−1𝑣(𝑘), (3.83) 𝐿(𝑘) = 𝐴(𝑘) − 𝐴(𝑘)𝑀 (𝑘)𝐹 (𝑘)−1𝐶(𝑘) e (3.84) 𝑃 (𝑘 + 1) = 𝐴(𝑘)𝑃 (𝑘|𝑘 − 1)𝐿(𝑘)𝑇 + 𝐵(𝑘)𝑄(𝑘)𝐵(𝑘)𝑇. (3.85)

Na atualização, para obter a inovação, realizada pela equação (3.78) deve-se aplicar a diferença entre a saída medida 𝑦(𝑘) e o produto da matriz de transição 𝐶(𝑘) com o erro de predição de estado. Após isso, são calculadas a matriz de covariância da inovação 𝐹 (𝑘) e a matriz 𝑀 (𝑘), obtida da matriz de covariância do erro de estimação e a matriz de transição do sistema. Com essas matrizes é determinado o ganho de Kalman, denotado por 𝐾(𝑘) em nossas demonstrações e se encontra de maneira implícita na equação (3.83) e (3.84). Logo depois, nas equações (3.83) e (3.85), inicia-se o processo de atualização do estado e da covariância.

3.3

Filtro de Kalman Estendido

O Filtro de Kalman Estendido (FKE) foi apresentado pela primeira vez em (SMITH;

SCHMIDT; MCGEE,1962), para estimação de trajetórias do veículo lunar Apollo 11. Neste caso,

os cálculos precisavam ser algo que os computadores a bordo da cápsula do veículo poderiam resolver com seu limitado poder computacional da década de 1960.

O procedimento criado por Schmidt consiste em linearizar analiticamente o sistema em torno do estado atual e aplicar as equações do Filtro de Kalman apresentadas anteriormente.

(35)

Capítulo 3. Observadores de estados 35

Este é um dos métodos recomendados para realizar as estimativas do sistema dinâmico não linear que descreve a febre amarela nesta dissertação.

3.3.1

Linearização

Ao linearizar uma função, expande-se a função não linear em série de Taylor em torno do ponto estacionário de operação, desprezando todos os termos após a primeira derivada parcial. Seja inicialmente a aproximação linear de uma variável. Expandindo-se a função 𝑓 (𝑥) em série de Taylor em torno de um ponto, tem-se:

𝑓 (𝑥) = 𝑓 (𝑥0) + 𝑑𝑓 𝑑𝑥    𝑥=𝑥0 (𝑥 − 𝑥0) + 1 2 ! 𝑑2𝑓 𝑑𝑥2    𝑥=𝑥0 (𝑥 − 𝑥0)2+ . . . (3.86) 𝑓 (𝑥) = ∞ ∑︁ 𝑘=0 (𝑥 − 𝑥0)𝑘 𝑘 ! 𝑑𝑘𝑓 𝑑𝑥𝑘 (3.87)

Considerando que 𝑥 − 𝑥0é um termo pequeno, isto é, 𝑥0 está próximo de 𝑥, descartam-se os

termos da série de potências maiores que 1. Com isso, tem-se um aproximação linear da função de primeira ordem 𝑓 (𝑥) = 𝑓 (𝑥0) + 𝑑𝑓 𝑑𝑥    𝑥=𝑥0 (𝑥 − 𝑥0). (3.88)

3.3.2

Linearização de sistemas em espaço de estados

A forma geral de um sistema dinâmico não linear determinístico é

𝑥(𝑘 + 1) = 𝑓 (𝑥(𝑘)), 𝑢(𝑘)), 𝑢(𝑘) ∼ 𝑁 (0, 𝑄(𝑘)) (3.89) 𝑦(𝑘) = ℎ(𝑥(𝑘)) + 𝑒(𝑘), 𝑒(𝑘) ∼ 𝑁 (0, 𝑅(𝑘)) (3.90) em que o vetor de estados 𝑥 ∈ R𝑛, o vetor de controle 𝑢 ∈ R𝑚, a saída 𝑦 ∈ R𝑝 e as funções não lineares 𝑓 (.) e ℎ(.) são a dinâmica de estados e a dinâmica de saída.

A função 𝑓 (·) pode ser usada para calcular o estado previsto a partir da estimativa anterior e, da mesma forma, a função ℎ(·) pode ser usada para calcular a medida prevista a partir do estado previsto. No entanto, 𝑓 (·) e ℎ(·) não podem ser aplicadas diretamente à covariância, isso porque o sistema relacionado a este trabalho é não linear e não consegue-se propagar a média e a covariância, respectivamente como foi realizado nas equações (3.81) e (3.82) do Filtro de Kalman. Além disso, quando se trata de sistemas lineares, as distribuições a priori e a posteriorisão gaussianas. Por outro lado, as transformações não lineares de sistemas não lineares podem deformar a distribuição das variáveis aleatórias envolvidas no processo, podendo levar a violações da hipótese de gaussianidade.

O Filtro de Kalman Estendido, é o próprio Filtro de Kalman implementado utilizando as matrizes jacobianas de 𝑓 (·) e ℎ(·), ou seja, usando as linearizações (primeiros termos das expansões da série de Taylor) de tais funções em torno do estado atual.

(36)

Capítulo 3. Observadores de estados 36

Aqui vale ressaltar que as funções 𝑓 (·) e ℎ(·) são funções vetoriais e suas matrizes jacobianas são respectivamente

9𝐹(𝑘) = 𝜕𝑓 𝜕𝑥    ^ 𝑥𝑘−1|𝑘−1,𝑢𝑘 e 9𝐻(𝑘) = 𝜕ℎ 𝜕𝑥    ^ 𝑥𝑘|𝑘−1 . (3.91)

Algo a ser mencionado é que em sistemas não lineares a matriz jacobiana 9𝐹 (𝑘) não é constante, mas se 9𝐹 (𝑘) e 9𝐻(𝑘) forem avaliadas em valores específicos do vetor de estado 𝑥 = 𝑥0, as respectivas matrizes jacobianas passam a ser constantes. Desta maneira, o Filtro de

Kalman Estendido pode ser escrito para estimar as populações de mosquitos portadores e não portadores no sistema SIR não linear descrito no Capítulo5como,

Filtro de Kalman Estendido Etapa de predição ˆ 𝑥(𝑘|𝑘) = 𝑓 (ˆ𝑥(𝑘|𝑘), 𝑢𝑘) e (3.92) 𝑃 (𝑘|𝑘) = 9𝐹 (𝑘)𝑃 (𝑘|𝑘) 9𝐹 (𝑘)𝑇 + 𝑄(𝑘). (3.93) Etapa de Correção/Atualização 𝐾(𝑘) = 𝑃 (𝑘|𝑘) 9𝐻(𝑘)𝑇( 9𝐻(𝑘)𝑃 (𝑘|𝑘)𝐻(𝑘)𝑇 + 𝑅(𝑘))−1, (3.94) ˆ 𝑥(𝑘 + 1|𝑘) = ˆ𝑥(𝑘|𝑘 − 1) + 𝐾(𝑘 + 1)(𝑦(𝑘) − ℎ(ˆ𝑥(𝑘|𝑘))) e (3.95) 𝑃 (𝑘 + 1) = 𝑃 (𝑘 + 1|𝑘) − 𝐾(𝑘 + 1)𝐻(𝑘)𝑃 (𝑘 + 1|𝑘). (3.96)

Nota-se que, as funções não lineares 𝑓 (·) e ℎ(·) são utilizadas na equação de propa-gação do vetor de estado (3.92) e na equação (3.95) que determina a saída esperada. Nas demais equações as matrizes jacobianas de 𝑓 (·) e ℎ(·) foram utilizadas para determinar as matrizes de covariância e o ganho de Kalman.

3.4

Estimadores de estado para sistemas não lineares

O Filtro de Kalman Unscented (FKU) é uma técnica mais atual para filtragem esto-cástica não linear, diferente do Filtro de Kalman Estendido. Proposto por (JULIER; UHLMANN,

1997) e aprimorado por (WAN; MERWE,2000), tem como ideia principal propagar a estimativa diretamente na função não linear e depois calcular a média e covariância da nova variável aleatória.

No FKE, a distribuição de estado é propagada analiticamente através da linearização de primeira ordem do sistema não linear. No FKU, é utilizada uma abordagem de amostragem determinística (WAN; MERWE,2000), a qual é baseada em uma técnica chamada Transformada Unscented(UT), utilizada para aproximar a média e a covariância de uma variável aleatória que é submetida uma transformação não linear. Isto é realizado escolhendo determinados pontos

Referências

Documentos relacionados

Essa pesquisa tem caráter teórico, exploratório e aplica análise qualitativa de dados. Para este estudo, selecionamos a música “Scar Tissue” da banda “Red Hot

O bloqueio intempestivo dos elementos de transmissão de energia entre os equipamentos e acessórios ou reboques está impedido ou se não está existem medidas que garantem a segurança

Ainda segundo Gil (2002), como a revisão bibliográfica esclarece os pressupostos teóricos que dão fundamentação à pesquisa e às contribuições oferecidas por

O estudo múltiplo de casos foi aplicado para identificar as semelhanças e dissemelhanças na forma como as empresas relacionam seus modelos de negócios e suas

Conforme mencionado anteriormente, os basidiomicetos de podridão branca são mais utilizados em processos de micorremediação mediado pela biodegradação enzimática, mas a

“Depois destes quatro anos de experiência temos novos desafios, por exemplo, trazer mais homens para nossas atividades e expandir o projeto para atender colegas do

(2013 B) avaliaram a microbiota bucal de oito pacientes submetidos à radioterapia na região de cabeça e pescoço através de pirosequenciamento e observaram alterações na

Contribuir para o desenvolvimento de produtos finais concretos (metodologias, processos, ferramentas de trabalho, políticas públicas, etc.), que sejam “novas portas