Meta-heurísticas aplicadas à identificação de sistemas

Texto

(1)UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE. U NIVERSIDADE F EDERAL DO R IO G RANDE DO N ORTE C ENTRO DE T ECNOLOGIA P ROGRAMA DE P ÓS -G RADUAÇÃO EM E NGENHARIA M ECATRÔNICA. UFRN CT PEM. Meta-heurísticas aplicadas à identificação de sistemas. Alcemy Gabriel Vitor Severino. Orientador: Prof. Dr. Fábio Meneghetti Ugulino de Araújo. Número de ordem PEM: M010 Natal, RN, dezembro de 2017.

(2) UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE. U NIVERSIDADE F EDERAL DO R IO G RANDE DO N ORTE C ENTRO DE T ECNOLOGIA P ROGRAMA DE P ÓS -G RADUAÇÃO EM E NGENHARIA M ECATRÔNICA. UFRN CT PEM. Meta-heurísticas aplicadas à identificação de sistemas. Alcemy Gabriel Vitor Severino. Orientador: Prof. Dr. Fábio Meneghetti Ugulino de Araújo. Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Engenharia Mecatrônica da UFRN (área de concentração: Sistemas Dinâmicos e Controle de Processos) como parte dos requisitos para obtenção do título de Mestre em Ciências.. Natal, RN, dezembro de 2017.

(3) Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Central Zila Mamede Severino, Alcemy Gabriel Vitor. Meta-heurísticas aplicadas à identificação de sistemas / Alcemy Gabriel Vitor Severino. - 2017. 74 f. : il. Dissertação (mestrado) - Universidade Federal do Rio Grande do Norte, Centro de Tecnologia, Programa de Pós-Graduação em Engenharia Mecatrônica. Natal, RN, 2018. Orientador: Prof. Dr. Fábio Meneghetti Ugulino de Araújo. 1. Meta-heurísticas - Dissertação. 2. Sistemas não lineares Dissertação. 3. Identificação de sistemas - Dissertação. 4. Seleção de estruturas - Dissertação. 5. Modelo NARX Dissertação. I. Araújo, Fábio Meneghetti Ugulino de. II. Título. RN/UF/BCZM. CDU 621.3.049.77.

(4)

(5) Aos meus pais, Alcivan e Marineide, e ao meu querido irmão, Gabriel..

(6) Agradecimentos. Em primeiro lugar agradeço a Deus por minha vida, pelas bênçãos colocadas em meu caminho, ainda que as não merecesse, e pela oportunidade de concluir este trabalho. Aos meus pais pelo opoio, paciência, compreensão e amor. Foram a educação e a confiança que eles me deram que proporcionou a força necessária para chegar onde estou e me tornar a pessoa que sou hoje. Ao meu querido irmão, Gabriel, que, com seu humor e alegria, forneceu-me momentos felizes que me ajudaram a seguir em frente. A minha amada namorada, Kyury, que, com seu amor e carinho, confortou-me e acreditou em mim mais do que eu mesmo, e sempre estava disposta a me ajudar no que fosse necessário. Ao meu orientador, Professor Dr. Fábio Meneghetti Ugulino de Araújo, que me deu a oportunidade de ser seu orientando e me guiou em minha carreira acadêmica desde a iniciação cientíntica até o mestrado. Sempre comprensível e disposto a ajudar. Aos meus queridos amigos, André Luiz, André Henrique, Andressa Jales, Artur Paulino, Brunna Vasconcelos, Danilo Ichihara, Diego Henrique, Fábio Ricardo, Frankelene Pinheiro, Gustavo Rossi, Ícaro Araújo, Jean Mário, José Kleiton, Leandro Luttiane, Mayranne Furtunato, Missilene Farias, Mário Sérgio, Pedro André, Rafael Cardoso, Sérgio Natan e Willians Mendes. Aos funcionários do Departamento de Engenharia de Computação e Automação, Amalusia Oliveira, Flávio Gameleira, Maria José e Raimundo Lima e a secretária da Coordenação de Pós-Graduação em Engenharia Mecatrônica, Rebeca Aline. Aos professores do Programa de Pós-Graduação em Engenharia Mecatrônica, em especial aos professores, Dr. Adelardo Adelino Dantas de Medeiros, Dr. Carlos Eduardo Trabuco Dorea, Dr. Kurios Iuri Pinheiro de Melo Queiroz e Dr. Pablo Javier Alsina. À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) pelo apoio financeiro. E para todos aqueles que não foram mencionados aqui e colaboraram, direta ou indiretamente, com a conclusão desse trabalho. Muito obrigado..

(7) “No fim tudo dá certo, e se não deu certo é porque ainda não chegou ao fim.” –Fernando Sabino.

(8) Resumo. A identificação de sistemas tem como objetivo determinar modelos matemáticos capazes de descrever suas características dinâmicas a partir de observações. Geralmente, o processo de identificação é dividido nas seguintes etapas: i) coleta de dados experimentais, ii) determinação da estrutura do modelo, iii) estimação de parâmetros e iv) validação do modelo. Neste trabalho investiga-se o problema da determinação de estruturas. A partir de técnicas de otimização conhecidas como meta-heurísticas, foi desenvolvido um algoritmo para determinação da estrutura de modelos NARX polinomiais. Diferente dos métodos tradicionais, as meta-heurísticas utilizam um conjunto de possíveis soluções e estratégias, geralmente baseadas na natureza, para encontrar a solução do caso aplicado. Dentre as técnicas estudadas estão o algoritmo genético, a otimização por enxame de partículas e o algoritmo do morcego. A metodologia proposta foi aplicada na identificação de três exemplos experimentais: um aquecedor elétrico, um conversor buck e uma válvula pneumática. Os resultados demonstram que meta-heurísticas podem ser aplicadas no problema da seleção de estruturas em modelos NARX polinomiais. Palavras-chave: Meta-heurística, Sistemas não lineares, Identificação de sistemas, Seleção de estruturas, modelo NARX..

(9) Abstract. System identification has the goal to determine mathematical models to describe dynamic characteristics of systems from observations. The identification process is generally divided into the following steps: i) experimental data collection, ii) determination of model structure, iii) parameter estimation and iv) model validation. In this work, the problem determining of structures is investigated. An algorithm was developed to determine the structure of polynomial NARX models using optimization techniques known as meta-heuristics. Unlike traditional methods, metaheuristics use a set of possible solutions and strategies, usually based on nature, to find the solution of the case applied. Among the techniques studied are the genetic algorithm, the particle swarm optimization, and the bat algorithm. The methodology proposed in this work was applied to identify three experimental examples: an electric heater, a buck converter and a pneumatic valve. The results demonstrate that metaheuristics can be applied to the problem of the selection of polynomial NARX model structures. Keywords: Meta-heuristics, Nonlinear systems, Systems identification, Selection of structures, NARX model..

(10) Lista de Figuras. 2.1 2.2 2.3 2.4 2.5 2.6. Procedimento para identificação de processos. . . . . . . Etapas do procedimento básico de identificação. . . . . . Representação esquemática dos modelos ARX e ARMAX. Etapas básicas do GA utilizado. . . . . . . . . . . . . . . Etapas básicas do PSO utilizado. . . . . . . . . . . . . . . Etapas básicas do BA utilizado. . . . . . . . . . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. 9 10 13 24 25 26. 3.1 3.2 3.3 3.4 3.5. Fluxograma do procedimento de identificação. Termos candidatos e organização. . . . . . . Algoritmo de identificação . . . . . . . . . . Processo de avaliação. . . . . . . . . . . . . Diagrama de blocos da simulação do modelo.. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. 29 30 31 32 33. 4.1 4.2 4.3 4.4. Aquecedor elétrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dados de identificação - aquecedor elétrico. . . . . . . . . . . . . . . . . Saída estimada - aquecedor elétrico. . . . . . . . . . . . . . . . . . . . . Saídas estimadas dos modelos encontrados pelas meta-heurísticas para o aquecedor elétrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diferença entre a saída real e estimada - aquecedor elétrico. . . . . . . . Ampliação das curvas de erros - aquecedor elétrico. . . . . . . . . . . . Estrutura de um conversor CC-CC do tipo buck . . . . . . . . . . . . . . Dados de identificação - conversor CC-CC do tipo buck. . . . . . . . . . Saída estimada - conversor buck. . . . . . . . . . . . . . . . . . . . . . Saídas estimadas dos modelos encontrados pelas meta-heurísticas para o conversor buck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diferença entre a saída real e estimada - conversor buck. . . . . . . . . . Sistema de controle de nível Level Process Statio 3503MO. . . . . . . . Diagrama do sistema de controle de nível. . . . . . . . . . . . . . . . . . Dados de identificação - válvula pneumática. . . . . . . . . . . . . . . . Saída estimada - válvula pneumática. . . . . . . . . . . . . . . . . . . . Saídas estimadas dos modelos encontrados pelas meta-heurísticas para a válvula pneumática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diferença entre a saída real e estimada - válvula pneumática. . . . . . . .. 34 35 36. 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 4.13 4.14 4.15 4.16 4.17. i. . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. 38 39 39 40 41 41 43 44 45 45 46 46 48 49.

(11) Lista de Quadros e Tabelas. 1.1. Lista de meta-heurísticas . . . . . . . . . . . . . . . . . . . . . . . . . .. 2.1 2.2 2.3 2.4. Formas de comportamento qualitativo não linear. . . . . . . Termos candidatos modelo ARMAX (ny = nu = 3 e ne = 2). Conversão decimal-binária e regressores selecionados. . . . Valores de x e a estrutura de seus respectivos modelos. . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. 14 20 20 20. 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9. Valores dos parâmetros utilizados para cada meta-heurística Média e desvio padrão dos critérios analisados . . . . . . . Índices de avaliação . . . . . . . . . . . . . . . . . . . . . Valores dos parâmetros utilizados para cada meta-heurística Média e desvio padrão dos critérios analisados . . . . . . . Índices de avaliação . . . . . . . . . . . . . . . . . . . . . Valores dos parâmetros utilizados para cada meta-heurística Média e desvio padrão dos critérios analisados . . . . . . . Índices de avaliação . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. 37 37 39 42 42 44 47 47 49. ii. 4.

(12) Lista de Símbolos e Abreviaturas. At. Média da amplitude de emissão de pulso. JMQ. Função custo. N. Comprimento dos dados coletados. Ts. Tempo de amostragem. Y. Vetor da resposta do sistema. Ψ. Matriz de regressores. ΨT Ψ. Matriz normal ou matriz de informação. Ξ. Vetor de resíduos. αeγ. Constantes. β. Vetor de números aleatórios com distribuição uniforme entre 0 e 1. ˆ Θ θ,. Vetor de parâmetros. yˆ. Resposta estimada do sistema. ω. Fator de inércia. φ. Matriz das observações. φ1. Grau de confiança da partícula na melhor solução encontrada pela mesma. φ2. Grau de confiança da particula na melhor solução encontrada pelo enxame. σ2erro. Variância dos resíduos. τd. Tempo morto. vi. i-ésima velocidade da partícula ou morcego. xi. i-ésima posição da partícula ou morcego. gbest. Melhor solução encontrada pelo i-ésimo enxame. pbesti. Melhor solução encontrada pela i-ésima partícula iii.

(13) ε. Valor aleatório entre -1 e 1. ε(k). Resíduos. ϕ(k). Vetor de regressores. e(k). Ruído do sistema. f (·). Função não linear qualquer. fmax. Frequência máxima de emissão de pulso. fmin. Frequência mínima de emissão de pulso. l. Grau de não linearidade. nθ. Número de parâmetros do modelo. ne. Ordem do ruído. nu. Ordem da entrada. ny. Ordem da saída. q−1. Operador de atraso. r1 e r2. Números aleatrórios entre 0 e 1. ri. Taxa de emissão de pulso. u(k). Sinal de entrada. y(k). Resposta do sistema. AIC. Akaike’s Information Criterion. ARMAX. AutoRegressive Moving Average with eXogenous inputs. ARX. AutoRegressive with eXogenous inputs. BA. Bat Algorithm. ERR. Error Reduction Ratio. GA. Genetic Algorithm. MMQ. Método de mínimos quadrados. NARMAX. Nonlinear AutoRegressive Moving Average with eXogenous inputs. NARX. Nonlinear AutoRegressive with eXogenous inputs. PRBS. Pseudo Random Binary Signal.

(14) PSO. Particle Swarm Optimization. PWM. Pulse Width Modulation.

(15) Sumário. 1. Introdução. 2. Fundamentação Teórica 2.1 Sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Sistemas lineares e não lineares . . . . . . . . . . . . . . . . 2.2 Identificação de sistemas dinâmicos . . . . . . . . . . . . . . . . . . 2.2.1 Coleta de dados experimentais . . . . . . . . . . . . . . . . . 2.2.2 Determinação do modelo . . . . . . . . . . . . . . . . . . . . 2.2.3 Métodos paramétricos . . . . . . . . . . . . . . . . . . . . . 2.2.3.1 Representações discretas para métodos paramétricos Modelo ARX . . . . . . . . . . . . . . . . . . . . . . Modelo ARMAX . . . . . . . . . . . . . . . . . . . . Modelo NARX . . . . . . . . . . . . . . . . . . . . . Modelo NARMAX . . . . . . . . . . . . . . . . . . . 2.2.4 Seleção da estrutura . . . . . . . . . . . . . . . . . . . . . . 2.2.4.1 Taxa de redução de erro . . . . . . . . . . . . . . . 2.2.4.2 Critério de informação de Akaike . . . . . . . . . . 2.2.5 Estimação de parâmetros . . . . . . . . . . . . . . . . . . . . 2.2.5.1 Método de mínimos quadrados . . . . . . . . . . . 2.2.6 Meta-heurísticas . . . . . . . . . . . . . . . . . . . . . . . . 2.2.6.1 Meta-heurísticas aplicadas à seleção de estrutura . . Algoritmo Genético . . . . . . . . . . . . . . . . . . Otimização por enxame de partículas . . . . . . . . . Algoritmo do morcego . . . . . . . . . . . . . . . . . 2.2.7 Validação do modelo . . . . . . . . . . . . . . . . . . . . . . 2.2.7.1 Simulação . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. 7 7 7 8 9 11 11 11 12 12 13 13 14 16 16 17 17 18 19 21 21 22 27 27. Metodologia 3.1 Descrição do algoritmo de identificação . . . . . . . . . . . . . . . 3.1.1 Obtenção dos dados de identificação . . . . . . . . . . . . . 3.1.2 Determinação do conjunto de termos candidatos . . . . . . 3.1.3 Seleção de estrutura e estimação dos parâmetros do modelo 3.1.4 Simulação e validação do modelo identificado . . . . . . . .. . . . . .. . . . . .. 28 28 30 30 30 33. 3. 1. vi. . . . . ..

(16) 4. 5. Estudos de caso 4.1 Aquecedor elétrico . . . 4.1.1 Modelos obtidos 4.2 Conversor buck . . . . . 4.2.1 Modelos obtidos 4.3 Válvula pneumática . . . 4.3.1 Modelos obtidos Conclusão. Referências bibliograficas. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. 34 34 36 40 42 44 47 50 51.

(17) Capítulo 1 Introdução. A crescente necessidade por produtos de melhor qualidade e pelo emprego eficiente de recursos e matéria-prima acarreta em um perceptível aumento da complexidade dos processos de produção. Este aumento impõe maiores restrições ao processo ao mesmo tempo que demanda por sistemas mais eficazes, sendo o conhecimento da dinâmica fundamental para se alcançar um bom desempenho do conjunto. Coelho e Coelho (2015) definem o conceito de sistemas dentro da área de controle de processos como um objeto ou uma coleção de objetos que realizam certo objetivo e cujas propriedades pretende-se estudar. Os autores ainda citam alguns exemplos como: sistemas de fabricação de papel ou cerâmica, planta solar, circuito elétrico, servomecanismo de posição, sistema biológico ou econômico, manipulador robótico, reator, coluna de destilação, laminador, trocador de calor, refinaria, entres outros. Sendo possível representar a dinâmica por meio de modelos matemáticos que auxiliam no entendimento e facilitam a resolução de problemas relacionados ao processo. A representação de sistemas e fenômenos por modelos matemáticos constitui um desafio. Desde a antiguidade, o homem tem procurado maneiras de descrever sistemas matematicamente, de modo a permitir maior entendimento acerca da dinâmica observada nestes processos e, dessa forma, buscar métodos eficazes de solucionar diversos problemas existentes (AGUIRRE, 2015). O modelo de um sistema é uma equação matemática utilizada para responder a questões sobre o sistema sem a realização de experimentos (através de um modelo pode-se calcular ou decidir como o sistema comporta-se sob determinadas condições operacionais). A utilização do modelo para simulação do sistema constitui-se um procedimento de baixo custo e seguro para experimentar o sistema. Entretanto, a validade (adequação) dos resultados de simulação depende da qualidade do modelo matemático do sistema (COELHO; COELHO, 2015). Geralmente, as técnicas de modelagem são divididas em dois grupos: a modelagem através das leis física que descrevem o processo, também conhecida por modelagem caixa branca, e a identificação do modelo a partir de observações do processo, chamada modelagem caixa preta. Ljung (1999) cita alguns trabalhos cujos autores descrevem os processos a partir das leis físicas, os quais são: Wellstead (1979) que promove a valorização dos métodos de modelagem de sistemas estabelecendo uma compreensão intuitiva dos sistemas de enge-.

(18) CAPÍTULO 1. INTRODUÇÃO. 2. nharia; Ljung e Glad (1994) demonstram como a modelagem pela física ou por experimentos pode ser aplicada em diversas situações práticas de modelagem; Close et al. (2002) apresentam metodologias de análise e modelagem para uma variedade de sistemas dinâmicos, independente da sua origem física. As técnicas de identificação de sistemas são bastante utilizadas para determinar modelos matemáticos a partir dos dados de entrada e saída do processo. Por meio desses modelos, é possível obter uma aproximação satisfatória do comportamento dinâmico do sistema para uma determinada aplicação dentro de faixas limitadas de operação. Segundo Aguirre (2015), a identificação de sistemas é uma área do conhecimento que estuda maneiras de modelar e analisar sistemas a partir de observações, ou seja, de dados. Uma das primeiras menções à identificação de sistemas é feita por Lotfali A. Zadeh. O autor explica que identificação: (. . . ) é a determinação de um sistema, com base nas observações dos dados de entrada e saída, dentro de uma classe específica de sistemas no qual o sistema em teste é equivalente. (ZADEH, 1962) Vale ressaltar que necessariamente não existe um modelo que reproduza com exatidão o comportamento de um sistema, de maneira que não existe apenas um modelo para determinado sistema, mas diversos modelos possíveis (DANTAS, 2013). Graças aos significativos avanços tecnológicos e a facilidade de se coletar dados dos processos, a identificação de sistemas é utilizada nas mais diversas áreas do conhecimento humano, desde a engenharia elétrica até a medicina. Por exemplo, podemos citar os seguintes trabalhos: Arahal et al. (2008) aplicam a uma planta solar, Ling et al. (2012) utilizam em um sistema eletro-hidráulico, os autores Alsharif e Hölzel (2016) usam na área de robótica, Rattanawaorahirunkul et al. (2016) e Hahn et al. (2012) aplicam em processos químicos, Zhang et al. (2016) e Ghasemi et al. (2011) na área de telecomunicações, Contreras et al. (2012) em sistema hidráulicos, e Choo et al. (2012) em sistemas biológicos. A identificação de sistemas é constituída basicamente de quatros etapas: i) coleta de dados experimentais, ii) determinação da estrutura do modelo, iii) estimação de parâmetros e iv) validação do modelo. Nas segunda e terceira etapas existem diferentes métodos que podem ser aplicados. Para a estimação dos parâmetros do modelo, o Método de Mínimos Quadrados (MMQ) é o algoritmo mais conhecido. Geralmente, esse método possui fácil implementação e alta robustez. Entretanto, desde que não haja modificações, sua aplicação é limitada a modelo lineares nos parâmetros. Na deternimação da estrutura do modelo destacam-se o uso da função de correlação e a técnica denominada Erro Reduction Ratio (ERR), ou simplesmente taxa de redução do erro. Como exemplo, temos os trabalhos de Aguirre et al. (1998), Cassini (1999) e Rodrigues (1996). Fu e Li (2013) classificam a identificação de sistemas em métodos clássicos e métodos modernos, relacionando-os com a identificação de sistemas lineares e não-lineares, respectivamente. Os autores também explicam que os métodos clássicos são baseados principalmente nos algoritmos do MMQ, função de correlação e ERR. Já os métodos modernos se utilizam das técnicas de Redes Neurais Artificiais (RNAs), Lógica Fuzzy, Algoritmos Genéticos (GAs), entre outros..

(19) CAPÍTULO 1. INTRODUÇÃO. 3. Para exemplificar a aplicação dos métodos modernos podemos citar: Narendra e Parthasarathy (1990) e Kosmatopoulos et al. (1995) que realizam identificação por meio de RNAs; Takagi e Sugeno (1985) e Rovatti e Guerrieri (1996) que aplicam lógica fuzzy no processo de identificação; os autores Cho e Wang (1996) combinam RNAs com lógica fuzzy, ou seja, identificação Neuro-Fuzzy. Nos últimos 40 anos, novos tipos de algoritmos de otimização surgiram. Esses algoritmos tentam combinar métodos heurísticos básicos de forma eficaz na exploração de um espaço de busca. Hoje em dia estes algoritmos são chamados de meta-heurísticas (BLUM; ROLI, 2003). O termo meta-heurística foi primeiro citado por Glover (1986), deriva da composição de duas palavras gregas, heurística que vem do verbo heuriskein que significa “encontrar”, enquanto o sufixo meta significa “acima de, em um nível superior”. Recentemente, a aplicação de meta-heurísticas tem obtido considerável sucesso como alternativa aos métodos clássicos de identificação. Por exemplo podemos citar os seguintes trabalhos: Iwasaki et al. (2005) utilizam o algoritmo genético para estimar a ordem, o ganho, os polos e os zeros de uma função de transferência responsável por representar um sistema mecatrônico; os autores Wada e Sugie (2009) identificam os valores da constante de tempo e do ganho do motor, além do comprimento e da massa do pêndulo de um crane system através da otimização por enxame de partículas; Luh e Wu (1999) realizam a seleção da estrutura de um modelo Nonlinear Auto-Regressive eXogenous (NARX), bem como os seus parâmetros por meio de algoritmo genético; em Deng (2009) a identificação é feita a partir da estimação dos parâmetros e da combinação de sub-modelos utilizando otimização por enxame de partículas. Uma meta-heurística pode ser entendida como um conjunto de conceitos usados para auxiliar métodos heurísticos que serão aplicados para diferentes problemas. Em outras palavras, uma meta-heurística deve ser vista como um algoritmo de estrutura geral que pode ser aplicado para diversos problemas de otimização e que com um número relativamente baixo de modificações adequar-se a problemas mais específicos (BLUM; ROLI, 2003). As meta-heurísticas apresentam-se como uma opção aos métodos conhecidos como algoritmos exatos, que garantem encontrar a solução ótima para um determinado problema desde que não lhe sejam impostas limitação de tempo no processo de busca e, consequentemente, demandam um alto esforço computacional. Na literatura existem diversas meta-heurísticas. Podemos classificá-las em dois grupos: não-inspiradas na natureza e inspiradas na natureza, e subdividir o segundo grupo em algoritmos evolutivos, algoritmos baseados em inteligência de enxame, algoritmos baseados em fenômenos naturais e leis físicas. Todos os grupos e subgrupos podem ser caracterizados em termos de seu princípio de funcionamento, conceitos nos quais foram inspiradas, e suas estratégias de intensificação/diversificação. Estratégias de intensificação estão relacionadas com o uso da experiência acumulada durante a busca, já as estratégias de diversificação com a exploração do espaço de busca. O quadro a seguir apresenta algumas meta-heurísticas organizadas pelo ano de apresentação..

(20) CAPÍTULO 1. INTRODUÇÃO. 4. Tabela 1.1: Lista de meta-heurísticas Ano 1975 1983 1986 1986 1989 1992 1995 1997 1999 2001 2002 2002 2005 2006 2007 2007 2008 2008. Nome Genetic Algorithm (GA) (HOLLAND, 1975) Simulated Annealing (SA) (KIRKPATRICK et al., 1983) Tabu Search (TS) (GLOVER, 1986) Artificial Immune Systems (AIS) (FARMER et al., 1986) Memetic Algorithms (MA) (MOSCATO, 1989) Ant Colony Optimization (ACO) (COLORNI et al., 1991) Particle Swarm Optimization (PSO) (EBERHART et al., 1995) Differential Evolution (DE) (STORN; PRICE, 1997) Bayesian Optimization Algorithm (BOA) (PELIKAN et al., 1999) Harmony Search (HS) (GEEM et al., 2001) Bacterial Foraging Optimization (BFO) (PASSINO, 2002) Artificial Fish-Swarm Algorithm (AFSA) (LI et al., 2002) Artificial Bee Colony (ABC) (KARABOGA, 2005) Big-Bang Big-Crunch Optimization Algorithm (BB-BC) (EROL; EKSIN, 2006) Cat Swarm Optimization (CSO) (CHU; TSAI, 2007) Imperialist Competitive Algorithm (ICA) (ATASHPAZ-GARGARI; LUCAS, 2007) Biogeography-Based Optimization (BBO) (SIMON, 2008) Monkey Algorithm (MA) (ZHAO; TANG, 2008). Tradução literal Algoritmo Genético Recozimento Simulado Busca Tabu Sistemas Imunológicos Artificiais Algoritmos Meméticos Otimização por Colônia de Formigas Otimização por Enxame de Partículas Evolução Diferencial Algoritmo de Otimização Bayesiana Busca Harmônica Otimização por Forrageamento Bacteriano Algoritmo de Cardume Artificial de Peixes Colônia Artificial de Abelhas Algoritmo de Otimização por Big-Bang Big-Crunch Otimização por Enxame de Gatos Algoritmo Competitivo Imperialista Otimização Baseada em Biogeografia Algoritmo do Macaco.

(21) CAPÍTULO 1. INTRODUÇÃO. 2009 2009 2009 2010 2010 2010 2010 2012 2012 2012 2013 2013 2014 2014 2014 2016. Firefly Algorithm (FA) (YANG, 2009) Gravitational Search Algorithm (GSA) (RASHEDI et al., 2009) League Championship Algorithm (LCA) (KASHAN, 2009) Bat Algorithm (BA) (YANG, 2010) Cuckoo Search (CS) (YANG; DEB, 2010) Chemical-Reaction Optimization (CRO) (LAM; LI, 2010) Firework Algorithm (FA) (TAN; ZHU, 2010) Differential Search Algorithm (DSF) (CIVICIOGLU, 2012) Flower Pollination Algorithm (FPA) (YANG, 2012) Mine Blast Algorithm (MBA) (SADOLLAH et al., 2012) Black Hole Algorithm (BH) (HATAMLOU, 2013) Swine Influenza Models Based Optimization (SIMBO) (PATTNAIK et al., 2013) Spider Monkey Optimization (SMO) (BANSAL et al., 2014) Grey Wolf Optimizer (GWO) (MIRJALILI et al., 2014) Artificial Raindrop Algorithm (ARA) (JIANG et al., 2014) Whale Optimization Algorithm (WOA) (MIRJALILI; LEWIS, 2016). 5. Algoritmo do Vaga-lume Algoritmo de Busca Gravitacional Algoritmo de Liga de Campeonato Algoritmo do Morcego Busca Cuco Otimização por Reação Química Algoritmo de Fogos de Artifício Algoritmo de Busca Diferencial Algoritmo de Polinização de Flores Algoritmo de Explosão de Minas Algoritmo do Buraco Negro Otimização Baseada em Modelos de Gripe Suína Otimização do Macaco-Aranha Otimização do Lobo Cinza Algoritmo de Gotas Artificiais de Chuva Algoritmo de Otimização da Baleia. Como explicado anteriormente, as meta-heurísticas podem ser aplicadas a uma grande quantidade de problemas, desde que sejam feitas as alterações necessárias para cada caso específico. Grande parte dos trabalhos que realizam identificação de sistemas através de meta-heurísticas, na verdade, estão apenas estimando os parâmetros de um modelo cuja estrutura já é conhecida, em outras palavras, não realizam a etapa de seleção de estrutura do modelo. Isso acontece em parte devido a questões relacionadas à representação do problema, ou seja, como a meta-heurística será capaz de interpretar as possíveis estruturas de modelos para o sistema em teste..

(22) CAPÍTULO 1. INTRODUÇÃO. 6. Nos trabalhos de Iba et al. (1995), Rodriguez-Vazquez et al. (1997) e Patelli e Ferariu (2009) é proposta uma abordagem para identificação de sistemas através de programação genética adaptativa aplicada a busca em árvores para estruturas de modelos dinâmicos. Por meio da combinação de regressores e operadores {+,∗} são criadas estruturas compactas, ou modelos, capazes de representar o comportamento dinâmico do sistema a ser identificado. Geralmente, essas estruturas são apresentadas em formato de árvores ou em uma cadeia de caracteres, sendo sua conversão em modelos matemáticos realizada de modo rápido e simples. Neste trabalho, em alternativa aos métodos clássicos, que como dito anteriormente utilizam a função de correlação e ERR, foi proposto um algoritmo de identificação de sistemas dinâmicos não lineares baseado em meta-heurística para a seleção de estruturas de modelos matemáticos. O próximo capítulo apresenta conhecimentos teóricos que fundamentam o desenvolvimento deste trabalho, fornecendo maiores detalhes sobre o processo de identificação de sistemas e as meta-heurísticas usadas. No Capítulo 3 são expostos o algoritmo de identificação de sistemas não lineares baseado em meta-heurística e a metodologia utilizada no decorrer do trabalho. O Capítulo 4 descreve os estudos de casos aplicados ao algoritmo de identificação e os resultados obtidos pelas meta-heruísticas. Por fim, no Capítulo 5 são feitas algumas considerações finais, propondo melhorias para o algoritmo desenvolvido e apresentando perspectivas futuras para o trabalho..

(23) Capítulo 2 Fundamentação Teórica. Neste capítulo serão apresentados conceitos e definições importantes para sua compreensão. Serão abordados sistemas lineares e não lineares, assim como identificação de sistemas e sua representação por meio de modelos matemáticos. Além disso, será mostrado como as meta-heurísticas podem ser usadas na identificação de sistemas.. 2.1. Sistemas. Um sistema é constituído por componentes interconectados, os quais são caracterizados por sua relação terminal (entrada/saída), podendo ser parte de um equipamento ou apenas um conjunto de componentes de um equipamento que funcione de maneira integrada, com o objetivo de realizar determinada operação (LATHI, 2007; OGATA, 2003). Para representar o comportamento dinâmico do sistema, ou seja, a sua evolução temporal, podemos utilizar modelos matemáticos. Um modelo matemático de um sistema físico é um análogo matemático que representa algumas das características observadas em tal sistema (AGUIRRE, 2015).. 2.1.1. Sistemas lineares e não lineares. Um sistema é linear se as propriedades de aditividade e de homogeneidade são satisfeitas. A propriedade da aditividade informa que para um sistema linear, se uma entrada x1 é aplicada isoladamente e possui o efeito y1 , e se uma entrada distinta x2 também é aplicada isoladamente e possui o efeito y2 , então, quando as duas entradas atuarem conjuntamente no sistema (x1 + x2 ), o efeito resultante será y1 + y2 . Consequentemente, se x1 −→ y1. e. x2 −→ y2. (2.1). então, para todo x1 e x2 x1 + x2 −→ y1 + y2. (2.2). A propriedade de homogeneidade, ou escalonamento, afirma que se uma entrada é aumentada k vezes, sendo k um número real ou imaginário, o seu efeito também aumentará k vezes. Desse modo, se x −→ y.

(24) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 8. então para todo k real ou imaginário kx −→ ky. (2.3). A combinação dessas duas propriedades é conhecida como propriedade de superposição, a qual é explicada como mostrado logo abaixo. Se, x1 −→ y1. e. x2 −→ y2. então para todos os valores das constantes complexas k1 e k2 , k1 x1 + k2 x2 −→ k1 y1 + k2 y2. (2.4). Uma das motivações de utilizar sistemas lineares é simplificar a obtenção do modelo. Em algumas aplicações, aproximações lineares são suficientes. Porém, em determinados casos, modelos lineares acarretam em desempenho insatisfatório, portanto as representações não lineares são mais adequadas. Rigorosamente falando, os sistemas lineares não existem na prática, uma vez que todos os sistemas físicos são não lineares de alguma forma (GOLNARAGHI; KUO, 2012). Optar por modelos não lineares traz como consequência um aumento na complexidade dos métodos a serem usados. Entretanto, modelos não lineares produzem certos regimes dinâmicos que modelos lineares não conseguem representar, como ciclos limite, bifurcações, regimes quasi periódicos e caóticos, histerese e zona morta (AGUIRRE, 2015). Na seção seguinte serão apresentadas, brevemente, as etapas do processo de identificação e algumas representações matemáticas não lineares comumente usadas.. 2.2. Identificação de sistemas dinâmicos. Fundamentalmente, a identificação de sistemas consiste na determinação de um modelo matemático que represente os aspectos essenciais do sistema, caracterizado pela manipulação dos sinais de entrada e saída (ISERMANN; LACHMANN; LJUNG, 1985, 1999 apud COELHO; COELHO, 2015). Outra definição é dada por Aguirre (2015), que explica a identificação de sistemas como a área do conhecimento que estuda e desenvolve técnicas e algoritmos para obter (identificar) modelos de sistemas dinâmicos a partir de dados gerados pelo próprios sistema. Os modelos de processos industriais, por exemplo, podem ser obtidos por meio do tratamento de medidas (procedimento estatístico, filtragem de dados) coletadas a partir de uma realização experimental para uma utilização particular, como diagnóstico, supervisão, otimização e/ou controle. Para fins de controle de processos, não se pretende encontrar um modelo matemático exato, mas um modelo adequado para uma determinada aplicação (COELHO; COELHO, 2015). Esses modelos podem ser caracterizados, no processo físico, pela função de transferência, para sistemas lineares; e modelos polinomiais, por exemplo, para sistemas não lineares, com os polinômios não lineares sendo funções lineares nos parâmetros, o que permite a utilização dos algoritmos de estimação de parâmetros lineares para modelos.

(25) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 9. não lineares (AGUIRRE, 2015). Um esquema de identificação é ilustrado através de blocos pela Figura 2.1 abaixo: Figura 2.1: Procedimento para identificação de processos.. Fonte: Modificado de Coelho e Coelho (2015). Geralmente, a identificação é realizada em quatro passos: coleta de dados experimentais, determinação da estrutura, estimação de parâmetros e validação do modelo (Figura 2.2).. 2.2.1. Coleta de dados experimentais. A identificação de sistemas baseia-se em dados de entrada e saída medidos no sistema que se deseja modelar. Tais dados são denominados dados de identificação e são obtidos através da medição simultânea da resposta do sistema y(k) a uma excitação na entrada u(k), pré-determinada. A qualidade do modelo obtido estará diretamente relacionada com as características do sinal de excitação. O modelo só reproduzirá as características do sistema que tiverem sido adequadamente excitadas pelo sinal de entrada (CORRÊA, 1997). É necessário que o sinal de entrada u(k) consiga excitar o sistema em todas as faixas de frequências de interesse de forma a revelar as características dinâmicas e estáticas do sistema (AGUIRRE, 2015; DANTAS, 2013). Nos métodos de identificação determinísticos e estocásticos, os sinais de excitação comumente aplicados são ondas quadradas, senoides, sinais binários pseudo aleatórios (Pseudo Random Binary Signal - PRBS) e ruídos brancos ou Gaussianos (sinais aleatórios cujo espectro tem a mesma potência em todas as frequências) (CORRÊA, 1997; DANTAS, 2013). Para sistemas não-lineares, nos quais variações da amplitude do sinal de entrada podem provocar mudanças qualitativas no comportamento do mesmo, é necessário projetar um perfil de amplitudes para os sinais de teste, de forma a garantir que todas as não linearidades presentes no sistema sejam visitadas (AGUIRRE; BILLINGS, 1995 apud CORRÊA, 1997).

(26) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 10. Figura 2.2: Etapas do procedimento básico de identificação.. Fonte: Modificado de Dantas (2013). Outro fator importante, no caso de modelos discrestos no t, é a determinação adequada do tempo de amostragem. Sua influência afeta a seleção da estrutura, a estimação dos parâmetros e a eficácia do modelo em representar características importantes do sistema. Os dados obtidos na experimentação do sistema devem ser processados por filtros passabaixas, a fim de que o falseamento dos sinais amostrados seja evitado. O espectro de frequências de um sinal amostrado corresponde ao espectro do sinal original no intervalo −2/Ts ≤ f ≤ 2/Ts , onde Ts é o tempo de amostragem e 2/Ts é a chamada de frequência de Nyquist. As componentes de altas frequências que estejam superpostas ao sinal original irão aparecer como componentes de baixas frequências no sinal amostrado, distorcendo o espectro de frequência deste (RODRIGUES, 1996; CORRÊA, 1997). Aguirre e Billings (1995) estudaram a importância da determinação correta do tempo de amostragem e perceberam que os dados precisam ser amostrados em intervalos de tempo adequados, ou seja, pequenos o suficiente, de modo que todas as frequências de interesse sejam visitadas pelo conjunto de dados, com o cuidado para que não sejam pequenos demais, prejudicando assim, o desempenho do algoritmo de estimação de parâmetros. Além disso, algumas interações não lineares só aparecerão e serão reproduzidas se a taxa de amostragem for suficientemente alta..

(27) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 2.2.2. 11. Determinação do modelo. Há várias formas de classificar técnicas de modelagem. Uma delas agrupa os métodos em três categorias denominadas modelagem caixa branca, modelagem caixa preta e modelagem caixa cinza (AGUIRRE, 2015): • Modelagem caixa branca - também conhecida como modelagem pelas leis físicas do processo ou natureza do processo, ou modelagem conceitual, requer um conhecimento a priori do sistema e das leis físicas que o caracterizam. Normalmente, os parâmetros de tais modelos possuem interpretação física; • Modelagem caixa preta - há pouco ou nenhum conhecimento a priori do sistema, de forma que apenas um projeto de sinal de entrada é feito, com o objetivo de observar o comportamento da saída do sistema. Por fim, a identificação do modelo acontece pelos dados coletados da entrada e saída do processo. Os parâmetros do modelo geralmente não possuem significado físico; • Modelagem caixa cinza - está localizada entre a modelagem caixa branca e modelagem caixa preta. Este tipo de modelagem utiliza informações auxiliares que os dados coletados durante a identificação não são capazes de demonstrar. A quantidade de informação auxiliar irá caracterizar a modelagem como mais “clara” ou mais “escura”. Dependendo dessa quantidade de informação prévia os parâmetros poderão ter (ou não) interpretação física.. 2.2.3. Métodos paramétricos. Os métodos paramétricos baseiam-se em estruturas matemáticas parametrizadas utilizadas para caracterizar o comportamento dinâmico do sistema no domínio do tempo. Os parâmetros dessas estruturas matemáticas são determinados por algoritmos de estimação a partir dos dados de entrada e saída coletados do sistema. Geralmente, os modelos mais usados na identificação de sistema são ARX, ARMAX, NARX e NARMAX, como é explicado por Aguirre (2015). 2.2.3.1. Representações discretas para métodos paramétricos. Existem representações matemáticas que são especialmente adequadas à identificação de sistemas usando-se algoritmos conhecidos para a estimação de parâmetros. Considere o seguinte modelo geral: B(q) C(q) u(k) + v(k) F(q) D(q) B(q) C(q) y(k) = u(k) + v(k) F(q)A(q) D(q)A(q) y(k) = G(q)u(k) + H(q)v(k). A(q)y(k) =. (2.5). sendo q−1 o operador de atraso (ou retardo), de forma que y(k)q−1 = y(k − 1), v(k).

(28) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 12. representa um ruído branco e A(q), B(q), C(q), D(q) e F(q) são os polinômios a seguir: A(q) B(q) C(q) D(q) F(q). = 1 − a1 q−1 − . . . − any q−ny , = b1 q−1 + . . . + bnu q−nu , = 1 + c1 q−1 + . . . + cnv q−nv , = 1 + d1 q−1 + . . . + dnd q−nd , = 1 + f1 q−1 + . . . + fn f q−n f. (2.6). As funções G(q) e H(q) normalmente são referidas com as funções de transferência do processo e do ruído, respectivamente. Modelo ARX O modelo autorregressivo com entradas externas (ARX do inglês AutoRegressive with eXogenous inputs) pode ser obtido a partir do modelo geral (Equação 2.5), tomando-se C(q) = D(q) = F(q) = 1, sendo A(q) e B(q) polinômios arbitrários, resultando em: A(q)y(k) = B(q)u(k) + v(k) (2.7) O modelo anterior pode ser reescrito da seguinte forma: y(k) =. 1 B(q) u(k) + v(k) A(q) A(q). (2.8). o que coloca em evidência as funções de transferência do sistema G(q) = B(q)/A(q) e de ruído C(q)/[D(q)A(q)] = 1/A(q), conforme pode ser visto na Figura 2.3a. Modelo ARMAX O modelo autorregressivo com média móvel e entradas exógenas (ARMAX do inglês AutoRegressive Moving Average with eXogenous inputs) pode ser obtido a partir do modelo geral (Equação 2.5), tomando-se D(q) = F(q) = 1 e A(q), B(q) e C(q) polinômios arbitrários, resultando em A(q)y(k) = B(q)u(k) +C(q)v(k). (2.9). B(q) C(q) u(k) + v(k) A(q) A(q) y(k) = G(q)u(k) + e(k). (2.10). ou, alternativamente, y(k) =. sendo e(k) um ruído não branco, conforme pode ser constatado na Figura 2.3b..

(29) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 13. Figura 2.3: Representação esquemática dos modelos ARX e ARMAX.. (a) Modelo ARX.. (b) Modelo ARMAX.. Fonte: Modificado de Aguirre (2015). Modelo NARX Os modelos NARX (do termo em inglês Nonlinear AutoRegressive with eXogenous inputs) são modelos discretos no tempo que explicam o valor da saída y(k) em função de valores prévios dos sinais de saída e de entrada, ou seja, y(k) = f [y(k − 1), . . . , y(k − ny ), u(k − τd ), . . . , u(k − nu )], sendo que ny e nu são as ordens de y(·) e u(·), e τd o atraso de transporte (AGUIRRE, 2015). É uma prática comum a inclusão de termos de ruído e(·) no modelo. Aguirre (2015) alerta sobre a importante consideração que nenhum termo cujo parâmetro tenha que ser estimado pode depender de e(k). De modo que o modelo NARX é representado por (COELHO et al., 2002): y(k) = f [y(k − 1), . . . , y(k − ny ), u(k − τd ), . . . , u(k − nu )] + e(k). (2.11). f é uma função não conhecida a priori. Modelo NARMAX O modelo NARMAX (do inglês Nonlinear AutoRegressive Moving Average with eXogenous inputs), geralmente representado pela forma abaixo: y(k) = f [y(k − 1), . . . , y(k − ny ), u(k − τd ), . . . . . . , u(k − nu ), e(k), e(k − 1), . . . , e(k − ne )]. (2.12). sendo e(·) é o ruído e ne é a ordem do ruído no modelo. f é uma função não linear qualquer, que normalmente não tem sua forma conhecida a priori, de modo que, para reconstruir a dinâmica do sistema utilizam-se aproximações. Possíveis aproximações para a função f são os modelos polinomiais e racionais. Um modelo polinomial NARMAX sem atraso puro de tempo tem a forma (AGUIRRE, 2015): ny. nu. ne. y(k) = ∑ ci ∏ y(k − j) ∏ u(k − r) ∏ e(k − q) i. j=1. r=1. (2.13). q=0. em que a parte de média móvel (MA) é composta por todos os termos que contêm a variável de ruído e(·)..

(30) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 14. Os modelos racionais são constituídos pela razão entre dois polinômios, como mostrado a seguir: ny. y(k) =. n. n. u e u(k − r) ∏q=1 e(k − q) ∑i ci ∏ j=1 y(k − j) ∏r=1. d. y u e 1 + ∑i di ∏ j=1 y(k − j) ∏dr=1 u(k − r) ∏dq=1 e(k − q). (2.14). Os modelos racionais quando comparados aos modelos polinomiais podem ter um desempenho mais eficiente em modelar certos sistemas, devido a sua estrutura mais flexível. É importante observar que nas Equações 2.13 e 2.14 o produtório não se trata de um produtório convencional, no qual se realiza o produto de todos os termos, mas, nesse caso, um produtório seletivo, em que o número de termos do produto cresce gradualmente. Desse modo, é possível o modelo conter termos lineares, como y(·), u(·) e e(·), e termos não lineares. Há diversas representações além das apresentadas anteriormente, como, por exemplo, aquelas baseadas em inteligência artificial: Redes Neurais Artificiais (MARTINS et al., 2015), Neuro-Fuzzy (ARAUJO JÚNIOR, 2014; LINHARES, 2015), ANFIS Modificado (MARTINS, 2015). Em Pearson (1999) é realizada uma ligação entre comportamento qualitativo observado e possíveis estruturas de modelo. Esses comportamentos são listados na Tabela 2.1. Tabela 2.1: Formas de comportamento qualitativo não linear. Abreviação. Classe de comportamento qualitativo. HARM SUB ASYM IDS SSM CHAOS HOM PHOM SL. geração harmônica a partir de entradas senoidais geração subarmônica a partir de entradas senoidais respostas assimétricas a entradas simétricas estabilidade dependente da entrada multiplicidade em estado estacionário respostas caóticas a entradas simples comportamento homogêneo não linear comportamento positivo-homogêneo não linear comportamento estático-linear não linear. Pearson (1999) também afirma que todos os comportamentos apresentados na Tabela 2.1 podem ser representados pela classe do modelo NARX.. 2.2.4. Seleção da estrutura. A seleção da estrutura apropriada é uma etapa fundamental no processo de identificação. Tem como objetivo determinar a estrutura mais simples capaz de reproduzir as características dinâmicas de um sistema. Geralmente, ao avaliarmos o modelo de um sistema observamos a sua ordem. A necessidade de se escolher um valor adequado para a.

(31) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 15. ordem de um sistema pode ser apreciada verificando-se que, se a ordem usada for (muito) menor do que a ordem efetiva do sistema real, o modelo não possuirá a complexidade estrutural necessária para reproduzir a dinâmica do sistema. Por outro lado, se a ordem do modelo for muito maior do que a necessária, a estimação de parâmetros será provavelmente malcondicionada (AGUIRRE, 2015). A seleção da estrutura pode ocorrer em duas fases: 1. definição dos termos que podem compor o modelo; 2. quais termos, dentre os definidos, comporão o modelo. O número de termos para representar a dinâmica do sistema deve ser suficientemente pequeno para se evitar instabilidade numérica, provocada por sobreparametrização (AGUIRRE; BILLINGS, 1995). Outra consequência da sobreparametrização é a presença de regimes dinâmicos espúrios, ou seja, regimes dinâmicos que não fazem parte do sistema original. Por exemplo, o número de termos possíveis em modelos polinomiais cresce bastante com o aumento do grau de não linearidade l 1 e da ordem ny , nu e ne do modelo, como pode ser observada na Equação 2.15. De fato, esse número pode ser determinado através da seguinte expressão (KORENBERG et al., 1988 apud CORRÊA, 1997): nθ = M + 1 M = ∑li=1 ni (2.15) ni−1 (ny + nu + ne + i − 1) , n0 = 1 ni = i onde nθ é o número de termos (de processo e de ruído) no modelo, de modo que o valor de nθ pode se tornar impraticavelmente grande para modelos polinomiais. Outro problema é a quantidade de combinações de termos possíveis, cujo o valor é igual a 2ny +nu +ne − 1. Apesar de o número de termos possíveis em modelos polinomiais ser bastante elevado, geralmente, um número pequeno dos mesmos é o suficiente para representar adequadamente a dinâmica do processo. As técnicas de seleção da estrutura de um modelo podem ser agrupadas em duas categorias principais, denominadas construtiva e eliminativa. Em algumas técnicas, a estrutura inicial do modelo é um conjunto vazio e em cada passo seguinte o termo mais importante entre todos os candidatos é anexado ao modelo. Tais técnicas podem ser chamadas de construtivas desde que “construam” a estrutura do modelo gradualmente a cada passo. Por outro lado, existem abordagens nas quais um modelo experimental é construído e subsequentemente os termos menos importantes do modelo são eliminados. Portanto, estas podem ser chamadas de técnicas eliminativas (AGUIRRE, 1994). No âmbito da identificação de sistemas, existem diversos procedimentos que permitem estimar a ordem de modelos dinâmicos a partir de dados medidos (AGUIRRE et al., 1998). Entre os mais usados estão a taxa de redução do erro e o critério de informação de Akaike. Estas estratégias permitem a detecção de quais parcelas do modelo são mais 1l. representa o número máximo de regressores que podem compor um agrupamento do modelo. Por exemplo, se l = 2 o modelo pode conter agrupamentos do tipo Ωy , Ωu , Ωyu , Ωy2 e Ωu2 ..

(32) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 16. relevantes para serem incluídas e quais podem ser consideradas desprezíveis (DANTAS, 2013). Além desses métodos, outros algoritmos não convencionais podem ser usados, como exemplo, a aplicação de algoritmos genéticos para seleção de termos em modelos NARMAX estudada por Fonseca et al. (1993). Neste trabalho será investigada a utilização de meta-heurísticas na seleção dos termos de modelos paramétricos do tipo NARX. As meta-heurísticas escolhidas são: algoritmo genético, otimização por enxame de partículas e método do morcego. O algoritmo de seleção de estrutura baseado nas meta-heurísticas será descrito após a apresentação do método de estimação de parâmetros. 2.2.4.1. Taxa de redução de erro. A taxa de redução do erro (Error Reduction Ratio - ERR) é um critério utilizado na detecção de estrutura de modelos polinomiais. O ERR indica a porção da variância da saída explicada pela inclusão de um novo termo no modelo, ou seja, o ERR de cada termo candidato é um número que informa a melhoria obtida na representação do sistema através da sua inclusão no modelo. Dessa forma é possível ordenar os termos candidatos de acordo com a contribuição de cada um. O algoritmo ERR gera uma lista em ordem decrescente com os termos e suas contribuições na identificação do sistema (AGUIRRE et al., 1998; RODRIGUES, 1996; CORRÊA, 1997). Entretanto, o ERR é um critério estatístico e não apresenta relações claras com aspectos dinâmicos do sistema a ser modelado. Além disso, o desempenho do ERR cai com o aumento do ruído nos dados de identificação (AGUIRRE et al., 1998). 2.2.4.2. Critério de informação de Akaike. O Critério de Informação de Akaike (1974) (Akaike’s Information Criterion - AIC), é um dos métodos mais tradicionais, e mais utilizados, para estimar a quantidade de termos em modelos dinâmicos. De acordo com o critério de informação de Akaike, para se obter o número ótimo de termos deve-se minimizar a função de custo dada pela expressão abaixo: AIC(nθ ) = N ln[σ2erro (nθ )] + 2nθ. (2.16). onde N é o valor do comprimento dos dados coletados, σ2erro é a variância dos resíduos e nθ é o número de parâmetros no modelo. A função de custo de Akaike possui duas parcelas: a primeira parte da Equação 2.16 quantifica a diminuição da variância dos resíduos resultante da inclusão do novo termo e a segunda parte representa o custo de inserir um novo termo no modelo, ou seja, estabelece um compromisso entre a qualidade do ajuste aos dados de identificação e a procura por representações parcimoniosas (DANTAS, 2013; AGUIRRE et al., 1998). O uso de AIC(nθ ) obviamente pressupõe que existe uma ordem predefinida para incluir os termos candidatos sequencialmente no modelo. No caso de modelos não lineares polinomiais, essa ordem entre os termos possíveis pode ser definida através do critério do ERR (AGUIRRE, 2015; AGUIRRE et al., 1998)..

(33) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 2.2.5. 17. Estimação de parâmetros. Definida a estrutura do modelo, o passo seguinte será a estimação de seus parâmetros. Há uma gama de algoritmos usados na estimação de parâmetros de modelos matemáticos. Neste trabalho será utilizado o método de mínimos quadrados. 2.2.5.1. Método de mínimos quadrados. Karl Friedrich Gauss desenvolveu o método de mínimos quadrados (MMQ) em 1795, para prever a trajetória de planetas e cometas a partir de observações realizadas. De acordo com Aguirre (2015), o método de mínimos quadrados é um dos mais conhecidos e mais utilizados nas mais diversas áreas de ciência e tecnologia. A partir do método, é possível estimar os parâmetros que descrevem o modelo. ˆ como: Definindo-se o vetor de parâmetros estimados, θ,   θˆ 1 θˆ   2 θˆ =  .  (2.17)  ..  θˆ n A melhor previsão da saída do sistema, y, ˆ é calculada multiplicando a matriz das ˆ dada pela Equação 2.18: observações, φ, pela estimativa do vetor parâmetros estimados, θ, yˆ = φθˆ. (2.18). Guass estabeleceu que os parâmetros estimados devem ser definidos de modo que a soma dos quadrados da diferença entre os valores observados e os calculados seja mínima. A função custo para o método de mínimos quadrados é dada por: N. JMQ = ∑ ε(i)2. (2.19). i=1. onde, ε(i) = y(i) − y(i), ˆ y é o valor observado da saída, yˆ é o valor estimado da saída, e N é o número de observações, ou seja, o tamanho do vetor dos dados de entrada. De acordo com Aguirre et al. (1998), a estrutura NARMAX pode ser representada como: nθ y(k) = ∑ ϕT (k)θˆ i + ε(k) (2.20) i=1. onde, nθ é o número de termos no modelo, o simbolo “^” sobre θ indica valores estimados, ϕ(k) é o vetor de regressores, ε(k) representa os erros de modelagem, os erros de medição, o ruído aditivo do sistema e incertezas de ordem qualquer. A Equação 2.20 pode ser também representada a partir de sua notação matricial: Y = ΨΘ + Ξ. (2.21).

(34) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 18. considerando que foram realizadas N medições, e que estas sejam suficientes para estimar os parâmetros, tem-se: T Y = y(1) y(2) · · · y(N) .  ϕ2 (1) · · · ϕnθ (1) ϕ2 (2) · · · ϕnθ (2)   .. ..  .. . . .  ϕ1 (N) ϕ2 (N) · · · ϕnθ (N) T Θ = θ1 θ2 · · · θnθ. ϕ1 (1)  ϕ1 (2)  Ψ =  ..  .. T Ξ = ξ(1) ξ(2) · · · ξ(N) onde Ψ é a matriz de regressores, Θ o vetor de parâmetros e Ξ o vetor de resíduos. O estimador dos mínimos quadrados é uma transformação linear sobre Y (função linear das medidas) e, assim, é denominado estimador linear que minimiza a função de custo representada na Equação 2.19 (COELHO; COELHO, 2015). ˆ existe e é única A equação a seguir é denominada equação normal. A sua solução, θ, T desde que a matriz Ψ Ψ, chamada de matriz normal ou matriz de informação, seja simétrica e definida positiva. Para isto, o sistema deve estar persistentemente excitado para evitar o caso de linhas comuns na matriz Ψ (colunas linearmente dependentes) (COELHO; COELHO, 2015). θˆ = [ΨT Ψ]−1 ΨT Y. 2.2.6. (2.22). Meta-heurísticas. As meta-heurísticas são uma classe dos métodos de otimização numérica, por isso devemos primeiro entender o que são estes métodos. Os métodos de otimização numérica são rotinas matemáticas/computacionais que consistem na busca de uma solução ótima ou um conjuntos de soluções para uma determinada função ou conjuntos de funções. Eles são separados em dois grupos: • Determinísticos, baseados em gradientes ou derivadas, ou ainda em aproximações destas; • Heurísticos, também conhecidos como naturais, que são aleatórios. A principal diferença entre esses grupos é que nos métodos determinísticos prevê-se todos os seus passos conhecendo um ponto de partida, ou seja, a resposta será a mesma para o mesmo ponto inicial; nos métodos heurísticos a escolha do próximo passo é feita a partir de números aleatórios, de modo que, para um mesmo ponto inicial podemos encontrar diferentes respostas finais..

(35) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 19. Estes grupos se dividem em subgrupos; no caso dos métodos heurísticos eles são: • • • • •. de Construção; de Busca de Vizinhança; Sistemáticas; Híbridas; Meta-heurísticas.. Meta-heurísticas utilizam uma combinação de escolhas aleatórias e o histórico de resultados passados encontrados pelo método para realizar buscas na vizinhança dentro do espaço de pesquisa, assim minimizando possíveis paradas em ótimos locais. É importante notar que a meta-heurística é o processo de orientação, ela norteia o calculo dos próximos possíveis movimentos. Já a heurística proporciona o processo de seleção, ou seja, possibilita determinar quais movimentos serão executados dentre os sugeridos pelo processo de orientação. De acordo com Osman e Laporte (1996), uma meta-heurística é um processo de geração iterativo que guia uma heurística subordinada, combinando, inteligentemente, conceitos diferentes para explorar os espaços de pesquisa, usando estratégias de aprendizagem para estruturar as informações, a fim de encontrar de forma eficiente soluções próximas do ideal. 2.2.6.1. Meta-heurísticas aplicadas à seleção de estrutura. A aplicação de meta-heurísticas na seleção de estrutura de modelos matemáticos pode ser entendida como um problema de representação. Geralmente, as meta-heurísticas trabalham com números decimais, binários ou outra base qualquer. Porém, diferentes representações podem ser usadas, como cadeia de caracteres, conjunto de regras, entre outras. Neste trabalho, as bases binária e decimal foram as bases escolhidas. A partir do tipo do modelo e dos valores das ordens e do grau de não linearidade (se for o caso) é gerado o conjunto de regressores possíveis, consideramos como sendo termos candidatos a compor o modelo. Para a meta-heurística a inclusão ou não do termo será definido pelos números 0 e 1. O número 0 indica que o termo não pertence à estrutura do modelo, o número 1 informa o contrário, ou seja, o termo pertence à estrutura do modelo. Dessa forma, existirá um vetor de números binários com comprimento igual ao número de termos candidatos responsável por informar quais termos farão parte da estrutura do modelo. A meta-heurística será responsável por gerar e recalcular esse vetor binário. Como dito anteriormente, cada diferente vetor representa uma possível estrutura de modelo para o sistema que se deseja identificar. No final a técnica escolherá a estrutura mais adequada. Porém, dependendo de características operacionais da meta-heurística aplicada é necessário utilizar números inteiros positivos x, sendo necessárias as conversões decimalbinário e binário-decimal no processo da seleção de estrutura. O valor x deve pertencer ao intervalo entre o número 1 e o valor 2nθ − 1, onde nθ é o número termos candidatos. Assim, garante-se que ao converter x para a base binária o vetor resultante possar selecionar qualquer um dos regressores possíveis..

(36) CAPÍTULO 2. FUNDAMENTAÇÃO TEÓRICA. 20. Vejamos o seguinte exemplo, para um sistema que se deseja identificar com modelo tipo ARMAX (l = 1) e valores de ordens igual a ny = nu = 3 e ne = 2. Obtemos o total de 8 termos candidatos, como mostra a tabela abaixo: Tabela 2.2: Termos candidatos modelo ARMAX (ny = nu = 3 e ne = 2). Regressores e(k − 2) e(k − 1) u(k − 3) u(k − 2) u(k − 1) y(k − 3) y(k − 2) y(k − 1) Nesse caso o valor máximo de x é igual a 25510 ou 111111112 . Se a meta-heurística informa que o número 22110 (110111012 ) é a solução para o sistema hipotético do exemplo anterior, significa que os termos e(k −2), e(k −1), u(k −2), u(k −1), y(k −3), y(k −1) foram escolhidos para compor a estrutura do modelo. O Quadro 2.3 apresenta a conversão decimal-binária e os regressores escolhidos para o exemplo da Tabela 2.2. Já o Quadro 2.4 nos mostra a estrutura dos modelos obtidos a partir dos valores de x para o Quadro 2.3. Quadro 2.3: Conversão decimal-binária e regressores selecionados. Regressores e(k − 2) e(k − 1) u(k − 3) u(k − 2) u(k − 1) y(k − 3) y(k − 2) y(k − 1). x 29. 138. 75. 81. 0 0 0 1 1 1 0 1. 1 0 0 0 1 0 1 0. 0 1 0 0 1 0 1 1. 0 1 0 1 0 0 0 1. Quadro 2.4: Valores de x e a estrutura de seus respectivos modelos. x. Modelo. 29 138 75 81. y(k) = θ1 y(k − 1) + θ2 y(k − 3) + θ3 u(k − 1) + θ4 u(k − 2) y(k) = θ1 y(k − 2) + θ2 u(k − 1) + θ3 e(k − 2) y(k) = θ1 y(k − 1) + θ2 y(k − 2) + θ3 u(k − 1) + θ4 e(k − 1) y(k) = θ1 y(k − 1) + θ2 u(k − 2) + θ3 e(k − 1). no qual θi representa o valor do parâmetro associado ao regressor i do modelo. Deve-se observar que durante a execução da meta-heurística cada integrante do conjunto das possíveis soluções, ou possíveis estruturas, tem seus parâmetros estimados pelo MMQ. Logo em seguida, os parâmetros obtidos são validados e um valor de desempenho é associado à possível solução. Tanto a etapa de validação do modelo quanto de avaliação das possíveis soluções serão explicadas nas seções seguintes..