• Nenhum resultado encontrado

ESTIMAÇÃO DE MODELOS LPV USANDO MÁQUINA DE SUPORTE VETORIAL

N/A
N/A
Protected

Academic year: 2021

Share "ESTIMAÇÃO DE MODELOS LPV USANDO MÁQUINA DE SUPORTE VETORIAL"

Copied!
9
0
0

Texto

(1)

ESTIMAÇÃO DE MODELOS LPV USANDO MÁQUINA DE SUPORTE

VETORIAL

Marcelo Mendes Lafetá Lima 1; Rodrigo Alvite Romano 2 1

Aluno de Iniciação Científica da Escola de Engenharia Mauá (EEM/CEUN-IMT);

2

Professor da Escola de Engenharia Mauá (EEM/CEUN-IMT).

Resumo. Os modelos lineares com parâmetros variantes no tempo (LPV), são eficientes para descrever não-linearidades e sistemas variantes no tempo. Neste trabalho é descrito um algoritmo de identificação de modelos LPV usando máquinas de suporte vetorial. Esta técnica é usada para aprender a dependência entre os coeficientes do modelo e um sinal variante no tempo que caracteriza o ponto de operação do modelo. O algoritmo utilizará o estimador de variáveis instrumentais, que permite a obtenção de estimativas consistentes para condições gerais de ruído nos dados experimentais. O algoritmo ofereceu bons resultados sendo capaz de reduzir a variância das estimações para uma situação genérica de ruído nos dados. Também foi possível reduzir o viés do estimador para situações em que a dinâmica do ruído é mais rápida do que a dinâmica da planta. Introdução

A necessidade por técnicas de identificação cada vez mais robustas tem crescido com o avanço da capacidade de processamento e a busca por representações mais fiéis dos fenômenos observados. Porém, parte majoritária dos fenômenos industriais são tanto não lineares quanto ruidosos, o que justifica o uso de algoritmos de alta complexidade para sua identificação. Modelos de identificação de sistemas LPV (linear parameter-varying) são comumente vistos como eficientes abordagens para identificação de não linearidades e de sistemas variantes no tempo. Os modelos LPV apresentam relações lineares como os LTI (linear time-invariant), porém seus parâmetros são funções de uma variável mensurável variante no tempo denominada variável de comutação (𝑝𝑘).

Muitos trabalhos demonstram a eficiência da técnica de regressão Support Vector Machine (SVM) para identificação de sistemas a partir de modelos LPV. Como descrito em [1] o algoritmo de identificação SVM se torna polarizado para sistemas com ruído branco na saída. Em [1] este problema é amenizado com o uso de filtros bi-dimensionais para sistemas em que o ruído é branco na saída, eliminando a polarização da máquina de suporte vetorial. Porém a premissa de que o ruído nos dados é branco se distancia da realidade.

A técnica de variáveis instrumentais já é consagrada para identificação de casos em que a natureza do ruído não é especificada ([2], [3] e [4]). Em [2] a técnica de variáveis instrumentais é utilizada para o tratamento de modelos com ruído colorido na saída, mostrando resultados efetivos na eliminação da polarização do estimador. O uso da técnica de variáveis instrumentais implementada junto a técnica LS-SVM (least-squares support vector machine) [4], gera um estimador sem polarização, porém, como visto em [5], com variância nos resultados maior que a técnica LS-SVM. Por mais que o estimador fique com maior representatividade devido a eliminação da polarização, uma alta variância não é aceitável.

Com o objetivo de desenvolver um estimador não polarizado para ruído colorido na saída e com a variância dos resultados reduzida, neste trabalho desenvolve-se um modelo em espaços de estados aplicando a máquina de suporte vetorial, juntamente com a filtragem bi-dimensional elaborada em [1] e a técnica de variáveis instrumentais descrita em [2]. O algoritmo aqui desenvolvido é denominado IV-filter.

(2)

Material e Métodos Problema proposto

Dado o sistema de tempo discreto representado em espaços de estados

𝑥𝑘+1 = (𝐴 + 𝐿(𝑝𝑘))𝑥𝑘+ 𝐵(𝑝𝑘)𝑢𝑘 (1)

𝑦𝑘 = 𝐶𝑥𝑘 (2)

em que 𝑥𝑘 ∈ ℝ𝑛𝑥 representa o vetor de estados, 𝑢𝑘 ∈ ℝ𝑛𝑢 as entradas do sistema, 𝑦𝑘 ∈ ℝ a saída e 𝑝𝑘: ℤ → ℝ𝑛𝑝 , chamada de variável de comutação, é conhecida e depende do ponto de operação. As matrizes 𝐴 e 𝐶 são constantes e escolhidas de forma arbitrária desde que o par (𝐴, 𝐶) seja observável e os autovalores da matriz 𝐴 sejam estáveis. As matrizes 𝐿(𝑝𝑘) e 𝐵(𝑝𝑘) são definidas através de funções de base 𝑓𝑟 arbitrárias que assumem valores de acordo com 𝑝𝑘

𝐿(𝑝𝑘) = ∑𝑛𝑓 𝐿𝑟𝑓𝑟(𝑝𝑘)

𝑟=1 ,

𝐵(𝑝𝑘) = ∑𝑛𝑟=1𝑓 𝐵𝑟𝑓𝑟(𝑝𝑘). Em que 𝐿𝑟 e 𝐵𝑟 são pesos dados as funções de base.

Visto 𝑛𝑥 como a ordem de regressão do modelo apresentado, tem-se que 𝐴 pode ser composta da seguinte maneira 𝐴 = [ 0 ⋯ 0 −𝛼𝑛𝑥 −𝛼𝑛𝑥−1 𝐼𝑛𝑥−1 ⋮ −𝛼1 ] , (3)

de forma a caracterizar o modelo de regressão, e garantindo que o par (𝐴, 𝐶) seja observável torna-se conveniente para a escolha de parâmetros a matriz 𝐶 na forma

𝐶 = [0 ⋯ 0 1]. (4) Para A ≜ bloco diagonal {𝐴𝑇, … , 𝐴𝑇} ∈ ℝ2𝑛𝑥𝑛𝑓 x 2𝑛𝑥𝑛𝑓 , B ≜ bloco diagonal {𝐶𝑇, … , 𝐶𝑇} ∈ ℝ2𝑛𝑥𝑛𝑓 x 2𝑛𝑓 , 𝐹(𝑝𝑘) ≜ [𝑓1(𝑝𝑘) … 𝑓𝑛𝑓(𝑝𝑘)] 𝑇 ∈ ℝ𝑛𝑓,

e sendo ⨂ o produto de Kronecker, é demonstrado em [1] que o modelo descrito em (1) e (2) pode apresentar um preditor na forma

𝜑𝑘+1 = A 𝜑𝑘+ B ([ 𝑦𝑘

𝑢𝑘] ⨂𝐹(𝑝𝑘))

(5)

𝑦̂𝑘 = 𝜃𝑇𝜑𝑘,

com 𝜃 = vec ( [ 𝐿1 … 𝐿𝑛𝑓 𝐵1 … 𝐵𝑛𝑓]) ∈ ℝ2𝑛𝑥𝑛𝑓 , sendo vec(∙) é o operador que coloca as colunas do argumento uma sobre a outra.

Em [1] é provado a partir da proposição acima que 𝜑𝑘= (𝑞𝐼2𝑛𝑥𝑛𝑓−A )−1 B ([𝑦𝑘 𝑢𝑘] ⨂𝐹(𝑝𝑘)) = 𝑞 𝑛𝑥 𝛼(𝑞)(𝐼2𝑛𝑓⨂[𝑞−𝑛𝑥 … 𝑞−1]𝑇) ([ 𝑦𝑘 𝑢𝑘] ⨂𝐹(𝑝𝑘)), que reescrito assume a forma

𝜑𝑘 = 𝑞𝑛𝑥

𝛼(𝑞) [𝑓1(𝑝𝑘−𝑛𝑥)𝑦𝑘−𝑛𝑥 … 𝑓1(𝑝𝑘−1)𝑦𝑘−1 … 𝑓𝑛𝑓(𝑝𝑘−𝑛𝑥)𝑦𝑘−𝑛𝑥 … 𝑓𝑛𝑓(𝑝𝑘−1)𝑦𝑘−1 𝑓1(𝑝𝑘−𝑛𝑥)𝑢𝑘−𝑛𝑥 … 𝑓1(𝑝𝑘−1)𝑢𝑘−1 … 𝑓𝑛𝑓(𝑝𝑘−𝑛𝑥)𝑢𝑘−𝑛𝑥 … 𝑓𝑛𝑓(𝑝𝑘−1)𝑢𝑘−1]𝑇. Assim

(3)

em que 𝑃 é a matriz de permutação responsável por representar de forma compacta o modelo de regressão e sendo 𝑧𝑘 ≜ [𝑦𝑘 𝑢𝑘]𝑇 𝜙𝑘 ≜ [𝐹𝑇(𝑝𝑘−𝑛𝑥)⨂𝑧𝑘−𝑛𝑥 𝑇 … 𝐹𝑇(𝑝 𝑘−1)⨂𝑧𝑘−1𝑇 ] 𝑇 .

Como demonstrado em [1], é possível determinar o modelo de regressão proposto 𝑌̂ = 𝑞𝑛𝑥

𝛼(𝑞) Φ𝑃𝜃,

(6)

em que 𝛼(𝑞) é o polinômio característico de 𝐴, 𝑌̂ ∈ ℝ𝑁−𝑛𝑥 é o vetor de saída estimado e Φ ∈ ℝ𝑁−𝑛𝑥 x 2𝑛𝑥𝑛𝑓 é um vetor de regressores dado por Φ = [𝜙

𝑛𝑥+1 … 𝜙𝑁] T

. Estimação de parâmetros

Com 𝑌 ∈ ℝ𝑁−𝑛𝑥 sendo a saída conhecida do sistema, descreve-se 𝐸 ∈ ℝ𝑁−𝑛𝑥, como o erro de estimação

𝐸 = 𝑌 − 𝑌̂ = 𝑌 − 𝛼(𝑞)𝑞𝑛𝑥 Φ𝑃𝜃 ; (7) logo, pode-se formular a função custo descrita em [2], 𝐽 ∈ ℝ+, dada por

𝐽 =12 𝜃𝑇𝜃 + 𝛾

2𝑁2‖Γ𝑇𝐸‖22 , (8)

Γ =𝛼(𝑞)1 𝒮, (9)

em que os instrumentos são dados por 𝒮 ∈ ℝ𝑁−𝑛𝑥 x 2𝑛𝑥𝑛𝑓, e Γ ∈ ℝ𝑁−𝑛𝑥 x 2𝑛𝑥𝑛𝑓 é o vetor de instrumentos filtrados. O parâmetro 𝛾 ∈ ℝ representa o valor que atribui peso à relação entre polarização do estimador e variância dos resultados. Sendo que a matriz de instrumentos é determinada na forma 𝒮 = [ ζ𝑛𝑥+1 … 𝜁𝑁 ]𝑇 sendo 𝜁𝑘 ≜ [𝐹𝑇(𝑝 𝑘−𝑛𝑥)⨂ [ 𝑦̂𝑘−𝑛𝑥 𝑢𝑘−𝑛𝑥] … 𝐹𝑇(𝑝𝑘−1)⨂ [𝑦̂𝑢𝑘−1 𝑘−1] ] 𝑇 .

De [2] é possível determinar a seguinte condição de otimização para os parâmetros do modelo, sujeito a (7), 𝜽 ̂ = arg𝜽min 12𝜃𝑇𝜃 +2𝑁𝛾2 ‖ 1 𝛼(𝑞)𝒮 𝑇𝐸‖ 2 2 . (10) Variáveis instrumentais

A técnica de variáveis instrumentais consiste em eliminar a polarização do estimador a partir da substituição das variáveis de regressão do modelo por instrumentos. Tais instrumentos são escolhidos visando minimizar a polarização 𝒃 do estimador. De modo que dado um modelo genérico descrito por 𝒚 = 𝝓𝜽 + 𝒆, estimado por 𝜽̂ = 𝐴𝑏𝒚, em que 𝒚 é a saída do modelo, 𝝓 são os regressores do modelo, 𝜽𝑏 são os parâmetros do modelo, 𝒆 é o ruído presente nos dados e 𝜽̂𝑏 é uma variável aleatória que corresponde aos parâmetros estimados. Tendo 𝐸[ ] como o operador esperança, a polarização, 𝒃, pode ser caracterizada por

𝒃 = lim 𝑁→∞𝐸[𝜽̂] − 𝜽 𝒃 = lim 𝑁→∞𝐸[𝐴𝑏(𝝓𝜽 + 𝒆)] − 𝜽 𝒃 = lim 𝑁→ ∞ 𝐸[𝐴𝑏𝝓𝜽 + 𝐴𝑏𝒆] − 𝜽 𝒃 = lim 𝑁→ ∞ 𝐸[𝐴𝑏𝝓 − 𝐼]𝜽 − 𝐸[𝐴𝑏𝒆]. (11)

(4)

De (11), é possível afirmar que 𝒃 somente é nulo para as situações em que 𝐴𝑏𝝓 = 𝐼, a média 𝐸[𝒆] = 0 e 𝐴𝑏 é descorrelacionada com o ruído 𝒆, o que garante 𝐸[𝐴𝑏𝒆] = 0.

A escolha dos instrumentos baseia-se na determinação da matriz 𝐴𝑏 de forma a garantir a não correlação entre 𝐴𝑏 e o ruído (𝒆). Considerando o estimador como o de mínimos quadrados, é possível determinar 𝐴𝑏 = [𝒮𝑏𝑇𝝓]−1𝒮

𝑏𝑇, onde 𝒮𝑏𝑇 é o vetor de instrumentos, 𝒃 = lim 𝑁→ ∞ [(𝒮𝑏 𝑇𝝓)−1𝒮 𝑏𝑇𝒆] = lim𝑁→ ∞ [(𝒮𝑏𝑇𝝓)−1] lim𝑁→ ∞ [𝒮𝑏𝑇𝒆], 𝒃 = lim 𝑁→ ∞ [(𝒮𝑏 𝑇𝝓)]𝒄, (12)

em que 𝒄 é a matriz de correlação cruzada entre o vetor de instrumentos e o ruído. Vale constatar que o ruído descrito não é a priori branco e, de acordo com (12), a técnica de variáveis instrumentais garante a não polarização do estimador desde que a correlação cruzada entre os instrumentos e o ruído seja nula. Logo é possível validar a escolha de filtragem dos instrumentos em (9) que objetiva descorrelacionar o vetor de instrumentos 𝒮 do ruído presente na saída.

Máquinas de Suporte Vetorial

A fim de resolver (10), desenvolve-se a Lagrangiana, em que 𝜆 ∈ ℝ𝑁−𝑛𝑥 é o vetor multiplicador de Lagrange, ℒ (𝐸, 𝜃, 𝜆) =12𝜃𝑇𝜃 + 𝛾 2𝑁2(𝐸𝑇[ 𝑞𝑛𝑥 𝛼(𝑞)𝒮𝒮𝑇 𝑞 𝑛𝑥 𝛼(𝑞)] 𝐸) − 𝜆𝑇(𝐸 − 𝑌 + 𝑞𝑛𝑥 𝛼(𝑞)Φ𝑃𝜃) , (13) e considerando as condições de Karush-Kuhn-Tucker (KKT)[1] para a Lagrangiana obtém-se

𝜕ℒ 𝜕𝐸= 𝛾 𝑁2 𝑞𝑛𝑥 𝛼(𝑞) 𝒮𝒮𝑇 𝑞 𝑛𝑥 𝛼(𝑞) 𝐸 − 𝜆 = 0, (14) 𝜕ℒ 𝜕𝜃= 𝜃 − 𝑃𝑇𝜃𝑇 𝑞 𝑛𝑥 𝛼(𝑞) 𝜆 = 0, (15) 𝜕ℒ 𝜕𝜆 = 𝐸 − 𝑌 + 𝑞𝑛𝑥 𝛼(𝑞)Φ𝑃𝜃 = 0. (16)

A partir de manipulações algébricas é possível determinar a seguinte relação [𝑁𝛾2𝛼(𝑞)𝑞𝑛𝑥 𝒮𝒮𝑇 𝑞𝑛𝑥 𝛼(𝑞) 𝑞𝑛𝑥 𝛼(𝑞) ΦΦ𝑇 𝑞 𝑛𝑥 𝛼(𝑞)+ 𝐼𝑁−𝑛𝑥] 𝜆 = 𝛾 𝑁2 𝑞𝑛𝑥 𝛼(𝑞) 𝒮𝒮𝑇 𝑞 𝑛𝑥 𝛼(𝑞) 𝑌. (17) Sendo 𝐾𝒮𝒮 = 𝑞𝑛𝑥 𝛼(𝑞) 𝒮𝒮 𝑇 𝑞𝑛𝑥 𝛼(𝑞) e 𝐾𝛷𝛷 = 𝑞𝑛𝑥 𝛼(𝑞) ΦΦ 𝑇 𝑞𝑛𝑥

𝛼(𝑞) , é possível determinar os multiplicadores de Lagrange por 𝜆 = (𝑁12 𝐾𝒮𝒮𝐾𝛷𝛷+𝐼𝑁−𝑛𝑥 𝛾 ) −1 1 𝑁2 𝐾𝒮𝒮𝑌 , (18)

em que as matrizes ΦΦ𝑇 ∈ ℝ𝑁−𝑛𝑥 x 𝑁−𝑛𝑥 e 𝒮𝒮𝑇 ∈ ℝ𝑁−𝑛𝑥 x 𝑁−𝑛𝑥, são desconhecidas. A fim de determinar algo que represente ΦΦ𝑇, o termo da linha 𝑖 e coluna 𝑗 é dado por:

[ΦΦ𝑇] 𝑖,𝑗 = 𝜙𝑖+𝑛𝑥𝑇 𝜙𝑗+𝑛𝑥 [ΦΦ𝑇] 𝑖,𝑗 = (𝐹𝑇(𝑝𝑖)⨂𝑧𝑖𝑇)(𝐹(𝑝𝑗)⨂𝑧𝑗) + (𝐹𝑇(𝑝𝑖+𝑛𝑥−1)⨂𝑧𝑖+𝑛𝑥−1 𝑇 )(𝐹(𝑝 𝑗+𝑛𝑥−1)⨂𝑧𝑗+𝑛𝑥−1) [ΦΦ𝑇] 𝑖,𝑗 = ∑ (𝐹𝑇(𝑝𝑖+𝑚)⨂𝑧𝑖+𝑚𝑇 )(𝐹(𝑝𝑗+𝑚)⨂𝑧𝑗+𝑚) 𝑛𝑥−1 𝑚=0 = ∑ 𝐹𝑇(𝑝 𝑖+𝑚)𝐹(𝑝𝑗+𝑚)𝑧𝑖+𝑚𝑇 𝑧𝑗+𝑚 𝑛𝑥−1 𝑚=0 . Assim, pelo denominado kernel-trick [6], o produto interno 𝐹𝑇(𝑝

𝑖+𝑚)𝐹(𝑝𝑗+𝑚) desconhecido pode ser caracterizado da seguinte forma

[ΦΦ𝑇] 𝑖,𝑗 ≜ ∑ Ψ(𝑝𝑖+𝑚, 𝑝𝑗+𝑚) 𝑧𝑖+𝑚𝑇 𝑧𝑗+𝑚 𝑛𝑥−1 𝑚=0 . (19)

(5)

O termo Ψ(𝑝𝑖, 𝑝𝑗) é uma função de kernel utilizada para representar o produto interno das funções 𝐹𝑇(𝑝

𝑖)𝐹(𝑝𝑗). Com isso, fica claro a necessidade da filtragem bi-dimencional, ou seja, das linhas e colunas da matriz caracterizada pelo produto ΦΦ𝑇, visto que somente é possível representar o produto destas matrizes.

Neste trabalho foram utilizadas as funções de base radial gaussianas devido sua capacidade

de representação, com 𝜎 ∈ ℝ+∗ +

𝑛 𝑚𝑎 𝑎 𝑎 𝑟𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎çã𝑜 𝑑𝑒 ç𝑑𝑢𝑡𝑜 𝑖𝑛𝑡𝑒𝑟𝑛𝑜 𝑑𝑎𝑠 𝑓𝑢𝑛ç𝑡𝑒𝑟𝑛𝑜 𝑝𝑜𝑟55555555555555555555555555555555555555555555555555555555555555555 Ψ(𝑝𝑖, 𝑝𝑗) = exp (− ‖𝑝𝑖−𝑝𝑗‖22

𝜎2 ). (20)

O mesmo pode ser aplicado para o produto interno do vetor de instrumentos 𝒮𝒮𝑇. O par de parâmetros (𝛾, 𝜎) é conhecido como hyper-parâmetros, os quais são determinados de forma livre.

Escolha dos filtros

A partir de (5) é possível perceber que a matriz 𝐴 é responsável pela dinâmica do preditor, sendo assim seus autovalores podem ser capazes de filtrar o ruído dos dados. Com isto, os filtros determinados por 𝛼(𝑞) foram escolhidos a partir da arquitetura dos filtros de Butterworth, como descrito em [1], com

𝑠𝑚 = 𝜔𝑐𝑒𝑗2𝑚+𝑛𝑥−12𝑛𝑥 , (21)

sendo 𝜔𝑐 a frequência de corte do filtro. Para a filtragem bi-dimensional é necessário escolher os autovalores da matriz 𝐴 (3) que fazem a sintonia do filtro responsável por mitigar o efeito do ruído de alta frequência presente nos dados.

A estrutura de 𝛼(𝑞) como os polos do filtro de Butterworth foi utilizada devido ao fato de que 𝜔𝑐 é uma grandeza física intuitiva capaz de trazer informações como a natureza do ruído presente no sistema e características interpretativas do modelo.

Para os valores candidatos de frequência Ω = {𝜔1, … , 𝜔𝑛𝜔}, foi utilizado um processo de otimização sem o uso de derivadas para estimar a frequência de corte do filtro. Para cada frequência foi determinado uma função custo 𝐽(𝜔𝑐) que indica a representatividade do modelo, para 𝜔𝑐 ∈ Ω. A partir da técnica de baricentro [7]

𝜔𝑐= ∑𝑛𝜔𝑣=1𝜔𝑣 𝑒−𝜇 𝐽 (𝜔𝑣) ∑𝑛𝜔 𝑒−𝜇 𝐽 (𝜔𝑣)

𝑣=1 ,

(22)

sendo que 𝑒−𝜇𝐽(𝜔𝑣) é responsável por dar peso maior aos termos de melhor performance. O termo 𝜇 ∈ ℝ+ é usado como peso para controlar os valores da função custo. Para valores altos de 𝜇, mais o baricentro (𝜔𝑐) tende ao valor de Ω que minimiza 𝐽(𝜔

(6)

Resultados e Discussão

É proposta a seguinte planta de resolução relacionada ao Aström system [8], 𝑥𝑘+1 = [𝑎𝑎11(𝑝𝑘) 1 21(𝑝𝑘) 0] 𝑥𝑘+ [ 𝑏1(𝑝𝑘) 𝑏2(𝑝𝑘)] 𝑢𝑘 𝑦𝑘 = [1 0]𝑥𝑘+ 𝑣𝑘 sendo 𝑎11(𝑝𝑘) = 0,35 sinc(𝜋2𝑝 𝑘) + 1,4 𝑎21(𝑝𝑘) = 5𝑝𝑘2− 0,8 𝑏1(𝑝𝑘) = { 1,5 , para 𝑝𝑘 > 0,125 1 + 4𝑝𝑘 , para |𝑝𝑘| ≤ 0,125 0,5 , para 𝑝𝑘 < −0,125 𝑏2(𝑝𝑘) = { 0 , para 𝑝𝑘 > 0,125 0,5 − 4𝑝𝑘 , para |𝑝𝑘| ≤ 0,125 1 , para 𝑝𝑘 < −0,125.

Foram criadas três condições de espectro de ruído: ruído branco determinado por 𝑣𝑜(𝑘) = 𝑒(𝑘), um ruído de banda estreita representado em (23), e um de banda larga em (24),

𝑣1(𝑘) =1−0,6 𝑧1 −1 𝑒(𝑘) , (23) 𝑣2(𝑘) =1−0,9 𝑧1 −1 𝑒(𝑘) . (24)

Produziram-se ensaios de Monte Carlo com 100 rodadas para cada condição de ruído em cada valor de SNR (0, 5, 10, 15 e 20 dB). Foi utilizado um sistema com 𝑁 = 1000 amostras, a entrada 𝑢(𝑘) é um ruído branco binário com média nula e 𝑝(𝑘) = [ 𝑢(𝑘) 𝑦(𝑘) ], o que caracteriza um modelo quasi-LPV. Analisou-se a representatividade de quatro diferentes algoritmos para o sistema descrito: o modelo LS-SVM [1] onde os polos do filtro se encontram na origem do plano Z (não há filtragem); o modelo 2D-filter proposto em [1]; o método IV-SVM, com 𝛼(𝑞) = 1 em (9), referente a abordagem descrita em [4]; e o modelo IV-filter onde os instrumentos são sujeitos ao mecanismo de filtragem.

A planta utilizada é artificial, logo o objetivo não foi de encontrar o modelo que melhor represente os parâmetros 𝑎11, 𝑎21, 𝑏1e 𝑏2, mas sim reproduzir o comportamento da saída sem ruído (𝒚) para uma dada entrada (𝒖). Para avaliar a capacidade assertiva do modelo utilizou-se o critério de best fit rate (BFR), pois retorna a representatividade do modelo a partir dos valores estimados,

BFR(%) = 100 . máx (1 −‖𝑌 − 𝑌̂‖2 ‖𝑌 − 𝑌̅‖2, 0),

(25)

definindo como 𝑌 o vetor de saídas real da planta, 𝑌̂ o vetor de valores estimados pelo modelo e 𝑌̅ a média comum do vetor de saídas real da planta, e de modo que seu complementar

𝐽(𝜔𝑐) = min (

‖𝑌 − 𝑌̂‖2 ‖𝑌 − 𝑌̅‖2, 1)

(26)

é utilizado como função custo para o cálculo da frequência de corte a partir do baricentro (22) para o conjunto de frequências candidatas Ω = {0.05, … , 1.0}𝜋 (rad/s). Para a determinação dos hyper-parâmetros 𝛾 e 𝜎, foi utilizada uma busca em grade com validação cruzada a fim do par ótimo (𝛾∗, 𝜎) que minimiza a função custo (26), para cada um dos modelos abordados. Levando em conta as assertivas descritas foi possível determinar a tabela com os seguintes resultados para cada natureza e intensidade de ruído.

(7)

Tabela 1 - Referente aos valores de BFR e desvio padrão para ruído branco, na forma: BFR (Desvio padrão). Método 𝟎 𝒅𝑩 𝟓 𝒅𝑩 𝟏𝟎 𝒅𝑩 𝟏𝟓 𝒅𝑩 𝟐𝟎 𝒅𝑩 LS-SVM 31.91 (2.51) 39.94 (2.04) 48.05 (2.05) 62.51 (2.06) 79.73 (1.51) 2D-filter 71.44 (3.33) 83.91 (2.27) 91.79 (1.31) 95.34 (0.69) 97.18 (0.37) IV-SVM 30.10 (20.7) 57.82 (19.9) 79.22 (5.39) 88.43 (1.87) 93.00 (1.15) IV-filter 79.25 (3.91) 86.58 (1.78) 91.16 (1.97) 86.40 (2.16) 94.48 (8.70)

Tabela 2 - Referente aos valores de BFR e desvio padrão para ruído de banda larga, na forma: BFR (Desvio padrão). Método 𝟎 𝒅𝑩 𝟓 𝒅𝑩 𝟏𝟎 𝒅𝑩 𝟏𝟓 𝒅𝑩 𝟐𝟎 𝒅𝑩 LS-SVM 43.20 (2.75) 51.05 (2.58) 63.93 (2.55) 80.77 (1.93) 91.58 (1.04) 2D-filter 66.99 (4.56) 80.62 (2.96) 90.06 (1.43) 95.01 (0.75) 97.12 (0.41) IV-SVM 60.83 (15.6) 78.84 (4.35) 87.07 (1.76) 93.05 (1.07) 95.60 (0.63) IV-filter 77.40 (3.82) 84.37 (2.31) 88.55 (1.85) 93.56 (1.30) 95.19 (0.96)

Tabela 3 - Referente aos valores de BFR e desvio padrão para ruído de banda estreita, na forma: BFR (Desvio padrão). Método 𝟎 𝒅𝑩 𝟓 𝒅𝑩 𝟏𝟎 𝒅𝑩 𝟏𝟓 𝒅𝑩 𝟐𝟎 𝒅𝑩 LS-SVM 43.86 (2.97) 65.11 (2.59) 82.53 (1.92) 92.35 (1.07) 96.53 (0.48) 2D-filter 50.95 (4.84) 74.56 (3.18) 87.87 (1.91) 94.73 (0.84) 96.73 (0.42) IV-SVM 74.57 (6.32) 85.67 (2.49) 92.25 (1.24) 95.59 (0.66) 97.29 (0.35) IV-filter 76.77 (5.35) 85.93 (2.43) 91.96 (1.35) 95.50 (0.84) 97.04 (0.54)

A partir das Tabelas 1, 2 e 3, é possível inferir que o método IV-filter apresenta maior acurácia (BFR) para situações com baixo SNR quando comparado com o método 2D-filter. Fica claro que para valores de SNR maiores que 10 dB a abordagem 2D-filter é vantajosa, enquanto que para valores menores que 5 dB o modelo IV-filter é mais propício, devido à relação entre tempo de processamento computacional e representatividade (BFR).

Para os casos de ruído branco (Tabela 1) e ruído de banda larga (Tabela 2) a variância nos resultados diminui do modelo IV-SVM para o modelo IV-filter. Isso se dá devido a filtragem dos instrumentos em (9). Portanto para situações de SNR menores que 5 dB, é possível afirmar que o aumento da variância nos resultados descrito em [5] pôde ser amenizado.

O mesmo não é evidenciado para ruído de banda estreita devido a estrutura do filtro passa-baixas descrito em [1]. A estrutura de filtragem passa-passa-baixas pode eliminar espectros pertencentes à planta na tentativa de eliminar o ruído, sendo necessário o desenvolvimento de outra estrutura de filtragem mais adequada para o problema. O desenvolvimento de um filtro capaz de viabilizar a filtragem de ruídos com dinâmica parecida à da planta acontece em paralelo com este trabalho.

Para casos de banda estreita, a filtragem dos instrumentos não é uma escolha favorável devido a diferença não significativa entre os resultados do modelo 2D-filter e IV-filter. Porém, é possível observar na Tabela 3 que a utilização da técnica de variáveis instrumentais pode ser uma abordagem propícia. Considerando tanto a acurácia quanto a variância dos resultados a técnica de variáveis instrumentais se torna uma interessante abordagem para sistemas em que o ruído é banda estreita.

Afim de ressaltar a vantagem da utilização da abordagem IV-filter, nas Figuras 1, 2 e 3 abaixo, foram montados os histogramas para as situações das Tabelas 1, 2 e 3, respectivamente, em que o valor de SNR vale 0 dB.

(8)

Figura 1 - Histograma dos resultados do modelo para ruído branco com SNR = 0 dB.

Figura 2 - Histograma dos resultados do modelo para ruído de banda larga com SNR = 0 dB.

Figura 3 - Histograma dos resultados do modelo para ruído de banda estreita com SNR = 0 dB.

A partir das figuras, fica evidente a redução de variância existente sobre a técnica de variáveis instrumentais quando a filtragem dos instrumentos é utilizada. Também fica clara a ineficiência da filtragem para os casos em que o ruído é de banda estreita. Logo, a filtragem mostrou-se interessante para situações em que a dinâmica do ruído é mais rápida que a da planta. Já a técnica de variáveis

(9)

instrumentais é eficiente para situações de valores baixos de SNR (alta influência do ruído nos dados), independente da condição de ruído presente nos dados.

Conclusão

Este trabalho apresenta um algoritmo de identificação de sistemas que utiliza a técnica de variáveis instrumentais em que os instrumentos são filtrados pela abordagem descrita em [1]. A técnica busca ser capaz de eliminar a polarização do modelo proposto em [1] em ambientes ruidosos nos quais a natureza do ruído não é necessariamente branca. Foi possível estimar um modelo no espaço de estados, robusto a ruído de natureza genérica na saída. Aplicado em uma planta de simulação, o modelo IV-filter, proposto por este trabalho, possibilitou melhoras tanto de representatividade quanto a redução da variância dos resultados para plantas com ruído colorido na saída. Foram comparados os resultados dos modelos LS-SVM e 2D-filter descritos em [1], o modelo IV-SVM [4] e o modelo IV-filter. A análise dos resultados evidencia que para ruído branco e de banda larga a técnica IV-filter se demonstra eficaz, enquanto para ruído de banda estreita, a utilização do modelo IV-SVM é mais atrativa. Este algoritmo foi implementado para a solução de problemas de flutter na área de aerodinâmica para fins literários revelando bons resultados. É almejado o desenvolvimento de um paper para um congresso internacional de automática, para o qual será mais detalhado o desenvolvimento computacional dos algoritmos. Podem existir desenvolvimentos seguintes a este trabalho que consiste no aumento da liberdade dos filtros, tornando-os variantes no tempo, assim como o aumento da complexidade da estrutura de filtragem.

Referências Bibliográficas

[1] Romano, R.A.; dos Santos, P.L.; Pait, F.; Perdicoúlis, T.A.; Ramos, J. (2016). Machine Learning Barycenter Approach to Identifying LPV State-Space Models. In American Control Conference

(ACC), 6351-6356.

[2] Laurain, V.; Tóth, R.; Piga, D.; Zheng, W.X. (2015). An instrumental least squares support vector machine for nonlinear system identification. In Automatica, 54, 340-347.

[3] Laurain, V. (2012). Nonparametric Identification of LPV Models under General Noise Conditions: An LS-SVM Based Approach. In IFAC Proceedings Volumes, 45(16), 1761-1766. [4] Rizvi, S.Z.; Velni, J.M.; Tóth, R.; Meskin, N. (2015). An IV-SVM-based Approach for Identification of State-Space LPV Models under Generic Noise Conditions. In Decision and Control

(CDC), IEEE,54, 7380-7385.

[5] Laurain, V.; Gilson, M.; Tóth, R.; Garnier, H. (2010). Refined instrumental variable methods for identification of LPV Box-Jenkins models. In Automatica, 46, 959-967.

[6] Vapnik, V. (1998). Statistical Learning Theory. New York: Wiley-Interscience.

[7] Pait, F.; Colón, D. (2014). A barycenter method for direct optimization. In SIAM Conference on Optimization.

Referências

Documentos relacionados

É difícil julgar qual das tecnologias é superior, porém algumas vantagens e desvantagens podem ser citadas como: nos experimentos com cDNA pode haver uma seqüência de DNA fixada

O CES é constituído por 54 itens, destinados a avaliar: (a) cinco tipos de crenças, a saber: (a1) Estatuto de Emprego - avalia até que ponto são favoráveis, as

Este estudo tem como objetivos identificar os níveis de trauma manifestados e de estratégias de coping utilizadas pelos TEPH; caracterizar os incidentes mais

Gráfico 3 – Satisfação com as necessidades de participação no trabalho Fonte: Pesquisa realizada pelo autor no mês de julho de 2016. No nível de participação, também chamado

A revisão realizada por ERDMAN (1988a) mostrou que, nos dezessete experimentos em que a silagem de milho foi a única fonte de volumoso oferecida a vacas leiteiras no início

Dessa forma, a partir da perspectiva teórica do sociólogo francês Pierre Bourdieu, o presente trabalho busca compreender como a lógica produtivista introduzida no campo

forficata recém-colhidas foram tratadas com escarificação mecânica, imersão em ácido sulfúrico concentrado durante 5 e 10 minutos, sementes armazenadas na geladeira (3 ± 1

Discussion The present results show that, like other conditions that change brain excitability, early environmental heat exposure also enhanced CSD propagation in adult rats.. The