• Nenhum resultado encontrado

3.3 O uso de dados com ruído

3.3.2 Exemplo motivacional

Com o propósito de demonstrar as propriedades estatísticas descritas na seção ante- rior, esta seção exibe um exemplo numérico do método VRFT multivariável proposto em (CAMPESTRINI et al., 2016). No exemplo, a metodologia original (estimativa com mínimos quadrados) é comparada com a metodologia por variáveis instrumentais.

Considere o seguinte processo multivariável, também utilizado em exemplos nos tra- balhos (FORMENTIN; SAVARESI, 2011; CAMPESTRINI et al., 2016):

G0(q) =     0,09516 q − 0,9048 0,03807 q − 0,9048 −0,02974 q − 0,9048 0,04758 q − 0,9048     , H0(q) = I. (136)

Deseja-se projetar um sistema de controle que alcance o seguinte modelo de referência: Td(q) =    0,25 q − 0,75 0 0 0,4 q − 0,6   , (137)

o qual garante erro nulo em regime permanente para seguimento de referências do tipo salto e desacoplamento entre as duas malhas. Para posterior comparação, o controlador ideal é calculado por meio de (36):

Cd(q) =     2,012q − 1,902 q − 1 −2,69q + 2,434 q − 1 1,314q − 1,189 q − 1 6,725q − 6,085 q − 1     , (138)

onde percebe-se que o mesmo é um controlador do tipo PI cheio. Como se deseja analisar o caso em que Cd(q) ∈ C, a classe de controladores a ser sintonizada também é escolhida

com esta estrutura, e então:

C(q,ρ) =      ρ0 11q + ρ111 q − 1 ρ0 12q + ρ112 q − 1 ρ021q + ρ121 q − 1 ρ022q + ρ122 q − 1      . (139)

É evidente que no cenário de controle baseado em dados não se conhece G0(q) e Cd(q)

e, assim sendo, a escolha da classe C não pode ser feita desta maneira. Mas, como neste exemplo a prioridade é demonstrar as propriedades estatísticas dos métodos dentro do caso ideal, tal escolha foi assim realizada. Portanto, pela Premissa 2.1, pode-se definir Cd(q) = C(q,ρ0), com ρ0 sendo o vetor de parâmetros ideais:

ρ0 =2,012; −1,902; −2,690; 2,434; 1,314; −1,189; 6,725; −6,085 T

. (140)

Para a coleta de dados e da variável instrumental, dois experimentos em malha aberta foram simulados no processo, com uma entrada do tipo PRBS (Pseudo-Random Binary Sequence) de tamanho N = 500 e amplitude unitária. A variância do ruído branco w(t) foi definida para garantir uma relação sinal ruído de 1,5 para cada saída, ou seja:

SN Ri =

var[y0i]

σ2 wi

= 1,5, (141)

com var[y0i] sendo a variância da saída i sem o efeito do ruído e σ

2

wi a variância do ruído

wi(t) presente nesta saída. Perceba que esta relação é extremamente baixa, o que signi-

fica que existe uma quantidade muito elevada ruído no sistema. Escolheu-se inserir uma quantidade muito elevada de ruído neste sistema para mostrar, de forma mais explícita, as características indesejadas de cada formulação do VRFT. Cabe destacar, porém, que se fosse determinada uma menor quantidade de ruído, estas características teriam menor efeito, ou seja, a qualidade das estimativas seria melhor em cada cenário. Também, vale ressaltar que o filtro F (q) empregado no exemplo foi F (q) = Td(q)[I − Td(q)], seguindo

Para aferir as propriedades das técnicas propostas na literatura, 500 rodadas de simu- lações Monte Carlo foram executadas com diferentes realizações do ruído. A cada rodada os dados de entrada e saída foram coletados e os parâmetros do controlador foram sin- tonizados conforme as formulações original e com variável instrumental do VRFT (foi utilizada a variável instrumental baseada em dados de um segundo experimento). Três diferentes critérios foram avaliados nesta análise:

(i) As distribuições da função custo Jy(ρ) observadas;

(ii) As respostas no tempo dos sistemas em malha fechada a uma referência do tipo salto;

(iii) Projeções do elipsoide que representa um intervalo de confiança de 95% para as estimativas;

Os dois primeiros critérios mostram o efeito das estimativas nos sistemas em malha fe- chada, que é o principal aspecto a ser avaliado no contexto de controle. O último, por sua vez, está relacionado com a qualidade das estimativas em si.

Primeiramente, se analisa o critério mais importante para a técnica aqui estudada, o Jy(ρ). A partir dos parâmetros obtidos em cada rodada, o mesmo foi calculado como

Jy( ˆρ) = N

X

t=1

||[T (q,ˆρ) − Td(q)]r(t)||22, (142)

onde r(t) foi definido como um vetor de dois saltos unitários: r1(t) ocorrendo no instante

t = 1 e r2(t) ocorrendo em t = 101, com um total de N = 200.

A Figura 4 demonstra as distribuições de Jy( ˆρ) observadas nas rodadas de Monte

Carlo por meio de diagramas de caixa (ou boxplots, do inglês). Nesses diagramas, a linha central em vermelho representa a mediana das observações, a caixa em azul representa o intervalo entre 25% e 75% das amostras, enquanto as linhas pretas pontilhadas se es- tendem até os valores mais extremos que não são considerados discrepantes. O símbolo ‘+’ em vermelho é usado para caracterizar as amostras mais discrepantes e os valores +x, no topo do diagrama, mostram quantas amostras ficaram acima do valor máximo que o gráfico compreende.

Um ponto importante a destacar nos diagramas de caixa é que os casos discrepantes não são considerados nos cálculos da mediana, da caixa e dos valores mais extremos. Tal ponto é importante pois no cenário do VRFT com VI, muitos sistemas ficaram instáveis e, portanto, apresentaram valores muito elevados para a função custo. Contudo, cabe ressaltar que nestes casos, tais custos foram considerados discrepantes e, portanto, não influenciaram no cálculo da mediana nem nos limites dos diagramas de caixa.

A Figura 4 mostra que a mediana do critério Jy(ρ) para o VRFT com MQ apresentou

valor de 17,3 e foi mais elevada se comparada ao VRFT com variáveis instrumentais, cuja mediana foi de 5,7. Claramente, a mediana é mais elevada no caso de VRFT com MQ devido ao erro de polarização que ocorre neste técnica, que se propaga para o desempenho em malha fechada e causa comportamentos distintos daqueles especificados em Td(q).

Por outro lado, é possível verificar que a elevada covariância das estimativas que resul- tam da técnica de variáveis instrumentais também acaba se refletindo nas funções objetivo Jy(ρ). Pode-se notar, por exemplo, que o maior custo medido pelo diagrama de caixa foi

MQ VI 0 5 10 15 20 25 30 35 Jy (ˆρ ) +10 +89

Figura 4: Comparação dos custos Jy( ˆρ) para o VRFT com mínimos quadrados (MQ) e o

VRFT com variável instrumental (VI).

elevado. Já nos valores de Jy(ρ) resultantes de estimativas com MQ, a covariância é subs-

tancialmente menor. Neste caso, o maior valor medido pelo diagrama de caixa foi de 26,83, além de que somente 21 valores foram considerados discrepantes.

Outro fator analisado neste exemplo e que demonstra de forma concreta o efeito de cada técnica no VRFT é a resposta no tempo dos sistemas em malha fechada. Para compará-las, em cada rodada o sistema foi simulado com o controlador obtido e com a referência definida acima para o cálculo de Jy( ˆρ). A Figura 5 exibe as respostas em ma-

lha fechada para os 500 controladores estimados utilizando o VRFT com MQ. Na figura, a linha preta representa o comportamento desejado e as linhas azuis os comportamentos atingidos.

Observando as respostas obtidas, é possível verificar que, na média, o comportamento transitório foi mais lento e com maior sobrepasso do que o especificado em Td(q). Ainda,

um ponto fundamental a ser destacado é que nenhum dos sistemas resultantes foi levado à instabilidade.

Por outro lado, na Figura 6 é exibido o comportamento dos 500 sistemas em malha fechada alcançados com a técnica de variáveis instrumentais. Novamente, as linhas pre- tas representam o comportamento desejado, as linhas azuis representam as respostas de sistemas estáveis, enquanto as linhas vermelhas representam as respostas de sistemas que ficaram instáveis com o controlador estimado.

Ao observar a figura, nota-se que em alguns casos a resposta desejada foi atingida, ao contrário da metodologia com MQ. Porém, uma grande desvantagem que pode ser verificada é a grande variância das respostas, efeito que chega a instabilizar o sistemas em algumas situações. De forma mais precisa, constatou-se que 14,2% dos casos resultaram em sistemas instáveis.

Por fim, uma análise da qualidade das estimativas observadas nas rodadas de Monte Carlo foi desenvolvida, reforçando as propriedades já estudadas. Para tanto, o primeiro passo foi calcular os elipsoides de 8 dimensões que representam um intervalo de confiança de 95% das estimativas. Visto que é difícil realizar alguma comparação gráfica baseada

Figura 5: Comparação das respostas em malha fechada nas 500 rodadas de Monte Carlo - VRFT com mínimos quadrados.

no elipsoide, o mesmo foi projetado nos planos P11 = ρ011 × ρ111, P12 = ρ012 × ρ112,

P21 = ρ021× ρ121 e P22 = ρ022× ρ122. A Figura 7 demonstra as projeções dos elipsoides

nos planos P11 (a) e P12 (b). A Figura 8 mostra as projeções no plano P21, onde foi

necessário detalhar a imagem (Figura 8-b) para tornar visível a projeção da elipse relativa à formulação com mínimos quadrados. A Figura 9 exibe as projeções no plano P22, onde

também foi incluído um detalhamento maior, exposto na Figura 9-b.

Nas figuras, o símbolo ‘*’ em vermelho representa o ponto dos parâmetros ideais no plano respectivo, enquanto o símbolo ‘+’ em preto denota a média atingida com a estimativa por MQ e o símbolo ‘’ denota a média atingida com a estimativa por VI. A elipse em azul representa a projeção do elipsoide relativo às estimativas com MQ e a elipse em laranja representa a projeção do elipsoide relativo à técnica de VI.

Ao observar as figuras, conclui-se que as propriedades estatísticas de cada formula- ção foram ratificadas no exemplo. As estimativas obtidas por mínimos quadrados apre- sentaram uma polarização significativa, enquanto as obtidas com a técnica das variáveis instrumentais foram praticamente não polarizadas (nota-se a presença de uma pequena po- larização, mas que pode ser explicada pelo número limitado de rodadas de Monte Carlo e de dados usados na sintonia). Ainda, constata-se que as projeções relativas à técnica das variáveis instrumentais resultaram em elipses muito maiores, o que representa a alta covariância das estimativas desta técnica.

A partir do exemplo, com a análise de diferentes critérios, é possível verificar as pro- priedades de cada metodologia do VRFT e, principalmente, suas consequências nos sis- temas de controle resultantes. Fica claro que ao utilizar o VRFT pela formulação de mínimos quadrados, o usuário obtém estimativas polarizadas de ρ0e, consequentemente,

desempenhos em malha fechada distintos daqueles desejados. Também, nota-se que uti- lizando a técnica de variáveis instrumentais, elimina-se o problema da polarização. Con- tudo, o exemplo também mostra a grande desvantagem desta metodologia: a covariância extremamente elevada das estimativas. É possível verificar que esta propriedade também prejudica o comportamento dos sistemas de controle em algumas situações, e pode até

Figura 6: Comparação das respostas em malha fechada nas 500 rodadas de Monte Carlo - VRFT com variáveis instrumentais.

resultar em sistemas instáveis.

Assim, a grande motivação deste trabalho é evidenciada: as propriedades das esti- mativas fornecidas pelas formulações padrão do VRFT MIMO são muito pobres quando o ruído é significativo no processo e acabam, por conseguinte, degradando o desempe- nho dos sistemas em malha fechada de forma considerável. Por isto, o principal objetivo da dissertação é aprimorar estas propriedades ao incluir regularização na formulação do VRFT MIMO com VI.

3.4

Considerações finais

Este capítulo introduziu ao leitor as formulações padrão, já existentes e consolidadas na literatura, do método de controle baseado em dados conhecido como VRFT. Inicial-

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 ρ110 -4 -3.5 -3 -2.5 -2 -1.5 -1 -0.5 0 ρ11 1 ρ0 Média ρ MQ Média ρ VI Elipse IC 95% MQ Elipse IC 95% VI (a) Plano P11 -10 -5 0 5 ρ120 -4 -2 0 2 4 6 8 ρ12 1 ρ0 Média ρ MQ Média ρ VI Elipse IC 95% MQ Elipse IC 95% VI (b) Plano P12

-10 -5 0 5 10 15 ρ210 -12 -10 -8 -6 -4 -2 0 2 4 6 8 ρ21 1 ρ0 Média ρ MQ Média ρ VI Elipse IC 95% MQ Elipse IC 95% VI (a) Plano P21 0 0.5 1 1.5 2 ρ210 -1.6 -1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 ρ21 1 ρ0 Média ρ MQ Média ρ VI Elipse IC 95% MQ Elipse IC 95% VI (b) Zoom no plano P21

Figura 8: Projeções dos elipsoides no plano P21para cada técnica.

-30 -20 -10 0 10 20 30 40 ρ 22 0 -30 -20 -10 0 10 20 ρ22 1 ρ0 Média ρ MQ Média ρ VI Elipse IC 95% MQ Elipse IC 95% VI (a) Plano P22 -5 0 5 10 ρ 22 0 -8 -6 -4 -2 0 2 4 ρ22 1 ρ0 Média ρ MQ Média ρ VI Elipse IC 95% MQ Elipse IC 95% VI (b) Zoom no plano P22

Figura 9: Projeções dos elipsoides no plano P22para cada técnica.

mente, a Seção 3.1 descreveu o VRFT monovariável, primeiro a surgir na literatura e mais acessível para a compreensão de suas características. Foi explicada a principal ideia do método, que consiste em reescrever o problema de otimização do critério Jy(ρ), em

um problema de identificação do controlador ideal, onde minimiza-se o critério JV R(ρ).

Mostrou-se, por meio da aplicação do Teorema de Parseval nas funções custo, que dentro da situação ideal a otimização dos dois critérios resulta no mesmo mínimo. Ainda, em uma análise similar, mostrou-se que fora do caso ideal o filtro F (q) deve ser projetado como F (q) = Td(q)[1 − Td(q)] com o objetivo de aproximar as duas funções.

Na sequência, a Seção 3.2 discutiu a formulação multivariável do método VRFT. Pri- meiramente, foi apresentada a formulação mais primitiva e restritiva, e as condições para que a mesma fosse, de fato, uma extensão multivariável do método. Em seguida, a for- mulação mais recente e mais coerente foi apresentada, na qual se mantém-se a ideia de reescrever o critério de otimização de Jy(ρ) em um critério de identificação do controlador

ideal. Ainda nesta seção, foi realizado um procedimento equivalente ao da seção anterior para mostrar que o mínimo dos critérios coincide no caso ideal. Tal procedimento também forneceu uma escolha de viés prático para o projeto do filtro F (q) no caso não ideal, que se resume a uma extensão do projeto do filtro monovariável: F (q) = Td(q)[I − Td(q)].

Na Seção 3.3 o problema de utilizar dados com ruído no VRFT foi abordado de forma genérica, ou seja, válido para as formulações SISO e MIMO. Foram discutidas as propri- edades das estimativas de ρ0 com a formulação original (MQ), enfatizando que a mesma

possui uma deficiência: o erro de polarização. Assim, como alternativa, mostrou-se a pro- posta de utilizar a técnica das variáveis instrumentais. Suas propriedades também foram discutidas e sua principal desvantagem também foi destacada: o elevado erro de covari- ância.

Finalmente, um exemplo demonstrando as propriedades citadas foi desenvolvido. No exemplo, verificou-se que a baixa qualidade das estimativas de MQ e VI se propaga para o desempenho dos sistemas em malha fechada, degradando-o de forma significativa em relação ao desempenho desejado. Dessa forma, ficou evidente a motivação do trabalho, que busca aprimorar as propriedades do VRFT MIMO com VI, reduzindo o erro de co- variância, de forma análoga ao que foi desenvolvido em (RALLO et al., 2016). Espera-se que, com isto, também sejam aprimorados os resultados em malha fechada.

4

IDENTIFICAÇÃO DE SISTEMAS COM REGULARIZA-

ÇÃO

Neste capítulo será apresentado o estado da arte do problema de identificação de sis- temas com regularização, com o intuito de introduzir as principais ideias por trás desta ferramenta e que são fundamentais para sua posterior aplicação no método VRFT. Logo, é interessante que o leitor esqueça, por um breve momento, o problema de controlar o pro- cesso descrito em (1) e considere o problema de identificação do mesmo. O problema de identificar o controlador ideal, como é proposto no VRFT, ainda não é levado em consi- deração, visto que possui características um pouco diferentes. Este assunto será abordado no próximo capítulo do trabalho.

Apesar de ser uma ferramenta já conhecida na comunidade de identificação de sis- temas, a regularização ganhou bastante destaque nos últimos anos em virtude dos tra- balhos inovadores expostos em (PILLONETTO; DE NICOLAO, 2010; PILLONETTO; CHIUSO; DE NICOLAO, 2011), que mostram uma perspectiva Bayesiana para identifi- car a resposta ao impulso de sistemas dinâmicos. Esta perspectiva tem sido amplamente utilizada e desenvolvida na comunidade de Machine Learning.

Inspirado por estes trabalhos os artigos (CHEN; OHLSSON; LJUNG, 2012; PILLO- NETTO et al., 2014) trazem esta perspectiva de forma mais acessível para a comunidade de controle e identificação, relacionando-a com técnicas de identificação de modelos pa- ramétricos e fornecendo ideias para a regularização com base em informações a priori observadas sobre o sistema, como, por exemplo, a estabilidade e característica exponen- cial da resposta ao impulso. A grande ideia explorada em (CHEN; OHLSSON; LJUNG, 2012; PILLONETTO et al., 2014) é estimar a resposta ao impulso de sistemas monova- riáveis através de modelos do tipo FIR de alta ordem, adicionando uma regularização do tipo L2 no problema. Com isto, os autores mostram que é possível gerenciar de forma

mais adequada o compromisso entre polarização e covariância que surge neste tipo de problema, minimizando uma grandeza que é composta por estas duas medidas: a matriz de Mean Square Error (MSE).

Dessa forma, para contextualizar o problema, a Seção 4.1 apresenta a metodologia clássica de identificação de sistemas dinâmicos, enfatizando o caso de modelos do tipo FIR. A solução do problema, por meio do conhecido método dos mínimos quadrados ponderados, também é brevemente apresentada, assim como as propriedades destas esti- mativas. Já na Seção 4.2 uma extensão para a identificação com regularização de sistemas multivariáveis é exposta. Primeiramente, se introduz o método dos mínimos quadrados ponderados regularizado. Também, a interpretação Bayesiana do processo de identifica- ção é explicada, fornecendo novas e importantes ideias para o uso de regularização. Em 4.2.2, são expostas as diferentes formas de parametrizar a matriz de regularização e como

obter estimativas para seus hiperparâmetros. Em seguida, as propriedades da identifica- ção com regularização e a matriz ótima de regularização são demonstradas. Por fim, um exemplo numérico demonstrando o efeito da regularização na função custo de erro de predição encerra o capítulo.