• Nenhum resultado encontrado

Método de Levenberg-Marquardt (LM)

2.2 IDENTIFICAÇÃO DE SISTEMAS NO DOMÍNIO DA FREQUÊNCIA

2.2.3 Método de Levenberg-Marquardt (LM)

( ) ∏ ( ̅ ) ∏ ( ̃ ) ∏ ( ̅ ) ( ) ∏ ( ̃ )

( 26 )

Pode-se notar que uma simplificação dos pólos iniciais pode ser realizada já que tanto a função de escalonamento quanto o produto ( ) ( ) tinham os mesmo pólos. A equação ( 26 ) demonstra que os zeros da função ( ) convertem-se em pólos da função ( ). Durante o processo iterativo estes valores são usados como novos valores para os pólos iniciais da próxima iteração.

Os zeros de ( ) são calculados a partir dos autovalores de uma matriz definida abaixo:

̃ ,

( 27 )

Em que é uma matriz diagonal contendo o valor dos pólos iniciais, é um vetor coluna de e ̃ é um vetor fila contendo os resíduos de ( ) (portanto os valores de ̃ ) encontrados anteriormente. A demonstração disto pode ser encontrada em (GUSTAVSEN B.; SEMLYEN, A, 1999).

Executando os passos descritos anteriormente em um processo iterativo chega-se a um modelo ( ) de ( )

Para a obtenção de um modelo satisfatório é de vital importância a solução do problema com exatidão e para isso bons pólos iniciais devem ser escolhidos. Uma solução dada pelo autor para esses problemas é o uso de pares complexos de pólos de forma que:

̅ ̅ Com .

Aprimoramentos no método vector fitting podem ser encontradas, dentre outras referências em (GUSTAVSEN, 2006).

2.2.3 Método de Levenberg-Marquardt (LM)

Quando se menciona o termo solução numérica para o problema de otimização, em particular, de minimização, quer dizer que o algoritmo tenta de

alguma forma encontrar o valor dos parâmetros ou variáveis de uma determinada função, denominada de função objetivo ou custo, de modo que o seu valor seja o menor (no caso de minimização) possível, seja num determinado intervalo (mínimo local) ou em todo o seu conjunto imagem (mínimo global).

De certa maneira é isso o que tem-se abordado até o momento porém não usando uma abordagem tão “direta” do problema como quando usando técnicas de otimização. Tanto o método de Levy quanto o método de Vector Fitting buscam encontrar o valor dos parâmetros do modelo em questão para os quais o erro em relação aos valores medidos tem o menor valor possível, ou seja, visam encontrar o mínimo da função erro ( ) dada pela equação ( 13). O objetivo de um algoritmo de otimização é justamente esse, determinar os pontos onde uma função assume determinado valor, ou assume valores extremos.

A diferença na utilização do algoritmo de otimização para se modelar um sistema reside no fato de que o algoritmo não foi desenvolvido para isso como os demais, e sim vai ser utilizado para esse fim.

O algoritmo de Levenberg–Marquardt (LM) é um dos mais utilizados algoritmos de otimização e será utilizado neste documento para fins de encontrar os parâmetros do modelo que minimizam a função de erro quadrático entre os dados medidos e os dados previstos pelo modelo. Tem como objetivo prover uma solução numérica para problemas de minimização em que uma função custo é expressa na forma de soma de quadrados, ou seja:

( ) ∑[ ( )]

( 28 )

Para que os coeficientes , possam ser obtidos devemos minimizar uma função custo, que se tratando do processo de identificação já foi apresentada em ( 13 ).

Assim como outros métodos de otimização o método de Levenberg– Marquardt (LM) é iterativo. Isso significa que dado um valor inicial , aqui representado pelos coeficientes do modelo, ele produzirá uma série de valores , que espera-se que a função de custo vá convergir para um valor de mínimo local ou global .

Pode-se interpretar o funcionamento do algoritmo do Levenberg–Marquardt como a combinação de dois outros métodos de otimização: gradiente descendente ou declive descendente e o método de Gauss-Newton. No primeiro a função custo é reduzida através do acréscimo dos parâmetros na direção de maior redução. Ao passo que no segundo, a soma do quadrado dos erros é reduzida fazendo-se uso de um processo de linearização local e a utilização de mínimos quadrados ordinários para encontrar um mínimo local dessa linearização. O algoritmo de LM atua como gradiente descendente quando os valores analisados estão longe de seu valor ótimo e como Gauss-Newton quando estão próximos. (RANGANATHAN, 2004)

A base para a aplicação do algoritmo é a aproximação linear do modelo em torno dos parâmetros iniciais [ , ] :

( ) ( ) ( 29 )

Nesta equação representa a matriz jacobiana ( ) Usando esta aproximação na equação de custo a ser minimizada

( ) | ( ) ( )| | ( ) ( ) | | | ( 30 ) Para que o valor da função acima convirja para um mínimo devemos encontrar um valor ótimo de A procura por esse valor está relacionada com um problema de mínimos quadrados ou também com as conhecidas equações normais:

( 31 )

A Matriz do lado esquerdo da equação acima é dita uma aproximação Hessiana ou seja, uma aproximação da matriz de derivadas de segunda ordem. O algoritmo Levenberg-Marquardt resolve um grupo de equação um pouco diferentes destas, conhecidas como equações normais aumentadas (augmented normal

equations ) :

( 32 )

Em que os elementos que não fazem parte da diagonal de são idênticos as de e os demais são dados por [ ] para .

A estratégia de alterar os coeficientes da diagonal da matriz é conhecida como damping e o termo é conhecido como fator de amortecimento (damping

factor). Quando o valor do vetor de parâmetros atualizado calculado usando a

equação ( 32 ) leva a uma redução do erro a atualização é aceita e o processo continua com um fator de amortecimento menor. Ao passo que, se o valor de aumenta, o valor de amortecimento é incrementado e as equações normais aumentadas são recalculadas até um valor de que decrementa o erro for encontrado. O processo de resolver a equação ( 32 ) para diferentes valores do fator de amortecimento até um valor aceitável de parâmetros for encontrado corresponde a uma iteração no algoritmo de Levenberg-Marquardt (RANGANATHAN A., 2004).

3 SISTEMAS PROPOSTOS

Este capítulo apresenta os sistemas que foram utilizados na obtenção dos dados para estimação dos modelos usando os diferentes métodos de identificação de sistemas.

Para formação do conjunto de dados que foram utilizados nos testes envolvendo os método de identificação de sistemas foram escolhidos 4 tipos de sistemas, sendo que algum deles se conhecia a sua representação usando função de transferência e outros de que não se tinha nenhuma informação prévia a cerca de sua dinâmica.

A nomenclatura adotada neste trabalho para facilitar a referência a esses sistemas está apresentada abaixo:

 : Sistema simples com valor de ordem conhecido.

 : Sistema complexo com valor de ordem conhecido.

 : Sistema simples de dinâmica não conhecida.

 : Sistema complexo de ordem não conhecida.

O termo sistema simples, refere-se a um sistema de ordem relativa baixa ao passo que sistema complexo refere-se a um sistema cuja ordem relativa é grande e seu comportamento é mais caótico do que o anterior.

Para representar o sistema foi escolhido o uso de um circuito eletrônico que representa um filtro com topologia Sallen-key. A FIGURA 3 ilustra o circuito:

FIGURA 3: Filtro Sallen Key para extração da função de transferência FONTE: LATHI, 2007

Essa estrutura é muito usada na implementação de filtros do tipo passa-baixas ou passa-altas. Escolhendo adequadamente o valor das impedâncias do circuito pode-se obter respostas do tipo Bessel, Butterworth, Chebyshev, etc.

Em (LATHI, 2007) podemos encontrar a função de transferência que representa este circuito:

( )

( ) ( )

,

( 33 )

em que

O termo na equação ( 33 ) referente a é chamado de frequência de corte e é o fator de qualidade do filtro.

Escolhendo os valores das capacitâncias e resistências de modo a se definir uma frequência de corte em e um fator de qualidade de na equação ( 33 ), obtém-se o seguinte modelo:

( ) ( )

.

( 34 )

A resposta em frequência da equação ( 34 ) está sendo exibida na FIGURA 4:

FIGURA 4: Reposta em frequência para o sistema

100 101 102 -80 -70 -60 -50 -40 -30 -20 M a g n it u d e ( d B ) Resposta em frequência 100 101 102 -200 -150 -100 -50 0 P h a se ( d e g ) Frequency (rad/s)

Podemos notar que a equação do sistema , possui dois pólos complexos conjugados localizados em:

.

Para representar o sistema complexo de ordem conhecida ( ) foi escolhido o sistema apresentado em (ISERMANN; MÜNCHHOF, 2010). Trata-se do chamado oscilador com três massas (three mass oscillator), ilustrado na FIGURA 5. É formado por um motor com um eixo que se movimenta presos a três massas e três discos. Um dos quais será o alvo do estudo. As massas e os dois discos extras servem para acrescentar momentos de inércia ao sistema, tornando-o dessa forma mais crítico ou caótico.

FIGURA 5: Oscilador com três massas FONTE: (ISERMANN; MÜNCHHOF, 2010)

Substituindo os valores propostos por (ISERMANN; MÜNCHHOF, 2010) necessários para os momentos de inércia, diâmetros dos discos e massa dos pesos acrescentados, encontramos a seguinte função de transferência da velocidade do último disco em relação ao torque do motor:

cuja resposta em frequência encontra-se na FIGURA 6.

A equação ( 35 ) tem pólos reais e complexos localizados em:

FIGURA 6: Resposta em frequência para o sistema

Os sistemas e são de dinâmica desconhecida e foram fornecidos pelo orientador desde trabalho. Os gráficos de resposta em frequência podem ser encontrados respectivamente na FIGURA 7 e FIGURA 8

100 101 102 -80 -60 -40 -20 0 20 40 M a g n it u d e ( d B ) Resposta em frequência 100 101 102 -500 -400 -300 -200 -100 0 P h a se ( d e g ) Frequency (rad/s)

FIGURA 7: Reposta em frequência para o sistema

FIGURA 8: Reposta em frequência para o sistema

10-2 10-1 100 101 102 -40 -30 -20 -10 0 10 M a g n it u d e ( d B )

Resposta em frequência sistema desconhecido H3

10-2 10-1 100 101 102 -100 -50 0 50 100 P h a se ( d e g ) Frequency (rad/s) 101 102 103 104 105 106 107 -120 -100 -80 -60 -40 -20 0 M a g n it u d e ( d B )

Resposta em frequência sistema desconhecido H3

101 102 103 104 105 106 107 -100 -50 0 50 100 P h a se ( d e g ) Frequency (rad/s)

4 RESULTADOS OBTIDOS

Este capítulo descreve os testes realizados nos sistemas descritos no capítulo 3, para a análise dos métodos de identificação no domínio do tempo e da frequência.

Primeiramente serão apresentados a análise em sistemas de dinâmica conhecida ( e ) em algumas situações distintas e depois passa-se a modelagem dos sistemas de dinâmica não conhecida ( e ).

Documentos relacionados