O Método de Newton e o Algoritmo ARCM - Rela¸cão do algoritmo ARCM com o Método de Newton

2.5 Rela¸c˜ao do algoritmo ARCM com o M´etodo de Newton

2.5.2 O M´etodo de Newton e o Algoritmo ARCM

Partindo das equa¸cões originais do algoritmo ARCM, equa¸cões (2.18), considere-se o erro quadrático a priori como fun¸cão custo. Com isto verificamos que o algoritmo ARCM pode ser colocado na forma da equa¸cão (2.35), utilizando aproxima¸cões para a inversa da matriz Hessiana e para o vetor gradiente. Para se chegar a esta conclusão basta combinar as expressões (2.18c) e (2.18d). Assim obtém-se

p[n] = p[n − 1] + α(G[n])−1

{q[n − 1] − αM1x[n]ea[n]}

= p[n − 1] − (G[n])−1{α2

M1x[n]ea[n] − (p[n − 1] − p[n − 2])} .

(2.36)

Comparando (2.36) com (2.35) pode-se concluir imediatamente que o algoritmo ARCM faz uso das seguintes estimativas:

∇f (n, pn−1) = β(α2M1ea[n]x[n] − p[n − 1] + p[n − 2]) (2.37)

F (n, pn−1) = βG[n], (2.38)

2.5. Rela¸c˜ao do algoritmo ARCM com o M´etodo de Newton 37

M1 = m1I e β = γ/(α + γ) resultam express˜oes mais familiares:

ρn = α α + γ (2.39) c ∇f (n, pn−1) = ea[n]x[n] − 1 α2_m 1 (p[n − 1] − p[n − 2]) (2.40) b F (n, pn−1) = 1 αγm1 I + x[n]x[n]T_. _(2.41)

A expressão (2.40) é uma estimativa instantânea do vetor gradiente E{ea[n]x[n]}

“corrigida” por um termo proporcional ao incremento do coeficiente anterior, e (2.41) ´e uma estimativa instantˆanea regularizada da matriz Hessiana Rx = E

x[n]xT_[n] _{. ´}_E

ilustrativo observar que para o algoritmo LMS vale ρn = µ (o passo de adapta¸c˜ao),

∇f (n, pn−1) = ea[n]x[n] e bF (n, pn−1) = I, e que para o algoritmo NLMS (ver Apˆendice

B) vale ρn= µn, c∇f (n, pn−1) = ea[n]x[n] e bF (n, pn−1) = ǫI + x[n]xT[n] (Sayed, 2003).

Pode-se observar que a estimativa de bF do algoritmo ǫ−NLMS ´e igual `a do algoritmo acelerador se

ǫ = 1

αγm1

. (2.42)

O fato de que a estimativa do gradiente do algoritmo acelerador é modificada pelos dois valores anteriores do parâmetro p, pode determinar uma vantagem para o algoritmo acelerador no sentido de que isto pode influenciar na dire¸cão em que os coeficientes se movem dentro do espa¸co de parâmetros, como veremos em um exemplo a seguir.

Experimentalmente pode-se verificar através de um gráfico o comportamento dos coeficientes dos algoritmos LMS, NLMS, Acelerador versão γ e de Newton no espa¸co de parâmetros. Para conseguir isto implementou-se o sistema de um filtro preditor de dois coeficientes apresentado na Figura 2.2, e como base de compara¸cão considerou-se que o desvio padrão dos coeficientes na região de convergência seja semelhante para todos os algoritmos. A Tabela 2.2 apresenta as condi¸cões empregadas na experiência tais como os sinais, os valores dos parâmetros usados por cada um dos algoritmos e os seus respectivos desvios-padrão.

2.5. Rela¸c˜ao do algoritmo ARCM com o M´etodo de Newton 38

Figura 2.2: Sistema de filtro preditor implementado para análise de convergência no espa¸co de parâmetros.

Sinal de entrada sen

5π 128n + 0, 4π σ2 ru´ıdo branco v[n] ₁₀−4 Coeficientes iniciais [−1.5 −1.7] Coeficientes ´otimos [2 −1] No. de amostras _{1.8 x 10}5

No. de amostras usadas para calculo do EQM _{ultimas 8 x 10}_´ 4

No. de experiˆencias ₂₀

Parˆametros:

ARγγγ 1 ARγγγ 2 NLMS 1 NLMS 2 Newton LMS

α = 0.125 α = 1.25 ǫ = 5.9259 ǫ = 0.0127 ρ = 0.05 µ = 0.08

m1 = 0.09 m1 = 0.009 µn = 0.525 µn= 0.0056

γ = 15 γ = 7000

Desvio resultante:

σ = 0.002 σ = 0.0022 σ = 0.0019 σ = 0.002 σ = 0.002

Tabela 2.2: Condi¸cões para a análise da convergência no espa¸co de parâmetros e desvio padrão dos coeficientes dos algoritmos ARγ, NLMS, Newton e LMS.

2.5. Rela¸c˜ao do algoritmo ARCM com o M´etodo de Newton 39

Para as condi¸cões em (AR1, NLMS1) e (AR2, NLMS2) a condi¸cão (2.42) é satisfeita, ou seja, as regulariza¸cões empregadas pelo AR e pelo NLMS são iguais. As diferen¸cas dos algoritmos serão portanto devidas ao termo adicional −p[n − 1] + p[n − 2] aplicado ao gradiente.

Como o algoritmo acelerador regressivo versão γ é um caso especial do algoritmo acelerador convencional matricial, os resultados aqui expressos podem ser considerados válidos também para este algoritmo.

A Figura 2.3 apresenta as trajetórias no plano dos coeficientes onde também estão representadas as curvas de contorno da fun¸cão custo. Dois comportamentos diferentes do algoritmo acelerador são mostrados, um deles similar aos dos algoritmos LMS e NLMS (ARγ 1) e outro similar ao algoritmo de Newton (ARγ 2). Neste último caso, con- siderando o espa¸co dos coeficientes, a convergência ocorre aproximadamente sobre uma reta ligando os coeficientes iniciais aos coeficientes ótimos. Fica assim evidenciado que, dependendo do valor dos parâmetros α, m1 e γ, o algoritmo acelerador pode apresentar

comportamentos bastante diversos, algo que não acontece com o algoritmo NLMS. O fato de que os valores dos parâmetros de ajuste foram definidos para cumprir com a equa¸cão (2.42), permite determinar que o fator adicional na estimativa do gradiente do algoritmo acelerador é quem determina a dire¸cão em que se movimentam os coeficientes. Pode causar uma certa surpresa que quando o algoritmo acelerador apresenta um comportamento como o algoritmo de Newton, a velocidade de convergência seja menor do que quando o comportamento é semelhante ao algoritmo LMS, ver Figura 2.4. Neste trabalho não se chegou a realizar um estudo aprofundado desta observa¸cão.

Nos próximos cap´ıtulos, serão apresentadas as análises teóricas dos algoritmos APCM e ARγ com experiências que permitem comprovar a validade destas análises.

2.5. Rela¸c˜ao do algoritmo ARCM com o M´etodo de Newton 40 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 w 0 w 1 LMS≈NLMS 1 NLMS 2 ARγ 1 ARγ 2 Newton

Figura 2.3: Ilustra¸c˜ao dos algoritmos LMS, NLMS, ARγ, e Newton, para dois coeficientes. 0 2000 4000 6000 8000 10000 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 n p LMS ARγ 1 ARγ 2 NLMS 1 NLMS 2

Cap´ıtulo 3

AN ´ALISE DO ALGORITMO

ACELERADOR PROGRESSIVO

O algoritmo acelerador progressivo convencional matricial (APCM) é um dos algoritmos mais simples obtidos na discretiza¸cão do algoritmo acelerador de tempo cont´ınuo. Apesar de ter sido mostrado no trabalho de Jojoa (1999) que ele não é sempre estável, é analisado neste cap´ıtulo dado que é um algoritmo que apresenta baixa complexidade computacional. Como base de compara¸cão para determinar as vantagens ou desvanta- gens deste algoritmo foi utilizado o algoritmo LMS, tendo em conta a sua simplicidade e que pode ser obtido do algoritmo do gradiente de tempo cont´ınuo pelo método de Euler progressivo. Neste cap´ıtulo é inicialmente apresentada uma análise do algoritmo LMS que vai servir de base de compara¸cão, e posteriormente é apresentada a análise dos momentos de primeira e segunda ordens realizada sobre o algoritmo acelerador APCM, encontrando condi¸cões para estabilidade na média e na média quadrática, e aproxima¸cões para o erro em regime do algoritmo.

3.1 O algoritmo LMS

Um dos algoritmos mais importantes da fam´ılia dos algoritmos de gradiente estocástico é o algoritmo LMS, o qual foi desenvolvido por Widrow e Hoff nos anos sessenta. A principal caracter´ıstica deste algoritmo, e que faz dele o algoritmo a ser considerado como base de compara¸cão, é a sua simplicidade. As equa¸cões que definem este algoritmo

3.1. O algoritmo LMS 42

s˜ao as seguintes (Solo; Kong, 1995):

e[n] = xT_{[n]p[n − 1] − d[n]}

p[n] = p[n − 1] − µx[n]e[n], com o modelo

d[n] = xT_[n]p

0+ η[n],

em que x[n] corresponde ao sinal de entrada (regressor) e η[n] ao ru´ıdo de medida. Sejam consideradas as seguintes hip´oteses:

• x[n] é um vetor gaussiano, de média zero com matriz de covariância Rx = E{x[n]xT[n]}.

• O sinal de ru´ıdo de medida, η[n], é gaussiano de média zero e variância σ2 η.

• x[n] e η[n] s˜ao estatisticamente independentes.

De acordo com (Solo; Kong, 1995), tendo-se em conta as anteriores considera¸c˜oes a an´alise dos momentos de primeira ordem determina que para o algoritmo LMS,

E{δp[n]} = (I − µRx)E{δp[n − 1]}

em que δp[n] = p[n] − po, sendo po os parâmetros ótimos e, a análise dos momentos de

segunda ordem que para PPP[n] = E{δp[n]δpT_[n]},

P P

P[n] = PPP[n − 1] − µ (PPP[n − 1]Rx+ RxPPP[n − 1]) + 2µ2RxPPP[n − 1]Rx+

+µ2

tr {PPP[n − 1]Rx} Rx+ µ2ση2Rx,

em que tr{·} corresponde ao tra¸co de uma matriz.

Determina-se que o erro quadrático médio (EQM) é dado por Ee2

[n] = σ2

η + tr{RxPPP[n − 1]}.

3.2. An´alise dos momentos do algoritmo APCM 43

No documento Um algoritmo acelerador de parâmetros (páginas 36-43)