A combina¸c˜ao convexa de algoritmos adaptativos

A combina¸cão convexa de dois ou mais filtros operando em paralelo foi proposta para melhorar o desempenho de filtros adaptativos [MARTÍNEZ-RAM ÓN et al., 2002; ARENAS-GARCÍA, 2004; ARENAS-GARCÍA; G ÓMEZ-VERDEJO; FIGUEIRAS-VIDAL, 2005; ARENAS-GARCÍA; FI- GUEIRAS-VIDAL; SAYED, 2006; ARENAS-GARCÍA et al., 2006; AZPICUETA-RUIZ; FIGUEIRAS- VIDAL; ARENAS-GARCÍA, 2008; SILVA; NASCIMENTO, 2008a; ARENAS-GARCÍA; FIGUEIRAS- VIDAL, 2009; L ÁZARO-GREDILLA et al., 2010]. Esse método é relativamente simples e pro- porciona um desempenho global melhor ou igual ao de cada filtro individual operando in- dependentemente. Essa ideia tem gerado interesse, pois uma dificuldade no projeto de filtros adaptativos é escolher da melhor forma os parâmetros fixos do filtro, como o passo de adapta¸cão para algoritmos do tipo LMS ou o fator de esquecimento para algoritmos do tipo RLS. Cabe destacar que há diversos artigos que propõem o uso de algoritmos com passo variável [KWONG; JOHNSTON, 1992; ABOULNASR; MAYYAS, 1997; BILCU; KUOSMANEN; EGI- AZARIAN, 2002; NELATURY; RAO, 2002], mas o desempenho deles é pior do que o de um algoritmo com parâmetro fixo escolhido de maneira ótima, principalmente quando os sinais são estacionários. Como o desempenho de combina¸cões de filtros nunca é pior do que o de cada filtro individual, essa solu¸cão é mais interessante do que as que utilizam parâmetros variáveis em muitas situa¸cões práticas.

A ideia de se combinar as sa´ıdas de vários filtros adaptativos independentes para se obter um melhor desempenho do que o de cada filtro individual não é nova. Ela foi proposta inicialmente em [ANDERSSON, 1985] e posteriormente melhorada em [NIED´ZWIECKI, 1990, 1992]. Ideias similares também têm sido usadas na literatura de teoria da informa¸cão (veja, e.g., [KOZAT; SINGER; ZEITLER, 2007]). No entanto, o método de [ARENAS-GARCÍA; FIGUEI- RAS-VIDAL; SAYED, 2006] tem recebido mais aten¸cão devido à sua relativa simplicidade e à prova de que a combina¸cão é universal, i.e., considerando entradas estacionárias, a estimativa combinada é pelo menos tão boa quanto à do melhor filtro componente em regime.

A combina¸cão convexa de dois filtros adaptativos está esquematizada na Figura 1.5, onde se considera a filtragem supervisionada que pode ser usada para diferentes aplica¸cões, como identifica¸cão de sistemas, equaliza¸cão adaptativa, cancelamento de eco ou ru´ıdo etc. [HAYKIN, 2002; SAYED, 2003]. O sinal de sa´ıda global y(n) é obtido a partir da combina¸cão

linear das sa´ıdas y1(n) e y2(n) dos filtros individuais, ou seja,

y(n) = η(n)y1(n) + [1 − η(n)]y2(n), (1.25)

sendo η(n) o parˆametro de mistura. Os vetores de coeficientes de cada filtro w1(n − 1) e

w2(n − 1) s˜ao adaptados com seus respectivos erros

e1(n) = d(n) − y1(n) (1.26)

e2(n) = d(n) − y2(n), (1.27)

sendo d(n) a resposta desejada, que no caso da equaliza¸c˜ao supervisionada corresponde ao s´ımbolo a(n − ∆). u(n) d(n) e(n) e1(n) e2(n) y1(n) y2(n) y(n) η(n) 1 − η(n) w1(n − 1) w2(n − 1) w_{(n − 1)}

Figura 1.5: Combina¸c˜ao convexa de dois filtros adaptativos transversais para filtragem supervisionada.

Na mistura de dois algoritmos do tipo LMS com passos de adapta¸c˜ao µ1 e µ2, sendo

µ1 > µ2, a combina¸cão convexa tem uma interpreta¸cão intuitiva. No in´ıcio da convergência,

η(n) → 1 e a combina¸c˜ao se aproxima do filtro µ1-LMS, que converge mais rapidamente.

Em regime, η(n) → 0 e a combina¸c˜ao se aproxima do filtro µ2-LMS, que por ser mais lento,

em que 0 < η(n) < 1 e nesses casos, a combina¸cão pode apresentar um desempenho melhor do que o de cada um dos filtros quando considerados separadamente [ARENAS-GARCÍA; FI- GUEIRAS-VIDAL; SAYED, 2006]. Esse comportamento pode ser observado nos resultados de simula¸cão mostrados na Figura 1.6, em que a combina¸cão convexa de dois filtros LMS com diferentes passos de adapta¸cão (µ1 = 0, 1 and µ2 = 0, 01) foi usada para identificar o sistema

0, 9003 −0,5377 0,2137 −0,0280 0,7826 0,5242 −0,0871 i

O regressor u(n) é obtido de um processo x(n), gerado com um modelo autoregressivo de primeira ordem, cuja fun¸cão de transferência é dada por √_{1 − b}2_{/(1 − bz}−₁

). Esse modelo é alimentado com um processo gaussiano iid, cuja variância é escolhida para que o tra¸co da matriz de autocorrela¸cão R seja igual a um. Além disso, um ru´ıdo aditivo iid v(n) com variância σ2

v = 0, 01 ´e adicionado para se obter o sinal desejado. Na Figura 1.6-(a), s˜ao

mostradas curvas de EMSE, estimadas a partir de uma média de conjunto de 500 realiza¸cões e filtradas por um filtro de média móvel com 128 coeficientes para facilitar a visualiza¸cão. Na Figura 1.6-(b), é mostrada a média do parâmetro de mistura ao longo do tempo. Pode-se observar que η(n) → 1 durante o in´ıcio da convergência e em regime, η(n) → 0.

Na combina¸cão convexa, o parâmetro de mistura η(n) fica restrito ao intervalo [ 0, 1 ] e por isso é modificado através de uma variável auxiliar α(n) que está relacionada com η(n) através da seguinte fun¸cão

η(n) = ϕ[α(n − 1)] = sgm[α(n − 1)] − sgm[−α +_] sgm[α+_{] − sgm[−α}+_] , (1.28) sendo sgm[x] = 1 1 + e−_x (1.29)

a fun¸cão sigmoidal e α+ _{o máximo valor que |α(n)| pode assumir. A fun¸cão de ativa¸cão ϕ[·]}

foi proposta em [L ÁZARO-GREDILLA et al., 2010] e é uma versão deslocada e escalonada da fun¸cão sigmoidal. ´_{E importante notar que η(n) atinge os valores 1 e 0 para α(n − 1) = α}+

e α(n − 1) = −α+_{, respectivamente.}

Calculando a derivada do MSE global da combina¸c˜ao

JMSE(n) = E{|e(n)|

combina¸c˜ao µ2-LMS µ1-LMS E M S E (d B ) (a) 0 0 1 2 3 −10 −20 −30 −40 −50 E { η (n )} (b) 0 0 1 1 0, 5 ×104 2 3 Itera¸c˜oes

Figura 1.6: (a) EMSE para µ1-LMS, µ2-LMS, e sua combina¸c˜ao convexa; (b) m´edia de conjunto

de η(n); µ1 = 0, 1, µ2 = 0, 01, µα = 100 (adapta¸cão não-normalizada), α+ = 4, b = 0, 8; média de

500 realiza¸c˜oes.

com rela¸cão à α(n) e aproximando as esperan¸cas por seus valores instantâneos, obtém-se a seguinte regra para adaptar α(n):

α(n) = α(n − 1) + ˜µα(n) Re{[d(n) − y(n)][y1(n) − y2(n)] ∗ }ϕ′[α(n − 1)], (1.30) sendo ϕ′ [α(n − 1)] = dη(n) dα(n − 1) = sgm[α(n − 1)]{1 − sgm[α(n − 1)]} sgm[α+_{] − sgm[−α}+_] (1.31)

e ˜µα(n) um passo de adapta¸cão. Na prática, α(n) fica restrita por satura¸cão ao intervalo

sim´etrico [−α+_{, α}+_{], j´a que o fator ϕ}′

[α(n − 1)] em (1.30) pararia a adapta¸cão se |α(n)| crescesse muito. Uma escolha comum na literatura é α+ _{= 4 [}_{ARENAS-GARCÍA; FIGUEIRAS-}

VIDAL; SAYED, 2006; AZPICUETA-RUIZ; FIGUEIRAS-VIDAL; ARENAS-GARCÍA, 2008; L ÁZARO- GREDILLA et al., 2010]. Quando se trata da combina¸cão convexa de dois algoritmos com passos de adapta¸cão diferentes, por exemplo, combina¸cão do µ1-LMS com o µ2-LMS, em

um comportamento semelhante ao do filtro rápido no in´ıcio da convergência. Entretanto, o desempenho da combina¸cão não é afetado significativamente se α(−1) for feito igual a um valor no intervalo [ −α+_{, α}+_{], já que λ(n) converge rapidamente para próximo de 1 quando}

o filtro µ2-LMS ainda não convergiu. Isso também ocorre quando há mudan¸cas abruptas no

canal de comunica¸c˜ao, por exemplo.

Embora seja poss´ıvel usar um valor constante para ˜µα(n), um comportamento melhor

pode ser obtido com uma regra normalizada. Reinterpretando a combina¸c˜ao como um filtro adaptativo de “segunda camada” [AZPICUETA-RUIZ; FIGUEIRAS-VIDAL; ARENAS-GARC´IA, 2008] e notando que [y1(n) − y2(n)] faz o papel de sinal de entrada para essa segunda

camada, pode-se considerar

µα(n) =

µα

p(n) (1.32)

sendo p(n) uma estimativa da potˆencia de [y1(n)−y2(n)], i.e,

p(n) = λpp(n − 1) + (1 − λp)|y1(n) − y2(n)|2 (1.33)

com p(−1) = 1. A regra normalizada é mais fácil de ajustar do que a não-normalizada, como observado em [AZPICUETA-RUIZ; FIGUEIRAS-VIDAL; ARENAS-GARCÍA, 2008;CANDIDO; SILVA; NASCIMENTO, 2010]. Além disso, a sele¸cão do fator de esquecimento λp não é cr´ıtica

para um bom desempenho da combina¸c˜ao, sendo λp = 0, 9 uma escolha comum na literatura.

As opera¸cões da combina¸cão convexa de dois algoritmos LMS com passos de adapta¸cão diferentes e adapta¸cão normalizada estão mostradas na Tabela 1.4, em que

sign[x] =    −1, x < 0 1, x ≥ 0.

Cabe observar que em uma implementa¸cão prática, a fun¸cão ϕ[·] pode ser calculada com o aux´ılio de uma tabela (lookup table). Além disso, no caso de equaliza¸cão, não é necessário calcular o vetor de coeficientes da combina¸cão, ou seja,

w(n) = η(n + 1)w1(n) + [1 − η(n + 1)]w2(n), (1.34)

já que para essa aplica¸cão, o interesse está na estimativa obtida com a sa´ıda global combinada, i.e., y(n).

Os benef´ıcios de se utilizar a fun¸cão ϕ[·] para o cálculo de η(n) são dois. Primeiramente, ela serve para manter o parâmetro de mistura η(n) no intervalo [ 0, 1 ]. Em segundo lugar,

Tabela 1.4: Sumário da combina¸cão convexa de dois filtros LMS. Inicializa¸cão: w1(−1) = 0, w2(−1) = 0, α(−1) = α+, p(−1) = 1 Para n = 0, 1, 2, . . . , calcule η(n) = ϕ[α(n − 1)] = sgm[α(n − 1)] − sgm[−α +_] sgm[α+_{] − sgm[−α}+_] y1(n) = uT(n)w1(n − 1) y2(n) = uT(n)w2(n − 1)

y(n) = η(n)y1(n) + [1 − η(n)]y2(n)

e1(n) = d(n) − y1(n) e2(n) = d(n) − y2(n) e(n) = d(n) − y(n) ϕ′ [α(n − 1)] = sgm[α(n − 1)]{1 − sgm[α(n − 1)]}_sgm[α+_{] − sgm[−α}+_] p(n) = λpp(n − 1) + (1 − λp)|y1(n) − y2(n)|2 α(n) = α(n − 1) + µα p(n)Re{e(n)[y1(n) − y2(n)] ∗ }ϕ′ [α(n − 1)] Se |α(n)| > α+ α(n) ← α+_sign[α(n)] Fim w₁(n) = w1(n − 1) + µ1e1(n)u ∗ (n) w2(n) = w2(n − 1) + µ2e2(n)u∗(n) Fim a derivada ϕ′

[α(n − 1)] que aparece em (1.30) assume um valor pequeno quando η(n) se aproxima dos limites inferior e superior, fazendo com que a velocidade de adapta¸cão e o ru´ıdo do gradiente diminuam [ARENAS-GARCÍA; FIGUEIRAS-VIDAL; SAYED, 2006; L ÁZARO- GREDILLA et al., 2010].

A combina¸cão convexa tem sido utilizada para melhorar o desempenho de filtros adaptativos e também como um esquema alternativo em diferentes aplica¸cões, destacando-se:

1. melhoria do desempenho do algoritmo LMS com comprimento vari´avel [ZHANG; CHAM- BERS, 2006];

2. melhoria da capacidade de tracking de filtros adaptativos [SILVA; NASCIMENTO, 2008a];

3. cancelamento de eco acústico, dereverbera¸cão e separa¸cão de fontes acústicas [ARENAS- GARCÍA; FIGUEIRAS-VIDAL, 2009;GONZALO-AYUSO et al., 2012;AZPICUETA-RUIZ et al., 2011; ZELLER et al., 2011;AZPICUETA-RUIZ, 2011];

4. equaliza¸c˜ao autodidata [ARENAS-GARC´IA; FIGUEIRAS-VIDAL, 2006;SILVA; NASCIMENTO, 2008a;CANDIDO; SILVA; NASCIMENTO, 2009];

5. equaliza¸c˜ao espa¸co-temporal [CHAVES et al., 2011];

6. cria¸c˜ao de estimadores enviesados [L ´AZARO-GREDILLA et al., 2010];

7. processamento de sinais biol´ogicos [MANDIC et al., 2008; JELFS et al., 2010; XIA et al.,

2011; LI et al., 2012]; e

8. processamento adaptativo distribu´ıdo [CATTIVELLI; SAYED, 2011; TAKAHASHI; YA- MADA; SAYED, 2010; ABDOLEE; CHAMPAGNE, 2011;FERN ´ANDES-BES et al., 2012].

Usando a combina¸cão convexa como fonte de inspira¸cão, outras combina¸cões de algoritmos foram propostas na literatura. Dentre essas combina¸cões, destacam-se a combina¸cão afim [BERSHAD; BERMUDEZ; TOURNERET, 2008;CANDIDO; SILVA; NASCIMENTO, 2010;BER- MUDEZ; BERSHAD; TOURNERET, 2011] e a combina¸cão linear [KOZAT et al., 2010], descritas a seguir. A combina¸cão afim de dois filtros LMS foi proposta em [BERSHAD; BERMUDEZ; TOURNERET, 2008]. Nesse artigo, o parâmetro de combina¸cão é escolhido de forma ótima a

fim de minimizar o MSE em regime, não ficando restrito ao intervalo [ 0, 1 ]. Dessa forma, a sa´ıda global é uma combina¸cão linear das sa´ıdas dos filtros individuais e a combina¸cão convexa é um caso particular. Por isso, a combina¸cão afim de [BERSHAD; BERMUDEZ; TOURNERET, 2008] é uma generaliza¸cão da combina¸cão convexa de [ARENAS-GARCÍA; FI- GUEIRAS-VIDAL; SAYED, 2006]. O parâmetro de mistura pode assumir valores negativos, o que ocorre usualmente em regime. Os resultados de [BERSHAD; BERMUDEZ; TOURNERET,

2008] foram estendidos em [CANDIDO, 2009; CANDIDO; SILVA; NASCIMENTO, 2010], considerando entrada branca ou colorida e outros algoritmos na combina¸cão (não apenas o LMS). Além disso, foi apresentada uma análise do transitório da combina¸cão, levando-se em conta

a adapta¸cão dos filtros componentes e também a adapta¸cão do parâmetro de mistura adap- tado com o algoritmo η-LMS, proposto em [BERSHAD; BERMUDEZ; TOURNERET, 2008]. Os resultados da análise do transitório facilitaram o ajuste dos parâmetros livres do esquema e a obten¸cão de dois algoritmos normalizados para atualizar o parâmetro de mistura. Nas simula¸cões mostradas em [CANDIDO, 2009; CANDIDO; SILVA; NASCIMENTO, 2010], observa- se uma boa concordância entre os resultados anal´ıticos e os de simula¸cão. Dessa forma, os modelos teóricos são capazes de prever situa¸cões em que esses algoritmos podem alcan¸car um desempenho melhor, sendo útil para o projetista.

Na combina¸cão linear proposta em [KOZAT et al., 2010], não é imposta restri¸cão alguma ao parâmetro de mistura, ou seja, a soma dos pesos das sa´ıdas dos filtros componentes não é necessariamente igual a um como nas combina¸cões convexa e afim. Em [KOZAT et al., 2010], ainda são apresentados resultados de análises teóricas que confirmam o desempenho melhor da combina¸cão linear em rela¸cão aos filtros componentes. Diante dessas diferentes combina¸cões de algoritmos adaptativos, se faz necessária uma compara¸cão sistemática e extensiva, levando-se em conta diferentes cenários de simula¸cão e os resultados das análises teóricas.

No documento MAGNO TEÓFILO MADEIRA DA SILVA EQUALIZAÇÃO AUTODIDATA BASEADA EM COMBINAÇÃO DE FILTROS ADAPTATIVOS (páginas 33-40)