• Nenhum resultado encontrado

3.2 Principais Abordagens em BSS Caso Linear

3.2.7 Métodos algébricos JADE

Na Seção 2.5.3, vimos que as informações de segunda ordem podem ser levadas em conta no problema de separação por meio de uma diagonalização da matriz de correlação (ou covariância) relativa ao vetor de misturas x. Nesta mesma linha, uma outra abordagem em BSS incorpora as informações de ordem superior ao problema a partir de processos de diagonalização de entidades que contenham tais informações, como, por exemplo, o tensor de cumulantes e a matriz de cumulantes associada a um vetor aleatório. Esse procedimento é a essência de uma pioneira técnica em BSS denominada JADE (Joint Approximate Diagonalization of Eigenmatrices) (Cardoso & Souloumiac, 1993). Antes de discutirmos as idéias centrais desta técnica, relembraremos a denição de um cumulante e também de um importante conceito relacionado a esta entidade.

ordem r deste conjunto é denido como (Nikias & Petropulu, 1993) cum(zk1 1 , z2k2, . . . , zkpp) , (−j)r ∂rΨ(ω 1. . . . , ωp) ∂wk1 1 . . . ∂w kp p ¯ ¯ ¯ ¯ ¯ ω1=...=ωp=0 , (3.50)

onde Ψ(ω1. . . . , ωp) representa o logaritmo da função característica conjunta e k1+

k2+ . . . + kp = r. No JADE, explora-se um cumulante de quarta ordem, dado por:

cum(z1, z2, . . . , zp) = E{z1z2z3z4} − E{z1z2}E{z3z4}

− E{z1z3}E{z2z4} − E{z1z4}E{z2z3}. (3.51)

Note que esta medida, diferentemente da clássica medida de correlação de segunda ordem, apresenta quatro argumentos. Deste modo, a denição de uma estrutura semelhante à matriz de correlação necessita do conceito de tensor, que, em linhas gerais, pode ser entendido como uma extrapolação do conceito de matriz, no sentido de que um tensor pode apresentar um número de entradas maior do que dois. Neste contexto, dene-se o tensor de cumulante como um conjunto de elementos, sendo que o elemento ijkl é dado por cum(zi, zj, zk, zl), e com i, j, k, l variando de 1 a p.

Um outro conceito que utilizaremos é o de matriz de cumulante associada a um vetor aleatório x = [x1, . . . , xN] e a uma matriz M de dimensão N × N. No caso, o

elemento ij da matriz de cumulante é dado por

[Qx(M)] ij = N X k,l=1 Cum(xi, xj, xk, xl)Mkl, (3.52)

sendo que os índices i e j variam de 1 a N. A matriz de cumulante Qx(M) pode

ser entendida como o resultado da aplicação do tensor de cumulante de x à matriz M, ou seja, Qx(M) = Γ(M), onde Γ(·) representa a transformação efetuada por um

tensor.

Vejamos agora como essas medidas são consideradas no problema de separação. No caso em que o vetor x representa os sinais misturados após um etapa de branqueamento, ou seja, x = Us, sendo U uma matriz ortogonal, é possível mostrar (Cardoso, 1999) que a matriz de cumulantes associada a x é dada por

onde 4(M) é uma matriz diagonal cujos parâmetros dependem de M e das curtoses das fontes.

Multiplicando ambos os lados da expressão (3.53) por UT à esquerda e por U à

direita, e lembrando que UT = U−1 (devido à ortogonalidade de U), temos que:

UTQx(M)U = UTU4(M)UTU = 4(M), (3.54) donde podemos concluir que a matriz U diagonaliza Qx(M). Logo, uma estratégia

plausível para a recuperação das fontes se daria a partir da diagonalização de Qx(M).

Em (Cardoso & Souloumiac, 1993), argumenta-se que a diagonalização da matriz de cumulante (3.53), para uma matriz M arbitrária, garante a identicação de U desde que haja, no máximo, uma fonte com curtose nula (novamente a restrição sobre as fontes gaussianas) e que os autovalores de Qx(M)sejam distintos. Infelizmente, os

autovalores desta matriz dependem, além da matriz M, de U, que não conhecemos a priori. Ou seja, não é possível estabelecer qualquer tipo de garantia sobre esses autovalores. Além disso, mesmo quando a matriz M garante a existência de autovalores distintos, a diagonalização exata da matriz de cumulante pode ser inatingível em um cenário prático, posto que os cumulantes são obtidos a partir de estatísticas amostrais. A idéia fundamental presente no algoritmo JADE tem justamente como objetivo evitar esses problemas.

Nessa técnica, em vez de se realizar a diagonalização considerando apenas uma matriz de cumulante, adota-se um esquema de diagonalização conjunta de diferentes matrizes de cumulante, sendo cada uma delas denida por uma matriz Mi. Matematicamente, a função custo a ser minimizada no algoritmo JADE é dada

por

D(U) =X

i

Ω(UTQx(Mi)U), (3.55)

onde o operador Ω(·) expressa a soma quadrática dos elementos que não estão na diagonal principal. No que diz respeito à escolha das matrizes Mi, adotam-se as

automatrizes relativas ao tensor de cumulante, ou seja, as N matrizes Mi tal que

Qx(M

i) = λMi. Ao proceder desta forma, todas as informações relevantes do tensor

de cumulante são, de certo modo, consideradas.

Para otimizar a expressão (3.55) é possível utilizar o método de Jacobi para diagonalização de matrizes. Inicialmente concebido para a diagonalização de uma

única matriz (Golub & Loan, 1989), este método foi estendido para prover a diagonalização conjunta de diversas matrizes em (Cardoso & Souloumiac, 1996). A idéia essencial presente nesta abordagem é representar a matriz U através de um produto de matrizes de rotação, dado por

U =

N

X

i,j=1,i6=j

Rij, (3.56)

onde a matriz de rotação Rij, de dimensões N × N, é idêntica a uma matriz

identidade, com a exceção de seus elementos nas posições (i,i), (i,j), (j,i) e (j,j), dados por

rii= cos θ, rij = sin θ, rji = − sin θ, rjj = cos θ. (3.57)

O parâmetro θ é o ângulo de rotação associado à matriz Rij.

É possível, para cada uma das matrizes de rotação Rij, determinar

analiticamente qual é o ângulo de rotação que minimiza a expressão (3.55), conforme descrito em (Cardoso & Souloumiac, 1996). Assim, a diagonalização conjunta das matrizes de cumulante pode ser feita a partir da obtenção, através de expressões analíticas, de cada um dos ângulos de rotação para todos os possíveis pares ij. Tal abordagem pode ser compreendida como uma possível iteração do algoritmo JADE, de modo que a condição de parada ocorra quando o ângulo de rotação obtido for menor que uma ângulo mínimo θmin previamente denido. A despeito do

reduzido número de iterações necessárias para a convergência deste procedimento de diagonalização conjunta, tal técnica se torna consideravelmente ineciente em cenários com um elevado número de fontes, devido ao aumento de complexidade presente na determinação analítica dos ângulos de rotação.

Uma dos principais atrativos presentes no JADE resulta do fato de que, tanto o desenvolvimento da função contraste (3.55), quanto o do processo de diagonalização conjunta são válidos para vetores aleatórios complexos (Cardoso & Souloumiac, 1993), ou seja, o JADE pode ser utilizado também na separação de fontes complexas.