Maximiza¸c˜ao da n˜ao-gaussianidade

2.4 Sum´ario

3.1.4 Maximiza¸c˜ao da n˜ao-gaussianidade

Outra estratégia efetiva na separa¸cão de fontes consiste em adaptar a matriz de separa¸cão de forma a maximizar a não-gaussianidade dos sinais estimados. Embora não seja evidente, o princ´ıpio leva à estima¸cão de sinais independentes entre si, mostrando- se um método apropriado para a ICA.

A abordagem pode ser compreendida através do teorema central do limite [109], um resultado clássico da teoria de probabilidade. Segundo o teorema, a fun¸cão densidade de probabilidade da soma de variáveis aleatórias independentes, sob certas condi¸cões, tende à de uma variável gaussiana [37]. Portanto, de certa forma, a pdf da soma de duas variáveis aleatórias independentes está mais “próxima” de uma distribui¸cão gaussiana do que qualquer uma das variáveis originais [66] (vide figura 3.1).

Mistura Instantânea -5 -4 -3 -2 -1 0 1 2 3 4 5 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 -5 -4 -3 -2 -1 0 1 2 3 4 5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 -5 -4 -3 -2 -1 0 1 2 3 4 5 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 -5 -4 -3 -2 -1 0 1 2 3 4 5 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

Figura 3.1: Exemplo de mistura de duas fontes independentes, uma com distribui¸cão uniforme, e outra com distribui¸cão laplaciana. Nota-se que as observa¸cões possuem perfil mais próximo ao de uma variável aleatória gaussiana do que as variáveis originais.

Tomemos o modelo dado por (2.3), onde as observa¸cões são o resultado de uma mistura linear instantânea. Digamos que estejamos interessados em recuperar apenas uma das fontes e, para isso, utilizaremos um vetor de separa¸cão w1:

y1 = wT1x = qTs = N X i=1 qisi , (3.12) onde q = wT

1A representa o efeito conjunto da mistura e do sistema separador. Note

s. Assim, para que se tenha uma estimativa do sinal original, basta que q seja um vetor com apenas um elemento n˜ao nulo.

Como a estimativa y1 = qT1s ´e uma soma ponderada dos sinais das fontes, podemos

dizer que a sua distribui¸cão será mais próxima à de uma variável gaussiana do que aquela de um dos sinais si. Portanto, pensando de forma inversa, y1 será o menos

gaussiana poss´ıvel quando sua distribui¸cão for igual à de qualquer uma das fontes si, ou seja, quando q possuir apenas um elemento não nulo. Dessa forma, obter o

vetor w1 que maximize a n˜ao-gaussianidade de wT1x configura-se como uma poss´ıvel

estrat´egia para recupera¸c˜ao da fonte.

A forma clássica de se averiguar se uma variável possui distribui¸cão gaussiana é através de sua curtose [109], definida, de acordo com a nota¸cão em (3.9), como:

K (x) = cum(x, x, x, x) = Ex4_{− 3 E x}2 2

. (3.13)

Para uma ampla gama de distribui¸cões a curtose apresenta valores diferentes de zero, sendo a distribui¸cão gaussiana uma das poucas exce¸cões. De fato, é usual classificar as distribui¸cões com rela¸cão aos valores de suas curtoses: caso K (x) > 0, diz-se que x possui distribui¸cão super-gaussiana; caso K (x) < 0 diz-se que x possui distribui¸cão sub-gaussiana. Portanto, um critério para se maximizar a não-gaussianidade do sinal estimado seria

max

w |K (yi)| , (3.14)

tendo como principal atrativo sua simplicidade. Sua estima¸c˜ao, a partir de um conjunto de dados, pode ser feita atrav´es de uma

Uma outra op¸cão de medida de não-gaussianidade, mais robusta no que diz re- speito a outliers, é a Negentropia. Lembrando que uma variável aleatória com distribui¸cão gaussiana possui a maior entropia dentre as demais distribui¸cões com mesma variância [109], define-se a negentropia:

Defini¸cão 3.1.5 (Negentropia). A negentropia de uma variável aleatória (ou equivalentemente, um vetor de v.a.’s) corresponde a

JN egentropia(y) = H (ygauss) − H (y) , (3.15)

onde ygauss representa uma variável aleatória com distribui¸cão gaussiana e

Uma vez que a entropia de uma variável aleatória é máxima para a distribui¸cão gaussiana, a negentropia sempre assumirá valores maiores ou iguais a zero, ocorrendo a igualdade somente quando y possuir distribui¸cão normal. Dessa forma a negentropia fornece uma idéia da distância entre a distribui¸cão de y e a variável gaussiana. O conceito pode ser estendido diretamente para um vetor y de variáveis aleatórias, sendo JN egentropia(y) = H (ygauss) − H (y), onde ygauss representa um vetor aleatório

com distribui¸cão gaussiana e matriz de covariância igual à de y.

Extra¸c˜ao cega de fontes

Diferentemente das estratégias anteriores, a abordagem de maximiza¸cão da não- gaussianidade, por se basear em uma medida que depende somente de um dos sinais estimados, pode ser utilizada para estima¸cão individual das componentes independentes. As técnicas que se baseiam nesta idéia são comumente associadas ao problema de Extra¸cão Cega de Fontes [89, 39], muito semelhante ao problema de BSS.

No problema de extra¸cão de fontes o objetivo não é obter todos os sinais das fontes, e sim conseguir extrair da mistura apenas os sinais de interesse, mas ainda considerando que estes são independentes dos demais sinais presentes na mistura. Se o número de sinais extra´ıdos for igual ao número total de fontes presentes veremos que os dois problemas são equivalentes.

O procedimento para extra¸cão de mais de uma fonte pode ser efetuado utilizando-se pelo menos duas estratégias distintas, porém ambas explorando a idéia de que os vetores wi, obtidos a partir de dados branqueados, serão necessariamente ortogonais:

1. Estima¸cão serial: Nesta abordagem as componentes são estimadas seqüen- cialmente. Inicia-se estimando, sem restri¸cão, a primeira componente indepen- dente, e com isso obtém-se um vetor w1 (que deve ter norma unitária). A partir

da segunda componente, a adapta¸c˜ao dos vetores wi deve ser feita sempre rea-

lizando um passo intermediário de ortonormaliza¸cão do vetor sendo ajustado em rela¸cão aos demais já obtidos, o que pode ser feito com o método de Gram- Schmidt [57]. Esta abordagem também é conhecida como separa¸cão de fontes por defla¸cão (do inglês Deflation approach).

2. Estima¸cão paralela: Neste caso um certo número de fontes será estimado ao mesmo tempo, adaptando-se paralelamente os vetore wi. No entanto, a cada

passo executado, é necessário garantir que as solu¸cões encontradas são ortonor- mais entre si, o que também pode ser efetuado com o método de Gram-Schmidt.

No entanto, é poss´ıvel utilizar uma técnica de ortogonaliza¸cão simétrica [66], dada por

W ← ˜W ˜WT1/2W,˜ (3.16) onde ˜W representa uma matriz composta pelos vetores wi.

No documento Proposta de metodos de separação cega de fontes para misturas convolutivas e não-lineares (páginas 34-37)