• Nenhum resultado encontrado

Uma função é denominada contraste não simétrico se não for invariante à permutação, mas satisfizer as demais condições de contraste da Definição 7.2 C

O conceito de contraste não simétrico é mais abrangente que o conceito de contraste usual da Definição 7.2. Os contrastes não simétricos podem ser úteis, por exemplo, em problemas de separação em que alguma informação a priori sobre a distribuição das fontes possa ser considerada no modelo de mistura (CARDOSO, 2000). Dispondo-se dessa informação adicional, o contraste não simétrico pode ser utilizado para traduzir a necessidade de não apenas recuperar uma cópia do vetor de fontes, mas também de recuperar as fontes na ordem correta. Em consequência, por não satisfazerem a condição de invariância à permutação, contrastes não simétricos não necessariamente assumem valor mínimo quando tomados sobre permutações do vetor de fontes (eventualmente, com mudanças de escala). Entretanto, de acordo com as condições (iii) e (iv) da Definição 7.2, qualquer mínimo que um contraste não simétrico venha a ter ocorre necessariamente quando ele é tomado sobre uma cópia do vetor de fontes. Em síntese, o contraste não simétrico assume valor mínimo apenas sobre cópias do vetor de fontes, mas não necessariamente sobre todas as cópias possíveis.

7.1. Definições de contrastes baseados em independência 153

7.1.4 Exemplos simples de contrastes

A fim de ilustrar e interpretar o comportamento qualitativo de algumas funções contraste aplicadas a um problema simplificado de separação de fontes, apresenta-se o seguinte exemplo inspirado em Cardoso (1998).

Exemplo 7.1. Seja o problema de separação de fontes com pré-processamento considerado na Figura 10-(b) particularizado para N = 2. A partir da Equação (6.18), recorda-se que as fontes estimadas y são relacionadas às fontes independentes e normalizadas s, de médiae

nula, segundo

y =Mgs,e (7.6)

em que define-se a matriz de resposta combinada como

g

M =gW U (7.7)

sendo W a matriz ortogonal de separação e U a matriz ortogonal de mistura. Por ser umg

produto de matrizes ortogonais, a matriz M também é ortogonal (HORN; JOHNSON,g

2013). Considera-se que a matriz de separação gW é variada, para U mantida constante,

de modo que globalmente tem-se

g M (θ) =  cos θ − sen θ sen θ cos θ  

para θ ∈ [0, π]. Neste exemplo, deseja-se verificar o comportamento de algumas funções candidatas a contrastes ortogonais em função do ângulo θ com que as fontes são recuperadas rotacionadas. Em todos os casos abordados a seguir, são consideradas as mesmas quatro funções candidatas a contrastes ortogonais φo

1, φ o 2, φ o 3 e φ o

4 para três diferentes distribuições conjuntas das fontes independentes s consideradas a seguir.

 Ambas as fontes com distribuição arco seno. Na Figura 20-(a), todas as funções candidatas possuem mínimos em θ = 0, π/2 e π. Esses ângulos correspondem a todas as situações, com θ ∈ [0, π], em que y é uma cópia de s — como se nota a partir dos diagramas de dispersão de y das Figuras 20-(b), (d) e (f). Sendo assim,

todas as funções candidatas são contrastes ortogonais nessa situação. Além disso, o comportamento de diferentes contrastes em torno dos pontos de mínimo é diferente — alguns possuem variações mais bruscas, enquanto outros possuem variações mais suaves. Finalmente, as direções de pior separação ou maior dependência entre y1 e

y2 se dão para os valores máximos dos contrastes, que ocorrem para ângulos θ = π/4 e 3π/4, cujos diagramas de dispersão podem ser observados respectivamente nas Figuras 20-(c) e (e).

 Uma fonte com distribuição arco seno e a outra fonte gaussiana. Novamente, conforme a Figura 21-(a), as funções φo

1, φ o 2 e φ

o

0 0,25 0,5 0,75 1 −4 −2 0 2 4 θ/π (a) φo1 φo2 φo3 φo4 (b) θ = 0 (c) θ = π/4 (d) θ = π/2 (e) θ = 3π/4 (f) θ = π

Figura 20 – Duas fontes independentes, ambas com distribuição arco seno: (a) Curvas dos contrastes φo

1, φo2, φo3e φo4, (b)–(f) diagramas de dispersão de y para diferentes ângulos de rotação e 1000

realizações independentes.

Fonte: autoria própria.

caso, pois possuem mínimos se, e somente se, for recuperada uma cópia das fontes. Entretanto, a função φo

4 possui mínimos para θ = 0 e π, mas não para θ = π/2. De acordo com as Figuras 21-(b), (d) e (f), as fontes recuperadas para θ = 0 e π possuem ordem distinta daquelas recuperadas para θ = π/2. Logo, a invariância à permutação não vale para φo

4 e não se trata de um contraste ortogonal segundo a Definição 7.3. No entanto, conforme a Definição 7.4, φo

4 é um contraste ortogonal não simétrico. Nesse caso, é considerada em φo

4 alguma informação hipotética sobre a distribuição de s que restringe a recuperação de fontes distintas apenas em uma

ordem específica. Em outras palavras, além de considerar a independência dos elementos dey, esse contraste também leva em conta o “casamento da distribuição”1 de y com a distribuição hipotética de s. No caso prévio da Figura 20, o contraste φo 4 não possui mínimos apenas quando ocorre separação em uma ordem particular pois, mesmo sendo não simétrico, não consegue distinguir as fontes distintas já que ambas possuem a mesma distribuição.

 Duas fontes conjuntamente gaussianas. Conforme a Figura 22-(a), nenhuma das funções candidatas é um contraste ortogonal válido nesse caso, visto que todos são constantes em função de θ. Isso ocorre pois, independentemente do ângulo de rotação, y1 e y2 são sempre independentes — como é possível notar a partir da simetria dos diagramas de dispersão dos casos particulares das Figuras 22-(b)–(f). Trata-se de um caso em que as condições de separabilidade do Teorema 5.4 não são satisfeitas: a recuperação de independência à saída do sistema separador não é suficiente para separar fontes conjuntamente gaussianas. Logo, a minimização das

1 O termo “casamento da distribuição” (do inglês distribution matching) refere-se a algum tipo de

7.1. Definições de contrastes baseados em independência 155 0 0,25 0,5 0,75 1 −4 −2 0 2 4 θ/π (a) φo1 φo2 φo3 φo4 (b) θ = 0 (c) θ = π/4 (d) θ = π/2 (e) θ = 3π/4 (f) θ = π

Figura 21 – Duas fontes independentes, uma com distribuição arco seno e a outra com distribuição gaussiana: (a) Curvas dos contrastes φo

1, φo2, φo3 e φo4, (b)–(f) diagramas de dispersão de y

para diferentes ângulos de rotação e 1000 realizações independentes. Fonte: autoria própria.

0 0,25 0,5 0,75 1 −1 0 1 2 3 θ/π (a) φo1 φo2 φo3 φo4 (b) θ = 0 (c) θ = π/4 (d) θ = π/2 (e) θ = 3π/4 (f) θ = π

Figura 22 – Duas fontes independentes e conjuntamente gaussianas: (a) Curvas dos contrastes φo

1, φo2, φo3e φo4, (b)–(f) diagramas de dispersão de y para diferentes ângulos de rotação e 1000 realizações

independentes.

Fonte: autoria própria.

funções indicadoras de independência φo 1, φ o 2, φ o 3 e φ o

4 não implica a recuperação de

uma cópia das fontes. C

No Exemplo 7.1, a fim de discutir apenas algumas propriedades de contrastes, não foram apresentadas as expressões das quatro funções candidatas abordadas. Trata-se, porém, de contrastes bem conhecidos na literatura de separação de fontes e que são abordados nas seções seguintes. A saber, os contrastes φo

1, φo2, φo3 e φo4 correspondem aos seguintes contrastes aproximados, respectivamente: máxima informação mútua, JADE, máxima negentropia e máxima verossimilhança (CARDOSO, 1999). A seguir, são apresentadas inicialmente as expressões de contrastes entrópicos — a partir das quais versões baseadas

em cumulantes, como aquelas consideradas no Exemplo 7.1, são obtidas nas Seções 7.3 e 7.4.

7.2 Contrastes entrópicos

Nesta seção, apresentam-se os principais contrastes para separação por imposição de independência que dependem explicitamente da distribuição de probabilidade do vetor aleatório de fontes estimadas y. Esses contrastes são denominados entrópicos (CARDOSO,

1998) e são especialmente úteis para interpretar e comparar princípios de separação de maneira quantitativa. À luz dos quantificadores de independência tratados no Capítulo 2 e das condições de separabilidade das fontes abordadas no Capítulo 5, evidenciam-se e interpretam-se, a seguir, os princípios fundamentais em que se baseiam os contrastes entrópicos mais conhecidos na literatura.

Inicia-se pelo contraste de máxima verossimilhança na Subseção 7.2.1. Em seguida, abordam-se os contrastes de maximização de entropia diferencial e máxima informação mútua, respectivamente, nas Subseções 7.2.2 e 7.2.3. Na Subseção 7.2.4, apresentam- se os contrastes de máxima negentropia e mínima entropia marginal. Finalmente, na Subseção 7.2.5 apresenta-se um resumo com as principais relações entre os contrastes abordados nesta seção.

7.2.1 Máxima verossimilhança

Considera-se o problema de separação mostrado na Figura 7. Na Figura 23, são mostrados dois modelos estatísticos para as mesmas T observaçõesx(0),x(1), . . . ,x(T −1)

de sorteios independentes do vetor aleatório de misturas x. Na Figura 23-(a), tem-se o

modelo de mistura exato composto por fontes com função densidade de probabilidade verdadeira fs e matriz de mistura verdadeiraH. Na Figura 23-(b), é mostrado o modelo de

mistura hipotético do problema cego, em que as grandezas verdadeiras são desconhecidas. Esse modelo depende da função densidade de probabilidade f˘s das fontes hipotéticas2 ˘s

e da matriz de mistura hipotética ˘H ∈ RN ×N. Consequentemente, tem-se uma função

densidade de probabilidade hipotética px para o vetor aleatório de misturas x, cuja

densidade verdadeira é dada por fx.

Com base nos trabalhos de Kay (1993), Cardoso (1997), Cardoso (2000), define-se a função de verossimilhança para o contexto de separação aqui considerado.

2 Nesta seção, tendo-se em vista o problema de análise de componentes independentes esquematizado

na Figura 7, considera-se que as fontes hipotéticas são mutuamente independentes. No entanto, é importante destacar que a abordagem de máxima verossimilhança é mais geral e pode ser feita sem considerar essa hipótese. Além disso, ela também pode ser aplicada a problemas de separação envolvendo outros tipos de modelos de mistura (COMON; JUTTEN, 2010).

7.2. Contrastes entrópicos 157 Misturas observadas: x(0), x(1), . . . , x(T −1) fx(x) Fontes independentes: s fs(s) Misturas observadas: x(0), x(1), . . . , x(T −1) px(x; ˘H, f˘s) Fontes independentes: ˘s f˘s(˘s) Sistema misturador H N N (a) Sistema misturador ˘ H N N (b)

Figura 23 – Esquemas simplificados de (a) modelo exato de mistura e (b) modelo hipotético de mistura. Fonte: autoria própria.

Definição 7.5. Seja o modelo de mistura hipotético mostrado na Figura 23-(b) para T