• Nenhum resultado encontrado

Espaço de probabilidade conjunta para dados circulares

3.4 Critério de Máxima Correntropia Circular

3.4.3 Espaço de probabilidade conjunta para dados circulares

Conforme mencionado anteriormente, a correntropia mede a similaridade entre duas variáveis aleatórias pois estima a probabilidade de serem iguais entre si. Esta métrica pode ser bem ilustrada traçando a densidade de probabilidade conjunta ˆfΘΦ(θ,φ). Quando duas variáveis são semelhantes entre si, os valores mais altos de ˆfΘΦ(θ,φ)estão concentrados na regiãoΘ=Φ. Como mencionado anteriormente, tanto a CC como a correntropia con-vencional calculam a integral da densidade sobre esta região. Por outro lado, para duas variáveis aleatórias com baixa similaridade, os picos ou altos valores de ˆfΘΦ(θ,φ)estão distribuídos fora da região Θ=Φ. No caso específico da CC, a topologia espacial não é mais um plano. TantoΘ quanto Φ estão restritos ao intervalo [0,2π), e, além disso, valores iguais a 0 são considerados vizinhos de valores iguais a 2π, enquanto o espaço de-finido porΘ×Φé um toroide. Neste contexto,Θ=Φagora define uma região no toroide que corresponde a um anel interno. Assim, a CC agora estima a integral de ˆfΘΦ(θ,φ) ao longo desse anel. Para ilustrar esse comportamento, consideremos a relação entreΘe ΦcomoΦ=aΘ+ N (0,0.05). As Figuras 3.3 e 3.4 mostram o espaço de probabilidade conjunta para duas variáveis aleatórias em termos das representações planar e toroidal.

As Figuras 3.3a e 3.3b correspondem a duas variáveis aleatórias altamente semelhantes, poisa=1. Já as Figuras 3.4a e 3.4b correspondem aa=2, ou seja, as variáveis possuem baixo grau de similaridade. As linhas em ciano claro representam a superfícieΘ=Φ. Os gráficos apresentados nas Figuras 3.3a e 3.3b denotam que os dados estão distribuídos ao longo da linha, evidenciando um alto grau de similaridade. Já nos gráficos apresentados nas Figuras 3.4a e 3.4b os dados não estão posicionados ao longo da linha,

correspon-CAPÍTULO 3. CORRENTROPIA CIRCULAR 33 dendo assim a um baixo grau de similaridade, ou seja, a integral de ˆfΘΦ(θ,φ) tem um valor baixo.

(a)

(b)

Figura 3.3: Espaço de probabilidade conjunta para duas variáveis definidas como Θ e Φ=aΘ+N(0,0,05), para a=1. A representação é mostrada no plano e no toroide, respectivamente.

CAPÍTULO 3. CORRENTROPIA CIRCULAR 34

(a)

(b)

Figura 3.4: Espaço de probabilidade conjunta para duas variáveis definidas como Θ e Φ=aΘ+N(0,0,05), para a=2. A representação é mostrada no plano e no toroide, respectivamente.

Capítulo 4 Aplicações

Este capítulo tem como objetivo demonstrar a aplicação da CC a duas abordagens distintas. inicialmente é apresentada uma breve interpretação do conceito de CC envol-vendo dados reais sobre medições de direção de vento. Em seguida, alguns resultados sobre identificação de sistemas e predições de séries temporais são discutidos a fim de avaliar a influência do tamanho dokernel, validar a generalização da métrica proposta ex-perimentalmente e verificar a sua robustez a presença deoutliers, sempre estabelecendo comparações justas com os resultados fornecidos por estatísticas de segunda ordem.

Para analisar o comportamento do método introduzido neste trabalho em um ambiente contaminado por ruído impulsivo, foram utilizados os dados de direção do vento medidos na cidade de Porto Alegre, Brasil, em 2016, os quais estão disponíveis em [Inmet 2020].

Os dados são representados por uma variável aleatória circularΘ, sendoθ1. . .θn∈ [0, 2π). Para investigar a robustez dos métodos avaliados, as amostras foram contaminados com 40% deoutliersna direçãoπ/4, enquanto o novo conjunto de amostras foi definido como pertencente à variável aleatóriaΦ. O desempenho da nova métrica foi então com-parado com o da estatística de segunda ordem. O espaço de probabilidade conjunta foi plotado ao longo de um toroide seguindo a mesma metodologia empregada nas Figuras 3.3b e 3.4b. Os valores deΘforam distribuídos ao longo da geratriz do arco circular do toroide, enquanto as amostras deΦforam distribuídas ao longo da circunferência no eixo central.

A Figura 4.1a compreende a análise usando estatística de segunda ordem. Nesse caso, os valores de probabilidade são fortemente influenciados pela presença deoutliers, uma vez que a densidade de probabilidade emφ=π/4 tem intensidade significativamente maior do que aqueles ao longo da linhaΘ=Φ. Por outro lado, a Figura 4.1b considera o mesmo cenário analisando através da CC comσ=50. Observa-se que a função de probabilidade não está concentrada em torno da região contendooutliers, mas distribuída ao longo da li-nhaΘ=Φ. Portanto, é razoável afirmar que a CC é mais robusta aoutliersque a estatística de segunda ordem.

35

CAPÍTULO 4. APLICAÇÕES 36

(a)

(b)

Figura 4.1: Espaço de probabilidade conjunta paraθeΦ. (a) estatística de segunda ordem (b) CC paraσ=50.

4.1 Aplicação de regressão para dados circulares

Para avaliar a aplicabilidade da CC, consideremos o exemplo de regressão usando diferentes valores dekernel. O objetivo é ajustar o seguinte modelo:

Θ=w¯2Φ2+w¯1Φ+w¯0+η. (4.1) As observações das variáveisΘ eΦ são definidas porθi e φi, onde i=1, ...,N e ¯w0,

¯

w1 e ¯w2 são os parâmetros conhecidos do modelo e η é um sinal de ruído aditivo não

CAPÍTULO 4. APLICAÇÕES 37 gaussiano. Portanto, este procedimento visa determinar os valores de w0, w1 e w2 para os quais o modelo estimado ˆΘ=w2Φ2+w1Φ+w0 é o mais próximo possível deΘ. Para atingir este objetivo utilizando a abordagem com CC, é necessário maximizar esta medida estatística entre a estimativa ˆΘe as observações do modeloΘ.

Devido à natureza oscilatória desta função de custo, espera-se que ela contenha máxi-mos locais. Portanto, é necessária uma pequena melhoria associada à regra do gradiente.

Em particular, a regra do gradiente com termo de momento é usada neste trabalho para este propósito [Qian 1999]. Basicamente, a função de custo é usada como a gravidade, enquanto um coeficiente de atrito, uma massa e um intervalo de tempo de integração são adotados. Agora, é possível escrever a regra de atualização para os parâmetroswj como:

vj+1=vj+µm∇JMCCC−βvj ,

wj+1=wj+µvj+1, (4.2)

na qual vj e wj são os parâmetros velocidade e posição, respectivamente; ∇JMCCC é a derivada da função cuso em relação awj;m,β, eµsão a massa, o coeficiente de dricção e o intervalo de integração, respectivamente.

Os resultados da simulação são apresentados para validar a análise teórica e demons-trar o desempenho da medida proposta. Todos os resultados são calculados a partir da média de 103 testes de Monte Carlo. O desempenho é avaliado pela relação sinal-ruído ponderada (WSNR), que é usada para quantificar a taxa de convergência adequadamente em decibéis [Singh e Principe 2010], conforme definido por

W SNRdb=10 log10( w¯T

(w¯ −w)T(w¯ −w)), (4.3) na qualw são os vetores de parâmetros calculados pelos métodos mencionados e ¯w são os parâmetros conhecidos usados nos testes.

O sinal desejado é formado pelo produto dos pesos próprios ¯we os valores das variá-veis aleatórias de entrada conforme definido na equação (4.1). Em seguida, é adicionado um sinal de ruído impulsivo, cuja função densidade de probabilidade é caracterizada por 0.9N (0; 0,1) +0.1N (2; 0,5).

Existem tamanhos apropriados de m, βeσpara cada sistema. Dessa forma, para se obter os melhores ajustes dos parâmetros e, por consequência, um melhor desempenho para a CC, foi realizada uma análise variando m entre 0 e 1; β entre 0 e 0,6 e usando três tamanhos distintos dekernel. Para cada combinação de parâmetros, foi calculado o WSNR resultante a fim de determinar o melhor ajuste. As Figs. 4.2 a 4.5 mostram o de-sempenho de MSE e da CC com tamanhos dekernelde 0,8; 1,5 e 2. Todas as simulações foram realizadas considerando os seguintes parâmetros: µ=0,02, ¯w= {0,3;−1; 1,5}, e w= {0; 0; 0}.

CAPÍTULO 4. APLICAÇÕES 38 A tabela 4.1 apresenta os melhores resultados obtidos nos testes.

Tabela 4.1: Coeficientes de massa eβusados nas simulações para cada algoritmo avali-ado.

método m β

CCσ=0,8 0,231 1×10−3 CCσ=1,5 0,9326 0,0825 CCσ=2 0,7055 0,1565 MSE 0,2154 1×10−3

Figura 4.2: WSNR como função dos coeficientesmeβpara o algoritmo MSE.

CAPÍTULO 4. APLICAÇÕES 39

Figura 4.3: WSNR como função dos coeficientes me β para correntropia circular com largura dekernelσ=0,8.

Figura 4.4: WSNR como função dos coeficientes me β para correntropia circular com largura dekernelσ=1,5.

CAPÍTULO 4. APLICAÇÕES 40

Figura 4.5: WSNR como função dos coeficientes me β para correntropia circular com largura dekernelσ=2.

Para avaliar a medida proposta, o problema de regressão foi considerado usando os valores dem,βeklistados na Tabela 4.1.

As figuras 4.6 e 4.7 comparam o desempenho do WSNR para MSE e CC usando va-lores diferentes de tamanho do kernel no problema de regressão. Neste experimento, é possível analisar o comportamento da CC. Observa-se que a medida proposta tem de-sempenho significativamente melhor que o MSE, ao mesmo tempo em que generaliza estatísticas de segunda ordem para pequenos valores deσ.

CAPÍTULO 4. APLICAÇÕES 41

0 1 2 3

Iterações 104

-50 0 50 100 150 200 250 300

Figura 4.6: Comparação de desempenho de correntropia para diferentes tamanhos de kernele MSE em termos de WSNR.

0 0.5 1 1.5 2 2.5 3

Iterações 104

0 2 4 6 8 10 12

Desvio padrão para WSNR

Figura 4.7: Desvio padrão para o WSNR na Figura 4.6.

Os resultados demonstram que a CC apresenta uma melhora significativa em termos de WSNR quando comparado com o MSE quando σ=1 e σ=1,3. Isso se deve aos momentos de altas ordens que minimizam os efeitos do ruído impulsivo. Em particular, a CC tende para as estatísticas de segunda ordem para tamanhos de kernel pequenos, conforme mencionado anteriormente na Seção 3.4.1.

CAPÍTULO 4. APLICAÇÕES 42

Documentos relacionados