• Nenhum resultado encontrado

Aquisição de frequência em sinais de satélites de baixa órbita por meio do critério da máxima correntropia

N/A
N/A
Protected

Academic year: 2021

Share "Aquisição de frequência em sinais de satélites de baixa órbita por meio do critério da máxima correntropia"

Copied!
71
0
0

Texto

(1)UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE. U NIVERSIDADE F EDERAL DO R IO G RANDE DO N ORTE C ENTRO DE T ECNOLOGIA P ROGRAMA DE P ÓS -G RADUAÇÃO EM E NGENHARIA E LÉTRICA E DE C OMPUTAÇÃO. Aquisição de frequência em sinais de satélites de baixa órbita por meio do critério da máxima correntropia. Hugo Rafael Gonçalves Cavalcante. Orientador: Prof. Dr. Luiz Felipe de Queiroz Silveira Co-orientador: Prof. Dr. Samuel Xavier de Souza. Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Engenharia Elétrica e de Computação da UFRN (área de concentração: Engenharia de Computação) como parte dos requisitos para obtenção do título de Mestre em Ciências.. Número de ordem PPgEEC: M522 Natal, RN, 16 de fevereiro de 2018.

(2) Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Central Zila Mamede Cavalcante, Hugo Rafael Gonçalves. Aquisição de frequência em sinais de satélites de baixa órbita por meio do critério da máxima correntropia / Hugo Rafael Gonçalves Cavalcante. - 2018. 71f.: il. Dissertação (Mestrado) - Universidade Federal do Rio Grande do Norte, Centro de Tecnologia, Programa de Pós Graduação em Engenharia Elétrica e de Computação, Natal, 2018. Orientador: Dr. Luiz Felipe de Queiroz Silveira. Coorientador: Dr. Samuel Xavier de Souza. 1. Comunicações espaciais - Dissertação. 2. Estimação de frequência - Dissertação. 3. Correntropia - Dissertação. I. Silveira, Luiz Felipe de Queiroz. II. Souza, Samuel Xavier de. III. Título. RN/UF/BCZM. CDU 621.391. Elaborado por Raimundo Muniz de Oliveira - CRB-15/429.

(3) Aquisição de frequência em sinais de satélites de baixa órbita por meio do critério da máxima correntropia. Hugo Rafael Gonçalves Cavalcante. Dissertação de Mestrado aprovada em 16 de fevereiro de 2018 pela banca examinadora composta pelos seguintes membros:.

(4) Ao meu amor, Débora Melo, por todo suporte e companheirismo na realização deste trabalho..

(5) Agradecimentos. Ao meu orientador e ao meu co-orientador, Prof. Dr. Luiz Felipe e Prof. Dr. Samuel Xavier, sou grato pela orientação, paciência e todos os ensinamentos absorvidos. Ao Prof. Dr. Aluisio Fontes, por todo suporte acadêmico e motivação. Ao Pesq. Dr. José Marcelo, pela oportunidade de pesquisa que fomentou o inicio de todo o trabalho desenvolvido. A todos os colegas de pós-graduação, em especial os que se fazem presente no LAPPS, por tornar esse trabalho mais fácil. À minha família pelo apoio durante esta jornada. À CAPES, pelo apoio financeiro..

(6) Resumo. Satélites de baixa órbita (LEO) se deslocam a altíssimas velocidades e são capazes de circunscrever o planeta por diversas vezes em um mesmo dia. Esse ambiente muito dinâmico induz valores consideráveis de deslocamento Doppler e aceleração Doppler nos sinais de comunicações espaciais, o que é conhecido como deslocamento Doppler dinâmico. Estabelecer comunicação com esses sistemas é um processo de múltiplas tarefas e, devido ao deslocamento Doppler dinâmico, uma das mais críticas é a aquisição fina da frequência da portadora. Diversos trabalhos já investigaram técnicas de estimação de frequência de sinais de satélite considerando ambientes de comunicação caracterizados pelo ruído aditivo Gaussiano branco (AWGN). Entretanto, os efeitos do ruído impulsivo também devem ser considerados em uma caracterização mais fiel do cenário de comunicação dos satélite LEO. Este trabalho introduz um novo método de aquisição de frequência para satélites de baixa órbita baseado no cálculo de similaridade obtido com o critério de máxima correntropia. A correntropia se mostra muito eficiente no processamento de sinais com ruído não-gaussiano, especialmente em ambientes de ruído impulsivo. Foi investigada a robustez da técnica proposta neste trabalho em um ambiente de comunicação caracterizado pelo ruído impulsivo, e seu desempenho foi comparado com o obtido por abordagens clássicas, baseadas no critério de erro médio quadrado. O método de aquisição fina da frequência da portadora de satélites LEO proposto neste trabalho pode ser usado no desenvolvimento de um decodificador completo para sinais do Sistema Brasileiro de Coleta de Dados Ambientais (SBCD ou SBCDA) e o sistema Franco-Americano de coleta de dados ambientais (ARGOS). Palavras-chave: Comunicações espaciais, Estimação de frequência, Correntropia..

(7) Abstract. Low-earth orbit (LEO) satellites move at very high speeds and can circumscribe the planet several times in a single day. These high dynamics environments induce considerable Doppler shift and Doppler rate values in spatial communications signals, which is known as dynamic Doppler shift. Establishing communication with these systems is a multi-task process and, due to the dynamic Doppler shift, a critical task is the fine acquisition of the carrier frequency. Several studies have investigated frequency estimation techniques of satellite signals, considering communication environments characterized by additive white Gaussian noise (AWGN). However, the effects of impulsive noise should also be considered in a more accurate characterization of the LEO satellite communication scenario. This work introduces a new method of frequency acquisition for low-orbit satellites based on similarity calculus by maximum correntropy criterion. Due to some of its properties, correntropy is very efficient in the processing of non-Gaussian signals, especially in impulsive noise environments. It was investigated the robustness of the technique proposed in this work on a communication environment characterized by impulsive noise, and compare its performance with that obtained by a classical approach, based on the correlation coefficient. The carrier frequency acquisition method for LEO satellites proposed in this work can be used in the development of a decoder for signals from the Brazilian Environmental Data Collection System (SBCD or SBCDA) and Franco-American Environmental Data Collection System (ARGOS). Keywords: Aerospace communications, Frequency estimation, Correntropy..

(8) Sumário. Sumário. i. Lista de Figuras. iii. Lista de Tabelas. v. Lista de Símbolos. vi. Lista de Abreviaturas e Siglas. x. 1. . . . .. 1 1 2 5 6. . . . . . . .. 7 7 8 8 11 15 15 17. . . . . .. 19 19 21 22 23 24. 2. 3. Introdução 1.1 Contextualização . . . 1.2 Trabalhos relacionados 1.3 Proposta da dissertação 1.4 Organização do texto .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. Estimação de frequência em sinais de satélite 2.1 Sistemas de comunicação . . . . . . . . . . . . 2.2 Canal de comunicação por satélite . . . . . . . 2.2.1 Efeito Doppler . . . . . . . . . . . . . 2.2.2 Presença de ruído impulsivo ou outlier 2.3 Métodos clássicos . . . . . . . . . . . . . . . . 2.3.1 Estimação por Least Mean Squares . . 2.3.2 Estimação por Recursive Least Squares Correntropia 3.1 Conceito . . . . . . . . . . . . . . . . 3.2 Critério de máxima correntropia . . . 3.2.1 MCC por gradiente ascendente 3.2.2 MCC por ponto fixo . . . . . 3.3 Considerações . . . . . . . . . . . . . i. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . .. . . . .. . . . . . . .. . . . . ..

(9) 4. Arquitetura proposta 4.1 Modelagem do sinal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Estimação por correntropia . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Arquitetura do estimador . . . . . . . . . . . . . . . . . . . . . . . . . .. 25 27 31 33. 5. Experimentos e resultados 5.1 Apresentação dos resultados . . . . . . . . . . . 5.2 Avaliação da correntropia em função do kernel σ 5.3 Custo computacional . . . . . . . . . . . . . . . 5.4 Considerações . . . . . . . . . . . . . . . . . . .. . . . .. 37 37 44 46 46. Conclusão 6.1 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 47 47. 6. Referências bibliográficas. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. 49.

(10) Lista de Figuras. 2.1 2.2. 4.1 4.2 4.3 4.4 4.5. 4.6 5.1 5.2. 5.3 5.4 5.5. Órbita geométrica para satélites LEO com altitude h e inclinação i. [Fonte: Aboutanios (2002)] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Funções densidade de probabilidade da distribuição normal (σ2 = 1 e µ = 0) e de alguns distribuições α-estáveis simétricas de média nula (β = 0, √ λ = 2/2 e λ = 0). [Fonte: autoral] . . . . . . . . . . . . . . . . . . . . Arquitetura sugestiva para demodulação de múltiplos sinais de satélite, da entrada ao bloco de estimação fina de frequência. [Fonte: autoral] . . . . Efeito Doppler simulado durante janela de passagem do satélite do SBCD CBERS sobre PCD. [Fonte: autoral] . . . . . . . . . . . . . . . . . . . . Busca em vizinhança por máximo coeficiente de correntropia (GSNR = 30dB, α = 0.8 e kernel σ = 10−2 ). [Fonte: autoral] . . . . . . . . . . . . Busca em vizinhança por máximo coeficiente de correlação. [Fonte: autoral] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modelo de blocos do processo de estimação fina de frequências Doppler adotando o critério de maximização da correntropia (MCC). [Fonte: autoral] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ilustração do tratamento de fase (sem ruído). [Fonte: autoral] . . . . . . Comparação de técnicas clássicas e MCC-FP (σ = 5) com 1000 repetições de Monte Carlo sobre um enlace ideal. [Fonte: autoral] . . . . . . . . . . Dispersão do MSE em técnicas clássicas e MCC-FP (GSNR = 20dB, α = 1.5, σ = 5) com 1000 repetições de Monte Carlo sobre um enlace ideal. [Fonte: autoral] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Comparação de técnicas clássicas e MCC-FP (GSNR = 20dB, α = 1.5, σ = 5) com 1000 repetições de Monte Carlo. [Fonte: autoral] . . . . . . Comparação de técnicas clássicas e MCC-FP (GSNR = 20dB, α = 1.5, σ = 5) com 1000 repetições de Monte Carlo. [Fonte: autoral] . . . . . . Dispersão do MSE em técnicas clássicas e MCC-FP (GSNR = 20dB, α = 1.5, σ = 5) com 1000 repetições de Monte Carlo. [Fonte: autoral] . . . . iii. 9. 13. 26 29 32 33. 34 35. 39. 39 40 41 42.

(11) 5.6. Exemplo de erro de estimação normatizado de técnicas clássicas e MCCFP (GSNR = 20dB, α = 1.5, σ = 5) para a fase inicial de −167◦ . [Fonte: autoral] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7 Exemplo de erro de estimação normatizado de técnicas clássicas e MCCFP (GSNR = 20dB, α = 1.5, σ = 5) para o deslocamento Doppler de −55 Hz. [Fonte: autoral] . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.8 Exemplo de erro de estimação normatizado de técnicas clássicas e MCCFP (GSNR = 20dB, α = 1.5, σ = 5) para a aceleração Doppler de −87 Hz/s. [Fonte: autoral] . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.9 Análise da largura do kernel gaussiano σ o WSNR da estimações por MCC-FP (GSNR = 20dB, α = 1.5). [Fonte: autoral] . . . . . . . . . . . 5.10 Análise da largura do kernel gaussiano σ sobre o MSE das estimações por MCC-FP (GSNR = 20dB, α = 1.5). [Fonte: autoral] . . . . . . . . . . .. 43. 43. 44 45 45.

(12) Lista de Tabelas. 4.1. Correspondência entre GSNR e Effective-SNR abordados nos experimentos (β = 0). [Fonte: autoral] . . . . . . . . . . . . . . . . . . . . . . . .. v. 30.

(13) Lista de Símbolos. A α αN arg(x[k]) β βN c C[i] Cg C[i] cos() d di ∆f ∆tk δ − → ∆θ ∆θ˜ EXY [] ei ηˆ ηn exp() f f fs fˆ. amplitude do sinal senoidal de portadora x[k]; expoente característico da distribuição α-estável; constante para estimação Doppler do sinal x[k] com N amostras pelo método de Su & Wu (2000); argumento de fase da k-ésima amostra do sinal x[k]; índice de simetria da distribuição α-estável; constante para estimação Doppler do sinal x[k] com N amostras pelo método de Su & Wu (2000); velocidade da luz; i-ésima amostra da função de autocorrelação do sinal x[k]; Constante de Euler = 1,781072(. . . ); i-ésima amostra da função normalizada de autocorrelação do sinal x[k]; função cosseno; vetor de valores desejados; i-ésima amostra do vetor d; variação de frequência original da portadora; período de tempo de t = 0 e o instante t = tk ; parâmetro de localização da distribuição α-estável; → − vetor com N − 1 variações angulares da N amostras de θ ; variação de fase estimada; função de esperança ou valor esperado; erro entre valores estimados e entrantes; coeficiente de correntropia; n-ésima média do processo estocástico de Xn ; função exponencial; frequência do sinal de portadora x[k]; frequência original da portadora; frequência de amostragem em amostras/s; frequência de portadora do sinal x[k] estimada; vi.

(14) Gσ () γ γ0 γN h i I[] j Jn k κσ () λ ln() log10 () M Mtrials Mx µ N O O(N 2 ) ω(t) ωF ˆD ω ˆ˙ D ω P P π ψ ψkay [k] Q r R() re. núcleo (kernel) da função de distribuição gaussiana; ângulo final entre plataforma de transmissão e posição inicial do satélite; ângulo inicial entre plataforma de transmissão e posição inicial do satélite; ângulo mínimo de visada; constante para estimação Doppler do sinal x[k] com N amostras pelo método de Su & Wu (2000); altitude da órbita do satélite LEO; índice amostral do sinal C[i]; componente em fase; notação complexa; função de custo gaussiana; índice amostral do sinal x[k]; núcleo (kernel) da função de distribuição genérica; parâmetro de dispersão ou escala da distribuição α-estável; função logarítimica natural; função logarítimica de base 10; quantidade de amostras computadas para o sinal C[i]; quantidade de tentativas simuladas; matriz característica na solução do método de regressão por mínimos quadrados; coeficiente de aprendizado ou esquecimento; quantidade de amostras computadas para o sinal x[k]; posição do centro do planeta; função de complexidade computacional de ordem quadrática N 2 ; deslocamento Doppler normalizado; velocidade angular de deslocamento do satélite LEO; deslocamento de frequência Doppler estimado; aceleração de frequência Doppler estimada; posição da plataforma de coleta e transmissão de dados; vetor de correlação cruzada entre o sinal desejado e de entrada; letra grega pi = 3; 141592(. . . ); variação angular da trajetória do satélite LEO em relação a posição da base; k-ésima amostra do vetor de valores da janela de pesos do método de Kay (1989); componente em quadratura; raio da órbita do satélite LEO em relação ao centro do planeta; matriz de autocorrelação do sinal de entrada; raio da terra; vii.

(15) S0 s(t) S00 σ σ2 σn sign() sin() T tan() θ θerr θ0 → − θ ˆ θ[k] ˜ θ[k]. posição final do percurso orbital do satélite LEO; distância entre base e satélite; percurso de transmissão; posição inicial do percurso orbital do satélite LEO; desvio padrão; variância da distribuição gaussiana; n-ésima variância do processo estocástico de Xn ; função sinal; retorna o sinal de um número real; função seno; período de tempo de uma amostra na frequência de amostragem fs ; função tangente; fase inicial do sinal de portadora x; erro de fase; valor estimado da fase inicial do sinal x[k];. U(X,Y ). vetor com argumentos de fase do sinal x[k]; k-ésima amostra do vetor estimado dos argumentos de fase de x[k]; argumento de fase da k-ésima amostra recepcionada no sistema (com ruído); correntropia cruzada centralizada entre as variáveis X e Y ;. u[k] ˆ U(X,Y ) V Vσ (X,Y ) VˆN,σ () W w[k] W∗ wk W Wk+1 Wk X x X[k, α] x[k] x∗ [k] Xα,n Xα. σ k-ésima amostra do processo de ruído AWGN com variância 2A 2; correntropia cruzada centralizada entre as variáveis X e Y para amostras finitos; variável aleatória com distribuição uniforme; função de correntropia entre as variáveis X e Y ; estimação da função de correntropia para amostras finitos; variável aleatória com distribuição exponencial; k-ésima amostra do processo de ruído AWGN com variância σ2 ; vetor de parâmetros ótimos (target) para o efeito Doppler; vetor de pesos em uma regressão por mínimos quadrados; vetor de parâmetros wk ; solução para regressão por mínimos quadrados; estimação futura dos parâmetros wk na regressão por ponto fixo; vetor de parâmetros estimados para o efeito Doppler na iteração k; variável aleatória real e escalar; variável genérica real e escalar; variável aleatória com distribuição impulsiva; k-ésima amostra do sinal x[k]; conjugado complexo da i-ésima amostra do sinal x[k]; n-ésima variável aleatória com distribuição α-estável; variável aleatória com distribuição α-estável;. 2. viii.

(16) Xi xi X Xi Y y yi z ∗ [k] z[k]. i-ésima variável aleatória gaussiana; variável genérica de amostras finitas; matriz caracterísitica de índices no método de regressão por mínimos quadrados; vetor de amostras temporais; variável aleatória real e escalar; vetor de valores de entrada; variável genérica de amostras finitas; conjugado complexo da k-ésima amostra do sinal z[k]; sinal de portadora imerso em ruído impulsivo;. ix.

(17) Lista de Abreviaturas e Siglas. ADC AFC ARGOS AWG AWGN BPSK CBERS EB FDP FFT FIR FP GSNR LEO LPF MCC MSE NCO OFDM PCD PDF PLL PPGEEC PSK QAM QPSK RF SBCD. Analog-to-Digital Converter Automatic Frequency Control Advanced Research and Global Observation Satellite Additive White Gaussian Additive White Gaussian Noise Binary Phase Shift Keying China-Brazil Earth-Resources Satellite Estação base Função de Densidade de Probabilidade Fast Fourier Transform Finite Impulse Response Fixed Point Generalized Signal-to-Noise Ratio Low-Earth Orbit Low Pass Filter Maximum Correntropy Criterion Mean Squared Error Numerically Controlled Oscillator Orthogonal Frequency-Division Multiplexing Plataforma de Coleta de Dados Probability Density Function Phase-Locked Loop Programa de Pós Graduação em Engenharia Elétrica e de Computação Phase Shift Keying Quadrature Amplitude Modulation Quadrature Phase Shift Keying Radiofrequência Sistema Brasileiro de Coleta de Dados. x.

(18) SBCDA UFRN UHF VCO WSNR. Sistema Brasileiro de Coleta de Dados Ambientais Universidade Federal do Rio Grande do Norte Ultra High Frequency Voltage Controlled Oscillator Weight Signal-to-Noise Ratio. xi.

(19) Capítulo 1 Introdução. 1.1. Contextualização. Satélites de baixa órbita terrestre (Low-Earth Orbit – LEO) têm ganhado cada vez mais destaque nos últimos anos pela popularização dos nanossatélites, os quais permitem resolver problemas específicos de maneira mais simples, e que em sua grande maioria são lançados em LEO devido ao menor custo de lançamento, curtos atrasos de transmissão e menores requisitos de potência, conforme descrito por Nunes & Leitão (2002). Os satélites LEO varrem grandes áreas do globo terrestre e circunscrevem o planeta em torno de 14 vezes em um mesmo dia. Segundo Vatalaro et al. (1995), oferecer serviços de cobertura global a partir de uma constelação de satélites similares é uma importante vantagem dessa tecnologia, o que permite aplicações em sensoriamento remoto, em telecomunicações e na coleta de dados ambientais como no Sistema Brasileiro de Coleta de Dados (SBCD) e ARGOS – sistema franco-americano. Um dos grandes desafios no estabelecimento de comunicação com esses satélites está na determinação e no tratamento das variações de frequência, causadas pelo efeito Doppler induzido sobre a portadora do sinal transmitido, o qual é caracterizado por um desvio entre a frequência transmitida e a recebida à bordo do satélite. Devido ainda ao ângulo de visada entre as antenas transmissora e receptora, e à rápida variação da velocidade relativa entre transmissor e receptor, nota-se também uma variação da intensidade do desvio ao longo do tempo, caracterizada por Zhang et al. (2016) como um deslocamento Doppler dinâmico, e denominada aceleração Doppler. Em especial ao caso do SBCD, em que se destaca uma aceleração Doppler máxima de ±120 Hz/s, esse desvio pode alcançar valores de até 115, 2 Hz durante a janela de transmissão. Esse efeito, consequente da dinâmica entre transmissor e receptor, degrada o processo de estimação de frequência e fase pelo decodificador do sinal, se não for corretamente tratado. Ainda além, quando tais valores são estimados, é possível calcular a posição geográfica do objeto transmissor com base.

(20) CAPÍTULO 1. INTRODUÇÃO. 2. nas informações de identificação destacadas na mensagem decodificada e no percurso do satélite. Diversos métodos têm sido propostos para se superar os efeitos do deslocamento Doppler dinâmico ao longo do anos, desde soluções clássicas dadas por Tretter (1985), Kay (1989) e Fitz (1994), até mais modernas como as descritas por Su & Wu (1997), Kandeepan & Reisenfeld (2004) e Sun et al. (2015). Porém, nenhum desses trabalhos consideram a presença de ruído impulsivo, conforme descrição de Button et al. (2002) para as comunicações aeroespaciais. O ruído impulsivo, por grande influência do homem mas também por causas naturais, tem uma importante contribuição no ruído externo, e seus efeitos devem ser considerados para uma caracterização mais fiel do cenário de comunicação dos satélites LEO (Button et al. 2002).. 1.2. Trabalhos relacionados. O problema de estimação de frequência é recorrente na área de processamento de sinais. Estudiosos com aplicações nas áreas de comunicações, radares, sonares, medições, geração de energia elétrica, entre outros, se mostram interessados nesse desenvolvimento. Grande parte dos trabalhos clássicos e alguns atuais como Tretter (1985), Kay (1989), Volker & Handel (2002) e Sun et al. (2015) descrevem métodos que não prevem a aceleração Doppler que a alta dinâmica dos satélites impõe ao problema. Em alguns casos, os sinais encontrados são estacionários ou quase estacionários, isto é, os parâmetros característicos do sinal são constantes ou variam tão lentamente que podem ser considerados constantes em uma curta janela de observação (Aboutanios 2002). O satélite FedSat, por exemplo, com link de comunicação em banda Ka (30 GHz), apresenta aceleração Doppler da ordem de 6 kHz/s, porém necessita de apenas 1024 amostras, transmitidas à frequência de amostragem de 1 MHz, o que representa uma janela de transmissão com ≈ 1 ms e um desvio de frequência máximo de 6 Hz por janela de observação e, portanto, tem essa variação desprezada. Da mesma forma, se observam casos que não se pode admitir tal consideração, como no SBCD, com desvio máximo de 115, 2 Hz em sua janela de transmissão. Tretter (1985) desenvolveu um modelo a partir do modelo senoidal x[k] = Ae. i h j 2πk ffs +θ. + w[k]. (1.1). em que A e θ representam amplitude e fase inicial do sinal respectivamente, enquanto w[k] representa o ruído AWGN com média zero e variância σ2 , f é a frequência do sinal.

(21) CAPÍTULO 1. INTRODUÇÃO. 3. senoidal e fs a frequência de amostragem. Assim, Tretter (1985) mostrou que é possível descrever a trajetória da fase do sinal aplicando o método dos mínimos quadrados na expressão arg(x[k]) = 2πk. f + θ + u[k] fs. (1.2) 2. σ em que u[k] é um processo de ruído AWGN com variância 2A 2. Alguns anos após, Kay (1989) sugeriu aprimoramentos ao trabalho de Tretter (1985) manipulando seus resultados com especial atenção ao diferencial de fase. A partir de uma média móvel com os coeficientes 1 e -1, ele estabeleceu a relação. ∆θ[k] = arg(x[k]) − arg(x[k − 1]) = 2π. f + u[k] − u[k − 1]. fs. (1.3). Dessa forma, o problema foi reduzido a uma estimação do valor médio 2π ffs no pro− → cesso com ruído Gaussiano colorido ∆θ = [∆θ[0] ∆θ[1] . . . ∆θ[N − 2]T ]. Através do estimador de máxima verossimilhança, Kay (1989) deduziu algebricamente uma expressão para essa média por N−1 ˆf = fs ∑ ψkay [k] arg(x[k] · x∗ [k − 1]) 2π k=1. (1.4). em que ∆θ[k] foi reescrito por arg(x[k] · x∗ [k − 1]) e ψkay [k] é uma janela de pesos, que quando considerada retangular, pode ter o resultado simplificado para fˆ =. N−1 fs ∑ arg(x[k] · x∗[k − 1]). 2π(N − 1) k=1. (1.5). Os métodos de Tretter (1985) e Kay (1989) são referências clássicas ao problema e tratam da estimação de frequência com base unicamente na informação de fase. Ao longo dos anos, porém, surgiram métodos com abordagens diferentes. Por sua vez, Fitz (1994) generalizou o estimador de Kay (1989), a partir da função de autocorrelação não normalizada. Sendo a função de autocorrelação de um sinal complexo x[k] definida como N. C[i] =. ∑. x[k] · x∗ [k − i],. k=i+1. a função de autocorrelação pode ser normalizada como. (1.6).

(22) CAPÍTULO 1. INTRODUÇÃO. 4. 1 C[i]. (1.7) N −1 O estimador equivalente apresentado por Kay (1989) para situações com altas relações sinais-ruído (SNR), e dado por C[i] =. fs arg fˆ = 2π. ! 1 N−1 ∑ x[k] · x∗[k − 1] , N − 1 k=1. (1.8). foi reescrito por Fitz (1994) como um método baseado na função de autocorrelação dada na Equação 1.7, resultando em  fs fˆ = arg C[1] . (1.9) 2π Com suas contribuições, Fitz (1994) tratou de dar continuidade ao trabalho iniciado por Kay (1989), chegando a equação fˆ =. M fs ∑ i · arg (C[i]) . 2πM(M + 1)(M + 2) i=1. (1.10). Tal contribuição, apesar de ser considerada uma aprimoramento, demonstrou-se ainda limitada a valores de SNR moderados. Em abordagem muito similar, foi mostrado pelo trabalho de Luise & Reggiannini (1995) que adotando o valor ótimo de M = N/2, a complexidade computacional do método proposto chegaria a O(N 2 ) e por isso, devida a elevada complexidade computacional e maior facilidade de implementação, para grandes valores de N, torna-se preferível uma implementação desse método baseada na Transformada rápida de Fourier (FFT, em inglês, Fast Fourier Transform). É importante frisar que a transmissão digital de dados via satélites é dominada por sistemas de modulação coerentes, tais como BPSK (em inglês, Binary Phase Shift Keying) e QPSK (em inglês, Quadrature Phase Shift Keying). Assim, uma significativa parte dos trabalhos relacionados a essas modulações partem, de alguma forma, de uma malha de captura de fase (PLL, em inglês, Phase-Locked Loop). Os sistemas de modulação por chaveamento do deslocamento de fase (PSK, em inglês, Phase Shift Keying) apresentam um bom desempenho na presença de ruído Gaussiano, porém não são muito tolerantes a distúrbios como altas taxas de aceleração Doppler, reflexão em múltiplos caminhos e anomalias ionosféricas (Natali 1984). Natali (1984), em seu trabalho, aponta os sistemas de controle automático de frequência (AFC, em inglês, Automatic Frequency Control) como solução mais robusta aos desvanecimentos dos enlaces de satélite..

(23) CAPÍTULO 1. INTRODUÇÃO. 5. Em Su & Wu (2000) e Su & Wu (1997) é proposto, de alguma forma, um regaste do modelo de Tretter (1985), em que se utiliza a ideia básica de uma regressão pelo método dos mínimos quadrados para inferir os parâmetros do sinal desejado. Desta vez, de uma perspectiva mais moderna, são demonstradas as influências das características da aceleração Doppler que sofre a portadora do sinal e é proposto uma caracterização através de uma expansão de Taylor de segunda ordem, dada por 1 ˆ ˆ = θˆ 0 + ω ˙ D (∆tk )2 , ˆ D ∆tk + ω θ[k] 2!. (1.11). ∆tk = tk − t0 .. (1.12). em que,. Assim, Su & Wu (2000) apresenta uma nova formulação para estimação da frequência e aceleração do sinal de portadora, que é dada por h N γN i ˜ ˆ˙ D = 2αN fs2 ∑ θ[k] ω k2 − (N + 1)k + 6 k=1. (1.13). e N.   (2N + 1)γN βN 2 ˜ ˆ D = αN fs ∑ θ[k] k− − (N + 1)k ω 15 10 k=1. (1.14). em que, αN = 180/ [N(N + 1)(N − 1)(N + 2)(N − 2)], βN = (2N + 1)(8N + 11) e γN = (N + 1)(N + 2). Além disso, são mostrados os ganhos em relação a técnica da malha de controle automático de frequência (AFC). Segundo Su & Wu (2000), uma malha AFC pode não ser capaz de realizar uma rápida aquisição/reaquisição de frequência, comumente requerida em situações de variações Doppler imprevisíveis ou em condições de alta dinâmica. Apesar do ruído impulsivo estar presente em cenários de comunicações por satélite como já discutido, o seu efeito ainda não havia sido analisado nas técnicas já propostas na literatura, e até o momento, ao que se conhece, não existem abordagens de estimação fina de frequência de satélites LEO robustas aos seus efeitos já publicados.. 1.3. Proposta da dissertação. Nesse trabalho é proposto um método para estimação fina dos desvios Doppler de até segunda ordem em uma onda portadora senoidal utilizada em um cenário de comunicação.

(24) CAPÍTULO 1. INTRODUÇÃO. 6. estabelecida pelos satélites de baixa órbita. Em particular, o trabalho traz como contribuição um novo modelo de aquisição de aceleração, frequência e fase de um sinal, baseado no recém desenvolvido critério de máxima correntropia (Principe 2010), e que se destaca frente aos métodos clássicos em cenários com características de ruído impulsivo, segundo análise apresentada neste trabalho.. 1.4. Organização do texto. O texto está organizado como segue. O Capítulo 2 trata do uso e desafios dos métodos de estimação de frequência em satélites LEO e está divido em três seções que abordam alguns dos conceitos básicos que alicerçam este trabalho. São eles, a caracterização dos sistemas de transmissão via satélite de baixa órbita, a caracterização do canal de comunicação e técnicas clássicas adotadas na estimação de frequência. O Capítulo 3 aborda o conceito da correntropia, suas propriedades, características, além de algumas aplicações. Em seguida, o Capítulo 4 apresenta o modelo proposto neste trabalho para estimação fina de frequências de sinais de satélites LEO, abordando para isso o modelo de sinal estudado e a esquema de blocos que descreve a arquitetura proposta. Por fim, no Capítulo 5 são apresentados os experimentos realizados e uma análise qualitativa dos resultados obtidos, além de uma análise sobre a influência da largura do kernel gaussiano, o único parâmetro de ajuste da arquitetura proposta, sobre o desempenho do método baseado na função de correntropia..

(25) Capítulo 2 Estimação de frequência em sinais de satélite. Esse capítulo traz uma discussão que servirá de referencial para os temas mais importantes abordados neste trabalho.. 2.1. Sistemas de comunicação. São muitas as diversidades de configurações possíveis para sistemas de transmissão de dados por enlaces de satélites de baixa órbita, ou LEO. Dois sistemas principais são o foco deste trabalho: o Sistema Brasileiro de Coleta de Dados (SBCD), que iniciou sua operação com o lançamento dos satélites SCD-1 em 1993; e o sistema ARGOS, sistema franco-americano iniciado em 1978, como mesma finalidade, e que motivou o desenvolvimento do sistema brasileiro. Algumas das características principais de ambos os sistemas, é que são compostos por satélites de baixa órbita (em torno de 750 km de altitude), recebem dados na frequência 401.650 MHz ±30 kHz a partir de plataformas espalhadas por todo globo terrestre. Na demodulação do sinal recebido, realizam a estimação das variações do efeito Doppler sobre a frequência da onda portadora do sinal, e são capazes de identificar as plataformas por meio do seu número de identificação informado através da mensagem coletada (Clark 1989). A característica de demodulação do sinal a bordo do satélite ainda não é uma realidade para o sistema brasileiro, que carece de avanços no desenvolvimento de tal tecnologia. O SBCD é constituido pela constelação de satélites SCD-1, SCD-2 e CBERS-4, e conta com mais de 800 Plataformas de Coleta de Dados (PCD). Eles orbitam o planeta e conseguem circunscreve-lo por mais de 14 vezes ao dia. Atualmente a demodulação dos dados é realizada apenas em solo, e o satélite funciona como um espelho retransmissor.

(26) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE. 8. dos sinais. Por isso, há bastante interesse no desenvolvimento de um modelo aprimorado de tal tecnologia.. 2.2. Canal de comunicação por satélite. A transmissão de dados por satélite é marcada por diversos desafios no campo das telecomunicações. Além dos desafios para funcionamento e manutenção de um sistema nos ares, vencer as adversidades do canal de transmissão com tamanha distância e as altas dinâmicas associadas também representa grande esforço no campo de processamento de sinais.. 2.2.1. Efeito Doppler. Nas comunicações aeroespaciais, o processo de estimação de frequência tem grande importância, não somente para a demodulação do sinal, mas em alguns casos, até para o apontamento da posição geográfica do objeto transmissor. Essa característica é útil e tem sido usada tanto pelo SBCD, como pelo sistema ARGOS, para rastreio de animais nas zonas mais remotas do planeta. A estimação da posição geográfica nesses sistemas somente é possível por meio da estimação do efeito Doppler envolvido no processo, que por toda dinâmica, provoca um descasamento entre a frequência transmitida na base e aquela que chega ao satélite. Uma vez, porém, que sejam determinadas a influência deste descasamento de frequências, a trajetória do satélite e o momento de transmissão, torna-se possível, não só extrair a informação do sinal em si, mas também determinar a localização do emissor, com precisão proporcional ao método de estimação usado..

(27) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE z. 9. Zenith S0'. r = re + h y. N S0. P li. O. S'. S Sx. S'x. Si. i. x. Si' (a) P. P. 0. s(t) O. S'. re. S0. S. r (b). (c). Figura 2.1: Órbita geométrica para satélites LEO com altitude h e inclinação i. [Fonte: Aboutanios (2002)] Como dito, quando o receptor se move com respeito a fonte do sinal, o efeito Doppler causa um deslocamento observável na percepção da frequência transmitida. Tal deslocamento é proporcional a velocidade relativa entre o transmissor e receptor. As comunicações por enlaces de satélites revelam experiências com grandes deslocamentos de frequência Doppler, da ordem de centenas de kHz, como no sistema FedSat que pode atingir até 600 kHz. No caso do SBCD, este deslocamento atinge até 9 kHz (Rae 2005). Em seu trabalho, Aboutanios (2002) desenvolve um modelo órbital simplificado para estimação desses parâmetros. Seu desenvolvimento parte da trigonometria, com o conceito básico de deslocamento Doppler normalizado ω, dado por.

(28) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE. ω(t) =. 1 ds(t) ∆f =− , f c dt. 10. (2.1). em que f é a frequência da portadora original, c é a velocidade da luz e s(t) é a trajetória do sinal transmitido entre a estação base e o satélite. Essa trajetória é definida por Aboutanios (2002) a partir da análise da Figura 2.1(b) e do uso da regra dos cossenos, como s(t) =. q re2 + r2 − 2re r cos (γ(t)),. (2.2). em que re é o raio da terra, r é o raio da orbita de trajetória do satélite considerando o centro da terra como referência, e γ(t) é o ângulo de visada entre estação base e satélite. O entendimento de toda a dinâmica envolvida demonstra algumas das características que necessita-se para o desenvolvimento de um sistema moderno capaz de detectar e demodular os sinais que trataremos neste trabalho. Primeiramente, é importante destacar que não somente a estimação de frequência deslocamento Doppler pode ser necessária. Isso porque, em sistemas com maiores dinâmicas ou em casos com sinais de longas durações, percebe-se significativa variação na frequência deslocada pelo efeito Doppler, denominada aceleração Doppler. Esta, ao exemplo do SBCD, pode assumir valores de até 135 Hz/s (Rae 2005). Assumindo um modelo esférico para planeta, como ilustrado na Figura 2.1, Aboutanios (2002) deduziu boas aproximações para as expressões de deslocamento Doppler ω(t) ˙ e aceleração Doppler ω(t), dadas respectivamente pelas expressões ω(t) = −. fc re r sin(ψ(t)) cos(γ0 ) ωF (t) c s. (2.3). e. ˙ =− ω(t). fc ωF cos(ψ(t)) s2 − re r sin(ψ(t)) cos(γ0 ), ωF (t) re rωF cos(γ0 ) c s3. (2.4). em que, ωF é a velocidade angular de deslocamento do satélite, e s(t), dado na Equação 2.2, pode ser reescrito em função do máximo ângulo de visada γ0 e do deslocamento angular entre a posição inicial e final da trajetória orbital ψ(t), substituindo cos(γ(t)) = cos(ψ(t)) cos(γ0 ), resultando em. (2.5).

(29) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE. s(t) =. q re2 + r2 − 2re r cos(ψ(t)) cos(γ0 ).. 11. (2.6). Considerando que o ângulo mínimo de visibilidade θv é um parâmetro inerente aos sistemas de comunicações por satélite LEO, e aproximando a velocidade de deslocamento do satélite por uma constante, encontramos o período máximo de visibilidade de um satélite em sua passagem pela sobre uma estação base. A duração de tal janela τmax é dada por 2 · cos−1 τmax ≈ ωF.  ! cos cos−1 rrE cos θv − θv . cos(γ0 ). (2.7). Este modelo foi adotado para estimação das variações de frequência e aceleração Doppler para o caso do SBCD. Os resultados são apresentados no Capítulo 5.. 2.2.2. Presença de ruído impulsivo ou outlier. O ruído AWG (Branco Aditivo e Gaussiano, ou em inglês AWGN, Additive White Gaussian Noise) é comum em todos os canais de comunicação e é caracterizado como um ruído estatisticamente aleatório dentro em uma larga gama de frequências (Alam 2008). A literatura de processamento de sinais está absolutamente dominada por suposições gaussianas. É certo que em muitos desses casos o modelo gaussiano é razoável e pode ser justificado pelo Teorema do Limite Central, que é uma propriedade dos processos estocásticos que mostra que a soma de n variáveis aleatórias Xi , tal que X = X1 + · · · + Xn. (2.8). resulta em uma variável aleatória X com distribuição normal, média η = η1 + · · · + ηn e variância σ2 = σ21 + · · · + σ2n (Papoulis 1965). Apesar de largamente adotada, muitos são os casos em que a presença de ruído AWGN é simplesmente presumida e, infelizmente, tal presunção não pode ser estendida a todos os casos no processamento de sinais (Shao & Nikias 1993). Em muitas situações como no processamento de sinais de sonares, radares ou transmissões de satélites a gaussianidade não pode ser sustentada (Brockett et al. 1989), sob risco de obter resultados dissimulados. Uma extensa classe dos fenômenos não gaussianos são caracterizados por sua natureza impulsiva. Sinais e ruídos desse tipo são comumente representados por eventos ocasionais com picos destoantes em relação ao eixo de observações dos sinais normalmente distribuídos (Shao & Nikias 1993). Muitos tipos de ruído artificiais, que são aqueles mo-.

(30) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE. 12. tivados por ação humana, têm sido categorizados nesta classe de sinais (Middleton 1999), que conta com uma gama crescente de interferências. Middleton (1999) apontou duas classificações para os sinais impulsivos, aqueles de Classe A ou do tipo inteligentes, e os de classe B ou não inteligentes. Os de classe A apresentam basicamente origem artificial, enquanto os de classe B são aqueles naturais ou gerados pelo homem de forma não intencional (Middleton 1999), ou seja, não são motivados por qualquer intenção de transmissão em radiofrequência (RF). Dessa forma, a distribuição α-estável aparece como um modelo para caracterização dos ruídos de natureza impulsiva, além de uma generalização da distribuição gaussiana (Georgiou et al. 1999). Duas razões são apontadas para isso. Em primeiro lugar, a distribuição α-estável satisfaz a propriedade da estabilidade, o que significa que se Xα , Xα,1 e Xα,2 são variáveis aleatórias independentes com distribuição α-estável, então existe dois escalares µ1 e µ2 tal que d. v1 Xα,1 + v2 Xα,2 = µ1 Xα + µ2 ,. (2.9). d. em que v1 , v2 , µ1 e µ2 são constantes e = denota igualdade de distribuições de probabilidade. Em segundo, ela satisfaz o teorema do limite central generalizado, o que significa que assim como no caso gaussiano, o somatório de variáveis aleatórias Xi de distribuição α-estável, tende a gerar a variável X também de distribuição α-estável, tal que X=. X1 + X2 + · · · + Xn − bn , an. (2.10). em que, X1 , X2 , . . . , Xn são variáveis aleatórias independentes e identicamente distribuídas, e n → ∞, enquanto os parâmetros bn é real e an é real e positivo. A partir da reparametrização de outros trabalhos, Weron & Weron (1995) apresentou um método para modelagem de uma variável aleatória X(α,λ,β,δ) com distribuição αestável. Segundo sua definição, denota-se X ∼ Sα (λ, β, δ) para indicar que a variável aleatória X tem distribuição Sα (λ, β, δ).. (2.11).

(31) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE. 1. 13. Comparação de Distribuições Normal e α -Estável Normal α=2 α = 1.5 α = 1.1 α = 0.5. 0.9 0.8 0.7. FDP(X). 0.6 0.5 0.4 0.3 0.2 0.1 0 -5. -4. -3. -2. -1. 0. 1. 2. 3. 4. 5. X. Figura 2.2: Funções densidade de probabilidade da distribuição normal (σ2 = 1 e µ = 0) √ e de alguns distribuições α-estáveis simétricas de média nula (β = 0, λ = 2/2 e λ = 0). [Fonte: autoral] Na distribuição α-estável, α é chamado de expoente característico (0 < α ≤ 2) e controla o alongamento da cauda caraterística de sua FDP (Função de Densidade de Probabilidade), vide Figura 2.2, que torna-se mais representativa para baixos valores de α e, por consequência, induz mais ruído impulsivo. β é o índice de simetria (−1 ≥ β ≥ 1). λ é o parâmetro de dispersão ou escala (λ > 0) e determina o largura da densidade em torno do parâmetro de localização δ (−∞ < δ < ∞) (Georgiou et al. 1999). ´ dis´ Para simulação das distribuições estáveis foi utilizado a função makedist(Stable ), ponível no software MATLAB R2017b através do Statistics and Machine Learning ToolboxT M (conjunto ferramentas para cálculo estatístico e aprendizado de máquina) (Stable Distribution - MATLAB & Simulink 2017). O modelo adotado pelo MATLAB segue a parametrização X(α, β, λ, δ) e é dado por (Nolan 2003) e Weron & Weron (1995) como.

(32) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE. i   h πα X(k) = exp −λα |k|α 1 + jβsign(k) tan( ) · (λ |k|)1−α − 1 + jδk , 2. 14. (2.12). para α 6= 1, e     2 X(k) = exp −λ |k| 1 + jβ · sign(k) · ln(λ |k|)· + jδk , π. (2.13). exclusivamente para o caso α = 1. Para o caso particular de β = 0 e δ = 0, as distribuições α-estáveis são chamadas de distribuições α-estáveis simétricas (Brcich et al. 2005). Alguns outros casos particulares merecem atenção. Quando α = 2, resulta-se a distribuição gaussiana (vide Figura 2.2) com média µ = δ e variância σ2 = 2λ, enquanto que para α = 1 e β = 0 temos a distribuição de Cauchy representada. Para elucidar cada um dos parâmetros no modelo de Weron & Weron (1995), podemos relacionar o parâmetro de localização δ à função da média para 1 < α ≤ 2 e à mediana para 0 < α ≤ 1, e a dispersão λ ao conceito de variância no modelo gaussiano (Georgiou et al. 1999). Alternativamente, e especificamente para os enlaces de comunicação via satélite, Weron & Weron (1995) propôs o modelo simulação de ruído impulsivo com natureza estável, a partir da definição de Middleton (1999) de ruído inteligente de classe B, com β = 0 e δ = 0 dado por   cos(V − αV (k)) (1−α)/α sin(αV ) × , Xα = W (cos(V ))1/α. (2.14). π em que V é uma variável aleatória uniformemente distribuída entre ( −π 2 , 2 ) e W é uma variável aleatória com distribuição exponencial e média unitária. Dessa forma, se encoraja o uso da distribuição α-estável nas situações em que se observa a presença de ruído impulsivo, até mesmo nos casso que tradicionalmente têm sido modelados por ruído AWG. A classe de distribuições α-estável com α 6= 2 apresenta momentos finitos somente para ordens menores que o valor de α (Georgiou et al. 1999). Ou seja, exceto para o caso α = 2, a distribuição não apresenta momentos de segunda ordem (ou superiores) finitos..

(33) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE. 15. Generalized Signal-to-Noise Ratio O uso do modelo de ruído impulsivo α-estável torna necessário adotar uma nova medida para caracterizar as relações sinal-ruído (Signal-to-Noise Ratio – SNR) usadas nos experimentos. Uma vez que variáveis definidas por essa distribuição para α < 2 são caracterizadas por sua variância infinita, a definição convencional de Signal-to-Noise Ratio não pode ser usada. Tsakalides & Nikias (1995) sugere alternativas para determinar o SNR de processos com variância infinita. Uma delas é chamada de Generalized Signal-to-Noise Ratio ou GSNR e definida pela equação .  Zrms. GSNR = 20 · log10 . 1 α −0.5. ,. (2.15). 2λ ·Cg ou ainda,  GSNR = 10 · log10 . M. 1 2 α −1. 4λ2 · M ·Cg. . ∑ |z[k]|2 ,. (2.16). k=1. em que Cg é a constante de Euler, igual a 1.781072(...) (Gradshteyn & Ryzhik 2014), e o parâmetro λ é a dispersão da distribuição α-estável, calculado a partir da Equação 2.16, na forma 1. λ= 2 · 10. GSNR 20. v u u1 M t |z[k]|2 , ∑ 1 −0.5 M α k=1. (2.17). Cg. uma vez que se conheça o GSNR e o expoente característico α do canal, e o sinal z transmitido.. 2.3. Métodos clássicos. Dois métodos clássicos foram implementados para validação dos resultados alcançados neste trabalho: o LMS (em inglês, Least Mean Squares) e o RLS (em inglês, Recursive Least Squares). Ambos são descritos na Seções que seguem, com implementações.. 2.3.1. Estimação por Least Mean Squares. Baseado no modelo de estimação de frequência por regressão através do algoritmo de LMS (Su & Wu 2000), foi desenvolvido um algoritmo para comparar e validar os resulta-.

(34) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE. 16. dos obtidos neste trabalho. Considerando que o trabalho de Su & Wu (2000) propôs um algoritmo que trabalha como uma janela deslizante de N amostras, e partir dela reconstrói os valores de fase de sistema com altas dinâmicas, foi desenvolvido um modelo do algoritmo aprimorando algumas de suas limitações. Uma das limitações de seu trabalho, é que não foi demonstrada um mecanismo para obtenção da fase inicial do sinal recebido, para um sistema de segunda ordem, em que não se pode desprezar a influência da aceleração Doppler. Assim, a partir das deduções realizadas por Weisstein (2002) para solução de um sistema polinomial baseado numa regressão por mínimos quadrados, encontra-se a solução para o polinômio característico y = w0 + w11 + · · · + wk xk ,. (2.18). permitindo assim, a correção da problemática apontada com o cálculo do vetor de pesos a por W = (XT X)−1 XT y,. (2.19). em que y são os valores de amostras entrantes ao sistema, e X é dado por.  1 x1 x12  1 x2 x22 X=  .. .. .. . . . 1 xn xn2.  . . . x1k  . . . x2k  , ..  .. . .  . . . xnk. (2.20). em que o vetor x = [0, 1, 2, · · · , n] é o vetor de índices das amostras para o caso. Dessa forma, o algoritmo foi projetado para minimizar parte de custo computacional, de forma a realizar apenas uma vez o cálculo da matriz Mx = (XT X)−1 XT .. (2.21). Os Algoritmos 1 e 2, trazem respectivamente as formas de implementação dos algoritmos clássicos de mínimos quadrados médio LMS (do inglês, Least Mean Squares) e de mínimos quadrados recursivo RLS (do inglês, Recursive Least Squares) descritas a seguir, em que os valores do vetor de pesos W são calculados iterativamente, com objetivo de.

(35) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE. 17. minimizar o erro quadrático calculado a cada nova iteração em ambas as versões. Algoritmo 1: Algoritmo de LMS (Adaptado de Su & Wu (2000)). ˜ valores de fase absoluta; λ coeficiente de aprendizado; Njanela Entrada: θ: tamanho da janela deslizante Saída: Wk+1 ˜ 1 N ← comprimento(θ); 2 W1 ← aleatorio_uni f orme(1, 3); 3 Xx ← [1(N (1 : Njanela )(Njanela ×1) (1 : Njanela )2(Njanela ×1) ]; janela ×1) 4 5 6 7 8 9 10 11 12 13. Mx ← (XTx · Xx )−1 · XTx ;; para k ← 1 até N faça X ← [1 k 0.5 · k2 ]; Waux [3] ← 0.5 · Wk [3]; Waux [2] ← Wk [2] + (k − Njanela ) · Wk [3]; Waux [1] ← Wk [1] + (k − Njanela ) · Wk [2] + 0.5 · (k − Njanela )2 · Wk [3]; se k > Njanela então ˜ − Njanela + 1 : k] − Wk · XTx ; θerr ← θ[k senão h i ˜ : k](1×k) − Wk · XTx ; θerr ← 0(1×N −k) θ[1 janela. fim Werr ← Mx · θTerr ; Werr [3] ← 2Werr [3]; Werr [2] ← Werr [2] − (k − NJanela ) · Werr [3]; Werr [1] ← Werr [1] − (k − NJanela ) · Werr [2] − (k − NJanela )2 · Werr [3]; Wk+1 ← (1 − λ) · Wk + λ(Wk + Werr );. 14 15 16 17 18 19 20 21. fim retorna Wk+1 ;. 2.3.2. Estimação por Recursive Least Squares. O método Recursive Least-Squares (RLS) foi desenvolvido a partir de uma adaptação recursivo do modelo do método de mínimos quadrados, e que permite a atualização da estimação almejada a cada nova amostra ingressante no sistema. O modelo foi implementado com base no algoritmo proposto por Haykin (2013),.

(36) CAPÍTULO 2. ESTIMAÇÃO DE FREQUÊNCIA EM SINAIS DE SATÉLITE. 18. como Algoritmo 2: Algoritmo de RLS (Adaptado de Haykin (2013)). ˜ valores de fase absoluta; λ coeficiente de aprendizado Entrada: θ: Saída: Wk+1 ˜ 1 N ← comprimento(θ); 2 W1 ← 03×1 ; −1 3 P ← 100δ I; 4 para k ← 1 até N faça 5 X ← [1 k · k2 ]T ; 6 R ← λ+XP·X T ·P·X ; 7 θmathtterr ← θ˜ − WT · X; k. 8 9 10 11. Wk+1 ←= Wk + R · θerr ; Pk+1 ← λ1 (Pk − R · XT · P); fim retorna Wk+1 ;. Singh & Principe (2010) usou este método para comparar e validar os resultados alcançados na demonstração do critério da máxima correntropia desenvolvido..

(37) Capítulo 3 Correntropia. Informações estatísticas de segunda ordem obtidas por correlação ou através do cálculo do erro médio quadrado (Mean Squared Error – MSE) são provavelmente as medidas mais usadas para se quantificar a similaridade entre duas variáveis aleatórias. As soluções da engenharia que obtiveram sucesso a partir dessas medidas dependem fortemente de suposições de linearidade e comportamento gaussiano. Os processos naturais de interesse da engenharia são compostos pela sua distribuição estatística de amplitudes e sua estrutura de tempo, sendo o segundo muitas vezes ignorado por grande parte dos métodos. Para uma descrição mais completa dos processos estocásticos nem sempre é realístico assumir independência entre a distribuição de dados adotada e sua estrutura temporal (Santamaría et al. 2006). Dessa forma, nos é apresenta uma forte ferramenta para cálculo de similaridade sobre o tempo: a correntropia.. 3.1. Conceito. Conceituar similaridade por meio de fórmulas matemáticas não é uma tarefa trivial. Trata-se de uma medida para quantificar sinais temporais. Um dos métodos pioneiros desenvolvidos para tal finalidade é a correlação, bastante usual em aplicações no campo de processamento de sinais e outros. Assim como a correlação, a correntropia é uma função bivariada que produz um escalar, mas que contém FDP não limitada aos momentos de segunda ordem (Principe 2010). Dessa forma, a correntropia se apresenta como uma interessante função matemática para o cálculo de similaridade de sinais não gaussianos. Santamaría et al. (2006) define a correntropia cruzada, normalmente referida apenas pelo termo correntropia, como uma medição generalizada de similaridade entre duas variáveis escalares e reais aleatórias X e Y , definida por.

(38) CAPÍTULO 3. CORRENTROPIA. 20. Vσ (X,Y ) = EXY [κσ (X,Y )]. (3.1). Z Z. =. κσ (x, y)pXY (x, y)dxdy,. (3.2). em que o kernel κσ (x, y) assume normalmente o formato gaussiano, já a função gaussiana Gσ (x − y) se caracteriza constante simetria de sua FDP (Função de Densidade de Probabilidade), mesmo sob variação de seu kernel σ (desvio padrão) escolhido. Assim,   (x − y)2 1 exp − . κσ (x, y) = Gσ (x − y) = √ 2σ2 2πσ. (3.3). Acontece que nos problema práticos a função de densidade de probabilidade conjunta é desconhecida e apenas um número finito de dados {(xi , yi )}N i=1 estão disponíveis, chegando a uma equação mais usual, dada por 1 N VˆN,σ (X,Y ) = ∑ κσ (xi − yi ). N i=1. (3.4). A Correntropia tem como propriedade ser sempre positiva e limitada a 0 < v(X,Y ) ≤ √ 1/ 2πσ, baseado nas limitações do kernel gaussiano, que assume o máximo se, e apenas se, X = Y . Isso é facilmente percebido pela análise da Equação 3.3. Devido as transformações não lineares produzidas pelo kernel gaussiano, o cálculo da correntropia cruzada não garante média zero, mesmo quando os dados de entrada estão centralizados (tenham média nula) (Principe 2010). Assim, para superar essa limitação, Principe (2010) define a correntropia cruzada centralizada, dada por U(X,Y ) = EX,Y [Gσ (x, y)] − EX EY [Gσ (x, y)].. (3.5). Tal como na Equação 3.4, é possível inferir a partir da Equação 3.5 a definição de correntropia cruzada centralizada para amostras finitas, dada por 1 N 1 N N Uˆ σ (X,Y ) = ∑ κσ√2 (xi − yi ) − 2 ∑ ∑ κσ√2 (xi − y j ). N i=1 N i=1 j=1. (3.6). O conceito da correntropia cruzada centralizada possibilita uma alternativa para realização da medição de similaridade em sinais com amplitudes desconhecidas, conforme o modelo adotado, e a partir dela se define o coeficiente de correntropia (Xu et al. 2007), dado por.

(39) CAPÍTULO 3. CORRENTROPIA. Uˆ σ (X,Y ) q ηˆ = q . Uˆ σ (X, X) Uˆ σ (Y,Y ). 21. (3.7). O coeficiente de correntropia ηˆ pode ser considerado uma generalização do conhecido coeficiente de correlação para κ(x, y) = xy, ou seja, assumindo valores nulos nos casos em que as variáveis aleatórias X e Y sejam estatisticamente independentes e módulo unitário caso exista similaridade. Isso porque, uma vez expandida a função gaussiana através de uma serie de Taylor a correntropia pode ser vista como um somatório de todos os momentos pares da FDP da variável aleatória X-Y (Santamaría et al. 2006), conforme expresso por ∞ (−1)k 1 √ E[(X −Y )2k ]. Vσ (X,Y ) = ∑ k 2k 2πσ k=0 2 σ k. (3.8). Demonstra-se assim que quando σ > 1 cresce no denominador, os momentos de mais alta ordem tendem a se tornar insignificantes, transformando σ em um peso ajustável que proporcionaliza a influência dos momentos pares subsequentes ao de segunda ordem. Essa característica pode ser usada para aprimorar o desempenho de técnicas de processamento de sinais em problemas não-gaussianos e não-lineares e, por isso, é particularmente interessante para tratar o problema discutido neste trabalho. O controle da largura do kernel gaussiano define o tamanho da "janela de observação"aplicada a informação (Principe 2010). O tamanho dessa janela de observação pode, portanto, ser controlada com o intuito de eliminar os ruídos outliers presentes. De tal maneira a correntropia tem sido definida como uma robusta medida de similaridade, que advêm da ideia das medidas baseada no erro médio quadrado com ponderações exponenciais ao erro (Singh & Principe 2010). O critério de maximização da correntropia (MCC, em inglês Maximum Correntropy Criterion), é portanto, uma adaptação robusta principalmente na presença de sinais não gaussiano, além de apresentar complexidade computacional similar ao LMS (Singh & Principe 2009).. 3.2. Critério de máxima correntropia. De forma genérica, o critério de máxima correntropia (MCC, em inglês, Maximum Correntropy Criterion) se assemelha ao critério do erro mínimo quadrático (MSE, em inglês, Mean Squared Error) já que ambos são utilizados basicamente para quantificar um erro..

(40) CAPÍTULO 3. CORRENTROPIA. 22. Como visto, o cálculo da correntropia tende a atingir seu máximo para variáveis aleatórias fortemente similares, ao contrário do MSE que tende a zero para as mesmas variáveis. Dessa forma, o MCC tende a ser maximizado em sistemas com aprendizado por realimentação.. 3.2.1. MCC por gradiente ascendente. Singh & Principe (2010) propõe e compara duas implementações derivadas metodologias clássicas para uso do MCC como funções de custo em sistemas adaptativos tipicamente lineares. São elas, o gradiente ascendente e a técnica de ponto fixo. Considerando, di o vetor de amostras desejadas e yi o vetor de amostras de saída no sistema, estabelecemos a correntropia baseada no kernel gaussiano como uma função de custo, resultado de Jn = E[Gσ (d − y)].. (3.9). A partir desta definição, Singh & Principe (2010) computa o valor esperado usando uma janela deslizante de N amostras por   k −(di − yi )2 1 1 , Jn = √ ∑ exp 2σ2 2πσ N i=k−N+1. (3.10).   k 1 1 −(di − WTk Xi )2 Jn = √ , ∑ exp 2σ2 2πσ N i=k−N+1. (3.11). ou,. em que o erro quadrático e2i = (di − WTk Xi )2 é computado a cada nova iteração, com base nos pesos estimados Wk e nas entradas Xi . O algoritmo de gradiente ascendente foi empregado para maximizar a função de custo, a partir da atualização do vetor de pesos estimados Wk+1 = Wk + µ∇Jn ,. (3.12).  2 k −ei 1 µ exp ei Xi , Wk+1 = Wk + √ ∑ 3 2σ2 2πσ N i=k−N+1. (3.13). em que µ é o coeficiente de aprendizado, tal como na técnica clássica. Inspirado pela técnica de gradiente estocástico clássico, Singh & Principe (2010) apro-.

(41) CAPÍTULO 3. CORRENTROPIA. 23. ximou o somatório da Equação 3.13 para o valor corrente a cada iteração assumindo N = 1, o que resultou na expressão final do método  2 −ek µ ek Xk . exp Wk+1 = Wk + √ 3 2σ2 2πσ. 3.2.2. (3.14). MCC por ponto fixo. De forma similar ao desenvolvimento do método baseado no gradiente ascendente, Singh & Principe (2010) adaptou o clássico algoritmo de ponto fixo para o MCC, também denominado MCC-FP (do inglês, Maximum Correntropy Criterion - Fixed Point). A solução foi desenvolvida a partir da Equação 3.9, que foi derivada e igualada a zero, na forma de E[Gσ (d − y)(d − y)X] = 0,. (3.15). E[Gσ (e)(d − XT W)X] = 0. (3.16). E[Gσ (e)d · X] = W · E[Gσ (e)XXT ].. (3.17).  −1 W = E[Gσ (e)XXT ] [E[Gσ (e)d · X]] .. (3.18). e. Por fim,. Usando o mesmo estimador para o valor esperado adotado para caso do algoritmo de gradiente ascendente, simplificamos a Equação 3.18 através da definição da matriz de autocorrelação R(Wk ) do sinal de entrada e do vetor de correlação cruzada P(Wk ) entre o sinal desejado e as amostras de entrada, ambos ponderados pela kernel gaussiano característico da correntropia, resultando em Wk = [R(Wk )]−1 P(Wk ),. (3.19). em que k. R(Wk ) = ∑ Gσ (ei )Xi XTi , i=1. e. (3.20).

(42) CAPÍTULO 3. CORRENTROPIA. 24. k. P(Wk ) = ∑ Gσ (ei )di · Xi .. (3.21). i=1. A partir dessa definição dada, foi desenvolvido um modelo recursivo, análogo ao algoritmo RLS (Seção 2.3.2), dado por R(Wk+1 ) = (1 − µ)R(Wk ) + µGσ (ek+1 )Xk+1 XTk+1 ,. (3.22). P(Wk+1 ) = (1 − µ)P(Wk ) + µGσ (ek+1 )dk+1 XTk+1 ,. (3.23). e,. em que µ é o fator de esquecimento com o objetivo de suavizar o aprendizado, proporcionando maior robustez aos distúrbios da longa memoria de sinais não estacionários. Singh & Principe (2010) demonstrou ganhos consideráveis na velocidade de convergência da técnica baseada em ponto fixo. Porém, um dos problemas de sua implementação, e que demanda maior parte dos recursos de processamento, consiste no cálculo da inversa da matriz de autocorrelação R(Wk ), dada na Equação 3.19, a cada nova iteração.. 3.3. Considerações. Baseado nos algoritmos descritos, passamos a enxergar a correntropia como forte aliada na estimação de frequências Doppler de sinais de satélite LEO em cenários imersos em ruído impulsivo. Ademais, os modelos de ruído impulsivo têm sido cada vez mais considerados na modelagem de canais de comunicação via rádio frequência, fato que por muito tempo foi ignorado pela ausência de uma ferramenta robusta para trata-los. A correntropia tem sido investigada para atender os mais diversos problemas no processamento digital de sinais, como para equalização cega de sinais distorcidos pelas interferências dos canais de comunicação (Santamaría et al. 2006), no desenvolvimento de técnicas de regressão mais robustas (Liu et al. 2007), na classificação automática de modulações aplicadas para rádio cognitivo (Fontes et al. 2015) e mais recentemente no tratamento de sinais complexos (Guimaraes et al. 2017)..

Referências

Documentos relacionados

No Estado do Pará as seguintes potencialidades são observadas a partir do processo de descentralização da gestão florestal: i desenvolvimento da política florestal estadual; ii

O primeiro conjunto de artigos, uma reflexão sobre atores, doenças e instituições, particularmente no âmbito da hanse- níase, do seu espaço, do seu enquadramento ou confinamen- to

Apesar do elevado potencial de aproveitamento energético, devido ao seu alto custo de implantação e operação, as tecnologias que utilizam de processos térmicos para tratar

Os pedidos para dispensa de medicamentos antibióticos sem receita médica junto das farmácias são mais do que frequentes, e cabe aos profissionais que nelas trabalham, a obrigação

The Anti-de Sitter/Conformal field theory (AdS/CFT) correspondence is a relation between a conformal field theory (CFT) in a d dimensional flat spacetime and a gravity theory in d +

After the eval- uation of the influence of each modification of the surfaces on the internal air temperatures and energy consumption of the compressor a final test was done with

Classificação biológica, Taxonomia e Sistemática são designações que tiveram origem em alturas distintas ao longo da história, e cujo significado por vezes

Além da multiplicidade genotípica de Campylobacter spp., outro fator que pode desencadear resistência à desinfecção é a ineficiência dos processos de limpeza em si,