UNIVERSIDADEFEDERALDO RIO GRANDE DO NORTE
DECOMPUTAÇÃO
Classificação Automática de Modulação Digital
com uso de Correntropia para Ambientes de
Rádio Cognitivo
Aluisio Igor Rêgo Fontes
Orientador: Prof. Dr. Luiz Felipe de Queiroz Silveira
Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Engenharia Elétrica e de Computação da UFRN como parte dos requisitos para a obtenção do título de Mestre em Ciências.
Seção de Informação e Referência
Catalogação da publicação na fonte. UFRN / Biblioteca Central Zila Mamede
Fontes,Aluisio Igor Rêgo.
Classificação Automática de Modulação Digital com uso de Correntropia para Ambientes de Rádio Cognitivo / Aluisio Igor Rêgo Fontes - Natal, RN, 2012
88 f.:il.
Orientador: Luiz Felipe de Queiroz Silveira
Dissertação (Mestrado) - Universidade Federal do Rio Grande do Norte. Cen-tro de Tecnologia. Programa de Pós-Graduação em Engenharia Elétrica e de Computação.
1. Classificação Automática de Modulação 2. Correntropia
3. Rádio Cognitivo - Dissertação.I.Silveira, Luiz Felipe de Queiroz. II. Univer-sidade Federal do Rio Grande do Norte. III. Título
com uso de Correntropia para Ambientes de
Rádio Cognitivo
Aluisio Igor Rêgo Fontes
Dissertação de Mestrado aprovada em 14 de Dezembro de 2012 pela banca examinadora composta pelos seguintes membros
Luiz Felipe de Queiroz Silveira, Dr (Orientador) . . . DCA/UFRN
Francisco Marcos de Assis, Dr . . . DEE/UFCG
Adrião Duarte Dória Neto, Dr . . . DCA/UFRN
Primeiramente, à Deus por sempre iluminar meu caminho.
Agradeço à minha família pelo apoio, incentivo, paciência, força, amor e carinho. Em especial meus pais: Maria de Fátima Rêgo Fontes e Aluisio Fontes de Queiroz e minha irmã Fabíola Rêgo Fontes.
À minha namorada, Bruna Angelina Barreto Costa Lobo , pelo amor, paciência e por sua dedicação em minha vida acadêmica, me dando todo o apoio nos momentos difíceis.
Ao professor Luiz Felipe de Queiroz Silveira, que sempre acreditou no meu potencial e se não fosse por sua enorme dedicação e orientação não teríamos concluído.
Aos professores do Departamento de Engenharia de Computação e Automação.
Aos meus amigos Arthur, Lucas, Nathalee, Leonardo, Eduardo Palmeira e Allan por todo apoio, amizade e momentos de descontração indispensáveis.
Resumo
Os modernos sistemas de comunicação sem fio empregam, frequentemente, técnicas
adaptativas para proporcionar uma alta taxa de transmissão, enquanto asseguram
quali-dade de serviço (QoS) e abrangência de cobertura. Estudos recentes têm mostrado que
esses sistemas podem se tornar ainda mais eficientes com a incorporação de técnicas de
in-teligência artificial e de conceitos de rádio definido por software. Os sistemas que seguem
essa linha, conhecidos como Sistemas de Rádio Cognitivo, podem idealmente explorar de
forma dinâmica e oportunística porções do espectro de frequências não utilizadas,
conhe-cidas como buracos espectrais, com o objetivo de prover altas taxas de transmissão de
dados com elevada confiabilidade e disponibilidade de serviço. A Classificação
Automá-tica de Modulação (AMC) seria uma habilidade muito útil nesses sistemas. Normalmente,
as técnicas de AMC utilizam alguma forma de pré-processamento do sinal que pode
in-troduzir um alto custo computacional ou necessitar de suposições fortes, e até mesmo
imprecisas, sobre o sinal recebido. Este trabalho propõe o uso direto de uma medida de
similaridade, baseada na Teoria da Informação, conhecida como coeficiente de
correntro-pia, para extrair informações estatísticas de ordem elevada do sinal, com o objetivo de
reconhecer automaticamente o formato de modulações digitais. Experimentos realizados
por meio de simulação computacional demonstram que a técnica proposta neste trabalho
apresenta uma alta taxa de sucesso na classificação de modulações digitais, mesmo na
presença de ruído aditivo gaussiano branco (AWGN).
Palavras-chave: Classificação Automática de Modulação, Correntropia, Rádio
Modern wireless systems employ adaptive techniques to provide high throughput
while observing desired coverage, Quality of Service (QoS) and capacity. An
alterna-tive to further enhance data rate is to applycognitive radio concepts, where a system is
able to exploit unused spectrum on existing licensed bands by “sensing” the spectrum and
opportunistically access unused portions. Techniques like Automatic Modulation
Classi-fication (AMC) could help or be vital for such scenarios. Usually, AMC implementations
rely on some form of signal pre-processing, which may introduce a high computational
cost or make assumptions about the received signal which may not hold (e.g. Gaussianity
of noise). This work proposes a new method to perform AMC which uses a similarity
me-asure from the Information Theoretic Learning (ITL) framework, known ascorrentropy
coefficient. It is capable of extracting similarity measurements over a pair of random
pro-cesses using higher order statistics, yielding in better similarity estimations than by using
e.g. correlation coefficient. Experiments carried out by means of computer simulation
show that the technique proposed in this paper presents a high rate success in
classifica-tion of digital modulaclassifica-tion, even in the presence of additive white gaussian noise (AWGN).
Sumário
Sumário i
Lista de Figuras iv
Lista de Tabelas vi
Lista de Símbolos vii
Lista de Símbolos e Abreviaturas vii
1 Introdução 1
1.1 Motivação e Relevância . . . 1
1.2 Estado da Arte . . . 3
1.3 Objetivo . . . 5
1.4 Organização do Trabalho . . . 6
2 Rádio Cognitivo: Uma Introdução 7 2.1 Introdução . . . 7
2.2 Rádio Cognitivo . . . 7
2.3 Conclusão . . . 12
3 Modulação Digital e Canal de Comunicação 13 3.1 Introdução . . . 13
3.2 Modulação . . . 13
3.2.1 Modulação por Chaveamento de Fase - PSK . . . 15
3.3 Modulação de Amplitude em Quadratura - QAM . . . 21
3.4 Canal de Comunicação . . . 22
3.4.1 Canal AWGN . . . 23
3.5 Conclusão . . . 24
4 Teoria da Informação 25 4.1 Introdução . . . 25
4.2 Entropia . . . 25
4.2.1 Entropia de Shannon . . . 26
4.2.2 Entropia de Rényi . . . 26
4.2.3 Janelas de Parzen e Potencial de Informação . . . 28
4.2.4 Correntropia . . . 30
4.3 Conclusão . . . 34
5 Arquitetura para AMC com uso de Medida Teórica de Informação 35 5.1 Introdução . . . 35
5.2 Arquitetura . . . 36
5.3 Conclusão . . . 40
6 Simulações e Resultados 41 6.1 Introdução . . . 41
6.2 Primeiro Experimento . . . 42
6.3 Segundo Experimento . . . 47
6.4 Terceiro Experimento . . . 50
6.5 Comparação de Resultados . . . 58
7 Conclusão e Perspectiva 65
7.1 Principais Contribuições . . . 66
7.2 Perspectivas para Trabalhos Futuros . . . 66
Referências bibliográficas 68
A Publicações 73
1.1 Modelo de AMC . . . 4
2.1 Utilização do Espectro nos Estados Unidos. . . 8
2.2 Diagrama de Funcionamento do RC.Fonte:wwwen.zte.com.cn/t20090701173473.html (Adaptação) . . . 10
3.1 Constelação 2-PSK . . . 16
3.2 Constelação QPSK . . . 16
3.3 Constelação OOK . . . 18
3.4 Constelação MSK . . . 21
3.5 Constelação QAM . . . 22
3.6 Modelo simplificado de um canal . . . 23
4.1 Estimativa de fY(y) . . . 29
5.1 Conjunto detemplatespara modulação OOK . . . 37
5.2 Arquitetura detalhada sem o Pré-Processamento do segundo modelo . . . 38
5.3 Bloco “Coef. Correntropia” visto em detalhe . . . 39
5.4 Arquitetura proposta . . . 39
6.1 Arquitetura para modulações binárias . . . 43
6.2 Resultados para o primeiro experimento . . . 44
6.3 Comparação de desempenho entre o coeficiente de correntropia e o coefi-ciente de correlação para uma modulação 2-FSK . . . 44
6.4 Comparação de desempenho entre o coeficiente de correntropia e o
coefi-ciente de correlação para uma modulação OOK . . . 45
6.5 Comparação de desempenho entre o coeficiente de correntropia e o coefi-ciente de correlação para uma modulação 2-PSK . . . 46
6.6 Resultados com variação do kernel: 2-FSK . . . 47
6.7 Resultados com variação do kernel: OOK . . . 48
6.8 Resultados com variação do kernel: 2-PSK . . . 48
6.9 Desempenho da arquitetura com os valores de kernel descrito na Tabela 6.2 49 6.10 Constelações das modulações normalizadas para 5 . . . 51
6.11 Arquitetura para modulações para modulações M-árias. Templates com quatro bits . . . 52
6.12 Resultados com variação do kernel: BPSK . . . 53
6.13 Resultados com variação do kernel: QPSK . . . 53
6.14 Resultados com variação do kernel: OOK . . . 54
6.15 Resultados com variação do kernel: MSK . . . 54
6.16 Resultados com variação do kernel: QAM . . . 55
6.17 Desempenho da arquitetura com os valores de kernels descritos na Tabela 6.3 . . . 56
6.18 Resultados do artigo de Aslam . . . 59
6.19 Resultados da dissertação . . . 59
6.20 Função Densidade de Probabilidade - BFSK . . . 62
6.21 Função Densidade de Probabilidade - BPSK . . . 63
6.22 Função Densidade de Probabilidade - OOK . . . 63
6.23 Função Densidade de Probabilidade - QPSK . . . 64
6.1 Parâmetros de simulação . . . 41
6.2 Tamanho do kernel ideal . . . 47
6.3 Tamanho do kernel sub-ótimo . . . 50
Lista de Símbolos
AM-DSB Modulação em Amplitude com Faixa Lateral Dupla
AMC Classificação Automática de Modulação
AWGN Ruído Aditivo Branco Gaussiano
BASK Modulação por chaveamente em amplitude em dois níveis
BFSK Modulação por chaveamente em frequência em dois níveis
BPSK Modulação por chaveamente em fase em dois níveis
CNEL Laboratório de NeuroEngenharia Computacional
DFT Transformada Discreta de Fourier
DSP Processamento Digital de Sinais
IA Inteligência Artificial
FFT Transformada Rápida de Fourier
FCC Comissão Federal de Comunicações
RDS Rápido Definido por Software
SNR Relação Sinal Ruído
TW Transformada Wavelet
ML Máxima Verossimilhança
PR Reconhecimento de Padrões
RNA Redes Neurais Artificiais
PCA Análise Principais Componentes
MSE Erro Médio Quadrático
RC Rádio Cognitivo
V.A Variável Aleatória
RKHS Espaço de Kernel de Hibert
UP Usuário Primário
US Usuário Secundário
Capítulo 1
Introdução
Neste capítulo, esta dissertação de mestrado é apresentada em linhas gerais, sendo
ressaltado a relevância do problema estudado, os objetivos desejados e a organização
proposta para o documento.
1.1 Motivação e Relevância
Nos sistemas de comunicações convencionais, o receptor trabalha cooperativamente
com o transmissor, isto é, o receptor tem um conhecimentoa priori do formato de
mo-dulação do sinal transmitido. Para um sistema de comunicação analógico, o formato de
modulação inclui o tipo de modulação, a frequência da portadora e o índice de modulação.
Por outro lado, para um sistema de comunicação digital, o formato de modulação inclui
o tipo de modulação, símbolos da constelação, tamanho do alfabeto, frequência da
por-tadora nominal, taxa de símbolos, formato do pulso, desvio de frequência (somente para
sinais modulados na frequência), dentre outros. Uma vez que esses parâmetros de
confi-guração do transmissor e do receptor são fixados, em função do contexto de aplicação de
tais sistemas, os projetistas se concentram em como tornar os sistemas de comunicações
mais eficientes, em termos de largura de banda e consumo de potência. Além disso, a
se-gurança na comunicação também é um requisito fundamental nos modernos sistemas de
Em geral, os dois entes envolvidos na comunicação não querem que suas
informa-ções sejam interceptadas por um terceiro. Em contraste a isso, as autoridades gestoras
dos sistemas de comunicação de um país podem desejar monitorar as comunicações com
algumas finalidades, como por exemplo detecção de transmissores não licenciados. Uma
etapa essencial para esse monitoramento é o reconhecimento ou classificação do formato
de modulação do sinal interceptado. Essa tarefa também surge em muitas outras
apli-cações civis e militares, tais como: confirmação de sinal no meio, identificação de
in-terferência, guerra eletrônica, análise de ameaças, e assim por diante [Ebrahimzadeh &
Hossienzadef 2011],[F.C.B.F Muller & Klautau 2011],[M.Richterova & Hythova 2006] e
[Rube & N.E.Madany 2010].
O desenvolvimento de novas técnicas eficientes de reconhecimento automático de
mo-dulação também tem sido estimulado pelo surgimento recente dos sistemas de rádio
de-finido por software (SDRs). De forma geral, o avanço tecnológico dos SDRs, aliado à
disseminação dos sistemas de comunicação sem fio, tem motivado o desenvolvimento
de técnicas inteligentes que permitam a reconfiguração automática de sistemas sem fio
de acordo com o seu ambiente de operação. Neste contexto de comunicação inteligente,
uma das tarefas desempenhadas pelo transmissor pode ser a seleção automática de um
es-quema de modulação, em função da qualidade do canal de comunicação, com o objetivo
de melhorar a sua eficiência. Essa flexibilidade na escolha do formato de modulação, pode
impor ao receptor do sistema a habilidade de reconhecer, de forma "cega", o formato de
modulação digital empregado no sinal. Essa habilidade permite ao receptor suportar uma
grande variedade de esquemas de modulação de forma dinâmica, o que potencialmente
aumentaria o desempenho do sistema.
A Classificação Automática de Modulação (AMC) consiste no reconhecimento do
tipo de modulação digital empregado por um sinal, durante a recepção do mesmo, sem a
utilização de nenhum conhecimentoa priori do sinal modulado, como por exemplo, sua
Introdução 3
função da própria ausência de informações sobre o sinal, tornando-se um desafio ainda
maior quando se considera o ruído e o desvanecimento do canal.
Experimentos realizados com a arquitetura proposta nesta dissertação, na presença de
Ruído Aditivo Gaussiano Branco (AWGN), demonstram uma taxa de sucesso
aproxima-damente igual a 97%, em uma relação sinal-ruído (SNR) de 0 dB.
1.2 Estado da Arte
A área de pesquisa em AMC se divide em duas grandes vertentes, uma que utiliza
estatísticas do sinal recebido para definir uma função de verossimilhança (ML) e outra que
usa características do sinal para classificação, empregando métodos de reconhecimento de
padrões. Em qualquer uma das abordagens, o sistema de classificação deve ser capaz de
escolher corretamente o tipo de modulação utilizada dentre um conjunto deNmodulações
candidatas. Um identificador ideal deve atender aos seguintes requisitos:
• Alta probabilidade de classificação correta (Verdadeiro Positivo ou TP) e baixa taxa
de Falso Positivo (FP), com um intervalo de observação curto;
• Capacidade de reconhecer os diversos formatos de modulação em diversos
ambien-tes, com variadas condições de propagação e ruído;
• Funcionamento em tempo real;
• Baixa complexidade computacional.
O processo clássico de classificação automática de modulações envolve
essencial-mente duas etapas: a) um pré-processamento do sinal e b) uma seleção adequada da
modulação pelo algoritmo de classificação. A seguir, a Figura 1.1 ilustra as etapas de um
receptor com AMC.
A etapa de pré-processamento do sinal pode ter como objetivo estimar parâmetros do
sistema, como frequência da portadora, período de símbolo, potência do sinal, ou mesmo
Figura 1.1: Modelo de AMC
É sabido que várias técnicas têm sido propostas na literatura para extrair características
do sinal na etapa de pré-processamento, e assim melhorar o desempenho do classificador
na etapa seguinte de AMC. Em [Rube & N.E.Madany 2010] propõe-se o cálculo do
des-vio padrão do sinal recebido na etapa de pré-processamento, para extrair características
do sinal e treinar uma rede neural na etapa de classificação. Já em [K.C. Prokopiw 2000]
propõe-se o uso de uma transformada wavelet (TW) para extrair características de sinais
QAM, PSK e FSK, assim como em [Hassan et al. 2010], no qual utiliza-se as
caracterís-ticas extraídas pela TW para realizar a classificação da modulação com o auxílio de uma
rede neural. Existem ainda trabalhos propondo a utilização de medidas estatísticas de
or-dem superior e características ciclo-estacionárias dos sinais modulados [Fehske et al. n.d.]
e análise de componentes principais (PCA) [He et al. 2010] na etapa de pré-processamento
de sistemas de AMC.
O artigo [Aslam et al. 2012] utiliza as modulações BPSK, QPSK, 16-QAM e
64-QAM e explora o uso de Programação Genética (GP) combinado com o algoritmoK−
NearestNeighbor (KNN). O KNN foi utilizado para avaliar a aptidão dos indivíduos da
GP durante a fase de treinamento. A extração de característica utiliza cumulantes de
Introdução 5
melhorar a precisão da classificação. O primeiro estágio classifica entre modulações por
chaveamento de fase (2-PSK e QPSK), já o segundo estágio classifica entre 16-QAM e
64-QAM. Os parâmetros de tempo de símbolo, frequência da portadora e fase presume-se
que seja conhecido pelo sistema.
De fato, algumas destas tarefas de pré-processamento possuem um elevado custo
com-putacional, o que pode limitar a sua aplicação ou mesmo inviabilizar a técnica proposta
em um ambiente de comunicação real.
Quanto aos métodos de classificação de modulação presentes na literatura, além do
uso de redes neurais clássicas, abordadas nas referências citadas anteriormente, alguns
tra-balhos utilizam classificadores baseados em SVM, dentre os quais, pode-se citar [F.C.B.F
Mul-ler & Klautau 2011], [Ebrahimzadeh & Hossienzadef 2011] e [C.S Park & Nah 2007].
A representação do conhecimento pode ser realizada de diversas formas. No caso
tí-pico das RNAs e das SVMs, o conhecimento é representado por meio de regras implícitas,
utilizando-se conjuntos de exemplos (amostras de dados) de entrada-saída, normalmente
na forma numérica. A aquisição do conhecimento, por sua vez, é realizada por meio
da aprendizagem de máquina. A aprendizagem de máquina pode ser classificada como:
aprendizagem supervisionada, aprendizagem não supervisionada e aprendizagem por
re-forço. Mais detalhes a respeito dessas formas de aprendizagem podem ser consultados
em [Haykin & Moher 1999].
Na abordagem ML, um ou mais testes de hipóteses são elaborados, de acordo com a
razão de verossimilhança entre as modulações envolvidas [Bastos 2007], [A.A.Polydoros
& A.Panagiotou 2000] e [J.L.Xu et al. 2010].
1.3 Objetivo
Este trabalho propõe o uso direto de uma medida da Teoria da Informação que mede
clas-sificação automática de modulações digitais binárias em um ambiente de comunicação
caracterizado pelo ruído AWGN, sem a utilização de uma fase de pré-processamento do
sinal.
1.4 Organização do Trabalho
No presente capítulo, são destacados a importância da classificação automática de
modulação, o objetivo do trabalho e o estado da arte.
O capítulo 2 introduz os principais conceitos de rádio cognitivo, como o ciclo
cog-nitivo e a reconfigurabilidade. Neste capítulo, são apresentados os requisitos, desafios e
formas de implementação.
No capítulo 3, são apresentados os esquemas de modulação digital considerados neste
trabalho. Bem como, os modelos matemáticos usados para representar os efeitos do canal
de comunicação sobre os sinais transmitidos.
No capítulo 4, apresenta-se os conceitos de entropia e potencial de informação. Neste
capítulo, são apresentadas ainda as definições fundamentais da correntropia, bem como
suas aplicações e propriedades.
O capítulo 5 apresenta a arquitetura desenvolvida nesta dissertação para a classificação
automática de modulações com uso de medida teórica de informação.
O capítulo 6 apresenta três experimentos com a finalidade de avaliar e analisar o
de-sempenho do classificador proposto.
Finalmente, no capítulo 7 são apresentadas as conclusões sobre os resultados obtidos
e as sugestões para trabalhos futuros.
O Anexo I contém a lista dos artigos publicados e submetidos à publicação no decorrer
Capítulo 2
Rádio Cognitivo: Uma Introdução
2.1 Introdução
Atualmente, o Rádio Cognitivo (RC) é uma importante linha de pesquisa na área de
telecomunicações para a solução do problema da escassez espectral. Várias entidades
privadas e públicas têm investido fortemente em temas relacionados a gestão dinâmica e
oportunista do espectro, uso flexível do espectro e atribuição dinâmica de canal.
De fato, o Rádio Cognitivo pode ser visto como um sistema de comunicação sem
fio revolucionário, que tem como principal objetivo melhorar a utilização do espectro de
radiofrequências.
2.2 Rádio Cognitivo
O espectro de frequências é um recurso limitado para as comunicações sem fio,
po-dendo tornar-se congestionado a medida que aumenta a necessidade de acomodar os
dife-rentes tipos de interfaces aéreas que surgem a cada nova geração de sistemas de
comunica-ção. De fato, a maioria do espectro de frequências disponível está licenciado atualmente.
Porém um estudo realizado pelaSpectrum Policy Task Force (STPF), ligada aoFederal
Communications Comission(FCC), mostrou que algumas bandas do espectro são muito
usadas pelos usuários licenciados (usuários primários) apenas em determinados locais e
ocupadas ou quase não são usadas. De acordo com a FCC, a utilização do espectro
li-cenciado varia entre 15 e 85%, dependendo da região geográfica e do instante de tempo,
como ilustrado na Figura 2.1.
Figura 2.1: Utilização do Espectro nos Estados Unidos.
Uma forma de contornar estas limitações é promover alterações no modelo de
licen-ciamento ou concessão atual, de forma a tornar mais flexível o acesso ao espectro de
frequências, permitindo que os usuários secundários (não licenciados) possam acessar
de forma oportunista os buracos espectrais, definidos em termos de tempo, localização
e frequência, sem causar interferências ou prejudicar as comunicações dos usuários
pri-mários (UPs) e obedecendo a certas regras e restrições de operação. Acredita-se que isso
melhoraria a eficiência e a utilização do espectro de rádio frequências, de forma a suportar
a demanda requerida. Os sistemas legados de comunicações foram projetados para operar
numa banda dedicada de frequências e eles não são capazes de aproveitar a flexibilidade
permitida no novo modelo de licenciamento. Logo, para tornar viável esta flexibilização
no acesso ao espectro é necessária uma nova tecnologia [Hossain et al. 2009].
in-Rádio Cognitivo: Uma Introdução 9
teligentes de comunicação que conseguem reconhecer o ambiente no qual opera, e são
capazes de reconfigurar seus parâmetros do sistema com o objetivo de melhorar a
quali-dade da transmissão. Em [S.Haykin 2005] estendeu a definição de rádio cognitivo: “Rádio
Cognitivo é um sistema de comunicação sem fio que está atento ao ambiente externo e
adapta seus estados internos às variações estatísticas dos sinais de RF, através da
altera-ção de seus parâmetros(potência de transmissão, frequência da portadora, modulaaltera-ção),
em tempo real, com dois objetivos principais: comunicação altamente confiável, onde e
quando for necessário, e utilização eficiente do espectro de rádio”.
O Rádio Cognitivo pode iniciar uma revolução na comunicação sem fio, com impactos
significativos tanto no desenvolvimento tecnológico, quanto na regulamentação do uso do
espectro para superar as limitações espectrais existentes.
RC, é um aprimoramento do Rádio Definido por Software (SDR) herdando todas as
características do rádio reconfigurável. A tecnologia de SDR permite ao Rádio Cognitivo
a característica de reconfigurábilidade, enquanto que a capacidade cognitiva, que permite
ao rádio interagir em tempo real com o ambiente de comunicação, é implementada por
técnicas de processamento de sinais e de aprendizagem de máquinas. O processo
cogni-tivo é iniciado com a simples observação do ambiente e termina com uma ação, ou seja,
com a alteração dos parâmetros de transmissão ou de recepção [Almeida 2009]. A Figura
2.2 ilustra um fluxograma de funcionamento do RC.
Existem três protocolos de comunicação para Rádio Cognitivo mais conhecidos:
in-terweave, underlay eoverlay [Goldesmith et al. 2009], [S.Srinivasa & Jafar 2007]. No
protocolointerweave, os usuários não licenciados (secundários) fazem um sensoriamento
do espectro licenciado à procura de faixas de frequência não utilizadas e, encontrando-as,
transmitem nessas frequências sem causar interferência no usuário licenciado (primário).
Se por acaso o usuário primário começar a transmitir em uma determinada frequência,
o usuário secundário não pode transmitir na mesma frequência, devendo então procurar
Figura 2.2: Diagrama de Funcionamento do RC. Fonte:
wwwen.zte.com.cn/t20090701173473.html (Adaptação)
simultaneamente com usuários primários desde que sua interferência esteja abaixo de um
certo limite. Assim, a potência de transmissão do secundário é limitada pelo nível de
interferência aceito pelo usuário primário. No protocolo overlay, o usuário secundário
conhece a mensagem do usuário primário. Com esse conhecimento e usando técnicas
avançadas de comunicação pode transmitir de forma concorrente com o primário.
As principais vantagens da adoção da tecnologia de rádio cognitivo são:
1. Aumentar a utilização do espectro atual, isto é, preencher partes do espctro não
utilizado.
2. Aumentar o desempenho das redes de dados sem fio.
3. Maior adaptabilidade aos ambientes de transmissão.
4. Maior disponiblidade de seviços.
A mudança da utilização do espectro do modelo estático, para o modelo dinâmico,
Rádio Cognitivo: Uma Introdução 11
de comunicação sem fio. Nos Estados Unidos existem diversas empresas atuando junto a
FCC para a adoção deste novo modelo de rádio.
A FCC foi pioneira no estudo de RC e publicou em [05-57 2005] as seguintes
carac-terísticas que os Rádios Cognitivos poderão incorporar para permitir um uso eficiente e
flexível do espectro:
• Frequência Ágil- O rádio deverá ser capaz de mudar sua frequência de operação
para otimizar a sua transmissão.
• Seleção Dinâmica de Frequência- O rádio deverá sentir os sinais dos
transmisso-res próximos para escolher o melhor ambiente de operação.
• Modulação Adaptativa- As características de transmissão e formato de
modula-ção podem ser reconfigurados explorando as oportunidades de utilizamodula-ção do
espec-tro e canal.
• Controle de Potência- A potência de transmissão é adaptada para os limites de
potência do meio.
• Detecção do Local- O rádio deverá ser capaz de determinar a sua localização e de
outros dispositivos que operam dentro da mesma faixa de espectro.
• Uso Negociado- O Rádio Cognitivo pode ter algoritmos para permitir o
compar-tilhamento, desde que haja um acordo pré-estabelecido entre o usuário primário e
secundário.
Esta dissertação propõe uma técnica de AMC que busca viabilizar a incorporação
de esquemas de modulação adaptativa, em sistemas de rádio cognitivo. Esquemas de
modulação adaptativa, possibilitam a utilização de mais de um tipo de modulação no
transmissor, o que potencialmente aumenta a eficiência na utilização do utilização do
2.3 Conclusão
Este capítulo introduziu os conceitos mais importantes da tecnologia de rádio
cogni-tivo. Devido às características diversas do RC, surge a necessidade de diversas técnicas
de sensoriamento do espectro, processamento digital de sinais e esquemas de modulações
adaptativa.
No próximo capítulo será apresentado os esquemas de modulação digital considerados
Capítulo 3
Modulação Digital e Canal de
Comunicação
3.1 Introdução
Neste capítulo, são apresentados os esquemas de modulação digital considerados
neste trabalho. Além disso, são apresentados os modelos matemáticos usados para
re-presentar os efeitos do canal de comunicação sobre os sinais transmitidos.
3.2 Modulação
O propósito de um sistema de comunicação é transmitir sinais portadores de
infor-mação através de um canal de comunicação, o qual separa o transmissor do receptor
[Haykin 2007]. Os sinais portadores de informação também são chamados sinais de
banda base. O uso apropriado do canal de comunicação requer um deslocamento da faixa
de frequência de banda base para outras faixas de frequências apropriadas à transmissão.
Este procedimento é realizado utilizando-se amodulação, definida como o processo pelo
qual a amplitude, frequência e fase de uma portadora é variada de acordo com a
s(t) =A(t)cosθ(t) (3.1)
em queA(t)representa a amplitude eθ(t)são as variações de fase e frequência da
porta-dora em função do tempo. A equação (3.2) define o valor deθ(t).
θ(t) =ωct+φ(t) (3.2)
de modo que
s(t) =A(t)cos[ωct+φ(t)] (3.3)
em que ωc é a frequência da portadora e φ(t) é a fase. Os parâmetros fc e ωc serão
utilizados para designar frequência, sendo fca frequência em Hertz eωca frequência em
radianos por segundo. Esses dois parâmetros de frequência são relacionados por ωc =
2πfc.
É importante ressaltar que, alguns meios de comunicação conseguem propagar as
on-das eletromagnéticas em banda base, sem modificações no conteúdo de frequências do
sinal transmitido. Por outro lado, para a transmissão sem fio, formas de onda em banda
base são impraticáveis por duas razões. Em primeiro lugar, o tamanho da antena
neces-sária para irradiar uma onda eletromagnética é inversamente proporcional a frequência
da onda. Portanto, o deslocamento espectral da forma de onda de banda base para uma
frequência mais elevada permite a utilização de uma antena maior. Para muitos
dispositi-vos móveis, isto resulta numa frequência de portadora da ordem de 1 GHz.
Por outro lado, a maioria dos sinais de informação de interesse possuem praticamente
o mesmo conteúdo de frequências. Ao atribuir a cada fonte de informação uma porção
única no espectro eletromagnético, por meio do processo de modulação, vários
transmis-sores podem operar sem interferência.
Modulação Digital e Canal de Comunicação 15
3.2.1 Modulação por Chaveamento de Fase - PSK
Como o nome indica, a modulação PSK ocorre com a atribuição de uma fase única
para cada símbolo presente na forma de onda em banda base.
Na modulação por chaveamento de fase binária (2-PSK) cada símbolo representa um
bit que é mapeado em uma de duas fases diferentes, já a 4-PSK utiliza quatro fases
dife-rentes para representar quatro símbolos de informação, e assim por diante. As formas de
onda resultantes podem ser representadas matematicamente por [Haykin 2007]:
si(t) =
r
2E Ts
cos
2πfct+ 2π
Mi
i=1,2, ...,M (3.4)
onde M é o número de símbolos da constelação, E é a energia por símbolo e T é o
intervalo de símbolo. A frequência da portadora é fc=nc
T para algum número inteiro fixo
nc.
A modulação 4-PSK (quando o valor de M é igual a 4) é amplamente utilizada nos
sistemas de comunicação. Nesse caso, as quatro fases possíveis para a portadora são: π
4, 3π
4 e 54π e 74π. Para esse conjunto de valores, pode-se definir o sinal transmitido como:
q
2E
T cos 2πfct+ (2i−
π
4)
0≤t≤T (3.5)
Na modulação 4-PSK, a sinalização da informação no canal é feita por funções seno
e cosseno. Isto é importante porque o seno e o cosseno são sinais ortogonais, o que
significa que eles não estão correlacionados no tempo sobre a duração de um símbolo.
Mesmo quando as suas frequências são as mesmas, esses sinais são transmitidos pela
mesma antena e recuperados no mesmo receptor sem qualquer interferência mútua.
A Figura 3.1 ilustra a constelação associada à modulação 2-PSK, já a Figura 3.2 ilustra
à constelação da modulação 4-PSK.
De forma geral, uma forma de onda modulada pode ser construída como a soma de
Figura 3.1: Constelação 2-PSK
Modulação Digital e Canal de Comunicação 17
segunda, representada pelo eixo vertical, está deslocada em relação à primeira de
exata-mente π
2 é dita estar em quadratura(Q). Por essa razão, a modulação 4-PSK é
normal-mente denominada chaveamento de quadrifase (QPSK) [Haykin 2007].
Os sistemas que utilizam esquemas de modulação M-PSK são populares por seu
de-sempenho, em termos de probabilidade de erro de símbolo, e por sua largura de banda
eficiente. No entanto, o receptor associado a essa modulação apresenta uma
complexi-dade maior. A fim de recuperar o sinal de banda base, o receptor deve gerar uma senoide
com fase sincronizada à fase do sinal recebido.
3.2.2 Modulação por Chaveamento de Amplitude - ASK
O sinal ASK pode ser compreendido a partir dos mesmos princípios da modulação
analógica AM-DSB. As principais características da modulação por chaveamento de
am-plitude são:
• Simplicidade no processo de modulação e demodulação;
• Eficiência de largura de banda;
• Baixa imunidade ao ruído.
Devido a essas características, a modulação por chaveamento de amplitude é indicada
em ambientes de comunicação com pouco ruído ou quando o baixo custo do sistema é
essencial.
Para se gerar um sinal com modulação 2-ASK basta alterar o valor da amplitude do
sinal de saída em função do bit a transmitir. Com base nesta condição, os símbolos na
modulação binária M-ASK são definidos pela equação (3.6):
Si(t) =
r
2Ei(t)
T cos(2πfct+φ) i=1,2, ...,M (3.6)
ondeM é o número de símbolos da constelação,Eé a energia por símbolo,T é o intervalo
Portanto, cada símbolo corresponde a uma amplitude diferente da portadora. Pode-se
aumentar a capacidade de transmissão do sistema adotando-se um número maior de
valo-res de amplitude para a portadora. Por exemplo, considerando-se agrupamentos de dois
bits por símbolo, existirão quatro possíveis símbolos no alfabeto da fonte de informação:
(00, 01, 10 e 11). Logo, cada amplitude da transmitida corresponde a dois bits, e uma
sinalização com essa modulação dobra a taxa de transmissão do sistema em relação ao
2-ASK.
Um caso particular da modulação 2-ASK é a modulação OOK. Esta técnica transmite
um pulso senoidal para representar a um determinado bit e nos intervalos de tempo do bit
complementar não transmite pulsos. Neste caso particular, o bit 1 é codificado de forma
idêntica à modulação ASK descrita na equação (3.6) e o bit 0 é codificado por um valor de
amplitude zero com duração de tempo de um bit. A expressão matemática que representa
a modulação OOK é descrita por (3.7).
q
2E(t)
T cos(2πfct+φ); bit1 0; bit0
(3.7)
A constelação associada a modulação OOK é ilustrada na Figura 3.7
Modulação Digital e Canal de Comunicação 19
A modulação ASK é extremamente susceptível à interferência provocada por ruídos.
O fato da modulação basear-se somente na amplitude do sinal para modular os níveis
binários é um fator problemático, pois os ruídos geralmente afetam a amplitude do sinal
que está sendo transmitido.
3.2.3 Modulação por Chaveamento de Frequência - FSK
A modulação FSK atribui frequências diferentes para a portadora em função do
sím-bolo que é transmitido. Portanto, quando o bit 0 é transmitido, a portadora assume uma
frequência correspondente ao bit 0, durante o período de duração do bit.
Alternativa-mente, é possível, por exemplo, utilizar quatro frequências de transmissão diferentes,
cada uma delas correspondendo a um símbolo formado por 2 bits, este modo é chamado
de 4-FSK [Haykin 2007]. A modulação 4-FSK aumenta a taxa de bits transmitidos em
comparação com a modulação 2-FSK, mas em contrapartida aumenta também a banda de
frequências utilizada na transmissão.
Pode-se expressar o sinal M-FSK da seguinte maneira:
si(t) =
r
2E
T cos(2πfit+φ) (3.8)
onde fié a frequência da portadora que representa o i-ésimo símbolo da fonte de
informa-ção,E é a energia por símbolo,T é o intervalo de símbolo eφé um deslocamento inicial
de fase.
Os sinais FSK binários representam os bits de informação por meio de duas
frequên-cias, f1e f2. Quando essas frequências são definidas por fi= f racMC+iTB, para algum
número inteiro fixoMcei=1,2, o sinal FSK é conhecido como FSK de Sunde. Esse sinal
é de fase contínua, no sentido de que a continuidade de fase é sempre mantida, incluindo
os tempos de comutação entre bits. Note que neste caso, a diferença entre as frequências
Os sinais FSK são diferentes dos sinais PSK e ASK, já que cada um dosM símbolos
possui sua própria frequência de sinalização. As senóides possuem a mesma amplitude,
porém com frequências diferentes.
A modulação FSK usa o espectro de frequências de forma ineficiente, mas pode ser
detectada de forma não-coerente, o que reduz a complexidade do receptor. Essa
demo-dulação não pode ser decomposta e visualizada como componentesI eQ, uma vez que
utiliza múltiplas frequências de sinalização, de forma que pode ser representada apenas
em um espaço multidimensional.
Um caso particular da modulação FSK é a modulação MSK (Minimum Shift Keying),
na qual a frequência de separação é mínima entre as portadoras com amplitudes e fases
constantes. As portadoras são utilizadas de modo a garantir a ortogonalidade entre elas.
A forma de onda da modulação MSK pode ser expressa por [Sklar 2001]:
s(t) =cos
2π(fc+ dk
4T)t+xk
(3.9)
Em que fc é a frequência da portadora, dk pode assumir valores −1 e 1 fornecido pela
codificação bipolar exk é uma fase constante sobre o k-ésimo intervalo de bits.
Observa-se que quandodk=1 a frequência transmitida é f0+1/4T e quandodk=−1 a frequência
transmitida é f0−1/4T. Logo, o espaçamento entre as frequências do MSK é igua a
metade daquele empregado na modulação FSK não-coerente, o que justifica o nome dessa
modulação, minimum shift keying.
Durante cada intervalo de T segundos, o valor dexké constante e igual a 0 ouπ. Este
valor é determinado pela restrição de fase contínua da onda emt =kt
A modulação MSK apresenta algumas vantagens. O espectro do sinal MSJ
modu-lado tem uma eficiência espectral superior às modulações BPSK e FSK, e sofre menos
distorções em aplicações com amplificadores de alta potência [Feher 1995].
Modulação Digital e Canal de Comunicação 21
Figura 3.4: Constelação MSK
3.3 Modulação de Amplitude em Quadratura - QAM
Na modulação QAM o sinal da portadora modula a informação da fonte tanto em
amplitude quanto em fase. A forma de onda corresponde a soma de duas senóides, sendo
cada uma delas modulada por um conjunto de amplitudes diferentes. A QAM é uma
generalização bidimensional da PAM M-ária na medida em que sua formulação envolve
duas funções de base ortogonais em banda passante. O sinal QAM transmitido para o
k-ésimo símbolo, é definido por [Haykin 2007]
sk(t) =
r
2E
T akcos(2πfct)−
r
2E
T bksen(2πfct) (3.10)
onde fc é a frequência da portadora, E é a energia por símbolo e T é o intervalo de
símbolo.
Dependendo do número de M símbolos possíveis, pode-se distinguir duas
constela-ções QAM: constelaconstela-ções quadradas, para os quais o número de bits por símbolo é par, e
constelações cruzadas, para as quais o número de bits por símbolo é ímpar. Nesta
dis-sertação considera apenas o caso de 4 bits por símbolo, o que corresponde a modulação
16-QAM.
amplitudes e cada símbolo transmitido representa a informação de quatro bits. A
combi-nação dos valores obtidos pelas senóides em fase (I) e em quadratura (Q) é ilustrada na
Figura 3.5.
Figura 3.5: Constelação QAM
A codificação dos quatro quadrantes, bem como a codificação dos símbolos em cada
quadrante, segue a regra de codificação Gray.
A modulação QAM é utilizada em TV digital e em outros sistemas que necessitam
de alta taxa de transmissão de informação. Alguns exemplos da utilização da QAM são
os enlaces de rádio digital e de microondas, televisão digital de alta definição, modens a
cabo e ADSL.
3.4 Canal de Comunicação
O canal de comunicação é o meio que provê a conexão física entre transmissores
e receptores em um sistema de comunicação. No canal de comunicação, o sinal pode
sofrer degradação de diferentes maneiras, o que torna os processos de demodulação e
classificação de modulação mais difíceis. Existem diferentes modelos matemáticos para
Modulação Digital e Canal de Comunicação 23
3.4.1 Canal AWGN
Qualquer receptor sempre terá uma determinada quantidade de energia térmica
as-sociada ao fluxo de cargas elétricas em sua antena ou nos seus circuitos. Além disso,
diferentes e vários sinais de interferências são sempre recebidos pela antena junto ao
si-nal de informação de interesse [Sklar 2001].
Esses diferentes processos interferentes podem ser modelados como um único sinal
aleatório gaussiano branco que se adiciona ao sinal modulado de interesse. Neste trabalho,
considera-se que este modelo é suficiente para descrever os efeitos do canal de propagação
sem fio sobre a informação transmitida. É comum expressar este processo em termos da
sua densidade espectral de potência constante igual a, N0
2 por dimensão.
Figura 3.6: Modelo simplificado de um canal
Na Figura 3.6, x(t) representa o sinal de informação transmitido, n(t) o ruído
adi-cionado pelo canal ey(t), o sinal recebido. O canal pode ser completamente
caracteri-zado pela distribuição de probabilidade do ruído. Ao assumir que este ruído é gaussiano
admite-se que o sinal aleatórion(t)é um processo gaussiano, e em cada instante de tempo,
o seu valor é modelado por uma variável aleatória (v.a) Gaussiana, com função densidade
matemá-tico é conhecido como canal com ruído aditivo gaussiano branco (AWGN).
P(α) = 1
σ√2πe
−2ασ22 (3.11)
Esse modelo é bastante utilizado em função de sua simplicidade matemática, e de sua
aderência a um grande conjunto de canais físicos.
Esses diferentes processos interferentes podem ser modelados como um único sinal
aleatório gaussiano branco que se adiciona ao sinal modulado de interesse. Neste trabalho,
considera-se que este modelo é suficiente para descrever os efeitos do canal de propagação
sem fio sobre a informação transmitida. É comum expressar este processo em termos da
sua densidade espectral de potência constante igual a, N0
2 por dimensão.
O termo ruído branco se deve ao fato desse tipo de ruído se distribuir uniformemente
em todas as faixas de frequência do espectro, possuir média nula e correlação nula entre
suas amplitudes em instantes de tempos distintos. Ou seja, o valor da amplitude do ruído
em um determinado instante independe daquele observado em outro instante de tempo
qualquer.
A degradação imposta pelo canal sobre o sinal pode ser quantificada através da relação
sinal-ruído (SNR), que é simplesmente a relação entre a potência do sinal e a potência do
ruído.
3.5 Conclusão
Neste capítulo, foi introduzido algumas técnicas de modulação digital comumente
utilizadas nos sistemas de comunicação, e o canal AWGN, responsável por modelar
ma-temáticamente as distorções impostas pelo canal sobre o sinal transmitido.
O próximo capítulo tratará das definições fundamentais da Teoria da Informação
Capítulo 4
Teoria da Informação
4.1 Introdução
No século XX, o surgimento da telefonia colocou desafios sobre os possíveis limites
para as taxas de transmissão de informação veiculadas por canais ruidosos.
Acreditava-se naquela época que a probabilidade de erro na recepção de uma mensagem somente
poderia ser reduzida pela redução da taxa de transmissão, ou seja, uma mensagem livre
de erros apenas poderia ocorrer se a transmissão cessasse.
Entretanto, Claude Shannon (1949), mostrou que se um canal tivesse capacidade
não-nula, ou seja aquele que é possível transmitir informação, probabilidades de erro
arbitra-riamente baixas poderiam ser atingidas, desde que a taxa de transmissão se mantivesse
abaixo da capacidade do canal. Shannon aplicou o conceito de entropia a estudos em
teoria da codificação, fundamentando a Teoria da Informação.
Este capítulo trata das definições fundamentais da Teoria da Informação e introduz a
correntropia, uma medida de similaridade que tem suas bases na Teoria da Informação.
Este capítulo também apresenta aplicações e propriedades da correntropia.
4.2 Entropia
Em Teoria da Informação, a entropia quantifica a incerteza associada com o valor de
exemplo, é maior do que a de um lance de moeda. Logo, conhecer o resultado de um
lance de dado reduz mais a entropia (fornece um maior ganho de informação) do que
conhecer o resultado de um lance de moeda. Resumidamente, quanto menos informações
é conhecida de um processo, maior será sua entropia.
4.2.1 Entropia de Shannon
A entropia de Shannon para uma variável aleatória (v.a) discretaXé calculada como
sendo:
H(X) =−
∑
pilog(pi) (4.1)em que pi é a probabilidade de cada evento i da partição ou da v.a X em questão. No
caso de uma v.a contínua, a entropia de Shannon é calculada, com base na distribuição de
probabilidadep(x)da v.a por:
H(X) =−
Z
pX(x)log(pX(x))dx (4.2)
Analisando a equação 4.1, chama-se a atenção para o fato de que a entropia H(X)
não é uma função da variável aleatória X, mas sim da distribuição de probabilidade dessa
variável. Em outras palavras, não dependente dos valores que X assume, mas das suas
probabilidades.
4.2.2 Entropia de Rényi
Rényi (1961) buscou uma definição geral para medidas de informação que
preser-vassem a aditividade de eventos independentes e fosse compatível com os axiomas da
probabilidade. A partir da equação funcional de Cauchy f(xy) = f(x) +f(y), a entropia
Teoria da Informação 27
Hα = 1
1−αlog( n
∑
i=1
pαi ) (4.3)
onde pisão as probabilidades de ocorrência dos valoresxida variável X, paraα≥0 eα
6
=1. Esse resultado engloba, de fato, uma família de medidas de informação chamadas
Entropia de Rényi. É possível demonstrar que a entropia de Shannon é um caso particular
da entropia de Rényi quandoαé igual a 1.
Ao se comparar as duas definições de entropia 4.1 e 4.3, percebe-se que em Shannon
log(pii)é ponderado pela probabilidade, enquanto em Rényi o logaritmo é externo à soma
de potências das probabilidades. Assumindo que:
Vα(X) =
∑
i
npαi (4.4)
Hα=
1
1−αlog(Vα(X)) =−log( α−p1
Vα(X)) (4.5)
Em queVα(X) é o argumento da α-norma da função probabilidade. Numa visão
geo-métrica, as funções de probabilidades compõem um espaço de n dimensões e a distância
entre a origem e um ponto P(p1,p2,p3, ...,pn) é medido pela α-norma, sendo α=2 a
norma euclidiana [Principe 2010].
A entropia de Rényi também pode ser definida para v.a’s. contínuas [Artuso 2011].
Hα= 1
1−αlog
Z
pα(x)dx (4.6)
Utilizandoα= 2 na equação 4.6, tem-se a entropia quadrática de Renyi:
H2=log
Z
p(x)2dx (4.7)
A entropia quadrática de Rényi é particularmente interessante por ser facilmente
Na literatura, o segundo momento da função de probabilidade é conhecido como o
índice de coincidência ou grau de pureza, porque desaparece se o estado da partícula é
puro [Principe 2010].
4.2.3 Janelas de Parzen e Potencial de Informação
O método da Janela de Parzen fornece uma estimativa da função densidade de
pro-babilidade de um conjunto de dados discretos, em um espaço M-dimensional. Parzen
utilizou um somatório de funções kernel para estimar a função de distribuição de
probabi-lidade (fdp) de uma v.a. A maioria das aplicações utilizam o kernel Gaussiano, pelo fato
da convolução de uma função gaussiana também ser uma gaussiana, facilitando o cálculo
computacional da função.
A expressão da estimativa da fdp fY(y)da variável aleatóriaY, com base numa
amos-tra formada por um conjuto de N pontos, é obtida a partir da soma das contribuições
individuais do kernel aplicado em cada ponto, na forma:
fY(y) = 1 N
N
∑
i=1
Kσ(y−yi) (4.8)
ondeyisão amostras da v.a,Kσé o kernel utilizando na aproximação eσé o tamanho da
janela de Parzen do kernel.
Pode ser observado que um valor alto para o parâmetro σresulta em uma estimativa
suavizada para fY(y), enquanto que um valor baixo para σ resulta em uma estimativa
grosseira para fY(y), conforme ilustrado na Figura 4.1, onde os tamanhos dos σ são a)
0.4, b) 0.2 e c) 0.8.
É possível estimar a entropia quadrática de Rényi utilizando a janela de Parzen. Para
isso, atribui-se um kernel sobre os dados da amostra e os soma com uma normalização
Teoria da Informação 29
Figura 4.1: Estimativa de fY(y)
H2=−log
Z ∞ −∞ 1 N N
∑
i=1
Kσ(y−yi)
!2
dy (4.9)
H2=−log 1 N2
Z ∞
−∞
N
∑
i=1 N
∑
j=1
Kσ(y−yj)Kσ(y−yi)dy (4.10)
H2=−log 1 N2
N
∑
i=1 N
∑
j=1
Z ∞
−∞Kσ(y−yj)Kσ(y−yi)dy (4.11)
Aplicando-se a propriedade da convolução de gaussianas, obtém-se:
H2=−log 1
N2 N
∑
i=1 N
∑
j=1 Kσ√
2(yj−yi)
!
(4.12)
H2=−log(IP(y)) (4.13)
em que:
IP(y) = 1
N2 N
∑
i=1 N
∑
j=1
Kσ(yi−yj) (4.14)
A funçãoIP(y)é denominada potencial de informação. A função empressa pela
equa-ção 4.14 é uma funequa-ção monotônica e crescente, e portanto a minimizaequa-ção da entropia pode
ser conseguida pela maximização do potencial de informação, ou seja, mais informação
sobre o sistema.
4.2.4 Correntropia
A correntropia foi desenvolvida pelo grupo de neuroengenharia da Universidade da
Flórida, coordenado pelo professor Jose C. Principe. Ela pode ser definida por uma
trans-formação não-linear sobre a diferença entre duas variáveis aleatórias X = [X1, ...,Xn] e
Y = [Y1, ...,Yn], sendo expressa por [Santamaria et al. 2006]:
V(X,Y) = 1
N N
∑
i=1
Kσ(xi−yi) (4.15)
Essa transformação é dada por uma função de kernel positiva-definida, a qual é capaz
de gerar um Espaço de Hilbert Reproduzido por Kernel (RKHS). Logo, a correntropia
pode ser vista como uma medida da diferença entre duas v.a’s nesse espaço.
Além disso, pode-se observar que a correntropia é uma generalização da medida de
correlação entre sinais aleatórios, pois essa medida consegue extrair tanto informações
estatísticas de segunda ordem, quanto de ordens superiores entre os sinais analisados
[Santamaria et al. 2006]. Nos últimos anos, este conceito tem sido aplicado com sucesso
tempo-Teoria da Informação 31
rais [Park & J.C.Príncipe 2008], testes de não-linearidade [Gunduz & J.C.Príncipe 2009],
reconhecimento de objetos [Jeong et al. 2009] e análise de componentes independentes
[Li et al. 2007]. Embora, por definição, a correntropia seja semelhante à correlação,
es-tudos recentes têm mostrado que ela funciona melhor do que a correlação ao lidar com
sistemas não-lineares e ambientes não-gaussianos, sem qualquer aumento significativo no
custo computacional [Santamaria et al. 2006].
O espaço RKHS é um espaço de Hilbert de funções construído de maneira específica
e única a partir de um kerbel positivo definido. Na equação 4.15 utiliza-se um kernel
gaussiano, o qual é definido por:
k(x,y) =Kσ(xi−yi) = 1 σ√2πe
−(xi−yi)
2
2σ2 (4.16)
As funções do RKHS tem como peculiaridade o fato de seus valores poderem ser
reproduzidos através de uma operação elementar envolvendo a própria função, o núcleo
gerador e o produto interno do espaço.
Aplicando-se uma expansão por série de Taylor no kernel gaussiano, definido pela
equação (4.15), a medida de correntropia pode ser expressa por:
v(X,Y) = √1
2πσ
∞
∑
n=0
(−1)n
2nσ2nn!E[(X−Y)
2n]. (4.17)
Percebe-se, a partir dessa equação, que a correntropia contém informação de infinitos
momentos estatísticos de ordem par.
A correntropia está diretamente relacionada ao conceito de similaridade entre duas
(v.a’s). O tamanho do kernel funciona como umzoomque controla a janela de observação
na qual a similaridade é avaliada nesse espaço. A possibilidade de ajustar o tamanho do
kernel fornece um mecanismo eficiente que permite eliminar os valores que são muito
diferentes do conjunto de dados (outlier).
sendo expressa por: 4.18 [Silverman 2086]:
σ=σX
h
4N−1(2d+1)−1i(d+14)
(4.18)
em que d corresponde à dimensão dos dados, N corresponde ao número de amostras e
σx corresponde ao traço da matriz de auto-covariância deX. É importante ressaltar que
a regra de Silverman não fornecer o melhor kernel para a medida de correntropia, porém
ela indica um valor de referência para um refinamento posterior.
Denomina-se auto-correntropia, a medida de correntropia calculada entre vetores
ale-atórios de um mesmo processo estocástico, e denomina-se correntropia cruzada a medida
de correntropia entre dois vetores aleatórios de processos diferentes [Xu et al. 2008].
Em [Principe 2010], define-se a correntropia cruzada centralizada por uma
genera-lização da função de covariância centralizada, pois a correntropia cruzada original não
possui garantia de média zero, mesmo quando os dados de entrada estão centralizados,
devido às transformações não lineares produzidas pelo kernel gaussiano. O estimador da
correntropia cruzada centralizada é dado por 4.19:
U(X,Y) = 1
N N
∑
i=1
Kσ(xi−yi)−
1 N2
N
∑
i=1 N
∑
j=1
Kσ(xi−yj)
(4.19)
Em [Xu et al. 2008], apresenta-se uma nova medida de similaridade, denominada
coeficiente de correntropia, que calcula o cosseno do ângulo entre dois vetores aleatórios
transformados no espaço (RKHS). Por utilizar os infinitos momentos estatísticos pares
entre as v.a’s X e Y, essa medida é capaz de extrair mais informação do que o coeficiente
Teoria da Informação 33
η(X,Y) = p U(X,Y)
U(X,X)p
U(Y,Y) (4.20)
em queU(X,Y)é a função de correntropia cruzada centralizada entre os vetores X e Y, e
U(X,X),U(Y,Y)são as funções de auto-correntropia centralizada para os vetores X e Y.
Neste trabalho, o coeficiente de correntropia é utilizado para caracterizar com
pre-cisão as interdependências dinâmicas entre sistemas de modulação digital. Esta
capaci-dade de caracterização se deve, principalmente, ao fato da correntropia ser sensível às
não-linearidades e informações estatísticas de ordem elevada que estão presentes nesses
sistemas.
Todas as propriedades da correntropia encontram-se descrita em [L.Weifeng et al.
2006] e [Santamaria et al. 2006]. Apenas serão apresentadas três propriedades essenciais
para compreender a aplicação dessa medida nos sistemas propostos.
Propriedades da Correntropia
Propriedade 1
A correntropia é simétrica:V(X,Y) =V(Y,X)
Propriedade 2
A correntropia é positiva e limitada: 0<V(X,Y)≤1/√2πσ. Ela atinge o seu valor
máximo se e somente seX=Y
Propriedade 3
A correntropia envolve todos os momentos estatísticos de ordem par, como pode ser
verificado por meio de sua definição: v(X,Y) = √1
2πσ∑ ∞
n=0 (−1)
n
2nσ2nn!E[(X−Y)2n]
É importante ressaltar que, se o tamanho do kernel for suficientemente grande, os
momentos estatísticos de segunda ordem dominam a função e a medida se resume à
co-variância enviesada. Adicionalmente, a correntropia é sensível a processos aleatórios
calculado pelo kernel gaussiano tende a zero [Santamaria et al. 2006].
4.3 Conclusão
O coeficiente de correntropia é um uma nova medida desenvolvida em [Xu et al. 2008]
para quantificar similaridade entre duas variáveis aleatórias a partir da definição
matemá-tica da correntropia. Os conceitos de correntropia estão sendo utilizados em problemas
complexos de engenharia, apresentando vantagens em relação à medidas estatísticas de
segunda ordem, principalmente em função da maior quantidade de informação extraída
dos processos analisados.
No próximo capítulo será apresentado o método de classificação de modulações
Capítulo 5
Arquitetura para AMC com uso de
Medida Teórica de Informação
5.1 Introdução
Um problema frequente no processamento da informação é descobrir como extrair
a melhor informação contida nos dados analisados. Ao longo dos anos, os momentos
estatísticos de segunda ordem vêm sendo largamente utilizados em algoritmos de
classi-ficação e de aprendizado de máquina. Há diversas razões para isso, dentre elas pode-se
destacar [Wang & Bovik 2009]:
1. Essas medidas são simples de usar;
2. Elas possuem significado físico, como é o caso do valor médio quadrático, o qual
está associado à energia do sinal avaliado.
3. São particularmente úteis na solução de problemas pertencentes ao domínio
linear-gaussiano;
4. Originam uma enorme variedade de algoritmos adaptativos;
Entretanto, há evidências que indicam que o segundo momento estatístico é uma
me-dida pobre para avaliar informação entre sinais [Principe et al. 2000]. Além disso, o
avanço da capacidade computacional e o estudo de problemas mais complexos em
momento estatístico pode não ser a mais satisfatória.
Neste capítulo será apresentado o método de classificação de modulações digitais,
de-senvolvido no trabalho. Esse método apresenta como principal característica o uso de uma
medida de informação denominada de correntropia, como ferramenta de classificação.
Obteve-se taxas elevadas de classificação, mesmo sem uma fase de pré-processamento
para a extração de característica. A arquitetura desenvolvida utiliza os infinitos
momen-tos estatísticos de ordem par, através da correntropia, com o objetivo de eliminar a etapa
de extração de característica e propor uma arquitetura escalável.
5.2 Arquitetura
A arquitetura de classificação proposta foi investigada em um ambiente de
comunica-ção modelado pelo ruído AWGN. Nesse modelo, o sinal recebido,r(t), é dado por:
r(t) =s(t) +n(t), iTs≤t≤(i+1)Ts (5.1)
em ques(t)é o sinal transmitido com modulação desconhecida, sendo definido pela
equa-ção 3.3 en(t)é um sinal aleatório que representa o ruído AWGN.
O objetivo do método é identificar a técnica de modulação utilizada no sinal recebido
r(t), por meio de uma medida de similaridade conhecida por coeficiente de correntropia.
Na arquitetura do classificador, cada modulação a ser investigada é representada por
agrupamento detemplates. O formato de modulação do sinal recebido é estimado a partir
da comparação desse sinal com cada template associado às modulações investigadas.
Essa comparação é feita em termos de um valor de similaridade fornecido pelo coeficiente
de correntropia.
Foi definido experimentalmente que a quantidade detemplatesbinários em cada
agru-pamento associado a um formato de modulação é igual aM, em que M é o número de
Arquitetura para AMC com uso de Medida Teórica de Informação 37
quatro, ou seja, para o conjunto de modulações (2-FSK, OOK e 2-PSK) o valor deMnão
seria igual a dois e sim igual a quatro. Já para o conjunto de modulações (2-FSK, OOK,
2-PSK, 4-PSK e 16-QAM) o valor deMseria igual a dezesseis.
Figura 5.1: Conjunto detemplatespara modulação OOK
Além disso, o tamanho de cada template deve ser igual a Nlog2M, em que N é o
número de amostras por símbolo.
A classificação ocorre em duas etapas, como ilustrado nas Figuras 5.2 e 5.3, descritas
abaixo:
1. Inicialmente, o classificador proposto calcula o coeficiente de correntropia entre
um vetor de amostras do sinal recebido, denotado aqui porX, na presença de ruído
AWGN, com cadatemplate associado às modulações investigadas. No bloco
de-nominado “Coef. Correntropia”, ilustrado na Figura 5.2, cada padrão binário do
conjunto detemplates são comparados com o vetor binário X do sinal recebido,
r(t), conforme visualizado em detalhes à esquerda da Figura 5.3 para o caso de
uma modulação binária. Os argumentos para o cálculo de cadaηdo coeficiente de
(a) A auto-correntropia do sinal de entrada:U(x,x);
(b) A auto-correntropia de cada elemento do conjunto de padrões binários:U(yi,yi);
(c) A correntropia-cruzada entre o sinal recebidoa e cada padrão binário descrito
no item anterior:U(x,yi).
Para propósito de ilustração, a Figura 5.1 mostra um conjuto de template, livre
de ruído, para a modulação OOK. Cada modulação terá seu conjuto de template
agrupados pela técnica de modulação.
2. No segundo passo, um comparador decide em favor do maior valor de coeficiente
de correntropia calculado na etapa anterior. O algoritmo define então a modulação
vencedora com base no maior coeficiente calculado.
Figura 5.2: Arquitetura detalhada sem o Pré-Processamento do segundo modelo
Devido à capacidade do coeficiente de correntropia de caracterizar as
interdependên-cias dinâmicas entre dois sinais aleatórios, mesmo quando estes estão contaminados por
ruído [Principe 2010], a etapa de pré-processamento do sinal comum na maioria dos
Arquitetura para AMC com uso de Medida Teórica de Informação 39
Figura 5.3: Bloco “Coef. Correntropia” visto em detalhe
Figura 5.4 ilustra a arquitetura geral do sistema de classificação proposto, sem a etapa de
pré-processamento.
Figura 5.4: Arquitetura proposta
O único parâmetro que precisa ser ajustado no método de AMC proposto é a variância
σutilizada no kernel gaussiano. Este parâmetro funciona como um zoom que controla
a janela de observação na qual a similaridade é avaliada. Nesta arquitetura, o valor deσ
foi aproximado pela regra de Silverman (equação 4.18), e posteriormente descoberto de
5.3 Conclusão
A arquitetura desenvolvida utiliza os infinitos momentos estatísticos de ordem par,
através do coeficiente de correntropia, com o objetivo de eliminar a etapa de extração de
característica e propor uma arquitetura escalável.
No próximo capítulo, o desempenho do classificador proposto neste trabalho foi
avali-ado com as modulações digitais 2-FSK, 2-PSK, OOK, MSK, 4-PSK e QAM, na presença
de Ruído Aditivo Gaussiano Branco. Foram realizados três conjuntos de experimentos
Capítulo 6
Simulações e Resultados
6.1 Introdução
A arquitetura proposta foi implementada e validada por simulação computacional no
MATLABR. Além disso, com o objetivo de avaliar o método de classificação proposto
nesse trabalho, foram desenvolvidos no SimulinkR seis sistemas de comunicação digital,
tais como: OOK, 2-PSK, 4-PSK, 2-FSK, MSK e QAM e parâmetros de simulação
apre-sentados na Tabela 6.1. Os sinais gerados por estes sistemas, caracterizados pela equação
5.1, foram utilizados nos testes e aprimoramentos do método proposto.
Parâmetros Valores Frequência de amostragemFs 500 KHz
Frequência da portadora,Fc 20 KHz Taxa de símbolo 5 Kbps
Tabela 6.1: Parâmetros de simulação
Três experimentos foram criados com a finalidade de verificar o desempenho do
clas-sificador proposto, baseado no coeficiente de correntropia. Estes experimentos tinham os
seguintes objetivos:
1. Verificar o desempenho do classificador com modulações binárias e comparar o
coeficiente de correntropia com o coeficiente de correlação. Neste experimento o