Classificação Automática de Modulação Digital com uso de Correntropia para Ambientes de Rádio Cognitivo

(1)

UNIVERSIDADE_FEDERALDO RIO GRANDE DO NORTE

DECOMPUTAÇÃO

Classificação Automática de Modulação Digital

com uso de Correntropia para Ambientes de

Rádio Cognitivo

Aluisio Igor Rêgo Fontes

Orientador: Prof. Dr. Luiz Felipe de Queiroz Silveira

Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Engenharia Elétrica e de Computação da UFRN como parte dos requisitos para a obtenção do título de Mestre em Ciências.

(2)

Seção de Informação e Referência

Catalogação da publicação na fonte. UFRN / Biblioteca Central Zila Mamede

Fontes,Aluisio Igor Rêgo.

Classificação Automática de Modulação Digital com uso de Correntropia para Ambientes de Rádio Cognitivo / Aluisio Igor Rêgo Fontes - Natal, RN, 2012

88 f.:il.

Orientador: Luiz Felipe de Queiroz Silveira

Dissertação (Mestrado) - Universidade Federal do Rio Grande do Norte. Cen-tro de Tecnologia. Programa de Pós-Graduação em Engenharia Elétrica e de Computação.

1. Classificação Automática de Modulação 2. Correntropia

3. Rádio Cognitivo - Dissertação.I.Silveira, Luiz Felipe de Queiroz. II. Univer-sidade Federal do Rio Grande do Norte. III. Título

(3)

com uso de Correntropia para Ambientes de

Rádio Cognitivo

Aluisio Igor Rêgo Fontes

Dissertação de Mestrado aprovada em 14 de Dezembro de 2012 pela banca examinadora composta pelos seguintes membros

Luiz Felipe de Queiroz Silveira, Dr (Orientador) . . . DCA/UFRN

Francisco Marcos de Assis, Dr . . . DEE/UFCG

Adrião Duarte Dória Neto, Dr . . . DCA/UFRN

(4)

(5)

Primeiramente, à Deus por sempre iluminar meu caminho.

Agradeço à minha família pelo apoio, incentivo, paciência, força, amor e carinho. Em especial meus pais: Maria de Fátima Rêgo Fontes e Aluisio Fontes de Queiroz e minha irmã Fabíola Rêgo Fontes.

À minha namorada, Bruna Angelina Barreto Costa Lobo , pelo amor, paciência e por sua dedicação em minha vida acadêmica, me dando todo o apoio nos momentos difíceis.

Ao professor Luiz Felipe de Queiroz Silveira, que sempre acreditou no meu potencial e se não fosse por sua enorme dedicação e orientação não teríamos concluído.

Aos professores do Departamento de Engenharia de Computação e Automação.

Aos meus amigos Arthur, Lucas, Nathalee, Leonardo, Eduardo Palmeira e Allan por todo apoio, amizade e momentos de descontração indispensáveis.

(6)

Resumo

Os modernos sistemas de comunicação sem fio empregam, frequentemente, técnicas

adaptativas para proporcionar uma alta taxa de transmissão, enquanto asseguram

quali-dade de serviço (QoS) e abrangência de cobertura. Estudos recentes têm mostrado que

esses sistemas podem se tornar ainda mais eficientes com a incorporação de técnicas de

in-teligência artificial e de conceitos de rádio definido por software. Os sistemas que seguem

essa linha, conhecidos como Sistemas de Rádio Cognitivo, podem idealmente explorar de

forma dinâmica e oportunística porções do espectro de frequências não utilizadas,

conhe-cidas como buracos espectrais, com o objetivo de prover altas taxas de transmissão de

dados com elevada confiabilidade e disponibilidade de serviço. A Classificação

Automá-tica de Modulação (AMC) seria uma habilidade muito útil nesses sistemas. Normalmente,

as técnicas de AMC utilizam alguma forma de pré-processamento do sinal que pode

in-troduzir um alto custo computacional ou necessitar de suposições fortes, e até mesmo

imprecisas, sobre o sinal recebido. Este trabalho propõe o uso direto de uma medida de

similaridade, baseada na Teoria da Informação, conhecida como coeficiente de

correntro-pia, para extrair informações estatísticas de ordem elevada do sinal, com o objetivo de

reconhecer automaticamente o formato de modulações digitais. Experimentos realizados

por meio de simulação computacional demonstram que a técnica proposta neste trabalho

apresenta uma alta taxa de sucesso na classificação de modulações digitais, mesmo na

presença de ruído aditivo gaussiano branco (AWGN).

Palavras-chave: Classificação Automática de Modulação, Correntropia, Rádio

(7)

Modern wireless systems employ adaptive techniques to provide high throughput

while observing desired coverage, Quality of Service (QoS) and capacity. An

alterna-tive to further enhance data rate is to applycognitive radio concepts, where a system is

able to exploit unused spectrum on existing licensed bands by “sensing” the spectrum and

opportunistically access unused portions. Techniques like Automatic Modulation

Classi-fication (AMC) could help or be vital for such scenarios. Usually, AMC implementations

rely on some form of signal pre-processing, which may introduce a high computational

cost or make assumptions about the received signal which may not hold (e.g. Gaussianity

of noise). This work proposes a new method to perform AMC which uses a similarity

me-asure from the Information Theoretic Learning (ITL) framework, known ascorrentropy

coefficient. It is capable of extracting similarity measurements over a pair of random

pro-cesses using higher order statistics, yielding in better similarity estimations than by using

e.g. correlation coefficient. Experiments carried out by means of computer simulation

show that the technique proposed in this paper presents a high rate success in

classifica-tion of digital modulaclassifica-tion, even in the presence of additive white gaussian noise (AWGN).

(8)

Sumário

Sumário i

Lista de Figuras iv

Lista de Tabelas vi

Lista de Símbolos vii

Lista de Símbolos e Abreviaturas vii

1 Introdução 1

1.1 Motivação e Relevância . . . 1

1.2 Estado da Arte . . . 3

1.3 Objetivo . . . 5

1.4 Organização do Trabalho . . . 6

2 Rádio Cognitivo: Uma Introdução 7 2.1 Introdução . . . 7

2.2 Rádio Cognitivo . . . 7

2.3 Conclusão . . . 12

3 Modulação Digital e Canal de Comunicação 13 3.1 Introdução . . . 13

3.2 Modulação . . . 13

3.2.1 Modulação por Chaveamento de Fase - PSK . . . 15

(9)

3.3 Modulação de Amplitude em Quadratura - QAM . . . 21

3.4 Canal de Comunicação . . . 22

3.4.1 Canal AWGN . . . 23

4 Teoria da Informação 25 4.1 Introdução . . . 25

4.2 Entropia . . . 25

4.2.1 Entropia de Shannon . . . 26

4.2.2 Entropia de Rényi . . . 26

4.2.3 Janelas de Parzen e Potencial de Informação . . . 28

4.2.4 Correntropia . . . 30

5 Arquitetura para AMC com uso de Medida Teórica de Informação 35 5.1 Introdução . . . 35

5.2 Arquitetura . . . 36

6 Simulações e Resultados 41 6.1 Introdução . . . 41

6.2 Primeiro Experimento . . . 42

6.3 Segundo Experimento . . . 47

6.4 Terceiro Experimento . . . 50

6.5 Comparação de Resultados . . . 58

(10)

7 Conclusão e Perspectiva 65

7.1 Principais Contribuições . . . 66

7.2 Perspectivas para Trabalhos Futuros . . . 66

Referências bibliográficas 68

A Publicações 73

(11)

1.1 Modelo de AMC . . . 4

2.1 Utilização do Espectro nos Estados Unidos. . . 8

2.2 Diagrama de Funcionamento do RC.Fonte:wwwen.zte.com.cn/t20090701173473.html (Adaptação) . . . 10

3.1 Constelação 2-PSK . . . 16

3.2 Constelação QPSK . . . 16

3.3 Constelação OOK . . . 18

3.4 Constelação MSK . . . 21

3.5 Constelação QAM . . . 22

3.6 Modelo simplificado de um canal . . . 23

4.1 Estimativa de fY(y) . . . 29

5.1 Conjunto detemplatespara modulação OOK . . . 37

5.2 Arquitetura detalhada sem o Pré-Processamento do segundo modelo . . . 38

5.3 Bloco “Coef. Correntropia” visto em detalhe . . . 39

5.4 Arquitetura proposta . . . 39

6.1 Arquitetura para modulações binárias . . . 43

6.2 Resultados para o primeiro experimento . . . 44

6.3 Comparação de desempenho entre o coeficiente de correntropia e o coefi-ciente de correlação para uma modulação 2-FSK . . . 44

(12)

6.4 Comparação de desempenho entre o coeficiente de correntropia e o

coefi-ciente de correlação para uma modulação OOK . . . 45

6.5 Comparação de desempenho entre o coeficiente de correntropia e o coefi-ciente de correlação para uma modulação 2-PSK . . . 46

6.6 Resultados com variação do kernel: 2-FSK . . . 47

6.7 Resultados com variação do kernel: OOK . . . 48

6.8 Resultados com variação do kernel: 2-PSK . . . 48

6.9 Desempenho da arquitetura com os valores de kernel descrito na Tabela 6.2 49 6.10 Constelações das modulações normalizadas para 5 . . . 51

6.11 Arquitetura para modulações para modulações M-árias. Templates com quatro bits . . . 52

6.12 Resultados com variação do kernel: BPSK . . . 53

6.13 Resultados com variação do kernel: QPSK . . . 53

6.14 Resultados com variação do kernel: OOK . . . 54

6.15 Resultados com variação do kernel: MSK . . . 54

6.16 Resultados com variação do kernel: QAM . . . 55

6.17 Desempenho da arquitetura com os valores de kernels descritos na Tabela 6.3 . . . 56

6.18 Resultados do artigo de Aslam . . . 59

6.19 Resultados da dissertação . . . 59

6.20 Função Densidade de Probabilidade - BFSK . . . 62

6.21 Função Densidade de Probabilidade - BPSK . . . 63

6.22 Função Densidade de Probabilidade - OOK . . . 63

6.23 Função Densidade de Probabilidade - QPSK . . . 64

(13)

6.1 Parâmetros de simulação . . . 41

6.2 Tamanho do kernel ideal . . . 47

6.3 Tamanho do kernel sub-ótimo . . . 50

(14)

Lista de Símbolos

AM-DSB Modulação em Amplitude com Faixa Lateral Dupla

AMC Classificação Automática de Modulação

AWGN Ruído Aditivo Branco Gaussiano

BASK Modulação por chaveamente em amplitude em dois níveis

BFSK Modulação por chaveamente em frequência em dois níveis

BPSK Modulação por chaveamente em fase em dois níveis

CNEL Laboratório de NeuroEngenharia Computacional

DFT Transformada Discreta de Fourier

DSP Processamento Digital de Sinais

IA Inteligência Artificial

FFT Transformada Rápida de Fourier

FCC Comissão Federal de Comunicações

RDS Rápido Definido por Software

SNR Relação Sinal Ruído

TW Transformada Wavelet

ML Máxima Verossimilhança

PR Reconhecimento de Padrões

RNA Redes Neurais Artificiais

PCA Análise Principais Componentes

MSE Erro Médio Quadrático

(15)

RC Rádio Cognitivo

V.A Variável Aleatória

RKHS Espaço de Kernel de Hibert

UP Usuário Primário

US Usuário Secundário

(16)

Capítulo 1

Introdução

Neste capítulo, esta dissertação de mestrado é apresentada em linhas gerais, sendo

ressaltado a relevância do problema estudado, os objetivos desejados e a organização

proposta para o documento.

1.1 Motivação e Relevância

Nos sistemas de comunicações convencionais, o receptor trabalha cooperativamente

com o transmissor, isto é, o receptor tem um conhecimentoa priori do formato de

mo-dulação do sinal transmitido. Para um sistema de comunicação analógico, o formato de

modulação inclui o tipo de modulação, a frequência da portadora e o índice de modulação.

Por outro lado, para um sistema de comunicação digital, o formato de modulação inclui

o tipo de modulação, símbolos da constelação, tamanho do alfabeto, frequência da

por-tadora nominal, taxa de símbolos, formato do pulso, desvio de frequência (somente para

sinais modulados na frequência), dentre outros. Uma vez que esses parâmetros de

confi-guração do transmissor e do receptor são fixados, em função do contexto de aplicação de

tais sistemas, os projetistas se concentram em como tornar os sistemas de comunicações

mais eficientes, em termos de largura de banda e consumo de potência. Além disso, a

se-gurança na comunicação também é um requisito fundamental nos modernos sistemas de

(17)

Em geral, os dois entes envolvidos na comunicação não querem que suas

informa-ções sejam interceptadas por um terceiro. Em contraste a isso, as autoridades gestoras

dos sistemas de comunicação de um país podem desejar monitorar as comunicações com

algumas finalidades, como por exemplo detecção de transmissores não licenciados. Uma

etapa essencial para esse monitoramento é o reconhecimento ou classificação do formato

de modulação do sinal interceptado. Essa tarefa também surge em muitas outras

apli-cações civis e militares, tais como: confirmação de sinal no meio, identificação de

in-terferência, guerra eletrônica, análise de ameaças, e assim por diante [Ebrahimzadeh &

Hossienzadef 2011],[F.C.B.F Muller & Klautau 2011],[M.Richterova & Hythova 2006] e

[Rube & N.E.Madany 2010].

O desenvolvimento de novas técnicas eficientes de reconhecimento automático de

mo-dulação também tem sido estimulado pelo surgimento recente dos sistemas de rádio

de-finido por software (SDRs). De forma geral, o avanço tecnológico dos SDRs, aliado à

disseminação dos sistemas de comunicação sem fio, tem motivado o desenvolvimento

de técnicas inteligentes que permitam a reconfiguração automática de sistemas sem fio

de acordo com o seu ambiente de operação. Neste contexto de comunicação inteligente,

uma das tarefas desempenhadas pelo transmissor pode ser a seleção automática de um

es-quema de modulação, em função da qualidade do canal de comunicação, com o objetivo

de melhorar a sua eficiência. Essa flexibilidade na escolha do formato de modulação, pode

impor ao receptor do sistema a habilidade de reconhecer, de forma "cega", o formato de

modulação digital empregado no sinal. Essa habilidade permite ao receptor suportar uma

grande variedade de esquemas de modulação de forma dinâmica, o que potencialmente

aumentaria o desempenho do sistema.

A Classificação Automática de Modulação (AMC) consiste no reconhecimento do

tipo de modulação digital empregado por um sinal, durante a recepção do mesmo, sem a

utilização de nenhum conhecimentoa priori do sinal modulado, como por exemplo, sua

(18)

Introdução 3

função da própria ausência de informações sobre o sinal, tornando-se um desafio ainda

maior quando se considera o ruído e o desvanecimento do canal.

Experimentos realizados com a arquitetura proposta nesta dissertação, na presença de

Ruído Aditivo Gaussiano Branco (AWGN), demonstram uma taxa de sucesso

aproxima-damente igual a 97%, em uma relação sinal-ruído (SNR) de 0 dB.

1.2 Estado da Arte

A área de pesquisa em AMC se divide em duas grandes vertentes, uma que utiliza

estatísticas do sinal recebido para definir uma função de verossimilhança (ML) e outra que

usa características do sinal para classificação, empregando métodos de reconhecimento de

padrões. Em qualquer uma das abordagens, o sistema de classificação deve ser capaz de

escolher corretamente o tipo de modulação utilizada dentre um conjunto deNmodulações

candidatas. Um identificador ideal deve atender aos seguintes requisitos:

• Alta probabilidade de classificação correta (Verdadeiro Positivo ou TP) e baixa taxa

de Falso Positivo (FP), com um intervalo de observação curto;

• Capacidade de reconhecer os diversos formatos de modulação em diversos

ambien-tes, com variadas condições de propagação e ruído;

• Funcionamento em tempo real;

• Baixa complexidade computacional.

O processo clássico de classificação automática de modulações envolve

essencial-mente duas etapas: a) um pré-processamento do sinal e b) uma seleção adequada da

modulação pelo algoritmo de classificação. A seguir, a Figura 1.1 ilustra as etapas de um

receptor com AMC.

A etapa de pré-processamento do sinal pode ter como objetivo estimar parâmetros do

sistema, como frequência da portadora, período de símbolo, potência do sinal, ou mesmo

(19)

Figura 1.1: Modelo de AMC

É sabido que várias técnicas têm sido propostas na literatura para extrair características

do sinal na etapa de pré-processamento, e assim melhorar o desempenho do classificador

na etapa seguinte de AMC. Em [Rube & N.E.Madany 2010] propõe-se o cálculo do

des-vio padrão do sinal recebido na etapa de pré-processamento, para extrair características

do sinal e treinar uma rede neural na etapa de classificação. Já em [K.C. Prokopiw 2000]

propõe-se o uso de uma transformada wavelet (TW) para extrair características de sinais

QAM, PSK e FSK, assim como em [Hassan et al. 2010], no qual utiliza-se as

caracterís-ticas extraídas pela TW para realizar a classificação da modulação com o auxílio de uma

rede neural. Existem ainda trabalhos propondo a utilização de medidas estatísticas de

or-dem superior e características ciclo-estacionárias dos sinais modulados [Fehske et al. n.d.]

e análise de componentes principais (PCA) [He et al. 2010] na etapa de pré-processamento

de sistemas de AMC.

O artigo [Aslam et al. 2012] utiliza as modulações BPSK, QPSK, 16-QAM e

64-QAM e explora o uso de Programação Genética (GP) combinado com o algoritmoK₋

NearestNeighbor (KNN). O KNN foi utilizado para avaliar a aptidão dos indivíduos da

GP durante a fase de treinamento. A extração de característica utiliza cumulantes de

(20)

Introdução 5

melhorar a precisão da classificação. O primeiro estágio classifica entre modulações por

chaveamento de fase (2-PSK e QPSK), já o segundo estágio classifica entre 16-QAM e

64-QAM. Os parâmetros de tempo de símbolo, frequência da portadora e fase presume-se

que seja conhecido pelo sistema.

De fato, algumas destas tarefas de pré-processamento possuem um elevado custo

com-putacional, o que pode limitar a sua aplicação ou mesmo inviabilizar a técnica proposta

em um ambiente de comunicação real.

Quanto aos métodos de classificação de modulação presentes na literatura, além do

uso de redes neurais clássicas, abordadas nas referências citadas anteriormente, alguns

tra-balhos utilizam classificadores baseados em SVM, dentre os quais, pode-se citar [F.C.B.F

Mul-ler & Klautau 2011], [Ebrahimzadeh & Hossienzadef 2011] e [C.S Park & Nah 2007].

A representação do conhecimento pode ser realizada de diversas formas. No caso

tí-pico das RNAs e das SVMs, o conhecimento é representado por meio de regras implícitas,

utilizando-se conjuntos de exemplos (amostras de dados) de entrada-saída, normalmente

na forma numérica. A aquisição do conhecimento, por sua vez, é realizada por meio

da aprendizagem de máquina. A aprendizagem de máquina pode ser classificada como:

aprendizagem supervisionada, aprendizagem não supervisionada e aprendizagem por

re-forço. Mais detalhes a respeito dessas formas de aprendizagem podem ser consultados

em [Haykin & Moher 1999].

Na abordagem ML, um ou mais testes de hipóteses são elaborados, de acordo com a

razão de verossimilhança entre as modulações envolvidas [Bastos 2007], [A.A.Polydoros

& A.Panagiotou 2000] e [J.L.Xu et al. 2010].

1.3 Objetivo

Este trabalho propõe o uso direto de uma medida da Teoria da Informação que mede

(21)

clas-sificação automática de modulações digitais binárias em um ambiente de comunicação

caracterizado pelo ruído AWGN, sem a utilização de uma fase de pré-processamento do

sinal.

1.4 Organização do Trabalho

No presente capítulo, são destacados a importância da classificação automática de

modulação, o objetivo do trabalho e o estado da arte.

O capítulo 2 introduz os principais conceitos de rádio cognitivo, como o ciclo

cog-nitivo e a reconfigurabilidade. Neste capítulo, são apresentados os requisitos, desafios e

formas de implementação.

No capítulo 3, são apresentados os esquemas de modulação digital considerados neste

trabalho. Bem como, os modelos matemáticos usados para representar os efeitos do canal

de comunicação sobre os sinais transmitidos.

No capítulo 4, apresenta-se os conceitos de entropia e potencial de informação. Neste

capítulo, são apresentadas ainda as definições fundamentais da correntropia, bem como

suas aplicações e propriedades.

O capítulo 5 apresenta a arquitetura desenvolvida nesta dissertação para a classificação

automática de modulações com uso de medida teórica de informação.

O capítulo 6 apresenta três experimentos com a finalidade de avaliar e analisar o

de-sempenho do classificador proposto.

Finalmente, no capítulo 7 são apresentadas as conclusões sobre os resultados obtidos

e as sugestões para trabalhos futuros.

O Anexo I contém a lista dos artigos publicados e submetidos à publicação no decorrer

(22)

Capítulo 2

Rádio Cognitivo: Uma Introdução

2.1 Introdução

Atualmente, o Rádio Cognitivo (RC) é uma importante linha de pesquisa na área de

telecomunicações para a solução do problema da escassez espectral. Várias entidades

privadas e públicas têm investido fortemente em temas relacionados a gestão dinâmica e

oportunista do espectro, uso flexível do espectro e atribuição dinâmica de canal.

De fato, o Rádio Cognitivo pode ser visto como um sistema de comunicação sem

fio revolucionário, que tem como principal objetivo melhorar a utilização do espectro de

radiofrequências.

2.2 Rádio Cognitivo

O espectro de frequências é um recurso limitado para as comunicações sem fio,

po-dendo tornar-se congestionado a medida que aumenta a necessidade de acomodar os

dife-rentes tipos de interfaces aéreas que surgem a cada nova geração de sistemas de

comunica-ção. De fato, a maioria do espectro de frequências disponível está licenciado atualmente.

Porém um estudo realizado pelaSpectrum Policy Task Force (STPF), ligada aoFederal

Communications Comission(FCC), mostrou que algumas bandas do espectro são muito

usadas pelos usuários licenciados (usuários primários) apenas em determinados locais e

(23)

ocupadas ou quase não são usadas. De acordo com a FCC, a utilização do espectro

li-cenciado varia entre 15 e 85%, dependendo da região geográfica e do instante de tempo,

como ilustrado na Figura 2.1.

Figura 2.1: Utilização do Espectro nos Estados Unidos.

Uma forma de contornar estas limitações é promover alterações no modelo de

licen-ciamento ou concessão atual, de forma a tornar mais flexível o acesso ao espectro de

frequências, permitindo que os usuários secundários (não licenciados) possam acessar

de forma oportunista os buracos espectrais, definidos em termos de tempo, localização

e frequência, sem causar interferências ou prejudicar as comunicações dos usuários

pri-mários (UPs) e obedecendo a certas regras e restrições de operação. Acredita-se que isso

melhoraria a eficiência e a utilização do espectro de rádio frequências, de forma a suportar

a demanda requerida. Os sistemas legados de comunicações foram projetados para operar

numa banda dedicada de frequências e eles não são capazes de aproveitar a flexibilidade

permitida no novo modelo de licenciamento. Logo, para tornar viável esta flexibilização

no acesso ao espectro é necessária uma nova tecnologia [Hossain et al. 2009].

(24)

in-Rádio Cognitivo: Uma Introdução 9

teligentes de comunicação que conseguem reconhecer o ambiente no qual opera, e são

capazes de reconfigurar seus parâmetros do sistema com o objetivo de melhorar a

quali-dade da transmissão. Em [S.Haykin 2005] estendeu a definição de rádio cognitivo: “Rádio

Cognitivo é um sistema de comunicação sem fio que está atento ao ambiente externo e

adapta seus estados internos às variações estatísticas dos sinais de RF, através da

altera-ção de seus parâmetros(potência de transmissão, frequência da portadora, modulaaltera-ção),

em tempo real, com dois objetivos principais: comunicação altamente confiável, onde e

quando for necessário, e utilização eficiente do espectro de rádio”.

O Rádio Cognitivo pode iniciar uma revolução na comunicação sem fio, com impactos

significativos tanto no desenvolvimento tecnológico, quanto na regulamentação do uso do

espectro para superar as limitações espectrais existentes.

RC, é um aprimoramento do Rádio Definido por Software (SDR) herdando todas as

características do rádio reconfigurável. A tecnologia de SDR permite ao Rádio Cognitivo

a característica de reconfigurábilidade, enquanto que a capacidade cognitiva, que permite

ao rádio interagir em tempo real com o ambiente de comunicação, é implementada por

técnicas de processamento de sinais e de aprendizagem de máquinas. O processo

cogni-tivo é iniciado com a simples observação do ambiente e termina com uma ação, ou seja,

com a alteração dos parâmetros de transmissão ou de recepção [Almeida 2009]. A Figura

2.2 ilustra um fluxograma de funcionamento do RC.

Existem três protocolos de comunicação para Rádio Cognitivo mais conhecidos:

in-terweave, underlay eoverlay [Goldesmith et al. 2009], [S.Srinivasa & Jafar 2007]. No

protocolointerweave, os usuários não licenciados (secundários) fazem um sensoriamento

do espectro licenciado à procura de faixas de frequência não utilizadas e, encontrando-as,

transmitem nessas frequências sem causar interferência no usuário licenciado (primário).

Se por acaso o usuário primário começar a transmitir em uma determinada frequência,

o usuário secundário não pode transmitir na mesma frequência, devendo então procurar

(25)

Figura 2.2: Diagrama de Funcionamento do RC. Fonte:

wwwen.zte.com.cn/t20090701173473.html (Adaptação)

simultaneamente com usuários primários desde que sua interferência esteja abaixo de um

certo limite. Assim, a potência de transmissão do secundário é limitada pelo nível de

interferência aceito pelo usuário primário. No protocolo overlay, o usuário secundário

conhece a mensagem do usuário primário. Com esse conhecimento e usando técnicas

avançadas de comunicação pode transmitir de forma concorrente com o primário.

As principais vantagens da adoção da tecnologia de rádio cognitivo são:

1. Aumentar a utilização do espectro atual, isto é, preencher partes do espctro não

utilizado.

2. Aumentar o desempenho das redes de dados sem fio.

3. Maior adaptabilidade aos ambientes de transmissão.

4. Maior disponiblidade de seviços.

A mudança da utilização do espectro do modelo estático, para o modelo dinâmico,

(26)

Rádio Cognitivo: Uma Introdução 11

de comunicação sem fio. Nos Estados Unidos existem diversas empresas atuando junto a

FCC para a adoção deste novo modelo de rádio.

A FCC foi pioneira no estudo de RC e publicou em [05-57 2005] as seguintes

carac-terísticas que os Rádios Cognitivos poderão incorporar para permitir um uso eficiente e

flexível do espectro:

• Frequência Ágil- O rádio deverá ser capaz de mudar sua frequência de operação

para otimizar a sua transmissão.

• Seleção Dinâmica de Frequência- O rádio deverá sentir os sinais dos

transmisso-res próximos para escolher o melhor ambiente de operação.

• Modulação Adaptativa- As características de transmissão e formato de

modula-ção podem ser reconfigurados explorando as oportunidades de utilizamodula-ção do

espec-tro e canal.

• Controle de Potência- A potência de transmissão é adaptada para os limites de

potência do meio.

• Detecção do Local- O rádio deverá ser capaz de determinar a sua localização e de

outros dispositivos que operam dentro da mesma faixa de espectro.

• Uso Negociado- O Rádio Cognitivo pode ter algoritmos para permitir o

compar-tilhamento, desde que haja um acordo pré-estabelecido entre o usuário primário e

secundário.

Esta dissertação propõe uma técnica de AMC que busca viabilizar a incorporação

de esquemas de modulação adaptativa, em sistemas de rádio cognitivo. Esquemas de

modulação adaptativa, possibilitam a utilização de mais de um tipo de modulação no

transmissor, o que potencialmente aumenta a eficiência na utilização do utilização do

(27)

2.3 Conclusão

Este capítulo introduziu os conceitos mais importantes da tecnologia de rádio

cogni-tivo. Devido às características diversas do RC, surge a necessidade de diversas técnicas

de sensoriamento do espectro, processamento digital de sinais e esquemas de modulações

adaptativa.

No próximo capítulo será apresentado os esquemas de modulação digital considerados

(28)

Capítulo 3

Modulação Digital e Canal de

Comunicação

3.1 Introdução

Neste capítulo, são apresentados os esquemas de modulação digital considerados

neste trabalho. Além disso, são apresentados os modelos matemáticos usados para

re-presentar os efeitos do canal de comunicação sobre os sinais transmitidos.

3.2 Modulação

O propósito de um sistema de comunicação é transmitir sinais portadores de

infor-mação através de um canal de comunicação, o qual separa o transmissor do receptor

[Haykin 2007]. Os sinais portadores de informação também são chamados sinais de

banda base. O uso apropriado do canal de comunicação requer um deslocamento da faixa

de frequência de banda base para outras faixas de frequências apropriadas à transmissão.

Este procedimento é realizado utilizando-se amodulação, definida como o processo pelo

qual a amplitude, frequência e fase de uma portadora é variada de acordo com a

(29)

s(t) =A(t)cosθ(t) (3.1)

em queA(t)representa a amplitude eθ(t)são as variações de fase e frequência da

porta-dora em função do tempo. A equação (3.2) define o valor deθ(t).

θ(t) =ωct+φ(t) (3.2)

de modo que

s(t) =A(t)cos[ωct+φ(t)] (3.3)

em que ωc é a frequência da portadora e φ(t) é a fase. Os parâmetros fc e ωc serão

utilizados para designar frequência, sendo fca frequência em Hertz eωca frequência em

radianos por segundo. Esses dois parâmetros de frequência são relacionados por ωc =

2πfc.

É importante ressaltar que, alguns meios de comunicação conseguem propagar as

on-das eletromagnéticas em banda base, sem modificações no conteúdo de frequências do

sinal transmitido. Por outro lado, para a transmissão sem fio, formas de onda em banda

base são impraticáveis por duas razões. Em primeiro lugar, o tamanho da antena

neces-sária para irradiar uma onda eletromagnética é inversamente proporcional a frequência

da onda. Portanto, o deslocamento espectral da forma de onda de banda base para uma

frequência mais elevada permite a utilização de uma antena maior. Para muitos

dispositi-vos móveis, isto resulta numa frequência de portadora da ordem de 1 GHz.

Por outro lado, a maioria dos sinais de informação de interesse possuem praticamente

o mesmo conteúdo de frequências. Ao atribuir a cada fonte de informação uma porção

única no espectro eletromagnético, por meio do processo de modulação, vários

transmis-sores podem operar sem interferência.

(30)

Modulação Digital e Canal de Comunicação 15

3.2.1 Modulação por Chaveamento de Fase - PSK

Como o nome indica, a modulação PSK ocorre com a atribuição de uma fase única

para cada símbolo presente na forma de onda em banda base.

Na modulação por chaveamento de fase binária (2-PSK) cada símbolo representa um

bit que é mapeado em uma de duas fases diferentes, já a 4-PSK utiliza quatro fases

dife-rentes para representar quatro símbolos de informação, e assim por diante. As formas de

onda resultantes podem ser representadas matematicamente por [Haykin 2007]:

si(t) =

r

2E Ts

cos

2πfct+ 2π

Mi

i=1,2, ...,M (3.4)

onde M é o número de símbolos da constelação, E é a energia por símbolo e T é o

intervalo de símbolo. A frequência da portadora é fc=nc

T para algum número inteiro fixo

nc.

A modulação 4-PSK (quando o valor de M é igual a 4) é amplamente utilizada nos

sistemas de comunicação. Nesse caso, as quatro fases possíveis para a portadora são: π

4, 3π

4 e 54π e 74π. Para esse conjunto de valores, pode-se definir o sinal transmitido como:

q

2E

T cos 2πfct+ (2i−

π

4)

0_≤t_≤T (3.5)

Na modulação 4-PSK, a sinalização da informação no canal é feita por funções seno

e cosseno. Isto é importante porque o seno e o cosseno são sinais ortogonais, o que

significa que eles não estão correlacionados no tempo sobre a duração de um símbolo.

Mesmo quando as suas frequências são as mesmas, esses sinais são transmitidos pela

mesma antena e recuperados no mesmo receptor sem qualquer interferência mútua.

A Figura 3.1 ilustra a constelação associada à modulação 2-PSK, já a Figura 3.2 ilustra

à constelação da modulação 4-PSK.

De forma geral, uma forma de onda modulada pode ser construída como a soma de

(31)

Figura 3.1: Constelação 2-PSK

(32)

segunda, representada pelo eixo vertical, está deslocada em relação à primeira de

exata-mente π

2 é dita estar em quadratura(Q). Por essa razão, a modulação 4-PSK é

normal-mente denominada chaveamento de quadrifase (QPSK) [Haykin 2007].

Os sistemas que utilizam esquemas de modulação M-PSK são populares por seu

de-sempenho, em termos de probabilidade de erro de símbolo, e por sua largura de banda

eficiente. No entanto, o receptor associado a essa modulação apresenta uma

complexi-dade maior. A fim de recuperar o sinal de banda base, o receptor deve gerar uma senoide

com fase sincronizada à fase do sinal recebido.

3.2.2 Modulação por Chaveamento de Amplitude - ASK

O sinal ASK pode ser compreendido a partir dos mesmos princípios da modulação

analógica AM-DSB. As principais características da modulação por chaveamento de

am-plitude são:

• Simplicidade no processo de modulação e demodulação;

• Eficiência de largura de banda;

• Baixa imunidade ao ruído.

Devido a essas características, a modulação por chaveamento de amplitude é indicada

em ambientes de comunicação com pouco ruído ou quando o baixo custo do sistema é

essencial.

Para se gerar um sinal com modulação 2-ASK basta alterar o valor da amplitude do

sinal de saída em função do bit a transmitir. Com base nesta condição, os símbolos na

modulação binária M-ASK são definidos pela equação (3.6):

Si(t) =

r

2Ei(t)

T cos(2πfct+φ) i=1,2, ...,M (3.6)

ondeM é o número de símbolos da constelação,Eé a energia por símbolo,T é o intervalo

(33)

Portanto, cada símbolo corresponde a uma amplitude diferente da portadora. Pode-se

aumentar a capacidade de transmissão do sistema adotando-se um número maior de

valo-res de amplitude para a portadora. Por exemplo, considerando-se agrupamentos de dois

bits por símbolo, existirão quatro possíveis símbolos no alfabeto da fonte de informação:

(00, 01, 10 e 11). Logo, cada amplitude da transmitida corresponde a dois bits, e uma

sinalização com essa modulação dobra a taxa de transmissão do sistema em relação ao

2-ASK.

Um caso particular da modulação 2-ASK é a modulação OOK. Esta técnica transmite

um pulso senoidal para representar a um determinado bit e nos intervalos de tempo do bit

complementar não transmite pulsos. Neste caso particular, o bit 1 é codificado de forma

idêntica à modulação ASK descrita na equação (3.6) e o bit 0 é codificado por um valor de

amplitude zero com duração de tempo de um bit. A expressão matemática que representa

a modulação OOK é descrita por (3.7).

  

 

q

2E(t)

T cos(2πfct+φ); bit1 0; bit0

(3.7)

A constelação associada a modulação OOK é ilustrada na Figura 3.7

(34)

A modulação ASK é extremamente susceptível à interferência provocada por ruídos.

O fato da modulação basear-se somente na amplitude do sinal para modular os níveis

binários é um fator problemático, pois os ruídos geralmente afetam a amplitude do sinal

que está sendo transmitido.

3.2.3 Modulação por Chaveamento de Frequência - FSK

A modulação FSK atribui frequências diferentes para a portadora em função do

sím-bolo que é transmitido. Portanto, quando o bit 0 é transmitido, a portadora assume uma

frequência correspondente ao bit 0, durante o período de duração do bit.

Alternativa-mente, é possível, por exemplo, utilizar quatro frequências de transmissão diferentes,

cada uma delas correspondendo a um símbolo formado por 2 bits, este modo é chamado

de 4-FSK [Haykin 2007]. A modulação 4-FSK aumenta a taxa de bits transmitidos em

comparação com a modulação 2-FSK, mas em contrapartida aumenta também a banda de

frequências utilizada na transmissão.

Pode-se expressar o sinal M-FSK da seguinte maneira:

si(t) =

r

2E

T cos(2πfit+φ) (3.8)

onde fié a frequência da portadora que representa o i-ésimo símbolo da fonte de

informa-ção,E é a energia por símbolo,T é o intervalo de símbolo eφé um deslocamento inicial

de fase.

Os sinais FSK binários representam os bits de informação por meio de duas

frequên-cias, f1e f2. Quando essas frequências são definidas por fi= f racMC+iTB, para algum

número inteiro fixoMcei=1,2, o sinal FSK é conhecido como FSK de Sunde. Esse sinal

é de fase contínua, no sentido de que a continuidade de fase é sempre mantida, incluindo

os tempos de comutação entre bits. Note que neste caso, a diferença entre as frequências

(35)

Os sinais FSK são diferentes dos sinais PSK e ASK, já que cada um dosM símbolos

possui sua própria frequência de sinalização. As senóides possuem a mesma amplitude,

porém com frequências diferentes.

A modulação FSK usa o espectro de frequências de forma ineficiente, mas pode ser

detectada de forma não-coerente, o que reduz a complexidade do receptor. Essa

demo-dulação não pode ser decomposta e visualizada como componentesI eQ, uma vez que

utiliza múltiplas frequências de sinalização, de forma que pode ser representada apenas

em um espaço multidimensional.

Um caso particular da modulação FSK é a modulação MSK (Minimum Shift Keying),

na qual a frequência de separação é mínima entre as portadoras com amplitudes e fases

constantes. As portadoras são utilizadas de modo a garantir a ortogonalidade entre elas.

A forma de onda da modulação MSK pode ser expressa por [Sklar 2001]:

s(t) =cos

2π(fc+ dk

4T)t+xk

(3.9)

Em que fc é a frequência da portadora, dk pode assumir valores −1 e 1 fornecido pela

codificação bipolar exk é uma fase constante sobre o k-ésimo intervalo de bits.

Observa-se que quandodk=1 a frequência transmitida é f0+1/4T e quandodk=−1 a frequência

transmitida é f0−1/4T. Logo, o espaçamento entre as frequências do MSK é igua a

metade daquele empregado na modulação FSK não-coerente, o que justifica o nome dessa

modulação, minimum shift keying.

Durante cada intervalo de T segundos, o valor dexké constante e igual a 0 ouπ. Este

valor é determinado pela restrição de fase contínua da onda emt =kt

A modulação MSK apresenta algumas vantagens. O espectro do sinal MSJ

modu-lado tem uma eficiência espectral superior às modulações BPSK e FSK, e sofre menos

distorções em aplicações com amplificadores de alta potência [Feher 1995].

(36)

Figura 3.4: Constelação MSK

3.3 Modulação de Amplitude em Quadratura - QAM

Na modulação QAM o sinal da portadora modula a informação da fonte tanto em

amplitude quanto em fase. A forma de onda corresponde a soma de duas senóides, sendo

cada uma delas modulada por um conjunto de amplitudes diferentes. A QAM é uma

generalização bidimensional da PAM M-ária na medida em que sua formulação envolve

duas funções de base ortogonais em banda passante. O sinal QAM transmitido para o

k-ésimo símbolo, é definido por [Haykin 2007]

sk(t) =

r

2E

T akcos(2πfct)−

r

2E

T bksen(2πfct) (3.10)

onde fc é a frequência da portadora, E é a energia por símbolo e T é o intervalo de

símbolo.

Dependendo do número de M símbolos possíveis, pode-se distinguir duas

constela-ções QAM: constelaconstela-ções quadradas, para os quais o número de bits por símbolo é par, e

constelações cruzadas, para as quais o número de bits por símbolo é ímpar. Nesta

dis-sertação considera apenas o caso de 4 bits por símbolo, o que corresponde a modulação

16-QAM.

(37)

amplitudes e cada símbolo transmitido representa a informação de quatro bits. A

combi-nação dos valores obtidos pelas senóides em fase (I) e em quadratura (Q) é ilustrada na

Figura 3.5.

Figura 3.5: Constelação QAM

A codificação dos quatro quadrantes, bem como a codificação dos símbolos em cada

quadrante, segue a regra de codificação Gray.

A modulação QAM é utilizada em TV digital e em outros sistemas que necessitam

de alta taxa de transmissão de informação. Alguns exemplos da utilização da QAM são

os enlaces de rádio digital e de microondas, televisão digital de alta definição, modens a

cabo e ADSL.

3.4 Canal de Comunicação

O canal de comunicação é o meio que provê a conexão física entre transmissores

e receptores em um sistema de comunicação. No canal de comunicação, o sinal pode

sofrer degradação de diferentes maneiras, o que torna os processos de demodulação e

classificação de modulação mais difíceis. Existem diferentes modelos matemáticos para

(38)

3.4.1 Canal AWGN

Qualquer receptor sempre terá uma determinada quantidade de energia térmica

as-sociada ao fluxo de cargas elétricas em sua antena ou nos seus circuitos. Além disso,

diferentes e vários sinais de interferências são sempre recebidos pela antena junto ao

si-nal de informação de interesse [Sklar 2001].

Esses diferentes processos interferentes podem ser modelados como um único sinal

aleatório gaussiano branco que se adiciona ao sinal modulado de interesse. Neste trabalho,

considera-se que este modelo é suficiente para descrever os efeitos do canal de propagação

sem fio sobre a informação transmitida. É comum expressar este processo em termos da

sua densidade espectral de potência constante igual a, N0

2 por dimensão.

Figura 3.6: Modelo simplificado de um canal

Na Figura 3.6, x(t) representa o sinal de informação transmitido, n(t) o ruído

adi-cionado pelo canal ey(t), o sinal recebido. O canal pode ser completamente

caracteri-zado pela distribuição de probabilidade do ruído. Ao assumir que este ruído é gaussiano

admite-se que o sinal aleatórion(t)é um processo gaussiano, e em cada instante de tempo,

o seu valor é modelado por uma variável aleatória (v.a) Gaussiana, com função densidade

(39)

matemá-tico é conhecido como canal com ruído aditivo gaussiano branco (AWGN).

P(α) = 1

σ√2πe

−₂α_σ22 _(3.11)

Esse modelo é bastante utilizado em função de sua simplicidade matemática, e de sua

aderência a um grande conjunto de canais físicos.

Esses diferentes processos interferentes podem ser modelados como um único sinal

aleatório gaussiano branco que se adiciona ao sinal modulado de interesse. Neste trabalho,

considera-se que este modelo é suficiente para descrever os efeitos do canal de propagação

sem fio sobre a informação transmitida. É comum expressar este processo em termos da

sua densidade espectral de potência constante igual a, N0

2 por dimensão.

O termo ruído branco se deve ao fato desse tipo de ruído se distribuir uniformemente

em todas as faixas de frequência do espectro, possuir média nula e correlação nula entre

suas amplitudes em instantes de tempos distintos. Ou seja, o valor da amplitude do ruído

em um determinado instante independe daquele observado em outro instante de tempo

qualquer.

A degradação imposta pelo canal sobre o sinal pode ser quantificada através da relação

sinal-ruído (SNR), que é simplesmente a relação entre a potência do sinal e a potência do

ruído.

3.5 Conclusão

Neste capítulo, foi introduzido algumas técnicas de modulação digital comumente

utilizadas nos sistemas de comunicação, e o canal AWGN, responsável por modelar

ma-temáticamente as distorções impostas pelo canal sobre o sinal transmitido.

O próximo capítulo tratará das definições fundamentais da Teoria da Informação

(40)

Capítulo 4

Teoria da Informação

4.1 Introdução

No século XX, o surgimento da telefonia colocou desafios sobre os possíveis limites

para as taxas de transmissão de informação veiculadas por canais ruidosos.

Acreditava-se naquela época que a probabilidade de erro na recepção de uma mensagem somente

poderia ser reduzida pela redução da taxa de transmissão, ou seja, uma mensagem livre

de erros apenas poderia ocorrer se a transmissão cessasse.

Entretanto, Claude Shannon (1949), mostrou que se um canal tivesse capacidade

não-nula, ou seja aquele que é possível transmitir informação, probabilidades de erro

arbitra-riamente baixas poderiam ser atingidas, desde que a taxa de transmissão se mantivesse

abaixo da capacidade do canal. Shannon aplicou o conceito de entropia a estudos em

teoria da codificação, fundamentando a Teoria da Informação.

Este capítulo trata das definições fundamentais da Teoria da Informação e introduz a

correntropia, uma medida de similaridade que tem suas bases na Teoria da Informação.

Este capítulo também apresenta aplicações e propriedades da correntropia.

4.2 Entropia

Em Teoria da Informação, a entropia quantifica a incerteza associada com o valor de

(41)

exemplo, é maior do que a de um lance de moeda. Logo, conhecer o resultado de um

lance de dado reduz mais a entropia (fornece um maior ganho de informação) do que

conhecer o resultado de um lance de moeda. Resumidamente, quanto menos informações

é conhecida de um processo, maior será sua entropia.

4.2.1 Entropia de Shannon

A entropia de Shannon para uma variável aleatória (v.a) discretaXé calculada como

sendo:

H(X) =₋

_∑

pilog(pi) (4.1)

em que pi é a probabilidade de cada evento i da partição ou da v.a X em questão. No

caso de uma v.a contínua, a entropia de Shannon é calculada, com base na distribuição de

probabilidadep(x)da v.a por:

H(X) =−

Z

pX(x)log(pX(x))dx (4.2)

Analisando a equação 4.1, chama-se a atenção para o fato de que a entropia H(X)

não é uma função da variável aleatória X, mas sim da distribuição de probabilidade dessa

variável. Em outras palavras, não dependente dos valores que X assume, mas das suas

probabilidades.

4.2.2 Entropia de Rényi

Rényi (1961) buscou uma definição geral para medidas de informação que

preser-vassem a aditividade de eventos independentes e fosse compatível com os axiomas da

probabilidade. A partir da equação funcional de Cauchy f(xy) = f(x) +f(y), a entropia

(42)

Teoria da Informação 27

Hα = 1

1₋αlog( n

∑

i=1

pα_i ) (4.3)

onde pisão as probabilidades de ocorrência dos valoresxida variável X, paraα_≥0 eα

6

=1. Esse resultado engloba, de fato, uma família de medidas de informação chamadas

Entropia de Rényi. É possível demonstrar que a entropia de Shannon é um caso particular

da entropia de Rényi quandoαé igual a 1.

Ao se comparar as duas definições de entropia 4.1 e 4.3, percebe-se que em Shannon

log(pii)é ponderado pela probabilidade, enquanto em Rényi o logaritmo é externo à soma

de potências das probabilidades. Assumindo que:

Vα(X) =

∑

i

npα_i (4.4)

Hα=

1

1₋αlog(Vα(X)) =−log( α−p1

Vα(X)) (4.5)

Em queVα(X) é o argumento da α-norma da função probabilidade. Numa visão

geo-métrica, as funções de probabilidades compõem um espaço de n dimensões e a distância

entre a origem e um ponto P(p1,p2,p3, ...,pn) é medido pela α-norma, sendo α=2 a

norma euclidiana [Principe 2010].

A entropia de Rényi também pode ser definida para v.a’s. contínuas [Artuso 2011].

Hα= 1

1₋αlog

Z

pα(x)dx (4.6)

Utilizandoα= 2 na equação 4.6, tem-se a entropia quadrática de Renyi:

H2=log

Z

p(x)2dx (4.7)

A entropia quadrática de Rényi é particularmente interessante por ser facilmente

(43)

Na literatura, o segundo momento da função de probabilidade é conhecido como o

índice de coincidência ou grau de pureza, porque desaparece se o estado da partícula é

puro [Principe 2010].

4.2.3 Janelas de Parzen e Potencial de Informação

O método da Janela de Parzen fornece uma estimativa da função densidade de

pro-babilidade de um conjunto de dados discretos, em um espaço M-dimensional. Parzen

utilizou um somatório de funções kernel para estimar a função de distribuição de

probabi-lidade (fdp) de uma v.a. A maioria das aplicações utilizam o kernel Gaussiano, pelo fato

da convolução de uma função gaussiana também ser uma gaussiana, facilitando o cálculo

computacional da função.

A expressão da estimativa da fdp fY(y)da variável aleatóriaY, com base numa

amos-tra formada por um conjuto de N pontos, é obtida a partir da soma das contribuições

individuais do kernel aplicado em cada ponto, na forma:

fY(y) = 1 N

N

∑

i=1

Kσ(y−yi) (4.8)

ondeyisão amostras da v.a,Kσé o kernel utilizando na aproximação eσé o tamanho da

janela de Parzen do kernel.

Pode ser observado que um valor alto para o parâmetro σresulta em uma estimativa

suavizada para fY(y), enquanto que um valor baixo para σ resulta em uma estimativa

grosseira para fY(y), conforme ilustrado na Figura 4.1, onde os tamanhos dos σ são a)

0.4, b) 0.2 e c) 0.8.

É possível estimar a entropia quadrática de Rényi utilizando a janela de Parzen. Para

isso, atribui-se um kernel sobre os dados da amostra e os soma com uma normalização

(44)

Figura 4.1: Estimativa de fY(y)

H2=−log

Z ∞ −∞ 1 N N

∑

i=1

Kσ(y−yi)

!2

dy (4.9)

H2=−log 1 N2

Z ∞

−∞

N

∑

i=1 N

∑

j=1

Kσ(y−yj)Kσ(y−yi)dy (4.10)

H2=−log 1 N2

N

∑

i=1 N

∑

j=1

Z ∞

−∞Kσ(y−yj)Kσ(y−yi)dy (4.11)

Aplicando-se a propriedade da convolução de gaussianas, obtém-se:

H2=−log 1

N2 N

∑

i=1 N

∑

j=1 K_σ√

2(yj−yi)

!

(4.12)

(45)

H2=−log(IP(y)) (4.13)

em que:

IP(y) = 1

N2 N

∑

i=1 N

∑

j=1

Kσ(yi−yj) (4.14)

A funçãoIP(y)é denominada potencial de informação. A função empressa pela

equa-ção 4.14 é uma funequa-ção monotônica e crescente, e portanto a minimizaequa-ção da entropia pode

ser conseguida pela maximização do potencial de informação, ou seja, mais informação

sobre o sistema.

4.2.4 Correntropia

A correntropia foi desenvolvida pelo grupo de neuroengenharia da Universidade da

Flórida, coordenado pelo professor Jose C. Principe. Ela pode ser definida por uma

trans-formação não-linear sobre a diferença entre duas variáveis aleatórias X = [X1, ...,Xn] e

Y = [Y1, ...,Yn], sendo expressa por [Santamaria et al. 2006]:

V(X,Y) = 1

N N

∑

i=1

Kσ(xi−yi) (4.15)

Essa transformação é dada por uma função de kernel positiva-definida, a qual é capaz

de gerar um Espaço de Hilbert Reproduzido por Kernel (RKHS). Logo, a correntropia

pode ser vista como uma medida da diferença entre duas v.a’s nesse espaço.

Além disso, pode-se observar que a correntropia é uma generalização da medida de

correlação entre sinais aleatórios, pois essa medida consegue extrair tanto informações

estatísticas de segunda ordem, quanto de ordens superiores entre os sinais analisados

[Santamaria et al. 2006]. Nos últimos anos, este conceito tem sido aplicado com sucesso

(46)

tempo-Teoria da Informação 31

rais [Park & J.C.Príncipe 2008], testes de não-linearidade [Gunduz & J.C.Príncipe 2009],

reconhecimento de objetos [Jeong et al. 2009] e análise de componentes independentes

[Li et al. 2007]. Embora, por definição, a correntropia seja semelhante à correlação,

es-tudos recentes têm mostrado que ela funciona melhor do que a correlação ao lidar com

sistemas não-lineares e ambientes não-gaussianos, sem qualquer aumento significativo no

custo computacional [Santamaria et al. 2006].

O espaço RKHS é um espaço de Hilbert de funções construído de maneira específica

e única a partir de um kerbel positivo definido. Na equação 4.15 utiliza-se um kernel

gaussiano, o qual é definido por:

k(x,y) =Kσ(xi−yi) = 1 σ√2πe

−(xi−yi)

2

2σ2 _(4.16)

As funções do RKHS tem como peculiaridade o fato de seus valores poderem ser

reproduzidos através de uma operação elementar envolvendo a própria função, o núcleo

gerador e o produto interno do espaço.

Aplicando-se uma expansão por série de Taylor no kernel gaussiano, definido pela

equação (4.15), a medida de correntropia pode ser expressa por:

v(X,Y) = √1

2πσ

∞

∑

n=0

(₋1)n

2n_σ2n_n!E[(X−Y)

2n_]. _(4.17)

Percebe-se, a partir dessa equação, que a correntropia contém informação de infinitos

momentos estatísticos de ordem par.

A correntropia está diretamente relacionada ao conceito de similaridade entre duas

(v.a’s). O tamanho do kernel funciona como umzoomque controla a janela de observação

na qual a similaridade é avaliada nesse espaço. A possibilidade de ajustar o tamanho do

kernel fornece um mecanismo eficiente que permite eliminar os valores que são muito

diferentes do conjunto de dados (outlier).

(47)

sendo expressa por: 4.18 [Silverman 2086]:

σ=σX

h

4N−1₍_2d₊₁₎−1i₍_d₊1₄₎

(4.18)

em que d corresponde à dimensão dos dados, N corresponde ao número de amostras e

σx corresponde ao traço da matriz de auto-covariância deX. É importante ressaltar que

a regra de Silverman não fornecer o melhor kernel para a medida de correntropia, porém

ela indica um valor de referência para um refinamento posterior.

Denomina-se auto-correntropia, a medida de correntropia calculada entre vetores

ale-atórios de um mesmo processo estocástico, e denomina-se correntropia cruzada a medida

de correntropia entre dois vetores aleatórios de processos diferentes [Xu et al. 2008].

Em [Principe 2010], define-se a correntropia cruzada centralizada por uma

genera-lização da função de covariância centralizada, pois a correntropia cruzada original não

possui garantia de média zero, mesmo quando os dados de entrada estão centralizados,

devido às transformações não lineares produzidas pelo kernel gaussiano. O estimador da

correntropia cruzada centralizada é dado por 4.19:

U(X,Y) = 1

N N

∑

i=1

Kσ(xi−yi)−

1 N2

N

∑

i=1 N

∑

j=1

Kσ(xi−yj)

(4.19)

Em [Xu et al. 2008], apresenta-se uma nova medida de similaridade, denominada

coeficiente de correntropia, que calcula o cosseno do ângulo entre dois vetores aleatórios

transformados no espaço (RKHS). Por utilizar os infinitos momentos estatísticos pares

entre as v.a’s X e Y, essa medida é capaz de extrair mais informação do que o coeficiente

(48)

η(X,Y) = _p U(X,Y)

U(X,X)p

U(Y,Y) (4.20)

em queU(X,Y)é a função de correntropia cruzada centralizada entre os vetores X e Y, e

U(X,X),U(Y,Y)são as funções de auto-correntropia centralizada para os vetores X e Y.

Neste trabalho, o coeficiente de correntropia é utilizado para caracterizar com

pre-cisão as interdependências dinâmicas entre sistemas de modulação digital. Esta

capaci-dade de caracterização se deve, principalmente, ao fato da correntropia ser sensível às

não-linearidades e informações estatísticas de ordem elevada que estão presentes nesses

sistemas.

Todas as propriedades da correntropia encontram-se descrita em [L.Weifeng et al.

2006] e [Santamaria et al. 2006]. Apenas serão apresentadas três propriedades essenciais

para compreender a aplicação dessa medida nos sistemas propostos.

Propriedades da Correntropia

Propriedade 1

A correntropia é simétrica:V(X,Y) =V(Y,X)

Propriedade 2

A correntropia é positiva e limitada: 0<V(X,Y)≤1/√2πσ. Ela atinge o seu valor

máximo se e somente seX=Y

Propriedade 3

A correntropia envolve todos os momentos estatísticos de ordem par, como pode ser

verificado por meio de sua definição: v(X,Y) = √1

2πσ∑ ∞

n=0 (−1)

n

2n_σ2n_n!E[(X−Y)2n]

É importante ressaltar que, se o tamanho do kernel for suficientemente grande, os

momentos estatísticos de segunda ordem dominam a função e a medida se resume à

co-variância enviesada. Adicionalmente, a correntropia é sensível a processos aleatórios

(49)

calculado pelo kernel gaussiano tende a zero [Santamaria et al. 2006].

4.3 Conclusão

O coeficiente de correntropia é um uma nova medida desenvolvida em [Xu et al. 2008]

para quantificar similaridade entre duas variáveis aleatórias a partir da definição

matemá-tica da correntropia. Os conceitos de correntropia estão sendo utilizados em problemas

complexos de engenharia, apresentando vantagens em relação à medidas estatísticas de

segunda ordem, principalmente em função da maior quantidade de informação extraída

dos processos analisados.

No próximo capítulo será apresentado o método de classificação de modulações

(50)

Capítulo 5

Arquitetura para AMC com uso de

Medida Teórica de Informação

5.1 Introdução

Um problema frequente no processamento da informação é descobrir como extrair

a melhor informação contida nos dados analisados. Ao longo dos anos, os momentos

estatísticos de segunda ordem vêm sendo largamente utilizados em algoritmos de

classi-ficação e de aprendizado de máquina. Há diversas razões para isso, dentre elas pode-se

destacar [Wang & Bovik 2009]:

1. Essas medidas são simples de usar;

2. Elas possuem significado físico, como é o caso do valor médio quadrático, o qual

está associado à energia do sinal avaliado.

3. São particularmente úteis na solução de problemas pertencentes ao domínio

linear-gaussiano;

4. Originam uma enorme variedade de algoritmos adaptativos;

Entretanto, há evidências que indicam que o segundo momento estatístico é uma

me-dida pobre para avaliar informação entre sinais [Principe et al. 2000]. Além disso, o

avanço da capacidade computacional e o estudo de problemas mais complexos em

(51)

momento estatístico pode não ser a mais satisfatória.

Neste capítulo será apresentado o método de classificação de modulações digitais,

de-senvolvido no trabalho. Esse método apresenta como principal característica o uso de uma

medida de informação denominada de correntropia, como ferramenta de classificação.

Obteve-se taxas elevadas de classificação, mesmo sem uma fase de pré-processamento

para a extração de característica. A arquitetura desenvolvida utiliza os infinitos

momen-tos estatísticos de ordem par, através da correntropia, com o objetivo de eliminar a etapa

de extração de característica e propor uma arquitetura escalável.

5.2 Arquitetura

A arquitetura de classificação proposta foi investigada em um ambiente de

comunica-ção modelado pelo ruído AWGN. Nesse modelo, o sinal recebido,r(t), é dado por:

r(t) =s(t) +n(t), iTs≤t≤(i+1)Ts (5.1)

em ques(t)é o sinal transmitido com modulação desconhecida, sendo definido pela

equa-ção 3.3 en(t)é um sinal aleatório que representa o ruído AWGN.

O objetivo do método é identificar a técnica de modulação utilizada no sinal recebido

r(t), por meio de uma medida de similaridade conhecida por coeficiente de correntropia.

Na arquitetura do classificador, cada modulação a ser investigada é representada por

agrupamento detemplates. O formato de modulação do sinal recebido é estimado a partir

da comparação desse sinal com cada template associado às modulações investigadas.

Essa comparação é feita em termos de um valor de similaridade fornecido pelo coeficiente

de correntropia.

Foi definido experimentalmente que a quantidade detemplatesbinários em cada

agru-pamento associado a um formato de modulação é igual aM, em que M é o número de

(52)

Arquitetura para AMC com uso de Medida Teórica de Informação 37

quatro, ou seja, para o conjunto de modulações (2-FSK, OOK e 2-PSK) o valor deMnão

seria igual a dois e sim igual a quatro. Já para o conjunto de modulações (2-FSK, OOK,

2-PSK, 4-PSK e 16-QAM) o valor deMseria igual a dezesseis.

Figura 5.1: Conjunto detemplatespara modulação OOK

Além disso, o tamanho de cada template deve ser igual a Nlog₂M, em que N é o

número de amostras por símbolo.

A classificação ocorre em duas etapas, como ilustrado nas Figuras 5.2 e 5.3, descritas

abaixo:

1. Inicialmente, o classificador proposto calcula o coeficiente de correntropia entre

um vetor de amostras do sinal recebido, denotado aqui porX, na presença de ruído

AWGN, com cadatemplate associado às modulações investigadas. No bloco

de-nominado “Coef. Correntropia”, ilustrado na Figura 5.2, cada padrão binário do

conjunto detemplates são comparados com o vetor binário X do sinal recebido,

r(t), conforme visualizado em detalhes à esquerda da Figura 5.3 para o caso de

uma modulação binária. Os argumentos para o cálculo de cadaηdo coeficiente de

(53)

(a) A auto-correntropia do sinal de entrada:U(x,x);

(b) A auto-correntropia de cada elemento do conjunto de padrões binários:U(yi,yi);

(c) A correntropia-cruzada entre o sinal recebidoa e cada padrão binário descrito

no item anterior:U(x,yi).

Para propósito de ilustração, a Figura 5.1 mostra um conjuto de template, livre

de ruído, para a modulação OOK. Cada modulação terá seu conjuto de template

agrupados pela técnica de modulação.

2. No segundo passo, um comparador decide em favor do maior valor de coeficiente

de correntropia calculado na etapa anterior. O algoritmo define então a modulação

vencedora com base no maior coeficiente calculado.

Figura 5.2: Arquitetura detalhada sem o Pré-Processamento do segundo modelo

Devido à capacidade do coeficiente de correntropia de caracterizar as

interdependên-cias dinâmicas entre dois sinais aleatórios, mesmo quando estes estão contaminados por

ruído [Principe 2010], a etapa de pré-processamento do sinal comum na maioria dos

(54)

Arquitetura para AMC com uso de Medida Teórica de Informação 39

Figura 5.3: Bloco “Coef. Correntropia” visto em detalhe

Figura 5.4 ilustra a arquitetura geral do sistema de classificação proposto, sem a etapa de

pré-processamento.

Figura 5.4: Arquitetura proposta

O único parâmetro que precisa ser ajustado no método de AMC proposto é a variância

σutilizada no kernel gaussiano. Este parâmetro funciona como um zoom que controla

a janela de observação na qual a similaridade é avaliada. Nesta arquitetura, o valor deσ

foi aproximado pela regra de Silverman (equação 4.18), e posteriormente descoberto de

(55)

5.3 Conclusão

A arquitetura desenvolvida utiliza os infinitos momentos estatísticos de ordem par,

através do coeficiente de correntropia, com o objetivo de eliminar a etapa de extração de

característica e propor uma arquitetura escalável.

No próximo capítulo, o desempenho do classificador proposto neste trabalho foi

avali-ado com as modulações digitais 2-FSK, 2-PSK, OOK, MSK, 4-PSK e QAM, na presença

de Ruído Aditivo Gaussiano Branco. Foram realizados três conjuntos de experimentos

(56)

Capítulo 6

Simulações e Resultados

6.1 Introdução

A arquitetura proposta foi implementada e validada por simulação computacional no

MATLABR_{. Além disso, com o objetivo de avaliar o método de classificação proposto}

nesse trabalho, foram desenvolvidos no SimulinkR _{seis sistemas de comunicação digital,}

tais como: OOK, 2-PSK, 4-PSK, 2-FSK, MSK e QAM e parâmetros de simulação

apre-sentados na Tabela 6.1. Os sinais gerados por estes sistemas, caracterizados pela equação

5.1, foram utilizados nos testes e aprimoramentos do método proposto.

Parâmetros Valores Frequência de amostragemFs 500 KHz

Frequência da portadora,Fc 20 KHz Taxa de símbolo 5 Kbps

Tabela 6.1: Parâmetros de simulação

Três experimentos foram criados com a finalidade de verificar o desempenho do

clas-sificador proposto, baseado no coeficiente de correntropia. Estes experimentos tinham os

seguintes objetivos:

1. Verificar o desempenho do classificador com modulações binárias e comparar o

coeficiente de correntropia com o coeficiente de correlação. Neste experimento o