• Nenhum resultado encontrado

Avaliação de Classificadores de Modulação para Sensoriamento Espectral em Rádio Cognitivo. Lilian Coelho de Freitas

N/A
N/A
Protected

Academic year: 2021

Share "Avaliação de Classificadores de Modulação para Sensoriamento Espectral em Rádio Cognitivo. Lilian Coelho de Freitas"

Copied!
75
0
0

Texto

(1)

INSTITUTO DE TECNOLOGIA

PROGRAMA DE P ´OS-GRADUAC¸ ˜AO EM ENGENHARIA EL´ETRICA

T´ITULO DO TRABALHO

Avalia¸c˜

ao de Classificadores de Modula¸c˜

ao para

Sensoriamento Espectral em R´

adio Cognitivo

NOME DO AUTOR

Lilian Coelho de Freitas

DM 31/2009

UFPA / ITEC / PPGEE Campus Universit´ario do Guam´a

Bel´em-Par´a-Brasil 2009

(2)
(3)

INSTITUTO DE TECNOLOGIA

PROGRAMA DE P ´OS-GRADUAC¸ ˜AO EM ENGENHARIA EL´ETRICA

NOME DO AUTOR

Lilian Coelho de Freitas

T´ITULO DO TRABALHO

Avalia¸c˜

ao de Classificadores de Modula¸c˜

ao para

Sensoriamento Espectral em R´

adio Cognitivo

DM 31/2009

UFPA / ITEC / PPGEE Campus Universit´ario do Guam´a

Bel´em-Par´a-Brasil 2009

(4)

UNIVERSIDADE FEDERAL DO PAR ´A INSTITUTO DE TECNOLOGIA

PROGRAMA DE P ´OS-GRADUAC¸ ˜AO EM ENGENHARIA EL´ETRICA

NOME DO AUTOR

Lilian Coelho de Freitas

T´ITULO DO TRABALHO

Avalia¸c˜

ao de Classificadores de Modula¸c˜

ao para

Sensoriamento Espectral em R´

adio Cognitivo

Disserta¸c˜ao submetida `a Banca Examinadora do Programa de P´os-gradua¸c˜ao em Engenharia El´etrica da UFPA para a obten¸c˜ao do Grau de Mestre em Engenharia El´etrica, ˆenfase em Computa¸c˜ao Aplicada.

UFPA / ITEC / PPGEE Campus Universit´ario do Guam´a

Bel´em-Par´a-Brasil 2009

(5)

SENSORIAMENTO ESPECTRAL EM R ´ADIO COGNITIVO

F866a Freitas, Lilian Coelho de

Avalia¸c˜ao de Classificadores de Modula¸c˜ao para Sensoriamento Espectral em R´adio Cognitivo;

Lilian Coelho de Freitas; orientador, Aldebaro Barreto da Rocha Klautau J´unior. 2009.

Disserta¸c˜ao (Mestrado) - Universidade Federal do Par´a, Instituto de Tecnologia, Programa de P´os-Gradua¸c˜ao em Engenharia El´etrica, Bel´em, 2009.

1.Radio definido por software. 2. Modula¸c˜ao digital. 3. Processamento de sinais - t´ecnicas digitais. 4. Radiofrequˆencia. I. Orientador. II. T´ıtulo.

(6)

UNIVERSIDADE FEDERAL DO PAR ´A INSTITUTO DE TECNOLOGIA

PROGRAMA DE P ´OS-GRADUAC¸ ˜AO EM ENGENHARIA EL´ETRICA

AVALIAC¸ ˜AO DE CLASSIFICADORES DE MODULAC¸ ˜AO PARA

SENSORIAMENTO ESPECTRAL EM R ´ADIO COGNITIVO

AUTOR: LILIAN COELHO DE FREITAS

DISSERTAC¸ ˜AO DE MESTRADO SUBMETIDA A AVALIAC` ¸ ˜AO DA BANCA EXAMINADORA

APROVADA PELO COLEGIADO DO PROGRAMA DE P ´OS-GRADUAC¸ ˜AO EM ENGENHARIA

EL´ETRICA DA UNIVERSIDADE FEDERAL DO PAR ´A E JULGADA ADEQUADA PARA OBTENC¸ ˜AO

DO GRAU DE MESTRE EM ENGENHARIA EL´ETRICA NA ´AREA DE COMPUTAC¸ ˜AO APLICADA.

APROVADA EM 07/12/2009

BANCA EXAMINADORA:

...

Prof. Dr. Aldebaro Barreto da Rocha Klautau J´unior (ORIENTADOR - UFPA)

...

Prof. Dr. Jo˜ao Cris´ostomo Weyl Albuquerque Costa (CO-ORIENTADOR - UFPA)

...

Prof. Dr. Ronaldo de Freitas Zampolo (MEMBRO - UFPA)

...

Prof. Dr. Eduardo Freire Nakamura (MEMBRO EXTERNO - FUCAPI)

VISTO:

...

Prof. Dr. Marcus Vin´ıcius Alves Nunes COORDENADOR DO PPGEE/ITEC/UFPA

(7)

aos meus pais

Jo˜ao Batista e Rosilda,

aos meus irm˜aos

Leidian e Obedi,

com amor.. . .

(8)

Agradecimentos

Aos meus pais, Jo˜ao Batista e Rosilda, pelo apoio incondicional, pelas ora¸c˜oes e amor demonstrado atrav´es dos conselhos.

Ao meu irm˜ao, Obedi Freitas, pelo apoio sempre que eu preciso. `

A minha querida irm˜a, Leidian Freitas, por ser minha maior incentivadora e amiga. Ao meu orientador prof. Aldebaro Klautau J´unior, pela amizade, orienta¸c˜ao t˜ao dedicada e conselhos diversos.

Ao professor e sempre orientador, Jo˜ao Cris´ostomo Costa, pelo apoio constante durante o mestrado e por sempre acreditar no meu trabalho.

Ao amigo Andr´e Mendes Calvalcante, pelo carinho, conselhos e incentivo que a mim dedica.

A todos os amigos do laborat´orio LEA, em especial ao Marco Sousa, pela amizade, companhia di´aria no laborat´orio e principalmente durante aos s´abados; ao Gilvan Borges, pelo bom humor constante que alegra a todos a sua volta, por me ceder seu computador para rodar simula¸c˜oes; Vin´ıcius Lima e Claudomiro Sousa pela amizade.

`

As minhas amigas Cleide Nielle, Adriana Nazar´e e Cynthia Leal que mesmo distantes se fazem sempre queridas.

Aos amigos Igor Negr˜ao, ´Eder Torres e M´arcio Pinheiro, que compartilharam longas horas de estudos durante as disciplinas.

As secret´arias Liane Barbosa e Kelly Pereira pela assistˆencia nos assuntos burocr´aticos de bolsas, viagens, etc.

Aos amigos do laborat´orio LAPS, em especial ao Adalbery Castro, Eduardo Medeiros, M´arcio Murilo, Gustavo Guedes, Marcel Cabral, Francisco M¨uller, Claudomir Cardoso, Jefferson Moraes e Yomara Pires pela ajuda diversa e simpatia com que sempre me trataram.

`

A Funda¸c˜ao de Amparo `a Pesquisa do Estado do Par´a (FAPESPA), por ter financiado minha bolsa durante o desenvolvimento desta pesquisa.

“Em tudo dai gra¸cas, pois essa ´e a vontade de Deus para covosco.”

(9)

Resumo

Esta disserta¸c˜ao tem como objetivo principal a avalia¸c˜ao de classificadores de modula¸c˜ao digital em sensoriamento espectral de r´adio cognitivo. Considerou-se nessa avalia¸c˜ao o estudo e implementa¸c˜ao da t´ecnica de an´alise espectral c´ıclica para extra¸c˜ao de caracter´ısticas dos sinais modulados, a qual utiliza a cicloestacionariedade contida em tais sinais. Essa t´ecnica tem mostrado bons resultados, mesmo em ambientes com baixa rela¸c˜ao sinal ru´ıdo. Com base nas caracter´ısticas extra´ıdas utilizando an´alise espectral c´ıclica, s˜ao avaliados os desempenhos de cinco t´ecnicas de reconhecimento de padr˜oes: na¨ıve Bayes, ´arvore de decis˜ao, k-nearest neighbor, m´aquinas de vetores de suporte e redes neurais. Os classificadores s˜ao avaliados na classifica¸c˜ao das modula¸c˜oes AM, BPSK, BFSK, QPSK e 16-QAM, considerando a influˆencia de um canal com ru´ıdo gaussiano branco e com desvanecimento por multipercurso. Outra contribui¸c˜ao desta disserta¸c˜ao ´e a disponibiliza¸c˜ao de uma base de dados para classifica¸c˜ao de modula¸c˜ao, objetivando auxiliar o estudo comparativo com outras t´ecnicas de classifica¸c˜ao.

PALAVRAS-CHAVES: r´adio cognitivo, sensoriamento espectral, classifica¸c˜ao de modula¸c˜ao.

(10)

Abstract

This dissertation has as main objective the evaluation of digital modulation classifiers applied to spectrum sensing in cognitive radio. The investigation included the implementation and evaluation of the cyclic spectral analysis technique to extract features from modulated signals, which uses the cyclostationary contained in such signals. This technique has shown good results even in environments with low signal to noise ratios. Based on the features extracted using cyclic spectral analysis, we estimate the performance of five pattern recognition techniques: Naive Bayes, decision tree, k -nearest neighbor, support vector machines and neural networks. The classifiers are evaluated on the task of identifying the modulations: AM, BPSK, BFSK, QPSK and 16-QAM, considering the influence of a channel with white Gaussian noise and multipath fading. Another contribution of this dissertation is to provide a database for modulation classification studies, aiming to assist the comparisons with other classification techniques and reproducing the results.

KEYWORDS: cognitive radio, spectrum sensing, modulation classification, cyclic spectral correlation.

(11)

Lista de Figuras iii Lista de Tabelas v Gloss´ario vi 1 Introdu¸c˜ao 1 1.1 Contexto do Trabalho . . . 1 1.2 Objetivos . . . 3 1.3 Trabalhos Relacionados . . . 3 1.4 Contribui¸c˜oes . . . 5 1.5 Estrutura do Trabalho . . . 6

2 Classifica¸c˜ao de Modula¸c˜ao em R´adio Cognitivo 7 2.1 Introdu¸c˜ao . . . 7

2.2 Classifica¸c˜ao Autom´atica de Modula¸c˜ao . . . 7

2.2.1 Front end : Extra¸c˜ao de Caracter´ısticas . . . 9

2.2.2 Back end : Reconhecedor de Padr˜ao . . . 10

2.3 An´alise Espectral C´ıclica . . . 11

2.3.1 Cicloestacionariedade . . . 11

2.3.1.1 Defini¸c˜ao . . . 11

2.3.1.2 Aplica¸c˜ao . . . 11

2.3.1.3 Motiva¸c˜ao . . . 12

2.3.2 An´alise Espectral C´ıclica . . . 14

2.3.2.1 Fun¸c˜ao de Autocorrela¸c˜ao C´ıclica - FAC . . . 14

2.3.2.2 Densidade Espectral C´ıclica (DEC) ou Espectro C´ıclico . . . . 16 i

(12)

2.3.2.3 Fun¸c˜ao de Autocoerˆencia Espectral - FAE . . . 16

2.3.2.4 Implementa¸c˜ao do Algoritmo . . . 17

2.3.2.5 Perfis de Modula¸c˜oes . . . 18

2.3.2.6 Vantagens . . . 22

2.3.3 Considera¸c˜oes Pr´aticas . . . 23

2.4 Reconhecedores de Padr˜ao . . . 24

2.4.1 Na¨ıve Bayes . . . 24

2.4.2 KNN . . . 25

2.4.3 Arvore de Decis˜´ ao . . . 26

2.4.4 SVM . . . 28

2.4.5 Rede Neural Artificial . . . 29

3 Metodologia 32 3.1 Introdu¸c˜ao . . . 32

3.2 Gera¸c˜ao dos Sinais Modulados . . . 32

3.3 Modelagem do Canal . . . 33

3.3.1 Canal com AWGN . . . 33

3.3.2 Canal com Desvanecimento por Multipercurso . . . 34

3.4 Reconhecedores de Padr˜ao . . . 35

3.5 Software WEKA . . . 38

3.6 Base de Dados UFPAModulation . . . 39

4 Resultados 40 4.1 Introdu¸c˜ao . . . 40

4.2 An´alise de Complexidade Amostral . . . 41

4.3 Cen´ario I - Canal com AWGN . . . 43

4.4 Cen´ario II - Canal com Desvanecimento Multipercurso . . . 48

Conclus˜oes do Trabalho 51

Publica¸c˜oes Oriundas da Pesquisa 53

Bibliografia 58

(13)

2.1 Sensoriamento espectral. . . 8

2.2 Diagrama do processo de comunica¸c˜ao (transmiss˜ao e recep¸c˜ao). . . 9

2.3 Processo de classifica¸c˜ao de modula¸c˜ao. . . 9

2.4 Caracter´ısticas de sinais cicloestacion´arios. . . 12

2.5 PSD de sinais sem linhas espectrais. . . 13

2.6 Exemplo de PSD com linhas espectrais. . . 14

2.7 Espectro c´ıclico para BPSK com diferentes suaviza¸c˜oes na frequˆencia α. . . 18

2.8 Autocoerˆencia espectral para BPSK com diferentes suaviza¸c˜oes na frequˆencia α. 19 2.9 Perfil para BPSK com diferentes suaviza¸c˜oes na frequˆencia α. . . 19

2.10 Espectro c´ıclico das modula¸c˜oes. . . 20

2.11 Autocoerˆencia espectral das modula¸c˜oes. . . 21

2.12 Perfil das modula¸c˜oes para as condi¸c˜oes adotadas. . . 22

2.13 ´Arvore de decis˜ao para classificar modula¸c˜oes em um ambiente com RSR=10 dB. 26 2.14 ´Arvore de decis˜ao para classificar modula¸c˜oes em um ambiente com RSR=-5 dB. 27 2.15 Topologia de uma Rede Neural. . . 30

3.1 Esquema da metodologia adotada para classifica¸c˜ao de modula¸c˜ao. . . 32

3.2 Efeitos do desvanecimento multipercurso e AWGN em um sinal BPSK. . . 36

3.3 Exemplo de arquivo ARFF. . . 39

4.1 Gr´afico de complexidade amostral para RSR = -10 dB. . . 41

4.2 Gr´afico de complexidade amostral para RSR = -5 dB. . . 42

4.3 Gr´afico de complexidade amostral para RSR = 5 dB. . . 42

4.4 Gr´afico de complexidade amostral para RSR = 10 dB. . . 43

4.5 Desempenho dos classificadores em um canal com AWGN. . . 44

(14)

4.6 Perfis BPSK e QPSK. . . 45 4.7 Desempenho dos classificadores quando treinados e testados com diferentes

valores de RSR. A abscissa indica a RSR adotada para o conjunto de teste. . . 47 4.8 Desempenho dos classificadores para classifica¸c˜ao da modula¸c˜ao 16-QAM. . . . 48 4.9 Classifica¸c˜ao de sinais: canal com desvanecimento Rayleigh, FD=50 Hz. . . 49 4.10 Classifica¸c˜ao de sinais: canal com desvanecimento Rayleigh, FD=150 Hz. . . . 49 4.11 Classifica¸c˜ao de sinais: canal com desvanecimento Rayleigh, FD=300 Hz. . . . 50

(15)

1.1 Exemplos de front end e back end utilizados na literatura para classifica¸c˜ao de

modula¸c˜ao. NE indica item n˜ao especificado. . . 4

3.1 Modelo de canal COST 207. . . 35

4.1 Desempenho dos classificadores em RSR = -15 dB. . . 44

4.2 Matriz de confus˜ao do classificador J4.8 para uma RSR = -15 dB. . . 45 4.3 Desempenho dos classificadores quando testados e treinados com diferentes RSR. 46

(16)
(17)

Gloss´

ario

ALRT - Average Likelihood Ratio Test AM - Amplitude modulation

ARFF - Attribute-Relation File Format AWGN - Additive White Gaussian Noise BFSK - Binary Frequency Shift Keying BPSK - Binary Phase Shift Keying

FAC - Fun¸c˜ao de Autocorrela¸c˜ao C´ıclica FCC - Federal Communications Commission FD - Frequˆencia Doppler

FFT - Fast Fourier Transform

GLRT - Generalized Likelihood Ratio Test HLRT - Hybrid Likelihood Ratio Test

IEEE - Instituto de Engenheiros Eletricistas e Eletrˆonicos KNN - K-Nearest Neighbor

MODOND - Modelo no dom´ınio da forma de onda MODSIM - Modelo no dom´ınio do s´ımbolo

PDF - Probability density function PSK - Phase Shift Keying

QAM - Quadrature Amplitude Modulation QPSK - Quadrature Phase Shift Keying RC - R´adio Cognitivo

RNA - Rede Neural Artificial RSR - Raz˜ao Sinal Ru´ıdo SVM - Support Vector Machine PSD - Power Spectral Density

WEKA - Waikato Environment for Knowledge Analysis vii

(18)

Cap´ıtulo 1

Introdu¸c˜

ao

1.1

Contexto do Trabalho

O crescimento e a diversidade das tecnologias de comunica¸c˜ao sem fio tˆem tornado o espectro de frequˆencia um recurso f´ısico cada vez mais concorrido. Grande parte dos problemas relacionados ao espectro de frequˆencia refere-se n˜ao apenas `a sua escassez f´ısica, como tamb´em `as suas formas de regulamenta¸c˜ao de acesso, que muitas vezes limitam a habilidade dos potenciais usu´arios de espectro de obter o acesso a tais recursos [1].

De acordo com estudos realizados pela Federal Communications Commission(FCC), a utiliza¸c˜ao do espectro de frequˆencia sofre uma varia¸c˜ao entre 15% e 85%, gerando assim sub-utiliza¸c˜ao do mesmo [2], sendo necess´arios novos m´etodos para solucionar conflitos de acesso, devido `a escassez de canais livres em faixas n˜ao licenciadas.

Nesse contexto, a tecnologia de R´adio Cognitivo (RC) se apresenta como uma das solu¸c˜oes promissoras para amenizar tais problemas, devido sua capacidade de prover alta largura de banda para usu´arios m´oveis, via arquiteturas de redes sem fio heterogˆeneas e t´ecnicas de acesso dinˆamico.

Atrav´es do uso do espectro de frequˆencia de forma dinˆamica, o RC permite que espectros n˜ao ocupados sejam utilizados, sem interferir nos chamados usu´arios prim´arios, ou seja nos usu´arios licenciados para operar em determinado espectro de frequˆencia. Dessa forma, quando um usu´ario prim´ario ´e detectado, o RC move-se para outra lacuna no espectro ou permanece no mesmo, alterando sua potˆencia de transmiss˜ao ou esquema de modula¸c˜ao para evitar interferˆencias. Assim sendo, o RC proporciona uma maior eficiˆencia espectral, bem como a otimiza¸c˜ao da qualidade de servi¸co.

Atualmente o Instituto de Engenheiros Eletricistas e Eletrˆonicos (IEEE) [3] est´a 1

(19)

desenvolvendo o primeiro padr˜ao de comunica¸c˜ao sem fio que utiliza conceitos de RC. O objetivo desse padr˜ao, chamado IEEE 802.22 [4], ´e o reuso das bandas subutilizadas da faixa de TV UHF/VHF entre 54 e 862 MHz em ´areas rurais.

O termo RC pode ser formalmente definido como sistemas de comunica¸c˜ao sem fio inteligentes capazes de modificar seus parˆametros de transmiss˜ao, tais como: frequˆencia de opera¸c˜ao, tipo de modula¸c˜ao, potˆencia de transmiss˜ao, protocolos de comunica¸c˜ao e outros, baseados em intera¸c˜oes com o ambiente em que operam, buscando dois objetivos prim´arios: (i) alta confiabilidade da comunica¸c˜ao sempre e onde for necess´ario e (ii) utiliza¸c˜ao eficiente do espectro de frequˆencia [1].

Para suportar tais capacidades, o RC apresenta quatro principais m´odulos, os quais s˜ao: sensoriamento, gerenciamento, mobilidade e compartilhamento espectral. O sensoriamento espectral (spectrum sensing) tem por responsabilidade detectar lacunas no espectro1 e

compartilh´a-los, sem causar interferˆencias em outros usu´arios. O gerenciamento espectral (spectrum management) provˆe o meio para determinar, em tempo real, a melhor banda e a melhor frequˆencia para fornecer os servi¸cos desejados. A mobilidade espectral (spectrum mobility) ´e respons´avel por manter a comunica¸c˜ao do usu´ario durante a transi¸c˜ao para o melhor espectro. Enquanto que o compartilhamento espectral (spectrum sharing) busca prover um m´etodo de escalonamento de espectro justo entre os usu´arios co-existentes [5].

Especificamente no m´odulo de sensoriamento espectral, uma importante tarefa ´e a classifica¸c˜ao de modula¸c˜ao dos sinais que estejam utilizando o espectro de frequˆencia em determinado momento. Tal tarefa permite identificar sinais (diferenciando-os de espectros n˜ao ocupados), al´em de evitar interferˆencias. Dessa forma, um sistema de RC pode configurar seus parˆametros de transmiss˜ao, de acordo com a informa¸c˜ao de modula¸c˜ao de um outro sistema de RC operando em um canal adjacente, tal que a interferˆencia n˜ao alcance um n´ıvel prejudicial.

O problema de classifica¸c˜ao de modula¸c˜ao tem sido estudado desde a d´ecada de 80, cujas principais motiva¸c˜oes eram atividades de vigilˆancia e inteligˆencia, voltadas, principalmente, para ´area militar. Com o advento da tecnologia de RC, tal problema ganha um novo interesse por parte dos pesquisadores.

Nesse contexto, uma importante t´ecnica de classifica¸c˜ao de modula¸c˜ao que reaparece ´e a t´ecnica de an´alise espectral c´ıclica, a qual explora a cicloestacionariedade de sinais modulados com o objetivo de detec¸c˜ao e classifica¸c˜ao, resultando em implementa¸c˜oes desta t´ecnica na forma de draft no padr˜ao IEEE.802.22. Al´em da detec¸c˜ao de sinais, esta t´ecnica tamb´em se

1lacunas no espectro correspondem `as faixas do espectro que n˜ao est˜ao sendo utilizadas por nenhum usu´ario

(20)

3 destaca em outras aplica¸c˜oes como: descoberta de sinais adjacentes, importante para diminuir o problema de n´o escondido em RC [5]; diferencia¸c˜ao entre tipos de modula¸c˜oes [6], [7], [8]; estima¸c˜ao de parˆametros de modula¸c˜ao [9]; identifica¸c˜ao de um sinal de interesse sem demodular o sinal [10]; e outras.

1.2

Objetivos

Este trabalho tem como objetivo geral a avalia¸c˜ao de distintos algoritmos para classifica¸c˜ao de modula¸c˜ao de sinais em sensoriamento espectral de r´adio cognitivo, buscando identificar sinais que estejam usando o espectro de frequˆencia e evitar interferˆencias. Como objetivos espec´ıficos do trabalho destacam-se:

• Estudo e implementa¸c˜ao da t´ecnica de an´alise espectral c´ıclica para extrair caracter´ısticas de sinais digitais modulados, tendo como base a cicloestacionariedade desses sinais. Tal t´ecnica tem apresentado bons resultados, mesmo em ambientes de baixa raz˜ao sinal ru´ıdo (RSR), conforme mostram alguns trabalhos na literatura [9], [6] e [11].

• Avaliar o desempenho de cinco t´ecnicas cl´assicas de reconhecimento de padr˜ao, aplicadas `a classifica¸c˜ao de sinais em sensoriamento espectral: Na¨ıve Bayes, ´Arvore de Decis˜ao J4.8, k-nearest neighbor (KNN), support vector machine (SVM) e Redes Neurais. A escolha por tais reconhecedores foi baseada no fato deles serem os mais populares representantes de diferentes paradigmas de aprendizagem.

• Disponibilizar na Web um “benchmark” para classificadores de modula¸c˜ao, o qual inclui as modula¸c˜oes AM, BPSK, BFSK, QPSK e 16-QAM, considerando a influˆencia de um canal com ru´ıdo aditivo branco e gaussiano, do inglˆes additive white gaussian noise (AWGN) e com desvanecimento por multipercurso. O objetivo ´e promover um estudo comparativo dos diferentes classificadores de modula¸c˜ao dispon´ıveis na literatura.

1.3

Trabalhos Relacionados

As publica¸c˜oes sobre classifica¸c˜ao de modula¸c˜ao de sinais, dispon´ıveis na literatura, abordam diferentes t´ecnicas de extra¸c˜ao de caracter´ısticas (front ends) e de reconhecimento de padr˜ao (back ends). No entanto, h´a uma dificuldade em se comparar diretamente resultados obtidos com os da literatura, especificamente porque as bases de dados s˜ao tipicamente

(21)

propriet´arias. Deve-se frisar que n˜ao foi encontrado nenhum trabalho que realizasse uma avalia¸c˜ao comparativa de desempenho das t´ecnicas propostas nesta disserta¸c˜ao.

A Tabela 1.1 apresenta um resumo da configura¸c˜ao de alguns trabalhos relacionados. Tabela 1.1: Exemplos de front end e back end utilizados na literatura para classifica¸c˜ao de modula¸c˜ao. NE indica item n˜ao especificado.

Ref. Extra¸c˜ao de Caracter´ısticas Reconhecedor de Padr˜ao Distor¸c˜ao/ Ru´ıdo RSR (dB) (min:∆:max) Classes treino/ teste [12] Transformada linear da

amplitude e fase do sinal

momento conjunto AWGN e freq. de offset na portadora

0:1:5 BPSK, QPSK NE/100 [13] Especrograma tempo-frequˆencia classificador baseado

em regras

AWGN 0:2:12 ASK, FSK, PSK NE/400 [14] Transformada Wavelet da

amplitude dos sinais

limiar de decis˜ao AWGN 0:5:15 FSK, PSK, QAM NE/1000 [15] Cumulantes de alta ordem limiar de decis˜ao AWGN, freq. de

offset, erro de timing 0:5:20 BPSK, QPSK, 8PSK e pi/4 DQPSK NE/100

[16] Entropia de Renyi, mudan¸ca de freq. skewness e entropia relativa

SVM AWGN 10 dB AM, FM,

AM-FM e QPSK

200/200 [17] cumulantes de 4ae 6aordem ARBF sem referˆencia 0:5:20 4ASK, 2ASK,

4PSK e 16QAM 50/50 [18] Algoritmo gen´etico Classificador Bayes sem referˆencia 7:1:12 FM, SSB, FSK2,

FSK4, PSK4, 16QAM, 32QAM

1024/400

[8] Correla¸c˜ao espectral c´ıclica Rede Neural AWGN, freq. offset 10 e 15 BPSK, QPSK, FSK, MSK, AM

NE/1000

Em Shimbo [12], por exemplo, ´e apresentado um m´etodo de classifica¸c˜ao de modula¸c˜ao baseado na transformada linear da amplitude e fase do sinal recebido e do momento conjunto correspondente. Entretanto, observa-se que, neste trabalho, apenas dois tipos de modula¸c˜ao foram considerados (BPSK e QPSK) e os testes de desempenho do m´etodo proposto consideraram uma RSR de 1 dB a 5 dB, sob um conjunto de teste de 100 amostras, sendo que o n´umero de exemplos de treino n˜ao foi especificado. J´a em Lynn [13] ´e implementado um algoritmo que utiliza o espectrograma tempo-frequˆencia dos sinais e um classificador baseado em regras. Observa-se que apenas as modula¸c˜oes ASK, FSK e PSK s˜ao classificadas em um cen´ario com AWGN.

Do mesmo modo, em Meng [14] ´e proposto um algoritmo para classifica¸c˜ao de modula¸c˜ao, baseado na transformada wavelet das amplitudes do sinal. Nesse caso, utiliza-se um teste de limiar para definir o tipo de modula¸c˜ao. No entanto, as simula¸c˜oes, tamb´em consideram somente AWGN. J´a em Shen [15] o classificador utiliza cumulantes e um limiar de decis˜ao para realizar a identifica¸c˜ao das modula¸c˜oes. Esse trabalho considera um cen´ario

(22)

5 com AWGN, portadora com frequˆencia de offset e timing de sincroniza¸c˜ao. As modula¸c˜oes classificadas s˜ao BPSK, QPSK, 8PSK e π/4DQPSK. N˜ao ´e especificado o n´umero de amostras do conjunto de treino e apenas 100 amostras s˜ao utilizadas para teste. Enquanto em Kadambe [16] ´e implementado um classificador com base na Entropia de Renyi e o reconhecimento de padr˜ao ´e realizado atrav´es de uma SVM. O desempenho do classificador implementado considera um ambiente apenas com AWGN e com 10 dB de RSR.

Em Tao [17] s˜ao utilizados cumulantes de 4a e 6a ordem, em conjunto com as

redes neurais com fun¸c˜oes de ativa¸c˜ao de base radial, do inglˆes adaptive radial-basis function networks (ARBF). As modula¸c˜oes 4-ASK, 2-ASK, 4-PSK e 16-QAM s˜ao avaliadas, considerando a RSR variando de 0 dB a 20 dB, e apenas 50 amostras de treino e teste foram utilizadas. J´a em Kim [18], algoritmos gen´eticos (para selecionar as melhores caracter´ısticas) e um classificador Bayes s˜ao utilizados na classifica¸c˜ao. Um n´umero maior de modula¸c˜oes ´e considerado (FM, SSB, 2-FSK2, 4-FSK, 4-PSK, 16-QAM, 32-QAM) e s˜ao utilizadas 400 amostras para treino e 1024 amostras para teste, mas n˜ao faz referˆencia a modelagem do canal utilizado. Descri¸c˜oes mais expl´ıcitas s˜ao realizadas em Reed [8], no qual um classificador ´e implementado utilizando correla¸c˜ao espectral c´ıclica. No entanto, diferente do trabalho proposto nesta disserta¸c˜ao, utiliza apenas redes neurais para classifica¸c˜ao. Na configura¸c˜ao do canal, n˜ao ´e considerado o desvanecimento por multipercurso.

Conforme se pode observar, esses trabalhos consideram em suas avalia¸c˜oes diferentes condi¸c˜oes de opera¸c˜ao (diversas RSR, ru´ıdos e distor¸c˜oes) e diferentes modula¸c˜oes. Dessa forma, buscou-se, nesta disserta¸c˜ao, implementar um setup que abrangesse um n´umero razo´avel de parˆametros. Al´em disso, um benchmark foi disponibilizado para possibilitar a compara¸c˜ao direta dos resultados, e permitir que os mesmos sejam reproduzidos.

1.4

Contribui¸c˜

oes

As principais contribui¸c˜oes desta disserta¸c˜ao s˜ao: (i) a implementa¸c˜ao da t´ecnica de an´alise espectral c´ıclica e sua avalia¸c˜ao em um cen´ario com AWGN e com desvanecimento por multipercurso; (ii) estudo comparativo das t´ecnicas na¨ıve Bayes, ´arvore de decis˜ao, KNN, SVM e redes neurais, aplicadas `a classifica¸c˜ao de sinais em sensoriamento espectral; (iii) disponibiliza¸c˜ao de um “benchmark” para classificadores de modula¸c˜ao, objetivando promover o estudo comparativo dos diferentes classificadores de modula¸c˜ao dispon´ıveis na literatura.

(23)

1.5

Estrutura do Trabalho

Para melhor descri¸c˜ao, o restante deste trabalho est´a organizado da seguinte maneira:

• Cap´ıtulo 2 - trata do processo de classifica¸c˜ao de modula¸c˜ao em RC. Esse cap´ıtulo envolve a descri¸c˜ao da t´ecnica de extra¸c˜ao de caracter´ısticas e dos reconhecedores de padr˜ao utilizados;

• Cap´ıtulo 3 - descreve a metodologia adotada; • Cap´ıtulo 4 - s˜ao mostrados os resultados obtidos;

• Cap´ıtulo 5 - apresenta as conclus˜oes. Adicionalmente, s˜ao apresentados alguns t´opicos para trabalhos futuros.

(24)

Cap´ıtulo 2

Classifica¸c˜

ao de Modula¸c˜

ao em R´

adio

Cognitivo

2.1

Introdu¸c˜

ao

Neste cap´ıtulo ser˜ao abordados os principais aspectos relacionados `a classifica¸c˜ao de modula¸c˜ao em r´adio cognitivo. Dentre estes, alguns requisitos dos classificadores e principais modelos adotados na literatura. Al´em disso, este cap´ıtulo tamb´em abordar´a a t´ecnica de classifica¸c˜ao usando an´alise espectral c´ıclica e os reconhecedores de padr˜ao: Na¨ıve Bayes, KNN, ´arvore de decis˜ao J4.8, Rede Neural e SVM utilizados nesta disserta¸c˜ao.

2.2

Classifica¸c˜

ao Autom´

atica de Modula¸c˜

ao

Em um sistema de R´adio Cognitivo (RC) a classifica¸c˜ao de modula¸c˜ao fica a cargo do m´odulo de sensoriamento espectral. Este m´odulo ´e respons´avel por obter as caracter´ısticas do espectro em uso, considerando as m´ultiplas dimens˜oes, tais como: tempo, espa¸co, frequˆencia e c´odigo [5]. Duas principais tarefas se destacam no m´odulo de sensoriamento espectral: detec¸c˜ao de lacunas no espectro (chamadas de spectrum holes) e classifica¸c˜ao de sinais.

Na tarefa de detec¸c˜ao de lacunas no espectros, o objetivo ´e verificar quais espectros est˜ao dispon´ıveis para uso. A forma mais simplista de realizar essa tarefa ´e usando detectores de energia [19]. Essa t´ecnica exige a estima¸c˜ao da potˆencia do ru´ıdo, o que a torna suscet´ıvel `as incertezas dessa estima¸c˜ao. Para resolver esse problema alguns trabalhos sugerem a transmiss˜ao de um tom piloto por parte do transmissor para ajudar a melhorar a precis˜ao do

(25)

detector de energia [19]. Tais detectores n˜ao podem detectar tipos de sinais, apenas determinar a presen¸ca do sinal.

Na tarefa de classifica¸c˜ao de sinais, o objetivo ´e determinar que tipos de sinais est˜ao ocupando o espectro. Isso ´e realizado atrav´es da caracteriza¸c˜ao do tipo de modula¸c˜ao, forma de onda, largura de faixa, frequˆencia da portadora, dentre outros aspectos [20]. Desse modo, um sistema de RC pode configurar seus parˆametros de transmiss˜ao, de acordo com as informa¸c˜oes coletadas do canal (tamb´em chamado espectro de frequˆencia), tal que a interferˆencia entre usu´arios n˜ao alcance um n´ıvel prejudicial. Portanto, a fun¸c˜ao do sensoriamento espectral permite ao RC adaptar-se ao ambiente de opera¸c˜ao. A Fig. 2.1 ilustra este procedimento.

C a n a l e s c o l h a d a m o d u l a ç ã o e o u t r o s p a r â m e t r o s d e t r a n s m i s s ã o c o m b a s e n a q u a l i d a d e d o s i n a l R á d i o C o g n i t i v o s e n s o r i a m e n t o e s p e c t r a l i n f o r m a ç õ e s d o c a n a l

Figura 2.1: Sensoriamento espectral.

Vale destacar que a prioridade do canal ´e sempre dos usu´arios licenciados para aquele determinado espectro. Dessa forma, se as altera¸c˜oes dos parˆametros de transmiss˜ao do RC n˜ao forem suficientes para diminuir o n´ıvel de interferˆencia com outros usu´arios, o RC deve trocar de faixa no espectro.

Nesse processo de adapta¸c˜ao do RC, a classifica¸c˜ao de modula¸c˜ao se torna relevante. Quando o RC sabe qual modula¸c˜ao est´a ocupando uma faixa do espectro, ele pode mais efetivamente evitar interferˆencia com a mesma ou tomar decis˜oes relacionadas de maneira mais acertada.

A classifica¸c˜ao de modula¸c˜ao ocorre tipicamente entre a detec¸c˜ao do sinal e a demodula¸c˜ao, conforme mostrado na Fig. 2.2. Nesse processo, o desafio da classifica¸c˜ao de modula¸c˜ao ´e abstrair a interferˆencia do canal, ru´ıdos, defasagem e outras transforma¸c˜oes sofridas pelo sinal modulado durante a sua transmiss˜ao, as quais podem vir a descaracteriz´a-lo. O projeto de um classificador de modula¸c˜ao envolve o pr´e-processamento e a sele¸c˜ao do algoritmo de classifica¸c˜ao. O bloco de pr´e-processamento pode incluir a estima¸c˜ao da frequˆencia da portadora, per´ıodo do s´ımbolo, potˆencia do sinal, equaliza¸c˜ao ou outros, dependendo do algoritmo de classifica¸c˜ao a ser escolhido. Ademais, alguns algoritmos de classifica¸c˜ao s˜ao mais sens´ıveis aos parˆametros desconhecidos, sendo necess´ario um n´ıvel maior de precis˜ao na estima¸c˜ao destes, j´a outros algoritmos s˜ao capazes de realizar a classifica¸c˜ao sem nenhum conhecimento a priori do sinal.

(26)

9 S í m b o l o s d e e n t r a d a C a n a l M o d u l a d o r + + P r é - P r o c e s s a d o r D e m o d u l a d o r C l a s s i f i c a ç ã o d e m o d u l a ç ã o r u í d o d o r e c e p t o r I n t e r f e r ê n c i a S í m b o l o s d e s a í d a R e c e p t o r F o r m a t o d e m o d u l a ç ã o

Figura 2.2: Diagrama do processo de comunica¸c˜ao (transmiss˜ao e recep¸c˜ao).

Devido `a caracter´ıstica dinˆamica de utiliza¸c˜ao do espectro de frequˆencia, o classificador de modula¸c˜ao deve identificar corretamente o formato de modula¸c˜ao do sinal em tempo real. Para tanto, deve utilizar um curto intervalo de observa¸c˜ao e apresentar baixo custo computacional. Al´em disso, deve ser capaz de reconhecer os formatos de modula¸c˜ao mesmo em ambientes com variadas condi¸c˜oes de propaga¸c˜ao.

Como mencionado, o processo de classifica¸c˜ao de modula¸c˜ao ´e constitu´ıdo por dois blocos, conforme mostrado na Fig. 2.3: um bloco de extra¸c˜ao de caracter´ısticas e um de reconhecedor de padr˜ao. O primeiro bloco (front end ) seleciona a informa¸c˜ao relevante para a decis˜ao, transformando os sinais recebidos (ap´os passar pelo canal) em um conjunto chamado de caracter´ısticas. As caracter´ısticas s˜ao utilizadas pelo reconhecedor de padr˜ao (back end ) para determinar a classe que melhor descreve a modula¸c˜ao do sinal.

E x t r a ç ã o d e C a r a c t e r í s t i c a s R e c o n h e c e d o r d e p a d r õ e s S i n a l M o d u l a d o C a n a l C l a s s i f i c a ç ã o d e M o d u l a ç ã o s i n a l + d i s t o r ç ã o + r u í d o c a r a c t e r í s t i c a s c l a s s e

Figura 2.3: Processo de classifica¸c˜ao de modula¸c˜ao.

2.2.1

Front end

: Extra¸c˜

ao de Caracter´ısticas

Os estudos desenvolvidos e apresentados na literatura se baseiam em dois modelos de front end para algoritmos de classifica¸c˜ao, s˜ao eles: modelos no dom´ınio do s´ımbolo (MODSIM) e modelos no dom´ınio da forma de onda (MODOND).

No modelo MODSIM, assume-se que o classificador observa os s´ımbolos recebidos (por exemplo, oriundos de uma constela¸c˜ao QAM) e n˜ao as amostras da forma de onda do sinal.

(27)

Uma das principais abordagens ao se usar o modelo MODSIM ´e baseada em testes com raz˜oes de verossimilhan¸ca [21]. Quando as fun¸c˜oes de verossimilhan¸ca do sinal recebido s˜ao corretas, a solu¸c˜ao ´e ´otima, visto que ela minimiza a probabilidade de classifica¸c˜ao falsa [22]. No entanto, a solu¸c˜ao ´otima requer uma maior complexidade computacional, podendo ser mais vantajoso o uso de classificadores sub-´otimos. Trˆes principais t´ecnicas utilizando este modelo, foram propostas na literatura: teste m´edio da rela¸c˜ao de verossimilhan¸ca (ALRT) [21, 23, 24], teste generalizado da rela¸c˜ao de verossimilhan¸ca (GLRT) [25, 26, 27] e teste h´ıbrido da rela¸c˜ao de verossimilhan¸ca (HLRT) [22, 26, 28].

No modelo MODOND s˜ao utilizadas as caracter´ısticas da forma de onda do sinal. Exemplos dessas caracter´ısticas s˜ao o momento conjunto da amplitude e fase do sinal [12], espectrograma tempo-frequˆencia [13], transformada wavelet da amplitude do sinal [14], entropia [16], cumulantes de alta ordem [15], caracter´ısticas espectrais [6, 29] dentre outras.

Nesta disserta¸c˜ao ser´a implementada a t´ecnica de an´alise espectral c´ıclica, baseada no modelo MODOND. A principal vantagem dessa t´ecnica ´e sua capacidade de diferenciar a energia do ru´ıdo da energia do sinal modulado. Isso acontece pelo fato de que o ru´ıdo ´e um sinal estacion´ario no sentido amplo com nenhuma correla¸c˜ao, enquanto sinais cicloestacion´arios apresentam correla¸c˜ao espectral devido `a redundˆancia imposta pela periodicidade do sinal [5]. A Se¸c˜ao 2.3 ´e dedicada a detalhar esta t´ecnica.

2.2.2

Back end

: Reconhecedor de Padr˜

ao

Os reconhecedores de padr˜ao constituem uma ´area de estudo bastante desenvolvida. A concep¸c˜ao do reconhecedor de padr˜ao para classifica¸c˜ao de modula¸c˜ao pode ser formulada de forma abstrata e independente da natureza do sinal recebido.

Dentre as t´ecnicas de reconhecimento de padr˜ao aplicadas em classifica¸c˜ao de modula¸c˜ao pode-se citar os trabalhos que utilizam momento conjunto [12], classificador baseado em regras [13], limiar de decis˜ao [14] e [15], SVM [16], ARBF (Adaptive Radial-Basis Function Networks) [17], Classificador Bayes [18], Rede Neurais [8]. No entanto, todos esses s˜ao avaliados sobre diferentes condi¸c˜oes de opera¸c˜ao (diversas RSR e distor¸c˜oes) e utilizam diferentes parˆametros de configura¸c˜ao do sinal modulado. Dessa forma, mostra-se dif´ıcil comparar diretamente os resultados, ou mesmo reproduz´ı-los.

Nesta disserta¸c˜ao, cinco t´ecnicas de reconhecimento de padr˜ao foram avaliadas, em conjunto com a t´ecnica de an´alise espectral c´ıclica, s˜ao elas: na¨ıve Bayes, KNN, ´arvore de decis˜ao, SVM e Redes Neurais. A Se¸c˜ao 2.4 detalha cada uma destas t´ecnicas.

(28)

11

2.3

An´

alise Espectral C´ıclica

Antes de descrever a t´ecnica de an´alise espectral c´ıclica, se faz necess´ario explicar o conceito de cicloestacionariedade.

2.3.1

Cicloestacionariedade

2.3.1.1 Defini¸c˜ao

Um sinal ´e cicloestacion´ario se suas caracter´ısticas estat´ısticas variam periodicamente com o tempo. Exemplos dessas caracter´ısticas s˜ao: m´edia, autocorrela¸c˜ao, fun¸c˜ao densidade de probabilidade, momento de ordem n, cumulantes de ordem n ou outras [30].

Para melhor compreens˜ao do conceito de cicloestacionariedade, pode-se fazer uma rela¸c˜ao com sinais estacion´arios, cujas caracter´ısticas estat´ısticas s˜ao invariantes com o tempo. Dessa forma, pode-se definir sinais cicloestacion´arios como sinais n˜ao-estacion´arios que apresentam estat´ısticas que variam periodicamente (ciclicamente) com o tempo.

Uma consequˆencia da periodicidade contida nos sinais cicloestacion´arios ´e a correla¸c˜ao espectral, a qual corresponde `a existˆencia de subbandas em frequˆencias distintas com conte´udo que s˜ao correlacionados. Outra consequˆencia, ´e o surgimento de componentes sinusoidais aditivas com potˆencia finita (denominadas de linhas espectrais), as quais s˜ao geradas ap´os transforma¸c˜oes n˜ao-lineares quadr´aticas ou de ordem maior, conforme mostrado em [31].

A Fig. 2.4 sumariza as caracter´ısticas dos sinais cicloestacion´arios.

S i n a i s C i c l o e s t a c i o n a r i o s M o m e n t o s o u C u m u l a n t e s P e r i ó d i c o s L i n h a s e s p e c t r a i s s u b b a n d a s c o r r e l a c i o n a d a s P r o p r i e d a d e s n o D o m í n i o d a F r e q u ê n c i a P r o p r i e d a d e s P r o b a b i l í s t i c a s P r o p r i e d a d e s n o D o m í n i o d o T e m p o g e r a d a s d e o p e r a ç õ e s n ã o - l i n e a r e s

(29)

2.3.1.2 Aplica¸c˜ao

A teoria de cicloestacionariedade ´e relevante para diversas ´areas do conhecimento, tais como telecomunica¸c˜oes, mecˆanica, econometria1 e outras, apresentando diversas aplica¸c˜oes

em cada uma dessas, conforme evidenciado em Gardner [30]. Nesta disserta¸c˜ao, o estudo de cicloestacionariedade ser´a voltado para a ´area de telecomunica¸c˜oes.

Em telecomunica¸c˜oes, a cicloestacionariedade pode surgir devido `a jun¸c˜ao de mensagens de sinais estacion´arios com portadoras sinusoidais, trem de pulsos, c´odigos de repeti¸c˜ao, ou pode ocorrer, tamb´em, como resultado de outros processos usados na gera¸c˜ao de sinais, tais como: amostragem e multiplexa¸c˜ao [9].

A cicloestacionariedade pode ser explorada para aumentar a precis˜ao e confiabilidade da informa¸c˜ao provida por um conjunto de dados, tal como medidas de sinais corrompidos. Tais informa¸c˜oes incluem:

• decis˜ao sobre a presen¸ca de um sinal modulado, ou sobre o n´umero de sinais modulados. • classifica¸c˜ao de modula¸c˜ao de m´ultiplos sinais transmitidos em um ambiente com ru´ıdo. • estimativa de parˆametros como fase da portadora, n´umero de s´ımbolos e dire¸c˜ao de

chegada de um sinal corrompido com ru´ıdo e interferˆencia.

Em Gardner [31] ´e apresentado um consistente estudo sobre a teoria e aplica¸c˜ao de sinais cicloestacion´arios.

2.3.1.3 Motiva¸c˜ao

Antes de aplicar cicloestacionariedade ao problema de classifica¸c˜ao de modula¸c˜ao, ser´a mostrado um exemplo de transforma¸c˜ao n˜ao-linear em um sinal x(t), objetivando mostrar o aparecimento de linhas espectrais. Essas linhas espectrais evidenciam a periodicidade escondida em determinados sinais. Tornar essa periodicidade expl´ıcita pode facilitar explor´a-la para fins de caracterizar o sinal.

Suponha que a(t) seja um sinal aleat´orio passa-baixa com densidade espectral de potˆencia (PSD) chamada de Sa(f ), a qual n˜ao cont´em nenhuma linha espectral, como mostrado

na Fig. 2.5(a). Se a(t) ´e usado para modular uma onda sinusoidal, ´e obtido um sinal modulado em amplitude (AM):

(30)

13

x(t) = a(t) cos (2πf0t) (2.1)

cuja PSD Sx(f ) ´e dada pela Eq. 2.2 e mostrada na Fig 2.5(b).

Sx(f ) = 1 4Sa(f + f0) + 1 4Sa(f − f0). (2.2) sendo f0 = 2, 4 GHz. −8 −6 −4 −2 0 2 4 6 8 −180 −170 −160 −150 −140 −130 −120 −110 −100 Frequência (GHz) Potência/frequência (dB/Hz) (a) PSD a(t) −8 −6 −4 −2 0 2 4 6 8 −180 −170 −160 −150 −140 −130 −120 −110 −100 Frequência (GHz) Powência/frequência (dB/Hz) (b) PSD x(t)

Figura 2.5: PSD de sinais sem linhas espectrais.

Embora a PSD seja centrada em f = f0 e f = −f0, n˜ao h´a nenhuma linha espectral

em Sx(f ) para f = 0. Fazendo x2(t) para obter:

y(t) = x2(t) = a2(t) cos2(2πf0t) =

1

2[b(t) + b(t) cos (4πf0t)] (2.3) onde

b(t) = a2(t)

observa-se que a PSD de b(t) cont´em linha espectrais em f = 0, como mostrado na Fig. 2.6(a). A PSD de y(t) ´e dada pela Eq. 2.4 e mostrada na Fig. 2.6(b).

Sy(f ) = 1 4[Sb(f ) + 1 4Sb(f + 2f0) + 1 4Sb(f − 2f0)]. (2.4) Esse exemplo permite ilustrar o aparecimento da periodicidade escondida em sinais ao se realizar transforma¸c˜oes n˜ao-lineares nestes. No exemplo acima, calcular x2(t) foi suficiente para o aparecimento de linhas espectrais. No entanto alguns sinais necessitam de outras transforma¸c˜oes n˜ao-lineares, tais como atraso e multiplica¸c˜ao, para o aparecimento de linhas espectrais, conforme demonstrado em [32]. A periodicidade exibida no sinal x(t) do exemplo acima, ´e chamada de 1a ordem, dado que as linhas espectrais s˜ao manifestadas na fun¸c˜ao

(31)

−8 −6 −4 −2 0 2 4 6 8 −180 −170 −160 −150 −140 −130 −120 −110 −100 Frequência (GHz) Potência/frequência (dB/Hz) (a) PSD de b(t) −8 −6 −4 −2 0 2 4 6 8 −180 −170 −160 −150 −140 −130 −120 −110 −100 Frequência (GHz) Potência/frequência (dB/Hz) (b) PSD de y(t)

Figura 2.6: Exemplo de PSD com linhas espectrais.

2.3.2

An´

alise Espectral C´ıclica

Nesta disserta¸c˜ao ser´a adotado o termo an´alise espectral c´ıclica para descrever o estudo de trˆes importantes fun¸c˜oes matem´aticas utilizadas para caracterizar sinais modulados com base na cicloestacionariedade, s˜ao elas: fun¸c˜ao de autocorrela¸c˜ao c´ıclica (cyclic autocorrelation function), espectro c´ıclico ou densidade espectral c´ıclica (cyclic spectral density) e fun¸c˜ao de autocoerˆencia espectral (spectral autocoherence function). Tais fun¸c˜oes se baseiam em sinais cicloestacion´arios de 2a ordem e s˜ao melhor detalhadas em [30]. As subse¸c˜oes seguintes ser˜ao

destinadas aos principais aspectos relacionados com a an´alise espectral implementada.

2.3.2.1 Fun¸c˜ao de Autocorrela¸c˜ao C´ıclica - FAC

A defini¸c˜ao de fun¸c˜ao de autocorrela¸c˜ao c´ıclica parte da defini¸c˜ao de autocorrela¸c˜ao de sinais cicloestacion´arios de 2a ordem: um sinal x(t) ´e definido como cicloestacion´ario de

2a ordem (no sentido amplo) se suas fun¸c˜oes m´edia e autocorrela¸c˜ao s˜ao peri´odicas com um

per´ıodo T , isto ´e

Mx(t + T ) = Mx(t)

Rx(t + T, u + T ) = Rx(t, u)

para todo t e u. Por conveniˆencia a fun¸c˜ao de autocorrela¸c˜ao pode ser reescrita como:

Rx(t + T, u + T ) = Rx(t + τ /2, t − τ/2),

ent˜ao Rx(t + τ /2, t − τ/2) ´e uma fun¸c˜ao de duas vari´aveis independentes t e τ, sendo peri´odica

em t com per´ıodo T para cada valor de τ . Assim ´e poss´ıvel expressar a representa¸c˜ao da s´erie de Fourier para Rx como:

(32)

15

Rx(t + τ /2, t − τ/2) =

X

α

x(τ )ei2παt (2.5)

Os coeficientes da s´erie de Fourier {Rα

x} podem ser definidos como:

x(τ )=∆ 1 T Z T /2 −T /2 Rx(t + τ 2, t − τ 2)e −i2παt dt, (2.6)

sendo α a frequˆencia c´ıclica, a qual percorre todos os m´ultiplos inteiros da frequˆencia fundamental 1/T . Esta defini¸c˜ao de Rα

x(τ ) considera uma ´unica periodicidade em 1/T . Para

o caso de se analisar m´ultiplas periodicidades, deve-se fazer α percorrer todos os m´ultiplos inteiros de todas as frequˆencias fundamentais, por exemplo “1/T1, 1/T2, 1/T3, . . .”. Assim a

defini¸c˜ao de Rα

x pode ser generalizada para:

x(τ )= lim∆ ∆t→∞ 1 ∆t Z ∆t/2 −∆t/2 Rx(t + τ 2, t − τ 2)e −i2παt dt, (2.7)

onde ∆t ´e o intervalo de tempo e Rαx(τ ) representa a fun¸c˜ao de autocorrela¸c˜ao c´ıclica (FAC).

Dessa forma, um processo ´e dito exibir cicloestacionariedade se existir uma frequˆencia c´ıclica α para o qual a FAC, definida na Eq. 2.7, seja diferente de zero.

Outra forma de definir a FAC ´e a partir do dom´ınio da frequˆencia. Por exemplo, considere duas vers˜oes de X(t) deslocadas na frequˆencia:

V (t) = X(t)e(−iπαt)

U (t) = X(t)e(+iπαt) (2.8)

A autocorrela¸c˜ao de U e V podem ser expressas com base na Eq. 2.7, atrav´es do valor esperado [30] como: RU(τ )= lim∆ ∆t→∞ 1 ∆t ∆t/2 Z −∆t/2 EnU³t + τ 2 ´ U³t − τ 2 ´o dt ≡ RX(τ )e−iπατ de maneira equivalente: RV(τ ) ≡ RX(τ )e+iπατ.

Calculando a correla¸c˜ao cruzada de V (t) e U (t), obt´em-se a fun¸c˜ao de autocorrela¸c˜ao c´ıclica da seguinte forma:

RU V(τ )= lim∆ ∆t→∞ 1 ∆t ∆t/2 Z −∆t/2 EnU³t + τ 2 ´ V ³t − τ 2 ´o dt ≡ RαX(τ ) (2.9)

(33)

Dessa forma, a fun¸c˜ao de autocorrela¸c˜ao c´ıclica de um sinal X ´e simplesmente a correla¸c˜ao cruzada entre vers˜oes de X deslocadas na frequˆencia. Isto significa que um sinal exibe cicloestacionariedade no sentido amplo se e somente se existir correla¸c˜ao entre vers˜oes deslocadas do sinal. Al´em disso, pode-se concluir que um sinal pode ser estacion´ario somente se n˜ao existir qualquer correla¸c˜ao entre as vers˜oes deslocadas do sinal, ou seja Rα

X(τ ) ≡ 0 para

todo α 6= 0.

2.3.2.2 Densidade Espectral C´ıclica (DEC) ou Espectro C´ıclico A densidade espectral de V e U s˜ao definidas com base na Eq. 2.8 como:

SU(f ) = SX(f + α/2), (2.10)

SV(f ) = SX(f − α/2), (2.11)

e o espectro cruzado da Eq. 2.9 ´e dado por:

SU V(f ) =

Z ∞ −∞

X(τ )e−i2πf τ

dτ = S∆ Xα(f ), (2.12) o qual ´e chamado de densidade espectral c´ıclica.

2.3.2.3 Fun¸c˜ao de Autocoerˆencia Espectral - FAE

Das Eq. 2.10, 2.11 e 2.12 ´e poss´ıvel definir a fun¸c˜ao de coerˆencia espectral, de acordo com [30] e [33]: ρU V(f )=∆ √SU V(f ) SU(f )SV(f ) = √ SXα(f ) SX(f +α/2)SX(f −α/2) ∆ = ρα X(f ) (2.13)

A fun¸c˜ao de autocoerˆencia espectral fornece uma medida normalizada da correla¸c˜ao cruzada entre as componentes do sinal em f − α/2 e f + α/2. A magnitude da fun¸c˜ao de autocoerˆencia espectral varia entre 0 e 1, sendo invariante a transforma¸c˜oes lineares dos sinais recebidos.

2.3.2.4 Implementa¸c˜ao do Algoritmo

O processo de extra¸c˜ao de caracter´ısticas implementado nesta disserta¸c˜ao foi baseado na fun¸c˜ao perfil de cada modula¸c˜ao. O algoritmo desenvolvido corresponde `a uma adapta¸c˜ao do algoritmo definido em [34]. A diferen¸ca ´e que em [34] a decis˜ao de classifica¸c˜ao ´e realizada com

(34)

17 base na fun¸c˜ao de autocoerˆencia espectral, enquanto que no algoritmo implementado nesta disserta¸c˜ao a classifica¸c˜ao teve como base o perfil c´ıclico. Com essa adapta¸c˜ao diminui-se o custo computacional, pois o perfil c´ıclico ´e uma vari´avel bidimensional, enquanto que a fun¸c˜ao de autocoerˆencia ´e tridimensional. Os vetores de perfis foram salvos em arquivos no formato do software WEKA e foram as entradas para os reconhecedores de padr˜ao realizarem a classifica¸c˜ao de modula¸c˜ao.

1. Divide-se a sequˆencia de amostras de entrada em L blocos, com cada bloco contendo N amostras;

2. Calcula-se a Transformada Discreta de Fourier das N amostras em cada bloco l, xl[n] = 0, 1, . . . , N − 1, l = 0, 1, . . . , L − 1 : Xl[k] = N −1 P n=0 xl[n] exp(−i2πknN), k = 0, 1, . . . , N − 1;

3. Calcula-se a fun¸c˜ao de autocorrela¸c˜ao c´ıclica: Tα l [k] = N1Xl[k + α 2]X ∗ l[k − α2], k = 0, 1, . . . , N − 1, l = 0, 1, . . . , L − 1;

4. Calcula-se o espectro c´ıclico, com base no resultado do passo (3) sobre todos os blocos: Sα X[k] = L1 L−1 P l=0 Tα l [k], k = 0, 1, . . . , N − 1; 5. Calcula-se a fun¸c˜ao de autocoerˆencia espectral:

ραX[k] = N −1 X k=0 Sα X[k] pS0 X[k + α/2]SX0 [k − α/2] (2.14)

6. Calcula-se a fun¸c˜ao perfil das frequˆencias c´ıclicas, proposta em [7]: I(α)= max∆

k |ρ α

X[k]|. (2.15)

2.3.2.5 Perfis de Modula¸c˜oes

No processo de extra¸c˜ao de caracter´ısticas, um importante fator que pode influenciar nas caracter´ısticas das modula¸c˜oes diz respeito ao processo de suaviza¸c˜ao do espectro (smoothing) ao longo das frequˆencias f e α. Esse processo de suaviza¸c˜ao impacta nas

(35)

caracter´ısticas espectrais dos sinais modulados, de tal forma que algumas caracter´ısticas das modula¸c˜oes podem n˜ao se manifestar no espectro c´ıclico do sinal.

Para exemplificar a influˆencia da suaviza¸c˜ao nas caracter´ısticas das modula¸c˜oes, considere que dois sinais modulados com BPSK tˆem seus espectros c´ıclicos filtrados por um filtro passa-baixa de ordem 50, com frequˆencias de corte Wn = 0.1 Hz e Wn = 0.5 Hz,

respectivamente, ao longo da frequˆencia c´ıclica α. Deve-se destacar que esses valores de Wn

est˜ao normalizados. As Figs. 2.7 - Fig. 2.9 mostram a diferen¸ca nas caracter´ısticas do espectro c´ıclico, fun¸c˜ao de autocoerˆencia2 e perfil de ambos os sinais.

α

(a) Wn=0,1

α

(b) Wn=0,5

Figura 2.7: Espectro c´ıclico para BPSK com diferentes suaviza¸c˜oes na frequˆencia α.

α

(a) Wn=0,1

α

(b) Wn=0,5

Figura 2.8: Autocoerˆencia espectral para BPSK com diferentes suaviza¸c˜oes na frequˆencia α.

(36)

19 0 1 2 3 4 5 6 7 8 x 109 0 1 2 3 4 5 6 7 X: 5.875e+009 Y: 2.547 X: 3.813e+009 Y: 6.57 X: 1.125e+009 Y: 2.686 α (Hz) (a) Wn=0,1 0 1 2 3 4 5 6 7 8 x 109 0 1 2 3 4 5 6 7 X: 3.938e+009 Y: 1.118 X: 5.875e+009 Y: 0.5552 X: 6.25e+007 Y: 1.105 α (Hz) (b) Wn=0,5

Figura 2.9: Perfil para BPSK com diferentes suaviza¸c˜oes na frequˆencia α.

Muitos trabalhos dispon´ıveis na literatura mostram gr´aficos do espectro c´ıclico para v´arias modula¸c˜oes, como em [7, 8, 11]. No entanto, nem todos os parˆametros para gerar tais gr´aficos s˜ao dispon´ıveis, dificultando sua reprodu¸c˜ao. Nesta disserta¸c˜ao, n˜ao foi utilizado nenhum processamento inicial para extrair as caracter´ısticas de modula¸c˜oes de forma a sintonizar com os resultados mostrados em outros trabalhos. As poss´ıveis diferen¸cas com outros resultados podem decorrer do uso de diferentes parˆametros de configura¸c˜ao.

As Fig. 2.10- 2.12 apresentam exemplos de gr´aficos de espectro c´ıclico, fun¸c˜ao de autocoerˆencia e perfil das modula¸c˜oes AM, BPSK, QPSK, BFSK e 16-QAM. Estes foram gerados com RSR = 10 dB, frequˆencia da portadora de 2,4 GHz, frequˆencia de amostragem de 8 GHz, FFT com 256 amostras, 2.560 s´ımbolos para cada modula¸c˜ao, considerou-se uma filtragem ao longo das frequˆencias f e α, com um filtro de ordem 50 e Wn = 0,2 e Wn = 0,1,

(37)

α

(a) Espectro c´ıclico - AM

α (b) Espectro c´ıclico - BPSK α (c) Espectro c´ıclico - QPSK α (d) Espectro c´ıclico - BFSK α

(e) Espectro c´ıclico - 16-QAM

(38)

21

α

(a) Autocoerˆencia espectral - AM

α (b) Autocoerˆencia espectral - BPSK α (c) Autocoerˆencia espectral - QPSK α (d) Autocoerˆencia espectral - BFSK α

(e) Autocoerˆencia espectral - 16-QAM

(39)

0 2 4 6 8 10 x 109 0 2 4 6 8 10 12 14 16 18 20 α (Hz) I (α) (a) Perfil - AM 0 1 2 3 4 5 6 7 8 x 109 0 2 4 6 8 10 12 14 16 18 20 α (Hz) I (α) (b) Perfil - BPSK 0 1 2 3 4 5 6 7 8 x 109 0 2 4 6 8 10 12 14 16 18 20 α (Hz) I (α) (c) Perfil - QPSK 0 1 2 3 4 5 6 7 8 x 109 0 2 4 6 8 10 12 14 16 18 20 α (Hz) I (α) (d) Perfil - BFSK 0 1 2 3 4 5 6 7 8 x 109 0 2 4 6 8 10 12 14 16 18 20 α (Hz) I (α)

(e) Perfil - 16-QAM

Figura 2.12: Perfil das modula¸c˜oes para as condi¸c˜oes adotadas.

2.3.2.6 Vantagens

Gardner [9] foi um dos pioneiros a demonstrar o poder da an´alise de sinais cicloestacion´arios quando aplicados em sistemas de comunica¸c˜ao sem fio. Ap´os seus trabalhos, a an´alise espectral c´ıclica tem sido extensivamente utilizada como t´ecnica para alcan¸car um

(40)

23 enorme leque de aplica¸c˜oes, incluindo detec¸c˜ao de sinais [10], classifica¸c˜ao [35], sincroniza¸c˜ao [6] e equaliza¸c˜ao [32].

H´a in´umeras vantagens provenientes da utiliza¸c˜ao da an´alise espectral c´ıclica para an´alise de sinais cicloestacion´arios em rela¸c˜ao `as abordagens radiom´etricas (as quais se baseiam na medida de energia do sinal recebido). Dentre estas vantagens est˜ao:

• Reduzida sensibilidade a ru´ıdo, comprovada pelo bom desempenho da t´ecnica de an´alise espectral c´ıclica em ambientes com baixa RSR [8, 31, 36].

• Reduzida sensibilidade a sinais interferentes, devido ao fato de que a an´alise espectral c´ıclica permite diferenciar grande parte dos sinais, conforme [6].

• Habilidade para extrair parˆametros de sinais ´unicos, tais como frequˆencia da portadora, taxa de s´ımbolos e outros [7, 31].

2.3.3

Considera¸c˜

oes Pr´

aticas

Como informado, a t´ecnica de an´alise espectral c´ıclica tem se mostrado eficiente em diversos trabalhos dispon´ıveis na literatura ([6, 7, 8, 32, 34]). No entanto, existem alguns desafios a serem considerados quanto ao seu uso como ferramenta para detec¸c˜ao e classifica¸c˜ao de sinais. Alguns desses desafios s˜ao resumidos a seguir:

• Na pr´atica, alguns sinais n˜ao s˜ao verdadeiramente cicloestacion´arios, devido `a varia¸c˜ao temporal dos sistemas de comunica¸c˜ao, ocasionado pela imprecis˜ao dos seus clocks. No entanto, se for considerado um bloco finito no tempo ´e poss´ıvel verificar a cicloestacionariedade.

• A natureza peri´odica dos sinais modulados, pode ser diminu´ıda pelas distor¸c˜oes no sinal, como por exemplo, efeito Doppler e desvanecimento.

• Nem todos os sinais podem ser classificados utilizando cicloestacionariedade de 2aordem,

pois as caracter´ısticas c´ıclicas de algumas modula¸c˜oes podem apresentar ambiguidades. Uma alternativa ´e a utiliza¸c˜ao de cumulantes c´ıclicos, o que exige um conjunto maior de dados e uma maior complexidade do sistema.

• O c´alculo da superf´ıcie tridimensional do espectro c´ıclico Sα

x(f ), necess´ario para cada

sinal modulado x(t) ´e computacionalmente intenso. Contudo, na pr´atica, a regi˜ao de c´alculo pode ser reduzida, se algumas suposi¸c˜oes sobre a banda de opera¸c˜ao forem assumidas.

(41)

2.4

Reconhecedores de Padr˜

ao

Nesta Se¸c˜ao ser´a apresentada uma breve descri¸c˜ao das t´ecnicas de reconhecimento de padr˜ao: na¨ıve Bayes, KNN, ´arvore de decis˜ao, SVM e Redes Neurais.

2.4.1

Na¨ıve Bayes

O reconhecedor de padr˜ao Na¨ıve Bayes pode ser visto como uma rede Bayesiana simples [37], na qual todos os atributos s˜ao condicionalmente independentes, dado o valor da classe y. Segundo [38], a suposi¸c˜ao de independˆencia condicional pode ser formalmente definida, como: P (X|Y = y) = d Y i=1 P (Xi|Y = y) (2.16)

onde cada conjunto (ou vetor) de atributos X = [X1, X2, ..., Xd] consiste de d atributos Xi.

Com a suposi¸c˜ao de independˆencia condicional, ao inv´es de se estimar a probabilidade condicional de X no espa¸co de dimens˜ao d, tem-se apenas que estimar a probabilidade condicional de cada Xi, dado Y . A ´ultima abordagem ´e mais pr´atica, pois n˜ao requer um

grande conjunto de treino para obter uma boa estimativa da probabilidade.

Para classificar um conjunto de teste, o Na¨ıve Bayes calcula a probabilidade `a posteriori para cada classe Y :

P (Y |X) = P (Y ) Qd

i=1P (Xi|Y )

P (X) , (2.17)

dado que P (X) n˜ao depende de Y , ´e suficiente escolher a classe que maximiza o numerador P (Y )Qd

i=1P (Xi|Y ).

Essa suposi¸c˜ao de independˆencia condicional reduz a complexidade da aprendizagem, mas pode se tornar restritiva [37]. Embora considerado um m´etodo simplista de classifica¸c˜ao, em muitas aplica¸c˜oes o Na¨ıve Bayes apresenta um bom desempenho [38] e o mesmo ´e ´util para fins de compara¸c˜oes [39].

O reconhecedor Na¨ıve Bayes geralmente apresenta as seguintes caracter´ısticas:

• ´e robusto para pontos de ru´ıdo isolados, tendo em vista que tais pontos s˜ao calculados separados (“averaged out”) ao se estimar a probabilidade condicional dos dados.

(42)

25 • ´e robusto para atributos irrelevantes. Se Xi ´e um atributo irrelevante, ent˜ao P (Xi|Y ) se

torna quase uniformemente distribu´ıdo. A probabilidade condicional para Xi n˜ao tem

nenhum impacto no c´alculo global da probabilidade `a posteriori.

• atributos correlacionados podem degradar o desempenho do Na¨ıve Bayes, pois a suposi¸c˜ao de independˆencia condicional j´a n˜ao ´e adequada para tais atributos.

2.4.2

KNN

Os reconhecedores de padr˜ao que simplesmente armazenam o conjunto de treino s˜ao chamados de “lazy” ou IBL (instance based learning) [40]. O KNN (k-nearest neighbor ) [40] ´e um m´etodo dessa fam´ılia e armazena exemplos na mem´oria como pontos no espa¸co n-dimensional definido pelos n atributos que descrevem os exemplos. Para tais m´etodos, uma das decis˜oes importantes ´e qual m´etrica adotar para medir a similaridade entre os exemplos. O KNN usa a t´ecnica do “vizinho mais pr´oximo” ou “nearest neighbor ” para classificar novos exemplos.

O reconhecedor KNN apresenta as seguintes caracter´ısticas:

• usa exemplos de treino espec´ıficos para fazer predi¸c˜oes sem ter que manter uma abstra¸c˜ao ou modelo derivado dos dados. Algoritmos IBL requerem uma medida de proximidade para determinar a similaridade ou distˆancia entre exemplos e uma fun¸c˜ao de classifica¸c˜ao que retorne a classe predita de um exemplo de teste baseado na proximidade a outros exemplos.

• n˜ao requer a constru¸c˜ao de um modelo, no entanto classifica¸c˜ao de um exemplo de teste pode ser custosa, pois ´e necess´ario calcular os valores de proximidade individualmente entre o teste e os exemplos de treino. Ao contr´ario dos algoritmos ditos “eager learners” que frequentemente gastam mais recursos computacionais para construir o modelo. No caso dos “eager learners”, uma vez que o modelo esteja constru´ıdo, a classifica¸c˜ao de um exemplo de teste ´e r´apida.

• faz predi¸c˜ao baseada em informa¸c˜oes locais, enquanto que os classificadores como ´arvore de decis˜ao e os baseados em regras tentam encontrar um modelo global que se ajuste a todo o espa¸co de entrada. Como a decis˜ao de classifica¸c˜ao ´e feita localmente, o KNN (com valores pequenos de k) s˜ao bastante suscept´ıveis a ru´ıdo.

• o limite de decis˜ao de um KNN tem alta variabilidade, pois ele depende da composi¸c˜ao dos exemplos de treino. Aumentando o n´umero k de vizinhos pr´oximos pode-se reduzir tal variabilidade.

(43)

• podem produzir predi¸c˜oes erradas, a menos que seja escolhida a medida de proximidade apropriada.

2.4.3

Arvore de Decis˜

´

ao

Uma ´arvore de decis˜ao ´e um modelo de aprendizagem de m´aquina preditivo [40], que realiza a decis˜ao de uma nova amostra baseada no valor de seus v´arios atributos. Consiste em uma estrutura onde os n´os n˜ao-terminais representam testes de um ou mais atributos. As ramifica¸c˜oes desses n´os s˜ao os poss´ıveis valores que esses atributos podem assumir nas amostras observadas e os n´os terminais ou folhas refletem o resultado da classifica¸c˜ao. Nessa estrutura o n´o ra´ız ´e aquele considerado pelo algoritmo classificado como o atributo mais importante para determinar o tipo de classe.

Para classificar um novo item, ´e criada uma ´arvore de decis˜ao baseada nos valores dos atributos do conjunto de treino. Procura-se um atributo que separe as v´arias amostras claramente [40]. Por exemplo, o atributo considerado como o que melhor distingue uma amostra pode ser o de maior ganho de informa¸c˜ao. O processo ´e repetido iterativamente. A Fig. 2.13 mostra os crit´erios utilizados para a classifica¸c˜ao das modula¸c˜oes AM, BPSK, QPSK, BFSK e 16-QAM, em um ambiente com AWGN e uma RSR = 10 dB.

Figura 2.13: ´Arvore de decis˜ao para classificar modula¸c˜oes em um ambiente com RSR=10 dB. Dentre os 256 atributos utilizados para caracterizar cada modula¸c˜ao, a ´arvore foi constru´ıda utilizando apenas 3 destes, os quais foram considerados os mais significativos. Por outro lado a Fig. 2.14 ilustra a classifica¸c˜ao das mesmas modula¸c˜oes, mas agora para uma RSR = -5 dB. Nota-se, que neste cen´ario foram considerados necess´arios 10 atributos para constru¸c˜ao da ´arvore de decis˜ao.

A escolha dos atributos se d´a de acordo com o algoritmo utilizado. Nesta disserta¸c˜ao foi utilizado o algoritmo J4.8, que ´e uma implementa¸c˜ao do algoritmo C4.5 [41]. O algoritmo

(44)

27

Figura 2.14: ´Arvore de decis˜ao para classificar modula¸c˜oes em um ambiente com RSR=-5 dB. J4.8 constr´oi um modelo de ´arvore de decis˜ao analisando o grau de aleatoriedade dos valores que uma vari´avel X pode assumir. A aleatoriedade ´e verificada com o c´alculo da entropia dos dados. Quanto menor a entropia, menor a aleatoriedade, assim a taxa de erros da classifica¸c˜ao ser´a menor.

As ´arvores treinadas podem ser representadas como um conjunto de regras “if-else”. Cada caminho do n´o raiz at´e um n´o folha representa uma destas regras. Por exemplo, na Fig. 2.14 pode ser visualizada a regra: IF part2 ≤ 0, 49 AND part1 ≤ 0, 83 THEN Classe = bpsk. A ´arvore de decis˜ao deve ser definida de tal forma que, para cada observa¸c˜ao da base de dados, haja apenas um caminho do n´o raiz at´e o n´o folha.

As ´arvores de decis˜ao apresentam as seguintes caracter´ısticas gerais:

• possuem um alto grau de interpretabilidade quando comparadas com outras t´ecnicas de reconhecimento, tais como rede neural e SVM.

• utiliza uma abordagem n˜ao-param´etrica para constru¸c˜ao de modelos de classifica¸c˜ao, uma vez que n˜ao requer qualquer suposi¸c˜ao sobre o tipo de distribui¸c˜ao de probabilidade satisfeita pela classe e outros atributos.

• s˜ao robustas `a presen¸ca de ru´ıdo, especialmente quando m´etodos para evitar superajustamento s˜ao utilizados [38].

• s˜ao poucos suscet´ıveis a atributos redundantes. Um atributo ´e redundante se ´e fortemente correlacionado com outro atributo, nesse caso apenas um ser´a escolhido para

(45)

constru¸c˜ao da ´arvore. Por outro lado, se o conjunto de treino apresenta muitos atributos irrelevantes (ou seja, atributos que n˜ao s˜ao ´uteis para classifica¸c˜ao) um desses poder´a ser escolhido. Nesse caso, a ´arvore de decis˜ao poder´a ser maior do que o necess´ario.

2.4.4

SVM

A SVM (support vector machine) engloba uma classe de algoritmos de aprendizado baseado na teoria de aprendizado estat´ıstico desenvolvida por Vapnik [42], a qual estabelece condi¸c˜oes matem´aticas que auxiliam na escolha de um classificador particular a partir de um conjunto de dados de treinamento. Essas condi¸c˜oes levam em conta o desempenho do classificador no conjunto de treinamento e a sua complexidade, com o objetivo de obter um bom desempenho tamb´em para novos dados do mesmo dom´ınio. Esta teoria implementa o princ´ıpio de minimiza¸c˜ao do risco estrutural (MRS) [43].

A id´eia b´asica da SVM ´e mapear um espa¸co de entrada em um espa¸co de caracter´ısticas. Este mapeamento pode ser feito linearmente ou n˜ao, de acordo com a fun¸c˜ao de kernel usada para mapeamento [42]. No espa¸co de caracter´ısticas, a SVM constr´oi hiperplanos ´otimos atrav´es dos quais as classes s˜ao separadas com o objetivo de estabelecer uma margem maior entre cada classe e um erro m´ınimo na classifica¸c˜ao [44]. O hiperplano ´otimo pode ser escrito como uma combina¸c˜ao de poucos pontos de caracter´ısticas, definidos pelos exemplos do conjunto de treino, e s˜ao chamados de vetores de suporte do hiperplano ´otimo.

A literatura apresenta v´arias possibilidades de kernels para a SVM em aplica¸c˜oes envolvendo o reconhecimento de padr˜ao, tais como kernel linear, polinomial, rede de fun¸c˜ao de base radial e perceptron de duas camadas [43]. Nesta disserta¸c˜ao foi escolhido empiricamente utilizar o kernel linear.

Seja T um conjunto de treinamento com n dados xi ∈ X e suas respectivas classes

yi ∈ Y, em que X constitui o espa¸co dos dados e Y = {−1, +1}. T ´e linearmente separ´avel

se ´e poss´ıvel separar os dados das classes +1 e −1 por um hiperplano.

Dessa forma, o modelo de aprendizagem de uma SVM linear pode ser formalizado como um problema de otimiza¸c˜ao com restri¸c˜ao:

min w kwk2 2 (2.18) sujeito a yi(w · xi+ b) ≥ 1, i = 1, 2, . . . , N.

(46)

29 Dado que a fun¸c˜ao objetivo ´e quadr´atica e as restri¸c˜oes s˜ao lineares, esse problema ´e resolvido usando o m´etodo de multiplicadores de Lagrange, conforme descrito em [38].

Em situa¸c˜oes reais, ´e dif´ıcil encontrar aplica¸c˜oes cujos dados sejam linearmente separ´aveis. Isso se deve a diversos fatores, entre eles a presen¸ca de ru´ıdos ou atributos que diferem do padr˜ao dos dados (outliers) ou `a pr´opria natureza do problema, que pode ser n˜ao linear. Nesses casos, as SVM lineares s˜ao adaptadas para resolver esse tipo de problema.

Uma poss´ıvel adapta¸c˜ao envolve a adi¸c˜ao de vari´aveis de folga ξi, para todo i =

1, 2, . . . , N ao problema de otimiza¸c˜ao da Eq. 2.18. Isso permite que alguns dados possam violar a restri¸c˜ao da Equa¸c˜ao 2.18.

Um erro no conjunto de treinamento ´e indicado por um valor de ξi maior que 1. Logo,

a soma dos ξi representa um limite no n´umero de erros de treinamento. Dessa forma, a fun¸c˜ao

objetivo modificada ´e dado pela Eq. 2.19:

min w,b,ξ = kwk2 2 + C( N X i=1 ξi) (2.19)

onde a constante C ´e um termo de regulariza¸c˜ao que imp˜oe um peso `a minimiza¸c˜ao dos erros no conjunto de treinamento em rela¸c˜ao `a minimiza¸c˜ao da complexidade do modelo [45].

Os reconhecedores SVM apresentam como caracter´ısticas principais:

• disp˜oe de eficientes algoritmos para encontrar o m´ınimo global da fun¸c˜ao objetivo, dada a convexidade do problema de otimiza¸c˜ao formulado. Enquanto que outros reconhecedores, como Redes Neurais Perceptron Multicamadas, apresentam m´ınimos locais na fun¸c˜ao objetivo, portanto tendem a encontrar solu¸c˜oes ´otimas localmente [38]. • s˜ao robustas diante de dados de grande dimens˜ao, sobre os quais outras t´ecnicas de

aprendizado comumente obtˆem classificadores super ou sub ajustados. • boa capacidade de generaliza¸c˜ao.

• s˜ao sens´ıveis aos valores dos parˆametros. • dificuldade de interpreta¸c˜ao do modelo gerado.

2.4.5

Rede Neural Artificial

Uma Rede Neural Artificial (RNA) ´e uma estrutura de processamento de informa¸c˜ao distribu´ıda paralelamente na forma de um grafo direcionado [46]. Consiste de um sistema de

(47)

neurˆonios ligados por conex˜oes sin´apticas e dividido em: neurˆonios de entrada, que recebem est´ımulos do meio externo, neurˆonios internos ou escondidos e neurˆonios de sa´ıda, que est˜ao organizados em camadas e se comunicam com o exterior. Possui uma regra de treinamento, onde os pesos w de suas conex˜oes s˜ao ajustados de acordo com os padr˜oes apresentados [47]. Uma RNA pode conter v´arias camadas intermedi´arias entre as camadas de entrada e de sa´ıda. Tais camadas s˜ao chamadas de camadas escondidas e os neurˆonios presentes nessa camada s˜ao os neurˆonios escondidos. A estrutura resultante ´e conhecida como rede neural multicamadas, conforme Fig. 2.15, onde xi representa o conjunto de dados de entrada, wi,j o

conjunto de pesos, ni o conjunto de neurˆonios e y a sa´ıda, que corresponde `a classe.

n 1 n2 n 3 n4 n 5 x1 x 2 y w3 1 w 4 1 w4 2 w3 2 w5 3 w5 4 C a m a d a d e e n t r a d a C a m a d a e s c o n d i d a C a m a d a d e s a í d a

Figura 2.15: Topologia de uma Rede Neural.

Um neurˆonio consiste de um somat´orio de pesos e entradas, seguido por uma fun¸c˜ao chamada de fun¸c˜ao de ativa¸c˜ao, originalmente ´e uma fun¸c˜ao de limiar. Exemplos de fun¸c˜oes de ativa¸c˜ao comumente usadas s˜ao: linear, tangente, sigm´oide, etc. Detalhes sobre tais fun¸c˜oes podem ser encontrados em [48, 49].

A RNA aprende ajustando os pesos das interconex˜oes entre as camadas. As sa´ıdas da rede s˜ao repetidamente comparadas com as sa´ıdas corretas, e cada vez os pesos das conex˜oes s˜ao ajustados na dire¸c˜ao das sa´ıdas corretas.

As RNAs buscam por padr˜oes em conjuntos de dados de treinamento. Aprendem estes padr˜oes, e desenvolvem a habilidade de classificar corretamente.

Nesta disserta¸c˜ao foi utilizado aprendizado supervisionado, no qual a rede neural recebe um conjunto de entradas padronizadas e seus correspondentes padr˜oes de sa´ıda. Ajustes nos pesos sin´apticos s˜ao realizados at´e que o erro entre os padr˜oes de sa´ıda, gerados pela rede tenham um valor desejado, ou at´e que um determinado n´umero de itera¸c˜oes seja alcan¸cado. O algoritmo de treinamento utilizado foi o backpropagation [48].

Alguns aspectos devem ser levados em considera¸c˜ao durante a fase de treinamento de uma RNA, entre os quais se destacam:

• m´etodo de inicializa¸c˜ao dos pesos, que pode ser uniforme ou aleat´orio, geralmente s˜ao utilizados valores na faixa de −1 e 1 ou −0, 5 e 0, 5.

(48)

31 • taxa de aprendizado, respons´avel pelo controle da velocidade do aprendizado. Como

sugerido em [50] seu valor deve ser maior que 0 e menor que 1.

• fun¸c˜ao de transferˆencia, essa fun¸c˜ao define e envia para fora do neurˆonio o valor passado pela fun¸c˜ao de ativa¸c˜ao.

Conforme definido em [38] as caracter´ısticas gerais de uma RNA s˜ao:

• RNA com pelo menos uma camada escondida s˜ao aproximadores universais, isto ´e, elas podem ser usadas para aproximar qualquer fun¸c˜ao alvo. Dado que uma RNA tem um espa¸co de hip´otese muito expressivo, dessa forma ´e importante a escolha apropriada da topologia da rede para um dado problema, para evitar superajustamento (overfitting). • podem controlar caracter´ısticas redundantes, pois os pesos s˜ao automaticamente

aprendidos durante a fase de treino. Os pesos para caracter´ısticas redundantes tendem a ser muito pequenos.

• s˜ao sens´ıveis `a presen¸ca de ru´ıdo nos dados treino. Uma abordagem para controlar ru´ıdo ´e usar um conjunto de valida¸c˜ao pra determinar o erro de generaliza¸c˜ao do modelo. Outra abordagem ´e reduzir os pesos por algum fator a cada itera¸c˜ao.

• a fase de treinamento ´e um processo demorado, especialmente quando o n´umero de neurˆonios na camada escondida ´e grande. Contudo, exemplos de teste podem ser classificados rapidamente no est´agio de teste.

Referências

Documentos relacionados

A teoria do propaga- dor semicl´ assico K + sc nesta representa¸c˜ ao j´ a existe a bastante tempo [10, 35, 36], por´ em somente ap´ os a dedu¸c˜ ao do retro-propagador K − sc

10 CONTE ´ UDO Na disciplina de teoria dos conjuntos vemos como definir o conjunto dos n´ umeros naturais – bem como formalizar os conceitos conjunt´ısticos usados nas

enumera¸c˜ ao de parˆ ametros que afetam o desempenho todos os parˆ ametros que podem afetar o desempenho sele¸c˜ ao de fatores para estudo. sele¸c˜ ao de carga de trabalho

O sistema desenvolvido neste trabalho consiste em uma plataforma eletrˆ onica integrada com sensores de temperatura cutˆ anea e sensores ambientais (temperatura e luminosidade

Para avaliar a busca, inicialmente ´e usada a mesma f´ormula para eficiˆencia energ´etica do caso homogˆeneo, que ´e simplesmente a raz˜ao entre os alvos encontrados e a

A an´ alise direta de sensibilidade j´ a foi usada para estudar a influˆ encia destes parˆ ametros, em que se resolve o sistema de equa¸ c˜ oes diferenciais oriundo da abordagem

Este trabalho apresenta um Algoritmo Gen´ etico de dois n´ıveis que utiliza um coarse model global definido com base em um modelo de rede neural artificial, o qual ´ e criado a

VRS-ION-PON: VRS gerada com solu¸ c˜ ao das ambiguidades realizada de forma recur- siva, corrigindo os efeitos da troposfera pelo modelo de Hopfield e estimando os efeitos