Avaliação de Classificadores de Modulação para Sensoriamento Espectral em Rádio Cognitivo. Lilian Coelho de Freitas

(1)

INSTITUTO DE TECNOLOGIA

PROGRAMA DE P ÓS-GRADUAÇ ÃO EM ENGENHARIA ELÉTRICA

T´ITULO DO TRABALHO

Avalia¸c˜

ao de Classificadores de Modula¸c˜

ao para

Sensoriamento Espectral em R´

adio Cognitivo

NOME DO AUTOR

Lilian Coelho de Freitas

DM 31/2009

UFPA / ITEC / PPGEE Campus Universit´ario do Guam´a

Bel´em-Par´a-Brasil 2009

(2)

(3)

INSTITUTO DE TECNOLOGIA

NOME DO AUTOR

Lilian Coelho de Freitas

Avalia¸c˜

ao de Classificadores de Modula¸c˜

ao para

Sensoriamento Espectral em R´

adio Cognitivo

DM 31/2009

(4)

UNIVERSIDADE FEDERAL DO PAR ´A INSTITUTO DE TECNOLOGIA

NOME DO AUTOR

Lilian Coelho de Freitas

Avalia¸c˜

ao de Classificadores de Modula¸c˜

ao para

Sensoriamento Espectral em R´

adio Cognitivo

Disserta¸cão submetida à Banca Examinadora do Programa de Pós-gradua¸cão em Engenharia Elétrica da UFPA para a obten¸cão do Grau de Mestre em Engenharia Elétrica, ênfase em Computa¸cão Aplicada.

(5)

SENSORIAMENTO ESPECTRAL EM R ´ADIO COGNITIVO

F866a Freitas, Lilian Coelho de

Avalia¸cão de Classificadores de Modula¸cão para Sensoriamento Espectral em Rádio Cognitivo;

Lilian Coelho de Freitas; orientador, Aldebaro Barreto da Rocha Klautau J´unior. 2009.

Disserta¸cão (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Programa de Pós-Gradua¸cão em Engenharia Elétrica, Belém, 2009.

1.Radio definido por software. 2. Modula¸cão digital. 3. Processamento de sinais - técnicas digitais. 4. Radiofrequência. I. Orientador. II. T´ıtulo.

(6)

UNIVERSIDADE FEDERAL DO PAR ´A INSTITUTO DE TECNOLOGIA

AVALIAÇ ÃO DE CLASSIFICADORES DE MODULAÇ ÃO PARA

SENSORIAMENTO ESPECTRAL EM R ´ADIO COGNITIVO

AUTOR: LILIAN COELHO DE FREITAS

DISSERTAÇ ÃO DE MESTRADO SUBMETIDA A AVALIAC` ¸ ÃO DA BANCA EXAMINADORA

APROVADA PELO COLEGIADO DO PROGRAMA DE P ÓS-GRADUAÇ ÃO EM ENGENHARIA

ELÉTRICA DA UNIVERSIDADE FEDERAL DO PAR Á E JULGADA ADEQUADA PARA OBTENÇ ÃO

DO GRAU DE MESTRE EM ENGENHARIA ELÉTRICA NA ÁREA DE COMPUTAÇ ÃO APLICADA.

APROVADA EM 07/12/2009

BANCA EXAMINADORA:

...

Prof. Dr. Aldebaro Barreto da Rocha Klautau J´unior (ORIENTADOR - UFPA)

...

Prof. Dr. Jo˜ao Cris´ostomo Weyl Albuquerque Costa (CO-ORIENTADOR - UFPA)

...

Prof. Dr. Ronaldo de Freitas Zampolo (MEMBRO - UFPA)

...

Prof. Dr. Eduardo Freire Nakamura (MEMBRO EXTERNO - FUCAPI)

VISTO:

...

Prof. Dr. Marcus Vin´ıcius Alves Nunes COORDENADOR DO PPGEE/ITEC/UFPA

(7)

aos meus pais

Jo˜ao Batista e Rosilda,

aos meus irm˜aos

Leidian e Obedi,

com amor.. . .

(8)

Agradecimentos

Aos meus pais, João Batista e Rosilda, pelo apoio incondicional, pelas ora¸cões e amor demonstrado através dos conselhos.

Ao meu irm˜ao, Obedi Freitas, pelo apoio sempre que eu preciso. `

A minha querida irmã, Leidian Freitas, por ser minha maior incentivadora e amiga. Ao meu orientador prof. Aldebaro Klautau Júnior, pela amizade, orienta¸cão tão dedicada e conselhos diversos.

Ao professor e sempre orientador, Jo˜ao Cris´ostomo Costa, pelo apoio constante durante o mestrado e por sempre acreditar no meu trabalho.

Ao amigo Andr´e Mendes Calvalcante, pelo carinho, conselhos e incentivo que a mim dedica.

A todos os amigos do laboratório LEA, em especial ao Marco Sousa, pela amizade, companhia diária no laboratório e principalmente durante aos sábados; ao Gilvan Borges, pelo bom humor constante que alegra a todos a sua volta, por me ceder seu computador para rodar simula¸cões; Vin´ıcius Lima e Claudomiro Sousa pela amizade.

`

As minhas amigas Cleide Nielle, Adriana Nazar´e e Cynthia Leal que mesmo distantes se fazem sempre queridas.

Aos amigos Igor Negrão, Éder Torres e Márcio Pinheiro, que compartilharam longas horas de estudos durante as disciplinas.

As secretárias Liane Barbosa e Kelly Pereira pela assistência nos assuntos burocráticos de bolsas, viagens, etc.

Aos amigos do laboratório LAPS, em especial ao Adalbery Castro, Eduardo Medeiros, Márcio Murilo, Gustavo Guedes, Marcel Cabral, Francisco Müller, Claudomir Cardoso, Jefferson Moraes e Yomara Pires pela ajuda diversa e simpatia com que sempre me trataram.

`

A Funda¸cão de Amparo à Pesquisa do Estado do Pará (FAPESPA), por ter financiado minha bolsa durante o desenvolvimento desta pesquisa.

“Em tudo dai gra¸cas, pois essa ´e a vontade de Deus para covosco.”

(9)

Resumo

Esta disserta¸cão tem como objetivo principal a avalia¸cão de classificadores de modula¸cão digital em sensoriamento espectral de rádio cognitivo. Considerou-se nessa avalia¸cão o estudo e implementa¸cão da técnica de análise espectral c´ıclica para extra¸cão de caracter´ısticas dos sinais modulados, a qual utiliza a cicloestacionariedade contida em tais sinais. Essa técnica tem mostrado bons resultados, mesmo em ambientes com baixa rela¸cão sinal ru´ıdo. Com base nas caracter´ısticas extra´ıdas utilizando análise espectral c´ıclica, são avaliados os desempenhos de cinco técnicas de reconhecimento de padrões: na¨ıve Bayes, árvore de decisão, k-nearest neighbor, máquinas de vetores de suporte e redes neurais. Os classificadores são avaliados na classifica¸cão das modula¸cões AM, BPSK, BFSK, QPSK e 16-QAM, considerando a influência de um canal com ru´ıdo gaussiano branco e com desvanecimento por multipercurso. Outra contribui¸cão desta disserta¸cão é a disponibiliza¸cão de uma base de dados para classifica¸cão de modula¸cão, objetivando auxiliar o estudo comparativo com outras técnicas de classifica¸cão.

PALAVRAS-CHAVES: rádio cognitivo, sensoriamento espectral, classifica¸cão de modula¸cão.

(10)

Abstract

This dissertation has as main objective the evaluation of digital modulation classifiers applied to spectrum sensing in cognitive radio. The investigation included the implementation and evaluation of the cyclic spectral analysis technique to extract features from modulated signals, which uses the cyclostationary contained in such signals. This technique has shown good results even in environments with low signal to noise ratios. Based on the features extracted using cyclic spectral analysis, we estimate the performance of five pattern recognition techniques: Naive Bayes, decision tree, k -nearest neighbor, support vector machines and neural networks. The classifiers are evaluated on the task of identifying the modulations: AM, BPSK, BFSK, QPSK and 16-QAM, considering the influence of a channel with white Gaussian noise and multipath fading. Another contribution of this dissertation is to provide a database for modulation classification studies, aiming to assist the comparisons with other classification techniques and reproducing the results.

KEYWORDS: cognitive radio, spectrum sensing, modulation classification, cyclic spectral correlation.

(11)

Lista de Figuras iii Lista de Tabelas v Glossário vi 1 Introdu¸cão 1 1.1 Contexto do Trabalho . . . 1 1.2 Objetivos . . . 3 1.3 Trabalhos Relacionados . . . 3 1.4 Contribui¸cões . . . 5 1.5 Estrutura do Trabalho . . . 6

2 Classifica¸cão de Modula¸cão em Rádio Cognitivo 7 2.1 Introdu¸cão . . . 7

2.2 Classifica¸cão Automática de Modula¸cão . . . 7

2.2.1 Front end : Extra¸c˜ao de Caracter´ısticas . . . 9

2.2.2 Back end : Reconhecedor de Padr˜ao . . . 10

2.3 An´alise Espectral C´ıclica . . . 11

2.3.1 Cicloestacionariedade . . . 11

2.3.1.1 Defini¸c˜ao . . . 11

2.3.1.2 Aplica¸c˜ao . . . 11

2.3.1.3 Motiva¸c˜ao . . . 12

2.3.2 An´alise Espectral C´ıclica . . . 14

2.3.2.1 Fun¸c˜ao de Autocorrela¸c˜ao C´ıclica - FAC . . . 14

2.3.2.2 Densidade Espectral C´ıclica (DEC) ou Espectro C´ıclico . . . . 16 i

(12)

2.3.2.3 Fun¸c˜ao de Autocoerˆencia Espectral - FAE . . . 16

2.3.2.4 Implementa¸c˜ao do Algoritmo . . . 17

2.3.2.5 Perfis de Modula¸c˜oes . . . 18

2.3.2.6 Vantagens . . . 22

2.3.3 Considera¸c˜oes Pr´aticas . . . 23

2.4 Reconhecedores de Padr˜ao . . . 24

2.4.1 Na¨ıve Bayes . . . 24

2.4.2 KNN . . . 25

2.4.3 Arvore de Decis˜´ ao . . . 26

2.4.4 SVM . . . 28

2.4.5 Rede Neural Artificial . . . 29

3 Metodologia 32 3.1 Introdu¸c˜ao . . . 32

3.2 Gera¸c˜ao dos Sinais Modulados . . . 32

3.3 Modelagem do Canal . . . 33

3.3.1 Canal com AWGN . . . 33

3.3.2 Canal com Desvanecimento por Multipercurso . . . 34

3.4 Reconhecedores de Padr˜ao . . . 35

3.5 Software WEKA . . . 38

3.6 Base de Dados UFPAModulation . . . 39

4 Resultados 40 4.1 Introdu¸c˜ao . . . 40

4.2 An´alise de Complexidade Amostral . . . 41

4.3 Cen´ario I - Canal com AWGN . . . 43

4.4 Cen´ario II - Canal com Desvanecimento Multipercurso . . . 48

Conclus˜oes do Trabalho 51

Publica¸c˜oes Oriundas da Pesquisa 53

Bibliografia 58

(13)

2.1 Sensoriamento espectral. . . 8

2.2 Diagrama do processo de comunica¸cão (transmissão e recep¸cão). . . 9

2.3 Processo de classifica¸c˜ao de modula¸c˜ao. . . 9

2.4 Caracter´ısticas de sinais cicloestacion´arios. . . 12

2.5 PSD de sinais sem linhas espectrais. . . 13

2.6 Exemplo de PSD com linhas espectrais. . . 14

2.7 Espectro c´ıclico para BPSK com diferentes suaviza¸c˜oes na frequˆencia α. . . 18

2.8 Autocoerência espectral para BPSK com diferentes suaviza¸cões na frequência α. 19 2.9 Perfil para BPSK com diferentes suaviza¸cões na frequência α. . . 19

2.10 Espectro c´ıclico das modula¸c˜oes. . . 20

2.11 Autocoerˆencia espectral das modula¸c˜oes. . . 21

2.12 Perfil das modula¸c˜oes para as condi¸c˜oes adotadas. . . 22

2.13 Árvore de decisão para classificar modula¸cões em um ambiente com RSR=10 dB. 26 2.14 Árvore de decisão para classificar modula¸cões em um ambiente com RSR=-5 dB. 27 2.15 Topologia de uma Rede Neural. . . 30

3.1 Esquema da metodologia adotada para classifica¸c˜ao de modula¸c˜ao. . . 32

3.2 Efeitos do desvanecimento multipercurso e AWGN em um sinal BPSK. . . 36

3.3 Exemplo de arquivo ARFF. . . 39

4.1 Gr´afico de complexidade amostral para RSR = -10 dB. . . 41

4.2 Gr´afico de complexidade amostral para RSR = -5 dB. . . 42

4.3 Gr´afico de complexidade amostral para RSR = 5 dB. . . 42

4.4 Gr´afico de complexidade amostral para RSR = 10 dB. . . 43

4.5 Desempenho dos classificadores em um canal com AWGN. . . 44

(14)

4.6 Perfis BPSK e QPSK. . . 45 4.7 Desempenho dos classificadores quando treinados e testados com diferentes

valores de RSR. A abscissa indica a RSR adotada para o conjunto de teste. . . 47 4.8 Desempenho dos classificadores para classifica¸cão da modula¸cão 16-QAM. . . . 48 4.9 Classifica¸cão de sinais: canal com desvanecimento Rayleigh, FD=50 Hz. . . 49 4.10 Classifica¸cão de sinais: canal com desvanecimento Rayleigh, FD=150 Hz. . . . 49 4.11 Classifica¸cão de sinais: canal com desvanecimento Rayleigh, FD=300 Hz. . . . 50

(15)

1.1 Exemplos de front end e back end utilizados na literatura para classifica¸c˜ao de

modula¸c˜ao. NE indica item n˜ao especificado. . . 4

3.1 Modelo de canal COST 207. . . 35

4.1 Desempenho dos classificadores em RSR = -15 dB. . . 44

4.2 Matriz de confus˜ao do classificador J4.8 para uma RSR = -15 dB. . . 45 4.3 Desempenho dos classificadores quando testados e treinados com diferentes RSR. 46

(16)

(17)

Gloss´

ario

ALRT - Average Likelihood Ratio Test AM - Amplitude modulation

ARFF - Attribute-Relation File Format AWGN - Additive White Gaussian Noise BFSK - Binary Frequency Shift Keying BPSK - Binary Phase Shift Keying

FAC - Fun¸cão de Autocorrela¸cão C´ıclica FCC - Federal Communications Commission FD - Frequência Doppler

FFT - Fast Fourier Transform

GLRT - Generalized Likelihood Ratio Test HLRT - Hybrid Likelihood Ratio Test

IEEE - Instituto de Engenheiros Eletricistas e Eletrˆonicos KNN - K-Nearest Neighbor

MODOND - Modelo no dom´ınio da forma de onda MODSIM - Modelo no dom´ınio do s´ımbolo

PDF - Probability density function PSK - Phase Shift Keying

QAM - Quadrature Amplitude Modulation QPSK - Quadrature Phase Shift Keying RC - R´adio Cognitivo

RNA - Rede Neural Artificial RSR - Raz˜ao Sinal Ru´ıdo SVM - Support Vector Machine PSD - Power Spectral Density

WEKA - Waikato Environment for Knowledge Analysis vii

(18)

Cap´ıtulo 1

Introdu¸c˜

ao

1.1 Contexto do Trabalho

O crescimento e a diversidade das tecnologias de comunica¸cão sem fio têm tornado o espectro de frequência um recurso f´ısico cada vez mais concorrido. Grande parte dos problemas relacionados ao espectro de frequência refere-se não apenas à sua escassez f´ısica, como também às suas formas de regulamenta¸cão de acesso, que muitas vezes limitam a habilidade dos potenciais usuários de espectro de obter o acesso a tais recursos [1].

De acordo com estudos realizados pela Federal Communications Commission(FCC), a utiliza¸cão do espectro de frequência sofre uma varia¸cão entre 15% e 85%, gerando assim sub-utiliza¸cão do mesmo [2], sendo necessários novos métodos para solucionar conflitos de acesso, devido à escassez de canais livres em faixas não licenciadas.

Nesse contexto, a tecnologia de Rádio Cognitivo (RC) se apresenta como uma das solu¸cões promissoras para amenizar tais problemas, devido sua capacidade de prover alta largura de banda para usuários móveis, via arquiteturas de redes sem fio heterogêneas e técnicas de acesso dinâmico.

Através do uso do espectro de frequência de forma dinâmica, o RC permite que espectros não ocupados sejam utilizados, sem interferir nos chamados usuários primários, ou seja nos usuários licenciados para operar em determinado espectro de frequência. Dessa forma, quando um usuário primário é detectado, o RC move-se para outra lacuna no espectro ou permanece no mesmo, alterando sua potência de transmissão ou esquema de modula¸cão para evitar interferências. Assim sendo, o RC proporciona uma maior eficiência espectral, bem como a otimiza¸cão da qualidade de servi¸co.

Atualmente o Instituto de Engenheiros Eletricistas e Eletrˆonicos (IEEE) [3] est´a 1

(19)

desenvolvendo o primeiro padrão de comunica¸cão sem fio que utiliza conceitos de RC. O objetivo desse padrão, chamado IEEE 802.22 [4], é o reuso das bandas subutilizadas da faixa de TV UHF/VHF entre 54 e 862 MHz em áreas rurais.

O termo RC pode ser formalmente definido como sistemas de comunica¸cão sem fio inteligentes capazes de modificar seus parâmetros de transmissão, tais como: frequência de opera¸cão, tipo de modula¸cão, potência de transmissão, protocolos de comunica¸cão e outros, baseados em intera¸cões com o ambiente em que operam, buscando dois objetivos primários: (i) alta confiabilidade da comunica¸cão sempre e onde for necessário e (ii) utiliza¸cão eficiente do espectro de frequência [1].

Para suportar tais capacidades, o RC apresenta quatro principais m´odulos, os quais s˜ao: sensoriamento, gerenciamento, mobilidade e compartilhamento espectral. O sensoriamento espectral (spectrum sensing) tem por responsabilidade detectar lacunas no espectro1 _e

compartilhá-los, sem causar interferências em outros usuários. O gerenciamento espectral (spectrum management) provê o meio para determinar, em tempo real, a melhor banda e a melhor frequência para fornecer os servi¸cos desejados. A mobilidade espectral (spectrum mobility) é responsável por manter a comunica¸cão do usuário durante a transi¸cão para o melhor espectro. Enquanto que o compartilhamento espectral (spectrum sharing) busca prover um método de escalonamento de espectro justo entre os usuários co-existentes [5].

Especificamente no módulo de sensoriamento espectral, uma importante tarefa é a classifica¸cão de modula¸cão dos sinais que estejam utilizando o espectro de frequência em determinado momento. Tal tarefa permite identificar sinais (diferenciando-os de espectros não ocupados), além de evitar interferências. Dessa forma, um sistema de RC pode configurar seus parâmetros de transmissão, de acordo com a informa¸cão de modula¸cão de um outro sistema de RC operando em um canal adjacente, tal que a interferência não alcance um n´ıvel prejudicial.

O problema de classifica¸cão de modula¸cão tem sido estudado desde a década de 80, cujas principais motiva¸cões eram atividades de vigilância e inteligência, voltadas, principalmente, para área militar. Com o advento da tecnologia de RC, tal problema ganha um novo interesse por parte dos pesquisadores.

Nesse contexto, uma importante técnica de classifica¸cão de modula¸cão que reaparece é a técnica de análise espectral c´ıclica, a qual explora a cicloestacionariedade de sinais modulados com o objetivo de deteçcão e classifica¸cão, resultando em implementa¸cões desta técnica na forma de draft no padrão IEEE.802.22. Além da deteçcão de sinais, esta técnica também se

1_{lacunas no espectro} _{correspondem às faixas do espectro que não est˜}_{ao sendo utilizadas por nenhum usuário}

(20)

3 destaca em outras aplica¸cões como: descoberta de sinais adjacentes, importante para diminuir o problema de nó escondido em RC [5]; diferencia¸cão entre tipos de modula¸cões [6], [7], [8]; estima¸cão de parâmetros de modula¸cão [9]; identifica¸cão de um sinal de interesse sem demodular o sinal [10]; e outras.

1.2 Objetivos

Este trabalho tem como objetivo geral a avalia¸cão de distintos algoritmos para classifica¸cão de modula¸cão de sinais em sensoriamento espectral de rádio cognitivo, buscando identificar sinais que estejam usando o espectro de frequência e evitar interferências. Como objetivos espec´ıficos do trabalho destacam-se:

• Estudo e implementa¸cão da técnica de análise espectral c´ıclica para extrair caracter´ısticas de sinais digitais modulados, tendo como base a cicloestacionariedade desses sinais. Tal técnica tem apresentado bons resultados, mesmo em ambientes de baixa razão sinal ru´ıdo (RSR), conforme mostram alguns trabalhos na literatura [9], [6] e [11].

• Avaliar o desempenho de cinco técnicas clássicas de reconhecimento de padrão, aplicadas à classifica¸cão de sinais em sensoriamento espectral: Na¨ıve Bayes, Árvore de Decisão J4.8, k-nearest neighbor (KNN), support vector machine (SVM) e Redes Neurais. A escolha por tais reconhecedores foi baseada no fato deles serem os mais populares representantes de diferentes paradigmas de aprendizagem.

• Disponibilizar na Web um “benchmark” para classificadores de modula¸cão, o qual inclui as modula¸cões AM, BPSK, BFSK, QPSK e 16-QAM, considerando a influência de um canal com ru´ıdo aditivo branco e gaussiano, do inglês additive white gaussian noise (AWGN) e com desvanecimento por multipercurso. O objetivo é promover um estudo comparativo dos diferentes classificadores de modula¸cão dispon´ıveis na literatura.

1.3 Trabalhos Relacionados

As publica¸cões sobre classifica¸cão de modula¸cão de sinais, dispon´ıveis na literatura, abordam diferentes técnicas de extra¸cão de caracter´ısticas (front ends) e de reconhecimento de padrão (back ends). No entanto, há uma dificuldade em se comparar diretamente resultados obtidos com os da literatura, especificamente porque as bases de dados são tipicamente

(21)

proprietárias. Deve-se frisar que não foi encontrado nenhum trabalho que realizasse uma avalia¸cão comparativa de desempenho das técnicas propostas nesta disserta¸cão.

A Tabela 1.1 apresenta um resumo da configura¸cão de alguns trabalhos relacionados. Tabela 1.1: Exemplos de front end e back end utilizados na literatura para classifica¸cão de modula¸cão. NE indica item não especificado.

Ref. Extra¸cão de Caracter´ısticas Reconhecedor de Padrão Distor¸cão/ Ru´ıdo RSR (dB) (min:∆:max) Classes treino/ teste [12] Transformada linear da

amplitude e fase do sinal

momento conjunto AWGN e freq. de offset na portadora

0:1:5 BPSK, QPSK NE/100 [13] Especrograma tempo-frequˆencia classificador baseado

em regras

AWGN 0:2:12 ASK, FSK, PSK NE/400 [14] Transformada Wavelet da

amplitude dos sinais

limiar de decis˜ao AWGN 0:5:15 FSK, PSK, QAM NE/1000 [15] Cumulantes de alta ordem limiar de decis˜ao AWGN, freq. de

offset, erro de timing 0:5:20 BPSK, QPSK, 8PSK e pi/4 DQPSK NE/100

[16] Entropia de Renyi, mudan¸ca de freq. skewness e entropia relativa

SVM AWGN 10 dB AM, FM,

AM-FM e QPSK

200/200 [17] cumulantes de 4a_{e 6}a_ordem _ARBF _{sem referˆencia} _0:5:20 _4ASK, _2ASK,

4PSK e 16QAM 50/50 [18] Algoritmo gen´etico Classificador Bayes sem referˆencia 7:1:12 FM, SSB, FSK2,

FSK4, PSK4, 16QAM, 32QAM

1024/400

[8] Correla¸c˜ao espectral c´ıclica Rede Neural AWGN, freq. offset 10 e 15 BPSK, QPSK, FSK, MSK, AM

NE/1000

Em Shimbo [12], por exemplo, é apresentado um método de classifica¸cão de modula¸cão baseado na transformada linear da amplitude e fase do sinal recebido e do momento conjunto correspondente. Entretanto, observa-se que, neste trabalho, apenas dois tipos de modula¸cão foram considerados (BPSK e QPSK) e os testes de desempenho do método proposto consideraram uma RSR de 1 dB a 5 dB, sob um conjunto de teste de 100 amostras, sendo que o número de exemplos de treino não foi especificado. Já em Lynn [13] é implementado um algoritmo que utiliza o espectrograma tempo-frequência dos sinais e um classificador baseado em regras. Observa-se que apenas as modula¸cões ASK, FSK e PSK são classificadas em um cenário com AWGN.

Do mesmo modo, em Meng [14] é proposto um algoritmo para classifica¸cão de modula¸cão, baseado na transformada wavelet das amplitudes do sinal. Nesse caso, utiliza-se um teste de limiar para definir o tipo de modula¸cão. No entanto, as simula¸cões, também consideram somente AWGN. Já em Shen [15] o classificador utiliza cumulantes e um limiar de decisão para realizar a identifica¸cão das modula¸cões. Esse trabalho considera um cenário

(22)

5 com AWGN, portadora com frequência de offset e timing de sincroniza¸cão. As modula¸cões classificadas são BPSK, QPSK, 8PSK e π/4DQPSK. Não é especificado o número de amostras do conjunto de treino e apenas 100 amostras são utilizadas para teste. Enquanto em Kadambe [16] é implementado um classificador com base na Entropia de Renyi e o reconhecimento de padrão é realizado através de uma SVM. O desempenho do classificador implementado considera um ambiente apenas com AWGN e com 10 dB de RSR.

Em Tao [17] s˜ao utilizados cumulantes de 4a _{e 6}a _{ordem, em conjunto com as}

redes neurais com fun¸cões de ativa¸cão de base radial, do inglês adaptive radial-basis function networks (ARBF). As modula¸cões 4-ASK, 2-ASK, 4-PSK e 16-QAM são avaliadas, considerando a RSR variando de 0 dB a 20 dB, e apenas 50 amostras de treino e teste foram utilizadas. Já em Kim [18], algoritmos genéticos (para selecionar as melhores caracter´ısticas) e um classificador Bayes são utilizados na classifica¸cão. Um número maior de modula¸cões é considerado (FM, SSB, 2-FSK2, 4-FSK, 4-PSK, 16-QAM, 32-QAM) e são utilizadas 400 amostras para treino e 1024 amostras para teste, mas não faz referência a modelagem do canal utilizado. Descri¸cões mais expl´ıcitas são realizadas em Reed [8], no qual um classificador é implementado utilizando correla¸cão espectral c´ıclica. No entanto, diferente do trabalho proposto nesta disserta¸cão, utiliza apenas redes neurais para classifica¸cão. Na configura¸cão do canal, não é considerado o desvanecimento por multipercurso.

Conforme se pode observar, esses trabalhos consideram em suas avalia¸cões diferentes condi¸cões de opera¸cão (diversas RSR, ru´ıdos e distor¸cões) e diferentes modula¸cões. Dessa forma, buscou-se, nesta disserta¸cão, implementar um setup que abrangesse um número razoável de parâmetros. Além disso, um benchmark foi disponibilizado para possibilitar a compara¸cão direta dos resultados, e permitir que os mesmos sejam reproduzidos.

1.4 Contribui¸c˜

oes

As principais contribui¸cões desta disserta¸cão são: (i) a implementa¸cão da técnica de análise espectral c´ıclica e sua avalia¸cão em um cenário com AWGN e com desvanecimento por multipercurso; (ii) estudo comparativo das técnicas na¨ıve Bayes, árvore de decisão, KNN, SVM e redes neurais, aplicadas à classifica¸cão de sinais em sensoriamento espectral; (iii) disponibiliza¸cão de um “benchmark” para classificadores de modula¸cão, objetivando promover o estudo comparativo dos diferentes classificadores de modula¸cão dispon´ıveis na literatura.

(23)

1.5 Estrutura do Trabalho

Para melhor descri¸c˜ao, o restante deste trabalho est´a organizado da seguinte maneira:

• Cap´ıtulo 2 - trata do processo de classifica¸cão de modula¸cão em RC. Esse cap´ıtulo envolve a descri¸cão da técnica de extra¸cão de caracter´ısticas e dos reconhecedores de padrão utilizados;

• Cap´ıtulo 3 - descreve a metodologia adotada; • Cap´ıtulo 4 - s˜ao mostrados os resultados obtidos;

• Cap´ıtulo 5 - apresenta as conclusões. Adicionalmente, são apresentados alguns tópicos para trabalhos futuros.

(24)

Cap´ıtulo 2

Classifica¸c˜

ao de Modula¸c˜

ao em R´

adio

Cognitivo

2.1 Introdu¸c˜

ao

Neste cap´ıtulo serão abordados os principais aspectos relacionados à classifica¸cão de modula¸cão em rádio cognitivo. Dentre estes, alguns requisitos dos classificadores e principais modelos adotados na literatura. Além disso, este cap´ıtulo também abordará a técnica de classifica¸cão usando análise espectral c´ıclica e os reconhecedores de padrão: Na¨ıve Bayes, KNN, árvore de decisão J4.8, Rede Neural e SVM utilizados nesta disserta¸cão.

2.2 Classifica¸c˜

ao Autom´

atica de Modula¸c˜

ao

Em um sistema de Rádio Cognitivo (RC) a classifica¸cão de modula¸cão fica a cargo do módulo de sensoriamento espectral. Este módulo é responsável por obter as caracter´ısticas do espectro em uso, considerando as múltiplas dimensões, tais como: tempo, espa¸co, frequência e código [5]. Duas principais tarefas se destacam no módulo de sensoriamento espectral: deteçcão de lacunas no espectro (chamadas de spectrum holes) e classifica¸cão de sinais.

Na tarefa de deteçcão de lacunas no espectros, o objetivo é verificar quais espectros estão dispon´ıveis para uso. A forma mais simplista de realizar essa tarefa é usando detectores de energia [19]. Essa técnica exige a estima¸cão da potência do ru´ıdo, o que a torna suscet´ıvel às incertezas dessa estima¸cão. Para resolver esse problema alguns trabalhos sugerem a transmissão de um tom piloto por parte do transmissor para ajudar a melhorar a precisão do

(25)

detector de energia [19]. Tais detectores n˜ao podem detectar tipos de sinais, apenas determinar a presen¸ca do sinal.

Na tarefa de classifica¸cão de sinais, o objetivo é determinar que tipos de sinais estão ocupando o espectro. Isso é realizado através da caracteriza¸cão do tipo de modula¸cão, forma de onda, largura de faixa, frequência da portadora, dentre outros aspectos [20]. Desse modo, um sistema de RC pode configurar seus parâmetros de transmissão, de acordo com as informa¸cões coletadas do canal (também chamado espectro de frequência), tal que a interferência entre usuários não alcance um n´ıvel prejudicial. Portanto, a fun¸cão do sensoriamento espectral permite ao RC adaptar-se ao ambiente de opera¸cão. A Fig. 2.1 ilustra este procedimento.

C a n a l e s c o l h a d a m o d u l a ç ã o e o u t r o s p a r â m e t r o s d e t r a n s m i s s ã o c o m b a s e n a q u a l i d a d e d o s i n a l R á d i o C o g n i t i v o s e n s o r i a m e n t o e s p e c t r a l i n f o r m a ç õ e s d o c a n a l

Figura 2.1: Sensoriamento espectral.

Vale destacar que a prioridade do canal é sempre dos usuários licenciados para aquele determinado espectro. Dessa forma, se as altera¸cões dos parâmetros de transmissão do RC não forem suficientes para diminuir o n´ıvel de interferência com outros usuários, o RC deve trocar de faixa no espectro.

Nesse processo de adapta¸cão do RC, a classifica¸cão de modula¸cão se torna relevante. Quando o RC sabe qual modula¸cão está ocupando uma faixa do espectro, ele pode mais efetivamente evitar interferência com a mesma ou tomar decisões relacionadas de maneira mais acertada.

A classifica¸cão de modula¸cão ocorre tipicamente entre a deteçcão do sinal e a demodula¸cão, conforme mostrado na Fig. 2.2. Nesse processo, o desafio da classifica¸cão de modula¸cão é abstrair a interferência do canal, ru´ıdos, defasagem e outras transforma¸cões sofridas pelo sinal modulado durante a sua transmissão, as quais podem vir a descaracterizá-lo. O projeto de um classificador de modula¸cão envolve o pré-processamento e a sele¸cão do algoritmo de classifica¸cão. O bloco de pré-processamento pode incluir a estima¸cão da frequência da portadora, per´ıodo do s´ımbolo, potência do sinal, equaliza¸cão ou outros, dependendo do algoritmo de classifica¸cão a ser escolhido. Ademais, alguns algoritmos de classifica¸cão são mais sens´ıveis aos parâmetros desconhecidos, sendo necessário um n´ıvel maior de precisão na estima¸cão destes, já outros algoritmos são capazes de realizar a classifica¸cão sem nenhum conhecimento a priori do sinal.

(26)

9 S í m b o l o s d e e n t r a d a C a n a l M o d u l a d o r + + P r é - P r o c e s s a d o r D e m o d u l a d o r C l a s s i f i c a ç ã o d e m o d u l a ç ã o r u í d o d o r e c e p t o r I n t e r f e r ê n c i a S í m b o l o s d e s a í d a R e c e p t o r F o r m a t o d e m o d u l a ç ã o

Figura 2.2: Diagrama do processo de comunica¸cão (transmissão e recep¸cão).

Devido à caracter´ıstica dinâmica de utiliza¸cão do espectro de frequência, o classificador de modula¸cão deve identificar corretamente o formato de modula¸cão do sinal em tempo real. Para tanto, deve utilizar um curto intervalo de observa¸cão e apresentar baixo custo computacional. Além disso, deve ser capaz de reconhecer os formatos de modula¸cão mesmo em ambientes com variadas condi¸cões de propaga¸cão.

Como mencionado, o processo de classifica¸cão de modula¸cão é constitu´ıdo por dois blocos, conforme mostrado na Fig. 2.3: um bloco de extra¸cão de caracter´ısticas e um de reconhecedor de padrão. O primeiro bloco (front end ) seleciona a informa¸cão relevante para a decisão, transformando os sinais recebidos (após passar pelo canal) em um conjunto chamado de caracter´ısticas. As caracter´ısticas são utilizadas pelo reconhecedor de padrão (back end ) para determinar a classe que melhor descreve a modula¸cão do sinal.

E x t r a ç ã o d e C a r a c t e r í s t i c a s R e c o n h e c e d o r d e p a d r õ e s S i n a l M o d u l a d o C a n a l C l a s s i f i c a ç ã o d e M o d u l a ç ã o s i n a l + d i s t o r ç ã o + r u í d o c a r a c t e r í s t i c a s _{c l a s s e}

Figura 2.3: Processo de classifica¸c˜ao de modula¸c˜ao.

2.2.1 Front end

: Extra¸c˜

ao de Caracter´ısticas

Os estudos desenvolvidos e apresentados na literatura se baseiam em dois modelos de front end para algoritmos de classifica¸c˜ao, s˜ao eles: modelos no dom´ınio do s´ımbolo (MODSIM) e modelos no dom´ınio da forma de onda (MODOND).

No modelo MODSIM, assume-se que o classificador observa os s´ımbolos recebidos (por exemplo, oriundos de uma constela¸c˜ao QAM) e n˜ao as amostras da forma de onda do sinal.

(27)

Uma das principais abordagens ao se usar o modelo MODSIM é baseada em testes com razões de verossimilhan¸ca [21]. Quando as fun¸cões de verossimilhan¸ca do sinal recebido são corretas, a solu¸cão é ótima, visto que ela minimiza a probabilidade de classifica¸cão falsa [22]. No entanto, a solu¸cão ótima requer uma maior complexidade computacional, podendo ser mais vantajoso o uso de classificadores sub-ótimos. Três principais técnicas utilizando este modelo, foram propostas na literatura: teste médio da rela¸cão de verossimilhan¸ca (ALRT) [21, 23, 24], teste generalizado da rela¸cão de verossimilhan¸ca (GLRT) [25, 26, 27] e teste h´ıbrido da rela¸cão de verossimilhan¸ca (HLRT) [22, 26, 28].

No modelo MODOND são utilizadas as caracter´ısticas da forma de onda do sinal. Exemplos dessas caracter´ısticas são o momento conjunto da amplitude e fase do sinal [12], espectrograma tempo-frequência [13], transformada wavelet da amplitude do sinal [14], entropia [16], cumulantes de alta ordem [15], caracter´ısticas espectrais [6, 29] dentre outras.

Nesta disserta¸cão será implementada a técnica de análise espectral c´ıclica, baseada no modelo MODOND. A principal vantagem dessa técnica é sua capacidade de diferenciar a energia do ru´ıdo da energia do sinal modulado. Isso acontece pelo fato de que o ru´ıdo é um sinal estacionário no sentido amplo com nenhuma correla¸cão, enquanto sinais cicloestacionários apresentam correla¸cão espectral devido à redundância imposta pela periodicidade do sinal [5]. A Se¸cão 2.3 é dedicada a detalhar esta técnica.

2.2.2 Back end

: Reconhecedor de Padr˜

ao

Os reconhecedores de padrão constituem uma área de estudo bastante desenvolvida. A concep¸cão do reconhecedor de padrão para classifica¸cão de modula¸cão pode ser formulada de forma abstrata e independente da natureza do sinal recebido.

Dentre as técnicas de reconhecimento de padrão aplicadas em classifica¸cão de modula¸cão pode-se citar os trabalhos que utilizam momento conjunto [12], classificador baseado em regras [13], limiar de decisão [14] e [15], SVM [16], ARBF (Adaptive Radial-Basis Function Networks) [17], Classificador Bayes [18], Rede Neurais [8]. No entanto, todos esses são avaliados sobre diferentes condi¸cões de opera¸cão (diversas RSR e distor¸cões) e utilizam diferentes parâmetros de configura¸cão do sinal modulado. Dessa forma, mostra-se dif´ıcil comparar diretamente os resultados, ou mesmo reproduz´ı-los.

Nesta disserta¸cão, cinco técnicas de reconhecimento de padrão foram avaliadas, em conjunto com a técnica de análise espectral c´ıclica, são elas: na¨ıve Bayes, KNN, árvore de decisão, SVM e Redes Neurais. A Se¸cão 2.4 detalha cada uma destas técnicas.

(28)

11

2.3 An´

alise Espectral C´ıclica

Antes de descrever a técnica de análise espectral c´ıclica, se faz necessário explicar o conceito de cicloestacionariedade.

2.3.1 Cicloestacionariedade

2.3.1.1 Defini¸c˜ao

Um sinal é cicloestacionário se suas caracter´ısticas estat´ısticas variam periodicamente com o tempo. Exemplos dessas caracter´ısticas são: média, autocorrela¸cão, fun¸cão densidade de probabilidade, momento de ordem n, cumulantes de ordem n ou outras [30].

Para melhor compreensão do conceito de cicloestacionariedade, pode-se fazer uma rela¸cão com sinais estacionários, cujas caracter´ısticas estat´ısticas são invariantes com o tempo. Dessa forma, pode-se definir sinais cicloestacionários como sinais não-estacionários que apresentam estat´ısticas que variam periodicamente (ciclicamente) com o tempo.

Uma consequência da periodicidade contida nos sinais cicloestacionários é a correla¸cão espectral, a qual corresponde à existência de subbandas em frequências distintas com conteúdo que são correlacionados. Outra consequência, é o surgimento de componentes sinusoidais aditivas com potência finita (denominadas de linhas espectrais), as quais são geradas após transforma¸cões não-lineares quadráticas ou de ordem maior, conforme mostrado em [31].

A Fig. 2.4 sumariza as caracter´ısticas dos sinais cicloestacion´arios.

S i n a i s C i c l o e s t a c i o n a r i o s M o m e n t o s o u C u m u l a n t e s P e r i ó d i c o s L i n h a s e s p e c t r a i s s u b b a n d a s c o r r e l a c i o n a d a s P r o p r i e d a d e s n o D o m í n i o d a F r e q u ê n c i a P r o p r i e d a d e s P r o b a b i l í s t i c a s P r o p r i e d a d e s n o D o m í n i o d o T e m p o g e r a d a s d e o p e r a ç õ e s n ã o - l i n e a r e s

(29)

2.3.1.2 Aplica¸c˜ao

A teoria de cicloestacionariedade é relevante para diversas áreas do conhecimento, tais como telecomunica¸cões, mecânica, econometria1 _{e outras, apresentando diversas aplica¸cões}

em cada uma dessas, conforme evidenciado em Gardner [30]. Nesta disserta¸cão, o estudo de cicloestacionariedade será voltado para a área de telecomunica¸cões.

Em telecomunica¸cões, a cicloestacionariedade pode surgir devido à jun¸cão de mensagens de sinais estacionários com portadoras sinusoidais, trem de pulsos, códigos de repeti¸cão, ou pode ocorrer, também, como resultado de outros processos usados na gera¸cão de sinais, tais como: amostragem e multiplexa¸cão [9].

A cicloestacionariedade pode ser explorada para aumentar a precisão e confiabilidade da informa¸cão provida por um conjunto de dados, tal como medidas de sinais corrompidos. Tais informa¸cões incluem:

• decisão sobre a presen¸ca de um sinal modulado, ou sobre o número de sinais modulados. • classifica¸cão de modula¸cão de múltiplos sinais transmitidos em um ambiente com ru´ıdo. • estimativa de parâmetros como fase da portadora, número de s´ımbolos e dire¸cão de

chegada de um sinal corrompido com ru´ıdo e interferˆencia.

Em Gardner [31] é apresentado um consistente estudo sobre a teoria e aplica¸cão de sinais cicloestacionários.

2.3.1.3 Motiva¸c˜ao

Antes de aplicar cicloestacionariedade ao problema de classifica¸cão de modula¸cão, será mostrado um exemplo de transforma¸cão não-linear em um sinal x(t), objetivando mostrar o aparecimento de linhas espectrais. Essas linhas espectrais evidenciam a periodicidade escondida em determinados sinais. Tornar essa periodicidade expl´ıcita pode facilitar explorá-la para fins de caracterizar o sinal.

Suponha que a(t) seja um sinal aleatório passa-baixa com densidade espectral de potência (PSD) chamada de Sa(f ), a qual não contém nenhuma linha espectral, como mostrado

na Fig. 2.5(a). Se a(t) ´e usado para modular uma onda sinusoidal, ´e obtido um sinal modulado em amplitude (AM):

(30)

13

x(t) = a(t) cos (2πf0t) (2.1)

cuja PSD Sx(f ) ´e dada pela Eq. 2.2 e mostrada na Fig 2.5(b).

Sx(f ) = 1 4Sa(f + f0) + 1 4Sa(f − f0). (2.2) sendo f0 = 2, 4 GHz. −8 −6 −4 −2 0 2 4 6 8 −180 −170 −160 −150 −140 −130 −120 −110 −100 Frequência (GHz) Potência/frequência (dB/Hz) (a) PSD a(t) −8 −6 −4 −2 0 2 4 6 8 −180 −170 −160 −150 −140 −130 −120 −110 −100 Frequência (GHz) Powência/frequência (dB/Hz) (b) PSD x(t)

Figura 2.5: PSD de sinais sem linhas espectrais.

Embora a PSD seja centrada em f = f0 e f = −f0, n˜ao h´a nenhuma linha espectral

em Sx(f ) para f = 0. Fazendo x2(t) para obter:

y(t) = x2(t) = a2(t) cos2(2πf0t) =

1

2[b(t) + b(t) cos (4πf0t)] (2.3) onde

b(t) = a2_(t)

observa-se que a PSD de b(t) cont´em linha espectrais em f = 0, como mostrado na Fig. 2.6(a). A PSD de y(t) ´e dada pela Eq. 2.4 e mostrada na Fig. 2.6(b).

Sy(f ) = 1 4[Sb(f ) + 1 4Sb(f + 2f0) + 1 4Sb(f − 2f0)]. (2.4) Esse exemplo permite ilustrar o aparecimento da periodicidade escondida em sinais ao se realizar transforma¸cões não-lineares nestes. No exemplo acima, calcular x2(t) foi suficiente para o aparecimento de linhas espectrais. No entanto alguns sinais necessitam de outras transforma¸cões não-lineares, tais como atraso e multiplica¸cão, para o aparecimento de linhas espectrais, conforme demonstrado em [32]. A periodicidade exibida no sinal x(t) do exemplo acima, é chamada de 1a _{ordem, dado que as linhas espectrais são manifestadas na fun¸cão}

(31)

−8 −6 −4 −2 0 2 4 6 8 −180 −170 −160 −150 −140 −130 −120 −110 −100 Frequência (GHz) Potência/frequência (dB/Hz) (a) PSD de b(t) −8 −6 −4 −2 0 2 4 6 8 −180 −170 −160 −150 −140 −130 −120 −110 −100 Frequência (GHz) Potência/frequência (dB/Hz) (b) PSD de y(t)

Figura 2.6: Exemplo de PSD com linhas espectrais.

2.3.2 An´

alise Espectral C´ıclica

Nesta disserta¸cão será adotado o termo análise espectral c´ıclica para descrever o estudo de três importantes fun¸cões matemáticas utilizadas para caracterizar sinais modulados com base na cicloestacionariedade, são elas: fun¸cão de autocorrela¸cão c´ıclica (cyclic autocorrelation function), espectro c´ıclico ou densidade espectral c´ıclica (cyclic spectral density) e fun¸cão de autocoerência espectral (spectral autocoherence function). Tais fun¸cões se baseiam em sinais cicloestacionários de 2a _{ordem e são melhor detalhadas em [30]. As subse¸cões seguintes serão}

destinadas aos principais aspectos relacionados com a an´alise espectral implementada.

2.3.2.1 Fun¸c˜ao de Autocorrela¸c˜ao C´ıclica - FAC

A defini¸cão de fun¸cão de autocorrela¸cão c´ıclica parte da defini¸cão de autocorrela¸cão de sinais cicloestacionários de 2a _{ordem: um sinal x(t) é definido como cicloestacionário de}

2a _{ordem (no sentido amplo) se suas fun¸cões média e autocorrela¸cão são periódicas com um}

per´ıodo T , isto ´e

Mx(t + T ) = Mx(t)

Rx(t + T, u + T ) = Rx(t, u)

para todo t e u. Por conveniência a fun¸cão de autocorrela¸cão pode ser reescrita como:

Rx(t + T, u + T ) = Rx(t + τ /2, t − τ/2),

então Rx(t + τ /2, t − τ/2) é uma fun¸cão de duas variáveis independentes t e τ, sendo periódica

em t com per´ıodo T para cada valor de τ . Assim é poss´ıvel expressar a representa¸cão da série de Fourier para Rx como:

(32)

15

Rx(t + τ /2, t − τ/2) =

X

α

Rα_x(τ )ei2παt (2.5)

Os coeficientes da s´erie de Fourier {Rα

x} podem ser definidos como:

Rα_x(τ )=∆ 1 T Z T /2 −T /2 Rx(t + τ 2, t − τ 2)e −i2παt dt, (2.6)

sendo α a frequência c´ıclica, a qual percorre todos os múltiplos inteiros da frequência fundamental 1/T . Esta defini¸cão de Rα

x(τ ) considera uma ´unica periodicidade em 1/T . Para

o caso de se analisar múltiplas periodicidades, deve-se fazer α percorrer todos os múltiplos inteiros de todas as frequências fundamentais, por exemplo “1/T1, 1/T2, 1/T3, . . .”. Assim a

defini¸c˜ao de Rα

x pode ser generalizada para:

Rα_x(τ )= lim∆ ∆t→∞ 1 ∆t Z ∆t/2 −∆t/2 Rx(t + τ 2, t − τ 2)e −i2παt dt, (2.7)

onde ∆t é o intervalo de tempo e Rαx(τ ) representa a fun¸cão de autocorrela¸cão c´ıclica (FAC).

Dessa forma, um processo ´e dito exibir cicloestacionariedade se existir uma frequˆencia c´ıclica α para o qual a FAC, definida na Eq. 2.7, seja diferente de zero.

Outra forma de definir a FAC é a partir do dom´ınio da frequência. Por exemplo, considere duas versões de X(t) deslocadas na frequência:

V (t) = X(t)e(−iπαt)

U (t) = X(t)e(+iπαt) (2.8)

A autocorrela¸cão de U e V podem ser expressas com base na Eq. 2.7, através do valor esperado [30] como: RU(τ )= lim∆ ∆t→∞ 1 ∆t ∆t/2 Z −∆t/2 EnU³t + τ 2 ´ U³_{t −} τ 2 ó dt ≡ RX(τ )e−iπατ de maneira equivalente: RV(τ ) ≡ RX(τ )e+iπατ.

Calculando a correla¸cão cruzada de V (t) e U (t), obtém-se a fun¸cão de autocorrela¸cão c´ıclica da seguinte forma:

RU V(τ )= lim∆ ∆t→∞ 1 ∆t ∆t/2 Z −∆t/2 EnU³t + τ 2 ´ V ³_{t −} τ 2 ´o dt ≡ RαX(τ ) (2.9)

(33)

Dessa forma, a fun¸cão de autocorrela¸cão c´ıclica de um sinal X é simplesmente a correla¸cão cruzada entre versões de X deslocadas na frequência. Isto significa que um sinal exibe cicloestacionariedade no sentido amplo se e somente se existir correla¸cão entre versões deslocadas do sinal. Além disso, pode-se concluir que um sinal pode ser estacionário somente se não existir qualquer correla¸cão entre as versões deslocadas do sinal, ou seja Rα

X(τ ) ≡ 0 para

todo α 6= 0.

2.3.2.2 Densidade Espectral C´ıclica (DEC) ou Espectro C´ıclico A densidade espectral de V e U s˜ao definidas com base na Eq. 2.8 como:

SU(f ) = SX(f + α/2), (2.10)

SV(f ) = SX(f − α/2), (2.11)

e o espectro cruzado da Eq. 2.9 ´e dado por:

SU V(f ) =

Z ∞ −∞

Rα_X(τ )e−i2πf τ

dτ = S∆ _Xα(f ), (2.12) o qual ´e chamado de densidade espectral c´ıclica.

2.3.2.3 Fun¸c˜ao de Autocoerˆencia Espectral - FAE

Das Eq. 2.10, 2.11 e 2.12 é poss´ıvel definir a fun¸cão de coerência espectral, de acordo com [30] e [33]: ρU V(f )=∆ √SU V(f ) SU(f )SV(f ) = √ SXα(f ) SX(f +α/2)SX(f −α/2) ∆ = ρα X(f ) (2.13)

A fun¸cão de autocoerência espectral fornece uma medida normalizada da correla¸cão cruzada entre as componentes do sinal em f − α/2 e f + α/2. A magnitude da fun¸cão de autocoerência espectral varia entre 0 e 1, sendo invariante a transforma¸cões lineares dos sinais recebidos.

2.3.2.4 Implementa¸c˜ao do Algoritmo

O processo de extra¸cão de caracter´ısticas implementado nesta disserta¸cão foi baseado na fun¸cão perfil de cada modula¸cão. O algoritmo desenvolvido corresponde à uma adapta¸cão do algoritmo definido em [34]. A diferen¸ca é que em [34] a decisão de classifica¸cão é realizada com

(34)

17 base na fun¸cão de autocoerência espectral, enquanto que no algoritmo implementado nesta disserta¸cão a classifica¸cão teve como base o perfil c´ıclico. Com essa adapta¸cão diminui-se o custo computacional, pois o perfil c´ıclico é uma variável bidimensional, enquanto que a fun¸cão de autocoerência é tridimensional. Os vetores de perfis foram salvos em arquivos no formato do software WEKA e foram as entradas para os reconhecedores de padrão realizarem a classifica¸cão de modula¸cão.

1. Divide-se a sequˆencia de amostras de entrada em L blocos, com cada bloco contendo N amostras;

2. Calcula-se a Transformada Discreta de Fourier das N amostras em cada bloco l, xl[n] = 0, 1, . . . , N − 1, l = 0, 1, . . . , L − 1 : Xl[k] = N −1 P n=0 xl[n] exp(−i2πkn_N), k = 0, 1, . . . , N − 1;

3. Calcula-se a fun¸c˜ao de autocorrela¸c˜ao c´ıclica: Tα l [k] = N1Xl[k + α 2]X ∗ l[k − α2], k = 0, 1, . . . , N − 1, l = 0, 1, . . . , L − 1;

4. Calcula-se o espectro c´ıclico, com base no resultado do passo (3) sobre todos os blocos: Sα X[k] = L1 L−1 P l=0 Tα l [k], k = 0, 1, . . . , N − 1; 5. Calcula-se a fun¸c˜ao de autocoerˆencia espectral:

ρα_X[k] = N −1 X k=0 Sα X[k] pS0 X[k + α/2]SX0 [k − α/2] (2.14)

6. Calcula-se a fun¸c˜ao perfil das frequˆencias c´ıclicas, proposta em [7]: I(α)= max∆

k |ρ α

X[k]|. (2.15)

2.3.2.5 Perfis de Modula¸c˜oes

No processo de extra¸cão de caracter´ısticas, um importante fator que pode influenciar nas caracter´ısticas das modula¸cões diz respeito ao processo de suaviza¸cão do espectro (smoothing) ao longo das frequências f e α. Esse processo de suaviza¸cão impacta nas

(35)

caracter´ısticas espectrais dos sinais modulados, de tal forma que algumas caracter´ısticas das modula¸c˜oes podem n˜ao se manifestar no espectro c´ıclico do sinal.

Para exemplificar a influência da suaviza¸cão nas caracter´ısticas das modula¸cões, considere que dois sinais modulados com BPSK têm seus espectros c´ıclicos filtrados por um filtro passa-baixa de ordem 50, com frequências de corte Wn = 0.1 Hz e Wn = 0.5 Hz,

respectivamente, ao longo da frequˆencia c´ıclica α. Deve-se destacar que esses valores de Wn

estão normalizados. As Figs. 2.7 - Fig. 2.9 mostram a diferen¸ca nas caracter´ısticas do espectro c´ıclico, fun¸cão de autocoerência2 _{e perfil de ambos os sinais.}

α

(a) Wn=0,1

α

(b) Wn=0,5

Figura 2.7: Espectro c´ıclico para BPSK com diferentes suaviza¸c˜oes na frequˆencia α.

α

(a) Wn=0,1

α

(b) Wn=0,5

Figura 2.8: Autocoerência espectral para BPSK com diferentes suaviza¸cões na frequência α.

(36)

19 0 1 2 3 4 5 6 7 8 x 109 0 1 2 3 4 5 6 7 X: 5.875e+009 Y: 2.547 X: 3.813e+009 Y: 6.57 X: 1.125e+009 Y: 2.686 α (Hz) (a) Wn=0,1 0 1 2 3 4 5 6 7 8 x 109 0 1 2 3 4 5 6 7 X: 3.938e+009 Y: 1.118 X: 5.875e+009 Y: 0.5552 X: 6.25e+007 Y: 1.105 α (Hz) (b) Wn=0,5

Figura 2.9: Perfil para BPSK com diferentes suaviza¸c˜oes na frequˆencia α.

Muitos trabalhos dispon´ıveis na literatura mostram gráficos do espectro c´ıclico para várias modula¸cões, como em [7, 8, 11]. No entanto, nem todos os parâmetros para gerar tais gráficos são dispon´ıveis, dificultando sua reprodu¸cão. Nesta disserta¸cão, não foi utilizado nenhum processamento inicial para extrair as caracter´ısticas de modula¸cões de forma a sintonizar com os resultados mostrados em outros trabalhos. As poss´ıveis diferen¸cas com outros resultados podem decorrer do uso de diferentes parâmetros de configura¸cão.

As Fig. 2.10- 2.12 apresentam exemplos de gráficos de espectro c´ıclico, fun¸cão de autocoerência e perfil das modula¸cões AM, BPSK, QPSK, BFSK e 16-QAM. Estes foram gerados com RSR = 10 dB, frequência da portadora de 2,4 GHz, frequência de amostragem de 8 GHz, FFT com 256 amostras, 2.560 s´ımbolos para cada modula¸cão, considerou-se uma filtragem ao longo das frequências f e α, com um filtro de ordem 50 e Wn = 0,2 e Wn = 0,1,

(37)

α

(a) Espectro c´ıclico - AM

α (b) Espectro c´ıclico - BPSK α (c) Espectro c´ıclico - QPSK α (d) Espectro c´ıclico - BFSK α

(e) Espectro c´ıclico - 16-QAM

(38)

21

α

(a) Autocoerˆencia espectral - AM

α (b) Autocoerência espectral - BPSK α (c) Autocoerência espectral - QPSK α (d) Autocoerência espectral - BFSK α

(e) Autocoerˆencia espectral - 16-QAM

(39)

0 2 4 6 8 10 x 109 0 2 4 6 8 10 12 14 16 18 20 α (Hz) I (α) (a) Perfil - AM 0 1 2 3 4 5 6 7 8 x 109 0 2 4 6 8 10 12 14 16 18 20 α (Hz) I (α) (b) Perfil - BPSK 0 1 2 3 4 5 6 7 8 x 109 0 2 4 6 8 10 12 14 16 18 20 α (Hz) I (α) (c) Perfil - QPSK 0 1 2 3 4 5 6 7 8 x 109 0 2 4 6 8 10 12 14 16 18 20 α (Hz) I (α) (d) Perfil - BFSK 0 1 2 3 4 5 6 7 8 x 109 0 2 4 6 8 10 12 14 16 18 20 α (Hz) I (α)

(e) Perfil - 16-QAM

Figura 2.12: Perfil das modula¸c˜oes para as condi¸c˜oes adotadas.

2.3.2.6 Vantagens

Gardner [9] foi um dos pioneiros a demonstrar o poder da análise de sinais cicloestacionários quando aplicados em sistemas de comunica¸cão sem fio. Após seus trabalhos, a análise espectral c´ıclica tem sido extensivamente utilizada como técnica para alcan¸car um

(40)

23 enorme leque de aplica¸cões, incluindo deteçcão de sinais [10], classifica¸cão [35], sincroniza¸cão [6] e equaliza¸cão [32].

Há inúmeras vantagens provenientes da utiliza¸cão da análise espectral c´ıclica para análise de sinais cicloestacionários em rela¸cão às abordagens radiométricas (as quais se baseiam na medida de energia do sinal recebido). Dentre estas vantagens estão:

• Reduzida sensibilidade a ru´ıdo, comprovada pelo bom desempenho da t´ecnica de an´alise espectral c´ıclica em ambientes com baixa RSR [8, 31, 36].

• Reduzida sensibilidade a sinais interferentes, devido ao fato de que a an´alise espectral c´ıclica permite diferenciar grande parte dos sinais, conforme [6].

• Habilidade para extrair parâmetros de sinais únicos, tais como frequência da portadora, taxa de s´ımbolos e outros [7, 31].

2.3.3 Considera¸c˜

oes Pr´

aticas

Como informado, a técnica de análise espectral c´ıclica tem se mostrado eficiente em diversos trabalhos dispon´ıveis na literatura ([6, 7, 8, 32, 34]). No entanto, existem alguns desafios a serem considerados quanto ao seu uso como ferramenta para deteçcão e classifica¸cão de sinais. Alguns desses desafios são resumidos a seguir:

• Na prática, alguns sinais não são verdadeiramente cicloestacionários, devido à varia¸cão temporal dos sistemas de comunica¸cão, ocasionado pela imprecisão dos seus clocks. No entanto, se for considerado um bloco finito no tempo é poss´ıvel verificar a cicloestacionariedade.

• A natureza peri´odica dos sinais modulados, pode ser diminu´ıda pelas distor¸c˜oes no sinal, como por exemplo, efeito Doppler e desvanecimento.

• Nem todos os sinais podem ser classificados utilizando cicloestacionariedade de 2a_ordem,

pois as caracter´ısticas c´ıclicas de algumas modula¸cões podem apresentar ambiguidades. Uma alternativa é a utiliza¸cão de cumulantes c´ıclicos, o que exige um conjunto maior de dados e uma maior complexidade do sistema.

• O c´alculo da superf´ıcie tridimensional do espectro c´ıclico Sα

x(f ), necess´ario para cada

sinal modulado x(t) é computacionalmente intenso. Contudo, na prática, a região de cálculo pode ser reduzida, se algumas suposi¸cões sobre a banda de opera¸cão forem assumidas.

(41)

2.4 Reconhecedores de Padr˜

ao

Nesta Se¸cão será apresentada uma breve descri¸cão das técnicas de reconhecimento de padrão: na¨ıve Bayes, KNN, árvore de decisão, SVM e Redes Neurais.

2.4.1 Na¨ıve Bayes

O reconhecedor de padrão Na¨ıve Bayes pode ser visto como uma rede Bayesiana simples [37], na qual todos os atributos são condicionalmente independentes, dado o valor da classe y. Segundo [38], a suposi¸cão de independência condicional pode ser formalmente definida, como: P (X|Y = y) = d Y i=1 P (Xi|Y = y) (2.16)

onde cada conjunto (ou vetor) de atributos X = [X1, X2, ..., Xd] consiste de d atributos Xi.

Com a suposi¸cão de independência condicional, ao invés de se estimar a probabilidade condicional de X no espa¸co de dimensão d, tem-se apenas que estimar a probabilidade condicional de cada Xi, dado Y . A última abordagem é mais prática, pois não requer um

grande conjunto de treino para obter uma boa estimativa da probabilidade.

Para classificar um conjunto de teste, o Na¨ıve Bayes calcula a probabilidade `a posteriori para cada classe Y :

P (Y |X) = P (Y ) Qd

i=1P (Xi|Y )

P (X) , (2.17)

dado que P (X) n˜ao depende de Y , ´e suficiente escolher a classe que maximiza o numerador P (Y )Qd

i=1P (Xi|Y ).

Essa suposi¸cão de independência condicional reduz a complexidade da aprendizagem, mas pode se tornar restritiva [37]. Embora considerado um método simplista de classifica¸cão, em muitas aplica¸cões o Na¨ıve Bayes apresenta um bom desempenho [38] e o mesmo é útil para fins de compara¸cões [39].

O reconhecedor Na¨ıve Bayes geralmente apresenta as seguintes caracter´ısticas:

• ´e robusto para pontos de ru´ıdo isolados, tendo em vista que tais pontos s˜ao calculados separados (“averaged out”) ao se estimar a probabilidade condicional dos dados.

(42)

25 • é robusto para atributos irrelevantes. Se Xi é um atributo irrelevante, então P (Xi|Y ) se

torna quase uniformemente distribu´ıdo. A probabilidade condicional para Xi n˜ao tem

nenhum impacto no c´alculo global da probabilidade `a posteriori.

• atributos correlacionados podem degradar o desempenho do Na¨ıve Bayes, pois a suposi¸cão de independência condicional já não é adequada para tais atributos.

2.4.2 KNN

Os reconhecedores de padrão que simplesmente armazenam o conjunto de treino são chamados de “lazy” ou IBL (instance based learning) [40]. O KNN (k-nearest neighbor ) [40] é um método dessa fam´ılia e armazena exemplos na memória como pontos no espa¸co n-dimensional definido pelos n atributos que descrevem os exemplos. Para tais métodos, uma das decisões importantes é qual métrica adotar para medir a similaridade entre os exemplos. O KNN usa a técnica do “vizinho mais próximo” ou “nearest neighbor ” para classificar novos exemplos.

O reconhecedor KNN apresenta as seguintes caracter´ısticas:

• usa exemplos de treino espec´ıficos para fazer predi¸cões sem ter que manter uma abstra¸cão ou modelo derivado dos dados. Algoritmos IBL requerem uma medida de proximidade para determinar a similaridade ou distância entre exemplos e uma fun¸cão de classifica¸cão que retorne a classe predita de um exemplo de teste baseado na proximidade a outros exemplos.

• não requer a constru¸cão de um modelo, no entanto classifica¸cão de um exemplo de teste pode ser custosa, pois é necessário calcular os valores de proximidade individualmente entre o teste e os exemplos de treino. Ao contrário dos algoritmos ditos “eager learners” que frequentemente gastam mais recursos computacionais para construir o modelo. No caso dos “eager learners”, uma vez que o modelo esteja constru´ıdo, a classifica¸cão de um exemplo de teste é rápida.

• faz predi¸cão baseada em informa¸cões locais, enquanto que os classificadores como árvore de decisão e os baseados em regras tentam encontrar um modelo global que se ajuste a todo o espa¸co de entrada. Como a decisão de classifica¸cão é feita localmente, o KNN (com valores pequenos de k) são bastante suscept´ıveis a ru´ıdo.

• o limite de decisão de um KNN tem alta variabilidade, pois ele depende da composi¸cão dos exemplos de treino. Aumentando o número k de vizinhos próximos pode-se reduzir tal variabilidade.

(43)

• podem produzir predi¸c˜oes erradas, a menos que seja escolhida a medida de proximidade apropriada.

2.4.3 Arvore de Decis˜

´

ao

Uma árvore de decisão é um modelo de aprendizagem de máquina preditivo [40], que realiza a decisão de uma nova amostra baseada no valor de seus vários atributos. Consiste em uma estrutura onde os nós não-terminais representam testes de um ou mais atributos. As ramifica¸cões desses nós são os poss´ıveis valores que esses atributos podem assumir nas amostras observadas e os nós terminais ou folhas refletem o resultado da classifica¸cão. Nessa estrutura o nó ra´ız é aquele considerado pelo algoritmo classificado como o atributo mais importante para determinar o tipo de classe.

Para classificar um novo item, é criada uma árvore de decisão baseada nos valores dos atributos do conjunto de treino. Procura-se um atributo que separe as várias amostras claramente [40]. Por exemplo, o atributo considerado como o que melhor distingue uma amostra pode ser o de maior ganho de informa¸cão. O processo é repetido iterativamente. A Fig. 2.13 mostra os critérios utilizados para a classifica¸cão das modula¸cões AM, BPSK, QPSK, BFSK e 16-QAM, em um ambiente com AWGN e uma RSR = 10 dB.

Figura 2.13: Árvore de decisão para classificar modula¸cões em um ambiente com RSR=10 dB. Dentre os 256 atributos utilizados para caracterizar cada modula¸cão, a árvore foi constru´ıda utilizando apenas 3 destes, os quais foram considerados os mais significativos. Por outro lado a Fig. 2.14 ilustra a classifica¸cão das mesmas modula¸cões, mas agora para uma RSR = -5 dB. Nota-se, que neste cenário foram considerados necessários 10 atributos para constru¸cão da árvore de decisão.

A escolha dos atributos se dá de acordo com o algoritmo utilizado. Nesta disserta¸cão foi utilizado o algoritmo J4.8, que é uma implementa¸cão do algoritmo C4.5 [41]. O algoritmo

(44)

27

Figura 2.14: Árvore de decisão para classificar modula¸cões em um ambiente com RSR=-5 dB. J4.8 constrói um modelo de árvore de decisão analisando o grau de aleatoriedade dos valores que uma variável X pode assumir. A aleatoriedade é verificada com o cálculo da entropia dos dados. Quanto menor a entropia, menor a aleatoriedade, assim a taxa de erros da classifica¸cão será menor.

As árvores treinadas podem ser representadas como um conjunto de regras “if-else”. Cada caminho do nó raiz até um nó folha representa uma destas regras. Por exemplo, na Fig. 2.14 pode ser visualizada a regra: IF part2 ≤ 0, 49 AND part1 ≤ 0, 83 THEN Classe = bpsk. A árvore de decisão deve ser definida de tal forma que, para cada observa¸cão da base de dados, haja apenas um caminho do nó raiz até o nó folha.

As ´arvores de decis˜ao apresentam as seguintes caracter´ısticas gerais:

• possuem um alto grau de interpretabilidade quando comparadas com outras t´ecnicas de reconhecimento, tais como rede neural e SVM.

• utiliza uma abordagem não-paramétrica para constru¸cão de modelos de classifica¸cão, uma vez que não requer qualquer suposi¸cão sobre o tipo de distribui¸cão de probabilidade satisfeita pela classe e outros atributos.

• são robustas à presen¸ca de ru´ıdo, especialmente quando métodos para evitar superajustamento são utilizados [38].

• são poucos suscet´ıveis a atributos redundantes. Um atributo é redundante se é fortemente correlacionado com outro atributo, nesse caso apenas um será escolhido para

(45)

constru¸cão da árvore. Por outro lado, se o conjunto de treino apresenta muitos atributos irrelevantes (ou seja, atributos que não são úteis para classifica¸cão) um desses poderá ser escolhido. Nesse caso, a árvore de decisão poderá ser maior do que o necessário.

2.4.4 SVM

A SVM (support vector machine) engloba uma classe de algoritmos de aprendizado baseado na teoria de aprendizado estat´ıstico desenvolvida por Vapnik [42], a qual estabelece condi¸cões matemáticas que auxiliam na escolha de um classificador particular a partir de um conjunto de dados de treinamento. Essas condi¸cões levam em conta o desempenho do classificador no conjunto de treinamento e a sua complexidade, com o objetivo de obter um bom desempenho também para novos dados do mesmo dom´ınio. Esta teoria implementa o princ´ıpio de minimiza¸cão do risco estrutural (MRS) [43].

A idéia básica da SVM é mapear um espa¸co de entrada em um espa¸co de caracter´ısticas. Este mapeamento pode ser feito linearmente ou não, de acordo com a fun¸cão de kernel usada para mapeamento [42]. No espa¸co de caracter´ısticas, a SVM constrói hiperplanos ótimos através dos quais as classes são separadas com o objetivo de estabelecer uma margem maior entre cada classe e um erro m´ınimo na classifica¸cão [44]. O hiperplano ótimo pode ser escrito como uma combina¸cão de poucos pontos de caracter´ısticas, definidos pelos exemplos do conjunto de treino, e são chamados de vetores de suporte do hiperplano ótimo.

A literatura apresenta várias possibilidades de kernels para a SVM em aplica¸cões envolvendo o reconhecimento de padrão, tais como kernel linear, polinomial, rede de fun¸cão de base radial e perceptron de duas camadas [43]. Nesta disserta¸cão foi escolhido empiricamente utilizar o kernel linear.

Seja T um conjunto de treinamento com n dados xi ∈ X e suas respectivas classes

yi ∈ Y, em que X constitui o espa¸co dos dados e Y = {−1, +1}. T ´e linearmente separ´avel

se ´e poss´ıvel separar os dados das classes +1 e −1 por um hiperplano.

Dessa forma, o modelo de aprendizagem de uma SVM linear pode ser formalizado como um problema de otimiza¸c˜ao com restri¸c˜ao:

min w kwk2 2 (2.18) sujeito a yi(w · xi+ b) ≥ 1, i = 1, 2, . . . , N.

(46)

29 Dado que a fun¸cão objetivo é quadrática e as restri¸cões são lineares, esse problema é resolvido usando o método de multiplicadores de Lagrange, conforme descrito em [38].

Em situa¸cões reais, é dif´ıcil encontrar aplica¸cões cujos dados sejam linearmente separáveis. Isso se deve a diversos fatores, entre eles a presen¸ca de ru´ıdos ou atributos que diferem do padrão dos dados (outliers) ou à própria natureza do problema, que pode ser não linear. Nesses casos, as SVM lineares são adaptadas para resolver esse tipo de problema.

Uma poss´ıvel adapta¸cão envolve a adi¸cão de variáveis de folga ξi, para todo i =

1, 2, . . . , N ao problema de otimiza¸cão da Eq. 2.18. Isso permite que alguns dados possam violar a restri¸cão da Equa¸cão 2.18.

Um erro no conjunto de treinamento ´e indicado por um valor de ξi maior que 1. Logo,

a soma dos ξi representa um limite no n´umero de erros de treinamento. Dessa forma, a fun¸c˜ao

objetivo modificada ´e dado pela Eq. 2.19:

min w_,b,ξ = kwk2 2 + C( N X i=1 ξi) (2.19)

onde a constante C é um termo de regulariza¸cão que impõe um peso à minimiza¸cão dos erros no conjunto de treinamento em rela¸cão à minimiza¸cão da complexidade do modelo [45].

Os reconhecedores SVM apresentam como caracter´ısticas principais:

• dispõe de eficientes algoritmos para encontrar o m´ınimo global da fun¸cão objetivo, dada a convexidade do problema de otimiza¸cão formulado. Enquanto que outros reconhecedores, como Redes Neurais Perceptron Multicamadas, apresentam m´ınimos locais na fun¸cão objetivo, portanto tendem a encontrar solu¸cões ótimas localmente [38]. • são robustas diante de dados de grande dimensão, sobre os quais outras técnicas de

aprendizado comumente obtˆem classificadores super ou sub ajustados. • boa capacidade de generaliza¸c˜ao.

• são sens´ıveis aos valores dos parâmetros. • dificuldade de interpreta¸cão do modelo gerado.

2.4.5 Rede Neural Artificial

Uma Rede Neural Artificial (RNA) ´e uma estrutura de processamento de informa¸c˜ao distribu´ıda paralelamente na forma de um grafo direcionado [46]. Consiste de um sistema de

(47)

neurônios ligados por conexões sinápticas e dividido em: neurônios de entrada, que recebem est´ımulos do meio externo, neurônios internos ou escondidos e neurônios de sa´ıda, que estão organizados em camadas e se comunicam com o exterior. Possui uma regra de treinamento, onde os pesos w de suas conexões são ajustados de acordo com os padrões apresentados [47]. Uma RNA pode conter várias camadas intermediárias entre as camadas de entrada e de sa´ıda. Tais camadas são chamadas de camadas escondidas e os neurônios presentes nessa camada são os neurônios escondidos. A estrutura resultante é conhecida como rede neural multicamadas, conforme Fig. 2.15, onde xi representa o conjunto de dados de entrada, wi,j o

conjunto de pesos, ni o conjunto de neurˆonios e y a sa´ıda, que corresponde `a classe.

n 1 n2 n 3 n₄ n 5 x₁ x 2 y w3 1 w 4 1 w_{4 2} w_{3 2} w_{5 3} w_{5 4} C a m a d a d e e n t r a d a C a m a d a e s c o n d i d a C a m a d a d e s a í d a

Figura 2.15: Topologia de uma Rede Neural.

Um neurônio consiste de um somatório de pesos e entradas, seguido por uma fun¸cão chamada de fun¸cão de ativa¸cão, originalmente é uma fun¸cão de limiar. Exemplos de fun¸cões de ativa¸cão comumente usadas são: linear, tangente, sigmóide, etc. Detalhes sobre tais fun¸cões podem ser encontrados em [48, 49].

A RNA aprende ajustando os pesos das interconexões entre as camadas. As sa´ıdas da rede são repetidamente comparadas com as sa´ıdas corretas, e cada vez os pesos das conexões são ajustados na dire¸cão das sa´ıdas corretas.

As RNAs buscam por padr˜oes em conjuntos de dados de treinamento. Aprendem estes padr˜oes, e desenvolvem a habilidade de classificar corretamente.

Nesta disserta¸cão foi utilizado aprendizado supervisionado, no qual a rede neural recebe um conjunto de entradas padronizadas e seus correspondentes padrões de sa´ıda. Ajustes nos pesos sinápticos são realizados até que o erro entre os padrões de sa´ıda, gerados pela rede tenham um valor desejado, ou até que um determinado número de itera¸cões seja alcan¸cado. O algoritmo de treinamento utilizado foi o backpropagation [48].

Alguns aspectos devem ser levados em considera¸c˜ao durante a fase de treinamento de uma RNA, entre os quais se destacam:

• método de inicializa¸cão dos pesos, que pode ser uniforme ou aleatório, geralmente são utilizados valores na faixa de −1 e 1 ou −0, 5 e 0, 5.

(48)

31 • taxa de aprendizado, respons´avel pelo controle da velocidade do aprendizado. Como

sugerido em [50] seu valor deve ser maior que 0 e menor que 1.

• fun¸cão de transferência, essa fun¸cão define e envia para fora do neurônio o valor passado pela fun¸cão de ativa¸cão.

Conforme definido em [38] as caracter´ısticas gerais de uma RNA s˜ao:

• RNA com pelo menos uma camada escondida são aproximadores universais, isto é, elas podem ser usadas para aproximar qualquer fun¸cão alvo. Dado que uma RNA tem um espa¸co de hipótese muito expressivo, dessa forma é importante a escolha apropriada da topologia da rede para um dado problema, para evitar superajustamento (overfitting). • podem controlar caracter´ısticas redundantes, pois os pesos são automaticamente

aprendidos durante a fase de treino. Os pesos para caracter´ısticas redundantes tendem a ser muito pequenos.

• são sens´ıveis à presen¸ca de ru´ıdo nos dados treino. Uma abordagem para controlar ru´ıdo é usar um conjunto de valida¸cão pra determinar o erro de generaliza¸cão do modelo. Outra abordagem é reduzir os pesos por algum fator a cada itera¸cão.

• a fase de treinamento é um processo demorado, especialmente quando o número de neurônios na camada escondida é grande. Contudo, exemplos de teste podem ser classificados rapidamente no estágio de teste.