• Nenhum resultado encontrado

UNIVERSIDADE FEDERAL DO PARANÁ LUIZA BEANA CHIPANSKY FREIRE

N/A
N/A
Protected

Academic year: 2021

Share "UNIVERSIDADE FEDERAL DO PARANÁ LUIZA BEANA CHIPANSKY FREIRE"

Copied!
75
0
0

Texto

(1)

Curitiba 2015

MODELAGEM COMPORTAMENTAL E PRÉ-DISTORÇÃO DIGITAL DE AMPLIFICADORES DE POTÊNCIA BASEADAS EM REDES NEURAIS COM

ARQUITETURA PERCEPTRON DE TRÊS CAMADAS

Dissertação apresentada como requisito parcial à obtenção do grau de Mestre em Engenharia Elétrica, no Curso de Pós-Graduação em Engenharia Elétrica, Setor de Tecnologia, da Universidade Federal do Paraná.

Orientador: Prof. Dr. Eduardo Gonçalves de Lima

(2)
(3)
(4)

AGRADECIMENTOS

Agradeço a Deus pelas oportunidades de aprendizado e crescimento que me deu até agora, à minha família pelo apoio, mesmo frente às dificuldades. Também agradeço ao meu querido amor que me acompanha em minha jornada da vida.

Agradeço a todo corpo docente do curso de engenharia elétrica pela transmissão cuidadosa de seu conhecimento. Agradecimentos especiais ao meu orientador Prof. Dr. Eduardo Gonçalves de Lima pela paciência e energia com que me auxiliou e guiou durante o período do mestrado.

Por fim agradeço à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior e ao Conselho Nacional de Desenvolvimento Científico e Tecnológica pelo fornecimento da minha bolsa.

(5)

RESUMO

Este trabalho se utiliza das redes neurais artificiais (RNAs) não recursivas, com a topologia perceptron de múltiplas camadas (MLP - Multi Layer Perceptron), como ferramenta para a modelagem comportamental das características de transferência direta e inversa de amplificadores de potência (PAs - Power Amplifiers) para sistemas de comunicação sem fio.

São propostas duas estruturas MLP, uma para a modelagem comportamental e outra para a extração do inverso do comportamento do PA, usando um pós-distorçor (PoD - Post-Distorter). Ambos novos modelos apresentaram melhor desempenho computacional e menores erros de modelagem que abordagens anteriores.

Sobre o teste do modelo comportamental baseado em 2 redes MLP com 1 saída cada, dois resultados importantes foram obtidos: primeiro, com um número semelhante de números de coeficientes, foi observado que o erro quadrático médio normalizado (NMSE – normalized mean square error) diminui de 1,3 dB com a utilização do modelo proposto em comparação com a abordagem tradicional que utiliza 1 rede MLP com 2 saídas; segundo, em uma situação onde os dois modelos alcançaram um NMSE=-40 dB, observou-se que o número de coeficientes de rede do modelo proposto diminuiu em 40% em relação ao modelo tradicional (de 62 para 38 coeficientes de valores reais).

No teste dos resultados do modelo PoD proposto, em comparação com a abordagem tradicional em um cenário de mesma quantidade de coeficientes, foram alcançadas melhorias nas métricas NMSE e na relação de potência do erro no canal adjacente (ACEPR – adjacent channel error power ratio) de 21 dB.

(6)

ABSTRACT

This work addresses non recursive multi layer perceptron (MLP) artificial neural networks (ANNs) as a tool for the behavioral modeling of the forward and inverse transfer characteristics of power amplifiers (PAs) for wireless communication systems.

Two MLP structures are proposed, one for the PA behavioral modeling and another for the extraction of the PA inverse behavior, using a post-distorter (PoD). Both novel approaches have better performance, in terms of modeling accuracy and computational complexity, than previous approaches.

Concerning the MLP-based behavioral modeling test, two important results are obtained. First, in case of similar number of network parameters, it is observed that the proposed RNA-based model can reduce the normalized mean-square error (NMSE) by up to 1.3 dB; second, in a situation of comparable modeling accuracy (NMSE = -40 dB), it is observed that the proposed RNA-based model can reduce the number of network parameters by up to 40% (from 62 to 38 real-valued parameters).

Concerning the MLP-based PoD test results, in a scenario of similar number of model coefficients, improvements in NMSE and adjacent channel error power ratio (ACEPR) metrics up to 21 dB are achieved by the use of the proposed MLP-based PoD model.

(7)

Figura 1 – Evolução dos padrões de modulação em redes sem fio. ... 13

Figura 2 – Diagrama de blocos de um sistema de comunicação sem fio. ... 17

Figura 3 - Esquemático de um PA. ... 18

Figura 4 – Curvas características de rendimento (a) e ganho do PA (b). ... 20

Figura 5 – Diagrama de blocos do PD em cascata com o PA. ... 21

Figura 6 – Características de transferência do PA, do PD (inverso do PA) e do PD em cascata com o PA (característica linear). ... 21

Figura 7 – Diagrama de blocos do método de aprendizagem direta. ... 22

Figura 8 - Diagrama de blocos do método de aprendizagem indireta. ... 23

Figura 9 – Diagrama de blocos do sistema de modelagem de um PA. ... 24

Figura 10 – Sinal de entrada do PA no domínio da frequência (a); sinal de saída do PA no domínio da frequência (b). ... 27

Figura 11 – Representação dos sinais de saída do PA no domínio da frequência: modelo passa-banda (a) e modelo equivalente passa-baixas (b). ... 29

Figura 12 – Gráfico detalhado das contribuições do sinal aplicado a uma função descrita por um polinômio de terceiro grau. ... 31

Figura 13 – Modelo não linear de um neurônio. ... 32

Figura 14 – Funções sigmoides com inclinação variável. ... 34

Figura 15 – Diagrama de blocos da rede de múltiplas camadas MLP. ... 34

Figura 16 – Grafo do fluxo do sinal na rede MLP. ... 36

Figura 17 – Diagrama de blocos de um modelo de PA baseado em MLP usualmente utilizado. ... 39

Figura 18 – PD derivado do modelo de PA. ... 39

Figura 19 – Diagrama de blocos de modelo de PA utilizando MLP. ... 41

Figura 20 - Diagrama de blocos que resume a análise matemática dada pelas equações (17) – (a), (18) – (c) e (19) – (b). ... 43

Figura 21 – Diagrama de blocos do modelo de PD proposto. ... 45

Figura 22 – Comportamento (a) AM-AM e (b) AM-PM modelados pela rede MLP. .. 47

Figura 23 – Diagrama de blocos do modelo comportamental baseado em MLP proposto. ... 47

Figura 24 – Separação do sinal em canal principal e canais adjacentes para avaliação da exatidão do modelo. ... 50

Figura 25 – Resultados de ACEPR como função dos números de coeficientes para diferentes modelos de PoD. M = 1 e largura de banda de 3,84 MHz. ... 53

Figura 26 – Resultados de NMSE como função dos números de coeficientes para diferentes modelos de PoD, com M = 1. ... 54

Figura 27 - PSDs dos sinais de erro para diferentes modelos de PoD tendo M = 1 e 72 coeficientes. ... 55

Figura 28 - PSDs das saídas medidas e estimadas do PA, para o caso de M = 1 e 72 coeficientes. ... 56

(8)

Figura 29 - Curva característica AM/AM do comportamento inverso do PA (medido) e do PoD proposto (estimado), para o caso particular de M = 1 e 72 coeficientes. ... 57 Figura 30 - Curva característica AM/PM do comportamento inverso do PA (medido) e do PoD proposto (estimado), para o caso particular de M = 1 e 72 coeficientes. ... 58 Figura 31 – Parte real dos sinais de saída medidos e estimados pelo modelo PoD proposto com M = 1 e 100 coeficientes (14 neurônios). ... 59 Figura 32 – Parte imaginária dos sinais de saída medidos e estimados pelo modelo PoD proposto com M = 1 e 100 coeficientes (14 neurônios). ... 60 Figura 33 – Amplitude dos sinais de saída medidos e estimados pelo modelo PoD proposto com M = 1 e 100 coeficientes (14 neurônios). ... 61 Figura 34 – Diferença de fase entre os sinais de saída e entrada: medido e estimado pelo modelo PoD proposto, tendo M = 1 e 100 coeficientes (14 neurônios). ... 62 Figura 35 – Resultados de NMSE como função do número de coeficientes da rede, com M = 2. ... 63 Figura 36 – PSDs das saídas medidas e estimadas do PA. O amplificador GaN HEMT classe AB é modelado pelo MLP proposto tendo M = 2 e 38 coeficientes de rede. ... 64 Figura 37 – Valores medido e estimado da conversão AM/AM normalizada. O

amplificador GaN HEMT classe AB é modelado pelo MLP proposto tendo M = 2 e 38 coeficientes de rede. ... 65 Figura 38 - Valores medido e estimado da conversão AM/PM normalizada. O

amplificador GaN HEMT classe AB é modelado pelo MLP proposto tendo M = 2 e 38 coeficientes de rede. ... 66 Figura 39 - Parte real dos sinais de saída medidos e estimados pelo modelo PoD proposto com M = 2 e 254 coeficientes (14 neurônios). ... 67 Figura 40 – Parte imaginária dos sinais de saída medidos e estimados pelo modelo PoD proposto com M = 2 e 254 coeficientes (14 neurônios). ... 68 Figura 41 - Amplitude dos sinais de saída medidos e estimados pelo modelo PoD proposto com M = 2 e 254 coeficientes (14 neurônios). ... 69 Figura 42 - Diferença de fase entre os sinais de saída e entrada: medido e estimado pelo modelo PoD proposto, tendo M = 2 e 254 coeficientes (14 neurônios). ... 70

(9)

LISTA DE TABELAS

Tabela 1 – Faixa de valores dos sinais de entrada dos conjuntos de extração e teste. ... 49 Tabela 2 – Valores de ACEPR como função dos números de coeficientes para diferentes modelos de PoD. M = 1 e largura de banda de 3,84 MHz. ... 53 Tabela 3 - Valores de NMSE como função dos números de coeficientes para

diferentes modelos de PoD. M = 1. ... 54 Tabela 4 - Valores de NMSE como função dos números de coeficientes para os modelos de PA tradicional e proposto. ... 63

(10)

1 Introdução... 12

1.1 Motivação e objetivos ... 12

1.2 Organização da dissertação ... 15

2 Fundamentação teórica ... 17

2.1 Amplificadores de potência de RF ... 17

2.1.1 Linearidade e eficiência de PAs ... 19

2.2 Pré-distorção digital ... 20

2.3 Modelagem de PAs ... 23

2.3.1 Efeitos não lineares e de memória na modelagem de PAs ... 25

2.3.2 Comportamento passa-banda do PA ... 26

2.3.3 Classificação dos modelos comportamentais ... 27

2.3.4 Restrições do comportamento passa-banda do PA ... 30

3 Redes Neurais Artificiais ... 32

3.1 Treinamento da rede MLP ... 35

3.2 Estado da arte de MLP em modelagem de PA e PD ... 38

4 Nova abordagem para modelagem comportamental e pré-distorção digital de amplificadores de potência ... 42

4.1 Restrições do comportamento passa-banda aplicado a PD ... 42

4.2 Modelo de PD proposto ... 44

4.3 Modelagem comportamental proposta de PAs com duas redes MLPs ... 45

4.4 Dados para teste e métricas de desempenho ... 48

4.5 Análise e resultado das simulações ... 52

4.5.1 Teste do modelo de PD proposto ... 52

4.5.2 Teste do modelo comportamental com 2 redes MLP ... 62

(11)

LISTA DE SIGLAS

ACEPR adjacent chanel error power ratio NMSE normalized mean square error PSD power spectral density

RNA rede neural artificial

RF rádio frequência

PA power amplifier (amplificador de potência) DPD digital pre-distortion (pré-distorção digital)

MLP multi layer perceptron (perceptron de múltiplas camadas) ERB estação rádio base

HEMT high-electron-mobility transistor GaN nitrato de gálio

PoD post-distorter (pós-distorçor)

WCDMA wideband code-division multiple access LTE long term evolution

AM/AM amplitude modulation to amplitude modulation AM/PM amplitude modulation to phase modulation PM/AM phase modulation to amplitude modulation PM/PM phase modulation to phase modulation VSA vector signal analyzer

(12)

1 INTRODUÇÃO

Neste capítulo é apresentada uma visão geral do trabalho: objetivos, motivação e organização.

1.1 MOTIVAÇÃO E OBJETIVOS

Nos tempos atuais, a demanda por comunicação móvel é crescente. Diversos novos serviços e conteúdos de mídia são disponibilizados na internet ou para download. Consequentemente, há um maior fluxo de dados. Esse crescente tráfego de dados deve se restringir nas limitadas bandas espectrais do sistema sem fio, o que impacta a velocidade do tráfego de dados da rede de forma crítica. É imprescindível, dessa forma, aumentar a capacidade das redes de comunicação sem fio. A partir disso, a fim de se ter melhor eficiência espectral está se popularizando o uso de novos padrões de interface de rádio como o WCDMA (Wideband Code Division Multiple Access) e o LTE (Long Term Evolution) (BRUBAKER, 2009), como mostrado na Figura 1.

Um problema em se utilizar esses novos padrões é que a portadora, sendo modulada tanto em amplitude quanto em fase, se torna mais sensível às distorções impostas pelo comportamento não linear dos amplificadores de potência (PAs – Power Amplifiers) (BRUBAKER, 2009).

Dentro da estação rádio base (ERB), o PA é o equipamento responsável por amplificar a potência do sinal a ser transmitido pela antena. Da mesma forma, no celular ele é responsável por amplificar o sinal a ser transmitido para a ERB. Ele é o equipamento que tem maior consumo de energia elétrica no sistema sem fio. Uma peculiaridade desses equipamentos é seu comportamento conflitante entre linearidade e eficiência, pois, a fim de se ter uma maior eficiência, o PA precisa operar com valores de tensão e corrente que implicam em um comportamento não linear (RAWAT; RAWAT, GHANNOUCHI, 2010).

Antes de tudo, deve-se entender esses dois fatores guias para o desenvolvimento e aprimoramento das redes de comunicação sem fio: a linearidade e a eficiência energética (REZAEI; SHAHRAKI; SHOKOUHI, 2013).

(13)

Traduz-se linearidade aqui como um requisito essencial de qualidade da rede de comunicação sem fio, já que equipamentos com respostas não lineares podem causar distorções dos sinais, gerar intermodulações em bandas adjacentes e dificultar a recuperação do sinal na extremidade recebedora. E, como é imprescindível seguir as exigências de qualidade ditadas pelos órgãos regulatórios, a linearidade dos equipamentos da rede de comunicação sem fio se torna uma característica necessária.

Para os PAs a questão de eficiência energética é bastante crítica. Primeiramente, por ser um equipamento de grande consumo energético, demanda altíssimos investimentos, na ERB, em equipamentos para dissipação de calor. Além disso, nos equipamentos portáteis (celular, tablet, etc), o tempo de autonomia das baterias é um quesito de suma importância. Mais detalhes sobre a linearidade e eficiência energética dos PAs são dados na Seção 2.1.1.

Figura 1 – Evolução dos padrões de modulação em redes sem fio. FONTE: Modificado pelo autor de BRUBAKER (2009)

Então, para manter uma boa eficiência e evitar os problemas advindos de um comportamento não linear, é necessário realizar a linearização dos amplificadores de potência.

Dentre as diversas técnicas de linearização de PAs, a mais utilizada é a pré-distorção digital (DPD - digital pre-distortion). Ela necessita de um modelo que caracterize, de forma precisa e com baixa complexidade computacional, o

(14)

comportamento de um PA (MKADEM; BOUMAIZA, 2011). Observando esses quesitos, o modelo de PA escolhido é o modelo comportamental ou caixa preta que observa apenas a relação entrada-saída do PA, sem conhecimento de sua estrutura interna.

A fim de obter esse modelo de PA, existem diversas técnicas. As mais utilizadas são os filtros polinomiais e as redes neurais artificiais (RNAs). As RNAs, por sua natureza adaptativa, têm demostrado ser capazes de aproximar sistemas não lineares dinâmicos com grande exatidão. Em comparação com outra técnica bem conhecida e explorada, a técnica polinomial de Volterra (SUN, 2014), as RNAs têm a vantagem de possuir um pequeno número de coeficientes e seus modelos apresentam grande capacidade de generalização, que é uma característica importante quando lidando com um conjunto de dados limitado (LAVRADOR; PEDRO; CARVALHO, 2005). Por essa razão, neste trabalho são explorados apenas os modelos baseados em RNAs.

Existem diversos modelos de RNAs, sendo que os mais estudados para a linearização de PAs são a rede de função de base radial (RBF – radial-basis function) (ISAKSSON; WISELL; RONNOW, Jun. 2005) e o perceptron de múltiplas camadas (MLP – Multi layer perceptron) (BENVENUTO; PIAZZA; UNCINI, 1993), (LIU; BOUMAIZA; GHANNOUCHI, 2004). Este trabalho utiliza o MLP de três camadas.

Os trabalhos anteriores na área de modelagem de PAs baseados em MLP não levam em consideração algumas características físicas inatas da natureza passa-banda dos transmissores e seu impacto na característica de transferência de um pré-distorçor (PD). Ao longo deste trabalho, essas características são analisadas e os benefícios em considerá-las na modelagem comportamental caixa preta são explorados.

Desta forma este trabalho tem o objetivo de propor uma nova abordagem para DPD e modelagem de amplificadores utilizando a arquitetura MLP, que satisfaz as restrições inatas das características físicas do PA. Ainda, é proposta uma nova arquitetura de RNA que explora os benefícios de se utilizar duas redes MLPs independentes.

(15)

1.2 ORGANIZAÇÃO DA DISSERTAÇÃO

No subcapítulo anterior, as motivações introdutórias em que se baseiam os estudos desta dissertação foram expostas. Agora, os tópicos abordados nos capítulos posteriores são brevemente apresentados.

No Capítulo 2 são apresentados os conhecimentos fundamentais que embasam o estudo dessa dissertação. No Subcapítulo 2.1 é detalhado o propósito dos PAs no sistema de comunicação sem fio, bem como os principais elementos eletrônicos que o compõem. E, posteriormente, na Seção 2.1.1 são explicadas duas das características mais importantes do PA: a linearidade e a eficiência energética. No Subcapítulo 2.2 são descritas as características principais da pré-distorção digital, que servem como ponto de partida para a introdução da modelagem comportamental de PAs, que então é descrita com detalhes no Subcapítulo 2.3. Também são abordadas características básicas sobre o comportamento físico dos PAs a fim de se entender algumas peculiaridades da modelagem comportamental, nas Seções 2.3.1 e 2.3.2. Na Seção 2.3.3 é explanado sobre os tipos de modelagem comportamental e suas características. Na Seção 2.3.4 são analisadas as implicações em se utilizar sinais banda em modelos equivalentes passa-baixas.

A RNA, a ferramenta base utilizada neste trabalho para a extração do modelo do PA e do PD, é descrita no Capítulo 3. São detalhadas sua estrutura e seu modelo matemático, bem como a motivação de sua escolha para a modelagem comportamental de PAs. No Subcapítulo 3.2 é detalhado o estado-da-arte da aplicação de MLP em modelagem de PA e DPD.

As contribuições deste trabalho são detalhadas no Capítulo 4. No Subcapítulo 4.1 é apresentada a teoria em que se baseiam os novos modelos propostos. O novo modelo de PD baseado em MLP, bem como o novo modelo de PA baseado em MLP com duas RNAs são apresentados respectivamente nos Subcapítulos 4.2 e 4.3. Os resultados dos testes desses dois modelos são apresentados no Subcapítulo 4.5, nas Seções 4.5.1 e 4.5.2 respectivamente, utilizando as ferramentas e os dados descritos no Subcapítulo 4.4.

(16)

No Capítulo 5 é feito um resumo das principais contribuições do trabalho e feitas as conclusões finais.

(17)

2 FUNDAMENTAÇÃO TEÓRICA

Neste capítulo, inicialmente são abordados alguns conhecimentos básicos sobre amplificadores de potência de rádio frequência (RF). Na sequência, a teoria básica sobre pré-distorção digital e modelagem comportamental é detalhada.

2.1 AMPLIFICADORES DE POTÊNCIA DE RF

Os PAs têm um papel essencial no sistema de comunicação sem fio. Eles transformam energia em corrente contínua (cc) em um sinal de saída RF em função do sinal RF de entrada (HYUNCHUL, 2003). O PA encontra-se na cadeia de transmissão logo antes da antena de transmissão, como mostra a Figura 2. Seu objetivo principal é amplificar a potência do sinal a ser irradiado pela antena.

Figura 2 – Diagrama de blocos de um sistema de comunicação sem fio. FONTE: Modificado pelo autor de HYUNCHUL (2003)

Os PAs que utilizam dispositivos de estado sólido geralmente são compostos de três partes essenciais, como na Figura 3: circuito de polarização cc e casamento

Codificador Transmissor Canal Receptor Decodificador

Oscilador local

Modulador Misturador Amplificador de Potência

Sinal passa- banda Sinal banda - base

(18)

de impedância da entrada; circuito ativo (transistor); circuito de polarização cc e casamento de impedância da saída (HYUNCHUL, 2003).

Figura 3 - Esquemático de um PA.

FONTE: Modificado pelo autor de PEDRO; CARVALHO; LAVRADOR (2003)

Os circuitos de casamento de impedância servem para moldar a característica de transferência que se deseja no PA e podem ser projetados para fornecer máxima potência, máximo ganho, ou mesmo para minimizar interferências de ruídos no sinal. O circuito de polarização provê a corrente e a tensão que se deseja para a operação do circuito ativo. Dependendo da escolha da forma como operar o transistor, o PA pode ser classificado em classes, como por exemplo, A, AB, B e C.

Nos subcapítulos seguintes se verá que a forma como o transistor opera tem impacto significativo na qualidade do sinal da rede de comunicação e por que são necessários métodos de linearização da resposta do PA. Além disso, entendendo-se as características de seus componentes eletrônicos podem-se criar modelos comportamentais mais fidedignos dos PAs e, consequentemente, métodos de linearização mais eficientes.

(19)

2.1.1 LINEARIDADE E EFICIÊNCIA DE PAS

Uma característica dos PAs que é proeminente em seu comportamento é o compromisso entre linearidade e eficiência.

A eficiência de um PA é a medida de quanto o PA converte da potência cc das fontes de polarização na potência RF entregue para a carga (SCHREURS et al., 2009). Sua definição é expressa por:

= (1)

onde é a potência de saída do PA (potência entregue à carga) e é a potência entregue pela fonte cc ao PA.

A potência que não é utilizada para a conversão de sinal útil é dissipada na forma de calor. PAs que possuem baixa eficiência, por conseguinte, têm altos níveis de dissipação de calor, e isso pode ser um fator limitante em certos projetos, devido aos custos com consumo energético, equipamentos de resfriamento, manutenção, etc.

A linearidade, por conseguinte, é a capacidade do PA entregar o sinal de saída como somente função linear do sinal de entrada. Exemplificando tem-se que:

= (2)

sendo o sinal de saída do PA; o sinal de entrada; e uma constante real, representando o ganho do PA. No domínio da frequência, um comportamento linear significa que o sinal de saída mantém valores não nulos nas mesmas frequências que o sinal de entrada. Diferentemente, em sistemas não lineares podem existir valores não nulos em frequências não excitadas pelo sinal de entrada, sendo expressos por intermodulações ou harmônicas (HYUNCHUL, 2003).

A eficiência de um PA aumenta em função do aumento da potência de saída, como observado na Figura 4 (a). Porém, na Figura 4 (b) nota-se que ao aumentar a potência do PA, ele entra em uma região de operação não linear, que se intensifica ao longo da curva.

(20)

Figura 4 – Curvas características de rendimento (a) e ganho do PA (b). FONTE: Modificado pelo autor de CRIPPS (2006)

Ainda que se busque um ponto ótimo de linearidade e eficiência, esses valores não são satisfatórios (na maioria dos PAs). Por isso, para obter um PA com boa eficiência e que preserve o sinal amplificado é necessário utilizar algum método de linearização de PAs. Dentre várias técnicas de linearização de PAs, uma que se destaca é a DPD, detalhada no subcapítulo seguinte.

2.2 PRÉ-DISTORÇÃO DIGITAL

A DPD é a técnica de linearização mais popular, pois possibilita o uso de diversos algoritmos corretivos e assegura razoáveis larguras de banda em comparação a outras técnicas (GUPTA et al., 2006).

A ideia principal desse método é inserir o inverso do comportamento não linear para compensar as distorções introduzidas pelo PA. Na Figura 5, o diagrama do sistema de linearização é mostrado e, na Figura 6, podem ser visualizadas as curvas características dos blocos de pré-distorção (PD) e do PA, bem como a resposta linear do sistema (PD em cascata com o PA).

(21)

Figura 5 – Diagrama de blocos do PD em cascata com o PA. FONTE: O autor (2015)

Na Figura 6 a resposta do PD (bolinha aberta), G[.] = F-1[.], e a resposta do PA (bolinha fechada), F[.], são postas em cascata, como na Figura 5, para gerar uma característica de transferência linear (ponto).

Figura 6 – Características de transferência do PA, do PD (inverso do PA) e do PD em cascata com o PA (característica linear).

FONTE: Modificado pelo autor de LIMA (2009)

Duas estratégias podem ser utilizadas para obter os coeficientes de um PD, nesse caso obter a função G[.]. Uma das estratégias é a de utilizar um modelo de PA que caracterize a função F[.] e então obter sua inversa F-1[.]=G[.].

Outra forma de obter os coeficientes do PD é diretamente, sem utilizar um modelo de PA. Para isso, existem ainda duas outras abordagens: a aprendizagem direta e a aprendizagem indireta.

Para a extração dos coeficientes do PD utilizando a aprendizagem direta, o bloco PD é posicionado logo antes do PA, como na Figura 7. Comumente, para o processo de extração do comportamento de um sistema, são utilizados como base

(22)

seus sinais de entrada e saída, modelando-se a função que gera o sinal de saída desejado quando aplicada uma determinada entrada. Porém, observando a Figura 7, vê-se que só se tem conhecimento da entrada e saída da conexão em cascata do bloco PD com o PA ( ( ) e ( )). O sinal ( ), que sai do bloco PD, é normalmente o sinal que entra no PA e ( ) seu sinal de saída, e, desses dois sinais, apenas o ( ) é previamente conhecido (deve ser uma réplica linear de ( ), a entrada do bloco PD). Porém, a obtenção do sinal de saída do bloco PD, ( ), não é trivial, tornando complexa a identificação de seus coeficientes (EUN; POWERS, 1997).

Figura 7 – Diagrama de blocos do método de aprendizagem direta. FONTE: Modificado pelo autor de MARSALEK; JARDIM; BAUDOIN (2003)

Agora, se for considerado um pós-distorçor (PoD – post distorter) - um sistema que tem o mesmo escopo de um PD, porém alocado após o PA (Figura 8) - a obtenção dos coeficientes se torna um simples problema de identificação de sistemas, desde que os sinais de entrada e saída sejam conhecidos. Em (GILABERT; MONTORO; BERTRAN, 2005) é demonstrado que o PD e o PoD de um sistema são idênticos.

Resumindo, o algoritmo de aprendizagem direta obtém os coeficientes do PD em um cenário onde sua saída não está disponível. Já o algoritmo de aprendizagem indireta primeiramente extrai um PoD para então copiar os coeficientes extraídos para um PD de mesma topologia.

(23)

Figura 8 - Diagrama de blocos do método de aprendizagem indireta. FONTE: Modificado pelo autor de EUN; POWERS (1997)

Neste trabalho, quando analisados modelos de PD, sempre é utilizado o algoritmo de aprendizagem indireta. Primeiramente, por possuir uma complexidade computacional menor e, depois, pelo fato de poder ser reutilizada a estrutura do modelo de PA para gerar o modelo de DPD. Esta última questão será explicada no subcapítulo seguinte.

Portanto, o sucesso de um sistema de linearização depende fortemente da disponibilidade de um modelo de PA de alta exatidão e baixo custo computacional.

2.3 MODELAGEM DE PAS

O objetivo ao modelar um dispositivo físico é reproduzir computacionalmente seu comportamento. De forma mais ampla existem duas abordagens para construir um modelo de um PA. Na primeira mapeiam-se os circuitos do PA e estudam-se os componentes eletrônicos que o constituem, bem como a forma como se inter-relacionam, sendo chamados assim modelos físicos. Esses modelos são utilizados para análises em nível de circuito e possuem alto nível de exatidão e de complexidade. Já os modelos empíricos, ou comportamentais, são utilizados quando se necessita da simulação em nível de sistema e observa-se apenas o

(24)

comportamento da entrada-saída do PA, tratando o mesmo como uma caixa preta (SCHREURS et al., 2009). Esta última modalidade restringe a compatibilidade do modelo a certos tipos de conjunto de dados de entrada, devido ao ajuste do modelo aos dados utilizados para sua extração. No melhor dos casos, o modelo é limitado à utilização de sinais de uma mesma classe de excitação (WCDMA, LTE, etc). Porém, em contrapartida, seu nível de complexidade é baixo e permite um processamento mais eficiente dos dados pelo modelo (SCHREURS et al., 2009).

Pode-se observar o sistema de modelagem caixa preta de um PA na Figura 9. Primeiro é escolhido um modelo compatível com as características que se quer modelar (RNAs, filtros polinomiais, etc). Então, seus coeficientes são ajustados sucessivamente até atingir um sinal de erro de valor mínimo desejável. O processo de modelagem começa submetendo o PA real e seu modelo a um mesmo sinal de entrada ( ). A resposta obtida da comparação das saídas instantâneas do PA real, ( ), e do seu modelo, ( ), é o sinal de erro ( ( ) = ( ) −

( ) ). A forma como os coeficientes são ajustados depende do modelo escolhido. Neste trabalho é utilizado um modelo MLP e suas características são vistas no Capítulo 3.

Figura 9 – Diagrama de blocos do sistema de modelagem de um PA. FONTE: O autor (2015)

PA

Min E[e(n)]

Modelo

Compatível

( )

( )

( )

e

( )

(25)

2.3.1 EFEITOS NÃO LINEARES E DE MEMÓRIA NA MODELAGEM DE PAS

Idealmente o sinal de saída de um PA é uma réplica linear (fora a constante de ganho) do sinal aplicado em sua entrada. Entretanto, a fim de melhorar sua eficiência energética, especialmente quando um sistema de linearização é aplicado em cascata com o transmissor, comportamentos não lineares não desprezíveis são observados no PA.

Estudos mais recentes propõem que juntamente com a análise direta da entrada-saída do PA sejam incorporadas algumas características de natureza física que tornam o modelo mais fidedigno. Uma característica que se observou ter bastante impacto na exatidão dos modelos são os efeitos de memória que ocorrem devido à retenção de energia pelo sistema (SCHREURS et al., 2009). Os fatores que causam esse distúrbio no sistema são derivados das constantes de tempo de circuitos LC e de casamento de impedância, aquecimento no transistor e constantes de tempo altas no circuito de polarização (HYUNCHUL, 2003). O sinal de entrada induz esses efeitos nos dispositivos dentro do PA e modificam suas características. Quando excitados com sinais de banda estreita, esses efeitos têm pouca ou nenhuma importância, já quando se trata de sinais de banda larga os efeitos de memória são mais significativos.

Um amplificador de potência geralmente é formado por três partes como mostrado na Figura 3. Estudando seus componentes pode-se caracterizar melhor o PA e então inserir essas informações no processo de modelagem.

Dois tipos de efeitos de memória podem ser encontrados: os efeitos de memória linear ou também chamados memórias de curta duração e os efeitos de memória não linear ou memórias de longa duração. Os efeitos de memórias de curta duração são caracterizados pela constante de tempo muito menor do que o recíproco do valor da frequência máxima da envoltória. Já os efeitos de memória de longa duração ocorrem devido às frequências de banda-base e de bandas harmônicas e ocorre apenas em regimes não lineares de operação. Como consequências dos efeitos de memória, o comportamento dos PAs se torna função não apenas dos valores instantâneos do sinal de entrada, mas também dos seus valores passados. A quantidade de termos passados utilizada nos modelos de PA é

(26)

definida como profundidade de memória, (M). Se, por exemplo, além do valor instantâneo do sinal de entrada forem utilizadas duas amostras anteriores ao sinal instantâneo, M será igual a dois (M = 2).

2.3.2 COMPORTAMENTO PASSA-BANDA DO PA

Na comunicação sem fio, o PA é excitado por sinais de portadora (com frequência da ordem de GHz) modulados por envoltórias de valor complexo tendo uma largura de banda na ordem de MHz (LEE, 1998).

Em outras palavras, os sinais com que o PA precisa lidar têm energia não nula apenas em frequências perto da frequência central e também largura de banda muito menor que a frequência central. Esses sinais são comumente designados como sinais passa-banda (ABUELMA’ATTI, 1984). Por isso, os PAs podem ser vistos como sistemas tendo uma entrada e uma saída, que relacionam sinais passa-banda. Os circuitos de casamento de impedância presentes na entrada e na saída do PA (Figura 3) são responsáveis por seu comportamento passa-banda. Por exemplo, apenas entradas passa-banda podem gerar qualquer sinal mensurável na saída. E, desta forma, na saída só podem ser observados sinais passa-banda.

Os sinais passa-banda de entrada e saída do PA podem ser representados, respectivamente, por (3) e (4):

( ) = Re ( )e = | | cos[ + ], (3) e

( ) = Re ( )e = | | cos[ + + ]. (4)

onde é a amostra instantânea de tempo; ( ) e ( ) são os sinais de RF de valores reais na entrada e na saída respectivamente; ( ) e ( ) são os valores complexos na entrada e na saída respectivamente; é a frequência da portadora; é a diferença entre o ângulo de fase dos sinais de envoltória na saída e na entrada e é o ângulo de fase do sinal de envoltória na entrada.

(27)

Na Figura 10 estão representados os sinais de entrada e saída do PA respectivamente. Observa-se que devido ao comportamento não linear do PA, o sinal na saída apresenta na frequência um alargamento nas bandas.

Figura 10 – Sinal de entrada do PA no domínio da frequência (a); sinal de saída do PA no domínio da frequência (b).

FONTE: Modificado pelo autor de SILVA (2014)

2.3.3 CLASSIFICAÇÃO DOS MODELOS COMPORTAMENTAIS

Os modelos comportamentais de PAs podem ser classificados em três categorias: sistemas não lineares sem memória, sistemas não lineares quase-sem memória e sistemas não lineares com memória. O Quadro 1 resume as informações sobre estes três sistemas (KU; MCKINLEY; KENNEY, 2002).

Observa-se pelo Quadro 1 que as curvas características do PA evidenciam os efeitos de memória que são considerados em cada modelo. As curvas características de um amplificador representam suas relações de entrada-saída. A característica AM/AM (amplitude modulation to amplitude modulation) mostra a amplitude da saída instantânea como função da amplitude da entrada instantânea. Ou seja, o sinal de saída do PA é dependente apenas da variação da amplitude da envoltória de entrada. Dessa forma, nos modelos que consideram os efeitos de memória desprezíveis, não se observa modulação de fase no sinal de saída e o sinal de envoltória da saída depende apenas do sinal de envoltória de entrada.

(28)

Quadro 1 – Classificação dos modelos de PA quanto aos efeitos de memória.

Classificação Curva características do PA

Efeito de memória

1º Sistema sem memória AM/AM Sem distorção de fase

2º Sistema quase-sem-memória AM/AM, AM/PM Com distorção de fase

3º Sistema com memória (a) AM/AM, AM/PM dinâmicas Memória de período longo

4º Sistema com memória (b)

PM/AM, PM/PM (dependência da fase em instante anterior), AM/AM,

AM/PM dinâmicas

Memória de períodos curto e

longo

FONTE: O autor (2015)

A característica AM/PM (amplitude modulation to phase modulation) mostra a relação da diferença de fase entre os sinais de saída e entrada do PA em função da amplitude instantânea da entrada. Os modelos quase-sem memória são representados por funções AM/AM e AM/PM. Porém, quando se consideram sinais de entrada de banda estreita, os modelos sem memória são caracterizados pela dependência da envoltória complexa da saída com a envoltória complexa instantânea da entrada. Assim, todos os modelos independentes da frequência podem ser denominados modelos sem memória, juntando então os modelos sem memória e quase-sem memória em um mesmo grupo (PEDRO; MAAS, 2005).

Nos sistemas com memória (a), as características AM/AM e AM/PM são dependentes não só dos valores instantâneos da amplitude da entrada, mas também dos valores passados. Dessa forma é possível representar os efeitos de memória de longa duração (KU; MCKINLEY; KENNEY, 2002).

Já os sistemas com memória (b) permitem representar não apenas os efeitos de memória de longa duração, mas também os de curta duração. Em outras palavras, as características AM/AM e AM/PM são funções dos valores atuais e passados da amplitude de entrada e também dos valores atuais e passados da

(29)

diferença de fases entre a saída e a entrada (agora a relação entrada-saída do PA também varia com as relações PM/AM (phase modulation to amplitude modulation) e PM/PM (phase modulation to phase modulation)) (LIMA; CUNHA; PEDRO, 2011).

Outra classificação para os modelos comportamentais é baseada na forma de representação dos sinais de entrada-saída do PA que é utilizada (PEDRO; MAAS, 2005). Podem ser utilizados sinais passa-banda, sendo chamados modelos comportamentais passa-banda. Porém se o que for modelado é a relação entrada-saída em valores de envoltória complexa, então o modelo é chamado de equivalente passa-baixas. Em particular, os sinais passa-banda possuem valores não nulos acerca da frequência da portadora ω e os sinais passa-baixas possuem valores não nulos apenas na origem, como na Figura 11.

Figura 11 – Representação dos sinais de saída do PA no domínio da frequência: modelo passa-banda (a) e modelo equivalente passa-baixas (b).

FONTE: Modificado pelo autor de SILVA (2014)

Os modelos comportamentais passa-banda requerem que o sinal de saída do PA seja função das amostras instantâneas do sinal de entrada, bem como de um grande conjunto de amostras passadas (na ordem de milhares). Pois, para um modelo ser satisfatório, é necessário levar em consideração os efeitos de memória (na ordem de MHz), e ainda respeitar o critério de Nyquist, o que obriga a utilizar uma frequência de amostragem da ordem de algumas harmônicas da frequência da portadora (na ordem de GHz). Já os modelos passa-baixas podem atingir um bom nível de exatidão considerando a saída no instante atual como função das entradas instantâneas e poucas amostras passadas. Desde que apenas os sinais de envoltória complexa estão disponíveis para o modelo comportamental passa-baixas, a frequência máxima que precisa ser manipulada pelo modelo é reduzida a algumas

a) modelo passa-banda b) modelo equivalente passa-baixas

GHz MHz

freq 0 freq

0 1f 2f 3f 3f 2f 1f

(30)

vezes a largura da envoltória. Por isso, a frequência de amostragem pode ser definida em um valor na faixa dos MHz (mil vezes menor que no modelo passa-banda).

Em resumo, a escolha entre modelos banda e equivalente passa-baixas tem um impacto significativo no custo computacional de um modelo comportamental. Então, a primeira recomendação ao se escolher um modelo de PA com fins de linearização é a adoção de um modelo comportamental equivalente passa-baixas.

Porém, a utilização dos sinais passa-baixas para representar um sistema passa-banda implica em algumas restrições na escolha dos modelos de PA. Mais detalhes sobre esse tópico são detalhados na seção seguinte.

2.3.4 RESTRIÇÕES DO COMPORTAMENTO PASSA-BANDA DO PA

Além dos efeitos de memória, outra característica inerente do modo de operação dos PAs são as restrições impostas pelo seu comportamento passa-banda no modelo equivalente passa-baixas.

Modelos comportamentais passa-baixas são insensíveis à informação da frequência da portadora. Como consequência, se é submetido a uma operação arbitrária , contribuições fora da banda são facilmente geradas pelo modelo comportamental passa-baixas (BENEDETTO; BIGLIERI; DAFFARA, 1979). Esses espúrios matemáticos não estando associados com nenhuma medida realizada no PA apenas comprometem a exatidão do modelo, além de aumentar sua complexidade computacional.

Como um exemplo, considere um sinal passa-banda de (3) submetido a um operador polinomial de 3º ordem, de acordo com:

( ) = + + , (5)

onde , e são coeficientes constantes. Na Figura 12 podem ser observados todos os termos gerados e suas características. Observa-se que apenas dois termos

(31)

se encontram dentro da banda, uma vez que preservam um valor escalar unitário multiplicando ω . Os termos pares sempre geram contribuições não físicas (fora do canal principal) e apenas alguns termos ímpares geram contribuições dentro do canal principal (1ω ).

Figura 12 – Gráfico detalhado das contribuições do sinal aplicado a uma função descrita por um polinômio de terceiro grau.

FONTE: O autor (2015)

Deduz-se então que, além de apresentar um valor escalar unitário multiplicando ωc, o sinal de envoltória complexa estimado por um operador do modelo comportamental passa-baixas deve ter paridade ímpar com respeito ao sinal de envoltória complexa aplicado na entrada do PA (LIMA; CUNHA; PEDRO, 2011).

É recomendada a adoção de modelos comportamentais passa-baixas que não gerem contribuições fora da banda, visto que essas contribuições não trazem informação útil sobre o comportamento do PA dificultando a extração de um modelo de PA de alta exatidão. Dessa forma, as restrições acima demonstradas e que estão associadas ao comportamento passa-banda dos PAs quando excitados por sinais de banda estreita, precisam ser impostas para garantir que apenas contribuições físicas dentro da banda sejam estimadas pelo modelo comportamental passa-baixas (BENEDETTO; BIGLIERI; DAFFARA, 1979; LIMA; CUNHA; PEDRO, 2011).

Duas formas de representar os modelos genéricos de PA se mostram bem promissoras: filtros polinomiais e redes neurais artificiais (RNAs). Ambas são capazes de estimar os efeitos não lineares e dinâmicos observados no PA. As redes neurais artificiais são o foco de estudo deste trabalho e são abordadas no capítulo seguinte. = cos(1 + ) + 1 2 cos 0 + 0 + + 1 2 cos 2 + 2 + 1 4 cos 3 + 3 + 3 4 cos(1 + ) O - termos ímpares O - termos pares - contribuições físicas

(32)

3 REDES NEURAIS ARTIFICIAIS

As redes neurais artificiais são modelos matemáticos que têm como base emular o funcionamento do neurônio humano a fim de processar problemas complexos com dados não lineares e com certo nível de ruído. Os elementos básicos de uma RNA são: um conjunto de neurônios artificiais, seu padrão de conectividade e um método para determinar os pesos (ou treinamento da rede). Modificando e combinando esses três aspectos de uma RNA pode-se construir uma variedade extensa de modelos adaptados a um determinado problema.

Os neurônios são as unidades básicas do cérebro e da inteligência biológica e, da mesma forma, um modelo de neurônio é a unidade de processamento básica de uma rede neural artificial (HAYKIN, 2001). Na Figura 13 se identificam três elementos básicos de um modelo neural:

Figura 13 – Modelo não linear de um neurônio. FONTE: HAYKIN (2001)

(a) um conjunto de sinapses ou elos de conexão, caracterizadas por um peso. Especificamente, um sinal na entrada da sinapse conectada ao neurônio é multiplicado pelo peso sináptico ;

(b) um somador que soma os sinais de entrada ponderados pelas respectivas sinapses do neurônio e, nesse caso, insere um bias aplicado externamente por ;

w

Pesos sinápticos Entradas Somador Função de ativação Saída

.

Bias

. .

.

. .

.

(33)

(c) uma função de ativação para restringir a amplitude de saída de um neurônio.

Essas operações podem ser traduzidas por:

= ( ∑ ) + , (6)

e

= ( ), (7)

onde , , … , são os sinais de entrada; , , … , são os pesos sinápticos do neurônio ; é a saída do combinador linear; é o bias; (. ) é a função de ativação; é o sinal de saída do neurônio (HAYKIN, 2001).

De acordo com o problema que se processa, podem-se usar diversos tipos de funções de ativação. A mais comum é a função sigmoide, e um exemplo de função sigmoide é a função logística dada por:

( ) = ( ), (8)

onde é o parâmetro de inclinação da função sigmoide. Sua forma pode ser vista na Figura 14 (a). Variando obtêm-se diferentes inclinações na função. A função logística assume valores contínuos de 0 a 1 e é diferenciável (HAYKIN, 2001).

Outra função sigmoide bem utilizada é a função sinal, visualizada na Figura 14 (b). Ela assume valores de -1 a +1, tendo neste caso uma forma assimétrica em relação à origem e traz, em certos casos, benefícios analíticos (HAYKIN, 2001).

Uma forma correspondente é representada pela função tangente hiperbólica definida por:

(34)

Figura 14 – Funções sigmoides com inclinação variável. FONTE: O autor (2015)

Um modelo de RNA largamente utilizado para modelagem de PAs, e que será empregado neste trabalho, é a MLP (LEUNG; HAYKIN, 1991). Na Figura 15 é mostrado o diagrama de blocos de uma arquitetura típica MLP tendo E entradas, R neurônios na camada escondida e S saídas. Observe que os nós de cada camada são totalmente conectados, significando que um neurônio de qualquer camada está conectado a todos os neurônios da camada anterior.

Figura 15 – Diagrama de blocos da rede de múltiplas camadas MLP. FONTE: O autor (2015)

No subcapítulo posterior será apresentado o algoritmo de aprendizagem utilizado juntamente com a arquitetura MLP da Figura 15.

(35)

3.1 TREINAMENTO DA REDE MLP

Depois de escolhida a classe e a arquitetura da RNA, aqui a arquitetura MLP com três camadas, o próximo passo para a solução de problemas é a escolha da regra de aprendizagem e de um algoritmo para implementá-la. O algoritmo que tem apresentado bons resultados em realizar o treinamento de redes MLP de forma supervisionada é o algoritmo de retropropagação (do termo em inglês backpropagation) e é baseado na regra de aprendizagem por correção de erro.

A ideia da aprendizagem pode ser subjetiva. Uma definição no contexto de redes neurais é dada por (MENDEL; MCLAREN, 1970):

Aprendizagem é um processo pelo qual os coeficientes livres de uma rede neural são adaptados através de um processo de estimulação pelo ambiente no qual a rede está inserida. O tipo de aprendizagem é determinado pela maneira pela qual a modificação dos coeficientes ocorre.

Na aprendizagem supervisionada, vetores de entrada e saída são apresentados para a rede. Então, através de ajustes iterativos de seus pesos e bias, de acordo com as regras definidas pelo algoritmo de retropropagação, extraem-se automaticamente as características que esse padrão de entrada-saída representa.

A aprendizagem por retropropagação consiste em duas etapas: 1) um passo para frente, a propagação; e 2) um passo para trás, a retropropagação. No primeiro passo, um vetor de entrada é aplicado à rede, que propaga esse sinal para frente, camada por camada. É produzido então um vetor de saída de resposta da rede. As equações que descrevem a propagação do sinal pela rede são as equações (6) e (7). Na segunda etapa, um sinal de erro é propagado para trás através da rede corrigindo seus pesos sinápticos. O sinal de erro é obtido pela diferença do sinal resposta gerado pela rede com o sinal desejado (ou resposta alvo).

Os pesos são ajustados iterativamente para que a resposta da rede se aproxime da resposta desejada, minimizando o sinal de erro. Daí ser um algoritmo de aprendizagem por correção de erro.

O algoritmo retropropagação é uma generalização do algoritmo do mínimo quadrado médio (LMS), já que este é utilizado para o ajuste dos coeficientes livres de um único neurônio linear, como na Figura 13 (HAYKIN, 2001). A ideia geral

(36)

desses algoritmos é agir como um filtro passa-baixas, deixando passar as componentes de baixa frequência de erro e atenuar suas componentes de alta frequência (HAYKIN, 1996a e 1996b).

Para dar prosseguimento com a apresentação das equações do algoritmo de retropropagação serão definidas algumas notações.

No grafo da Figura 16, observa-se em detalhes o fluxo do sinal de entrada até a saída. Os índices i, k e j se referem aos neurônios da camada de entrada, de saída e da camada intermediária, respectivamente; n é a n-ésima iteração ao qual a rede é submetida; (n) é o sinal de entrada do i-ésimo neurônio de entrada na iteração n, e é o sinal de entrada do j-ésimo neurônio da camada intermediária na iteração n; (. ) é a função de ativação de cada camada; e é o peso sináptico conectando a saída do neurônio i à entrada do neurônio j, na iteração n e, da mesma forma, é o peso sináptico conectando a saída do neurônio j à entrada do neurônio k, na iteração n (HAYKIN, 2001).

Figura 16 – Grafo do fluxo do sinal na rede MLP. FONTE: Modificado pelo autor de HAYKIN (2001)

O sinal de erro na saída do neurônio k (nó de saída), na iteração n, é definido por: ( ) = ( ) − ( ), (10) -1 ( ) ( ) ( . ) ( ) + ( ) ... ... = + ( ) ( . ) ... .. .

(37)

onde ( ) é o sinal de saída desejado da rede, na iteração n, e ( ) é o sinal de saída da rede, na iteração n.

Matematicamente a aprendizagem por retropropagação utiliza a ideia de descida de gradiente no espaço de pesos, isto é, busca uma direção para a mudança de pesos onde o valor da função de custo se reduza (HAYKIN, 2001). A função de custo é o valor instantâneo da energia total do erro dada por:

( ) = ∑ ( ), (11)

onde o conjunto C inclui todos os neurônios da camada de saída da rede.

A correção dos pesos, tanto da saída como da entrada, é então definida pela regra delta: çã ∆ ( ) = â ( ) ô . (12)

Se o peso sináptico a ser ajustado é o, , então o sinal de entrada do neurônio é o . E, da mesma forma, para , o sinal de entrada é o . O gradiente local também varia se estamos lidando com o neurônio j ou k:

( ) =

( ) ( ) para o neurônio da camada de saída

(13) ( ) ( ) ( ) para o neurônio da camada oculta

onde o apóstrofo em ′( . ) representa a diferenciação em relação ao argumento ( ), que é o sinal aplicado à função de ativação (soma ponderada de todas as entradas sinápticas acrescida do bias) (HAYKIN, 2001).

A taxa de aprendizagem define a taxa de progressão do processo de aprendizagem. Para de valores pequenos o processo adaptativo converge mais lentamente e ∆ ( ) possui, por conseguinte, valores menores (HAYKIN, 2001).

Então, o novo peso é obtido somando-se o valor correção de acordo com a regra delta:

(38)

= + ∆ . (14)

Resumindo, o algoritmo de retropropagação efetua iterações de correção dos pesos sucessivamente, de acordo com a regra delta dada em (13), a fim de achar os pesos ótimos que traduzam o padrão de comportamento dado pelos vetores de entrada e saída apresentados à rede. E esse processo continua até que o número de iterações designado seja atingido ou até que a função custo seja reduzida ao valor desejado.

No próximo subcapítulo serão detalhados os modelos de PA e PD baseados em MLP existentes.

3.2 ESTADO DA ARTE DE MLP EM MODELAGEM DE PA E PD

RNAs têm sido usualmente utilizadas na modelagem de PAs, principalmente por sua capacidade de modelar sistemas não lineares, e tem lidado de forma promissora com as distorções nos canais de comunicação em várias publicações (CHEN et al., 1990; MULGREW, 1996; KANTSILA; LEHTOKANGAS; SAARINEM, 2004). Aqui, são utilizados e estudados apenas modelos que utilizam redes MLP reais. Dessa forma, para se processar o sinal de envoltória complexa de um PA é necessária a decomposição do sinal complexo em componentes reais.

Na literatura, modelos comportamentais baseados em MLP de valores reais primeiramente decompõem os valores de envoltória complexa nos componentes em fase = | | cos( + ) e em quadratura = | | sin( + ) e os aplicam como entradas independentes na MLP. Além disso, o MLP tem duas saídas que estimam os valores instantâneos e reais das componentes em fase = | | cos ( + + ) e em quadratura = | | sin ( + + ) do sinal complexo de saída do PA, como mostrado na Figura 17. A fim de retornar ao sinal original complexo é feita a somatória da componente em fase com a componente em quadratura multiplicada por (imaginário puro). Para inserir o comportamento dinâmico dos PAs a rede MLP

(39)

necessita da entrada instantânea do sinal de entrada ( ) e das respectivas amostras passadas ( − ), sendo a profundidade de memória.

Além disso, a arquitetura de MLP mostrada na Figura 17 também tem sido utilizada na literatura para PD, de acordo com a técnica de aprendizagem indireta, como visto no Subcapítulo 2.2.

Figura 17 – Diagrama de blocos de um modelo de PA baseado em MLP usualmente utilizado.

FONTE: Modificado pelo autor de LIMA; CUNHA; PEDRO (2011)

Quando aplicado como PD, invertem-se os papeis da entrada e saída medidas no PA, conforme mostra a Figura 18. Ou seja, as entradas da MLP são as saídas (instantâneas e passadas) medidas no PA, enquanto que as saídas da MLP estimam a envoltória complexa aplicada na entrada (e no instante atual) do PA. Os coeficientes da rede são identificados de tal forma a minimizar o erro entre a entrada aplicada no PA e a saída estimada pelo modelo MLP.

Figura 18 – PD derivado do modelo de PA.

FONTE: Modificado pelo autor de FREIRE; LIMA (2014) 1

z

( )

y n

j

( )

I

x n

( )

Q

y n

MLP

1

z

 

( )

I

y n

( )

Q

x n

(

)

I

x n M

(

)

Q

x n M

1

z

 

j

( )

I

y n

( )

Q

x n

MLP

1

z

 

( )

I

x n

( )

Q

y n

(

)

I

y n M

(

)

Q

y n M

( )

x n

(40)

Entretanto, em LIMA; CUNHA; PEDRO (2011) foi verificado que, quando o modelo da Figura 17 é aplicado para a modelagem de PA, o mesmo não obedece às restrições impostas pela natureza passa-banda do PA.

Pode-se averiguar essa afirmação introduzindo o sinal de entrada do modelo = | | cos( + ), em uma função ímpar de terceiro grau:

= (15)

Daí tem-se, que:

( ) = | | cos ( + ) = | | (3

4 cos( + ) + 1

4 cos(3 + 3 )) (16)

Prova-se então que contribuições não físicas são geradas, de acordo com o termo fora do canal principal, cos(3 + 3 ).

Em LIMA; CUNHA; PEDRO (2011) foi proposto um modelo de PA, reproduzido na Figura 19, que garante o cumprimento das restrições físicas detalhadas na Seção 2.3.4. Cumpre ressaltar que este modelo proposto em LIMA; CUNHA; PEDRO (2011) não foi aplicado para PD e, na literatura, não se encontram trabalhos onde é analisado o impacto da natureza passa-banda sobre o PD. Em outras palavras, não é conhecido se o modelo da Figura 19, quando utilizado como PD, gera contribuições não físicas que não contribuem para a linearização do PA. Essa questão será analisada no Capítulo 4. Além disso, observe que os modelos de PA das Figuras 17 e 19 usam uma única rede MLP de duas saídas.

(41)

Figura 19 – Diagrama de blocos de modelo de PA utilizando MLP. FONTE: Modificado pelo autor de LIMA; CUNHA; PEDRO (2011)

( )

x n

MLP

1

sin(

n

n

)

1

cos(

n

n

)

1

sin(

n M

n M

)

1

cos(

n M

n M

)

exp (.)

j

( )

y n

( )

y n

n

n

( ) (

)

x n

n

M

1

z

1

z

1

z

(42)

4 NOVA ABORDAGEM PARA MODELAGEM COMPORTAMENTAL E PRÉ-DISTORÇÃO DIGITAL DE AMPLIFICADORES DE POTÊNCIA

Neste capítulo, as principais contribuições do trabalho são apresentadas. No Subcapítulo 4.1, inicialmente são investigados os efeitos do comportamento passa-banda nos modelos PD, então uma nova arquitetura de modelo PD é proposta no Subcapítulo 4.2. Ao final, esse modelo proposto é testado comparativamente com outro modelo anterior na Seção 4.5.1. Ainda, no Subcapítulo 4.3 é proposta uma nova abordagem para a modelagem comportamental de PAs utilizando, em vez de uma, duas redes MLPs. Na sequência, na Seção 4.5.2, é feito seu teste comparativamente com a modelagem baseada em MLP de uma única rede.

4.1 RESTRIÇÕES DO COMPORTAMENTO PASSA-BANDA APLICADO A PD

Até agora foi visto que um modelo de PA deve seguir algumas restrições impostas pela natureza passa-banda do PA (Seção 2.3.4). O objetivo desse subcapítulo é investigar se essas mesmas restrições devem ser impostas ao operador [ . ] do PD (como visto na Figura 5). Define-se o operador [ . ] como sendo a função característica do comportamento do PD. É investigado se, para compensar os efeitos não lineares de um sistema passa-banda, o operador [ . ] pode ser escolhido arbitrariamente ou deve cumprir com algum requisito.

Na conexão em cascata, o sistema PD é colocado antes do PA (Figura 5). Se o sinal aplicado à entrada do PD é y, então o operador [ . ] do PD deve satisfazer:

[ (y)] = y, (17)

onde [ . ] é o modelo equivalente passa-baixas do PA. O diagrama de blocos da Figura 20 (a) representa essa relação. De acordo com a Seção 2.3.4, para satisfazer as restrições impostas pela natureza passa-banda no caso sem memória, [ . ] se restringe a:

(43)

( ) = (| |), (18)

onde um novo operador é definido, sendo que é uma função de uma variável real. O diagrama de blocos da Figura 20 (c) representa essa relação. Após algumas manipulações algébricas, pode ser mostrado que o operador do PD precisa cumprir com a seguinte restrição (FREIRE; LIMA, 2014):

O diagrama de blocos da Figura 20 (b) representa a relação dada em (19). Pode-se observar que o operador [ . ] do PD, obedece às mesmas imposições que o operador [ . ]. Prova-se, dessa forma, que os modelos de PDs baseados nos modelos de PA necessariamente devem respeitar as restrições impostas pelo comportamento passa-banda do PA, já que são equivalentes. Uma melhor visualização da análise acima é feita através da Figura 20.

Figura 20 - Diagrama de blocos que resume a análise matemática dada pelas equações (17) – (a), (18) – (c) e (19) – (b).

FONTE: O autor (2015)

Ainda, manipulando (17), (18) e (19), podemos relacionar e com:

(| |) [| || (| |)|] = 1. (20) PD (. ) PA (. ) ( ) = . (. ) = ( ) ( ) = . (. ) ( ) (a) (b) (c) (y) = (| |), (19)

(44)

De (20) observa-se que o operador [ . ] deve ter paridade ímpar com relação ao sinal de envoltória complexa y aplicado à entrada do PD. Lembrando ainda que, a paridade ímpar é uma condição necessária, mas não suficiente, como visto na Seção 2.3.4, sendo necessário ainda manter o valor escalar unitário multiplicando a frequência da portadora, , nos sinais submetidos ao operador [ . ].

É imediato se ver que, independentemente da escolha particular feita para a função de ativação do MLP, o sistema PD baseado em MLP da Figura 18 não respeita as restrições dadas por (19). Isso ocorre devido ao fato de que as entradas do MLP estão intrinsicamente relacionadas à frequência da portadora e as funções de ativação do MLP podem facilmente gerar contribuições fora da banda, como elucidado na Figura 12.

No próximo subcapítulo será apresentado um modelo de PD que satisfaz às restrições impostas pelo comportamento passa-banda dos PAs.

4.2 MODELO DE PD PROPOSTO

Agora, é proposto um modelo PD baseado em MLP que diferentemente das abordagens anteriores, obedece às restrições vistas no Subcapítulo 4.1. A estratégia adotada aqui é modificar os sinais aplicados à entrada do MLP, de tal forma que se remova completamente a sua relação com a frequência da portadora. A amplitude de um sinal de envoltória, por definição, não tem conexão com a frequência da portadora, então não necessita de qualquer modificação. Por outro lado, a fase em um sinal de envoltória ( ) é sempre associada à frequência da portadora por ( + ). A fim de remover essa relação da fase da envoltória com a frequência da portadora é suficiente fazer a diferença entre duas informações de fase arbitrárias, ( + ) − ( + ) = ( − ) (LIMA; CUNHA; PEDRO, 2011). Com isso em mente, o modelo de PD baseado em MLP proposto é mostrado na Figura 21.

(45)

Figura 21 – Diagrama de blocos do modelo de PD proposto. FONTE: FREIRE; LIMA (2014)

As saídas do MLP também foram modificadas porque agora todas as saídas são de fato sinais em banda base não tendo relação com a frequência da portadora. As operações feitas sobre as saídas do MLP mostradas na Figura 21 apenas restauram a conexão intrínseca entre o ângulo polar do valor complexo da envoltória e a frequência da portadora. Também é necessário manter, no sinal de saída do PA, o valor escalar unitário multiplicando a frequência da portadora requerida pela natureza passa-banda do transmissor sem fio, uma vez que os sistemas físicos de PA relacionam sinais passa-banda centrados em , modulados por envoltórias de valores complexos. De novo, para inserir os efeitos de memória, o MLP tem as entradas instantâneas, bem como as amostras passadas de acordo com a profundidade de memória M escolhida.

4.3 MODELAGEM COMPORTAMENTAL PROPOSTA DE PAs COM DUAS REDES MLPs

Na arquitetura MLP, conforme mostra a Figura 15, o sinal z na saída da função de ativação pode ser interpretado como sendo um elemento de um espaço Z de dimensão R, de acordo com Z = z , z , … , z . O espaço amostral Z

MLP

1

sin(

n

n

)

1

cos(

n

n

)

1

sin(

n M

n M

)

1

cos(

n M 

n M

)

exp (.)

j

( )

x n

| ( ) |

x n

n

n

| (

y n M

) |

1

z

1

z

1

z

| ( ) |

y n

(46)

então é um conjunto de funções definidas pelo sinal de entrada e pelos pesos da rede.

De forma mais genérica, as RNAs para modelagem de sistemas têm o objetivo de realizar aproximação de funções. Assim, define-se a ação de uma RNA como sendo: em uma área compacta Z do espaço de entrada descrever uma função

( ), pela combinação de funções ( ) mais simples (CHEN, 1999).

A função ( ) é a função objetivo e a função pertencente ao espaço Z que melhor descreve ( ) é aqui chamada de função ótima ( , ) e é obtida de acordo com :

onde são elementos reais do vetor de pesos = [ , … , ]; R é o número de neurônios e são chamadas funções elementares.

O critério para a escolha da função ótima é dada por:

e é arbitrariamente pequeno. Em uma MLP os são os pesos e o bias de saída e os são os sinais de saída da função de ativação acrescidos de uma função unitária que multiplica o bias de saída.

Dessa forma, cada saída de uma RNA pode ser vista como a melhor projeção de um sinal no espaço amostral Z. Esta tarefa é chamada de aproximação de funções, em particular designada de regressão linear, neste exemplo com o uso de topologias lineares.

Os dois sinais que se desejam estimar nas saídas da RNA, a amplitude e a fase da envoltória complexa, têm características bem distintas um do outro, como se pode observar na Figura 22. E ao se utilizar apenas uma RNA, estão-se projetando esses dois sinais em apenas um espaço amostral Z (FREIRE; DE FRANÇA; LIMA, 2014).

( , ) = ∑ ( ), (21)

Referências

Documentos relacionados

Em seguida aborda-se estresse e seu contexto geral: tipologias de estresse, estresse ocupacional, fontes de tensão no trabalho, sintomas de estresse, estratégias de

Também, em sua maior parte (96%), não recebiam orientação contábil. A partir deste dado, procuramos relacionar a idade destas com a orientação contábil recebida e

Analisando as aplicações relevantes desse capítulo fica nítido que o produto de pirólise de resíduos poliméricos tem um potencial enorme para aplicações comerciais e

c.4) Não ocorrerá o cancelamento do contrato de seguro cujo prêmio tenha sido pago a vista, mediante financiamento obtido junto a instituições financeiras, no

Se houver um segundo turno na eleição para presidente e os candidatos fossem esses que vou ler, em qual dos dois o(a) sr(a) votaria para presidente? Pode não somar 100 devido

Foram ainda denunciados nessa fase: Alberto Youssef, doleiro; Paulo Roberto Costa, ex-diretor de Abastecimento da Petrobras; Waldomiro de Oliveira, dono da MO

Considerando que a maioria dos dirigentes destas entidades constituem-se de mão de obra voluntária e na maioria das vezes sem formação adequada para o processo de gestão e tendo

O objetivo deste trabalho foi realizar o inventário florestal em floresta em restauração no município de São Sebastião da Vargem Alegre, para posterior