• Nenhum resultado encontrado

Separação cega de sinais em sistemas ópticos com multiplexação de polarização

N/A
N/A
Protected

Academic year: 2021

Share "Separação cega de sinais em sistemas ópticos com multiplexação de polarização"

Copied!
95
0
0

Texto

(1)

Separação cega de sinais em sistemas ópticos com

multiplexação de polarização

Faculdade de Engenharia Elétrica e de Computação

Dissertação de Mestrado apresentada à Faculdade de Engenharia Elétrica e de Computação como parte dos requisitos para obtenção do título de Mestre em Engenharia Elétrica.

Orientador: João Marcos Travassos Romano

Campinas, SP 2010

(2)
(3)
(4)

A multiplexação de polarização é uma técnica promissora que permite dobrar a capacidade de transmissão das próximas gerações de sistemas de comunicações ópticas operando a 40 Gb/s. Tais sistemas são dependentes de processamento digital de sinais, tanto para efetuar a separação dos sinais multiplexados em polarização, quanto para combater degradações impostas pelo canal óptico. Em geral, técnicas não supervisionadas como o algoritmo do módulo constante (CMA -Constant Modulus Algorithm) multiusuário são utilizadas para realizar a separação e a equalização simultaneamente. No entanto, este método apresenta algumas desvantagens, em especial a possibilidade de perda de um dos sinais transmitidos quando o sistema apresenta perda dependente de polarização. Este trabalho propõe uma nova estrutura de demultiplexação usando uma técnica de separação conhecida como análise de componentes independentes em conjunto com um equalizador adaptado pelo algoritmo do módulo constante. A técnica proposta é avaliada por meio de simulações, confirmando-se um bom desempenho diante das principais distorções lineares presentes em sistemas de comunicação óptica e verificando-se uma maior robustez em termos de perda dependente de polarização.

(5)

Abstract

Polarization multiplexing is a promising technique, able to double the capacity of next generation optical communication systems working at 40 Gb/s. Such systems are dependent of digital signal processing, both to separate the signals in multiplexed polarization, and to combat impairments imposed by optical channel. In general, unsupervised techniques such as multiuser CMA (Constant Modulus Algorithm)are used to perform the separation and equalization simultaneously. However, this method has some drawbacks, in particular the possibility of losing one of the signals when the system has polarization dependent loss. This work proposes a new structure for demultiplexing employing a separation technique known as independent component analysis in conjunction with an equalizer adapted by the constant modulus algorithm. The proposed technique is evaluated through simulations, confirming the good performance in front of the main linear distortions present in optical communication systems and being more robust in terms of polarization dependent loss.

(6)

Naturalmente, Outubro sabia que o ato de virar uma página, terminar um capítulo ou fechar um livro não encerrava a história. Tendo admitido isso, reconheceria também que finais felizes não eram difíceis de encontrar: “É apenas uma questão”, explicou para Abril, “de encontrar um canto ensolarado num jardim, onde a luz é dourada e a grama é macia; um local para descansar, parar de ler e ficar satisfeito”. – Estação das Brumas, Neil Gaiman.

(7)

A minha querida esposa Priscila, pelo amor e carinho em todos os momentos. Agradeço especialmente pela dedicação durante a reta final deste trabalho, além da indispensável ajuda com a edição de diversas figuras desta dissertação.

Aos meus pais, Horácio e Maria José, aos meus irmãos Elis e Renato, e ao meu sobrinho Leonardo, pelo constante apoio e incentivo.

Ao professor João Marcos pela acolhida, orientação e confiança.

Ao professor Hélio Waldman pelo apoio desde a graduação, e pela cuidadosa revisão deste trabalho.

Ao professor Renato Lopes pelas frutíferas discussões desde o início do mestrado, pelas sugestões e correções.

Ao professor Darli Mello, pela amizade e pela sua inestimável orientação durante a graduação.

Aos amigos do DSPCom, Romis, Everton, Diogo, Kasuo, Krummen, Gremista, Fabiano, Marcos, Tiago, Marco, Michel, Tiago “Gaúcho”, Murilo, Glauco, Filipe, Fábio, Cris, Levi, Michele, Cynthia, Celi, e demais colegas do laboratório, pela convivência fraterna, pelos momentos de descontração, pelos jogos e brincadeiras, pelo apoio em diversas situações e pelas inúmeras e extremamente proveitosas discussões.

Em especial agradeço aos meus amigos Suyama e Léo, dois eternos membros do

(8)

DSPCom, que em conjunto me orientaram durante todo o mestrado, fazendo com que esse trabalho fosse possível.

A todos os meus amigos, os colegas e alunos do cursinho Herbert de Souza, do curso de agroecologia do MST, os colegas do COTUCA e da UNICAMP. Em especial aos meu amigos de longa data Diogo, Cão e Pedro.

Aos funcionários pelo apoio em diversas situações. Em especial agradeço à Noêmia, Edison, Mazé, Samuel e Washigton.

(9)

Lista de Figuras xi

1 Introdução 1

1.1 Objetivos e organização da dissertação . . . 6

2 Sistemas de comunicações ópticas 8 2.1 Formatos de modulação em sistemas ópticos . . . 9

2.2 Transmissores ópticos . . . 11

2.3 Receptores ópticos . . . 15

2.3.1 Recepção coerente . . . 16

2.4 Multiplexação de polarização . . . 18

2.5 Modelo do canal óptico . . . 20

2.5.1 Dispersão cromática . . . 21

2.5.2 Dispersão por modo de polarização . . . 22

2.5.3 Perda dependente de polarização . . . 25

2.5.4 Ruído . . . 26

2.6 Modelo linear do canal . . . 27

2.7 Sumário . . . 28

3 Equalização digital em sistemas PDM 30 3.1 Equalização Supervisionada . . . 31

3.1.1 Critério de Wiener . . . 33

3.1.2 O Método do Gradiente e o Algoritmo LMS . . . 34

3.2 Equalização não-supervisionada . . . 36 ix

(10)

3.2.1 O critério do Módulo Constante . . . 37

3.3 Equalização de um sistema MIMO . . . 40

3.3.1 O CMA multiusuário . . . 42

3.4 O CMA multiusuário na equalização de sistemas PDM . . . 44

3.5 Sumário . . . 45

4 Separação Cega de Fontes 47 4.1 Formalização da BSS . . . 49

4.2 Análise de Componentes Independentes . . . 51

4.3 Critérios para ICA . . . 55

4.3.1 Correlação não-linear . . . 55

4.3.2 Maximização de não-gaussianidade . . . 57

4.3.3 Explorando de estatísticas de ordem superior . . . 58

4.3.4 Outros critérios de separação . . . 59

4.4 Algoritmos baseados em ICA . . . 61

4.4.1 FastICA . . . 62

4.4.2 JADE . . . 63

4.4.3 CFICA . . . 64

4.5 Sumário . . . 66

5 Aplicação de ICA em Sistemas Ópticos PDM 67 5.1 Modelo de Mistura em Sistemas PDM . . . 68

5.2 Cenários simulados e resultados . . . 69

5.2.1 Perda de Fontes em função da PDL . . . 71

5.2.2 Desempenho em frente à dispersão cromática e PMD . . . 72

5.2.3 Desempenho na Presença de Ruído . . . 74

5.3 Considerações sobre os resultados . . . 76

6 Conclusões e Perspectivas 78 Referências . . . 80

(11)

2.1 Diagrama de um sistema PDM com recepção coerente e

processamento digital de sinais . . . 20

2.2 Modelo em treliça de PMD de ordem superior. . . 24

3.1 Processamento digital de sinais para recuperação dos sinais transmitidos 31 3.2 Canal SISO com equalização supervisionada . . . 32

3.3 Canal SISO com equalização dirigida por decisão (DD) . . . 36

3.4 Modelo de canal e equalizador MIMO com dois transmissores e três receptores . . . 41

3.5 Equalizador MIMO FIR de um sistema PDM . . . 44

4.1 Processo genérico de mistura e separação . . . 48

4.2 Processo de mistura instantânea (a) e convolutiva (b) em um caso com duas fontes e duas misturas . . . 51

4.3 Estrutura de separação do método de Hérault, Jutten e Ans . . . 52

4.4 Estrutura de separação utilizando uma rede neural artificial . . . 60

5.1 Modelo simplificado do canal e estrutura de separação . . . 69

5.2 Perda de fontes em função da PDL. Cenário com 400 ps/nm de dispersão cromática e ausência de PMD . . . 72

5.3 Erro quadrático médio em função da dispersão cromática . . . 73

5.4 Erro quadrático médio em função da PMD . . . 73

5.5 Relação sinal-ruído requerida para uma taxa de erro de bit igual à 10−3 em função da dispersão cromática. . . 75

(12)

5.6 Relação sinal-ruído requerida para uma taxa de erro de bit igual à 10−3 em função da PMD. . . 76

(13)

1

Introdução

O desenvolvimento dos sistemas de comunicações ópticas se deu de forma distinta dos demais sistemas de telecomunicações. As limitações de banda e potência, em sistemas com e sem fio, impulsionaram o desenvolvimento de um vasto ferramental em processamento digital de sinais, novos formatos de modulação e codificação. Nenhuma destas inovações foi aplicada de forma ampla em sistemas ópticos comerciais. O desenvolvimento da tecnologia de sistemas com multiplexação por divisão de comprimento de onda (WDM - Wavelength Division Multiplexing) permitiu explorar a extensa banda de operação das fibras ópticas. Ao mesmo tempo, os amplificadores ópticos, em especial os amplificadores de fibra dopada a érbio (EDFA - Erbium Doped Fiber Amplifier), aliados à baixa atenuação das fibras ópticas, viabilizaram enlaces de longas distâncias, incluindo sistemas transoceânicos, sem necessidade de regeneradores elétricos.

Até o fim do século XX, as distorções impostas pela fibra também foram quase que exclusivamente combatidas no domínio óptico. A dispersão cromática (CD

(14)

- Chromatic Dispersion), a principal degradação linear em sistemas até 2,5 Gb/s por canal, é em geral equalizada com fibras compensadoras de dispersão (DCF -Dispersion Compensating Fiber) ou filtros baseados em grades de Bragg. Estas soluções aplicadas à camada física dos sistemas ópticos garantiram a evolução da capacidade de transmissão utilizando designs de sistemas bastante simples, e sem o emprego de processamento digital de sinais (DSP - Digital Signal Processing). No entanto, a inserção de códigos corretores de erro (FEC - Feedforward Error Correcting) com adição de 7 % de overhead é comum em sistemas amplificados, devido ao ruído óptico acumulado nestes enlaces.

Técnicas de equalização digital só começaram a ser aplicadas em alguns enlaces de 10 Gb/s por canal. Com taxas tão elevadas, algumas distorções que antes tinham efeito minoritário, como a dispersão por modo de polarização (PMD -Polarization Mode Dispersion) e dispersão cromática residual, passaram a limitar o desempenho destes sistemas. Dentre as soluções mais utilizadas estão estimadores de máxima verossimilhança (MLSE - Maximum Likelyhood Sequence Estimator), disponibilizados comercialmente nos últimos 5 anos. Esta e demais soluções utilizando processamento de sinais foram tardiamente empregadas por conta da falta de componentes capazes em operar nas altas taxas destes sistemas, em especial de conversores analógicos-digitais com taxas de amostragem altas o suficiente. Foi apenas recentemente que conversores AD operando com 20 Gamostras/s e com 3 bits de resolução foram disponibilizados.

Sistemas ópticos transmitindo a 10 Gb/s por canal, com até 30 portadoras ópticas espaçadas de 100 GHz, são hoje bastante difundidos. Mesmo nestes sistemas de alta capacidade, a banda disponível da fibra é pouco ocupada, permitindo o uso de formatos de modulação simples e com baixa eficiência espectral, majoritariamente o chaveamento liga-desliga (OOK - On-Off Keying) e detecção direta. Além disso, a baixa taxa de ocupação das fibras instaladas, algo entre 1 e 10 %, permite que a curto prazo a demanda por taxas de transmissões maiores possa ser suprida com a ativação de fibras escuras.

No entanto, o aumento do número de usuários, a oferta de novos serviços e demanda por conexões de banda larga alavancaram o aumento do tráfego da internet, que aproximadamente dobra a cada ano. Mantido este ritmo de

(15)

crescimento, e utilizando-se das tecnologias atuais, as redes de fibras ópticas instaladas ficariam saturadas entre três e sete anos. O elevado custo para a ampliação da infraestrutura de redes de fibras ópticas incentiva a busca por formas mais eficientes do uso do espectro da fibras atualmente disponíveis. Para este objetivo, existem principalmente dois caminhos: o aumento do número de portadoras transmitidas por fibra, com a redução do espaçamento entre portadoras para 50 ou 25 GHz, e o aumento da taxa de transmissão por canal, inicialmente para 40 Gb/s e em seguida para 100 Gb/s.

A utilização conjunta dos dois métodos citados acima leva à necessidade de formatos de modulação com maior eficiência espectral. Além disso, o impacto de degradações que não podem ser facilmente equalizadas no domínio óptico é salientado, e novos formatos com maior robustez a estas degradações também são necessários. Diversas técnicas vêm sendo discutidas, entre elas:

• Formatos multiníveis, em especial os formatos DQPSK, 8PSK e 16-QAM. Também são incluídos nesta categoria os formatos pseudo-ternários como o duobinário, que também apresentam maior eficiência espectral que o OOK. . • Supressão total, SSB, ou parcial, VSB, de uma das bandas laterais do espectro,

com ganhos de eficiência espectral.

• OFDM óptico, especialmente estudado para sistemas com taxa de 100 Gb/s por canal, com grande resistência a diversas degradações.

• Utilização da diversidade de polarização das fibras monomodo, que permite a transmissão de duas sequências de dados multiplexadas em polarização, técnica conhecida como PDM (Polarization Division Multiplexing), dobrando a eficiência espectral.

Utilizar estes formatos em sistemas ópticos traz diversos desafios. Formatos que requeiram grande complexidade computacional como o OFDM são limitados devido a restrições de hardware atualmente disponíveis. Do mesmo modo, formatos multiníveis e com supressão de banda encontram dificuldades técnicas de implementação. Além disso, uma vez que os receptores de detecção direta

(16)

são sensíveis apenas à amplitude do sinal recebido, novos modelos de recepção são necessários para a maior parte dos formatos citados. As propostas para estes novos receptores se dividem em dois grupos:

• Receptores não-coerentes - incluindo receptores diferenciais utilizando interferometria, capazes de detectar formatos modulados exclusivamente em fase como DQPSK. Alguns trabalhos indicam que estes receptores possuem uma maior robustez a não linearidades. Os formatos com supressão de banda e OFDM não-coerente também podem utilizar receptores desta categoria. • Receptores coerentes - apresentam maior sensibilidade e podem ser utilizados

para detectar qualquer um dos formatos citados, além de facilitarem a multiplexação de polarização. Eles também apresentam a vantagem de seletividade, que pode ser explorada para criação de sistemas WDM mais densos.

Os receptores coerentes foram inicialmente estudados na década de 80, numa tentativa de aumentar a distância entre regeneradores elétricos nos enlaces, aproveitando-se da maior sensibilidade destes receptores em comparação com os de detecção direta. Estes receptores utilizavam um laser funcionando como oscilador local, cuja fase deveria ser controlada por um PLL (Phase-Locked Loop) óptico, de modo a combater o ruído de fase presente tanto no laser de transmissão como no oscilador local. A complexidade destes receptores, em especial deste controle de fase, tornou seu uso bastante limitado. Seu desenvolvimento foi enfim deixado de lado com o advento do EDFA, que ofereceu uma solução mais simples e eficiente de lidar com o problema da atenuação nos enlaces.

Foi apenas depois da virada do milênio que os receptores ópticos coerentes voltaram a ser amplamente discutidos. Quando a utilização de formatos de modulação mais avançados que o OOK passou a ser considerada, os receptores coerentes surgiram como uma opção mais eficiente e versátil que os receptores não-coerentes. Contudo, as altas taxas de símbolos praticadas nos sistemas atuais, e os ainda elevados valores de ruído de fase dos lasers comercialmente disponíveis, não permitiram a estratégia de recuperação de portadora com PPL óptico. Ao invés disso, utilizaram-se algoritmos de recuperação de portadora (FFCR - Feed-Forward

(17)

Carrier Recovery), baseados em processamento digital de sinais (E. Ip, J. M. Kahn, 2007).

Noé propôs em (R. Noé, 2005) um esquema de transmissão no formato DQPSK em cada uma das polarizações multiplexadas, utilizando um detector coerente. A idéia da multiplexação de polarização já havia sido explorada anteriormente, porém sem um modelo de receptor que fosse eficiente o bastante para o uso comercial. O redescoberto receptor coerente preencheu esta lacuna. A proposta de Noé também apresentava a vantagem de permitir uma transmissão de 40 Gb/s utilizando um esquema paralelizado de modulação, cujos componentes eletrônicos operam em 10 Gb/s, relaxando consideravelmente os requisitos de hardware. Desde então, o estudo de sistemas empregando receptores coerentes e com multiplexação de polarização, utilizando diversos formatos, cresce continuamente.

A contrário dos sistemas ópticos comercializados até então, estes sistemas são fortemente baseados em processamento digital de sinais. Além da recuperação de portadora e da equalização, é necessário a separação digital dos dados multiplexados em polarização, uma vez que durante a transmissão estes sinais sofrem múltiplos acoplamentos entre as polarizações. Diversas combinações de algoritmos de separação, equalização, recuperação de portadora, formatos de modulação e cenários com diversos tipos de distorções lineares e não-lineares renderam, e ainda rendem, muitos trabalhos acadêmicos (I. Fatadin, D. Ives, S. J. Savory, 2009) (M. Kuscherov, F. N. Hauske, K. Piyawanno, B. Spinnler, M. S. Alfiad, A. Napoli, B. Lankl, 2009) (G. Colavolpe, T. Foggi, E. Forestieni, G. Prati, 2009) (G. Charlet, 2008), embora ainda existam vários pontos a serem explorados. Esta grande diversidade de trabalhos também sinaliza a ausência de um padrão a curto prazo que domine os sistemas de 40 e 100 Gb/s.

Os algoritmos utilizados nesta etapa de processamento também foram inicialmente desenvolvidos para sistemas a cabo ou sem fio, e agora são aplicados a sistemas ópticos. Dentre estas soluções se destacam algoritmos de equalização adaptativa, com objetivo de mitigar distorções lineares impostas pelo canal e realizar a separação dos sinais multiplexados em polarização. Tanto critérios supervisionados quanto não-supervisionados vêm sendo pesquisados, porém com maior ênfase nestes últimos. No entanto, os critérios não-supervisionados mais utilizados, baseados

(18)

em extensões multiusuário do algoritmo de módulo constante (CMA - Constant Modulus Algorithm), possuem alguns problemas de convergência, que podem levar, em algumas situações, à perda de sinais transmitidos. Esta situação é por vezes chamada de singularidade.

Uma alternativa possivelmente mais robusta para a etapa de demultiplexação é utilizar algoritmos desenvolvidos para problemas de Separação Cega de Fontes (BSS - Blind Source Separation). Em BSS, o objetivo é recuperar um conjunto de sinais desconhecidos, as fontes, a partir da observação de suas misturas, obtidas após a passagem por um sistema de mistura também desconhecido. A separação destes sinais se sustenta sobre algum critério que explore características estatísticas conhecidas das fontes. A primeira e mais difundida técnica de separação cega de fontes é a análise por componentes independentes (ICA - Independent Component Analysis), onde se supõe que as fontes são estatisticamente independentes entre si. Os algoritmos baseados em ICA buscam encontrar um sistema separador que, aplicado às misturas, recupere um conjunto de sinais independentes entre si, tal que, dadas algumas restrições, correspondem às fontes. Demonstrações utilizando ICA instantâneo em sistemas PDM back-to-back foram realizadas, e mostraram uma grande robustez ao problema de singularidade (H. Zang, Z. Tao, L. Liu,S. Oda, T. Hoshida, J. C. Rasmussen, 2009). No entanto, as técnicas tradicionais de ICA para misturas com memória, o que, a rigor, é o caso em sistemas de comunicações ópticas, possuem alta complexidade computacional e menor eficiência que métodos voltados para misturas instantâneas.

1.1

Objetivos e organização da dissertação

Neste trabalho propomos um novo esquema de separação e equalização não-supervisionadas de sinais em sistemas com multiplexação de polarização e detecção coerente. Este novo método envolve o uso de algoritmos baseados em análise de componentes independentes para a etapa de separação, e do algoritmo de módulo constante para a equalização. Verificamos os limites desta abordagem utilizando algoritmos de separação para misturas instantâneas, adotando um modelo simplificado de canal, visando uma solução com baixa complexidade e maior

(19)

robustez. Uma solução baseada em ICA para misturas com memória também é apresentada. Os resultados obtidos são comparados com os do CMA multiusuário, um dos algoritmos mais utilizados para separação e equalização de sinais em sistemas PDM.

No capítulo 2, introduzimos os principais componentes dos sistemas ópticos atuais, os formatos de modulação atualmente empregados, as estruturas dos transmissores, receptores, e as principais degradações presentes nestes sistemas. A técnica de multiplexação de polarização é discutida, e um modelo do canal destes sistemas é apresentado.

No capítulo 3, apresentamos os principais critérios, supervisionados e cegos, para equalização adaptativa, assim como os principais algoritmos derivados destes critérios. Abordamos inicialmente equalização de sistemas SISO e, em seguida, mostramos as suas extensões para o caso MIMO, com destaque para o algoritmo CMA multiusuário.

No capítulo 4, abordamos a análise de componentes independentes, o método de separação cega de fontes aplicado para a recuperação dos sinais multiplexados em polarização. Serão apresentados alguns dos critérios utilizados para avaliar a independência entre os sinais, e os algoritmos derivados destes critérios.

No capítulo 5, apresentaremos os métodos propostos para a separação e equalização, baseados em algoritmos de ICA. Através de uma série de simulações, verificamos o desempenho das estruturas propostas em diferentes cenários envolvendo as principais degradações lineares presentes em sistemas de comunicação óptica. Comparamos, através de medidas de taxa de erro e de probabilidade de perda de sinais, o desempenho dos métodos propostos baseados em ICA para misturas instantâneas, para misturas com memória e com o CMA Multiusuário.

Por fim no capítulo 6, apresentamos algumas conclusões sobre os resultados obtidos no trabalho e perspectivas de continuação no tema.

(20)

2

Sistemas de comunicações ópticas

Neste capítulo abordaremos os componentes básicos de um sistema de comunicações ópticas, os métodos de modulação, demodulação e alguns dos formatos de modulação que podem ser utilizados nestes sistemas. Atenção especial será dada aos sistemas com multiplexação de polarização, uma técnica relativamente nova que permite dobrar a eficiência espectral dos sinais transmitidos. Sistemas utilizando multiplexação de polarização, detecção coerente e formatos avançados de modulação figuram como os principais candidatos para transmissões em 40 e 100 Gbits/s, e será este tipo de sistema que será abordado neste trabalho. Também apresentaremos as principais degradações lineares que afetam o desempenho de sistemas multiplexados em polarização, e forneceremos um modelo linear do canal óptico.

(21)

2.1

Formatos de modulação em sistemas ópticos

O processo de modulação consiste em incorporar a informação contida em um sinal de interesse, chamado modulante, a uma onda eletromagnética, chamada portadora, de tal forma que esta informação possa ser recuperada após o processo de demodulação. As características da onda portadora são escolhidas de modo a adequá-la ao meio de transmissão. A informação contida no sinal modulante é incorporada à portadora pela alteração de um ou mais de seus parâmetros, amplitude, fase ou frequência. O método pelo qual estes parâmetros são modificados em função do sinal modulante define o formato de modulação.

Em comunicações digitais, o sinal modulante é uma sequência discreta de símbolos, com valores definidos por um alfabeto finito. Em geral a informação digital é modulada introduzindo variações na amplitude e/ou fase da portadora, de acordo com o valor símbolo a ser transmitido. O sinal modulado pode ser descrito de acordo com a equação 2.1:

s(t) = a(t)cos(ωct + θ(t)), (2.1)

onde s(t) é a onda com frequência angular ωc, modulada de acordo com a amplitude

a(t) e a fase θ(t) definidos pelo símbolo transmitido. A equação 2.1 pode ser reescrita na forma da equação 2.2

s(t) = Re{u(t)ejωct

}, (2.2)

onde u(t) é a envoltória complexa do sinal modulante, dado pela equação 2.3. A forma de u(t) em função do sinal modulante define o formato de modulação.

u(t) = a(t)ejθct

. (2.3)

Os formatos de transmissão mais utilizados em sistemas ópticos são formatos de modulação por chaveamento de amplitude (ASK - Amplitude Shift Keying), no qual u(t) é definido pela equação 2.4:

(22)

u(t) =

X

n=0

anp(t − nTs), (2.4)

onde p(t) é o formato do pulso básico transmitido, Ts é o período do símbolo e an

é um coeficiente real, pertencente a um alfabeto finito. Tipicamente, se utiliza um alfabeto binário {1,0}, de modo que este formato de modulação também é conhecido como chaveamento liga-e-desliga (OOK - On-Off Keying). Neste cenário, o formato de pulso mais utilizado é o NRZ (Non-Return-to-Zero), descrito pela equação 2.5

pN RZ(t) = rect

 t Ts



. (2.5)

Formatos modulados em fase são recentes em comunicações ópticas. Nos formatos por chaveamento de fase (PSK - Phase Shift Keying) a forma de u(t) é dada pela equação 2.6:

u(t) = ∞ X n=0 ejθn p(t − nTs), (2.6)

onde θn é um coeficiente no intervalo [0,2π[, pertencente a um alfabeto finito. Os

formatos mais utilizados em sistemas ópticos são o BPSK, constituído por um alfabeto binário, e o QPSK, constituindo de um alfabeto quaternário. Além disso é comum o uso de um formato diferencial, no qual a informação transmitida não está no valor do símbolo em si, mas na diferença entre o símbolo atual e um ou mais símbolos adjacentes, em geral, o símbolo imediatamente anterior. Estes formatos denominados de modulação por chaveamento diferencial de fase, DBPSK e DQPSK, apresentam alguma redução de desempenho em relação às suas contra-partes não diferenciais, porém com ganhos substanciais no projeto dos receptores.

Por fim, é possível modular simultaneamente a fase e a amplitude da portadora. Alguns sistemas sobrepõem diretamente modulações ASK e PSK, embora o formato mais utilizado nesta categoria seja a modulação de amplitude em quadratura (QAM - Quadrature Amplitude Modulation). Nesta formato é realizada uma modulação

(23)

em amplitude na componente real do sinal, e outra modulação em amplitude na componente imaginária, de acordo com a equação 2.7:

u(t) =

X

n=0

(rn+ jin)p(t − nTs), (2.7)

onde rn e insão coeficientes reais pertencentes a um alfabeto finito. É comum que rn

e in compartilhem o mesmo alfabeto, de forma que a disposição dos símbolos sobre

um plano complexo delimite um quadrado. Caso se utilize um alfabeto binário {1,-1} em ambos coeficientes, a modulação QAM equivale a uma modulação QPSK. O formato 16QAM foi aplicado em diversos trabalhos recentes e desponta como um bom candidato para sistemas a 100 Gb/s.

2.2

Transmissores ópticos

Sistemas de fibras ópticas possuem sua mais baixa atenuação, e também o melhor desempenho de amplificadores ópticos, em uma região da banda aproximadamente entre 1530 e 1560 nm, o que corresponde em frequência a uma região do espectro infravermelho entre 192 e 196 THz. Uma onda portadora nesta região do espectro é fornecida usualmente por um diodo laser de realimentação distribuída (DFB -Distributed Feedback). O processo de modulação nestes sistemas consiste em formas de alterar a amplitude e/ou a fase da luz produzida pelo laser. Os diversos métodos de modulação apresentados aqui podem ser vistos em mais detalhes em (P. Winzer, R.-J. Essiambre, 2006) e (K.-P. Ho, 2005).

O método mais simples de realizar a modulação óptica é controlando a corrente elétrica que alimenta o laser de transmissão, método conhecido como modulação direta, capaz de produzir formatos ASK. A maioria dos sistemas até 2,5 Gb/s utiliza modulação direta para gerar o formato OOK. As principais vantagens são a facilidade de implementação, baixo custo e reduzido volume dos transmissores. No entanto a modulação direta apresenta algumas desvantagens que dificultam sua aplicação em taxas acima de 10 Gb/s. Em primeiro lugar, a variação da corrente elétrica que atravessa o laser causa, além variação da amplitude do sinal óptico, uma modulação

(24)

de fase, em geral não desejada, denominada chirp. Esta variação de fase provoca um alargamento espectral do sinal e aumenta o impacto da dispersão cromática sobre o pulso. Uma segunda limitação da modulação direta é chamada de extinção incompleta. Devido à característica não linear do laser, a corrente que o modula não pode ser reduzida abaixo de um certo patamar, sob pena de introduzir um atraso na subida subsequente e distorcer o sinal transmitido. Isso limita o alfabeto dos símbolos a {1,1/r}, onde r é um número positivo chamado de razão de extinção, tipicamente menor que 10.

Alguns dos transmissores de 2,5 Gb/s e a maioria dos de 10 Gb/s utilizam o método de modulação externa por absorção. Neste método, o laser de transmissão emite luz continuamente, e a modulação é feita por outro elemento semicondutor, cuja lacuna de banda pode ser controlada pela aplicação de uma diferença de potencial externa, alterando assim suas características de absorção da luz. Estes moduladores eram inicialmente módulos independentes com alta perda de inserção, mas atualmente são integrados aos encapsulamentos dos lasers, com potências de saída similares aos transmissores com modulação direta. Moduladores de absorção podem ser utilizados para transmitir formatos modulados em amplitude e possuem melhor razão de extinção e menor indução de chirp que os lasers modulados diretamente.

O método mais moderno, no entanto, de modular a portadora óptica é através de moduladores Mach-Zehnder (MZM - Mach-Zehnder Modulator). A luz gerada continuamente pelo laser de transmissão é modulada, não pela absorção, mas pelo fenômeno da interferência. Neste dispositivo, um acoplador de entrada divide a luz por dois caminhos, chamados ramos ou braços. Um ou ambos ramos possuem um modulador de fase, controlado por uma diferença de potencial externa. Ao final, a luz é novamente reagrupada com um acoplador de saída. A função de transferência do modulador Mach-Zehnder é um escalar complexo, determinado pelas tensões aplicadas a cada um ramos, de acordo com a equação 2.8.

HM ZM = 1 2{e jkV1 + ejkV2 } (2.8)

(25)

do material que constitui o modulador. Se aplicarmos a mesma tensão em seus dois ramos o MZM funciona como um modulador de fase. Aplicando tensões de intensidades iguais, porém com polaridades opostas, induzimos um padrão de interferência destrutiva, reduzindo a amplitude do sinal óptico e realizando portanto uma modulação de amplitude.

Além de permitir a modulação de amplitude e fase da portadora óptica os MZMs apresentam melhor desempenho que os demais métodos de modulação, mesmo quando o formato OOK é empregado. O modulador Mach-Zehnder é praticamente livre de chirp, tem alta razão de extinção e melhor perda de inserção que o moduladores externos por absorção. Suas principais desvantagens são seu custo e a relativamente alta tensão necessária para controlar seus moduladores de fase. A tensão necessária para realizar uma modulação de π radianos, denominada Vπ, é em

torno de 6 Volts. Contudo, MZM para taxas de 10 Gb/s são amplamente difundidos, e a maioria dos formatos avançados de modulação são implementados com este tipo de modulador.

A modulação em amplitude pode ser realizada com um modulador Mach-Zehnder na configuração push-pull, na qual são aplicadas nos ramos do MZM dois valores de tensão com a mesma intensidade porém com polaridades inversas. Se, durante a excursão da tensão, esta não ultrapassar Vπ

2 , será obtido um formato OOK sem

variação de fase.

Se utilizarmos a mesma configuração, porém com valores de tensão no intervalo [Vπ

2 ,Vπ], ocorrerá uma variação de π radianos na fase do sinal. É possível nesse

caso realizar uma modulação em amplitude com símbolos no intervalo [-1,1]. O sinal com alfabeto binário {-1,1} também pode ser interpretado como um sinal modulado em fase, com alfabeto binário de {0,π}. Obtemos assim o mais simples formato modulado em fase, o BPSK, ou com adição de codificação diferencial antes da modulação, o DBPSK. Este mesmo formato pode ser obtido com o modulador de Mach-Zehnder operando exclusivamente como modulador de fase, aplicando a mesma tensão nos dois ramos do modulador.

Este formato de modulação não apresenta ganhos de eficiência espectral já que continua codificando apenas um bit por símbolo, porém oferece um ganho de 3dB em sua relação sinal ruído para uma dada taxa de erro em relação ao OOK, pois a

(26)

distância euclidiana entre os símbolos da constelação é dobrada. Esta característica é explorada em enlaces de ultra-longa distância com grande número de amplificadores ópticos e consequente baixa relação sinal-ruído.

Podemos utilizar a modulação de fase para obter formatos de modulação multiníveis com mais de um bit por símbolo, com ganhos de eficiência espectral. Neste caso existem duas estratégias possíveis: a primeira consiste em controlar o modulador Mach-Zehnder com sinais elétricos multiníveis, aumentando a complexidade dos circuitos eletrônicos dos transmissores; a segunda alternativa, mais comum, é utilizar múltiplos moduladores Mach-Zehnder, cada um controlado por um sinal elétrico binário.

Na segunda, dois moduladores são configurados para realizarem modulações binárias de fase com intensidades diferentes. Os moduladores são arranjados em cascata, enquanto a luz do laser é modulada sequencialmente por cada um deles. Neste caso é possível obter uma modulação no formato QPSK com um MZM modulando a portadora óptica com um alfabeto binário {0,π} e outro na sequência com um alfabeto binário {0,π

2}, compondo o alfabeto quaternário com a sequência

das duas modulações binárias. Do mesmo modo é possível obter um formato M-PSK com √M MZMs cascateados.

Outra arquitetura possível para obter o formato QPSK consiste em utilizar dois moduladores Mach-Zehnder, um para codificar a parte real do símbolo, e outro para a parte imaginária. Neste caso a luz do laser é enviada a um acoplador e dividida entre os dois MZMs, cada um deles modulando com um alfabeto binário {0,π}. No entanto um desvio de fase fixo de π

2 é adicionado ao sinal em quadratura, antes que

as duas componentes sejam recombinadas por outro acoplador. O sinal resultante possui um formado de modulação quaternário com fases {π

4, 3π 4 , 5π 4 , 7π 4 }. Assim como

na modulação BPSK, os MZMs podem ser modulados em amplitude com o alfabeto binário {+1,-1}, com os mesmos resultados.

A mesma estrutura em fase-quadratura descrita para moduladores QPSK pode ser utilizada para produzir formatos de modulação de amplitude em quadratura (QAM - Quadrature Amplitude Modulation). Neste caso, sinais elétricos multiníveis são utilizados para modular a informação em fase e em quadratura compondo o sinal QAM. Alternativamente, podemos utilizar uma configuração em cascata com

(27)

um MZM modulando amplitude e outro MZM modulando fase, ambos controlados por sinais multiníveis.

2.3

Receptores ópticos

O mais difundido tipo de recepção é o receptor de detecção direta, também chamado de receptor de lei quadrática, consistindo basicamente de um fotodiodo. Neste tipo de receptor a luz é convertida em corrente elétrica pelo efeito fotoelétrico, na proporção de um elétron por fóton recebido. Como a quantidade de fótons é proporcional à potência óptica, a corrente elétrica gerada é proporcional à potência recebida, de acordo com a equação 2.9

IDD(t) = R|E(t)|2, (2.9)

onde R é uma constante do fotodetector conhecida como responsividade, expressa em A/W , e E(t) é o vetor campo elétrico do sinal recebido (Agrawal, 2002). O sinal obtido não carrega informação de fase do sinal óptico, de forma similar a um receptor de envoltória. Este tipo de receptor ainda é o mais utilizado em comunicações ópticas, já que a maior parte destes sistemas utiliza o formato OOK. Além de ser limitado a formatos modulados apenas em amplitude, o sinal obtido após a detecção de lei quadrática não é uma função linear da amplitude do sinal óptico, trazendo algumas dificuldades para o processo de equalização digital.

Para detectar formatos com amplitude constante mas modulados em fase é possível utilizar detectores diferenciais. Estes receptores utilizam o principio da interferência para determinar a diferença de fase entre o símbolo de interesse e um ou mais símbolos de referência (P. Winzer, R.-J. Essiambre, 2006). Um receptor para o formato DBPSK pode ser construído com um interferômetro de Mach-Zehnder com um atraso temporal em um de seus braços igual ao inverso da taxa de símbolos do sinal recebido, Ts. Os sinais na saída do interferômetro são detectados por um par

de fotodiodos balanceados, cuja corrente de saída é expressa pela equação 2.10

(28)

O interferômetro de Mach-Zehnder converte a diferença de fase entre os símbolos em uma modulação de amplitude com alfabeto {1,−1}. Uma extensão deste receptor diferencial pode ser utilizada para a detecção de qualquer formato D(M)PSK com M>2. Neste caso, um par de receptores diferenciais é utilizado para detectar independentemente as componentes em fase e em quadratura no sinal recebido. As correntes correspondentes aos sinais em fase e quadratura são dadas pelas equações 2.11 e 2.12:

If ase(t) = R <{|E(t)ejωctE∗(t − Ts)e−jωc(t−Ts)|}, (2.11)

Iquadratura(t) = R ={|E(t)ejωctE∗(t − Ts)e−jωc(t−Ts)|}. (2.12)

A principal motivação para o uso destes detectores diferenciais é explorar a maior sensitividade proporcionada pelo formato DBPSK em relação ao OOK, e permitir o uso de formatos multiníveis, em especial DQPSK, com ganhos de eficiência espectral. Entretanto estes receptores apresentam algumas limitações. Em primeiro lugar, só é possível detectar formatos modulados exclusivamente em fase, o que mantém a limitação de um grau de liberdade por polarização por comprimento de onda. Os formatos também são obrigatoriamente diferenciais, implicando em uma redução do desempenho. Os receptores também só podem operar em uma taxa de símbolos determinada pelos atrasos ópticos dos interferômetros, a menos que estes sejam configuráveis. Por fim, o sinal obtido por estes detectores não é, assim como nos receptores de detecção direta, uma função linear do campo elétrico do sinal óptico.

2.3.1

Recepção coerente

O método mais avançado de detecção são os receptores coerentes, os quais podem recuperar tanto a amplitude quanto a fase dos símbolos recebidos, permitindo uma grande flexibilidade nos formatos que podem ser detectados, além de melhor desempenho de equalizadores no domínio digital. A recepção coerente requer o conhecimento da fase da portadora, já que o sinal é demodulado por meio do batimento com um laser no receptor funcionando como oscilador local (LO - Local

(29)

Oscilator), que fornece uma referência absoluta de fase. Em receptores coerentes homódinos, o sinal recebido e do oscilador local são misturados em uma híbrida opto-elétrica de 90 graus, utilizando dois pares de fotodetectores balanceados.

Considerando que as frequências da portadora e do oscilador local são iguais, e estes dois sinais estão em fase, os sinais elétricos obtidos pelos fotodetectores balanceados são descritos pelas equações 2.13 e 2.14, e carregam as componentes em fase e em quadratura do sinal recebido.

ICi(t) = RES(t) + RELO(t) + 2Rp|ES(t)|2|ELO(t)|2cos(θ(t)), (2.13)

ICq(t) = RES(t) + RELO(t) + 2Rp|ES(t)|2|ELO(t)|2sin(θ(t)), (2.14)

onde ES(t) é o vetor campo elétrico do sinal recebido, ELO(t) é o vetor campo

elétrico do oscilador local, e θ(t) é a fase do sinal recebido (E. Ip, A. P. T. Lau, D. J. F. Barros, J. M. Kahn, 2008). Realizando um acoplamento AC deste sinal é possível eliminar o termo RELO(t), já que este tem módulo constante. Além disso,

se a potência do oscilador local for muito maior que a do sinal recebido, o termo RES(t) pode ser suprimido. Os sinais resultantes após o acoplamento AC são dados

por

ICi(t) ≈ 2R|ES(t)||ELO(t)|cos(θ(t)), (2.15)

ICq(t) ≈ 2R|ES(t)||ELO(t)|sin(θ(t)). (2.16)

O sinal obtido é a representação do sinal recebido em banda-base, multiplicado por um ganho constante de 2R|ELO|, chamado ganho de coerência. Contudo, tanto

o laser de transmissão quanto o oscilador local possuem um ruído de fase decorrente das larguras espectrais destes lasers, tipicamente entre 100 kHz e 10 MHz. Este ruído de fase é adicionado ao sinal recebido e causa a rotação da constelação dos símbolos e, consequentemente, um erro de decisão. É comum em sistemas de comunicações

(30)

realizar a recuperação de fase com uma estratégia de Feedback, utilizando um PLL (Phase Locked-Loop), abordagem que pode ser adotada em sistemas ópticos. Porém, uma arquitetura de recuperação de fase utilizando PLL é sensível a atrasos dentro do laço de repetição, atraso este dependente do tempo de símbolo e da intensidade do ruído de fase. Com os valores de largura espectral de lasers comercialmente disponíveis não é possível aplicar esta estratégia com taxas de símbolos iguais ou superiores a 10 Gb/s. Outra alternativa é permitir uma operação livre tanto do laser de transmissão quando do oscilador local, e determinar e compensar o ruído de fase digitalmente após a decisão dos símbolos, utilizando algoritmos de recuperação de portadora (FFCR - Feedforward Carrier Recovery), obtendo resultados superiores aos que usam PLL.

A recepção coerente está deste modo fortemente associada ao processamento de sinais, tanto pela necessidade de recuperação de fase, quanto pela possibilidade da equalização no domínio digital ser realizada sem as distorções não-lineares da detecção direta. Além disso, como veremos a seguir, os receptores coerentes e o processamento digital de sinais também possuem papel conjunto na separação de sinais multiplexados em polarização. Por tudo isso, é um tendência muito forte a adoção deste receptores em cenários em que o modelo de recepção direta e equalização exclusivamente óptica não são suficientes.

2.4

Multiplexação de polarização

As fibras monomodo possuem, apesar do nome, dois modos de propagação, que são degenerados quando consideramos a fibra como um guia cilíndrico e uniforme, porém possuem polarizações ortogonais. A posição destes dois eixos de polarização ao longo da fibra é chamado de estado de polarização (SoP - State of Polarization). Quando acoplada à fibra, a luz do laser, que é polarizada, se divide entre os dois eixos definidos pelos modos de polarização, dependendo do ângulo formado por este eixos e da polarização da luz. Os receptores de detecção direta não são sensíveis à polarização da luz, de modo que a forma da distribuição de energia entre os dois modos não interfere na detecção do sinal.

(31)

dirigidas para o estudo do formato de modulação por chaveamento de polarização (PolSK), em que um alfabeto binário era simbolizado pela presença de luz em uma ou outra polarização. Este formato no entanto não apresenta grandes vantagem sobre o OOK, e possui transmissores e receptores consideravelmente mais complexos, de modo que não encontrou aplicação prática relevante. A diversidade de polarização das fibras recebeu maior interesse quando os sistemas de 10 Gb/s por canal começaram a ser estudados e percebeu-se que a dispersão por modo de polarização, causada pela diferença de velocidade de propagação entre os dois modos, era um fator limitante nestes novos sistemas utilizando fibras legadas. Extenso trabalho acadêmico foi realizado para modelar e propor estratégias para mitigar PMD.

Apenas recentemente passou-se a utilizar a diversidade de polarização em fibras monomodo para aumentar a capacidade de transmissão, modulando sinais diferentes em cada uma das polarizações (R. Noé, 2005) (E. Ip, A. P. T. Lau, D. J. F. Barros, J. M. Kahn, 2008). Esta técnica recebe diversas terminologias, entre as mais comuns são PDM (Polarization Division Multiplexing), PolMux e DP (Dual Polarization). Qualquer um dos formatos descritos na seção 2.1 podem ser utilizados em conjunto com a multiplexação de polarização, desde que sejam utilizadas técnicas de modulação externa. Para tal, a luz proveniente de um laser funcionando continuamente é dividida por meio de um PBS (Polarization Beam Spliter), dispositivo que consiste em um filtro polarizador que separa a luz recebida em dois feixes com polarização ortogonal. A distribuição de potência entre os dois feixes de saída de um PBS depende do ângulo entre a polarização da luz incidente e o sentido do polarizador do dispositivo. Um ângulo de 45 graus é normalmente utilizado, resultando em uma divisão igual de potência. Cada um dois feixes é então modulado de forma independente por um modulador externo, conforme o esquema da figura 2.1, e, após a modulação, são recombinados com um PBC (Polarization Beam Combiner).

Na recepção, considerando um sistema back-to-back, um outro PBS separa o sinal em duas polarizações ortogonais, recebendo cada um destes dois sinais em um receptor adequado ao formato de transmissão. Receptores interferométricos não são compatíveis com a multiplexação de polarização. Portanto, caso sejam utilizados formatos mais avançados que o OOK, receptores coerentes devem ser empregados.

(32)

Figura 2.1: Diagrama de um sistema PDM com recepção coerente e processamento digital de sinais

Neste caso os receptores compartilham um único oscilador local, cuja a luz é dividida por meio de segundo PBS no receptor.

Os sinais recuperados não são os sinais transmitidos, mas sim misturas destes sinais, devido a diversos acoplamentos entre as polarizações durante a propagação na fibra. A origem e descrição destes acoplamentos será tratada na secção 2.5. Para a demultiplexação destes sinais é possível adotar basicamente duas estratégias: a primeira se dá por meio de um controle de polarização no domínio óptico, um controle de difícil operação e de limitado desempenho; a segunda consiste em realizar a demultiplexação no domínio digital após a detecção do sinal, estratégia essa normalmente utilizada.

2.5

Modelo do canal óptico

Em qualquer sistema de comunicações, o meio inflige um conjunto de degradações que deterioram o sinal transmitido antes que este alcance seu destino. Uma das principais motivações para realizar a modulação do sinal é justamente adaptar o sinal a estas degradações. No caso dos sistemas ópticos, estas distorções são separadas em dois grandes grupos, os efeitos lineares e os efeitos não-lineares.

Os efeitos não-lineares possuem diversas origens, porém todas relacionadas com uma relativamente alta potência dos sinais ópticos transmitidos. Os efeitos

(33)

não-lineares, mais relevantes nos sistemas WDM, são a auto modulação de fase (SPM - Self Phase Modulation), a modulação cruzada de fase (XPM - Cross Phase Modulation) e a mistura de quatro ondas (FWM - Four Wave Mixing). Estes três efeitos se originam da dependência do índice de refração da fibra com a intensidade do campo elétrico a que ela está submetida, ou seja, com a potência dos sinais propagados, fenômeno conhecido como efeito Kerr (Agrawal, 2002). A interação deste efeito com outras características da fibra, formato de modulação utilizado, potência dos sinais e espaçamento entre as portadoras ópticas determinam quais destes efeitos se manifestarão, e com qual intensidade.

O combate aos efeitos não-lineares é uma tarefa bastante desafiadora, porém com alguns avanços em abordagens utilizando equalização digital. Em geral, o projeto dos sistemas limita a potência óptica transmitida para evitar, ou ao menos limitar, os efeitos não-lineares, o que implica em reduzir a distância entre amplificadores ópticos em um enlace, aumentando o acúmulo de ruído de emissão espontânea com sucessivas amplificações ópticas. Apesar deste acúmulo de ruído, estes sistemas operam em regime linear, o que oferece uma significativa vantagem.

Neste trabalho, não consideraremos o efeitos não-lineares, e realizaremos todas as simulações no regime linear. As degradações lineares do canal óptico serão discutidas a seguir.

2.5.1

Dispersão cromática

A dispersão cromática é a principal degradação linear de sistemas ópticos com fibra monomodo. Consiste no espalhamento temporal dos pulsos transmitidos pelo fato de suas componentes espectrais possuírem diferentes velocidades de propagação. Isso causa o alargamento do pulso transmitido e consequente interferência inter-simbólica (ISI - Inter Symbol Interference). No domínio da frequência, a dispersão cromática pode ser representada, aproximadamente, pela equação 2.17.

HCD(ω) = exp −jDλ 2ω2l

4πc 

(2.17)

(34)

velocidade da luz, ω é a frequência angular do sinal e D é chamado de parâmetro de dispersão, característico da fibra (Agrawal, 2002). Em geral, é atribuída a mesma dispersão cromática a ambas polarizações.

Boa parte das fibras atualmente em operação foram instaladas quando a maior parte dos sistemas operava com comprimentos de onda próximos a 1300 nm, e foram projetadas para oferecerem mínima dispersão cromática nesta faixa. No entanto, para explorar uma região de menor atenuação, os sistemas atuais operam com comprimentos de onda em torno de 1550 nm, faixa em que estas fibras possuem dispersão entre 15 e 17 ps/nm.km, limitando sistemas transmitindo com taxas de 10 Gbaud em poucas dezenas de quilômetros.

O uso de compensadores ópticos para combater a dispersão cromática é amplamente difundido. Em geral, utiliza-se um trecho de fibra com alto parâmetro de dispersão de sinal oposto ao infligido na transmissão do sinal, de modo a anular a dispersão. Contudo, não é possível ajustar o parâmetro de dispersão do compensador para equalizar todos os comprimentos de onda transmitidos simultaneamente em um sistema WDM, o que resulta em uma pequena quantidade de dispersão em cada canal que não pode ser equalizada. Esta dispersão é chamada dispersão cromática residual, e tem valores típicos entre 0 e 4% da dispersão acumulada na transmissão. A dispersão residual não era levada muito em conta em sistemas até 2,5 Gb/s. Porém, em taxas maiores, o alargamento temporal do pulso pode ocupar uma parcela significativa do tempo de símbolo, de forma que esta degradação torna-se relevante.

2.5.2

Dispersão por modo de polarização

Outra degradação que se mostrou limitante em taxas elevadas foi a dispersão por modo de polarização. A hipótese dos dois modos de polarização da fibra serem degenerados, ou seja, possuírem as mesmas características de propagação, é válida se a fibra for considerada um guia perfeitamente cilíndrico e homogêneo. Porém, limitações em sua fabricação permitem que sua secção circular seja ligeiramente elíptica, com excentricidades típicas em torno de 1% para fibras legadas. Mesmo esta pequena variação induz uma birrefringência da fibra, o que significa que o índice de refração efetivo em cada polarização é diferente, assim como a velocidade de grupo de uma onda propagada em cada polarização.

(35)

Quando a luz do laser é lançada na fibra, o sinal óptico se distribui entre os dois modos de de polarização. Considerando que não ocorram acoplamentos entre os modos durante a propagação, o pulso transmitido sofre um alargamento temporal τ , dado pela equação 2.18, onde L é o comprimento da fibra e ∆β1 é um termo relativo

à birrefringência. Este alargamento temporal é chamado de atraso diferencial de grupo (DGD - Differential Group Delay) ou PMD de primeira ordem, e τ é por vezes referido como parâmetro de DGD (Agrawal, 2002).

τ = L∆β1. (2.18)

Consideremos agora um sistema com multiplexação de polarização. Neste caso, ocorrem dois acoplamentos entre as polarizações: o primeiro, quando estes sinais são lançados na fibra; o segundo, quando o sinal da fibra é dividido pelo PBS na recepção. Nessa situação, um dos sinais misturados na transmissão se propagará pelo eixo mais rápido da fibra e outro pelo eixo mais lento, de modo que no final, ocorrerá uma nova mistura. Este cenário é descrito pela equação 2.19:

" rx(ω) ry(ω) # = " cos α − sin α sin α cos α # " ejωτ /2 0 0 e−jωτ /2 # " cos β − sin β sin β cos β # " sx(ω) sy(ω) # , (2.19)

onde sx e sy são os sinais transmitidos nas polarizações x e y, e rx e ry são os

sinais recebidos nas polarizações x e y. Os parâmetros α e β são ângulos entre os estados de polarização da fibra e as polarizações do sinal em sua entrada e saída (I. Fatadin, D. Ives, S. J. Savory, 2009). Estes ângulos possuem valores aleatórios uniformemente distribuídos no intervalo [0,2π[, além de serem variantes no tempo, devido à característica dinâmica dos estados de polarização da fibra. Este modelo de DGD também introduz o princípio do processo de mistura entre os sinais sx e sy.

A partir da equação 2.19, podemos definir a função de transferência de um elemento que introduz DGD como

HDGD(ω) = " cos α − sin α sin α cos α # " ejωτ /2 0 0 e−jωτ /2 # " cos β − sin β sin β cos β # . (2.20)

(36)

Uma possibilidade para a compensação da DGD consiste, portanto, em controlar o ângulo das polarizações na recepção de forma que β = 0, o que separaria os sinais recebidos no eixo rápido e lento, e, em seguida, submeter o sinal propagado pelo eixo rápido a um atraso de valor τ . Abordagens eletro-ópticas para estimar DGD e compensá-la com este método já foram muito estudadas.

Contudo, durante a propagação ocorrem inúmeros acoplamentos aleatórios entre os sinais em cada um dos modos. Quando estes acoplamentos são considerados, passamos a modelar a PMD de ordem superior. Para a maioria das fibras instaladas, a distância entre os acoplamentos é muito menor que o comprimento do enlace, e as secções de fibra entre eles possuem cada uma um valor também aleatório de DGD, dando origem a um modelo em treliça da PMD de ordem superior, ilustrado na figura 2.2.

Figura 2.2: Modelo em treliça de PMD de ordem superior.

Estes múltiplos acoplamentos dificultam uma abordagem eletro-óptica para a separação dos sinais e compensação da PMD. Os modelos resultantes para PMD são obtidos com a sobreposição dos efeitos de DGD entre cada acoplamento, conforme a equação 2.21. HP M D(ω) =Y HDGD(ω) = " HP M Dxx(ω) HP M Dxy(ω) HP M Dyx(ω) HP M Dyy(ω) # , (2.21)

onde HP M Dxx(ω) modela o efeito da PMD sobre o sinal transmitido na polarização

x e recebido na polarização x, e de modo análogo HP M Dxy(ω), HP M Dyx(ω) e

HP M Dyy(ω) modelam o efeito do canal sobre suas respectivas polarizações de

(37)

Os modelos estatísticos para a PMD foram bastante estudados, e mostraram que o alargamento temporal resultante segue uma distribuição de Maxwell-Boltzmann, com valor médio que cresce com a raiz quadrada do comprimento L da fibra, de acordo com a equação 2.22. Isso leva à interessante conclusão de que, embora o efeito de ordens superiores sobre a PMD dificulte sua equalização, ele reduz o alargamento temporal do pulso em relação ao causado apenas pela DGD. Isso se deve ao fato dos acoplamentos misturarem as parcelas do sinal que se propagam pelos eixos rápido e lento.

τP M D= Dp

L. (2.22)

O parâmetro Dp, característico da fibra, dependente de sua birrefringência e está

tipicamente entre 1 e 10 ps/√km para fibras legadas, embora para fibras fabricadas atualmente chegue a apenas 0.1 ps/√km. Apesar de causar alargamentos temporais muito menos severos que a dispersão cromática, a PMD tem uma característica dinâmica, o que é um empecilho a mais para sua equalização.

2.5.3

Perda dependente de polarização

Um último efeito linear de maior relevância sobre sistemas multiplexados em polarização é a perda dependente de polarização, causada quando a luz atravessa um componente que possui estados principais de polarização que introduzem atenuações diferentes. Esta diferença, em dB, é denominada parâmetro de PDL, Γ. O valor da PDL irá depender não só da diferença de atenuação, mas também do ângulo entre os estados de polarização do elemento com PDL e das fibras antes e depois deste elemento. Isso leva ao um modelo para PDL, de acordo com a equação 2.23, similar ao do DGD: HP DL = " cos α − sin α sin α cos α # " √ 1 − γ 0 0 √1 + γ # " cos β − sin β sin β cos β # , (2.23)

(38)

das fibras antes e depois deste elemento (Francisco Augusto da Costa Garcia, 2009). O valor da PDL em dB se relaciona com γ, denominado parâmetro de PDL, pela equação 2.24.

Γ(dB) = 10 log1 + γ

1 − γ (2.24)

Assim como a PMD, a PDL tem uma característica dinâmica devido às variações dos estados de polarização da fibra. A PDL também tem uma característica cumulativa, à medida que diversos elementos com PDL podem estar distribuídos ao longo do enlace.

2.5.4

Ruído

Além das degradações lineares, os sinais em sistemas ópticos são degradados por ruídos de diversas fontes. Os fotodetetores, componentes dos receptores coerentes, introduzem o ruído balístico, também chamado de ruído shot, um processo aleatório discreto com distribuição de Poisson que, na prática, é aproximado para um processo gaussiano. Outro ruído que tem sua origem no receptor é o ruído térmico, modelado como um processo gaussiano aditivo. Em geral, sistemas não amplificados são limitados pelo ruído shot (Agrawal, 2002).

Sistemas que utilizam amplificação óptica utilizando amplificadores com fibra dopada a érbio enfrentam uma fonte muito mais intensa de ruído aditivo, o ruído de emissão espontânea (ASE - Amplified Spontaneous Emission), com distribuição gaussiana. O ruído ASE é muito dominante em sistemas amplificados, de forma que os efeitos dos ruídos térmico e shot são usualmente desprezados. Como este ruído tem origem ainda no domínio óptico, sua distribuição de probabilidade após a detecção depende do tipo de receptor utilizado. Receptores de lei quadrada transpõe o ruído ASE para uma distribuição chi-quadrada, enquanto receptores coerentes mantém a distribuição gaussiana.

Como mencionado na seção 2.3.1, outra possível fonte de ruído é o ruído de coerência, devido a oscilações de amplitude dos termos não coerentes da detecção, que não são suprimidos pelo acoplamento AC empregado após a recepção. Este

(39)

ruído também tem uma característica aditiva e com distribuição gaussiana, e pode ser desconsiderado se a potência do oscilador local do receptor coerente for muito maior que a potência do sinal recebido.

Além dos diversos ruídos aditivos, o sinal também é corrompido em sistemas coerentes por um ruído de fase multiplicativo. Este ruído tem origem na diferença de fase entre os lasers de transmissão e do oscilador local. O ruído de fase é descrito por um processo de Wiener (E. Ip, J. M. Kahn, 2007), com variância dada pela equação 2.25

σφ2 = 2π∆νTs, (2.25)

onde ∆ν é a largura espectral dos lasers empregados e Ts é o tempo de símbolo.

Em sistemas PDM, os sinais em cada polarização compartilham tanto o laser de transmissão quanto o oscilador local, de modo que o ruído de fase nas duas polarizações é, em geral, o mesmo.

2.6

Modelo linear do canal

Os sistemas abordados neste trabalho utilizam a multiplexação de polarização com detecção coerente e recuperação digital de fase e polarização, conforme ilustrado na figura 2.1. Os efeitos combinados das degradações lineares e dos ruídos apresentados nas seções anteriores dão origem ao modelo de canal descrito na equação 2.26: " rx(ω) ry(ω) # = " Hxx(ω) Hxy(ω) Hyx(ω) Hyy(ω) # " sx(ω) sy(ω) # ejφ+ " ηx(ω) ηy(ω) # , (2.26)

onde Hxx(ω), Hxy(ω), Hyx(ω) e Hyy(ω) descrevem os efeitos conjuntos da PMD, da

PDL e da dispersão cromática do enlace, incluindo eventual equalização de dispersão no domínio óptico; sx(ω) e sy(ω) representam os sinais transmitidos nas polarizações

x e y; rx(ω) e ry(ω) representam os sinais recebidos na polarizações x e y; φ é o

(40)

Considerando recepção coerente e amostragem perfeita dos sinais, os símbolos recebidos, representados de forma discreta no domínio do tempo, são dados pelas equações 2.27 e 2.28

rx[n] = (hxx[n] ⊗ sx[n] + hxy[n] ⊗ sy[n]) ejφ+ ηx[n], (2.27)

ry[n] = (hyx[n] ⊗ sx[n] + hyy[n] ⊗ sy[n]) ejφ+ ηy[n], (2.28)

onde ⊗ denota a operação de convolução; os sinais representados por rx[n] e ry[n]

são misturas lineares e com memória dos sinais transmitidos, representados por sx[n]

e sy[n], corrompidos pelo ruído de fase e pelo ruído aditivo. Os filtros representados

pelas respostas ao impulso hxx[n], hxy[n], hyx[n] e hyy[n] são, em geral, supostos de

resposta ao impulso finita (FIR - Finite Impulse Response). Deste modo, podemos representar cada um destes filtros por um vetor de seus coeficientes no instante n, ou seja, por hxx[n], hxy[n], hyx[n] e hyy[n], respectivamente. Assim, os sinais recebidos

também podem ser expressos na forma " rx[n] ry[n] # = " hTxx[n] hT xy[n] hTyx[n] hT yy[n] # " sx[n] sy[n] # ejφ+ " ηx[n] ηy[n] # , (2.29) onde os vetores sx[n] = [sx(n) sx (n − 1) · · · sx(n − L + 1)]T e sy[n] = [sy(n) sy(n −

1) · · · sy(n − L + 1)]T são constituídos de L amostras dos sinais sx e sx, onde L é

o comprimento dos vetores hxx[n], hxy[n], hyx[n] e hyy[n].

2.7

Sumário

Neste capítulo apresentamos os principais métodos de modulação e demodulação em sistemas ópticos. A evolução destes métodos permitiu que formatos de modulação com maior eficiência espectral e maior robustez às degradações impostas pelo canal pudessem ser utilizados. Além disso, os métodos mais avançados de modulação podem ser utilizados em conjunto com a multiplexação de polarização, dobrando a eficiência espectral dos sinais transmitidos. Contudo, tanto a

(41)

demultiplexação de polarização, quanto a mitigação das degradações impostas pelo canal, descritas neste capítulo, são mais facilmente executadas no domínio digital. Deste modo, os sistemas com multiplexação de polarização são altamente dependentes de processamento digital de sinais. Como parte dos efeitos aos quais os sinais propagados estão sujeitos são variantes no tempo, é necessário que o processo de equalização seja adaptativo. No capítulo seguinte abordaremos alguns aspectos dos processos de separação e equalização utilizados nestes sistemas.

(42)

3

Equalização digital em sistemas PDM

No capítulo 2 introduzimos um modelo linear do canal óptico incluindo suas principais degradações. Vimos que, após a detecção coerente, obtemos os sinais rx[n]

e ry[n], que correspondem a misturas lineares e com memória dos sinais transmitidos,

sx[n] e sy[n], além de um ruído de fase multiplicativo φn e um ruído aditivo ηn,

razoavelmente aproximado por uma distribuição gaussiana.

Para recuperar a informação transmitida a partir de rx[n] e ry[n], são necessárias

diversas etapas de processamento de sinais, conforme ilustrado na figura 3.1. Os primeiros estágios deste processamento são não-adaptativos, voltados para combater imperfeições dos receptores e compensar grandes quantidades de dispersão cromática, substituindo ou complementando a compensação óptica de CD. Em seguida, os sinais passam por um filtro adaptativo para compensar os efeitos da PMD, dispersão cromática residual e separação dos sinais multiplexados em polarização. O próximo estágio é a recuperação de portadora, para mitigar o efeito de ruído de fase dos lasers de transmissão e do oscilador local. Por fim, os símbolos

(43)

são decididos e, sobre os sinais resultantes, são aplicados códigos corretores de erro.

Figura 3.1: Processamento digital de sinais para recuperação dos sinais transmitidos Neste trabalho, nos focaremos no processo de equalização e separação adaptativas. Em geral, esta equalização é realizada por um filtro linear com uma estrutura de Múltiplas-Saídas-e-Múltiplas-Entradas (MIMO - Multiple-Input-Multiple-Output), 2x2 complexa. Diversos algoritmos podem ser utilizados para adaptar os coeficientes deste equalizador, seguindo um critério apropriado.

Neste capítulo introduziremos brevemente o critério de Wiener e o critério do Módulo Constante, que são, respectivamente, os principais critérios de equalização adaptativa supervisionada e não-supervisionada. Descreveremos também os principais algoritmos derivados destes critérios, o LMS e o CMA. Inicialmente, faremos esta análise para sistemas de Única-Entrada-e-Única-Saída (SISO - Single-Input-Single-Output), e, em seguida, suas expansões para equalização MIMO. Por fim, descreveremos a aplicação do CMA multiusuário em sistemas ópticos multiplexados em polarização, um dos algoritmos mais utilizados para esta finalidade.

3.1

Equalização Supervisionada

A figura 3.2 exibe um esquema de equalização de um canal SISO, onde o sinal x[n] é o resultado da convolução de uma sinal s[n] com um canal de resposta ao impulso h[n].

No caso SISO, resolver o problema de equalização é encontrar um sistema w[n], que ao ser convolvido com o sinal x[n], resulte em um sinal y[n] o mais próximo

(44)

Figura 3.2: Canal SISO com equalização supervisionada

possível de s[n]. A expressão "mais próximo possível" deve levar em conta algum critério que avalie o quanto o sinal y[n] é ou não uma boa estimativa de s[n]. Esse critério é dito supervisionado se, ao realizar a busca pelo equalizador w[n], temos acesso ao sinal de interesse d[n], que neste caso equivale ao sinal transmitido a menos de um atraso m e de um ganho k:

d[n] = ks[n − m]. (3.1)

Em algumas aplicações de filtragem adaptativa, o sinal d[n] está naturalmente acessível para o processo de adaptação, este porém não é o caso da equalização de um canal de comunicações. Para que ocorra a adaptação supervisionada é necessário que seja transmitida uma sequência de símbolos conhecida pela receptor, denominada sequência de treinamento ou sequência piloto, com consequente redução da capacidade de transmissão do sistema. Caso o canal seja variante com o tempo, a sequência de treinamento deve ser retransmitida periodicamente.

Outra característica comum a equalizadores digitais adaptativos é que geralmente eles são constituídos de um filtro linear transversal, independente do critério de equalização empregado. Isso traz alguma limitação ao desempenho do equalizador ótimo, pois como a função de transferência do filtro é desprovida de pólos, é em geral impossível obter uma equalização perfeita de h[n] na forma:

h[n] ⊗ w[n] = kδ(n − m), (3.2)

onde a resposta combinada do canal e equalizador é reduzida a um ganho k e um atraso m.

(45)

3.1.1

Critério de Wiener

Um dos primeiros e ainda mais utilizados critérios de equalização supervisionada é o critério de mínimo erro quadrático médio, ou critério de Wiener, que define como equalizador ótimo aquele que minimiza o erro quadrático médio entre o sinal equalizado y[n] e o sinal de interesse d[n] (S. Haykin, 1996). A função custo do critério de Wiener em relação ao vetor w é fornecida pela equação 3.3:

Jwiener = E{(e[n])2},

Jwiener = E{(d[n] − y[n])2}, (3.3)

Jwiener = E{(d[n] − wTx[n])2},

onde E{·} é o operador esperança; x[n] = [x(n) x(n − 1) · · · x(n − L)] é um vetor constituido de amostras do sinal x[n], desde o intante n até L amostras passadas, onde L+1 é o comprimento do vetor que descreve o equalizador w = [w0w1 · · · wL].

Expandindo a equação 3.3 obtemos:

Jw= E{(d[n] 2

− 2d[n]wTx[n] + wTx[n]xH

[n]w)}. (3.4)

A função custo de Wiener é portanto uma função quadrática de w, o que lhe dá um formato de um hiper-parabolóide, possuindo portanto um único ponto de mínimo. Para encontrar o valor do mínimo erro médio quadrático devemos encontrar o ponto de mínimo valor da função custo JW iener. Derivando-a em relação a w e

distribuindo o operador esperança estatística obtemos:

∇Jw = −2E{d[n]x[n]} + 2E{x[n]x[n] H

}w. (3.5)

O vetor E{d[n]x[n]} é o vetor de correlação cruzada de d[n] e x[n], pxd,

enquanto a matriz E{x[n]x[n]T} é a matriz de auto-correlação do sinal x[n], R xx.

Reescrevendo a equação 3.5 com estas definições obtemos:

(46)

Igualando por fim a equação 3.6 a zero para encontrar o ponto de mínimo de J, e isolando o valor obtido de w, encontramos o equalizador ótimo.

wotimo = R−1xxpxd. (3.7)

Este resultado é conhecido com equação de Wiener-Hopf. Podemos, deste modo, determinar o equalizador ótimo a partir de Rxx e pxd. No entanto, conhecer

estas grandezas implica em conhecimento prévio do canal h, em geral indisponível. Alternativamente, a auto-correlação e a correlação cruzada podem ser estimadas diretamente a partir das amostras obtidas, esta abordagem porém oferece um alto custo computacional e requer um grande número de amostras.

3.1.2

O Método do Gradiente e o Algoritmo LMS

O primeiro passo a fim de eliminar o cálculo explícito de Rxx e pxd, e obter um

algoritmo de fato adaptativo é encontrar um algoritmo iterativo para a determinação de wotimo. Partido do suposto que conhecemos a função custo de Wiener, podemos

utilizar o método do gradiente. Uma vez que o vetor gradiente de JW iener em um

certo ponto da curva indica o sentido de maior crescimento da função, o sentido oposto leva ao seu maior decrescimento. Este método converge em um ponto quando o vetor gradiente neste ponto é nulo, situação está que só se verifica na função custo de Wiener no ponto de mínimo. O método iterativo do gradiente, também conhecido como steepest descent, é dado pela equação 3.8:

w(n + 1) = w(n) − µ∇Jw, (3.8)

onde µ é um passo de adaptação positivo convenientemente escolhido e k indica a k-ésima iteração do algoritmo. Substituindo em 3.8 o gradiente da função custo de Wiener dado pela equação 3.6 obtemos:

Referências

Documentos relacionados

2. Identifica as personagens do texto.. Indica o tempo da história. Indica o espaço da história. Classifica as palavras quanto ao número de sílabas. Copia do texto três

Em janeiro, o hemisfério sul recebe a radiação solar com menor inclinação e tem dias maiores que as noites, encontrando-se, assim, mais aquecido do que o hemisfério norte.. Em julho,

Combinaram encontrar-se às 21h

Quero ir com o avô Markus buscar a Boneca-Mais-Linda-do-Mundo, quero andar de trenó, comer maçãs assadas e pão escuro com geleia (17) de framboesa (18).... – Porque é tão

Classifica os verbos sublinhados na frase como transitivos ou intransitivos, transcrevendo- os para a coluna respetiva do quadro.. Frase: Escondi três livros na estante

O MUNICÍPIO DE PORTO ALEGRE, através da Central de Licitações da Secretaria Municipal da Fazenda, torna pública a licitação abaixo, para o SISTEMA DE REGISTRO

A Figura 17 apresenta os resultados obtidos por meio da análise de DSC para a amostra inicial da blenda PBAT/PHBH-0 e para as amostras PBAT/PHBH-4, PBAT/PHBH-8 e

O estudo múltiplo de casos foi aplicado para identificar as semelhanças e dissemelhanças na forma como as empresas relacionam seus modelos de negócios e suas