• Nenhum resultado encontrado

Codificação de forma de onda

A codificação de forma de onda de sinais de voz é baseada principalmente na predição linear, e o esquema mais utilizado é o Adaptive Differential Pulse Code Modulation (ADPCM). Os

codificadores de forma de onda são os que propiciam voz de melhor qualidade, mas são os que despendem a maior taxa de bits, em geral com taxas superiores a 30 kbps.

Codificação paramétrica

O estudo da natureza do sinal (no caso da telefonia, a voz) é essencial para obter máxima compressão, embora com sensível perda de qualidade. Os codificadores paramétricos, também denominados vocoders (voice coders), utilizam no decodificador um modelo de produção de voz, cujos parâmetros são estimados e transmitidos pelo codificador a intervalos curtos de tempo (10 a 30 ms). A classe de codificadores paramétricos mais utilizada é a dos vocoders LPC (Linear

Predictive Coding). Os vocoders conseguem codificar os sinais de voz a taxas de no máximo cerca de 2 kbps, mas com qualidade entre ruim e regular.

Codificação híbrida

Capítulo 03

Introdução à VoIP

forma de onda), procurando um balanço entre qualidade e taxa de compressão. Os codificadores híbridos são esquemas que combinam características dos codificadores de forma de onda e dos vocoders. Atualmente, a maioria dos codificadores híbridos utiliza o modelo de codificação Code Excited Linear Predictive (CELP), com taxas de bits entre 4 e 16 kbps, proporcionando qualidade muito melhor do que a dos vocoders. Alguns deles propiciam qualidade muito próxima da obtida com os codificadores de forma de onda.

Com base nos tipos de codificação citados, concluímos que os codificadores de forma de onda são os que proporcionam voz com melhor qualidade, mas despendem maior taxa de bits. Em geral, taxas superiores a 30 kbps.

Sobre atraso/delay

Um fator importante a ser considerado é o delay inserido pelo codificador. O processo

computacional de codificar e, na outra ponta, decodificar os pacotes significa inserir mais atraso na comunicação. De maneira geral, quanto menor for a taxa do CODEC, maior será seu delay, mas também depende muito da complexidade do algoritmo e da implementação do CODEC.

Em uma rede de pacote, onde os pacotes de voz podem sofrer grandes atrasos, a escolha do CODEC em função do atraso do mesmo pode ser um diferencial do projeto, principalmente se existem enlaces onde o delay é crítico, como em uma conexão via satélite.

Em redes com grande disponibilidade de banda, um CODEC indicado é o G.711, que possui taxa de transmissão a 64 Kbits/seg, mas com delay (de processamento) próximo de zero, boa qualidade e livre de licença.

Comparação entre as técnicas

A tabela abaixo mostra um resumo da faixa de frequência, taxas de transmissão e latência utilizada nos principais padrões de codificação de áudio.

Capítulo 03

Introdução à VoIP

O padrão G.711 é um dos melhores disponíveis (embora o conceito de “melhor” seja relativo), com delay próximo de zero, mesmo que sua taxa de transmissão de bits seja muito alta (64 Kbits/seg), consumindo muita banda em comparação com os demais CODECs. Seu grande diferencial é que está livre de licença, sendo um fator a considerar para projetos com disponibilidade de banda. Outro fator a considerar é que este é um CODEC lossless e não perde informação, sendo utilizado em transmissão de fax.

O padrão G.729 possui taxa de 8 Kbits/seg e é muito utilizado no mercado. É um CODEC ITU com a necessidade de compra de licença, pois seu algoritmo foi patenteado. Existem as versões

G729a, menos complexa que a G729, e a versão G729b, com capacidade de inserir ruído de conforto nas ligações que utilizam VAD (detecção de atividade de voz).

O padrão G 723.1 possui taxas menores que o G.729, é um CODEC ITU e também necessita de pagamento de licença. Possui taxas de 6,3 ou 5,3 Kbits/seg e seu atraso é da ordem de 37,5 mseg. O CODEC iLBC tem fonte aberta, sem exigência de pagamento de licença, sendo uma boa opção de solução. Sua taxa é da ordem de 13,3 Kbits/seg.

G.711

A função básica do algoritmo é codificar a voz utilizando 8 bits por amostra; a banda de entrada de voz é amostrada a 8 kHz, mantendo a largura de banda de 300 a 3400 Hz. Com isso, cada canal de voz precisa de 64 kbps.

Dois algoritmos foram definidos no padrão ITU-T G.711: U (ulaw) e A (alaw); o primeiro é utilizado na América do Norte e no Japão, o segundo, na Europa e no resto do mundo.

O princípio do codificador G.711 é que se deve utilizar a quantização com escala logarítmica para obter uma relação sinal/ruído independente da intensidade. Isso foi possível duplicando o passo de quantização a cada vez que a intensidade do sinal era duplicada; deste modo obteve-se uma constante.

G.729

O codificador G.729 codifica sinais de voz a uma taxa de 8 kbps usando o modelo CS-ACELP (Conjugate Structure Algebraic Code Excited Linear Prediction), que é baseado no modelo de codificação CELP. Ele é projetado para operar com o sinal de voz de entrada já convertido para o formato PCM uniforme, com 16 bits/amostra e taxa de amostragem de 8 kHz.

O codificador G.729 trabalha com quadros de 10 ms (ou 80 amostras), que são divididos em dois subquadros de 5 ms (ou 40 amostras). Cada quadro de 10 ms do sinal de voz é analisado para extrair os parâmetros do modelo CELP: os coeficientes preditores do filtro de síntese, os índices dos dicionários fixo e adaptativo e seus respectivos ganhos. Esses últimos são os parâmetros da excitação, determinados para cada subquadro de 5 ms. Esses parâmetros são codificados e transmitidos.

No decodificador, esses parâmetros são recuperados para construir a excitação e obter os parâmetros do filtro de síntese. O sinal de voz é reconstruído passando a excitação pelo filtro de síntese de ordem 10. Depois de reconstruído, o sinal de voz é passado por um pós-filtro para melhorar a qualidade do sinal de saída.

G.723.1

O codificador G.723.1 tem duas taxas de bits associadas a ele, de 5,3 e 6,3 kbps. Ele codifica sinais de voz quadro a quadro usando codificação preditiva linear baseada em análise por síntese

Capítulo 03

Introdução à VoIP

(CPLbAS). A codificação em taxa alta (6,3 kbps) usa um modelo MP-MLQ (Multipulse Maximum Likelihood Quantization) para gerar o sinal de excitação, enquanto a codificação em taxa baixa (5,3 kbps) usa um modelo ACELP (Algebraic Code Excited Linear Prediction). O tamanho dos quadros é de 30 ms (ou 240 amostras).

O codificador G.723.1 é projetado para operar com o sinal de voz de entrada já convertido para o formato PCM uniforme, 16 bits/amostra e taxa de amostragem de 8 kHz.

iLBC

O codificador iLBC utiliza o algoritmo de predição linear e suporta dois comprimentos básicos, quadros de 20 ms a 15.2 kbps e de 30 ms a 13.33 kbps. Quando o codificador trabalha com quadros de comprimento de 20 ms, produz 304 bits de saída por quadro, e para um comprimento de 30 ms por quadro, produz 400 bits de saída, os quais devem ser empacotados para serem transmitidos. Os dois modos para quadros de diferentes tamanhos operam de maneira similar. A descrição do algoritmo resulta em um sistema de codificação de voz com resposta controlada diante da perda de pacotes, similar à especificada no PCM com perda de pacotes no padrão ITU-T G.711, que opera a uma taxa fixa de 64 kbps. Algumas das aplicações para este codificador estão nas formas de comunicação em tempo real, como telefonia, videoconferência, áudio e envio de mensagens.

CODECs de banda larga | CODECs de alta definição G.722

O CODEC G.722 é conhecido como CODECs de banda larga ou também como CODECs de alta definição (High Definition - HD). Ele possui uma faixa de frequência maior do que os demais, em 7kHz. Isso faz com que ele capture mais detalhes da voz. É baseado na téncia sub-band ADPCM (SB-ADPCM). Esse CODEC utiliza 14 bits para determinar cada amostra de some consome até 64kbits/seg (mais os cabeçalhos de transporte, rede e enlace).

G.722.2

O G.722.2 é um CODEC de voz mais moderno, que utiliza a técnica AMR-WB, Adaptative Multi- Rate Wideband, desenvolvido com base no AMR e com metodologia similar a ACELP. Esse CODEC é capaz de se adaptar às condições de rede, reduzindo ou aumentando o bitrate, sempre tentando entregar a melhor qualidade de voz que a rede permite.

É licenciado pela VoiceAge Corporation.

Resumo

Agora que já é conhecido a maior parte das técnicas aplicadas na tecnologia de voz sobre IP, é possível fazer um resumo sobre como todos os componentes se interligam.

Capítulo 03

Introdução à VoIP

2. O telefone de A envia um INVITE para seu proxy local (ou seu PBX IP) 3. O proxy local localiza e identifica o Proxy de B (ou seu PBX IP)

4. O proxy de B encontra o telefone B (seu ramal no PBX)

5. A e B (e seus proxies) negociam os parâmetros da sessão usando SDP 6. A ligação é estabelecida

7. A voz dos interlocutores é codificada, digitalizada e comprimida nos respectivos telefones IP, utilizando o CODEC negociado durante o estabelecimento da chamada

8. A informação da voz digitalizada é enviada utilizando o RTP

9. Os pacotes de voz chegam do outro lado e são enfileirados para que possam ser decodificados corretamente

10. A informação da voz é desempacotada, decodificada e reproduzida

11. Depois de algum tempo, alguém decide desligar e, ao colocar o telefone de volta no gancho, que envia um BYE para o outro lado

Capítulo 03

Introdução à VoIP

Capítulo 04 Arquitetura do fone@RNP v2012

Serviço fone@RNP v.2012

Manual do serviço de telefonia IP da RNP

Capítulo 4 – Arquitetura do fone@RNP v2012

AVISO

O serviço fone@RNP, baseado na tecnologia de Telefonia sobre Internet Protocol (IP), é uma aplicação que utiliza a infraestrutura de redes IP para encaminhar ligações telefônicas. Por isso mesmo, está sujeita às vantagens e desvantagens do IP. A implantação e manutenção de um serviço de telefonia IP não é trivial, e requer profissionais qualificados para exercer tais tarefas. É necessário que o profissional, responsável técnico pelo serviço na instituição, conheça os riscos da implantação deste serviço. É necessário que ele promova e coordene o diálogo entre as equipes de redes, segurança de redes e de telefonia (ou equivalentes). A RNP se preocupa com a segurança do sistema e a qualidade das ligações. O fone@RNP é dotado de uma série de funções e subsistemas que tratam essas questões de forma mais eficiente possível. Entretanto, não pode garantir que o sistema nunca será invadido, nunca terá mau uso, ou nunca sofrerá por consequência de parâmetros Qualidade de Serviço (QoS) inadequados. A Rede Nacional de Ensino e Pesquisa, RNP, possui o dever de informar que não é responsável por quaisquer danos ou prejuízos causados pelo uso do serviço fone@RNP, principalmente relacionados à qualidade das chamadas e à segurança do sistema contra invasões e mau uso.

Capítulo 04 Arquitetura do fone@RNP v2012