• Nenhum resultado encontrado

Padrões de codificação de voz

No documento Introdução à Voz sobre IP e Asterisk (páginas 41-44)

\ \ Principais padrões: \ \ G.711; \ \ G.729; \ \ G.723.1; \ \ iLBC.

A tabela abaixo mostra um resumo da faixa de frequência, taxas de transmissão e latência utilizada nos principais padrões de codificação de áudio.

Padrão Faixa de frequência

Taxa de transmissão Latência Qualidade

G.711 300 Hz – 3.4 kHz 64 kbit/s < 1 Excelente G.722 50 Hz – 7 kHz 48, 56 ou 64 kbit/s < 2 G.722.1 14 kHz 24-32 kbit/s - Boa G.722.2 50 Hz – 7 kHz 6.6 – 23.85 kbit/s - G.723.1 8 kHz 5.3 ou 6.3 kbit/s 100 Razoável a boa G.726 8 kGz 16 – 40 kbits/s 60 Boa a razoável G.728 300 Hz – 3.4 kHz 16 kbit/s < 2 Boa G.729 8 kHz 8 kbits/s 25 – 35 Boa

ILBC 300 Hz – 3.4 kHz 13,33 ou 15,20 kbit/s 30 – 20 Boa

O padrão G.711 é um dos melhores oferecidos pelo mercado, com delay próximo de

Introdução à V

oz sobre IP e Asterisk

O padrão G.729 possui taxa de 8 Kbits/seg e é muito utilizado no mercado. É um codec ITU com a necessidade de compra de licença. Existem as versões G729a, menos complexa que a G729, e a versão G729b, com capacidade de inserir ruído de conforto nas ligações que utilizam VAD (detecção de atividade de voz).

O padrão G 723.1 possui taxas menores que o G.729, é um codec ITU e também necessita de pagamento de licença. Possui taxas de 6,3 ou 5,3 Kbits/seg e seu atraso é da ordem de 37,5 mseg.

O codec iLBC tem fonte aberta, sem exigência de pagamento de licença, sendo uma boa opção de solução de fonte aberta. Sua taxa é da ordem de 13,3 Kbits/seg.

G.711

\

\ Codificador padrão ITU-T de larga aplicação; \

\ Representa os sinais de voz usando o formato PCM; \

\ Comprime amostras PCM com 13 ou 14 bits em 8 bits usando escala

logarítmica, gerando 64 kbps.

A função básica do algoritmo é codificar a voz utilizando 8 bits por amostra; a banda de entrada de voz é amostrada a 8 kHz, mantendo a largura de banda de 300 a 3400 Hz. Com isso, cada canal de voz precisa de 64 kbps.

Dois algoritmos foram definidos no padrão ITU-T G.711: U (ulaw) e A (alaw); o primeiro é utilizado na América do Norte e no Japão, o segundo, na Europa e no resto do mundo. O princípio do codificador G.711 é que se deve utilizar a quantização com escala logarítmica para obter uma relação sinal/ruído independente da intensidade. Isso foi possível duplicando o passo de quantização a cada vez que a intensidade do sinal era duplicada; deste modo obteve-se uma constante.

G.729

\

\ Padrão ITU-T para codificação de sinais de voz a uma taxa de 8 kbps, com

quadros de 2 ou 8 bytes a cada 10 ms;

\

\ Utiliza o algoritmo Conjugate Structure Algebraic Code Excited Linear

Prediction (CS-ACELP), baseado no modelo de codificação Code Excited Linear Prediction (CELP);

\

\ Desenvolvido originalmente para uso na telefonia fixa com comutação de circuito.

O codificador G.729 codifica sinais de voz a uma taxa de 8 kbps usando o modelo CS-ACELP (Conjugate Structure Algebraic Code Excited Linear Prediction), que é

Capítulo 1 – Histórico e conceitos básicos voz de entrada já convertido para o formato PCM uniforme, com 16 bits/amostra e

taxa de amostragem de 8 kHz.

O codificador G.729 trabalha com quadros de 10 ms (ou 80 amostras), que são divididos em dois subquadros de 5 ms (ou 40 amostras). Cada quadro de 10 ms do sinal de voz é analisado para extrair os parâmetros do modelo CELP: os coeficientes preditores do filtro de síntese, os índices dos dicionários fixo e adaptativo e seus respectivos ganhos. Esses últimos são os parâmetros da excitação, determinados para cada subquadro de 5 ms. Esses parâmetros são codificados e transmitidos. No decodificador, esses parâmetros são recuperados para construir a excitação e obter os parâmetros do filtro de síntese. O sinal de voz é reconstruído passando a excitação pelo filtro de síntese de ordem 10. Depois de reconstruído, o sinal de voz é passado por um pós-filtro para melhorar a qualidade do sinal de saída.

G.723.1

\

\ Padrão ITU-T para taxas de bits muito baixas (5,3 ou 6,3 kbps), desenvolvido

para uso em telefonia por redes de pacotes;

\

\ Para taxas de 5,3 kbps, usa o algoritmo ACELP (Algebraic Code Excited

Linear Prediction);

\

\ Para taxas de 6,3 kbps, usa o algoritmo MP-MLQ (Multipulse Maximum

Likelihood Quantization).

O codificador G.723.1 tem duas taxas de bits associadas a ele, de 5,3 e 6,3 kbps. Ele codifica sinais de voz quadro a quadro usando codificação preditiva linear baseada em análise por síntese (CPLbAS). A codificação em taxa alta (6,3 kbps) usa um modelo MP-MLQ (Multipulse Maximum Likelihood Quantization) para gerar o sinal de excitação, enquanto a codificação em taxa baixa (5,3 kbps) usa um modelo ACELP (Algebraic Code Excited Linear Prediction). O tamanho dos quadros é de 30 ms (ou 240 amostras).

O codificador G.723.1 é projetado para operar com o sinal de voz de entrada já convertido para o formato PCM uniforme, 16 bits/amostra e taxa de amostragem de 8 kHz.

iLBC

\

Introdução à V

oz sobre IP e Asterisk

\

\ Baseado em predição linear; não usa o modelo CELP. \

\ Opera a taxas de 13,33 kbps (399 bits em quadros de 30 ms) ou 15,20 kbps

(303 bits em quadros de 20 ms).

O codificador iLBC utiliza o algoritmo de predição linear e suporta dois

comprimentos básicos, quadros de 20 ms a 15.2 kbps e de 30 ms a 13.33 kbps. Quando o codificador trabalha com quadros de comprimento de 20 ms, produz 304 bits de saída por quadro, e para um comprimento de 30 ms por quadro, produz 400 bits de saída, os quais devem ser empacotados para serem transmitidos. Os dois modos para quadros de diferentes tamanhos operam de maneira similar. A descrição do algoritmo resulta em um sistema de codificação de voz com resposta controlada diante da perda de pacotes, similar à especificada no PCM com perda de pacotes no padrão ITU-T G.711, que opera a uma taxa fixa de 64 kbps. Algumas das

aplicações para este codificador estão nas formas de comunicação em tempo real, como telefonia, videoconferência, áudio e envio de mensagens.

Arquitetura VoIP

. . .

Zona 1 Zona 2

. . .

. . .

. . .

PABX PABX GW GW Tel IP TM TM GC MCU GK GC MCU GK Tel IP Rede IP STFC

Visão geral dos diversos elementos que podem interagir dentro da arquitetura VoIP:

\

\ Gatekeeper (GK) – permite o controle centralizado do sistema;

No documento Introdução à Voz sobre IP e Asterisk (páginas 41-44)

Documentos relacionados