AVALIAÇÃO DA QUALIDADE DA VOZ - Melhoria da qualidade da voz de deficientes auditivos utilizand

Não existe um conceito de voz normal, mas sabe-se que esta deve ser uma emissão agradável, sem esforços, e que se enquadre aos interesses sociais, pessoais e profissionais do falante. Define-se com disfonia, a qualquer alteração na emissão vocal, e que seja percebida pelo próprio falante ou ouvinte. As difonias podem ser divididas em: funcional, organofuncional e orgânica (BEHLAU, 2005). As disfonias funcionais são geradas por comportamento vocal inadequado. As organofuncionais, geralmente, são aquelas disfonias funcionais diagnosticadas tardiamente e, por isso, apresentam lesão secundária. Já as difonias orgânicas independem do uso da voz e, geralmente, apresentam qualidade vocal bastante alterada.

O Comitê de Foniatria da Sociedade Europeia de Laringologia sugere a utilização de um protocolo multidimensional, que inclua avaliação perceptivo-auditiva, videoestroboscópica, acústica, aerodinâmica e avaliação da auto-percepção da alteração vocal (DEJONCKERE et al, 2001).

A avaliação perceptivo-auditiva, embora subjetiva, é ainda a mais importante na prática clínica, porque leva em consideração não só os aspectos auditivos, mas também prosódicos sociais e emocionais do falante (BEHLAU, 2001).

Quando se fala em avaliação da qualidade da voz são encontradas algumas linhas de pesquisas distintas: (a) avaliação de voz para sistemas de comunicações, celulares, voz sobre IP (Voip) e TV; (b) avaliação de qualidade de voz voltada para terapia fonoaudióloga com foco em reabilitação de pessoas com dificuldade de fonação e oralização de deficientes auditivos; (c) voz patológica; (d) ferramentas de software para reconhecimento da fala, etc.

O desenvolvimento rápido das tecnologias em sistemas de comunicações, empurrado pelos interesses financeiros das grandes empresas do ramo e a necessidade de definições de padrões resultou na elaboração de alguns métodos objetivos e subjetivos de avaliação da qualidade da voz, pelos Comitês Internacionais do Setor. De uma maneira geral, os métodos para avaliação de voz podem ser agrupados em métodos objetivos e subjetivos.

2.5.1 Métodos Objetivos

Os métodos objetivos são baseados na análise acústica do sinal de voz e em exames laringoscópicos para diagnósticos clínicos. São adotadas comparações do comportamento de várias medidas acústicas do sinal de voz em relação a uma voz de referência, compatível com a idade e sexo da pessoa. As medidas objetivas acústicas podem ser classificadas em 3 diferentes classes: medidas temporais, análise temporal da forma de onda e medidas espectrais.

A análise de medidas acústicas requer, entretanto, o conhecimento do sinal acústico e de sua estrutura, os quais podem revelar a qualidade e funcionamento do aparelho fonador (TERNSTROM, 2005). Esta análise depende, ainda, do tipo de amostra utilizada: vogal sustentada ou amostra de fala contínua. As vogais sustentadas são amplamente utilizadas em estudos da qualidade vocal, embora a fala contínua seja mais natural e próxima à realidade vocal. Por outro lado, a utilização de amostra contínua de fala inclui outros fatores – dialeto, prosódia e articulação – que dificultam a análise da qualidade vocal (KROM, 1995). As medidas acústicas objetivas mais utilizadas são: frequência fundamental, Jitter (indica a pertubação da frequência fundamental a curto prazo), Shimmer (indica a variabilidade da amplitude a curto prazo), relação sinal-ruído (SNR), Harmonics-to-Noise Ratio - HNR (Índice que relaciona a componente harmônica versus a componente de ruído da onda acústica), Normalized Noise Energy – NNE (Mede o ruído da onda sonora ao nível da glote), perfil de extensão vocal (fonetogramas) e espectrografia acústica (espectrogramas e espectro médio de longo termo – LTAS).

Os métodos objetivos caracterizam-se por utilizar expressões matemáticas que podem ser representadas em algoritmos de computadores, fornecendo resultados numéricos. Entretanto para se trabalhar com métodos objetivos são necessários equipamentos eletrônicos de precisão e possuir um excelente isolamento acústico durante a gravação da voz em observação. Em muitos casos, também é desejável trabalhar com banco de vozes padrões.

2.5.2 Métodos Subjetivos

A análise da qualidade da voz envolve fatores que são difíceis de serem ponderados em medidas objetivas, como, por exemplo, o incômodo que uma determinada distorção ou ruído causam, e a inteligibilidade de um sinal.

O conceito de qualidade de voz varia de acordo com a aplicação pretendida e com o público alvo, que pode ser mais ou menos exigente, dependendo de suas características culturais. Portanto, as medidas subjetivas são utilizadas, especialmente em casos em que há a necessidade de resultados realmente confiáveis. Entretanto, as medidas subjetivas possuem maior custo, maior complexidade e demanda mais tempo para a realização de medidas objetivas que estimem a qualidade subjetiva de forma eficiente.

Desta forma, mesmo com o avanço tecnológico propiciando medidas acústicas mais precisas, os métodos subjetivos ainda continuam sendo os mais confiáveis. Os métodos subjetivos são realizados por um grupo de pessoas (LAKANIEMI, 2001). Na primeira fase é feita a gravação do sinal e depois ocorre a avaliação pelas pessoas em diferentes condições. Os métodos ou testes subjetivos se caracterizam pela forma de sua aplicação e pela forma de escolha do grupo de avaliadores. Estes testes, geralmente, são aplicados em sala especial com controle de ruído de fundo e fatores ambientais. Estes testes são mais caros e trabalhosos porque a exatidão dos resultados é dependente da quantidade de avaliadores.

Os testes subjetivos, em telefonia, podem ser divididos em três grupos: os de entrevistas, os conversacionais e os de audição (RANGO et al, 2006).

Os testes de entrevista são realizados através de questionários aplicados aos avaliadores sobre a qualidade de voz do indivíduo, previamente gravada. Quanto maior a quantidade de questionários maior a exatidão dos resultados.

Os testes conversacionais envolvem duas pessoas que tenham sido especificamente treinadas, uma falando e a outra ouvindo (teste bidirecional), de acordo com alguma metodologia a ser adotada.

Os testes de audição são unidirecionais e a avaliação da qualidade da voz envolve uma escala de referência, a partir de sentenças simples. Os testes de referência mais conhecidos são: ACR (Absolute Category Rating), DCR (Degradation Category Rating) e CCR (Comparison Category Rating).

2.5.2.1Testesdequalidadeabsoluta(AbsoluteCategoryRating–ACR)

Nos testes de qualidade absoluta (ACR) o avaliador não dispõe de material para comparação. A avaliação é realizada baseada somente na amostra de voz em análise, sem qualquer objeto de comparação. Estes testes podem utilizar três escalas de opiniões: Qualidade de audição, esforço de audição e preferência de sonoridade. As Tabelas 2.6, 2.7 e 2.8 ilustram estes testes. Os resultados, valores numéricos, representam o escore de opinião média subjetiva – MOS (ITU-T, 1996).

Tabela26Escaladequalidadedeaudição Qualidade de voz Pontos

Excelente 5 Boa 4 Razoável 3 Pobre 2 Ruim 1 Tabela27Escaladesonoridadeparacompreensão Esforço requerido para a compreensão

do significado das sentenças Pontos

Relaxamento completo possível, nenhum esforço requerido 5 Atenção necessária, pouco esforço requerido 4 Esforço moderado requerido 3 Considerável esforço requerido 2 Nenhum significado é reconhecido, qualquer que seja o esforço 1

A pontuação em MOS é produzida subjetivamente por um grande grupo de usuários, a qual cada usuário expõe sua opinião sobre a qualidade da voz. A partir destes resultados, é calculada a média desta pontuação (escores).

Tabela28Escaladepreferênciadesonoridade Preferência de sonoridade Pontos

Muito mais alto que o ideal 5 Mais alto que o ideal 4

Ideal 3 Mais baixo que o ideal 2

Muito mais baixo que o ideal 1

2.5.2.2Testesdedegradação(DegradationCategoryRating–DCR)

Os testes de degradação (DRC) são recomendados quando se trata de uma excelente qualidade de voz e os resultados do teste de ACR tornam-se inadequados. Neste teste são comparadas as amostras em testes com amostras padrões. Os resultados são colocados em uma escala numérica de degradação e resumidos em um escore de opinião média subjetiva (MOS). A Tabela 2.9 ilustra um modelo de teste DCR.

Tabela29Escaladedegradação

Nível de degradação Pontos

Inaudível 5 Audível, mais incômoda 4

Incomoda um pouco 3

Incomoda 2 Incomoda muito 1

2.5.2.3TestesdeComparação(ComparisonCategoryRating–CCR)

Os testes de comparação são similares aos DCRs. O que diferencia é o tipo de uso das amostras. No DCR a amostra de referencia é a primeira apresentada, seguida da amostra em avaliação. No CCR esta ordem é aleatória e o avaliador não sabe disso. Além disso, no

CCR o avaliador tem que responder qual sinal é melhor e o quanto é melhor. A Tabela 2.10 apresenta um exemplo de escala para uso do teste CCR.

Tabela210Testedecomparaçãoentreelementosdeumpar:antesedepois Comparação entre os sinais Pontos

Muito melhor 3 Melhor 2 Ligeiramente melhor 1 Aproximadamente igual 0 Ligeiramente pior -1 Pior -2 Muito pior -3

As escalas de degradação e de comparação entre elementos de um par, usando os métodos de classificação DCR e CCR, utilizam a média aritmética denominada “Comparative

Mean Opinion Score – CMOS” (ITU-T, 1996).

No documento Melhoria da qualidade da voz de deficientes auditivos utilizando-se correção da frequência fundamental. (páginas 57-62)