• Nenhum resultado encontrado

FERRAMENTAS USADAS/CRIADAS COMO SUPORTE À DETERMINAÇÃO AUTOMÁTICA DE PARÂMETROS

6.7 Chirp Z Transform

Esta é uma técnica de passagem da representação do sinal no domínio temporal para o domínio Z das frequências.

Foi usada no algoritmo de extracção automática de formantes pelo método de análise cepstral com a finalidade de realizar o "zoom" de frequências. Para o seu uso recorreu-se à função CZT() da "toolbox Signal Processing" do programa Matlab. A função G=CZT(X,K,W,A) usa as variáveis:

G - vector com os K elementos de saída da transformada do sinal de entrada X.

W - espaçamento entre pontos ao longo do contorno espiral do plano de interesse.

A - O ponto complexo de início desse contorno.

O desenvolvimento teórico desta transformada é apresentado por [Schafer 70], da qual se apresentam as vantagens:

- O número de amostras do sinal no domínio dos tempos não tem que igualar o número de pontos da transformada nas frequências.

- O ponto do domínio Z a que se inicia o cálculo da transformada é arbitrário. Isto permite centrar a análise na região de frequências de interesse.

- O espaçamento frequencial das amostras espectrais é arbitrário, o que permite obter uma resolução frequencial tão fina quanto se pretenda.

a)

b)

Figura 6.12 - Exemplo do "zoom" realizado pelo CZT. a) espectro alisado pelo cepstro de um segmento de fala; b) "zoom" com CZT na zona de frequências de 500 a

1400Hz.

Esta transformada é aplicada no algoritmo de extracção automática dos formantes pelo método do cepstro para se conseguir um "zoom" em frequências do espectro alisado pelo cepstro quando dois formantes aparecem suficientemente próximos ao ponto do espectro alisado não conseguir distinguir as suas frequências. Nestes casos, a função da janela de "lifteragem"i usada no cepstro, para separar as características do

i

Janela usada no método do cepstro para separar gradualmente as altas das baixas quefrências e consequentemente as características espectrais do trato vocal das da frequência fundamental, alisando assim o espectro do trato vocal tanto quanto se pretenda. Ver secção seguinte.

trato vocal das características da frequência fundamental, deve ser mais larga, para que o espectro não seja tão alisado e permitir destinguir os dois formantes. Um exemplo destes casos é apresentado na figura 6.12 em que no espectro alisado pelo cepstro na figura 6.12a não se distinguem o primeiro e segundo formantes próximos na zona de frequências dos 1000Hz e na figura 6.12b depois de realizado o "zoom" do espectro naquela zona de frequências, já se distinguem as frequências dos dois formantes. F1=820Hz e F2=1180Hz.

6.8 Cepstro

Análise cepstral é o nome dado a uma gama de técnicas que utilizam funções que podem ser consideradas como "espectro do espectro logarítmico".

Esta ferramenta já abordada no 4º capítulo em que se referiram as aplicações na área da análise de sinais de fala, nomeadamente das propriedades que permitem realizar a separação da componente fundamental da componente do trato vocal, determinação da frequência fundamental e alisamento do envelope espectral do trato vocal.

Apresenta-se aqui uma pequena abordagem do cepstro, referindo o estudo teórico mais profundo a [Proakis 92], [Noll 67] e [Rabiner 78].

Tendo sido inicialmente proposto como a melhor alternativa às funções de autocorrelação para a detecção de ecos em sinais sísmicos, pode definir-se como a transformada inversa de Fourier do logaritmo do espectro.

A análise cepstral divide-se em dois métodos, o cepstro de potências e o cepstro complexo.

A definição do cepstro de potências é

}

{

CAA( )σ = F−1 logSAA( )f (6.9)

Onde F é a transformada de Fourier e SAA(f) é o auto espectro médio de potências,

bilateral:

}

{

SAA( )f = F a t( ) 2 (6.10)

O sinal analítico correspondente pode obter-se a partir do espectro logarítmico unilateral de potências

}

{

 ( ) ( ) CAA σ = F−1 TAA f (6.11) com T f S f S f AA AA AA ( ) log ( ) log ( ) =      2 f > 0 f > 0 0 f < 0 (6.12)

a parte real de CAA( )σ é igual à parte real de CAA(σ).

O parâmetro σ na definição é uma variável temporal, embora seja chamada quefrency. A definição do cepstro complexo

}

{

CA( )σ =F−1 log ( )A f (6.13)

sendo A(f) o espectro complexo de a(t):

}

{

A f( )= F a t( ) =AR( )f + jA fI( ) (6.14) ou A f( )= A f e( ) jφ( )f (6.15) resultando log ( )A f =logA f( ) + φj ( )f (6.16)

Quando a(t) é real, A(f) será par conjugada e o cepstro complexo é real.

O cepstro complexo CA( )σ = F−1

{

logA f( ) + jφ( )f

}

alegadamente mais poderoso que o cepstro de potências exige que a função de fase φ(t) seja uma função contínua, em vez da função apresentada em módulo 2π, como normalmente se usa e se obtém nos cálculos directos com as equações 6.14 e 6.15. Quando assim acontece deve-se usar o desempacotamento de fase para passar a função do módulo 2π para uma função contínua.

Nas funções de fase mínima (funções que não apresentam pólos nem zeros no semi- plano direito de Laplace), a fase não precisa de ser medida.

O cepstro complexo de uma função de fase mínima é causal (existe só para quefrências positivas), dado que as partes real e imaginária da respectiva transformada de Fourier estão relacionadas por uma transformada de Hilbert [Freitas 93].

Para funções de fase mínima o cepstro complexo pode obter-se do cepstro de potências duplicando os valores de quefrências positivos e anulando os de quefrências negativas.

Uma propriedade do cepstro que lhe permite um grande número de aplicações é a possibilidade de separar efeitos da fonte e dos caminhos de transmissão, isto é, efectua a desconvolução.

B(f)=A(f).H(f) (6.17)

logB(f)=logA(f) + logH(f) (6.18) e

}

{

}

{

}

{

F−1 log ( )B f = F−1 log ( )A f +F−1 log ( ) H f (6.19) o mesmo pode ser escrito para o cepstro de potências mostrando que os efeitos da fonte e da transmissão são aditivos no cepstro de potência.

A subtracção do cepstro de potências da fonte permitirá conhecer o cepstro só da transmissão.

As aplicações para o cepstro vão desde a detecção e remoção de ecos, estabelecimento de propriedades de uma superfície reflectora, passando pela análise da fala até ao diagnóstico em máquinas.

Esta ferramenta foi usada recorrendo à função rceps() da "toolbox Signal Processing" do Matlab.

O alisamento espectral realizado pelo método do cepstro recorre a uma "lifteragem" linear. Isto é, o sinal do cepstro é sujeito a uma função de "filtragem" nas quefrências para remover a componente espectral relativa ao período fundamental.

Figura 6.13 - Função da janela l(n) usada no alisamento espectral pelo método do cepstro.

A componente devida ao modelamento da forma de onda glotal e do trato vocal está concentrada na região de quefrências inferiores a σ e a componente devida ao período

do período fundamental do segmento analisado. O período fundamental pode ser determinado procurando no cepstro um pico forte na região acima de um σmin

esperado para o período fundamental. O envelope espectral pode ser obtido por um "short pass lifter" da amplitude logarítmica da transformada discreta de Fourier. No método do cepstro esta filtragem é realizada multiplicando o sinal do cepstro por uma função de "short pass liftering", l(n), da forma

[

]

{

}

l n( )= +cos (n− ) ≤ <n + ≥ +      1 1 1 1 n < 1 2 0 n 1 1 1 σ π σ σ σ σ ∆σ ∆σ ∆σ (6.20)

em que σ1 +∆σ é menor que o período fundamental mínimo esperado.

A figura 6.13 mostra a função da janela com σ1=1ms , ∆σ=3ms, frequência de

amostragem de 11.025 Khz e uma janela de 400 amostras determinada pela função

flifter() desenvolvida em Matlab e cujo código se apresenta no anexo B5.

Quanto maior é σ1 +∆σ menos alisado será o espectro, sendo também verdadeiro o

inverso. Uma correcta escolha destes parâmetros é portanto extremamente importante para se obterem bons resultados com o alisamento espectral. Esta importância é acrescida quando as formantes são directamente extraídas do espectro alisado.

Não se poderá deixar de referir que devido à componente da frequência fundamental aparecer separada no cepstro manifestando-se pelo aparecimento de um pico às quefrências correspondentes à duração do período fundamental, pode-se avaliar da vocalização ou não do segmento em causa pela existência ou não do referido pico, já que este aparece apenas para a fala vocalizada.

No documento UNIVERSIDADE DO PORTO FACULDADE DE ENGENHARIA (páginas 105-110)