• Nenhum resultado encontrado

SBrT XVIII Simpósio Brasileiro de Telecomunicaοc~oes, 3 a 6 de Setembro, 2000, Gramado-RS Um Método de Busca Rápida no Dicionário Adaptativo em

N/A
N/A
Protected

Academic year: 2021

Share "SBrT XVIII Simpósio Brasileiro de Telecomunicaοc~oes, 3 a 6 de Setembro, 2000, Gramado-RS Um Método de Busca Rápida no Dicionário Adaptativo em"

Copied!
5
0
0

Texto

(1)

Um Metodo de Busca Rapida no Dicionario Adaptativo em

Codi cadores de Voz CELP

Ranniery da S.Maia,Cassio B. Ribeiro,Sergio L. Netto e Fernando GilV. Resende Jr.

Programa de Engenharia Eletrica/COPPE,DEL/EE

Universidade Federal doRio de Janeiro

CP 68504,Rio de Janeiro, RJ,21945-970, BRASIL

Fone: (0xx21)260 5010, Fax: (0xx21)290 6626

franniery, cassio, sergioln, gilg@lps.ufrj.br

Resumo

Estetrabalhoapresentaummetododebuscarapidano

dicionario adaptativoem codi cadores de voz por

pre-dic~ao linear com excitac~ao por codigos de dicionarios

(code-excited linear prediction, CELP). Resultados

ex-perimentais,que incluemtestescom diferentes tipos de

dicionariosetamanhosdesegmentos,mostramqueo

sis-tema proposto e capaz de reduzir em torno de 30% a

50% o tempo total de codi cac~ao, quando comparado

comosistemasem buscarapida,introduzindo mnimas

distorc~oesnosinal.

1 Introduc~ao

Atualmente,aplicac~oesligadasaInterneteatemesmoo

grandedesenvolvimentodossistemasdetelefoniamovel

v^emrequerendo codi cadores devozqueobtenham um

compromissocadavez melhorentrequalidadeetaxade

bits consumida. Uma dastecnicas mais utilizadas

atu-almente para a codi cac~ao de voz a baixas taxas e a

tecnicaCELP[1],cujoprincipalproblemade

implemen-tac~ao esta na complexidadee tempo de processamento

para a determinac~ao da melhor excitac~ao. Para

ame-nizarestes problemas, algumas formas de acelerar esta

tecnicaforampropostasnaliteratura[2],oquepermitiu,

em conjunto com o maiordesenvolvimento dos

proces-sadoresdesinal digital,aimplementac~aodacodi cac~ao

CELPemtemporeal. Osmetodosempregadospara

bus-carapida,nasuamaioria,agilizamabuscanodicionario

xo,sendoabuscanodicionarioadaptativofeitada

for-ma convencional. Este trabalho prop~oe um metodo de

buscarapidanodicionarioadaptativo[3,4],quee

com-Estetrabalho foirealizadocomsuporte nanceiro deCNPq,

CAPES,FAPERJeFUJB/UFRJ.

paradoao mostrado em [5] para dicionarioscom esem

atrasosfracionariosediferentestamanhos desegmentos

devoz. Acomparac~aoefeitaemtermosdequalidadedo

sinalreconstrudoetempodeprocessamento.

O trabalho esta organizado da seguinte forma: na

Sec~ao 2 apresentamos rapidamente atecnica de

codi -cac~aoCELP;naSec~ao3apresentamosometododebusca

rapidapropostoem[5];naSec~ao4eexplicadoometodo

de busca rapida aqui proposto; na Sec~ao 5 mostramos

os resultados dos experimentos realizados comparando

asperformancesdosmetodosdebuscarapidaemtermos

detempodeprocessamento equalidadedosinaldevoz

decodi cado;por m,naSec~ao6inclumosasconclus~oes.

2 A tecnica CELP

A Figura 1 mostra o diagrama de blocos do

codi ca-dordevozCELPtidocomopadr~ao. Avozreconstruda

^

s(n)eobtidaao passarosinal de excitac~ao x(n),

com-posto pelos dicionarios adaptativoe xo, pelo ltro de

sntese H(z) = 1=A(z). O ltro de ponderac~ao do

er-ro W(z) = A(z)=A(z= ) modi ca o sinal de erro e(n)

durante o procedimento de analise-por-sntese para se

obterasmelhorescomponentesdeexcitac~aodecada

di-cionario.

A tecnica CELPsegmenta osinal de voz em blocos,

ques~aoposteriormentedivididosemsub-blocos. Os

pa-r^ametros do ltro de sntese H(z) s~ao determinados a

cada bloco, enquanto que os ganhos endices dos

dici-onarios, quecomp~oemaexcitac~aox(n), s~ao

determina-dosacadasub-bloco. Osintetizador, oudecodi cador,

tambemfazpartedocodi cadoreestaselecionadopela

linha pontilhada. Isto ocorre porque a tecnica CELP

(2)

-? -6 6 6 -?   ? Dicionario Adaptativo I X Dicionario Fixo xfI(n) X e(n) G a G f x(n) H(z)= 1 A(z) ^ s(n) s(n) W(z)= A(z) A(z= ) ew(n) Minimizac~ao de P e 2 w (n) + + D xaD(n)

Figura1: Estruturadocodi cadorCELPtidacomo

pa-dr~ao. -6 6 -? -? ? - ? 6 - -Dicionario Adaptativo I X Dicionario Fixo xfI(n) X Ga Gf D xaD(n) W(z)= A(z) A(z= ) s w (n) t(n) Minimizac~ao de P e 2 w (n) ew(n) + + s(n) ^ s0(n) + x(n) x(n)

Estadoinicialnulo Hw(z)=

1

A(z= ) ^

t(n)

Figura 2: Estrutura do codi cador CELP para

imple-mentac~ao.

varios sub-blocos de voz s~ao sintetizados para a

esco-lhadospar^ametros(ndiceseganhos)responsaveispela

reproduc~ao do sub-bloco que ocasionea menor energia

doerroponderadoe

w (n).

Odicionarioadaptativo,quesubstituio ltrodepitch

das primeiras vers~oes da tecnica CELP, e composto a

partir de uma unica sequ^encia formada com amostras

dasexcitac~oeseminstantes passados,ouseja,

fc a (n)g=fx( D max );:::;x( 1)g; (1) onde D max

corresponde ao maximo atraso considerado

noprocessodebuscadamelhorexcitac~aox

aDot (n).

Napratica,ocodi cadorCELPeimplementado

pas-sandoo ltroW(z)paraosdoisramosantesdosomador

que comp~oe o sinalde erro e(n), eseparando a

respos-ta do ltro recursivo resultante H

w

(z) = 1=A(z= )em

duas partes: arespostacomestado inicial zero, ^

t(n), e

aresposta aentrada zero, s^

0

(n). A Figura2 mostra o

diagramadosistema levando-seemcontaestas

conside-rac~oes. -6 6 -6 ? - -Dicionario Adaptativo I X Dicionario Fixo xfI(n) X Ga Gf D xaD(n) y(n) A(z= ) ^s(n) A(z) Hw(z)= 1 A(z= ) +

Figura 3: Novo modelo de sntese obtido a partir do

modeloconvencional,paraometododebuscarapidano

dicionarioadaptativode[5].

-6 6 -6 ? ? -? ? - -Dicionario Adaptativo I X Dicionario Fixo xfI(n) X Ga Gf D + xaD(n) y(n) W(z)= A(z) A(z= ) s w (n) t(n) Minimizac~ao de P e 2 w (n) ew(n) + + ^ t(n) s(n) ^ s0(n) H w (z)= 1 A(z= )

Estadoinicialnulo

Figura 4: Estrutura pratica do codi cador CELP

mo-di cada para o metodo de busca rapida no dicionario

adaptativode[5].

3 Ometodode buscarapidade [5]

Ometodode buscanodicionarioadaptativo

apresenta-do em [5] modi ca o sintetizador CELP mostrado na

Figura 1 baseando-se no fato de que o ganho G

a , os

par^ametrosdeH(z)eoatrasoD n~aovariammuitoem

umblocodevozsonoro. Onovomodelo,queesta

mos-tradonaFigura3,resultadeumatransformac~aodo

mo-deloconvencionaleumaposteriorsimpli cac~ao,

confor-meemostradoem[5].

Com este novo modelo, o codi cador CELP pratico

passa a ser aquele mostrado na Figura 4, onde o

di-cionario adaptativoe atualizado com a sequ^encia y(n)

obtidasegundomostraaFigura3. Pode-seperceber

cla-ramentequenestenovomodeloassequ^enciascandidatas

x

aD

(n)n~aos~ao ltradasemhipotesealgumadurante

to-dooprocessodecodi cac~ao,reduzindoassimotempode

processamentoparaadeterminac~aodamelhorexcitac~ao

(3)

- -c a (n) H w (z)= 1 A(z= ) c aF (n)

Figura5: Gerac~aododicionarioadaptativo ltrado

usa-donometodopropostodebuscarapida.

4 O metodo de busca rapida

pro-posto

O metodo aqui proposto para a busca rapida no

di-cionario adaptativo tambem evita a ltragem de cada

sequ^enciacandidata x

aD (n)porH w (z). Neste metodo, asequ^enciac a

(n),daqualecompostoodicionario

adap-tativo segundo mostra (1), e inteiramente ltrada por

H

w

(z),gerandoassimumasequ^enciac

aF

(n)queformara

odicionarioadaptativo ltrado,conformemostraa

Figu-ra5. Abuscadamelhorexcitac~aonestenovodicionario

passaent~aoaserfeitasemquesejanecessario ltrarcada

sequ^enciacandidata individualmente,ou seja,utiliza-se

domodelomostradonaFigura4comodicionario

ltra-donolugardooriginal.

SendodeterminadoomelhoratrasoD

ot

nodicionario

adaptativo ltrado, a leitura da melhor sequ^encia

x

aD

ot

(n)efeitaemc

a

(n)(dicionariooriginal),quedepois

eatualizadocomx(n), ouseja, apartirdoinstante em

queedeterminadoomelhoratrasoD

ot

,oprocedimento

debuscapassaaserexatamenteigualaometodo

utiliza-dopelosistema sembuscarapida,equeecaracterizado

pelo modelomostradonaFigura2

Portanto, neste metodo existemsomente duas

ltra-gens relativas ao dicionario adaptativo para cada

sub-bloco: a de c

a

(n) por H

w

(z) no incio do processo de

busca, e a da melhor sequ^encia x

aDot

(n), lida no

dici-onario adaptativo original, tambem por H

w

(z) para a

determinac~aodo ganhoG

a

. Esteprocedimento garante

umaacelerac~aodoprocessodebuscadex(n).

5 Experimentos

Osdoismetodosde buscarapidaforam implementados

nosistema CELPdescritoem[3]semaquantizac~aodos

ganhos G

a e G

f

. As medidas objetivas utilizadas

cor-responderamaraz~aosinal-rudosegmentadaperceptual

(RSRSP)[3],adist^anciacepestral(DC)[6]eadist^ancia

deItakura(DI)[7]. Asduasultimasquanti camas

dife-rencasnodomniodafrequ^encia,enquantoqueaRSRSP

tratamaisasdiferencasnodomniodotempo.

Assentencasescolhidasparaoexperimento

correspon-lnguaportuguesafaladanoBrasil,sendodoissinais

ge-radosporlocutoresdosexomasculino(M1eM2)edois

porlocutoresdosexofeminino(F1eF2). Ossinaisforam

digitalizadosa 8kHzcom16 bitspor amostra. Aposa

digitalizac~ao,foirealizadauma ltragempassa-altas

pa-raaremoc~aoderudosdebaixafrequ^encia.

Daqui em diante o metodo de buscarapidaproposto

em[5]serareferenciadocomoMetodoI,enquantoqueo

metodo propostoneste trabalhoserareferenciadocomo

MetodoII.

5.1 Experimento 1

Neste experimento, veri camos asperformancesdo

sis-tema CELP sem e com os metodos I e II para busca

rapida nodicionarioadaptativo. Ostestes foram feitos

emtermosdemedidasobjetivasdequalidadeetempode

processamentoemumaestac~aodetrabalhoSunUltra60.

Foram consideradosblocosde 20ms comsub-blocosde

5 ms, e foi usado um dicionario adaptativo com

atra-sos fracionarios cujas resoluc~oes foram distribudas da

seguinteforma: oitavasde20a55,quartasde55a101e

unitariasde101a146. ATabela1sintetizaosresultados

aquiobtidosnacodi cac~aodas4frasesconsideradas.

Tabela 1: Experimento 1- Medidasobjetivas de

quali-dadeem dB etempo deprocessamento (TP) com

dici-onario adaptativo com atrasos fracionarios e blocos de

20ms comsub-blocosde5ms.

SistemaCELPsembuscarapida

Locutor RSRSP DC DI TP (s)

M1 17,75 2,87 1,02 39,774

M2 18,43 2,93 1,04 51,068

F1 19,23 2,98 1,10 37,534

F2 17,01 3,14 1,21 45,100

SistemaCELPcomoMetodoI

Locutor RSRSP DC DI TP (s)

M1 16,24 3,20 1,25 26,806

M2 16,79 3,19 1,24 34,364

F1 18,05 3,01 1,10 25,547

F2 15,97 3,16 1,23 30,573

SistemaCELPcomoMetodoII

Locutor RSRSP DC DI TP (s)

M1 17,60 2,93 1,05 27,250

M2 18,43 2,93 1,04 35,030

F1 18,89 2,89 1,02 25,969

F2 16,77 3,07 1,17 31,329

(4)

am-tagemdoMetodoI,comoesperado. Emtermosde

me-didasobjetivasdequalidade,oMetodoIIintroduzuma

distorc~ao sensivelmente menor que a do outro metodo.

Alias, para as sentencas F1 e F2 aqualidade melhorou

emrelac~aoaosistema sem buscarapida, segundoaDC

eaDI. Issopode ter ocorrido pelo fatodestas medidas

avaliarem aqualidadedo sinal basicamente nodomnio

dafrequ^encia. Por m,pode-setambemperceberqueos

doismetodosreduzememcercade32%otempototalde

codi cac~aoemrelac~aoaosistema sembuscarapida.

5.2 Experimento 2

Neste caso,realizamostestes semelhantes aos do

Expe-rimento 1, considerando aqui, porem, blocos de 30 ms

com sub-blocos de 7,5 ms. Os resultados encontrados,

qualitativamenteanalogosaosdocasoanterior,s~ao

rela-cionadosnaTabela2.

Tabela 2: Experimento 2 -Medidas objetivas de

quali-dadeem dB etempode processamento(TP) com

dici-onario adaptativocom atrasos fracionarios e blocos de

30mscomsub-blocosde7,5ms.

SistemaCELPsembuscarapida

Locutor RSRSP DC DI TP(s)

M1 16,26 3,12 1,20 37,708

M2 17,03 3,08 1,16 48,466

F1 17,74 3,14 1,21 35,961

F2 15,63 3,33 1,37 43,304

SistemaCELPcomoMetodoI

Locutor RSRSP DC DI TP(s)

M1 15,45 3,40 1,42 25,425

M2 16,10 3,27 1,30 32,612

F1 17,04 3,34 1,35 24,299

F2 15,07 3,38 1,40 29,137

SistemaCELPcomoMetodoII

Locutor RSRSP DC DI TP(s) M1 16,16 3,22 1,26 25,618 M2 16,86 3,09 1,17 32,958 F1 17,56 3,17 1,24 24,312 F2 15,45 3,29 1,33 29,257 5.3 Experimento 3

Por m,foiutilizadoodicionarioadaptativosematrasos

fracionarios,comfaixade20a146,nolugardaquelecom

atrasosfracionariosutilizadoanteriormente. Os

resulta-dosobtidoss~aomostradosnaTabela3,usando-seblocos

to1acima.

Tabela 3: Experimento 3- Medidasobjetivas de

quali-dadeem dB etempo deprocessamento (TP) com

dici-onario adaptativo sem atrasos fracionarios e blocos de

20ms comsub-blocosde5ms.

SistemaCELPsembuscarapida

Locutor RSRSP DC DI TP (s)

M1 17,26 3,01 1,12 7,336

M2 18,37 2,87 1,00 9,489

F1 18,61 2,90 1,04 7,024

F2 16,77 2,84 1,00 8,439

SistemaCELPcomoMetodoI

Locutor RSRSP DC DI TP (s)

M1 16,12 3,27 1,31 3,576

M2 16,75 3,20 1,25 4,614

F1 17,68 3,51 1,51 3,416

F2 15,72 3,18 1,24 4,105

SistemaCELPcomoMetodoII

Locutor RSRSP DC DI TP (s)

M1 17,23 3,02 1,12 3,702

M2 18,13 2,86 1,00 4,747

F1 18,55 2,94 1,06 3,559

F2 16,56 2,96 1,07 4,246

Cabenotaraquiareduc~aodrasticadotempototalde

processamentodevidoaousodeumdicionario

adaptati-vosematrasosfracionarios,causadapeladiminuic~aodas

sequ^encias candidatas epelo fato de n~ao haver

necessi-dadedeseutilizaro ltrointerpoladorparaaobtenc~ao

dosatrasoscomfrac~oesdeamostras. Nestecasoo

tem-pototaldecodi cac~aofoireduzidoemtornode50%em

relac~ao aosistema sembuscarapida. Emtermos

quali-tativos,porem,temos queoMetodoII introduz

signi -cativamente menosdistorc~aotambemneste caso.

Pode-sepercebertambem queousododicionarioadaptativo

sematrasosfracionariosmelhoraassentencasM2, F1e

F2 para o casosem busca rapida, eas sentencas M2 e

F2 para os caso do Metodo II; quando consideradas a

DC ea DI(tabelas 1e 3). Istopodeter ocorridopelo

fatodestasmedidas analisaremmaisasdiferencasentre

ossinaisnodomniodafrequ^encia,apesardeseesperar

sempreque aintroduc~ao de um dicionario comatrasos

fracionariosmelhoreaqualidade.

5.4 Experimento 4

Foirealizado umtestesubjetivoinformal,que consistiu

(5)

suas respectivas opini~oes. A Tabela 4 mostra os

per-centuaisdeouvintes queacharammelhorosistemasem

busca rapida, o sistema com o Metodo II, ou

qualida-deindistinguvel,paracadasentenca. Pode-seperceber,

dosresultadosapresentados,queaqualidadedosistema

comoMetodoIIfoijulgadasuperiorparaasentencaF1

einferiorparaasentencaM1, enquantoqueparaocaso

dassentencasM2eF2,asqualidadesforamconsideradas

indistinguveis.

Tabela4: Experimento4-Avaliac~aosubjetivainformal:

percentuaisdeouvintesquejulgaramsermelhoro

siste-masembuscarapida(SR),osistemacomoMetodoII,

ou qualidade idistinguvel, para blocos de 20 ms com

sub-blocosde 5ms e dicionarioadaptativosem atrasos

fracionarios.

Sentenca MelhorSR (%) MelhorII(%) Iguais(%)

M1 60,87 8,70 30,43

M2 17,39 39,13 43,48

F1 17,39 56,52 26,09

F2 26,09 30,43 43,48

6 Conclus~ao

Estetrabalhoapresentouummetododebuscarapidano

dicionarioadaptativoemcodi cadoresCELPea

posteri-orcomparac~aocomoutrometodoexistentenaliteratura.

Ostestes foram feitos em termos de medidas objetivas

dequalidadeetempodeprocessamento,paradicionarios

comesematrasosfracionariosediferentes tamanhosde

blocos de voz. Osresultados mostraram queo metodo

proposto produz qualidade superior, enquanto reduz o

tempo deprocessamento namesma proporc~ao (em

tor-node 30%a50%do tempo totalde codi cac~ao)que o

metododerefer^encia. Umtestesubjetivoinformal

indi-couqueometodopropostoobtemqualidadecomparavel

aometodoconvencionaldebusca.

Refer^encias

[1] M.R.SchroederandB.S.Atal,\Code-excitedlinear

prediction (CELP): high-quality speech at very low

Speech, andSignalProcessing,pp.937{940,1985.

[2] W. B. Kleijn, D. J. Krasinski, and R. H. Ketchum,

\Fast methods for the CELP speech coding,"

IE-EETrans.Acoustics, Speech, andSignalProcessing,

vol.38,pp.1330{1342,Aug.1990.

[3] R.S.Maia,\Codi cac~aoCELPeanaliseespectralde

voz,"TesedeM.Sc.,COPPE/UFRJ,RiodeJaneiro,

RJ,Brasil, Mar.2000.

[4] R. S. Maia, C. B. Ribeiro, F. G. V. Resende Jr. e

S. L. Netto, \Um sistema CELP para acodi cac~ao

dafalaa4,4kb/s,"XIIICongressoBrasileirode

Au-tomatica,Florianopolis,Brasil,Set.2000.

[5] L. M. da Silva and A. Alcaim, \A modi ed CELP

model withcomputacionallyeÆcientadaptive

code-booksearch,"IEEESignalProcessingLetters,vol.2,

pp.44{45,Mar.1995.

[6] N. Kitawaki, H. Nagabuchi,and K. Itoh,

\Objecti-ve quality evaluation for low-bit-rate speech coding

systems," IEEE Journal on Selected Areas in

Com-munications, vol.6,pp.242{248,Feb.1988.

[7] J. R. Deller, J. G. Proakis, and J. H. L. Hansen,

Discrete-Time Processing of Speech Signals. New

Referências

Documentos relacionados

a) Sistema de produto: produção integrada: soja, capim e algodão. O capim é cultivado como espécie formadora de palha; não é colhido ou pastejado, correspondendo, portanto, a um

Os sensores são desligados e após alguns instantes ligados novamente para aferição, onde é passado um gás de concentração intermediária de CO 2 (292 ppm) e

The strict partition problem is relaxed into a bi-objective set covering problem with k-cliques which allows over-covered and uncovered nodes.. The information extracted

Therefore, the analysis of suitability of the existing transportation network for riding bicycle in Coimbra should address two important aspects: (i) identifying

Dessa maneira, os resultados desta tese são uma síntese que propõe o uso de índices não convencionais de conforto térmico, utilizando o Índice de Temperatura de Globo Negro e

Atualmente os currículos em ensino de ciências sinalizam que os conteúdos difundidos em sala de aula devem proporcionar ao educando o desenvolvimento de competências e habilidades

In response to vaccine, Curraleiro Pé-duro showed greater ability to respond specifically to BCG, generating resistance profile (Th1), evidenced by greater number of antigen

Tendo este trabalho como objectivo, ilustrar os vários aspectos da relação de Simone de Beauvoir com o nosso país, abordámos, com esse intuito, as visitas efectuadas por esta