Um Metodo de Busca Rapida no Dicionario Adaptativo em
Codicadores de Voz CELP
Ranniery da S.Maia,Cassio B. Ribeiro,Sergio L. Netto e Fernando GilV. Resende Jr.
Programa de Engenharia Eletrica/COPPE,DEL/EE
Universidade Federal doRio de Janeiro
CP 68504,Rio de Janeiro, RJ,21945-970, BRASIL
Fone: (0xx21)260 5010, Fax: (0xx21)290 6626
franniery, cassio, sergioln, gilg@lps.ufrj.br
Resumo
Estetrabalhoapresentaummetododebuscarapidano
dicionario adaptativoem codicadores de voz por
pre-dic~ao linear com excitac~ao por codigos de dicionarios
(code-excited linear prediction, CELP). Resultados
ex-perimentais,que incluemtestescom diferentes tipos de
dicionariosetamanhosdesegmentos,mostramqueo
sis-tema proposto e capaz de reduzir em torno de 30% a
50% o tempo total de codicac~ao, quando comparado
comosistemasem buscarapida,introduzindo mnimas
distorc~oesnosinal.
1 Introduc~ao
Atualmente,aplicac~oesligadasaInterneteatemesmoo
grandedesenvolvimentodossistemasdetelefoniamovel
v^emrequerendo codicadores devozqueobtenham um
compromissocadavez melhorentrequalidadeetaxade
bits consumida. Uma dastecnicas mais utilizadas
atu-almente para a codicac~ao de voz a baixas taxas e a
tecnicaCELP[1],cujoprincipalproblemade
implemen-tac~ao esta na complexidadee tempo de processamento
para a determinac~ao da melhor excitac~ao. Para
ame-nizarestes problemas, algumas formas de acelerar esta
tecnicaforampropostasnaliteratura[2],oquepermitiu,
em conjunto com o maiordesenvolvimento dos
proces-sadoresdesinal digital,aimplementac~aodacodicac~ao
CELPemtemporeal. Osmetodosempregadospara
bus-carapida,nasuamaioria,agilizamabuscanodicionario
xo,sendoabuscanodicionarioadaptativofeitada
for-ma convencional. Este trabalho prop~oe um metodo de
buscarapidanodicionarioadaptativo[3,4],quee
com-Estetrabalho foirealizadocomsuportenanceiro deCNPq,
CAPES,FAPERJeFUJB/UFRJ.
paradoao mostrado em [5] para dicionarioscom esem
atrasosfracionariosediferentestamanhos desegmentos
devoz. Acomparac~aoefeitaemtermosdequalidadedo
sinalreconstrudoetempodeprocessamento.
O trabalho esta organizado da seguinte forma: na
Sec~ao 2 apresentamos rapidamente atecnica de
codi-cac~aoCELP;naSec~ao3apresentamosometododebusca
rapidapropostoem[5];naSec~ao4eexplicadoometodo
de busca rapida aqui proposto; na Sec~ao 5 mostramos
os resultados dos experimentos realizados comparando
asperformancesdosmetodosdebuscarapidaemtermos
detempodeprocessamento equalidadedosinaldevoz
decodicado;porm,naSec~ao6inclumosasconclus~oes.
2 A tecnica CELP
A Figura 1 mostra o diagrama de blocos do
codica-dordevozCELPtidocomopadr~ao. Avozreconstruda
^
s(n)eobtidaao passarosinal de excitac~ao x(n),
com-posto pelos dicionarios adaptativoe xo, pelo ltro de
sntese H(z) = 1=A(z). O ltro de ponderac~ao do
er-ro W(z) = A(z)=A(z= ) modica o sinal de erro e(n)
durante o procedimento de analise-por-sntese para se
obterasmelhorescomponentesdeexcitac~aodecada
di-cionario.
A tecnica CELPsegmenta osinal de voz em blocos,
ques~aoposteriormentedivididosemsub-blocos. Os
pa-r^ametros do ltro de sntese H(z) s~ao determinados a
cada bloco, enquanto que os ganhos endices dos
dici-onarios, quecomp~oemaexcitac~aox(n), s~ao
determina-dosacadasub-bloco. Osintetizador, oudecodicador,
tambemfazpartedocodicadoreestaselecionadopela
linha pontilhada. Isto ocorre porque a tecnica CELP
-? -6 6 6 -? ? Dicionario Adaptativo I X Dicionario Fixo xfI(n) X e(n) G a G f x(n) H(z)= 1 A(z) ^ s(n) s(n) W(z)= A(z) A(z= ) ew(n) Minimizac~ao de P e 2 w (n) + + D xaD(n)
Figura1: EstruturadocodicadorCELPtidacomo
pa-dr~ao. -6 6 -? -? ? - ? 6 - -Dicionario Adaptativo I X Dicionario Fixo xfI(n) X Ga Gf D xaD(n) W(z)= A(z) A(z= ) s w (n) t(n) Minimizac~ao de P e 2 w (n) ew(n) + + s(n) ^ s0(n) + x(n) x(n)
Estadoinicialnulo Hw(z)=
1
A(z= ) ^
t(n)
Figura 2: Estrutura do codicador CELP para
imple-mentac~ao.
varios sub-blocos de voz s~ao sintetizados para a
esco-lhadospar^ametros(ndiceseganhos)responsaveispela
reproduc~ao do sub-bloco que ocasionea menor energia
doerroponderadoe
w (n).
Odicionarioadaptativo,quesubstituioltrodepitch
das primeiras vers~oes da tecnica CELP, e composto a
partir de uma unica sequ^encia formada com amostras
dasexcitac~oeseminstantes passados,ouseja,
fc a (n)g=fx( D max );:::;x( 1)g; (1) onde D max
corresponde ao maximo atraso considerado
noprocessodebuscadamelhorexcitac~aox
aDot (n).
Napratica,ocodicadorCELPeimplementado
pas-sandooltroW(z)paraosdoisramosantesdosomador
que comp~oe o sinalde erro e(n), eseparando a
respos-ta do ltro recursivo resultante H
w
(z) = 1=A(z= )em
duas partes: arespostacomestado inicial zero, ^
t(n), e
aresposta aentrada zero, s^
0
(n). A Figura2 mostra o
diagramadosistema levando-seemcontaestas
conside-rac~oes. -6 6 -6 ? - -Dicionario Adaptativo I X Dicionario Fixo xfI(n) X Ga Gf D xaD(n) y(n) A(z= ) ^s(n) A(z) Hw(z)= 1 A(z= ) +
Figura 3: Novo modelo de sntese obtido a partir do
modeloconvencional,paraometododebuscarapidano
dicionarioadaptativode[5].
-6 6 -6 ? ? -? ? - -Dicionario Adaptativo I X Dicionario Fixo xfI(n) X Ga Gf D + xaD(n) y(n) W(z)= A(z) A(z= ) s w (n) t(n) Minimizac~ao de P e 2 w (n) ew(n) + + ^ t(n) s(n) ^ s0(n) H w (z)= 1 A(z= )
Estadoinicialnulo
Figura 4: Estrutura pratica do codicador CELP
mo-dicada para o metodo de busca rapida no dicionario
adaptativode[5].
3 Ometodode buscarapidade [5]
Ometodode buscanodicionarioadaptativo
apresenta-do em [5] modica o sintetizador CELP mostrado na
Figura 1 baseando-se no fato de que o ganho G
a , os
par^ametrosdeH(z)eoatrasoD n~aovariammuitoem
umblocodevozsonoro. Onovomodelo,queesta
mos-tradonaFigura3,resultadeumatransformac~aodo
mo-deloconvencionaleumaposteriorsimplicac~ao,
confor-meemostradoem[5].
Com este novo modelo, o codicador CELP pratico
passa a ser aquele mostrado na Figura 4, onde o
di-cionario adaptativoe atualizado com a sequ^encia y(n)
obtidasegundomostraaFigura3. Pode-seperceber
cla-ramentequenestenovomodeloassequ^enciascandidatas
x
aD
(n)n~aos~aoltradasemhipotesealgumadurante
to-dooprocessodecodicac~ao,reduzindoassimotempode
processamentoparaadeterminac~aodamelhorexcitac~ao
- -c a (n) H w (z)= 1 A(z= ) c aF (n)
Figura5: Gerac~aododicionarioadaptativoltrado
usa-donometodopropostodebuscarapida.
4 O metodo de busca rapida
pro-posto
O metodo aqui proposto para a busca rapida no
di-cionario adaptativo tambem evita a ltragem de cada
sequ^enciacandidata x
aD (n)porH w (z). Neste metodo, asequ^enciac a
(n),daqualecompostoodicionario
adap-tativo segundo mostra (1), e inteiramente ltrada por
H
w
(z),gerandoassimumasequ^enciac
aF
(n)queformara
odicionarioadaptativoltrado,conformemostraa
Figu-ra5. Abuscadamelhorexcitac~aonestenovodicionario
passaent~aoaserfeitasemquesejanecessarioltrarcada
sequ^enciacandidata individualmente,ou seja,utiliza-se
domodelomostradonaFigura4comodicionario
ltra-donolugardooriginal.
SendodeterminadoomelhoratrasoD
ot
nodicionario
adaptativo ltrado, a leitura da melhor sequ^encia
x
aD
ot
(n)efeitaemc
a
(n)(dicionariooriginal),quedepois
eatualizadocomx(n), ouseja, apartirdoinstante em
queedeterminadoomelhoratrasoD
ot
,oprocedimento
debuscapassaaserexatamenteigualaometodo
utiliza-dopelosistema sembuscarapida,equeecaracterizado
pelo modelomostradonaFigura2
Portanto, neste metodo existemsomente duas
ltra-gens relativas ao dicionario adaptativo para cada
sub-bloco: a de c
a
(n) por H
w
(z) no incio do processo de
busca, e a da melhor sequ^encia x
aDot
(n), lida no
dici-onario adaptativo original, tambem por H
w
(z) para a
determinac~aodo ganhoG
a
. Esteprocedimento garante
umaacelerac~aodoprocessodebuscadex(n).
5 Experimentos
Osdoismetodosde buscarapidaforam implementados
nosistema CELPdescritoem[3]semaquantizac~aodos
ganhos G
a e G
f
. As medidas objetivas utilizadas
cor-responderamaraz~aosinal-rudosegmentadaperceptual
(RSRSP)[3],adist^anciacepestral(DC)[6]eadist^ancia
deItakura(DI)[7]. Asduasultimasquanticamas
dife-rencasnodomniodafrequ^encia,enquantoqueaRSRSP
tratamaisasdiferencasnodomniodotempo.
Assentencasescolhidasparaoexperimento
correspon-lnguaportuguesafaladanoBrasil,sendodoissinais
ge-radosporlocutoresdosexomasculino(M1eM2)edois
porlocutoresdosexofeminino(F1eF2). Ossinaisforam
digitalizadosa 8kHzcom16 bitspor amostra. Aposa
digitalizac~ao,foirealizadaumaltragempassa-altas
pa-raaremoc~aoderudosdebaixafrequ^encia.
Daqui em diante o metodo de buscarapidaproposto
em[5]serareferenciadocomoMetodoI,enquantoqueo
metodo propostoneste trabalhoserareferenciadocomo
MetodoII.
5.1 Experimento 1
Neste experimento, vericamos asperformancesdo
sis-tema CELP sem e com os metodos I e II para busca
rapida nodicionarioadaptativo. Ostestes foram feitos
emtermosdemedidasobjetivasdequalidadeetempode
processamentoemumaestac~aodetrabalhoSunUltra60.
Foram consideradosblocosde 20ms comsub-blocosde
5 ms, e foi usado um dicionario adaptativo com
atra-sos fracionarios cujas resoluc~oes foram distribudas da
seguinteforma: oitavasde20a55,quartasde55a101e
unitariasde101a146. ATabela1sintetizaosresultados
aquiobtidosnacodicac~aodas4frasesconsideradas.
Tabela 1: Experimento 1- Medidasobjetivas de
quali-dadeem dB etempo deprocessamento (TP) com
dici-onario adaptativo com atrasos fracionarios e blocos de
20ms comsub-blocosde5ms.
SistemaCELPsembuscarapida
Locutor RSRSP DC DI TP (s)
M1 17,75 2,87 1,02 39,774
M2 18,43 2,93 1,04 51,068
F1 19,23 2,98 1,10 37,534
F2 17,01 3,14 1,21 45,100
SistemaCELPcomoMetodoI
Locutor RSRSP DC DI TP (s)
M1 16,24 3,20 1,25 26,806
M2 16,79 3,19 1,24 34,364
F1 18,05 3,01 1,10 25,547
F2 15,97 3,16 1,23 30,573
SistemaCELPcomoMetodoII
Locutor RSRSP DC DI TP (s)
M1 17,60 2,93 1,05 27,250
M2 18,43 2,93 1,04 35,030
F1 18,89 2,89 1,02 25,969
F2 16,77 3,07 1,17 31,329
am-tagemdoMetodoI,comoesperado. Emtermosde
me-didasobjetivasdequalidade,oMetodoIIintroduzuma
distorc~ao sensivelmente menor que a do outro metodo.
Alias, para as sentencas F1 e F2 aqualidade melhorou
emrelac~aoaosistema sem buscarapida, segundoaDC
eaDI. Issopode ter ocorrido pelo fatodestas medidas
avaliarem aqualidadedo sinal basicamente nodomnio
dafrequ^encia. Porm,pode-setambemperceberqueos
doismetodosreduzememcercade32%otempototalde
codicac~aoemrelac~aoaosistema sembuscarapida.
5.2 Experimento 2
Neste caso,realizamostestes semelhantes aos do
Expe-rimento 1, considerando aqui, porem, blocos de 30 ms
com sub-blocos de 7,5 ms. Os resultados encontrados,
qualitativamenteanalogosaosdocasoanterior,s~ao
rela-cionadosnaTabela2.
Tabela 2: Experimento 2 -Medidas objetivas de
quali-dadeem dB etempode processamento(TP) com
dici-onario adaptativocom atrasos fracionarios e blocos de
30mscomsub-blocosde7,5ms.
SistemaCELPsembuscarapida
Locutor RSRSP DC DI TP(s)
M1 16,26 3,12 1,20 37,708
M2 17,03 3,08 1,16 48,466
F1 17,74 3,14 1,21 35,961
F2 15,63 3,33 1,37 43,304
SistemaCELPcomoMetodoI
Locutor RSRSP DC DI TP(s)
M1 15,45 3,40 1,42 25,425
M2 16,10 3,27 1,30 32,612
F1 17,04 3,34 1,35 24,299
F2 15,07 3,38 1,40 29,137
SistemaCELPcomoMetodoII
Locutor RSRSP DC DI TP(s) M1 16,16 3,22 1,26 25,618 M2 16,86 3,09 1,17 32,958 F1 17,56 3,17 1,24 24,312 F2 15,45 3,29 1,33 29,257 5.3 Experimento 3
Porm,foiutilizadoodicionarioadaptativosematrasos
fracionarios,comfaixade20a146,nolugardaquelecom
atrasosfracionariosutilizadoanteriormente. Os
resulta-dosobtidoss~aomostradosnaTabela3,usando-seblocos
to1acima.
Tabela 3: Experimento 3- Medidasobjetivas de
quali-dadeem dB etempo deprocessamento (TP) com
dici-onario adaptativo sem atrasos fracionarios e blocos de
20ms comsub-blocosde5ms.
SistemaCELPsembuscarapida
Locutor RSRSP DC DI TP (s)
M1 17,26 3,01 1,12 7,336
M2 18,37 2,87 1,00 9,489
F1 18,61 2,90 1,04 7,024
F2 16,77 2,84 1,00 8,439
SistemaCELPcomoMetodoI
Locutor RSRSP DC DI TP (s)
M1 16,12 3,27 1,31 3,576
M2 16,75 3,20 1,25 4,614
F1 17,68 3,51 1,51 3,416
F2 15,72 3,18 1,24 4,105
SistemaCELPcomoMetodoII
Locutor RSRSP DC DI TP (s)
M1 17,23 3,02 1,12 3,702
M2 18,13 2,86 1,00 4,747
F1 18,55 2,94 1,06 3,559
F2 16,56 2,96 1,07 4,246
Cabenotaraquiareduc~aodrasticadotempototalde
processamentodevidoaousodeumdicionario
adaptati-vosematrasosfracionarios,causadapeladiminuic~aodas
sequ^encias candidatas epelo fato de n~ao haver
necessi-dadedeseutilizaroltrointerpoladorparaaobtenc~ao
dosatrasoscomfrac~oesdeamostras. Nestecasoo
tem-pototaldecodicac~aofoireduzidoemtornode50%em
relac~ao aosistema sembuscarapida. Emtermos
quali-tativos,porem,temos queoMetodoII introduz
signi-cativamente menosdistorc~aotambemneste caso.
Pode-sepercebertambem queousododicionarioadaptativo
sematrasosfracionariosmelhoraassentencasM2, F1e
F2 para o casosem busca rapida, eas sentencas M2 e
F2 para os caso do Metodo II; quando consideradas a
DC ea DI(tabelas 1e 3). Istopodeter ocorridopelo
fatodestasmedidas analisaremmaisasdiferencasentre
ossinaisnodomniodafrequ^encia,apesardeseesperar
sempreque aintroduc~ao de um dicionario comatrasos
fracionariosmelhoreaqualidade.
5.4 Experimento 4
Foirealizado umtestesubjetivoinformal,que consistiu
suas respectivas opini~oes. A Tabela 4 mostra os
per-centuaisdeouvintes queacharammelhorosistemasem
busca rapida, o sistema com o Metodo II, ou
qualida-deindistinguvel,paracadasentenca. Pode-seperceber,
dosresultadosapresentados,queaqualidadedosistema
comoMetodoIIfoijulgadasuperiorparaasentencaF1
einferiorparaasentencaM1, enquantoqueparaocaso
dassentencasM2eF2,asqualidadesforamconsideradas
indistinguveis.
Tabela4: Experimento4-Avaliac~aosubjetivainformal:
percentuaisdeouvintesquejulgaramsermelhoro
siste-masembuscarapida(SR),osistemacomoMetodoII,
ou qualidade idistinguvel, para blocos de 20 ms com
sub-blocosde 5ms e dicionarioadaptativosem atrasos
fracionarios.
Sentenca MelhorSR (%) MelhorII(%) Iguais(%)
M1 60,87 8,70 30,43
M2 17,39 39,13 43,48
F1 17,39 56,52 26,09
F2 26,09 30,43 43,48
6 Conclus~ao
Estetrabalhoapresentouummetododebuscarapidano
dicionarioadaptativoemcodicadoresCELPea
posteri-orcomparac~aocomoutrometodoexistentenaliteratura.
Ostestes foram feitos em termos de medidas objetivas
dequalidadeetempodeprocessamento,paradicionarios
comesematrasosfracionariosediferentes tamanhosde
blocos de voz. Osresultados mostraram queo metodo
proposto produz qualidade superior, enquanto reduz o
tempo deprocessamento namesma proporc~ao (em
tor-node 30%a50%do tempo totalde codicac~ao)que o
metododerefer^encia. Umtestesubjetivoinformal
indi-couqueometodopropostoobtemqualidadecomparavel
aometodoconvencionaldebusca.
Refer^encias
[1] M.R.SchroederandB.S.Atal,\Code-excitedlinear
prediction (CELP): high-quality speech at very low
Speech, andSignalProcessing,pp.937{940,1985.
[2] W. B. Kleijn, D. J. Krasinski, and R. H. Ketchum,
\Fast methods for the CELP speech coding,"
IE-EETrans.Acoustics, Speech, andSignalProcessing,
vol.38,pp.1330{1342,Aug.1990.
[3] R.S.Maia,\Codicac~aoCELPeanaliseespectralde
voz,"TesedeM.Sc.,COPPE/UFRJ,RiodeJaneiro,
RJ,Brasil, Mar.2000.
[4] R. S. Maia, C. B. Ribeiro, F. G. V. Resende Jr. e
S. L. Netto, \Um sistema CELP para acodicac~ao
dafalaa4,4kb/s,"XIIICongressoBrasileirode
Au-tomatica,Florianopolis,Brasil,Set.2000.
[5] L. M. da Silva and A. Alcaim, \A modied CELP
model withcomputacionallyeÆcientadaptive
code-booksearch,"IEEESignalProcessingLetters,vol.2,
pp.44{45,Mar.1995.
[6] N. Kitawaki, H. Nagabuchi,and K. Itoh,
\Objecti-ve quality evaluation for low-bit-rate speech coding
systems," IEEE Journal on Selected Areas in
Com-munications, vol.6,pp.242{248,Feb.1988.
[7] J. R. Deller, J. G. Proakis, and J. H. L. Hansen,
Discrete-Time Processing of Speech Signals. New