Centro de Te nologia e Geo iên ias
Programa de Pós-graduaçãoem Engenharia Elétri a
Vítor de Andrade Coutinho
Aproximações para a DCT via
Pruning om Apli ações em
Aproximações para a DCT via
Pruning om Apli ações em
Codifi ação de Imagem e Vídeo
Dissertação submetida ao Programa de
Pós-Graduação em Engenharia Elétri a da
UniversidadeFederalde Pernambu o omo
parte dos requisitospara obtenção do grau de
Mestre em Engenharia Elétri a
Orientador: Prof. Dr. Renato J. Cintra
Coorientador: Prof. Dr. Ri ardo M. Campello de Souza
Catalogação na fonte
Bibliotecária Valdicéa Alves, CRB-4 / 1260.
C871a
Coutinho,
Vítor de Andrade.
Aproximações para DCT via pruning com aplicações em codificação de
imagem e vídeo / Vítor de Andrade
Coutinho - Recife: O Autor, 2015.
153folhas, Il. e Tabs.
Orientador: Prof. Dr. Renato J. Cintra.
Coorientador: Prof. Dr. Ricardo M. Campello de Souza.
Dissertação (Mestrado)
– Universidade Federal de Pernambuco. CTG.
Programa de Pós-Graduação em Engenharia Elétrica, 2015.
Inclui Referências, Apêndices, glossário e Acrônimo.
1.
Engenharia Elétrica. 2. Compressão de dados. 3. DCT aproximada.
4.
DCT pruning. 5.
Compressão de imagem. I. Cintra, Renato J. (Orientador). II.
Souza,
Ricardo M. Campello de. (Coorientador). III. Título.
UFPE
PARECER DA COMISSÃO EXAMINADORA DE DEFESA DE
DISSERTAÇÃO DO MESTRADO ACADÊMICO DE
TÍTULO
“
APROXIMAÇÕES PARA A DCT VIA PRUNING
COM APLICAÇÕES EM CODIFICAÇÃO DE IMAGEM E VÍDEO
”
A comissão examinadora composta pelos professores: RICARDO MENEZES CAMPELLO
DE SOUZA, DES/UFPE, JOÃO HENRIQUE RANHEL RIBEIRO, DES/UFPE e FÁBIO MARIANO
BAYER, DE/UFSM sob a presidência do primeiro, consideram o candidato
VÍTOR DE
ANDRADE COUTINHO
APROVADO
.
Recife, 23 de fevereiro de 2015.
CECILIO JOSÉ LINS PIMENTEL
Coordenador do PPGEE
RICARDO MENEZES CAMPELLO DE
SOUZA
Membro Titular Interno
FÁBIO MARIANO BAYER
Membro Titular Externo
JOÃO HENRIQUE RANHEL RIBEIRO
Primeiramente, à minha mãe, Glau e Gouveia, ao meu pai, Henrique Guimarães, e à minha
irmã,Clarade Andrade, peladedi ação,suporte,in entivo,amizadee amor in ondi ional.
Aos meus avós, Maria Augusta, Ana Maria e Fran is o, por todo o arinho e amor que me
propor ionam e pelo a olhimento de sempre. Ao meu av Antnio Carlos (in memoriam)
pelos pou os epre iosos momentos emquepude desfrutarde sua ompanhia.
Aos meus tios Mar us, Raisa, Polyana, Ramon e Pablo pelo ompanheirismo, amizade e
inúmerosbonsmomentos vividosjuntos.
AFabíola,pelos impres indíveis in entivos, arinho, ompreensão e ompanhia onstante na
retanaldo trabalho.
À família Holanda Tavares, pelos momentos inesque íveis, pela grande inuên ia na minha
personalidade e a quemtenhoeterno amor, admiração e gratidão.
Aos olegasdomestrado, dogrupodepro essamentode sinaise degraduação, espe ialmente
aosMos asBran as,originalmente umtime defutebol,atualmente umafamília.
ASil,Max,Andiara,José,Zé,Bruno,Viní ius,Leo,Neto,Pedrinho,Juliano,Méner,Allissa,
Ju,Anax, Pedro, Savinho etal.
Atoda aminha família eamigos, por tudo oquerepresentamparamim.
Ao meu orientador, Prof. Dr. Renato J. Cintra, pelos ensinamentos, dedi ação,
motiva-ção,atenção, pa iên ia, pelas obranças oportunas e por a reditar na minha apa idade, me
propondoumdesaoextra lassedurantedis iplinaequeviriaaresultarnopresentetrabalho.
Ao meu oorientador, Prof. Dr. Ri ardo M. Campellode Souza, pelos ensinamentos durante
minha graduação e pós-graduação, pela ajuda fundamental para ingressar no PPGEE, pela
grandeinuên iano meuinteresse por pro essamento desinais e peladisponibilidade.
Ao meuorientador deICdurante agraduação, Prof. Dr. HélioM. deOliveira, pelos
ensina-mentos ientí osini iais, pelo entusiasmo, disponibilidade ein entivo.
AosProf. Dr. FábioBayer,Dr. ArjunaMadanayakeeSuneraKulasekera,pelas ontribuições
epelostrabalhos realizados empar eria.
Atodososmeusprofessoresdapós-graduação,dagraduaçãoedoperíodoes olar,quezeram
parteda minhaformação.
Ao CNPq,pelosuporte nan eiro.
Vítor de Andrade Coutinho
Aproximações para a DCT via Pruning
om Apli ações em Codifi ação de
Imagem e Vídeo
Vítor de Andrade Coutinho
fevereiro/2015
Orientador: Prof. Dr. RenatoJ.Cintra
Coorientador: Prof. Dr. Ri ardo M. Campello de Souza
Área de Con entração: Comuni ações
Palavras- haves: Compressão de dados, DCT aproximada, aproximação DCT, DCT
pru-ning, ompressão de imagem, JPEG,MPEG, H264, HEVC.
Número de páginas: 155
Opresente trabalho abordaodesenvolvimento deaproximaçõesparaatransformada
dis- retado osseno(DCT)utilizandoaabordagempruning. Devidoàpropriedadeda
ompa ta-çãodeenergia, aDCTéempregadaemdiversasapli açõesde ompressão dedados. Embora
algoritmosrápidospermitam omputaraDCTe ientemente,operaçõesdemultipli açãosão
inevitáveis. Devido a res ente demanda por métodos de baixo onsumo energéti o, novos
algoritmos de usto omputa ional reduzido são ne essários. Neste ontexto, aproximações
paraaDCTforampropostasnosúltimosanos. Taisaproximaçõespermitemalgoritmoslivres
de multipli ação, sem a ne essidade de operações de ponto utuante, mantendo o
desempe-nhode ompressão omparávelao forne idopormétodosbaseadosnaDCT. Umaabordagem
adi ional para reduziro usto omputa ional daDCT é a utilizaçãode pruning. Tal té ni a
onsiste em não onsiderar oe ientes dos vetores de entrada e/ou saída que apresentam
menorrelevân ia em termosde energia on entrada. No asoda DCT, esses oe ientes são
ostermosdemaisaltafrequên iadovetortransformado. Aapli açãodepruning a
aproxima-çõesparaaDCTéumaáreapou o explorada. Oobjetivodestetrabalhoéapli araté ni aa
diferentes métodosaproximados paraa DCT. Astransformaçõesresultantes foramapli adas
no ontextode ompressão deimagemevídeoeosresultados mostraramdesempenho
Pruned DCT Approximations with
Appli ations in Image and Video Coding
Vítor de Andrade Coutinho
February/2015
Supervisor: Prof. Dr. RenatoJ. Cintra
Co-supervisor: Prof. Dr. Ri ardo M. Campello deSouza
Area of Con entration: Communi ations
Keywords: Data ompression,approximateDCT,DCTapproximation, prunedDCT,image
ompression, JPEG,MPEG, H264,HEVC.
Number of pages: 155
Thisworkintrodu esapproximatedis rete osinetransforms(DCT)basedonthepruning
approa h. Due to the energy ompa tion property, the DCT is employed in several data
ompression appli ations. Although fast algorithms allow an e ient DCT omputation,
multipli ation operations are inevitable. Due to the in reasing demand for energy e ient
methods, new algorithms with redu ed omputational ost are required. In this ontext,
DCTapproximations have been proposedre ently. Su h approximationsallowmultipli ation
free algorithms whi h an avoid oating point operations, while maintaining a ompetitive
performan e. Afurtherapproa htoredu ethe omputational ostoftheDCTispruning. The
te hnique onsists of dis arding input and/or output ve tors oe ients whi h are regarded
aslesssigni ant. Inthe ase oftheDCT,su h oe ients areoutput oe ients asso iated
to higher frequen y terms. Pruned DCT approximations is a relatively unexplored eld of
resear h. The obje tive of this work is the ombination of approximations and pruning to
deriveextremelylow- omplexityDCTapproximations. Theresultingmethodswereappliedin
the imageand vídeo ompressions enario andresults showed omparative performan ewith
exa t methods at a mu h lower omputational omplexity. A qualitative and quantitative
2.1 Extensão
y
I I[n]
paraa DCT-II. . . 26 2.2 Extensãoy
I[n]
paraa DCT-I. . . 28 2.3 Extensãoy
I I I[n]
paraa DCT-III.. . . 29 2.4 Extensãoy
IV[n]
paraaDCT-IV. . . 30 2.5 Estrutura borboleta. . . 332.6 Algoritmo rápidoparatransformada de Walsh-Hadamard . . . 42
3.1 Funções deWalsh. . . 53
3.2 Algoritmo rápidoparatransformada de Walsh-Hadamard. . . 54
4.1 Algoritmo rápidoparatransformada de Walsh-Hadamard naordem natural. . 68
4.2 Algoritmo rápidoparaexemplo de transformada deWalsh-Hadamardpodada. 68 5.1 Codi ador deimagem por transformada de blo o. . . 97
5.2 De odi ador deimagem portransformada de blo o. . . 98
5.3 Distribuição relativa deenergia
E
rel,dB
(n, m)
paraaDCTexata,WHT,SDCT, LODCT, RDCTe MRDCT. . . 1015.4 Distribuição relativa deenergia
E
rel,dB
(n, m)
para osmétodosdaSérie BAS. . 1025.5 Distribuição relativa de energia
E
rel,dB
(n, m)
para os métodos baseados em funçõesinteiras. . . 1035.6 Curvasde PSNR médiopara ada método.. . . 108
5.7 Curvasde SSIMmédio para ada método. . . 111
5.8 Curvasde PSNR médiodivididas peloganho de odi ação
C
g
de ada método.112 5.9 Compressão da imagem`Lena' atravésde métodosderivadosda WHT. . . 1135.10 Compressão da imagem`Lena' atravésde métodosderivadosda SDCT. . . 114
5.11 Compressão da imagem`Lena' atravésde métodosderivadosda LODCT. . . . 115
5.12 Compressão da imagem`Lena' atravésde métodosderivadosda RDCT. . . . 116
5.13 Compressão da imagem`Lena' atravésde métodosderivadosda MRDCT. . . 117
5.14 Compressão da imagem`Lena' atravésde métodosderivadosda BAS-1.. . . . 118
5.15 Compressão da imagem`Lena' atravésde métodosderivadosda INT-6. . . 119
5.16 Arquitetura 1-Dparaa MRDCTpodada. . . 120
5.17 Arquitetura 1-Dparaa LODCTpodada. . . 120
A.3 Algoritmos rápidos paraaproximaçõesderivadasde BAS-2. . . 139
A.4 Algoritmos rápidos paraaproximaçõesderivadasde BAS-3. . . 140
A.5 Algoritmos rápidos paraaproximaçõesderivadasde BAS-4,BAS-5 eBAS-6. . 141
A.6 Algoritmos rápidos paraaproximaçõesderivadasde BAS-7. . . 142
A.7 Algoritmos rápidos paraaproximaçõesderivadasda RDCT. . . 143
A.8 Algoritmos rápidos paraaproximaçõesderivadasda MRDCT. . . 144
A.9 Algoritmos rápidos paraaproximaçõesderivadasda LODCTe dasINT-
i
. . . 145A.10Blo osA
(i)
paraosalgoritmosda FiguraA.9. . . 1462.1 Complexidade aritméti aparaosalgoritmos des ritos . . . 45
3.1 Aproximaçõesda sérieBAS . . . 58
3.2 Aproximaçõesortogonais baseadas emfunçõesinteiras . . . 61
3.3 Medidas de desempenho paraosmétodosabordados . . . 64
4.1 AproximaçõesSDCT podadas . . . 75
4.2 AproximaçõesBAS-1 podadas . . . 76
4.3 AproximaçõesBAS-2 podadas . . . 77
4.4 AproximaçõesBAS-3 podadas . . . 77
4.5 AproximaçõesBAS-4 podadas . . . 78
4.6 AproximaçõesBAS-5 podadas . . . 78
4.7 AproximaçõesBAS-6 podadas . . . 79
4.8 AproximaçõesBAS-7 podadas . . . 79
4.9 AproximaçõesLODCT podadas . . . 80
4.10 AproximaçõesRDCT podadas. . . 81
4.11 AproximaçõesMRDCT podadas . . . 82
4.12 AproximaçõesINT-1 podadas . . . 83
4.13 AproximaçõesINT-2 podadas . . . 83
4.14 AproximaçõesINT-4 podadas . . . 84
4.15 AproximaçõesINT-5 podadas . . . 84
4.16 AproximaçõesINT-6 podadas . . . 85
4.17 Complexidadearitméti aparaasaproximaçõespodadasapresentadas(adições/ deslo amento de bits). . . 89
5.1 Apli ações om ompressão de vídeo . . . 93
5.2 Energia relativa por zona para ada método . . . 100
5.3 Valoresde PSNR médio para ada método . . . 109
5.4 Valoresde SSIMmédio para ada método . . . 110
5.5 Consumo dere urso dehardware utilizando Xilinx Virtex-5paraa MRDCTe LODCT . . . 110
5.6 Consumo de re urso de hardware utilizando Xilinx Virtex-6 para a MRDCT podada. . . 111
Lista de Figuras 6 Lista de Tabelas 8 1 Introdução 13 1.1 Motivação . . . 14 1.2 Revisão da Literatura . . . 16 1.3 Objetivos . . . 18 1.4 Estrutura . . . 19
2 A Transformada Dis reta do Cosseno 21 2.1 A Transformadade Karhunen-Loève . . . 22
2.1.1 SoluçãoMarkov-1 . . . 24
2.2 Denições da Transformada Dis reta do Cosseno . . . 24
2.3 A DCT omo Caso Assintóti o da KLT . . . 30
2.4 Algoritmos Rápidos para a DCT . . . 31
2.4.1 Algoritmode Chen . . . 32 2.4.2 Algoritmode Lee . . . 36 2.4.3 Algoritmode Wang . . . 37 2.4.4 Algoritmode VetterliNussbaumer . . . 38 2.4.5 Algoritmode SuehiroHatori . . . 39 2.4.6 Algoritmode Hou . . . 41 2.4.7 Algoritmode Loeer . . . 42 2.4.8 Algoritmode FeigWinograd . . . 42 2.4.9 Comparação . . . 44 3 Aproximações para a DCT 46 3.1 Introdução . . . 47 3.2 Classes de Aproximações . . . 47 3.3 Ortogonalidade e Ortonormalidade . . . 49 3.4 Aproximações no Conjunto
P
. . . 52 3.4.1 Transformada deWalsh-Hadamard. . . 523.4.5 ADCT arredondada ea DCTarredondada modi ada . . . 57
3.4.6 Série deAproximaçõesBaseadas emFunçõesInteiras . . . 59
3.5 Medidas de Desempenho . . . 61
3.5.1 ErroMédioQuadráti o . . . 61
3.5.2 Ganhode Codi ação . . . 62
3.5.3 E iên iada Transformada . . . 63
3.5.4 AvaliaçãodasTransformadas . . . 63
4 Aproximações Podadas 65 4.1 Preliminares . . . 66
4.2 Transformada Dis reta de Fourier Podada . . . 70
4.3 Transformada Dis reta do Cosseno Podada . . . 71
4.4 Relação entre Complexidade Aritméti a para Métodos Podados em 1-D e 2-D . . . 71
4.5 Aproximações Podadas . . . 73
4.5.1 DCTSinalizada Podada . . . 75
4.5.2 Aproximações BASPodadas . . . 76
4.5.3 Aproximação Lengwehasatit-Ortega Podada. . . 76
4.5.4 DCTArredondada Podada . . . 80
4.5.5 DCTArredondada Modi adaPodada . . . 81
4.5.6 Aproximações BaseadasemFunções Inteiras Podadas . . . 81
4.5.7 Considerações . . . 82
4.5.8 Cál uloda Transformação Inversa . . . 85
5 Apli ação em Compressão de imagens: Simulações e Resultados 90 5.1 Introdução . . . 91
5.2 Métri as para o Desempenho de Compressão. . . 93
5.2.1 Similaridade Estrutural . . . 94
5.3 Compressão de Imagem Estáti a . . . 96
5.3.1 Energia Con entrada porCoe iente epor Zona . . . 98
5.3.2 Metodologia da Simulação JPEG . . . 104
5.3.3 Resultados . . . 106
5.4 Arquiteturas VLSI. . . 107
6 Con lusões 122
7 Bibliografia 126
Apêndi e A Algoritmos Rápidos para as Aproximações Podadas 135
Glossário de Notação 151
1.1 Motivação
T
ransformadas dis retas são ferramentas vastamente utilizadas em diversas
apli a-çõesrela ionadas apro essamento digital de sinais [1℄. Em parti ular, a transformada
dis retado osseno(DCT) foiapresentada em1974 omoumaalternativaà transformadade
Karhunen-Loève (KLT) [2℄ para apli ações de des orrelação de dados. A KLT é
estatisti a-menteótimaemrelaçãoà des orrelaçãode omponentesde umvetorarbitrário. Entretanto,
ela não possui um algoritmo direto para o ál ulo omputa ional já que o nú leo da
trans-formação depende do vetor a ser transformado [3℄. Por outrolado, a DCT possui nú leo de
transformaçãoquenão depende dosdadosde entrada, oquepossibilita odesenvolvimento de
algoritmosrápidos [4℄. Veri a-se quea DCTé o asoassintóti o daKLTquando osinalde
entradaéumpro essomarkovianodeprimeiraordemeo oe ientede orrelação
ρ → 1
[3,4℄.Defato, a KLT pode sersubstituída pela DCT omgrande e iên ia para sinais fortemente
orrela ionados, omo imagense áudio.
A existên ia de algoritmos rápidos tornou a DCT vastamenteutilizada em diversas
apli- ações e, devido à sua apa idade de ompa tação de energia, é largamente empregada na
ompressão de dados digitais. A DCT tem sido utilizada omo prin ipal ferramenta em
diversos padrões de odi ação de imagem e vídeo. Em suma,é utilizada nos seguintes
pa-drões de ompa tação: JPEG [5℄, MPEG [6,7℄, H.261 [8℄, H.263 [9℄, H.264/AVC [10,11℄ e
HEVC[12,13℄.
A DCT de omprimento 8 desempenha umpapel importante no enário de ompressão
deimagem evídeo. Todosospadrõesde odi ação itadosa ima utilizam tal omprimento
durante o pro esso de ompressão. Portanto, o desenvolvimento de algoritmos rápidos para
este omprimento parti ular daDCT setornouumimportante ampode pesquisa. Diversos
algoritmos rápidos foram desenvolvidos ao longo dos anos e podem ser en ontrados na
lite-ratura[14 21℄. A arquiteturadesenvolvida pela indústria paraa implementação da DCTde
duasdimensõesébaseadanaseparaçãodenú leodaDCT,também hamadodede omposição
linha- oluna [3,22℄ . Atravésdestemétodo,atransformadaem2-Dé omputadaatravésde
al-goritmosparaaDCTdeumadimensãopara adalinhaesubsequentementepara ada oluna
do sinal de duas dimensões. Entretanto, alguns algoritmos foram desenvolvidos abordando
diretamente o asode duasdimensões [21,23℄
foramdesenvolvidos ir uitosintegradosde apli açãoespe í a (ASICs)parapro essamento
em tempo real da DCT operando em até
14.32 MHz
[27℄. 1Nos últimos anos, arquiteturas
paraapli açõesemTV dealta denição (HDTV)vemsendodesenvolvidos [28,29℄.
Embora algoritmos rápidos diminuam drasti amente o esforço omputa ional ne essário
parao ál uloda DCT, asmultipli açõespor númerosreaissãoinevitáveis. Olimitemínimo
teóri o para a quantidade de multipli ações no ál ulo da DCT está estabele ido na
litera-tura[30,31℄. Osesforçosempesquisanaárealevaramàprodução dealgoritmos queatingem
ou hegam próximo da ota mínima teóri a[20℄. Portanto, a bus apor algoritmos e ientes
parao ál ulo da DCT é uma área já bastante explorada e obter algoritmos mais e ientes
nãoé umaatividade trivial.
Por outrolado, aproximações paraaDCT podemreduzir drasti amente aquantidadede
operaçõesaritméti as eaindagerarresultados satisfatórios. Umaaproximação paraa DCTé
umatransformaçãolinearquepreserva ara terísti as daDCToriginal, omoa ompa tação
deenergiae apa idadededes orrelaçãodevetores[32℄,porexemplo. Emgeral,deseja-seque
aaproximação possua a menor omplexidade aritméti a possível. Nesse ontexto, oslimites
teóri os para a DCT não mais se apli am. Sendo assim, é possível en ontrar aproximações
om usto omputa ional onsideravelmenteinferioresaosestabele idos para aDCT[3246℄.
Outra estratégia para diminuir o usto omputa ional no ál ulo da DCT é reduzir o
número de oe ientes al ulados, ou seja, desprezar omponentes de menor relevân ia para
um dado problema. Devido a propriedade de ompa tação de energia da DCT, em muitas
apli açõesa maior parte da informação útil está on entrada nosprimeiros oe ientes [47℄.
Dessaforma,oesforço omputa ional em al ularasúltimas omponentes édispensado. Tal
abordagem é hamadadepruning. Doravante,algoritmosqueseguem essametodologiaserão
hamados algoritmos podados. No ontextode ompressão de imagens, onde a DCTde duas
dimensõesé onsiderada,aimagem omprimidaétransformadaetemsuas omponentesmais
altasdesprezadasnaetapadaquantização. Entretanto,emumalgoritmo omumparaaDCT
de duas dimensões, tais omponentes desprezadas na etapa de quantização são omputadas
igualmenteatodasasoutras. Neste enário,algoritmosque omputamapenasumapartedas
omponentesforam desenvolvidos e tambémsão onhe idos omoalgoritmos zonais [48,49℄.
EmboradiversasaproximaçõesparaaDCTealgoritmospodadosparaaDCTtenhamsido
propostos,ajunção dasduasabordagensainda éumaáreapou o explorada. Apenasem[50℄
foiintroduzidaumaaproximaçãopodadaparaaDCTbaseadanaaproximação dadaem[43℄.
Alémdeserum ampoinexplorado emtermosde apli ações, on eitualmentetambéméuma
áreapou odesenvolvida. O on eitodepruning are edeumageneralizaçãomatemáti aede
umaformalizaçãoparaapli ações omDCTs aproximadas,assim omoumaanálisealgébri a
sobre omplexidade aritméti a etransformação inversa.
1.2 Revisão da Literatura
Em1971,antesmesmodosurgimento daDCT,édesenvolvidoporMarkelparaa
transfor-madadis reta de Fourier (DFT) o primeiro algoritmo utilizando a abordagem pruning [51℄.
O algoritmo se apli a a situações em que o número de amostras nulas do vetor de entrada
é grande. Dessa forma, os ál ulos envolvendo tais omponentes são des onsiderados e a
omplexidade é reduzida. Oalgoritmo desenvolvido se mostrou útil em apli ações omo
in-terpolação, análise e síntese de voz e aproximação por mínimos quadrados om polinmios
trigonométri os [51℄. Apesar de apli ar pruning no domíniodo tempo, isto é, eliminar
om-ponentes do vetor de entrada, Markel sugere que a mesma ideia pode ser apli ada para o
domínio da frequên ia, eliminando omponentes do vetor de saída. O algoritmo de Markel
foimelhorado por Skinnerem 1976 [52℄. Ao apenas ex luir algumas operações, Markel
deri-vouumalgoritmo ommultipli açõesrepetidasemdiferentes estágios doalgoritmo. Skinner
propsumamaneiradiferentedederivaromesmoalgoritmobaseadonaeliminaçãodeestágios
inteiros, propor ionando ummaiortime-saving.
A DCT foi introduzida em 1974 por AhmedNatarajanRao [2℄. Ahmed et al. estavam
interessados em en ontrar uma boa aproximação para a KLT que pudesse ser omputada
e ientemente. O algoritmo rápido sugerido por Ahmed et al. utilizava o fato de a DCT
poderser es rita em termos da parte real da DFT om o dobro do omprimento. Então, o
problemade al ular e ientemente aDCT seresumia emapli ar umalgoritmo rápido para
aDFT(FFT).
Em 1977, Chen introduziu um algoritmo rápido para a DCT mais e iente do que o
que utiliza a FFT de omprimento dobrado [14℄. O algoritmo se apli a a omprimentos
de transformada da forma
2
m
, m ≥ 2
e é seis vezes mais e onmi o do que o algoritmo
anterior. Em 1984, Lee derivou umalgoritmo baseado nadizimação notempo (DIT)para a
DCTinversa(IDCT) de omprimento
N
,podendoser apli adoparaaDCTde omprimentoTambém em 1984, Wang apresentou novos algoritmos através de novo método de fatoração
dasmatrizesde ada umdosquatro tiposdaDCT[16℄. Alémdisso,Wang propsalgoritmos
também para quatro tipos da transformada dis reta do seno (DST) e da transformada
W
dis reta (DWT). O algoritmo proposto por Wang para a DCT de omprimento 8 ne essita
de 13 multipli ações e 29 adições. Neste mesmo ano, Lee props um algoritmo rápido que,
paraa DCTde omprimento 8,ne essita de 12 multipli açõese 29 adições[15℄. Entretanto,
a ne essidade de utilizar multipli ações pelo inverso do osseno pode levar a problemas de
overow e erros de arredondamento. Ainda neste ano, Vetterli props um algoritmo que
omputa a DCT de omprimento
N
através de duas DFTs reais de omprimentoN
[17℄,atingindo também a ota de 12 multipli ações e 29 adições. Em 1986, Suehiro props um
algoritmoque omputaaDCT-IIbaseadonafatoraçãodamatrizdaDCT-IV[18℄. Oalgoritmo
apresentatambém12multipli açõese29adições. Em1987,Houapresentaumalgoritmo om
amesma ota [19℄.
A teoriada omplexidade multipli ativa apli adaa pro essamento de sinais foi
desenvol-vidaporS.Winograd[30℄eorganizadaporM.Heidemanem1988[31℄. Heidemamseinspirou
nostrabalhosde Winogradsobre omplexidade multipli ativa [30℄. Em seu livro,oriundode
suatese de doutorado, Heideman aborda a questão da omplexidade multipli ativa mínima
paraosproblemasdo ál ulode onvolução e multipli açãopolinomial edo ál ulodaDFT.
Apartir da teoria desenvolvida paraa DFT, são derivadas as omplexidades multipli ativas
paraa transformada dis reta de Hartley (DHT) [31, p.115℄ e para a DCT [31, p. 116℄ . O
limitemínimo de 11 multipli ações paraa DCT de omprimento 8 foiatingido por Loeer,
em1989 [20℄. Oalgoritmoobtido requer11 multipli açõese 29 adições.
Oprimeiroalgoritmoapli andopruningparaaDCTfoipropostoem1991,porWang[47℄.
Wang argumentou que, emdiversasapli ações, amaior parte dainformação útil deumsinal
está ontido nos primeiros termos do vetor da DCT. Sendo assim, apenas esses primeiros
elementosdo vetorne essitariam ser al ulados para essa apli ação.
Feig e Winograd introduziram, em 1992, um onjunto de algoritmos para a DCT om
vetoresde omprimentos daforma
2
m
[21℄. Casosparti ularesparaa DCTde umadimensão
om omprimento 8 ede duasdimensões omtamanho
8 × 8
foramestudadosemdetalhe. Oalgoritmopropostopara2-Dapresentaumnúmeromenordemultipli açõesdoqueoalgoritmo
pandindoa DCTparaa dimensão temporal [53℄. Ométodo érealizado onsiderando grupos
onse utivosdeoitoframes dedimensão
8 × 8
. Nestemesmoano,Chanand Leepropuseramumnovométodoparagerar valoresdequantização para oe ientesdaDCTem3-Dvisando
esquemasde odi açãodevídeo[54℄. Em2004,Boussaktapropõeumalgoritmo paraaDCT
omputado diretamente em 3-D ao invés de utilizar o método usual de de omposição
linha- oluna-frame [55℄. Em2010,ogrupodepesquisadoreslideradosporDinaKatabipropõeuma
nova abordagem para transmissão wireless de video denominada SoftCast [56℄. A té ni a
utilizaDCT em3-D na etapade ompressão e visapermitiro re eptor ade odi ar vídeo a
umataxade bits que depende da qualidade do anal observadaapósare epção.
Em 2001,Haweelapresenta aDCTsinalizada (signed DCT, SDCT)[33℄,que onsiste em
umaaproximaçãoparaaDCTbaseadanafunçãosinal. Aaproximaçãoapresentavaalgoritmos
rápidos para a transformação direta e inversa de baixa omplexidade, sem a ne essidade de
operações de multipli ação. Em 2004, Lengwehasatit e Ortega apresentam um onjunto de
métodos para redução de omplexidade para a DCT direta [34℄. Em tal trabalho, pruning
édenido omo método de seleção de frequên ia, enquanto aproximações sãodenidas omo
método deseleção de pre isão.
Entre 2008 e 2013, Bouguezel et al. propõem uma série de aproximações para a DCT
apresentandobomdesempenhode odi açãoebaixas omplexidades omputa ionais[3540℄.
Em 2011, Cintra e Bayer apresentam uma aproximação paraa DCTbaseada em na função
dearredondamento [41℄. Em 2012,BayereCintra propõema aproximação paraaDCT om
menor usto omputa ionalnaliteratura. Talmétodorequerapenas14adições[42℄. Em2013,
Kouadriaet al. propõemaabordagem pruning àaproximação BASapresentada em[43℄ om
apli ação no ontexto de redes de sensores visuais wireless (WVSNs) [50℄, representando o
úni otrabalho na literaturaqueapli a pruning aumaaproximação para a DCT.
1.3 Objetivos
Métodos alternativos paradiminuir o usto omputa ional da DCTem apli ações
diver-saseespe ialmente em ompressão deimagemvemsendoexplorados. Conforme men ionado
anteriormente, tais métodos podem ser lassi ados omo métodos de seleção de frequên ia
ou de seleção de pre isão [34℄. Os métodos de seleção de frequên ia são baseados em
depre isãosãorepresentadospelasaproximaçõesparaaDCT.Métodoshíbridostambémsão
possíveis,sendobastanteinexploradosna literatura.
O objetivo prin ipal deste trabalho é formalizar matemati amente o on eito de
pru-ning (seleçãode frequên ia) eapli ara té ni aadiversasaproximaçõesparaaDCT(seleção
de pre isão). É objetivada a proposição de novos métodos híbridos ou aproximações para a
DCT via pruning om apli ação no ontexto de ompressão de imagem. Bus aremos
reali-zar uma análise algébri a sobre a omplexidade aritméti a de tais métodos, assim omo do
pro edimentopara omputaratransformaçãoinversa. Objetiva-serealizarsimulaçõesem
o-di açãodeimagem omosmétodosderivadoseavaliarodesempenhode ompressãoatravés
demétri asdifundidasna literatura. Além disso,bus aremospropor algoritmosrápidos para
osnovosmétodosapresentados.
Osobjetivosdeste trabalho sãosumarizadosa seguir:
•
Realizar umarevisão sobrea DCT,apresentando denições,relação om aKLT,des rição e omparaçãoentre osprin ipaisalgoritmosrápidos disponíveisna literatura;•
ApresentarumarevisãosobreaproximaçõesparaaDCT,forne erdes riçõese omparações entrediversosmétodosaproximados disponíveis naliteratura;•
Formalizar matemati amente e generalizar o on eitode pruning;•
Propor novosmétodosaproximados epodados;•
Propor algoritmos rápidos podadospara osmétodospropostos;•
Analisarmatemati amenteaquestãodatransformadainversaeda omplexidadearitméti a paraaproximaçõespodadas;•
Realizarsimulaçãode ompressãodeimagemparaavaliarodesempenhodosnovosmétodos propostos.1.4 Estrutura
Este do umento estáorganizado omosesegue: No Capítulo 2,sãodis utidose
apresen-tadosdiversosaspe tosrela ionadosaDCT.NaSeção2.1,é abordadaaKLT, transformação
ótima em relação a des orrelação de dados, em que a DCT é tida omo uma aproximação.
e ilustrado para o aso da DCT-II. A Seção 2.3 apresenta a DCT omo aproximação
assin-tóti a para a KLT para sinais om alta orrelação, justi ando o uso da DCT no ontexto
de ompressão de dados. A Seção 2.4 apresenta uma oleção de algoritmos rápidos para a
DCTdisponíveisna literatura, des revendo-os su intamentee omparando as omplexidades
aritméti as de ada um.
OCapítulo 3 aborda aproximaçõespara aDCT, emque asaproximações utilizadaspara
derivarnovosmétodossãoapresentadas. ASeção3.1introduzo on eitodeaproximaçãopara
a DCT, justi ando sua importân ia. Na Seção 3.2, diferentes lasses de aproximações são
des ritasdea ordo omotipode entradadamatrizdetransformação. ASeção3.3apresenta
os on eitosdeortogonalidadeeortonormalidadeno ontextodeaproximaçõesparaaDCT.A
Seção3.4apresentaasaproximaçõesabordadasnestetrabalho. NaSeção3.5,sãoapresentadas
edes ritasmedidasparaavaliarodesempenho dasaproximações no ontextode odi ação.
No Capítulo 4,são apresentadas asaproximaçõesderivadas através da apli ação de
pru-ning e este on eito é formalizado matemati amente. Na Seção 4.1, o on eito de pruning
é formalizado e generalizado. Alguns exemplospara ilustrar o método são apresentados. A
Seção4.2 apresenta a DFTpodada, originalmente proposta em[51℄. A Seção4.3 des reve a
DCTpodada, apresentadaem [47℄. Na Seção4.4, é realizada uma análise sobre a
omplexi-dadearitméti adetransformaçõespodadasem1-De2-D. NaSeção4.5,édenidoo on eito
de pruning paraaproximações paraa DCT e são apresentados osnovos métodos propostos,
baseadosna apli ação dadenição paraasaproximaçõesdes ritasno Capítulo 3.
NoCapítulo 5,sãoabordadas,deformageral,té ni asde ompressão deimagem. Na
Se-ção5.1,umaabordagemintrodutória éapresentada,emque on eitosdeimagensdigitaissão
abordados,assim omoaimportân iada ompressão. NaSeção5.2,sãoapresentadasmétri as
usuaisdeavaliação dedegradação de imagem, omo oerro médioquadráti o (MSE), relação
sinal-ruídodepi o(PSNR)e asimilaridadeestrutural(SSIM). ASeção5.3des reve o
pro e-dimentode ompressãodeimagemestáti a. Umestudovisandoanalisara apa idadede
om-pa tação de energia dosmétodosabordados é realizado. A metodologia para simulação tipo
JPEGédes rita. Osresultadosobtidospara adaumdosnovosmétodosgeradossão
apresen-tadosedis utidos. ASeção5.4apresenta arquiteturasemvery-large-s ale integration (VLSI)
A Transformada
2.1 A Transformada de Karhunen-Loève
A
KLT é derivada através da bus a de uma transformação quedes orrela ione
omple-tamenteumdadovetor. Diferentesnomen laturasequivalentesàKLTsãoen ontrados
na literatura, tais omo análise de omponente prin ipal e transformada de Hotelling [57℄,
termos propostos respe tivamentenos trabalhos de K. Pearson [58℄ e H. Hotelling [59℄. Um
vetor orrela ionado possui seus elementos om erto grau de redundân ia e grande parte
dos problemas físi os reais lidam om sinais dessa forma. Em parti ular, imagens naturais
que possuem signi ado ao érebro humano são fortemente orrela ionadas. Os vetores de
base da KLT são os autovetores da matriz de ovariân ia e, onsequentemente, dependem
do sinal de entrada a ser transformado. O efeito ausado pela KLT é a diagonalização da
matriz de ovariân ia, removendo a orrelação entre elementos distintos do vetor. A matriz
de ovariân iade umvetor
y
= [y
0
y
1
· · · y
N −1
]
⊤
pode ser denida omo[60℄
R
y
= E
(y − m)(y − m)
⊤
,
(2.1)em que
E[·]
é o operador valor esperado [61℄ em
= E[y]
. O valor esperado é um operadorlinear e, se apli ado a um vetor ou matriz, a operação é realizada elemento a elemento. O
operador
⊤
indi a transposição matri ial. Em geral, um pro esso esto ásti o asso iado aovetor
y
édito serdes orrela ionado seamatriz de ovariân ia éda formaR
y
=
λ
0
0
· · ·
0
0
λ
1
· · ·
0
..
.
..
.
. ..
..
.
0
0
· · · λ
N −1
,
(2.2) emque, daexpressão(2.1),λ
i
= E
h
(y
i
− E[y
i
])
2
i
,
i = 0, 1, . . . , N − 1.
(2.3) Considerando um vetorx
= [x
0
x
1
· · · x
N −1
]
⊤
, om matriz de ovariân ia
R
x
arbitrária, objetiva-se en ontrar umatransformaçãolinearda formay
= W · x
(2.4)que resulte em uma matriz de ovariân ia da forma (2.2) . A matriz
W
deve apresentarAssumindo que a matriz
W
seja ortonormal, isto é, suas linhase olunas são ompostasdevetoresunitários e ortogonais entre si, éválida aseguinterelação [60℄:
W
· W
⊤
= W
⊤
· W = I
N
,
em que
I
N
é a matriz identidade de ordemN
. O on eito de ortonormalidade é denido adiantena Seção3.3. Dessaforma, aexpressãoqueinverte a equação (2.4)éx
= W
⊤
· y.
Se o pro esso asso iado ao vetor
x
tem média zero, então o pro esso asso iado ao vetortransformado
y
tambémtemmédianula. Essefatopodesermostradoutilizando-seaexpres-são(2.4) ,impondoa ondição
E[x] = 0
. Segueentão que:E[y] = E[W · x]
= W · E[x]
= 0.
Assumirtal ara terísti aé onvenientepara a notaçãoe não a arretaemperdade
generali-dade. Nesse aso, aexpressão(2.1) sereduza
R
y
= E
y · y
⊤
.
(2.5)Amatrizdiagonalde ovariân ia
R
y
podeser al uladadamatrizde ovariân iaR
x
dovetorx
original. ConsiderandoqueE[x] = 0
e onsequentementesendoválidaaexpressão(2.5) ,segueque
R
y
= E
y · y
⊤
= E
h
(W · x) (W · x)
⊤
i
= E
W · x · x
⊤
· W
⊤
= W · E
x · x
⊤
· W
⊤
= W · R
x
· W
⊤
,
ou,equivalentemente,W
· R
x
= R
y
· W.
(2.6)Umavezquea matriz
R
y
é arbitrariamente diagonal,aexpressão(2.6) podeser es ritapara ada linhaw
i
deW
. Então, vemqueResolver a equação (2.7) orresponde a en ontrar os autovetores e autovalores da
ma-triz
R
x
[62, p. 436℄. Portanto, en ontrar a matriz de transformaçãoW
que diagonaliza a matrizde ovariân ia do vetor transformado seresume a en ontrar osautovetores eautova-loresdamatriz de ovariân ia dovetor deentrada.
2.1.1 Solução Markov-1
Devido à dependên ia da matriz de transformação om os dados de entrada, não existe
umafórmulaúni aparao ál ulodosvetoresdebasedaKLT.Entretanto,quandose onsidera
determinada lasse de sinais, é possível derivar expressõesmatemáti as úni as para a KLT.
Sinaisque podem ser modelados omo pro esso markoviano esta ionário de primeira ordem
(Markov-1) [4℄ apresentam a matrizde ovariân ia de a ordo om
[R
x
]
m,n
= ρ
|m−n|
,
(2.8)emque
ρ
é o oe iente de orrelação [63℄. Para sinais desta forma, an
-ésima omponentedo
k
-ésimo autovetor édada por [4℄w
k
(n) =
r
2
N + λ
k
sin
µ
k
n + 1 −
N + 1
2
+
π(k + 1)
2
,
(2.9) emqueλ
k
=
1 − ρ
2
1 − 2ρ cos µ
k
+ ρ
2
(2.10)sãoosautovalores. Os valores
µ
k
sãoasraízespositivasreaisda equação trans endentaltan (N µ) = −
(1 − ρ
2
) sin µ
(1 + ρ
2
) cos µ − 2ρ
.
(2.11)2.2 Definições da Transformada Dis reta do Cosseno
Aointroduzir aDCT, Ahmed etal. tinham omopropósito propor umanova ferramenta
para substituir a KLT que possuísse nú leo de transformação xo e pudesse, dessa forma,
ser omputada e ientemente [2℄. Entretanto, a nova transformada apresentada se tratava
apenasde umtipo de DCT.
UmaDCT deum vetor
x[n]
de omprimentoN
é umatransformada do tipoX[k] =
N −1
X
n=0
em que as funções ortogonais
φ
∗
k
[n]
que ompõem o nú leo da transformação são funções osseno. A DCTtambémpode serexpressa na formamatri ialX
= C · x,
emque
C
éamatrizdetransformaçãodedimensãoN ×N
, ujasentradasc
k,n
sãodenidas pe-losvetoresdebaseφ
∗
k
[n]
. Nesteponto, onvémindexaramatrizC
omk, n = 0, 1, . . . , N − 1
. Os vetoresx
= [x
0
x
1
· · · x
N −1
]
⊤
e
X
= [X
0
X
1
· · · X
N −1
]
⊤
são os vetores de entrada e
saída,respe tivamente.
ADCTédesenvolvidamatemati amentetomandoumasequên ia
x[n]
de omprimentoN
e formando uma nova sequên ia
y[n]
de omprimentoM > N
om simetria par em relaçãoa origem
n = 0
, de modo que a sequên ia original possa ser uni amente re uperada. ADFT
Y [k]
de omprimentoM
da nova sequên iay[n]
é então onsiderada [22℄. A DCT deomprimento
N
dadaporX[k]
édenida apartir deY [k]
. Talpro edimento é sumarizadoaseguir:
Comprimento
N
ComprimentoM
M
-DFT ComprimentoM
ComprimentoN
x[n]
←→
y[n]
←→
Y [k]
←→
X[k]
O tipo de simetria adotado vai determinar o tipo da DCT. Uma vez que são possíveis oito
formasdiferentes de realizaruma extensãopar emtorno daorigem dasequên ia original,há
oito tipos diferentes de DCT. Os tipos mais relevantes são a DCT tipo I (DCT-I), a DCT
tipo II (DCT-II), a DCT tipo III (DCT-III) e a DCT tipo IV (DCT-IV) [64℄. O ponto de
simetria pode ser uma amostra do vetor (whole-sample symmetry) ou um ponto hipotéti o
intermediário entre duas amostras (half-sample symmetry) [65℄. As extensões podem ser
interpretadas omosomasde ópias deslo adasdassequên ias
±x[n]
e±x[−n]
. Tambémsãopossíveisextensõesímparesem tornoda origem, dandoorigem aoito tiposde DST.
A DCT-IIé a formamais utilizada emapli ações de ompressão de dados. Sendo assim,
onsideremos ini ialmente este aso. A extensão do vetor
x[n]
é feita sem a sobreposiçãodos elementos mais externos, em que a simetria é entre as amostras
n = N − 1
en = N
(half-sample symmetry). A nova sequên ia simétri a possui omprimento
M = 2N
e é dadapor
y
I I[n] =
x[n],
0 ≤ n ≤ N − 1,
x[2N − n − 1], N ≤ n ≤ 2N − 1.
(2.12)0
4
9
Figura 2.1: Extensão
y
II[n]
paraaDCT-II.
Umexemplode extensão dessetipopara
N = 5
é mostradona Figura2.1.TomandoaDFTde omprimento
M
de(2.12)e dividindoointervalo0 ≤ n ≤ 2N − 1
emdoisintervalos
0 ≤ n ≤ N − 1
eN ≤ n ≤ 2N − 1
,obtém-seY [k] =
2N −1
X
n=0
y
I I[n]e
−j
2πkn
2N
=
N −1
X
n=0
y
I I[n]e
−j
2πkn
2N
+
2N −1
X
n=N
y
I I[n]e
−j
2πkn
2N
=
N −1
X
n=0
x[n]e
−j
2πkn
2N
+
2N −1
X
n=N
x[2N − n − 1]e
−j
2πkn
2N
,
(2.13)em que
k = 0, 1, . . . , 2N − 1
. Apli ando ao somatório de intervaloN ≤ n ≤ 2N − 1
umamudança devariáveldo tipo
n
′
= 2N − 1 − n
,a expressão anterior resultaem
Y [k] =
N −1
X
n=0
x[n]e
−j
2πkn
2N
+
N −1
X
n=0
x[n]e
−j
2πk(2N −1−n)
2N
=
N −1
X
n=0
x[n]e
−j
2πkn
2N
+ e
j
πk
N
N −1
X
n=0
x[n]e
j
2πkn
2N
= e
j
2N
πk
e
−j
πk
2N
N −1
X
n=0
x[n]e
−j
2πkn
2N
+ e
j
2N
πk
N −1
X
n=0
x[n]e
j
2πkn
2N
!
= e
j
2N
πk
N −1
X
n=0
x[n]
e
−j
πk(2n+1)
2N
+ e
j
πk(2n+1)
2N
= 2e
j
2N
πk
N −1
X
n=0
x[n] cos
πk(2n + 1)
2N
,
k = 0, 1, . . . , 2N − 1.
(2.14)ADCT-IIde omprimento
N
dada porX
II[k]
é denidaa partir de
Y [k]
da seguinteforma:X
II[k] = e
−j
πk
2N
Y [k],
k = 0, 1, . . . , N − 1.
(2.15)
Para obter a expressão para a transformação inversa, um pro edimento similar inverso é
realizado[22℄. Dessaforma,o par de transformadasdireta e inversa paraa DCT-II pode ser
obtidoe é dadopor
X
II[k] = 2
N −1
X
n=0
x[n] cos
πk(2n + 1)
2N
,
(2.16)x[n] =
1
N
N −1
X
k=0
c
k
X
II[k] cos
πk(2n + 1)
2N
,
(2.17) emquec
k
=
1
2
, k = 0,
1,
aso ontrário.
(2.18)ADCT-IItambéméapresentadanaliteraturaemsuaformaunitária. Naformaunitária,
osvetoresdabasesãonormalizadosdemodoa setornaremortonormais(videSeção3.3). Os
termos
2,
2
N
ec
k
sãodistribuídos entreasequações(2.16) e (2.17) ,resultandonasexpressõesˆ
X
II[k] =
r 2
N
c
ˆ
k
N −1
X
n=0
x[n] cos
πk(2n + 1)
2N
,
(2.19)x[n] =
r 2
N
N −1
X
k=0
ˆ
c
k
X
ˆ
II[k] cos
πk(2n + 1)
2N
,
(2.20) emqueˆ
c
k
=
1
√
2
, k = 0,
1,
aso ontrário. (2.21)O desenvolvimento da DCT-I é feito de forma similar ao apresentado para a DCT-II. A
extensãode
x[n]
quelevaàDCT-Ié feita omsobreposição doúltimoelemento dasequên ia,produzindoumanova sequên iade omprimento
M = 2N − 1
omsimetriapar emtorno doponto
N − 1
. anovasequên ia é expressa por [64℄y
I[n] =
x[n],
0 ≤ n < N,
x[2N − n − 2], N ≤ n ≤ 2N − 2.
(2.22)0
4
8
Figura2.2: Extensãoy
I[n]
paraaDCT-I. Tomando aDFTdey
I[n]
deformaanáloga ao asoda DCT-II,obtém-seadenição para aDCT-I. A transformaçãoé dadapelopar de equaçõesde análisee sínteseX
I[k] = 2
N −1
X
n=0
α
n
x[n] cos
πkn
N − 1
,
(2.23)x[n] =
1
N − 1
N −1
X
k=0
α
k
X
I[k] cos
πkn
N − 1
.
(2.24)ADCT-I na formaunitária éexpressa pelas seguintesexpressõesde análise esíntese:
ˆ
X
I[k] =
r
2
N − 1
N −1
X
n=0
ˆ
α
n
x[n] cos
πkn
N − 1
,
x[n] =
r
2
N − 1
N −1
X
k=0
ˆ
α
k
X
ˆ
I[k] cos
πkn
N − 1
,
emqueˆ
α
n
=
1
√
2
, n = 0
oun = N − 1,
1,
aso ontrário.Outras formas de extensão om simetria par em torno da origem geram os demais tipos
deDCT. AsDCT-IIIe DCT-IVsão geradasrespe tivamentepelasseguintes sequên ias[65℄:
y
I I I[n] =
x[n],
0 ≤ n ≤ N − 1,
0,
n = N,
−x[2N − n], N + 1 ≤ n ≤ 2N.
(2.25)0
4
10
0
Figura 2.3: Extensãoy
III[n]
para aDCT-III. ey
IV[n] =
x[n],
0 ≤ n ≤ N − 1,
−x[2N − n − 1], N + 1 ≤ n ≤ 2N − 1.
(2.26)Exemplos de extensão para para a DCT-III e DCT-IV de omprimento 5 são mostrados
respe tivamente nasFiguras2.3e 2.4.
AsDCTs tipoI, II,IIIe IV sãodenidas formalmente naforma unitária, ouortonormal,
atravésdasmatrizesde transformação
C
N
In,k
=
r
2
N − 1
c
k
c
n
cos
πkn
N − 1
,
C
N
IIn,k
=
r 2
N
c
k
cos
πk(2n + 1)
2N
,
C
N
IIIn,k
=
r 2
N
c
n
cos
π(2k + 1)n
2N
,
C
N
IVn,k
=
r 2
N
cos
π(2k + 1)(2n + 1)
4N
,
(2.27) emquen, k = 0, 1, . . . , N − 1
ec
n
=
1
√
2
, n = 0
oun = N,
1,
aso ontrário. (2.28)0
4
9
0
Figura 2.4: Extensão
y
IV[n]
paraaDCT-IV.
2.3 A DCT omo Caso Assintóti o da KLT
Consideremossinais quepodemser modelados omo umpro esso deMarkovde primeira
ordem om alta orrelação. Nesse aso, apli a-se o limite
ρ → 1
às equações (2.8) (2.11) .Daequação(2.11) , tem-se
lim
ρ→1
tan (N µ) = − lim
ρ→1
(1 − ρ
2
) sin µ
(1 + ρ
2
) cos µ − 2ρ
= 0.
(2.29)Dessaforma,asraízesnão negativasde(2.29) são
µ
k
=
kπ
N
, k = 0, 1, . . . , N − 1.
(2.30)Substituindo (2.30) em (2.10) e fazendo
ρ → 1
,tem-se queλ
k
= 0
parak 6= 0
. Para avaliar o aso em quek = 0
, utiliza-se o operator traçotr(·)
. O traço de uma matrizA
é denidopor [66, p.86℄
tr(A) =
N
X
n=1
a
n,n
,
(2.31)emque
A
éumamatrizdedimensãoN ×N
ea
n,n
éon
-ésimoelementodadiagonalprin ipal. UmavezqueR
y
= W·R
x
·W
⊤
,asmatrizesde ovariân iasãoditasmatrizessemelhantes[62,
p. 407℄. Numa transformaçãode similaridade destetipo,o traço damatriz é preservado [62,
p. 412℄. Considerando um pro esso de Markovde primeira ordem,segue-se que
tr(R
x
) =
N
X
n=1
ρ
|n−n|
= N = tr(R
y
) =
N −1
X
n=0
λ
n
= λ
0
.
Portanto,
λ
0
= N
. Substituindoµ
k
eλ
k
em(2.9)paraen ontrarosautovetores, segue-sequew
0
(n) =
1
√
N
ew
k
(n) =
r 2
N
cos
π(2n + 1)i
2N
,
k 6= 0.
Uni andoasduasexpressões, tem-seo nú leo da DCT-II,dado por
w
k
(n) = c
k
r 2
N
cos
π(2n + 1)k
2N
,
k, n = 0, 1, . . . , N − 1,
emquec
k
=
1
√
2
k = 0,
1,
aso ontrário.Dessaforma,aDCT-IIse omporta omoaKLTparasinaisperfeitamente orrela ionados.
Nesse aso, toda a energia do sinalé on entrada no primeiro autovetor, orrespondente ao
valor médio ou termo DC do sinal. Para sinais altamente orrela ionados, a DCT-II é uma
ex elente aproximação paraa KLT. Uma vez que osvetores da basenão dependem do sinal
deentrada, oquepossibilita odesenvolvimento dealgoritmosrápidos,a DCT-IIéaprin ipal
ferramenta para ompa tação dedadose para des orrela ionar vetores.
2.4 Algoritmos Rápidos para a DCT
AointroduziraDCT,ométodopropostoporAhmedetal. para omputar aDCTse
base-avanarelaçãodaDCT omaDFT[2℄. Entretanto,talmétodo empregaaritméti a omplexa
em sua implementação. Posteriormente, diversos algoritmos rápidos mais e ientes para a
implementação da DCT foram propostos. Tais algoritmos são denominados transformadas
rápidas do osseno(FCTs)
Nesta Seção são apresentados algoritmos rápidos relevantes para a DCT-II. Por ser um
métodopioneiroe por serbastantedifundidonaliteratura, sendoin lusiveapli adoem
apro-ximaçõesparaaDCTbaseadas emlifting s heme [67℄,ométodo deChen[14℄ seráabordado
em maior nível de detalhes. Outros algoritmos importantes também são abordados, sendo
su intamente des ritos. NestaSeção,porsimpli idade denota-seamatrizdaDCT-IIde
om-primento
N
porC
N
,ex etoquandone essáriodistinguirdeoutrotipodeDCT.Nesseúltimo aso,seráutilizadaanotaçãoempregadanaSeção2.2. Uma omparaçãoentreasomplexida-aritméti a de uma transformada a quantidade de operações matemáti as ne essárias para
omputaratransformação.
2.4.1 Algoritmo de Chen
Apresentadoem 1977,o algoritmo por Chen et al. apresentou umamelhora de fatorseis
na omplexidade omputa ionalquando omparado omo método baseado na DFT [14℄. O
algoritmoapresentadoenvolve apenasoperaçõesreaisepode serapli ado para omprimentos
N = 2
m
,
m ≥ 2
. Ométodo ébaseado na de omposição da matrizda DCT.ADCT de omprimento
N
deumvetorx
podeserexpressa porX
= C
N
· x
,ondeX
é o vetorde saída . A matrizC
N
pode serde ompostada seguinteformare ursiva [14℄:C
N
= P
N
·
C
N/2
0
0
R
N/2
· B
N
,
(2.32)emque
P
N
é umamatriz de permutação que permuta o vetor transformado de umaordem bit-reversed para a ordem natural. AmatrizR
N/2
é denidade a ordo omR
N/2
k,n
=
c
k
cos
(2n + 1)(2k + 1)π
2N
,
(2.33)n, k = 0, 1, . . . ,
N
2
− 1.
Amatriz
B
N
é denidaporB
N
=
I
N/2
¯I
N/2
¯I
N/2
−I
N/2
,
B
∗
N
=
−I
N/2
¯I
N/2
¯I
N/2
I
N/2
.
(2.34)Denota-se por
¯I
N
a matriz de ordemN
uja diagonal se undária é ompostapor elementos unitários e os demais elementos são nulos. A matrizB
N
apresenta estruturas onhe idas omoborboletas [68℄. UmaestruturaborboletaémostradanaFigura2.5. Linhastra ejadasrepresentammultipli ação por
−1
. Dea ordo omaFigura2.5,tem-sequeX
0
= a ·x
0
+ c ·x
1
e
X
1
= b · x
0
− d · x
1
. A matrizR
N/2
denida em (2.33) é de omposta em2 log
2
N − 3
matrizes da seguinte forma:X
0
x
0
x
1
X
1
a
b
c
d
Figura 2.5: Estruturaborboleta.
Antesdedes reverasmatrizes
M
i
,primeiramentesedeneasseguintesmatrizesparafa ilitar anotação:S
k
i
= sin
kπ
i
I
N/2i
,
¯
S
k
i
= sin
kπ
i
¯I
N/2i
,
K
k
i
= cos
kπ
i
I
N/2i
,
¯
K
k
i
= cos
kπ
i
¯I
N/2i
.
Asmatrizes
M
i
em(2.35) são lassi adas nosseguintestipos:•
Tipo 1: Se trata da primeira matrizM
1
. É formada on atenando-se termosS
a
j
2N
pela diagonal prin ipal no quadrante de ima a esquerda da matriz. O quadrante de baixo,à direita, é preen hido om termos
K
a
j
2N
. A diagonal se undária é feita preen hendo-se omK
¯
a
j
2N
no quadrante de ima, à direta, eS
¯
a
j
2N
no quadrante de baixo a esquerda. Os valoresdea
j
sãoa representação bit-reversed [69℄ deN/2 + j − 1
, paraj = 1, 2, . . . , N/2
. Resumidamente, a matrizé dada porM
1
=
S
a
1
2N
K
¯
a
2N
1
S
a
2
2N
K
¯
a
2N
2
. ..
. .
.
S
a
2N
N/4
K
¯
a
2N
N/4
¯
S
a
N/4+1
2N
K
a
N/4+1
2N
. .
.
. ..
¯
S
a
N/2−1
2N
K
a
N/2−1
2N
¯
S
a
2N
N/2
K
a
2N
N/2
.
(2.36)•
Tipo 2: Se trata da última matriz,M
2 log
2
N −3
. É denida pela on atenação deI
N/8
,−K
1
4
,K
1
4
,I
es-0
N/8
, K
1
4
, ¯
K
1
4
, 0
N/8
. Dessaforma,M
2 log
2
N −3
=
I
N/8
−K
1
4
K
¯
1
4
¯
K
1
4
K
1
4
I
N/8
.
(2.37)•
Tipo 3: São lassi adas neste tipo as demais matrizesM
q
om índi eq
ímpar. São formadaspela on atenaçãosu essivadasequên iaI
N/2i
,−K
k
j
i
,−S
k
j
i
,I
N/2i
peladiagonal prin ipal omeçando do quadrante de ima, à esquerda, e indo até o meio, em quei =
N
2
(q−1)/2
ej = 1, 2 . . . , i/8
. Deformasimilar,asequên iaI
N/2i
,K
k
j
i
,S
k
j
i
,I
N/2i
ontinuando na diagonal prin ipal pelo meio até o quadrante de baixo, à direita, em quej = i/8 +
1, i/8 + 2 . . . , i/4
. Através da diagonal se undária é on atenada a sequên ia0
N/2i
,S
¯
k
j
i
,− ¯
K
k
j
i
,0
N/2i
no quadrante de ima, à direita, até o meio. Continuando pela diagonal se undária do meio atéo quadrantede baixo, à esquerda, on atena-se a sequên ia0
N/2i
,−¯S
k
j
i
,K
¯
k
j
bit-reversed de
i/4 + j − 1
. Dessaforma,M
3
=
1
0
−K
k
1
N/2
S
¯
k
1
N/2
−S
k
1
N/2
− ¯
K
k
1
N/2
1
0
. .. ...
. .
. . ..
0
1
−¯S
k
N/8
N/2
K
k
N/8
N/2
¯
K
k
N/8
N/2
S
k
N/8
N/2
0
1
,
(2.38)M
5
=
I
2
0
−K
k
1
N/4
S
¯
k
1
N/4
−S
k
1
N/4
− ¯
K
k
1
N/4
I
2
0
. .. ...
. .
. . ..
0
I
2
−¯S
k
N/16
N/4
K
k
N/8
N/2
¯
K
k
N/16
N/4
S
k
N/16
N/4
0
I
2
· · ·
(2.39)•
Tipo 4: AsmatrizesM
p
de índi ep
par formameste onjunto. Asmatrizessãodenidas alternandoB
l
eB
∗
l
na diagonal prin ipal, oml = 2
P/2
. Dessa forma,M
p
=
B
2
p/2
B
∗
2
p/2
. ..
B
2
p/2
B
∗
2
p/2
.
(2.40)A omplexidademultipli ativa
M(·)
,dadapelonúmerodemultipli açõesdométodo,assimomoa omplexidadeaditiva
A(·)
,dadapelonúmerodeadições,podemserderivadasapartira matriz
B
N
, que só possui elementos±1
ontribui omN
adições. Então, deriva-se as seguintes equaçõesre ursivas:A(C
N
) = N + A(C
N/2
) + A(R
N/2
),
(2.41)M(C
N
) = M(C
N/2
) + M(R
N/2
).
(2.42)Aexpressãopara
A(R
N/2
)
podeserinferidanotando-se que(2.35)é ompostadelog
2
N − 2
matrizes ujadiagonalse undáriaéo upadapelametadee
log
2
N −1
matrizes ompletamente o upadas na diagonal prin ipal e se undária e sempre que há uma elemento na diagonalprin ipale umelemento na diagonal se undária, na mesmalinha,há umasoma. Portanto,
A(R
N/2
) =
N
4
(log
2
N − 2) +
N
2
(log
2
N − 1)
=
3N
4
log
2
N − N, N ≥ 4.
(2.43)Em relação ao número de multipli ações
M(R
N/2
)
, apenas as matrizes de índi e ímpares (tipo1,tipo2etipo3) ontribuem omtermosmultipli ativos. Aprimeiramatriz, dotipo1,ontribui om
N
multipli ações. Aúltima matriz, tipo 2, ontribui omN/4
multipli ações.Orestante das
log
2
N − 3
matrizes,tipo3, ontribuem omN/2
. Consequentemente,M(R
N/2
) = N +
N
4
+
N
2
(log
2
N − 3)
=
N
2
log
2
N −
N
4
, N ≥ 8.
(2.44)Umavez que
C
2
=
1
√
2
1
1
1 −1
,
(2.45)tem-se que
A(C
2
) = 2
eM(C
2
) = 2
. Com esses valores e substituindo (2.44) e (2.43) em (2.41) e(2.42) e solu ionandoa re ursividade,tem-se que[14℄A(C
N
) =
3N
2
(log
2
N − 1) + 2,
(2.46)M(C
N
) = N log
2
N −
3N
2
+ 4, N ≥ 4.
(2.47) 2.4.2 Algoritmo de LeeEm1984,Lee derivouumalgoritmoDITparaaDCT-II [15℄. Ométodofoiilustradopara
Des onsiderando as onstantes multipli ativas, a expressão (2.17) para a IDCT-II pode
seres rita separando
X
II[k]
emíndi es parese ímpares,da seguinte forma:
x[n] = g[n] + ˆ
h[n],
x[N − 1 − n] = g[n] − ˆh[n],
k = 0, 1, . . . , N/2 − 1,
emqueg[n] =
N/2−1
X
k=0
α
k
X
II(2k) cos
(2n + 1)k
N
,
eˆ
h[n] =
N/2−1
X
k=0
α
k
X
II(2k + 1) cos
(2n + 1)(2k + 1)
2N
.
Apósalgumas manipulações algébri as, hega-se àsexpressões
x[n] = g[n] +
1
2 cos
2n+1
2N
· h[n],
x[N − 1 − n] = g[n] −
1
2 cos
2n+1
2N
· h[n],
k = 0, 1, . . . , N/2 − 1,
(2.48) emqueh[n] =
N/2−1
X
k=0
α
k
[X
II(2k + 1) + X
II(2k − 1)] cos
(2n + 1)(2k + 1)
N
.
Dessaforma,aIDCTde omprimento
N
éde ompostanasomadeduasIDCTsdeompri-mento
N/2
. Opro edimento podeserapli adodeformare ursivaepodeserrealizadoparaaDCT.Considerando aDCTde omprimento 8,o método apresenta omplexidadearitméti a
de12 multipli ações e29 adições.
2.4.3 Algoritmo de Wang
Em1984,Wangpropsummétodosistemáti oparafatorarasmatrizesdaDFT,daDCT,
da DST e da DWT [16℄. Uma forma sistemáti a parade ompor as matrizes dasDCTs tipo
I,II, IIIeIV foiapresentadapara omprimentos
N = 2
k
, om
k
inteiro.Para aDTC-II, afatoração de Wang é dada por