Alternativa de compress˜ ao lossless - Codificadores gen´ericos

4.2 Codificadores gen´ericos

5.1.2 Alternativa de compress˜ ao lossless

Partindo da estratégia base, que consistia em utilizar a diferen¸ca entre imagens DICOM consecutivas (Differential Images) em vez das próprias imagens, foram desenvolvidos e imple- mentados vários estratagemas que resultaram no método que iremos descrever de seguida.

A aproxima¸cão normal seria obter as Differential Images pela ordem natural de aquisi¸cão das imagem e usando a equa¸cão de diferen¸ca directa anteriormente definida (Difi,j(m, n) =

Imagem_i_{(m, n) − Imagem}_j(m, n)). Diversas experiências foram realizadas com este método mas as taxas de compressão obtidas não eram satisfatórias.

Se analisarmos os histogramas das imagens originais XA e CT (Figuras 5.7 e 5.8) e os com- pararmos com os histogramas das imagens obtidas por diferen¸ca directa (Figuras 5.9 e 5.10), é leg´ıtimo assumir que as últimas sejam mais suscept´ıveis de serem comprimidas do que as primeiras pois os seus histogramas são mais compactos.

No entanto isso não se verificou, pois, apesar das imagens resultantes da diferen¸ca directa conterem uma menor gama de valores do que as imagens originais, elas possuem uma distri- bui¸cão espacial menos estruturada e portanto menos prop´ıcia à compressão.

E importante referir que as Figuras 5.9 e 5.10 n˜ao apresentam os histogramas das diferen¸cas directas, mas sim, os das diferen¸cas directas mapeadas com a Equa¸c˜ao 4.2 que permite, como iremos ver, incluir diferen¸cas positivas e negativas na mesma imagem.

Figura 5.8: Imagem CT e respectivo histograma.

Figura 5.9: Diferen¸ca directa entre duas imagens XA consecutivas e respectivo histograma.

Figura 5.10: Diferen¸ca directa entre duas imagens CT consecutivas e respectivo histograma.

Foi então necessário desenvolver um método que utilizasse a mesma redundância tridimensional das diferen¸cas directas mas que a manipulasse por forma a facilitar a sua codifica¸cão.

A solu¸cão encontrada para XA foi, em vez de usarmos a diferen¸ca entre as imagens separadas na dimensão tempo, utilizarmos a diferen¸ca entre imagens extra´ıdas numa outra dimensão. Para isso, agregamos todas as frames, mantendo a sua ordem normal, e criamos um volume tridimensional (x, y, n) de, por exemplo, 512×512×N onde N é o número de frames do exame XA (Figura 5.11). O número de aquisi¸cão (n) de cada frame está directamente relacionado com o instante (t) em que foi adquirida. Assim, um número de aquisi¸cão superior implica

um momento de aquisi¸cão posterior. Este processo de constru¸cão do volume foi executado usando a ferramenta de software Matlab. As imagens usadas na diferen¸ca directa são posteriormente extra´ıdas no plano xt e não no plano xy (este último constitui a sequência temporal das imagens) - Figura 5.12. A solu¸cão foi depois extrapolada para CT em que N passa a ser o número de cortes do procedimento e as imagens são extra´ıdas no plano análogo ao xt para XA, i.e., o plano xz.

Figura 5.11: Constru¸c˜ao do volume.

Figura 5.12: Extrac¸c˜ao de imagem xt.

Na Figura 5.13 é poss´ıvel observarem-se os dois tipos de imagens, o de uma frame original xy (esquerda) e de uma frame xt (direita). As Differential Images são obtidas subtraindo-se uma imagem xt da imagem xt precedente. O primeiro plano xt é o topo do volume e o último plano xt é o fundo do mesmo. Estas imagens permitirão, como iremos ver, obter Differential Images mais prop´ıcias à compressão.

Figura 5.13: Diferen¸ca entre uma imagem xy e uma imagem xt.

O valor dos pixels das Differential Images xt resulta igualmente da aplica¸cão da equa¸cão de diferen¸ca directa anteriormente definida. As Differential Images da modalidade XA necessi- taram de uma aten¸cão especial pois não era poss´ıvel, com 8 bits de resolu¸cão, guardar toda a gama poss´ıvel de diferen¸cas ([-255, 255]) pelo que os valores de diferen¸ca não podiam ser directamente atribu´ıdos.

Foi ent˜ao utilizado um esquema de mapeamento similar ao usado pelo JPEG-LS e descrito na Equa¸c˜ao 4.2 aqui repetida.

M (ǫ) = 2|ǫ| − µ(ǫ) (5.1)

onde ǫ representa a diferen¸ca e µ(ǫ) = 1 se ǫ < 0 ou 0 se ǫ ≥ 0

Para este caso espec´ıfico, ǫ não representa um erro (como para JPEG-LS) mas sim o valor resultante da diferen¸ca directa. A aplica¸cão deste mapeamento resulta que todas as diferen¸cas negativas se transformem em números inteiros positivos ´ımpares e as positivas em números inteiros positivos pares. Este esquema pode, no entanto, parecer inadequado pela necessidade da Differential Image resultante necessitar, nalguns casos, de 2 Bytes por pixel (se 2|ǫ| − µ(ǫ) for superior a 255) mas isto nunca ocorreu em todos os procedimentos testados pois os valores das diferen¸cas são relativamente pequenos. No entanto, se se revelar necessário, a Differential Image em causa é gravada com 16 bits por pixel, não afectando a integridade do algoritmo. Depois do mapeamento, as Differential Images são codificadas com os diversos algoritmos de compressão (de imagem e genéricos) descritos anteriormente.

E importante real¸car que as Differential Images incluem tanto redundância bidimensional como tridimensional pois as imagens xt (xz para CT) usadas na diferen¸ca directa possuem informa¸cão temporal intr´ınseca (terceira dimensão espacial no caso CT) pois cada imagem xt ou xz contem a informa¸cão do comportamento de uma linha de pixels ao longo de todo o procedimento.

As modalidades XA e CT são, em termos de estrutura dos ficheiros DICOM, consideravel- mente diferentes pelo que as abordagens de leitura, análise e compressão são também elas distintas. Iremos de seguida abordar, separadamente, a estratégia alternativa espec´ıfica de cada modalidade.

Angiografia coron´aria

Cada exame XA (objecto multi-frame) é armazenado em disco sob a forma de um único ficheiro DICOM no qual, no entanto, cada frame do procedimento possui a sua própria informa¸cão relativa. Isto resulta num único ficheiro DICOM XA multi-frame de N frames. Por- tanto, para o caso espec´ıfico da modalidade XA, a situa¸cão geral da Figura 5.4 transforma-se no diagrama de blocos da Figura 5.14.

O algoritmo inicia-se com uma procura recursiva dos ficheiros DICOM existentes na pasta seleccionada. Ao encontrar um ficheiro DICOM XA, é efectuada uma análise ao seu cabe¸calho de modo a identificar os vários parâmetros que serão usados na manipula¸cão do mesmo como por exemplo, a Transfer Syntax (para verificar se o ficheiro já sofreu compressão etc.) e o número de frames. As frames que constituem o ficheiro XA são extra´ıdas individualmente e armazenadas em formato RAW ou Portable Gray Map (PGM) que não é mais do que uma imagem RAW com um pequeno cabe¸calho de três linhas em que estão indicados, além de uma palavra reservada de identifica¸cão do formato (palavra “P5”), o número de linhas, número de colunas e o valor máximo poss´ıvel que um pixel da imagem pode possuir.

Os ficheiros são posteriormente analisados por um programa escrito em Matlab (conversão para “C” em curso), no qual os ficheiros são anexados uns aos outros de modo a construir o volume. Desse volume são extra´ıdas as frames xt (Figura 5.12) e são calculadas as Differential Images que serão posteriormente sujeitas à compressão. Este ciclo é então repetido até que nenhum ficheiro DICOM XA seja encontrado no directório em análise. Na primeira itera¸cão é criado um log file onde são guardados resultados como o nome do ficheiro DICOM, taxa de compressão obtida etc. Este log file é actualizado a cada nova itera¸cão. Os módulos de software aplicados em cada passo, para a modalidade XA, estão também descritos na Figura 5.14.

Figura 5.14: Diagrama de fluxo detalhado para XA.

Encontram-se, na Tabela 5.1, as especifica¸cões da amostra de exames XA usada nesta ex- periência de compressão e sujeita ao algoritmo descrito anteriormente pela Figura 5.14.

Tabela 5.1: Caracteriza¸c˜ao da amostra de exames XA usada. N´umero total de procedimentos 278

N´umero total de frames 23152

Número m´ınimo de frames por exame 16 Número máximo de frames por exame 277

Velocidade de aquisi¸c˜ao 15 frames-per-second Espa¸co de armazenamento total 6.077.106.590 Bytes (6 GB)

Os passos efectuados na compara¸cão entre a utiliza¸cão dos codificadores state-of-the-art nas imagens originais e a utiliza¸cão dos codificadores genéricos no método Differential Images foram:

1. Aplicar os codificadores lossless state-of-the-art nas imagens XA originais previamente exportadas para o formato PGM (formato de entrada para a maioria dos codificadores) pela biblioteca DcmCC.dll.

2. Aplicar o codificador gen´erico referˆencia (PPMd) nas imagens XA originais para verificar o seu comportamento nestas imagens.

3. Após a realiza¸cão dos dois testes anteriores, aplicar o codificador state-of-the-art que melhores resultados obteve nas imagens originais, nas imagens do método Differential Images.

4. Comprimir as imagens do método Differential Images com os vários codificadores genéricos apresentados anteriormente.

Os resultados obtidos com os diferentes codificadores encontram-se nas Tabelas 5.2 e 5.3. As taxas de compress˜ao apresentadas s˜ao calculadas dividindo o espa¸co de armazenamento ocupado pela imagem original pelo espa¸co de armazenamento ocupado pela imagem codificada

Tabela 5.2: Resultados de compressão em imagens originais. Codificador Taxa de compressão média Lossless JPEG sv 1 2,67:1 PPMd 2,96:1 JPEG2000 3,37:1 JPEG-LS 3,52:1 PAQ8i 3,78:1 BMF 2.0 3,80:1

O codificador BMF 2.0 foi inclu´ıdo na Tabela 5.3 por ter sido o que melhor resultados teve na Tabela 5.2 servindo desta forma para comprovar o fraco desempenho dos codificadores de imagem state-of-the-art nas imagens do m´etodo Differential Images.

Tabela 5.3: Resultados de compressão em Differential Images. Codificador Taxa de compressão média

BMF 2.0 2,74:1

Zlib 2,89:1

BZ2 2,99:1

PPMd 3,38:1

PAQ8f 3,43:1

Das Tabelas 5.2 e 5.3 ´e poss´ıvel tirar as seguintes conclus˜oes:

• O JPEG-LS é o melhor codificador lossless de entre os três codificadores de imagem adoptados pela norma DICOM para estudos angiográficos.

• Dois dos codificadores lossless de imagem (BMF 2.0 e PAQ8i) s˜ao superiores aos adoptados pelo standard DICOM. No entanto, os seus desempenhos diminuem consideravel- mente nas Differential Images (ver BMF 2.0 na Tabela 5.3).

• O método alternativo com codificador PPMd consegue, em média, uma compressão 27% mais elevada do que o Lossless JPEG sv1. Tem também uma taxa de compressão ligeiramente melhor do que o JPEG2000 e perde somente 4% em rela¸cão ao JPEG-LS.

E preciso real¸car o facto de que os codificadores da fam´ılia JPEG foram desenvolvidos especialmente para a compress˜ao de imagens.

• Os codificadores gerais da fam´ılia PAQ8 estão entre os melhores em ambas as estratégias. No entanto, devem ser exclu´ıdos como solu¸cão prática pois têm um consumo elevado tanto em termos de recursos computacionais como em tempo de processamento. Foram usados nestas experiências para servir de compara¸cão com os outros codificadores. De seguida está apresentada a estratégia de arquivo para a modalidade de imagiologia CT e respectivos resultados.

Tomografia Computorizada

Os ficheiros DICOM da modalidade CT são originalmente armazenados de forma diferente aos de XA pelo que foi necessário aplicar uma abordagem diferente ao método Differential Images. Cada corte CT é armazenado num ficheiro separado dos restantes, o que resulta em N ficheiros DICOM em que cada um corresponde à imagem de um único corte. Portanto,

para o caso espec´ıfico da modalidade CT, a situa¸c˜ao geral da Figura 5.4 transforma-se no diagrama de fluxo da Figura 5.15.

Figura 5.15: Diagrama de fluxo detalhado para CT.

O algoritmo desenvolvido para a modalidade CT é praticamente idêntico à abordagem usada em XA mas difere em pontos importantes (com contornos espessos na Figura 5.15). Devido `

a forma como os ficheiros CT são armazenados, é imperativo identificar e agrupar os ficheiros que pertencem ao mesmo procedimento. O bloco interrogatório “ID Correcto ?” é então necessário para se identificar a classifica¸cão do ficheiro DICOM analisado em termos de Pa- tient Name, Study ID, Series Number, etc., de acordo com a hierarquia de pesquisa DICOM apresentada no Cap´ıtulo 3.

Alguns procedimentos CT gerados no CHVNG e por nós usados nas experiências têm ori- gem num equipamento CT multidetector (MDCT) de 64 cortes e são geralmente destinados para diagnóstico de calcifica¸cão das artérias coronárias (CTA). Nestes procedimentos, é co-

mum dividir-se o ciclo card´ıaco (intervalo R-R), de forma percentual, em janelas temporais (normalmente 10) denominadas fases nas quais são adquiridas as imagens. O bloco “Fase card´ıaca completa?” da Figura 5.15 está relacionado com a identifica¸cão da fase card´ıaca a que o ficheiro DICOM em causa pertence.

Esta técnica, em que existe um sincronismo entre a aquisi¸cão das imagens CT e o electrocar- diograma (ECG) do paciente é chamada de CT com ECG triggering [13, 14]. Na Figura 5.16 encontra-se um exemplo de ECG triggering para um equipamento CT de corte único.

Figura 5.16: CT com ECG triggering [13].

Apesar de reduzirem bastante o tempo de aquisi¸cão do exame, os 64 cortes simultâneos não permitem, em condi¸cões normais, adquirir em simultâneo um volume imagiológico que abranja todo o cora¸cão pelo que são necessárias várias passagens em diferentes posi¸cões relativas. Estas novas aquisi¸cões são efectuadas nos próximos ciclos card´ıacos com sincroniza¸cão retrospectiva das reconstru¸cões tomográficas. Como resultado da aplica¸cão da técnica de ECG triggering, o procedimento completo é composto pelo número normal de cortes CT multiplicado pelo número de fases em que o ciclo card´ıaco foi dividido. Por exemplo, se necessitarmos de 300 cortes para obter imagens de todo o cora¸cão e o ciclo for dividido em 10 fases, o procedimento será, na sua totalidade, constitu´ıdo por 3000 ficheiros DICOM.

Os volumes de imagens criados neste trabalho e usados para se extra´ırem as imagens xz, apenas podem ser constru´ıdos com ficheiros DICOM CT do mesmo procedimento e princi- palmente da mesma fase do ciclo card´ıaco. Mas, como todos os ficheiros de uma mesma fase não são adquiridos de forma sequencial, é necessário ordená-los antes de os converter para o formato RAW ou PGM. Essa ordena¸cão é efectuada com o algoritmo Shell sort e usando como parâmetro de ordena¸cão a etiqueta Instance Number (0020,0013) dos ficheiros DICOM CT que identifica o número da imagem dentro da série. Este algoritmo de ordena¸cão deriva do Insertion sort e foi inventado por Donald Shell em 1959. É um dos mais rápidos algoritmos para classificar pequenos conjuntos com menos de 1000 elementos (como é o caso de ficheiros CT da mesma fase card´ıaca). Uma outra vantagem deste algoritmo é que requer quantidades relativamente pequenas de memória [15, 16].

Depois de ordenados, os ficheiros são convertidos, tal como para XA, para o formato RAW ou PGM. O volume é então criado e são extra´ıdas as imagens xz CT. As Differential Images são obtidas mas com uma pequena diferen¸ca em rela¸cão a XA. Cada pixel de uma imagem CT ocupa 2 Bytes, dos quais só os 12 bits menos significativos (least significant bits - lsb) têm informa¸cão, i.e., os 4 bits mais significativos (most significant bits - msb) estão a zero ou possuem informa¸cão irrelevante. É então importante aplicar uma máscara de modo a não incluir o conteúdo dos 4 msb no cálculo da diferen¸ca entre imagens xz consecutivas.

Além disso, existe ainda a possibilidade dos dados estarem representados numa de duas formas poss´ıveis: Windows Intel “Litte Endian” (Figura 5.17) ou Motorola “Big Endian” (Figura 5.18). Esta representa¸cão interna especifica de que forma está ordenada a informa¸cão em palavras de 2 ou mais Bytes. No caso das máquinas Intel e para uma palavra de 16 bits (2 Bytes), o Byte menos significativo vem primeiro, no espa¸co de endere¸camento em memória, do que o Byte mais significativo [17, 18].

Figura 5.17: Armazenamento “Little Endian” em mem´oria [18].

Para esta situa¸cão espec´ıfica, a Transfer Syntax suportada, por defeito, pelo standard DICOM é “Implicit VR Little Endian Transfer Syntax”. O trabalho foi efectuado em máquinas de arquitectura Intel pelo que foi necessário especial cuidado na aplica¸cão da máscara.

Figura 5.18: Armazenamento “Big Endian” em mem´oria [18].

As Differential Images são finalmente comprimidas com um dos codificadores mencionados no cap´ıtulo anterior e o log file é actualizado. Os passos efectuados na compara¸cão entre a utiliza¸cão dos codificadores state-of-the-art nas imagens originais e a utiliza¸cão dos codificadores genéricos no método Differential Images foram os mesmos do que para a modalidade XA.

Encontram-se, na Tabela 5.4, as especifica¸c˜oes da amostra de procedimentos CT usada nesta experiˆencia e sujeita ao algoritmo descrito anteriormente pela Figura 5.15.

Tabela 5.4: Caracteriza¸c˜ao da amostra de exames CT usada.

N´umero total de procedimentos 5

N´umero total de frames 8334

Máximo número de files por fase card´ıaca 369 M´ınimo número de files por fase card´ıaca 273

Volume de dados 4.396.540.912 Bytes (4 GB)

Os resultados obtidos com este método e com os diferentes codificadores encontram-se nas Tabelas 5.5 e 5.6. É de notar a ausência do codificador BMF 2.0 que obteve os melhores resultados nas imagens XA. Esta ausência deve-se à incapacidade deste codificador lidar com imagens grayscale com resolu¸cão superior a 8 bits por pixel (bpp) como é o caso das imagens CT (12 bpp).

A norma de compressão JPEG2000 encontra-se na Tabela 5.6 pela mesma razão que o codificador BMF2.0 se encontrava na Tabela 5.3 para a modalidade XA, i.e., comparar o desempenho do melhor codificador em imagens CT originais com o desempenho dos codificadores ditos genéricos quando aplicado em Differential Images.

Tabela 5.5: Resultados de compressão em imagens originais. Codificador Taxa de compressão média

PPMd 2,033:1

Lossless JPEG sv 1 2,148:1

PAQ8i 2,234:1

JPEG-LS 2,639:1

JPEG2000 2,675:1

Tabela 5.6: Resultados de compressão em Differential Images. Codificador Taxa de compressão média

Zlib 1,799:1 JPEG2000 2,276:1 PPMd - Ordem 2 2,414:1 BZ2 2,422:1 PPMd - Ordem 5 2,444:1 PAQ8f 2,545:1

Na Tabela 5.6 estão afixados dois resultados com o codificador PPMd que se referem ao mesmo codificador mas com ordens diferentes. O codificador PPMd de ordem 2 é óptimo para a modalidade XA enquanto que para CT, o codificador é óptimo se o preditor usar as 5 amostras anteriores (ordem 5). Apesar da diferen¸ca nas taxas de compressão entre as duas configura¸cões ser m´ınima, ilustra claramente que a configura¸cão deste codificador afecta os resultados obtidos.

Das Tabelas 5.5 e 5.6 ´e poss´ıvel tirar as seguintes conclus˜oes:

• Ao contrário da modalidade XA em que o codificador JPEG-LS foi o melhor, em CT, o JPEG2000 é o melhor codificador lossless de entre os três codificadores de imagem adoptados pela norma DICOM para estudos CT, ultrapassando mesmo o exigente PAQ8i. • O método Differential Images com codificador PPMd consegue, em média, uma com-

press˜ao 14% mais elevada do que o Lossless JPEG sv1 perdendo, no entanto, cerca de 8% para o JPEG-LS e 9% para o JPEG2000.

• Tal como nos resultados obtidos para a modalidade XA, os codificadores genéricos da fam´ılia PAQ8 estão entre os melhores em ambas as estratégias. No entanto, foram mais uma vez exclu´ıdos como solu¸cão prática devido ao elevado consumo de recursos computacionais e de tempo de processamento. Foram usados nestas experiências para servir de compara¸cão com os outros codificadores.

O ponto essencial que tem de ser referido é que, mediante os resultados apresentados nas tabelas anteriores, o método Differential Images iguala, de certa forma, os desempenhos dos mais recentes codificadores de imagem mas não os ultrapassa. Isto torna-o pouco atractivo para a compressão puramente lossless pois não introduz melhorias significativas nas taxas de compressão. No entanto, como veremos mais a frente nesta disserta¸cão, um dos pontos fortes desta estratégia consiste na sua flexibilidade e na possibilidade de integra¸cão de diferentes técnicas de remo¸cão de informa¸cão visual não relevante, de modo a se obter um método de compressão visually lossless aliciante. Outro ponto importante resida na facilidade de integra¸cão de novos codificadores lossless no esquema geral do algoritmo.

No documento Estratégias de arquivo de imagiologia cardíaca (páginas 141-154)