Resultados - Aplica¸c˜ ao: segmenta¸c˜ ao de c´ elulas

5.2 Aplica¸c˜ ao: segmenta¸c˜ ao de c´ elulas

5.2.2 Resultados

As linhas celulares mais importantes relacionadas à medula óssea são as séries denomi- nadas eritróide, linfóide e granuloc´ıtica [56]. De acordo com o n´ıvel de matura¸cão, elas diferem em caracter´ısticas tais como forma, textura, cor, granularidade e densidade.

O conjunto de imagens utilizado neste trabalho pertence à série granulocytic, composta pelas células mieloblasto, promielócito, mielócito, metamielócito, neutrófilo bastonete e segmentado, ilustradas na Figura 5.8. Para que o processo de classifica¸cão envolva apenas caracter´ısticas baseadas na forma, não serão utilizadas amostras do tipo promielócito pois, neste caso, seria necessário considerar informa¸cões de cor e textura) [76].

(a) (b) (c) (d) (e) (f)

Figura 5.8: Células da linha celular granuloc´ıtica: (a) mieloblasto, (b) promielócito, (c) mielócito, (d) metamielócito, (e) neutrófilo bastonete e (f) segmentado [53].

Tais imagens pertencem ao CellAtlas.com [3], um banco de dados público com imagens de células de sangue classificadas por especialistas da áreas de hematologia. Foram realizados testes em mais de 100 amostras, obtendo-se resultados promissores. A Fi- gura 5.9 ilustra alguns exemplos de segmenta¸cão do núcleo de WBC.

Figura 5.9: Segmenta¸cão do núcleo de WBC em imagens com um único núcleo. Em contraste a abordagens que exigem uma sub-imagem para cada WBC, o esquema proposto também produz bons resultados de segmenta¸cão para imagens compostas por várias células, mesmo em casos onde o fundo é complexo e contém RBC sobrepostas. Ob- serve na Figura 5.10 que resultados precisos são obtidos, eliminando assim a necessidade de uma etapa adicional para extra¸cão de sub-imagens.

Figura 5.10: Segmenta¸cão do núcleo de WBC em imagens com múltiplas células. Como discutido anteriormente, a ilumina¸cão não-uniforme pode afetar o contraste no contorno entre o núcleo e o citoplasma, aumentando as chances de vazamento devido à baixa defini¸cão da imagem gradiente [76]. A Figura 5.11 ilustra alguns resultados em que o pré-processamento da imagem inicial com o operador SMMT foi essencial para evitar tais problemas.

(a) (b) (c) (d)

Figura 5.11: Exemplo de segmenta¸c˜ao onde o vazamento pode ser evitado com a utiliza¸c˜ao do operador SMMT. Resultados utilizando como marcador externo a imagem gradiente (Sobel) da imagem (a,c) original e (b,d) processada pelo SMMT.

Finalmente, a Figura 5.12 apresenta alguns resultados de segmenta¸cão do citoplasma. Embora seja apenas uma estimativa, esta segmenta¸cão pode ser considerada uma boa representa¸cão da área e forma do citoplasma para fins de extra¸cão de caracter´ısticas, conforme discutido na próxima se¸cão.

64 Cap´ıtulo 5

A simplifica¸cão realizada pelo SMMT também conduz a melhores resultados quando associada a outros algoritmos de segmenta¸cão. As Figuras 5.13 e 5.14 mostram os resultados obtidos para os algoritmos normalized cuts [38] e mean shift [9], respectivamente. No primeiro, os pixels da imagem são vistos como pontos em um espa¸co de caracter´ısticas organizados na forma de um grafo com pesos. A segmenta¸cão, interpretada como um problema de agrupamento de pixels com caracter´ısticas semelhantes, é realizada através de um procedimento de corte em grafo cujo critério se baseia tanto na dissimilaridade entre os diferentes grupos quanto na similaridade entre os componentes de cada grupo.

(a) (b) (c)

Figura 5.13: Segmenta¸c˜ao com Normalized Cuts: (a) imagem original e resultados considerando a imagem (b) processada pelo SMMT (σ−1 = 5, k = 15) e (c) a partir da original.

O algoritmo Mean Shift, por sua vez, define os agrupamentos como sendo as zonas de influência dos máximos de uma fun¸cão densidade de probabilidade formada pela representa¸cão dos pixels no espa¸co de caracter´ısticas [9].

(a) (b) (c)

Figura 5.14: Resultados com Mean Shift. (a) imagem de entrada (primeira linha: original e segunda linha: processada pelo SMMT, (b) Segmenta¸c˜ao e (c) bordas da segmenta¸c˜ao.

Resultados de Classifica¸c˜ao

Os sistemas automatizados de contagem diferencial em geral não atingem taxas de classifica¸cão aceitáveis, impossibilitando seu uso na prática. Por este motivo, é preciso que o processo seja feito manualmente, tornando os resultados subjetivos à interpreta¸cão da pessoa realizando a tarefa. A diferen¸ca entre a classifica¸cão realizada por dois especialistas independentes é de aproximadamente 15% e, portanto, a precisão da contagem manual pode ser estimada em 85% [56]. Um dos fatores que causam essa diferen¸ca na interpreta¸cão dos resultados é que, enquanto os estágios de matura¸cão são uma variável cont´ınua, a escolha do especialista precisa ser discreta.

Neste trabalho, a classifica¸cão foi realizada a partir de caracter´ısticas extra´ıdas dos resultados de segmenta¸cão da se¸cão anterior, que considerou o conjunto de imagens com- posto por cinco classes de células pertencentes à série celular granuloc´ıtica (Figura 5.8). Tais caracter´ısticas representam a forma geométrica do núcleo e também da célula com- pleta. Os seguintes parâmetros foram extra´ıdos do componente núcleo: (f1) área, (f2) solidez, (f3) excentricidade, (f4) área da parte convexa do núcleo e (f5) per´ımetro. A excentricidade representa a razão entre os tamanhos máximo e m´ınimo de eixo, e assume um valor entre 0 e 1. A solidez representa a propor¸cão dos pixels no fecho convexo que também pertencem ao objeto. Por fim, também foi calculada a taxa entre a área do núcleo e citoplasma (f6).

O número excessivo de caracter´ısticas pode perturbar o processo de reconhecimento de padrões, pois as mesmas podem ser contraditórias ou mesmo representar informa¸cão não-significativa, tal como ru´ıdo. Portanto, é necessário avaliar qual subconjunto é o mais apropriado para o problema espec´ıfico. Isso também causa a redu¸cão da dimensionalidade do espa¸co de caracter´ısticas e, consequentemente, uma melhoria do desempenho e da capacidade de discrimina¸cão do algoritmo de classifica¸cão. Aqui, as caracter´ısticas f1-f6 foram combinadas experimentalmente de diferentes formas para identificar quais delas conduziam a taxas de classifica¸cão mais precisas. A Tabela 5.3 mostra a porcentagem das WBC corretamente classificadas para diferentes combina¸cões, utilizando o algoritmo de classifica¸cão knn com a abordagem leave-one-out [10].

Tabela 5.3: Conjuntos de caracter´ısticas e taxas de classifica¸c˜ao. Caracter´ısticas Taxa de Classifica¸c˜ao Correta

f1, f2, f3, f4, f5 e f6 54.29%

f2 e f5 60.00%

f3 e f5 68.57%

f3, f5 e f6 70.23%

66 Cap´ıtulo 5

Observe que, mesmo considerando apenas caracter´ısticas baseadas na forma e um classificador muito simples, foram obtidos bons resultados preliminares (lembre-se que a segmenta¸cão manual possui uma acurácia de 85%). Isso indica que as informa¸cões derivadas dos componentes núcleo e citoplasma segmentados pela abordagem proposta são confiáveis e podem ser aplicadas em testes mais completos, seja em conjunto com outras caracter´ısticas ou utilizando classificadores mais robustos. Observe ainda que a sele¸cão das caracter´ısticas mais discriminativas aumentou as taxas de classifica¸cão de 54.29% para 71.43%.

E importante ressaltar que o objetivo dos testes realizados foi apenas avaliar se os núcleos segmentados pela abordagem proposta são adequados para fins de classifica¸cão (em termos de precisão na recupera¸cão da forma, por exemplo). Para uma análise mais robusta, seria preciso considerar um maior formalismo na sele¸cão de caracter´ısticas. Neste sentido, podem ser utilizadas técnicas automáticas de sele¸cão de caracter´ısticas, bem como algoritmos de classifica¸cão mais robustos.

5.3 Conclus˜oes

Este cap´ıtulo apresentou exemplos em que a qualidade dos resultados obtidos depende fortemente da simplifica¸cão realizada pelo operador SMMT. Em alguns casos, tal simplifica¸cão permite a extra¸cão de marcadores mais significativos, evitando super-segmenta¸cão. Em outros, conduz à regulariza¸cão do contorno, possibilitando o cálculo de uma imagem gradiente adequada.

Bons resultados foram obtidos mesmo em imagens com problemas de ilumina¸cão, conforme ilustrado nas Figuras 5.3 e 5.4. A Se¸cão 5.1 também mostrou que a segmenta¸cão obtida através da imagem processada pelo operador é mais precisa do que quando a imagem original é utilizada diretamente.

Por fim, foram discutidos os resultados de segmenta¸cão e classifica¸cão de WBC em que, novamente, a utiliza¸cão do operador SMMT foi fundamental para evitar problemas tais como vazamento. O próximo cap´ıtulo apresenta um novo operador de binariza¸cão que explora as propriedades do SMMT para identificar ou delimitar regiões de interesse.

Abordagem toggle para binariza¸c˜ao

multi-escala de imagens

Diferentemente de outras abordagens, na transforma¸cão realizada pelo operador SMMT, máximos e m´ınimos da imagem interagem ao mesmo tempo, conduzindo a uma fusão de regiões que a simplificam de tal forma que importantes estruturas podem ser identifica- das mesmo quando da existência de varia¸cões nas condi¸cões de ilumina¸cão. Além disso, por lidar explicitamente com o conceito de escala, tal abordagem possibilita a análise da imagem em diferentes n´ıveis de representa¸cão, o que facilita a identifica¸cão daqueles contendo o conjunto das caracter´ısticas de interesse. Neste cap´ıtulo, tais propriedades são exploradas para definir uma nova opera¸cão de limiariza¸cão adaptativa multi-escala: Defini¸cão 6.1. (Operador de binariza¸cão adaptativo multi-escala) Seja φk

1(x) =

[δBσ(f )]

k_{(x), isto ´}_{e, a dilata¸}_c˜_{ao de f (x) com a fun¸}_c˜_{ao estruturante dependente de escala}

Bσ k vezes. De forma an´aloga, φk2(x) = [εBσ(f )]

k_{(x). O novo operador de binariza¸}_c˜_{ao ´}_e

dado pela fun¸c˜ao:

(f gσ)k(x) =

1, se φk

1(x) − f (x) ≤ f (x) − φk2(x),

0, em outros casos. (6.1)

Em resumo, se o valor de um pixel está mais próximo do seu valor erodido atribui-se a ele zero (preto). Caso contrário, atribui-se o valor um (branco), inclusive se a diferen¸ca entre o seu valor erodido e dilatado for a mesma.

Esta opera¸cão explora principalmente o fato de que diferentes estruturas são afetadas dependendo da escala e do número de itera¸cões (Cap´ıtulo 4). Quanto menor a escala, por exemplo, maior deve ser a diferen¸ca entre os n´ıveis de cinza de pixels vizinhos para que os mesmos sejam alterados por uma das primitivas. Esta caracter´ıstica pode ser utilizada para extrair informa¸cões relacionadas a regiões em que há uma maior varia¸cão, tais como contornos (os quais tipicamente correspondem aos limites f´ısicos dos objetos).

68 Cap´ıtulo 6

Observe também que, assim como é o caso para o SMMT, a regra de decisão baseia-se na similaridade do pixel sendo analisado em rela¸cão às transforma¸cões morfológicas de erosão e dilata¸cão dependentes de escala. Dado que o valor de um máximo (m´ınimo) local ´

e considerado para determinar o valor dilatado (erodido), pode-se interpretar o resultado da aplica¸cão do operador de binariza¸cão como a representa¸cão da convergência de um pixel para a região de influência de um extremo local (veja a discussão destes aspectos no Cap´ıtulo 4). Em resumo, um pixel arbitrário pode convergir para a região de influência de um m´ınimo (valor zero), de um máximo (valor um) ou para nenhuma (valor um). O aumento no número de itera¸cões considera uma vizinhan¸ca mais ampla nesta análise.

A Figura 6.1 ilustra o efeito da mudan¸ca de parâmetros para uma imagem com ilumina¸cão não-uniforme. Como o fundo é mais escuro que os grãos (Figura 6.1(a)), os pixels pertencentes a ele tendem a se aproximar mais do seu valor erodido quando escalas mais altas são consideradas (pois, neste caso, pequenas varia¸cões nos n´ıveis de cinza são sufici- entes para modificá-los). A aplica¸cão iterativa evita que extremos não significativos - tais como aqueles presentes devido às varia¸cões nas condi¸cões de ilumina¸cão - comprometam o resultado (Figura 6.1(b)).

A Figura 6.1(c) mostra o resultado ao considerar uma escala menor. Neste caso, regiões com n´ıveis de cinza homogêneos tendem a não ser alteradas, fazendo com que o fundo não seja transformado (Cap´ıtulo 4). A parte interna, por ser mais clara, aproxima-se mais da transforma¸cão definida pela dilata¸cão e também é alterada para o valor um. Por outro lado, os pixels pertencentes aos contornos dos grãos, regiões em que há uma maior varia¸cão, estão mais próximos do valor erodido e são associados ao valor zero.

(a) (b) (c)

Figura 6.1: Efeito da altera¸cão dos parâmetros no operador de binariza¸cão: (a) imagem original, (b) σ−1 = 1 e k = 25 e (c) σ−1 = 40 e k = 5.

Portanto, dependendo do objetivo espec´ıfico, diferentes combina¸cões de parâmetros devem ser utilizadas. Enquanto escalas maiores tendem a criar regiões, escalas menores as delimitam, identificando regiões de contorno.

6.1 Trabalhos relacionados

Basicamente, a limiariza¸cão consiste na transforma¸cão de uma imagem em n´ıveis de cinza numa imagem binária, a qual deve preferencialmente preservar informa¸cões relevantes sobre número, forma e posi¸cão dos objetos que a compõem. A principal motiva¸cão, neste sentido, vem do fato de que a complexidade dos dados é reduzida, simplificando processamentos futuros.

A metodologia mais simples neste tipo de transforma¸cão consiste em utilizar um único limiar para toda a imagem. Contudo, devido a fatores como ru´ıdo e heterogeneidade na ilumina¸cão, os resultados obtidos são geralmente insatisfatórios para a maioria dos casos, exigindo o uso de diversos valores de limiares.

As abordagens de binariza¸cão são tipicamente classificadas em duas categorias, dependendo da forma de obten¸cão do limiar: globais, se dados que representam a imagem como um todo são utilizados, ou locais, quando considera-se apenas a informa¸cão em uma vizinhan¸ca do pixel a ser transformado. As técnicas globais mais frequentemente utilizadas são baseadas em análise de histograma, determinando o valor do limiar a partir daquele que melhor separa seus picos [68]. Métodos de multi-limiariza¸cão, por sua vez, além da análise da fun¸cão de distribui¸cão do histograma também podem utilizar informa¸cões sobre contornos [81].

Entretanto, o bom desempenho de tais abordagens depende de um conhecimento pre- liminar sobre o número ideal de picos. Além disso, como não necessariamente todas as caracter´ısticas de interesse formam picos proeminentes (como é o caso para objetos dis- tintos com o mesmo n´ıvel de cinza), bons resultados são obtidos apenas quando existe uma boa separa¸cão entre o fundo e os objetos de interesse. Estes fatores tornam inviável sua aplica¸cão em imagens com ilumina¸cão não-uniforme, por exemplo [68].

Uma abordagem de limiariza¸cão global de propósito geral bastante conhecida é o algoritmo de Otsu [63, 65]. Basicamente, ele seleciona como limiar o valor t que minimiza a seguinte rela¸cão:

η(t) = σ 2 b σ2 t , (6.2) em que σ2

b representa a varia¸c˜ao dos valores m´edios de cada classe considerada (fundo e

objetos) em rela¸cão à média total de todos os pixels e σ2

t ´e a variˆancia total.

Por outro lado, técnicas de limiariza¸cão local fornecem uma solu¸cão adaptativa, dado que o valor do limiar é determinado pontualmente com base na informa¸cão presente em uma vizinhan¸ca pré-definida. Devido ao custo computacional, é importante que tais transforma¸cões sejam eficientes. Algumas delas são descritas a seguir.

O método das médias deslizantes determina o limiar com base no n´ıvel de cinza médio dos últimos n pixels e foi especialmente desenvolvido para imagens contendo texto. A

70 Cap´ıtulo 6

imagem pode ser manipulada como uma cadeia unidimensional de pixels e a média pode ser calculada exatamente ou estimada através da seguinte equa¸cão [65]:

Mi+1 = Mi−

n + gi+1, (6.3)

em que Mi+1é a média deslizante estimada para o pixel i + 1, gi+1é o seu n´ıvel de cinza

e Mi é a média anterior (isto é, para o pixel i). O valor do limiar é definido como uma

certa porcentagem desta m´edia deslizante.

O algoritmo de Niblack foi desenvolvido para segmenta¸cão de imagens de documentos e define um limiar local a partir da média e do desvio padrão calculados sobre uma janela retangular em torno do pixel sendo transformado segundo a seguinte equa¸cão [61]:

T = m + k ∗ s, (6.4)

em que m é a média e s é o desvio padrão dos pixels da janela. A variável k determina quanto do objeto é mantido e assume um valor entre −1 e 1. Como desvantagens, o método possui a baixa eficiência computacional (o tempo de cálculo do limiar varia com o tamanho da vizinhan¸ca), a sensibilidade ao tamanho da janela (o ideal é que ela contenha no m´ınimo um caracter) e a ocorrência de ru´ıdo na região do fundo.

Para minimizar este ru´ıdo, Sauvola propôs uma extensão a este algoritmo na qual o valor do limiar é calculado considerando um intervalo dinâmico do desvio padrão, R, de acordo com a equa¸cão [69]:

T = m ∗1 + ks R − 1

, (6.5)

em que, novamente, m e s são a média e o desvio padrão dos pixels da janela. Aqui, k assume um valor positivo entre 0 e 1. Para determinar apropriadamente o valor de R, ´

e necess´ario conhecer o contraste do documento. Contudo, a influˆencia do tamanho da janela e o custo computacional permanecem um problema.

Gatos et al. [24] propuseram um esquema de binariza¸cão local para imagens de documentos que é robusto a diferentes problemas de degrada¸cão. O método consiste em cinco passos principais: (a) pré-processamento utilizando o filtro de Wiener [26], (b) cálculo de uma aproxima¸cão inicial do texto utilizando o algoritmo de Sauvola (Equa¸cão 6.5), (c) estimativa da superf´ıcie do fundo através de interpola¸cão, (d) limiariza¸cão dos objetos de interesse com base na combina¸cão entre a estimativa do fundo e a imagem original, e (e) etapa de pós-processamento para melhorar a qualidade das letras e preservar a sua conexidade.

A seguir, os métodos descritos são comparados ao operador proposto em diferentes contextos. Visando avaliar adequadamente a sua robustez, ele é aplicado em imagens de diferentes classes e sujeitas a diversos tipos de degrada¸cão.

6.2 Binariza¸c˜ao de imagens com problemas de ilu-

No documento Transformações de imagens baseadas em morfologia matematica (páginas 77-86)