5.2 Aplica¸c˜ ao: segmenta¸c˜ ao de c´ elulas
5.2.2 Resultados
As linhas celulares mais importantes relacionadas `a medula ´ossea s˜ao as s´eries denomi- nadas eritr´oide, linf´oide e granuloc´ıtica [56]. De acordo com o n´ıvel de matura¸c˜ao, elas diferem em caracter´ısticas tais como forma, textura, cor, granularidade e densidade.
O conjunto de imagens utilizado neste trabalho pertence `a s´erie granulocytic, composta pelas c´elulas mieloblasto, promiel´ocito, miel´ocito, metamiel´ocito, neutr´ofilo bastonete e segmentado, ilustradas na Figura 5.8. Para que o processo de classifica¸c˜ao envolva apenas caracter´ısticas baseadas na forma, n˜ao ser˜ao utilizadas amostras do tipo promiel´ocito pois, neste caso, seria necess´ario considerar informa¸c˜oes de cor e textura) [76].
(a) (b) (c) (d) (e) (f)
Figura 5.8: C´elulas da linha celular granuloc´ıtica: (a) mieloblasto, (b) promiel´ocito, (c) miel´ocito, (d) metamiel´ocito, (e) neutr´ofilo bastonete e (f) segmentado [53].
Tais imagens pertencem ao CellAtlas.com [3], um banco de dados p´ublico com ima- gens de c´elulas de sangue classificadas por especialistas da ´areas de hematologia. Foram realizados testes em mais de 100 amostras, obtendo-se resultados promissores. A Fi- gura 5.9 ilustra alguns exemplos de segmenta¸c˜ao do n´ucleo de WBC.
Figura 5.9: Segmenta¸c˜ao do n´ucleo de WBC em imagens com um ´unico n´ucleo. Em contraste a abordagens que exigem uma sub-imagem para cada WBC, o esquema proposto tamb´em produz bons resultados de segmenta¸c˜ao para imagens compostas por v´arias c´elulas, mesmo em casos onde o fundo ´e complexo e cont´em RBC sobrepostas. Ob- serve na Figura 5.10 que resultados precisos s˜ao obtidos, eliminando assim a necessidade de uma etapa adicional para extra¸c˜ao de sub-imagens.
Figura 5.10: Segmenta¸c˜ao do n´ucleo de WBC em imagens com m´ultiplas c´elulas. Como discutido anteriormente, a ilumina¸c˜ao n˜ao-uniforme pode afetar o contraste no contorno entre o n´ucleo e o citoplasma, aumentando as chances de vazamento devido `a baixa defini¸c˜ao da imagem gradiente [76]. A Figura 5.11 ilustra alguns resultados em que o pr´e-processamento da imagem inicial com o operador SMMT foi essencial para evitar tais problemas.
(a) (b) (c) (d)
Figura 5.11: Exemplo de segmenta¸c˜ao onde o vazamento pode ser evitado com a utiliza¸c˜ao do operador SMMT. Resultados utilizando como marcador externo a imagem gradiente (Sobel) da imagem (a,c) original e (b,d) processada pelo SMMT.
Finalmente, a Figura 5.12 apresenta alguns resultados de segmenta¸c˜ao do citoplasma. Embora seja apenas uma estimativa, esta segmenta¸c˜ao pode ser considerada uma boa representa¸c˜ao da ´area e forma do citoplasma para fins de extra¸c˜ao de caracter´ısticas, conforme discutido na pr´oxima se¸c˜ao.
64 Cap´ıtulo 5
A simplifica¸c˜ao realizada pelo SMMT tamb´em conduz a melhores resultados quando associada a outros algoritmos de segmenta¸c˜ao. As Figuras 5.13 e 5.14 mostram os resul- tados obtidos para os algoritmos normalized cuts [38] e mean shift [9], respectivamente. No primeiro, os pixels da imagem s˜ao vistos como pontos em um espa¸co de caracter´ısticas organizados na forma de um grafo com pesos. A segmenta¸c˜ao, interpretada como um problema de agrupamento de pixels com caracter´ısticas semelhantes, ´e realizada atrav´es de um procedimento de corte em grafo cujo crit´erio se baseia tanto na dissimilaridade entre os diferentes grupos quanto na similaridade entre os componentes de cada grupo.
(a) (b) (c)
Figura 5.13: Segmenta¸c˜ao com Normalized Cuts: (a) imagem original e resultados con- siderando a imagem (b) processada pelo SMMT (σ−1 = 5, k = 15) e (c) a partir da original.
O algoritmo Mean Shift, por sua vez, define os agrupamentos como sendo as zonas de influˆencia dos m´aximos de uma fun¸c˜ao densidade de probabilidade formada pela repre- senta¸c˜ao dos pixels no espa¸co de caracter´ısticas [9].
(a) (b) (c)
Figura 5.14: Resultados com Mean Shift. (a) imagem de entrada (primeira linha: original e segunda linha: processada pelo SMMT, (b) Segmenta¸c˜ao e (c) bordas da segmenta¸c˜ao.
Resultados de Classifica¸c˜ao
Os sistemas automatizados de contagem diferencial em geral n˜ao atingem taxas de clas- sifica¸c˜ao aceit´aveis, impossibilitando seu uso na pr´atica. Por este motivo, ´e preciso que o processo seja feito manualmente, tornando os resultados subjetivos `a interpreta¸c˜ao da pessoa realizando a tarefa. A diferen¸ca entre a classifica¸c˜ao realizada por dois especi- alistas independentes ´e de aproximadamente 15% e, portanto, a precis˜ao da contagem manual pode ser estimada em 85% [56]. Um dos fatores que causam essa diferen¸ca na interpreta¸c˜ao dos resultados ´e que, enquanto os est´agios de matura¸c˜ao s˜ao uma vari´avel cont´ınua, a escolha do especialista precisa ser discreta.
Neste trabalho, a classifica¸c˜ao foi realizada a partir de caracter´ısticas extra´ıdas dos resultados de segmenta¸c˜ao da se¸c˜ao anterior, que considerou o conjunto de imagens com- posto por cinco classes de c´elulas pertencentes `a s´erie celular granuloc´ıtica (Figura 5.8). Tais caracter´ısticas representam a forma geom´etrica do n´ucleo e tamb´em da c´elula com- pleta. Os seguintes parˆametros foram extra´ıdos do componente n´ucleo: (f1) ´area, (f2) solidez, (f3) excentricidade, (f4) ´area da parte convexa do n´ucleo e (f5) per´ımetro. A excentricidade representa a raz˜ao entre os tamanhos m´aximo e m´ınimo de eixo, e assume um valor entre 0 e 1. A solidez representa a propor¸c˜ao dos pixels no fecho convexo que tamb´em pertencem ao objeto. Por fim, tamb´em foi calculada a taxa entre a ´area do n´ucleo e citoplasma (f6).
O n´umero excessivo de caracter´ısticas pode perturbar o processo de reconhecimento de padr˜oes, pois as mesmas podem ser contradit´orias ou mesmo representar informa¸c˜ao n˜ao-significativa, tal como ru´ıdo. Portanto, ´e necess´ario avaliar qual subconjunto ´e o mais apropriado para o problema espec´ıfico. Isso tamb´em causa a redu¸c˜ao da dimensionalidade do espa¸co de caracter´ısticas e, consequentemente, uma melhoria do desempenho e da capacidade de discrimina¸c˜ao do algoritmo de classifica¸c˜ao. Aqui, as caracter´ısticas f1-f6 foram combinadas experimentalmente de diferentes formas para identificar quais delas conduziam a taxas de classifica¸c˜ao mais precisas. A Tabela 5.3 mostra a porcentagem das WBC corretamente classificadas para diferentes combina¸c˜oes, utilizando o algoritmo de classifica¸c˜ao knn com a abordagem leave-one-out [10].
Tabela 5.3: Conjuntos de caracter´ısticas e taxas de classifica¸c˜ao. Caracter´ısticas Taxa de Classifica¸c˜ao Correta
f1, f2, f3, f4, f5 e f6 54.29%
f2 e f5 60.00%
f3 e f5 68.57%
f3, f5 e f6 70.23%
66 Cap´ıtulo 5
Observe que, mesmo considerando apenas caracter´ısticas baseadas na forma e um classificador muito simples, foram obtidos bons resultados preliminares (lembre-se que a segmenta¸c˜ao manual possui uma acur´acia de 85%). Isso indica que as informa¸c˜oes derivadas dos componentes n´ucleo e citoplasma segmentados pela abordagem proposta s˜ao confi´aveis e podem ser aplicadas em testes mais completos, seja em conjunto com outras caracter´ısticas ou utilizando classificadores mais robustos. Observe ainda que a sele¸c˜ao das caracter´ısticas mais discriminativas aumentou as taxas de classifica¸c˜ao de 54.29% para 71.43%.
´
E importante ressaltar que o objetivo dos testes realizados foi apenas avaliar se os n´ucleos segmentados pela abordagem proposta s˜ao adequados para fins de classifica¸c˜ao (em termos de precis˜ao na recupera¸c˜ao da forma, por exemplo). Para uma an´alise mais robusta, seria preciso considerar um maior formalismo na sele¸c˜ao de caracter´ısticas. Neste sentido, podem ser utilizadas t´ecnicas autom´aticas de sele¸c˜ao de caracter´ısticas, bem como algoritmos de classifica¸c˜ao mais robustos.
5.3
Conclus˜oes
Este cap´ıtulo apresentou exemplos em que a qualidade dos resultados obtidos depende fortemente da simplifica¸c˜ao realizada pelo operador SMMT. Em alguns casos, tal simpli- fica¸c˜ao permite a extra¸c˜ao de marcadores mais significativos, evitando super-segmenta¸c˜ao. Em outros, conduz `a regulariza¸c˜ao do contorno, possibilitando o c´alculo de uma imagem gradiente adequada.
Bons resultados foram obtidos mesmo em imagens com problemas de ilumina¸c˜ao, conforme ilustrado nas Figuras 5.3 e 5.4. A Se¸c˜ao 5.1 tamb´em mostrou que a segmenta¸c˜ao obtida atrav´es da imagem processada pelo operador ´e mais precisa do que quando a imagem original ´e utilizada diretamente.
Por fim, foram discutidos os resultados de segmenta¸c˜ao e classifica¸c˜ao de WBC em que, novamente, a utiliza¸c˜ao do operador SMMT foi fundamental para evitar problemas tais como vazamento. O pr´oximo cap´ıtulo apresenta um novo operador de binariza¸c˜ao que explora as propriedades do SMMT para identificar ou delimitar regi˜oes de interesse.
Abordagem toggle para binariza¸c˜ao
multi-escala de imagens
Diferentemente de outras abordagens, na transforma¸c˜ao realizada pelo operador SMMT, m´aximos e m´ınimos da imagem interagem ao mesmo tempo, conduzindo a uma fus˜ao de regi˜oes que a simplificam de tal forma que importantes estruturas podem ser identifica- das mesmo quando da existˆencia de varia¸c˜oes nas condi¸c˜oes de ilumina¸c˜ao. Al´em disso, por lidar explicitamente com o conceito de escala, tal abordagem possibilita a an´alise da imagem em diferentes n´ıveis de representa¸c˜ao, o que facilita a identifica¸c˜ao daqueles contendo o conjunto das caracter´ısticas de interesse. Neste cap´ıtulo, tais propriedades s˜ao exploradas para definir uma nova opera¸c˜ao de limiariza¸c˜ao adaptativa multi-escala: Defini¸c˜ao 6.1. (Operador de binariza¸c˜ao adaptativo multi-escala) Seja φk
1(x) =
[δBσ(f )]
k(x), isto ´e, a dilata¸c˜ao de f (x) com a fun¸c˜ao estruturante dependente de escala
Bσ k vezes. De forma an´aloga, φk2(x) = [εBσ(f )]
k(x). O novo operador de binariza¸c˜ao ´e
dado pela fun¸c˜ao:
(f gσ)k(x) =
1, se φk
1(x) − f (x) ≤ f (x) − φk2(x),
0, em outros casos. (6.1)
Em resumo, se o valor de um pixel est´a mais pr´oximo do seu valor erodido atribui-se a ele zero (preto). Caso contr´ario, atribui-se o valor um (branco), inclusive se a diferen¸ca entre o seu valor erodido e dilatado for a mesma.
Esta opera¸c˜ao explora principalmente o fato de que diferentes estruturas s˜ao afetadas dependendo da escala e do n´umero de itera¸c˜oes (Cap´ıtulo 4). Quanto menor a escala, por exemplo, maior deve ser a diferen¸ca entre os n´ıveis de cinza de pixels vizinhos para que os mesmos sejam alterados por uma das primitivas. Esta caracter´ıstica pode ser utilizada para extrair informa¸c˜oes relacionadas a regi˜oes em que h´a uma maior varia¸c˜ao, tais como contornos (os quais tipicamente correspondem aos limites f´ısicos dos objetos).
68 Cap´ıtulo 6
Observe tamb´em que, assim como ´e o caso para o SMMT, a regra de decis˜ao baseia-se na similaridade do pixel sendo analisado em rela¸c˜ao `as transforma¸c˜oes morfol´ogicas de eros˜ao e dilata¸c˜ao dependentes de escala. Dado que o valor de um m´aximo (m´ınimo) local ´
e considerado para determinar o valor dilatado (erodido), pode-se interpretar o resultado da aplica¸c˜ao do operador de binariza¸c˜ao como a representa¸c˜ao da convergˆencia de um pixel para a regi˜ao de influˆencia de um extremo local (veja a discuss˜ao destes aspectos no Cap´ıtulo 4). Em resumo, um pixel arbitr´ario pode convergir para a regi˜ao de influˆencia de um m´ınimo (valor zero), de um m´aximo (valor um) ou para nenhuma (valor um). O aumento no n´umero de itera¸c˜oes considera uma vizinhan¸ca mais ampla nesta an´alise.
A Figura 6.1 ilustra o efeito da mudan¸ca de parˆametros para uma imagem com ilu- mina¸c˜ao n˜ao-uniforme. Como o fundo ´e mais escuro que os gr˜aos (Figura 6.1(a)), os pixels pertencentes a ele tendem a se aproximar mais do seu valor erodido quando escalas mais altas s˜ao consideradas (pois, neste caso, pequenas varia¸c˜oes nos n´ıveis de cinza s˜ao sufici- entes para modific´a-los). A aplica¸c˜ao iterativa evita que extremos n˜ao significativos - tais como aqueles presentes devido `as varia¸c˜oes nas condi¸c˜oes de ilumina¸c˜ao - comprometam o resultado (Figura 6.1(b)).
A Figura 6.1(c) mostra o resultado ao considerar uma escala menor. Neste caso, regi˜oes com n´ıveis de cinza homogˆeneos tendem a n˜ao ser alteradas, fazendo com que o fundo n˜ao seja transformado (Cap´ıtulo 4). A parte interna, por ser mais clara, aproxima-se mais da transforma¸c˜ao definida pela dilata¸c˜ao e tamb´em ´e alterada para o valor um. Por outro lado, os pixels pertencentes aos contornos dos gr˜aos, regi˜oes em que h´a uma maior varia¸c˜ao, est˜ao mais pr´oximos do valor erodido e s˜ao associados ao valor zero.
(a) (b) (c)
Figura 6.1: Efeito da altera¸c˜ao dos parˆametros no operador de binariza¸c˜ao: (a) imagem original, (b) σ−1 = 1 e k = 25 e (c) σ−1 = 40 e k = 5.
Portanto, dependendo do objetivo espec´ıfico, diferentes combina¸c˜oes de parˆametros devem ser utilizadas. Enquanto escalas maiores tendem a criar regi˜oes, escalas menores as delimitam, identificando regi˜oes de contorno.
6.1
Trabalhos relacionados
Basicamente, a limiariza¸c˜ao consiste na transforma¸c˜ao de uma imagem em n´ıveis de cinza numa imagem bin´aria, a qual deve preferencialmente preservar informa¸c˜oes relevantes sobre n´umero, forma e posi¸c˜ao dos objetos que a comp˜oem. A principal motiva¸c˜ao, neste sentido, vem do fato de que a complexidade dos dados ´e reduzida, simplificando processamentos futuros.
A metodologia mais simples neste tipo de transforma¸c˜ao consiste em utilizar um ´unico limiar para toda a imagem. Contudo, devido a fatores como ru´ıdo e heterogeneidade na ilumina¸c˜ao, os resultados obtidos s˜ao geralmente insatisfat´orios para a maioria dos casos, exigindo o uso de diversos valores de limiares.
As abordagens de binariza¸c˜ao s˜ao tipicamente classificadas em duas categorias, depen- dendo da forma de obten¸c˜ao do limiar: globais, se dados que representam a imagem como um todo s˜ao utilizados, ou locais, quando considera-se apenas a informa¸c˜ao em uma vizi- nhan¸ca do pixel a ser transformado. As t´ecnicas globais mais frequentemente utilizadas s˜ao baseadas em an´alise de histograma, determinando o valor do limiar a partir daquele que melhor separa seus picos [68]. M´etodos de multi-limiariza¸c˜ao, por sua vez, al´em da an´alise da fun¸c˜ao de distribui¸c˜ao do histograma tamb´em podem utilizar informa¸c˜oes sobre contornos [81].
Entretanto, o bom desempenho de tais abordagens depende de um conhecimento pre- liminar sobre o n´umero ideal de picos. Al´em disso, como n˜ao necessariamente todas as caracter´ısticas de interesse formam picos proeminentes (como ´e o caso para objetos dis- tintos com o mesmo n´ıvel de cinza), bons resultados s˜ao obtidos apenas quando existe uma boa separa¸c˜ao entre o fundo e os objetos de interesse. Estes fatores tornam invi´avel sua aplica¸c˜ao em imagens com ilumina¸c˜ao n˜ao-uniforme, por exemplo [68].
Uma abordagem de limiariza¸c˜ao global de prop´osito geral bastante conhecida ´e o algoritmo de Otsu [63, 65]. Basicamente, ele seleciona como limiar o valor t que minimiza a seguinte rela¸c˜ao:
η(t) = σ 2 b σ2 t , (6.2) em que σ2
b representa a varia¸c˜ao dos valores m´edios de cada classe considerada (fundo e
objetos) em rela¸c˜ao `a m´edia total de todos os pixels e σ2
t ´e a variˆancia total.
Por outro lado, t´ecnicas de limiariza¸c˜ao local fornecem uma solu¸c˜ao adaptativa, dado que o valor do limiar ´e determinado pontualmente com base na informa¸c˜ao presente em uma vizinhan¸ca pr´e-definida. Devido ao custo computacional, ´e importante que tais transforma¸c˜oes sejam eficientes. Algumas delas s˜ao descritas a seguir.
O m´etodo das m´edias deslizantes determina o limiar com base no n´ıvel de cinza m´edio dos ´ultimos n pixels e foi especialmente desenvolvido para imagens contendo texto. A
70 Cap´ıtulo 6
imagem pode ser manipulada como uma cadeia unidimensional de pixels e a m´edia pode ser calculada exatamente ou estimada atrav´es da seguinte equa¸c˜ao [65]:
Mi+1 = Mi−
Mi
n + gi+1, (6.3)
em que Mi+1´e a m´edia deslizante estimada para o pixel i + 1, gi+1´e o seu n´ıvel de cinza
e Mi ´e a m´edia anterior (isto ´e, para o pixel i). O valor do limiar ´e definido como uma
certa porcentagem desta m´edia deslizante.
O algoritmo de Niblack foi desenvolvido para segmenta¸c˜ao de imagens de documentos e define um limiar local a partir da m´edia e do desvio padr˜ao calculados sobre uma janela retangular em torno do pixel sendo transformado segundo a seguinte equa¸c˜ao [61]:
T = m + k ∗ s, (6.4)
em que m ´e a m´edia e s ´e o desvio padr˜ao dos pixels da janela. A vari´avel k determina quanto do objeto ´e mantido e assume um valor entre −1 e 1. Como desvantagens, o m´etodo possui a baixa eficiˆencia computacional (o tempo de c´alculo do limiar varia com o tamanho da vizinhan¸ca), a sensibilidade ao tamanho da janela (o ideal ´e que ela contenha no m´ınimo um caracter) e a ocorrˆencia de ru´ıdo na regi˜ao do fundo.
Para minimizar este ru´ıdo, Sauvola propˆos uma extens˜ao a este algoritmo na qual o valor do limiar ´e calculado considerando um intervalo dinˆamico do desvio padr˜ao, R, de acordo com a equa¸c˜ao [69]:
T = m ∗1 + ks R − 1
, (6.5)
em que, novamente, m e s s˜ao a m´edia e o desvio padr˜ao dos pixels da janela. Aqui, k assume um valor positivo entre 0 e 1. Para determinar apropriadamente o valor de R, ´
e necess´ario conhecer o contraste do documento. Contudo, a influˆencia do tamanho da janela e o custo computacional permanecem um problema.
Gatos et al. [24] propuseram um esquema de binariza¸c˜ao local para imagens de docu- mentos que ´e robusto a diferentes problemas de degrada¸c˜ao. O m´etodo consiste em cinco passos principais: (a) pr´e-processamento utilizando o filtro de Wiener [26], (b) c´alculo de uma aproxima¸c˜ao inicial do texto utilizando o algoritmo de Sauvola (Equa¸c˜ao 6.5), (c) estimativa da superf´ıcie do fundo atrav´es de interpola¸c˜ao, (d) limiariza¸c˜ao dos objetos de interesse com base na combina¸c˜ao entre a estimativa do fundo e a imagem original, e (e) etapa de p´os-processamento para melhorar a qualidade das letras e preservar a sua conexidade.
A seguir, os m´etodos descritos s˜ao comparados ao operador proposto em diferentes contextos. Visando avaliar adequadamente a sua robustez, ele ´e aplicado em imagens de diferentes classes e sujeitas a diversos tipos de degrada¸c˜ao.