Classificação de leucócitos através de um modelo híbrido

O modelo de segmentação híbrida pode ser facilmente adaptado à classificação de regiões. No modelo segmentador existe um classificador que determina a pertença, ou não, de um determinado pixel à região de interesse, decidindo-se sobre uma das duas classes possíveis. Esta decisão é tomada a partir da relação que os pixels adjacentes ao pixel a classificar estabelecem. Na classificação de uma região, como no caso de um

entrada para o classificador. O conceito funcional do modelo é em todo semelhante ao modelo usado na classificação. A principal diferença relaciona-se com a possibilidade de o número de classes a classificar ser agora maior do que dois. Este facto conduz a que se tenham de ter classificadores supervisionados treinados cada um deles, especificamente, para cada uma das classes de regiões consideradas. A razão de aplicar um modelo híbrido também neste problema é a mesma que levou à sua aplicação no problema da segmentação. A micro-segmentação executada na secção não supervisionada, no modelo híbrido, produz diversos aspectos padronizantes das regiões de interesse que permitem evitar um pouco o problema da métrica estática que suporta a decisão do que é importante e do que não é importante considerar numa região. Sem a percepção e o posterior entendimento de novas situações, o sistema pode falhar mais frequentemente. No problema da classificação de regiões a variabilidade em múltiplas direcções pode naturalmente surgir, como no caso do problema da segmentação, conduzindo a decisões erradas. A componente supervisionada tem assim uma tarefa mais simples, com resultados menos incertos, ao ter a cooperação da componente não- supervisionada.

Também neste caso a rede PCNN é responsável por obter um particionamento geométrico caracterizador da região a classificar. A assinatura obtida pelo decorrer das múltiplas iterações neuronais é numericamente codificada por descritores de Zernike. Estes, por sua vez, vão fornecer à rede supervisionada uma descrição mais independente das características altamente variantes das regiões em causa. A rede supervisionada deverá, nesta situação, ter apenas de aprender os traços fundamentais seleccionados e extraídos pela etapa não supervisionada que a antecede de cada classe em causa. A organização de blocos do modelo apresentado é mostrada na Figura 5.20. Como se pode visualizar, a decisão final passa por analisar cada uma das saídas dos classificadores SVM no bloco de comparação. A saída que tiver um valor mais elevado indicará a classe a que pertence a região em processamento. São consideradas ainda duas situações de não classificação. O comparador não indicará (a partir de um formato binário) qualquer classe, se existirem classes separadas por um valor inferior a κou se todas as classes tiverem um valor inferior a ρ. No primeiro caso, o comparador codifica a resposta num correspondente valor binário à interpretação de “Não tenho a certeza” e, no segundo caso, um outro valor binário corresponde à reposta de “Não sei”. O domínio numérico das saídas dos classificadores SVM situa-se no intervalo

[ ]

−1,1 . Assim,

Classificação de leucócitos através de um modelo híbrido

dentro deste intervalo, por uma análise da curva ROC, (Receiver Operating Characteristic), procurou-se encontrar os valores de κ e de ρ que minimizam o número de células classificadas erradamente. O valor final encontrado para κfoi o de 0.1 e o valor final encontrado para ρ foi o de -0.4. O procedimento foi feito avaliando, de forma independente, cada uma das curvas ROC de cada classe e consequentemente obtendo o valores de κ e de ρ para cada classe. Os valores finais de κ e de ρ foram obtidos pela média ponderada (relativamente ao número de instâncias de células existentes em cada classe) dos valores parciais de κ e de ρ de cada classe. No entanto, a forma mais correcta de se obterem esses valores seria pela análise conjunta das curvas ROC através de um método de optimização.

Figura 5.20 Composição do método de classificação por PCNN/SVM

...

1.ª Iteração - PCNN 2.ª Iteração - PCNN N.ª Iteração - PCNN

Estímulo externo (pixels da imagem)

Descritores de Zernike

Estímulo externo (pixels da imagem)

Descritores de Zernike

Estímulo externo (pixels da imagem)

Descritores de Zernike Classificador – SVM(k)

Este leucócito é um ...

Imagem de um leucócito segmentado

Comparador

SVM(1) SVM(2) ... SVM(K)

Classificação de leucócitos através de um modelo híbrido

Descrição das fases constituintes do treino para a classificação das regiões leucócito:

1. Percorrer a imagem de segmentações, pixel a pixel, numa progressão bem definida. Poderá ser da esquerda para a direita e de cima para baixo.

2. Após encontrar um primeiro pixel, assinalado pelo processo de segmentação e pertencente a uma célula, assinalar o contorno da célula na imagem de segmentação. O método usado para assinalar o contorno tem por base o processo de representação de contornos, chain code.

3. Assinalar/reassinalar todos os pixels internos ao contorno por um processo de preenchimento de regiões.

4. Os valores dos pixels são extraídos da região assinalada e são recolocados no plano bidimensional de entrada da PCNN. Cada região leucócito resultante é processada, de forma independente, pela PCNN em i-iterações.

5. As regiões binárias resultantes nas saídas da PCNN, ao longo de i-iterações, são descritas, numericamente, por um conjunto de momentos do descritor de regiões, o descritor de Zernike.

6. Para cada célula, a série que descreve a região tem um tamanho de i-elementos vezes o número de momentos do descritor usado. Cada uma destas séries corresponde a um padrão de treino para a SVM.

7. Normalização dos padrões de treino para um desvio padrão de uma unidade e para uma média de zero.

8. Cada padrão de treino é apresentado a um classificador de aprendizagem supervisionada, a SVM. Cada padrão está associado a um padrão de saída da SVM. Existe um número de SVMs igual ao número de classes de células a classificar. Cada SVM é treinada para que o padrão de treino na sua entrada tenha uma correspondência positiva ou negativa, na sua saída, de acordo com a classe de leucócitos associada ao respectivo

9. O processo descrito no ponto 8 será repetido um número de vezes de acordo com as regras de convergência do classificador, de aprendizagem supervisionada, em causa.

10.Pela análise das curvas de ROC, da saída de cada classificador SVM, são determinados valores limiares internos, κ e ρ, do comparador, que permitem optimizar o número de identificações correctas.

Descrição das fases constituintes do pós-treino na classificação das regiões leucócito:

1. Percorrer a imagem de segmentações, pixel a pixel, numa progressão bem definida. Poderá ser da esquerda para a direita e de cima para baixo.

2. Após encontrar um primeiro pixel, assinalado pelo processo de segmentação e pertencente a uma célula, assinalar o contorno da célula na imagem de segmentação.

3. Assinalar/reassinalar todos os pixels internos ao contorno por um processo de preenchimento de regiões.

4. Os valores dos pixels são extraídos da região assinalada. Cada região leucócito resultante é processada, de forma independente, pela PCNN em i-iterações.

5. As regiões binárias resultantes nas saídas das PCNN, ao longo de i-iterações, são descritas, numericamente, por um conjunto de momentos do descritor de regiões, o descritor de Zernike.

6. Para cada célula, a série que descreve a região tem um tamanho de i-elementos vezes o número de momentos do descritor usado. Cada uma destas séries corresponde a um padrão a identificar. 7. Normalização do padrão a identificar para um desvio padrão de

uma unidade e para uma média de zero.

8. Cada padrão a identificar é apresentado a um classificador de aprendizagem supervisionada, SVM, já treinado. Cada SVM

Resultados do classificador híbrido

codificará uma resposta que corresponderá positivamente ou negativamente à classe de leucócitos associada ao respectivo classificador SVM.

9. Cada valor de saída de cada SVM será comparado com os valores de saída restantes das SVMs restantes.

10.O valor maior, entre todos, será indicador da classe de célula identificada. Se o maior valor de saída cair dentro dos intervalos de rejeição de identificação do comparador, este devolve uma codificação binária que indica essa situação.

No documento Técnicas de segmentação e de classificação em imagens. Estudo de um caso de aplicação (páginas 143-149)