Métricas Implementadas - Análises Comparativas

3.3 Análises Comparativas

3.3.2 Métricas Implementadas

Essa seção explica em detalhes as métricas implementadas neste trabalho e suportadas pelo módulo de análises comparativas da plataforma de execução distribuída Region Tem- plates. Parte dessas métricas são baseados em coeficientes estatísticos que são usualmente

utilizados na literatura para comparar a similaridade entre duas amostras [23, 32].

Métrica: Diff Pixels A métrica Diff Pixels conta a quantidade de pixels diferentes,

pertencentes ao foreground, da máscara produzida pela aplicação em relação à máscara produzida pelo patologista. Isso ocorre porque as máscaras são compostas basicamente de duas cores: branco e preto, sendo que a primeira serve para identificar os objetos encontrados (células e etc) e a segunda para representar o plano fundo. Dentre as seis métricas suportadas, esta é a única que não utiliza a unidade de processamento espacial RESQUE.

Métrica: General Dice Coefficient Este coeficiente é uma medida estatística que

varia de 0 a 1 e é utilizado para medir a semelhança entre duas amostras. Ela também

é conhecida como índice de Sørensen-Dice [63]. Quanto mais próximo de 1 for o valor

da métrica, mais semelhantes as amostras são. Esta métrica pode ser calculada através da divisão do dobro da área de intersecção das duas amostras pela soma das respectivas

áreas, conforme a Fórmula 3.1.

Dicegen =

2|A ∩ B|

|A| + |B| (3.1)

Ou seja, é calculada a área de interseção das imagens, baseada na área de interseção dos polígonos provenientes das máscaras em análise. E após somar todas as áreas das respectivas intercessões, divide-se pelo valor total da soma das áreas dos polígonos de ambos conjuntos de dados.

Métrica: Individual Dice Coefficient Essa métrica utiliza a mesma Fórmula do

coeficiente de Sørensen-Dice [23], no entanto, ao invés de considerar A e B como a área

total de interseção das máscaras de segmentação e de referência, considera-se A e B como

um par de células encontradas em ambas as máscaras (Fórmula 3.2).

Diceind = 1 N N X n=0 2|A ∩ B| |A| + |B| (3.2)

O A é a célula identificada na máscara gerada pela segmentação e o B é a célula equivalente encontrada na máscara de referência. Dessa forma são avaliados o graus de similaridades

de cada par de células (n) individualmente. Após calcular o valor do coeficiente Dice de cada par, calcula-se o valor médio entre todos eles (N = Número total de pares). O valor dessa métrica também varia de 0 a 1. Quanto mais próximo de 1, melhor é o resultado.

Métrica: Average Dice Coefficient Essa métrica é a média aritmética das métricas

General Dice Coefficient e Individual Dice Coefficient. Embora ambas as métricas sejam

semelhantes, elas contêm algumas desvantagens quando utilizadas de maneira isolada, daí a necessidade de criação desta métrica. A métrica General Dice Coefficient não atribui

valores diferentes ao comparar uma única célula da máscara de referência (Figura 3.12b)

à duas células com metade do tamanho correto e que estejam justapostas na máscara de

segmentação (Figura 3.12c), uma vez que ela apenas considera a soma da área total de

todos objetos encontrados no processo de segmentação.

(a) Exemplo de imagem de tecido anotada por um patologista.

(b) Exemplo segmentação correta. Duas células identificadas.

(c) Exemplo de segmenta- ção incorreta. Cinco células identificadas, sendo que de- veriam ser identificadas apenas duas.

Figura 3.12: Comparação de uma máscara com uma célula segmentada do tamanho correto com uma máscara que possui duas métricas com metade do tamanho e justapostas. [21].

Essa limitação pode acabar beneficiando segmentações que identifiquem mais células do que o correto ao comparar com a máscara de referência. Por outro lado, a métrica

Individual Dice Coefficient é capaz de diferenciar qual dessas duas situações é mais seme-

lhante à segmentação de referência porque ela considera cada par de células por vez, e, portanto, dá-lhe uma pontuação mais ou menos elevada dependendo do caso. Mesmo que esta métrica seja superior nesta situação, isso não significa que ela seja adequada a todos os casos. Por exemplo, a métrica Individual Dice Coefficient considera apenas os pares de células que estejam presentes em ambas segmentações e que se interceptam. Isso significa que se a segmentação gerada pela aplicação contém apenas algumas poucas células da

segmentação de referência, de modo que elas apresentem formato muito semelhante a sua célula correspondente, a métrica irá atribuir um valor alto para a segmentação.

Diceavg =

Dicegeneral+ Diceindividual

2 (3.3)

A métrica Average Dice Coefficient (Fórmula 3.3) foi criada para tirar proveito das

vantagens de ambas métricas e minimizar as suas limitações. Isso acontece porque quando ocorre a situação em que se demonstra a limitação de uma das métricas, a outra métrica é capaz de avaliar o resultado aplicando uma penalização ou uma pontuação mais elevada dependendo do caso. Essa métrica foi escolhida para ser utilizada na Avaliação

Experimental (Capítulo 4) dessa dissertação, uma vez que foi observado que ela reflete de

maneira precisa a qualidade de uma segmentação dentre as métricas suportadas.

Métrica: Intersection Overlap Area Esta métrica foi desenvolvida para representar

a relação percentual entre a área total de intersecção entre as duas amostras dividida pela soma das áreas de todos os polígonos apenas da máscara de referência, de acordo com a

Fórmula 3.4.

IOA = |A ∩ B|

|B| (3.4)

Quanto maior for essa porcentagem de intersecção, mais similar é a máscara computada

em relação à máscara de referência [70].

Métrica: Jaccard Index A métrica Jaccard Index também varia de 0 a 1. Ela é

calculada ao dividir a área total de intersecção entre duas amostras pela área total da

união dessas mesmas amostras [32], conforme a Fórmula 3.5.

J accard = |A ∩ B|

|A ∪ B| (3.5)

Uma expressão SQL-like similar a da Figura3.13 poderia ser utilizada em um banco

Figura 3.13: Uma consulta SQL-like equivalente à métrica Jaccard Index utilizada em banco de dados espaciais.

No documento Ajuste automático de parâmetros para aplicações de segmentação nuclear em imagens médicas (páginas 64-67)