3.3 Análises Comparativas
3.3.2 Métricas Implementadas
Essa seção explica em detalhes as métricas implementadas neste trabalho e suportadas pelo módulo de análises comparativas da plataforma de execução distribuída Region Tem- plates. Parte dessas métricas são baseados em coeficientes estatísticos que são usualmente
utilizados na literatura para comparar a similaridade entre duas amostras [23, 32].
Métrica: Diff Pixels A métrica Diff Pixels conta a quantidade de pixels diferentes,
pertencentes ao foreground, da máscara produzida pela aplicação em relação à máscara produzida pelo patologista. Isso ocorre porque as máscaras são compostas basicamente de duas cores: branco e preto, sendo que a primeira serve para identificar os objetos encontrados (células e etc) e a segunda para representar o plano fundo. Dentre as seis métricas suportadas, esta é a única que não utiliza a unidade de processamento espacial RESQUE.
Métrica: General Dice Coefficient Este coeficiente é uma medida estatística que
varia de 0 a 1 e é utilizado para medir a semelhança entre duas amostras. Ela também
é conhecida como índice de Sørensen-Dice [63]. Quanto mais próximo de 1 for o valor
da métrica, mais semelhantes as amostras são. Esta métrica pode ser calculada através da divisão do dobro da área de intersecção das duas amostras pela soma das respectivas
áreas, conforme a Fórmula 3.1.
Dicegen =
2|A ∩ B|
|A| + |B| (3.1)
Ou seja, é calculada a área de interseção das imagens, baseada na área de interseção dos polígonos provenientes das máscaras em análise. E após somar todas as áreas das respectivas intercessões, divide-se pelo valor total da soma das áreas dos polígonos de ambos conjuntos de dados.
Métrica: Individual Dice Coefficient Essa métrica utiliza a mesma Fórmula do
coeficiente de Sørensen-Dice [23], no entanto, ao invés de considerar A e B como a área
total de interseção das máscaras de segmentação e de referência, considera-se A e B como
um par de células encontradas em ambas as máscaras (Fórmula 3.2).
Diceind = 1 N N X n=0 2|A ∩ B| |A| + |B| (3.2)
O A é a célula identificada na máscara gerada pela segmentação e o B é a célula equivalente encontrada na máscara de referência. Dessa forma são avaliados o graus de similaridades
de cada par de células (n) individualmente. Após calcular o valor do coeficiente Dice de cada par, calcula-se o valor médio entre todos eles (N = Número total de pares). O valor dessa métrica também varia de 0 a 1. Quanto mais próximo de 1, melhor é o resultado.
Métrica: Average Dice Coefficient Essa métrica é a média aritmética das métricas
General Dice Coefficient e Individual Dice Coefficient. Embora ambas as métricas sejam
semelhantes, elas contêm algumas desvantagens quando utilizadas de maneira isolada, daí a necessidade de criação desta métrica. A métrica General Dice Coefficient não atribui
valores diferentes ao comparar uma única célula da máscara de referência (Figura 3.12b)
à duas células com metade do tamanho correto e que estejam justapostas na máscara de
segmentação (Figura 3.12c), uma vez que ela apenas considera a soma da área total de
todos objetos encontrados no processo de segmentação.
(a) Exemplo de imagem de tecido anotada por um pato- logista.
(b) Exemplo segmentação correta. Duas células identi- ficadas.
(c) Exemplo de segmenta- ção incorreta. Cinco células identificadas, sendo que de- veriam ser identificadas ape- nas duas.
Figura 3.12: Comparação de uma máscara com uma célula segmentada do tamanho correto com uma máscara que possui duas métricas com metade do tamanho e justapostas. [21].
Essa limitação pode acabar beneficiando segmentações que identifiquem mais células do que o correto ao comparar com a máscara de referência. Por outro lado, a métrica
Individual Dice Coefficient é capaz de diferenciar qual dessas duas situações é mais seme-
lhante à segmentação de referência porque ela considera cada par de células por vez, e, portanto, dá-lhe uma pontuação mais ou menos elevada dependendo do caso. Mesmo que esta métrica seja superior nesta situação, isso não significa que ela seja adequada a todos os casos. Por exemplo, a métrica Individual Dice Coefficient considera apenas os pares de células que estejam presentes em ambas segmentações e que se interceptam. Isso significa que se a segmentação gerada pela aplicação contém apenas algumas poucas células da
segmentação de referência, de modo que elas apresentem formato muito semelhante a sua célula correspondente, a métrica irá atribuir um valor alto para a segmentação.
Diceavg =
Dicegeneral+ Diceindividual
2 (3.3)
A métrica Average Dice Coefficient (Fórmula 3.3) foi criada para tirar proveito das
vantagens de ambas métricas e minimizar as suas limitações. Isso acontece porque quando ocorre a situação em que se demonstra a limitação de uma das métricas, a outra métrica é capaz de avaliar o resultado aplicando uma penalização ou uma pontuação mais ele- vada dependendo do caso. Essa métrica foi escolhida para ser utilizada na Avaliação
Experimental (Capítulo 4) dessa dissertação, uma vez que foi observado que ela reflete de
maneira precisa a qualidade de uma segmentação dentre as métricas suportadas.
Métrica: Intersection Overlap Area Esta métrica foi desenvolvida para representar
a relação percentual entre a área total de intersecção entre as duas amostras dividida pela soma das áreas de todos os polígonos apenas da máscara de referência, de acordo com a
Fórmula 3.4.
IOA = |A ∩ B|
|B| (3.4)
Quanto maior for essa porcentagem de intersecção, mais similar é a máscara computada
em relação à máscara de referência [70].
Métrica: Jaccard Index A métrica Jaccard Index também varia de 0 a 1. Ela é
calculada ao dividir a área total de intersecção entre duas amostras pela área total da
união dessas mesmas amostras [32], conforme a Fórmula 3.5.
J accard = |A ∩ B|
|A ∪ B| (3.5)
Uma expressão SQL-like similar a da Figura3.13 poderia ser utilizada em um banco
Figura 3.13: Uma consulta SQL-like equivalente à métrica Jaccard Index utilizada em banco de dados espaciais.