• Nenhum resultado encontrado

Resultados dos Descritores Baseados nos Números de Ponto das Caixas

Os descritores BCDFβ1 e BCDFβ2 foram definidos pelas equações (5.5) e (5.6),

com β1 “ tµr, σr, Eru e β2 “ tµr, σr, Er, Kru. A Figura 6.2mostra a taxa de sucesso na

classificação de imagens de acordo com diferentes porcentagens das imagens usadas para treinamento.

A Figura 6.2 mostra que os dois descritores, BCDFβ1 e BCDFβ2, apresentam

os melhores resultados nas bases Outex e UIUC. O descritor BM se destaca na classificação das imagens da base USPTex, o que é previamente apresentado em [30] e justificado pela homogeneidade das imagens dentro de suas respectivas classes. Isso torna a análise multiescala de descritores fractais de BM suficiente para alcançar altas taxas de sucesso, mesmo para uma quantidade reduzida de amostras usadas para treinamento. Deve-se observar também que a abordagem proposta superou todos os outros métodos quando uma proporção razoável da base de dados foi separada para treinamento. Outro fato é que o descritor BCDFβ1 apresenta pior desempenho na base USPTex, enquanto fornece

resultados competitivos na Outex, e resultados superiores na base UIUC. Entre estas três base, a UIUC é o único conjunto de imagens nesta comparação contendo imagens com maior resolução (256 ˆ 256). Essa característica implica em mais informações a serem capturadas por qualquer método visando consolidar as informações, como qualquer descritor de imagem deve fazer. Esse tipo de riqueza de informações tende a beneficiar as técnicas diretas, que é o caso da proposta dos descritores apresentados.

O desempenho dos métodos na classificação das imagens das bases Outex, USPTex e UIUC também é apresentado na Tabela 6.1, que confirma o que foi apresentado pela Figura 6.2, mostrando que o descritor BCDFβ1 apresenta desempenho competitivo

nas bases Outex e USPTex e supera todos os demais métodos comparados para as imagens da base UIUC. Ao mesmo tempo, a combinação com a entropia, isto é, o descritor BCDFβ2,

produziu precisão ainda maior, com vantagem significativa sobre os demais.

(a) Outex (b) USPTex

(c) UIUC

Figura 6.2 – Taxa de sucesso de acordo com a porcentagem de imagens usada para treina- mento.

Fonte: Modificado de [98]

Tabela 6.1 – Porcentagem de imagens das bases Outex, UIUC e USPTex corretamente classificadas e respectivos desvios pelos descritores BCDFβ1, BCDFβ2, e

descritores da literatura.

Method Outex USPTex UIUC

LBP 75.4˘0.6 67.9˘0.4 77.6˘0.8 LBP+VAR 72.7˘0.5 69.9˘0.6 79.5˘0.7 MR8 63.6˘0.5 36.2˘0.5 81.3˘0.7 VZ-Joint 78.6˘0.5 63.0˘0.4 80.1˘0.6 BM 80.1˘0.5 77.9˘0.4 78.6˘0.6 Multifractal 57.7˘0.6 44.4˘0.6 68.4˘0.9 LPQ 74.8˘0.4 76.3˘0.4 74.2˘0.9 BCDFβ1 80.7˘0.6 74.0˘0.5 90.5˘0.5 BCDFβ2 83.2˘0.7 78.1˘0.5 91.2˘0.6

medida estatística que tem sido utilizada em diversas áreas, incluindo análise e processa- mento de imagens, durante as últimas décadas e cuja importância é bem conhecida na literatura [107, 108]. Na verdade, A entropia possui notável semelhança com a dimensão fractal, pois ambas de certa forma representam uma medida da desordem na distribuição de pixels da imagem.

As Figuras 6.3,6.4 e 6.5 mostram as matrizes de confusão associadas às classi- ficações das bases Outex, USPTex e UIUC respectivamente. O desempenho dos métodos BCDFβ1 e BCDFβ2 podem ser observados através da diagonal principal. Para que um

método seja considerado ideal este deve exibir uma diagonal “sólida”, e a abordagem pro- posta demonstra ser melhor em “preencher as diagonais” em cada matriz, correspondendo a erros menores. Uma observação específica sobre a Figura 6.3, que representa as matrizes de confusão da base Outex, é que em todos os métodos, grande parte dos erros se concen- tram entre as classes 58 e 68. Observando-se as matrizes de confusão, pode-se perceber que, embora a taxa de erro seja extremamente alta nestas classes, as classes previstas estão sempre entre as próprias classes 58 e 68. Isso indica que tais categorias de objetos apresentam características extremamente semelhantes segundo a análise dos descritores desenvolvidos. Esta observação já havia sido destacada como um desafio apresentado pela Figura 6.1, onde as primeiras texturas representam exatamente as classes citadas.

No caso da base UIUC, em que a taxa de sucesso é alta para todos os descritores comparados, também é possível observar-se que os pontos fora da diagonal são ainda menos presentes nas matrizes dos descritores BCDFβ1 e BCDFβ2.

(a) VZ-Joint (b) Bouligand-Minkowski

(c) BCDFβ1 (d) BCDFβ2

Figura 6.3 – Matriz de Confusão dos métodos com maiores taxas de sucesso na base Outex. Fonte: Obtido de [98]

O desempenho do descritor BCDFβ2 também foi avaliado com as imagens

afetadas por ruído, mais especificamente, por ruído Gaussiano. O ruído Gaussiano ge- ralmente aparece em imagens digitais resultantes de baixa iluminação ou temperaturas excessivamente altas do sensor. Tais ruídos também podem ocorrer por características físicas do circuito eletrônico que transmite a imagem. Sua remoção ou atenuação também é conhecida por ser mais desafiadora do que outros ruídos típicos, como “sal e pimenta”. Nos testes, o ruído Gaussiano foi introduzido artificialmente usando-se variações aleatórias no valor de todos os pixels, seguindo uma distribuição Gaussiana com média centrada no valor original do pixel e variância entre 0, 01 e 0, 05. Os resultados obtidos estão representados pela Figura 6.6. A comparação é feita com os métodos que alcançaram as maiores precisões na Tabela 6.1. Exceto para a base de dados Outex, em que todos os métodos comparados foram severamente afetados, a confirmação que o método proposto é relativamente tolerante ao ruído Gaussiano é apresentada por meio das curvas da Figura

(a) LPQ (b) Bouligand-Minkowski

(c) BCDFβ1 (d) BCDFβ2

Figura 6.4 – Matriz de Confusão dos métodos com maiores taxas de sucesso na base USPTex.

Fonte: Obtido de [98]

6.6. No entanto, o desempenho médio do descritor BCDFβ2 foi aceitável, não só pela

severidade da distorção introduzida, mas também pela precisão ser ainda maior do que a maioria dos demais descritores de imagem.

É interessante observar que embora as definições de dimensão de Bouligand- Minkowski e box-counting sejam equivalentes para conjuntos fractais clássicos [27], em todas as bases os testes descritos apresentaram grande diferença entre o desempenho dos descritores fractais com base na dimensão de Bouligand-Minkowski e a proposta baseada na dimensão box-counting aqui apresentada. Em situações práticas, isso não é realmente um problema, em especial pelo fato de que essa equivalência geralmente não é preservada pelo método numérico. Diferentes descritores implicam em diferentes perspectivas das mesmas imagens e diferentes abordagens podem ser combinadas, por exemplo, em ensembles de classificadores para fornecer resultados mais precisos e confiáveis.

(a) VZ-Joint (b) MR8

(c) BCDFβ1 (d) BCDFβ2

Figura 6.5 – Matriz de Confusão dos métodos com maiores taxas de sucesso na base UIUC. Fonte: Obtido de [98]

O desempenho alcançado pelo BCDFβ1 e BCDFβ2 na classificação de imagens

é em geral bastante encorajador. O método pode ser considerado mais simples do que outros métodos baseados na geometria fractal propostos na literatura para o reconhecimento de imagens. A proposta deste trabalho é significativamente mais simples, por exemplo, do que o espectro multifractal [20], e mais intuitivo do que os descritores BM [33], considerando-se que nenhuma transformação geométrica como a dilatação morfológica é realizada sobre a nuvem 3D representando a distribuição de pixels da imagem. Apesar da simplicidade e das definições intuitivas das definições dos descritores BCDFβ, as quantificações estatísticas

básicas são capazes de extrair características que demonstraram grande potencial na classificação das imagens de texturas, como pode ser averiguado pelos excelentes resultados alcançados.

(a) Outex (b) USPTex

(c) UIUC

Figura 6.6 – Taxas de sucesso quando o ruído Gaussiano é introduzido artificialmente na base de dados, coma variância (nível) entre 0, 01 e 0, 05.

Fonte: Obtido de [98]

Documentos relacionados