• Nenhum resultado encontrado

Resultados do Descritor Baseado na Análise Multifractal

Os testes para verificar o desempenho do descritor gerado a partir de partições das texturas em imagens binárias foram feitos inicialmente com os classificadores LDA e SVM. A Tabela 6.3 mostra a porcentagem de imagens classificadas corretamente e o respectivo desvio padrão, isso para cada base de imagens.

Tabela 6.3 – Comparação da Acurácia dos Classificadores SVM e LDA nos descritores multifractais aplicados nas bases KTHTIPS-2b, UIUC, UMD e 1200Tex.

Base SVM LDA

KTHTIPS-2b 63.5˘2.8 64.9˘2.7

UIUC 96.2˘0.7 97.6˘0.4

UMD 97.2˘0.6 99.1˘0.5

1200Tex 84.9˘1.1 87.1˘1.1

A Tabela 6.3 mostra que o classificador LDA forneceu maior precisão em todos os dados testados e, com base nisso, os demais testes foram realizados usando-se esse esquema de classificação. O desempenho dos descritores fractais individuais Box-counting (BC), Bouligand-Minkowski (BM) e Lacunaridade (L) (esta última conforme definida em

[35]) é apresentado na Tabela 6.4.

Tabela 6.4 – Acurácia da classificação usando descritores fractais individuais BC (Box counting), BM (Bouligand-Minkowski) e L (Lacunaridade) aplicados nas bases KTHTIPS-2b, UIUC, UMD e 1200Tex.

Base BC BM L

KTHTIPS-2b 64.9˘2.7 60.5˘2.9 61.2˘3.0

UIUC 97.6˘0.4 98.0˘0.7 97.9˘0.5

UMD 99.1˘0.5 99.3˘0.3 99.4˘0.5

1200Tex 87.1˘1.1 87.1˘1.1 86.8˘1.3

Dependendo das particularidades do conjunto de dados analisado, de acordo com os resultados apresentados na Tabela 6.4, é possível se afirmar que cada métrica fractal pode ou não ser recomendada. No entanto, é importante mencionar-se que para a base de imagens mais desafiadora (KTHTIPS-2b) ocorre a vantagem mais evidente do uso dos descritores box-counting propostos.

Diferentes combinações dos descritores fractais foram investigadas. A Tabela

6.5 mostra a acurácia de algumas medidas combinadas em um único descritor. O descritor BC individual continua sendo a melhor opção para a base KTHTIPS-2b, enquanto apenas uma melhora bastante sutil foi verificada nas outras bases quando descritores combinados foram usados.

As Tabelas 6.6, 6.7 e 6.8 listam respectivamente o desempenho do descritor proposto na classificação das bases KTHTIPS-2b, UIUC e UMD, em comparação com

Tabela 6.5 – Acurácia na classificação de combinações dos descritores BC (Box coun- ting), BM (Bouligand-Minkowski) e L (Lacunaridade) aplicados nas bases KTHTIPS-2b, UIUC, UMD e 1200Tex.

Base de imagens BC+BM BC+BM+L BM+L

KTHTIPS-2b 61.8˘2.6 63.1˘2.5 63.2˘2.0

UIUC 98.0˘0.4 98.2˘0.4 98.3˘0.4

UMD 99.4˘0.3 99.4˘0.3 99.4˘0.5

1200Tex 86.8˘1.3 87.1˘1.1 87.0˘1.2

Tabela 6.6 – Classificação das imagens da base KTHTIPS-2b. Acurácia do descritor pro- posto comparado com outros descritores da literatura.

Método Acurácia (%) VZ-MR8 [31] 46.3 LBP [19] 50.5 VZ-Joint [32] 53.3 LBP-FH [109] 54.6 CLBP [110] 57.3 ELBP [111] 58.1 SIFT + KCB [112] 58.3 SIFT + BoVW [112] 58.4 SIFT + VLAD [112] 63.1 Proposto 64.9

Tabela 6.7 – Classificação das imagens da base UIUC. Acurácia do descritor proposto comparado com outros descritores da literatura.

Método Acurácia (%) RandNet (NNC) [113] 56.6 PCANet (NNC) [113] 57.7 BSIF [114] 73.4 VZ-Joint [32] 78.4 LBPriu2/VAR [19] 84.4 ScatNet (NNC) [115] 88.6 MRS4 [32] 90.3 FC-CNN AlexNet [46] 91.1 MFS [20] 92.7 DeCAF [112] 94.2 FC-CNN VGGM [46] 94.5 PLS [35] 96.6 FC-CNN VGGVD [46] 97.0 Proposto 98.3

Tabela 6.8 – Classificação das imagens da base UMD. Acurácia do descritor proposto comparado com outros descritores da literatura.

Método Acurácia (%) FC-CNN AlexNet [46] 95.9 DeCAF [112] 96.4 Scattering [116] 96.6 (H+L)(S+R) [36] 97.0 FC-CNN VGGM [46] 97.2 FC-CNN VGGVD [46] 97.7 SIFT+BoVW [112] 98.1 SIFT+LLC [46] 98.4 WMFS [22] 98.7 OTF [117] 98.8 PLS [35] 99.0 Proposto 99.4

outros resultados publicados na literatura.

Os resultados apresentados na Tabela 6.6 mostram que os descritores fractais superam abordagens avançadas e do estado-da-arte como SIFT + VLAD ou SIFT + BoVW na classificação da base KTHTIPS-2b. As Tabelas6.7e6.8confirmam que métodos baseados no aprendizado automático como o FC-CNN também são superados na UIUC e UMD. Os resultados confirmam o potencial dos métodos baseados em fractal para analisar esses tipos de imagens, mesmo frente ao que há de mais moderno na literatura de reconhecimento de texturas.

As Figuras 6.10, 6.11 e 6.12 mostram as matrizes de confusão para as bases KTHTIPS-2b, UIUC e UMD respectivamente. As representações através de tais matrizes essencialmente confirmam a acurácia apresentada nas Tabelas 6.6, 6.7 e 6.8, além de complementarem aquela informação com o dado de precisão em cada classe, o que abre possibilidades para uma análise mais elaborada dos resultados da classificação.

Na Figura 6.10, vê-se que o classificador na KTHTIPS-2b teve menor precisão nas classes 3 (“veludo”) e 5 (“algodão”). Na verdade, esses materiais são frequentemente confundidos, até mesmo pela visão humana, pois ambos são tipos de tecidos para roupas e possuem padrões de textura semelhantes.

As bases UMD e UIUC, por outro lado, tiveram resultados de classificação com acurácias muito próximas ao 100%. Na UIUC, destacam-se classificações errôneas significativas apenas na classe 8 (“granito”), confundida com a classe 18 (“tapete”). Apesar de serem materiais diferentes, ambos são caracterizados por uma aparência granular, o que representa alguma dificuldade para a discriminação automática.

Figura 6.10 – Matrizes de Confusão do Descritor Baseado na Análise Multifractal para Classificação das Imagens da Base KTHTIPS-2b.

Figura 6.11 – Matrizes de Confusão do Descritor Baseado na Análise Multifractal para Classificação das Imagens da Base UIUC.

Figura 6.12 – Matrizes de Confusão do Descritor Baseado na Análise Multifractal para Classificação das Imagens da Base UMD.

6.4.1

Identificação de Espécies de Plantas

A Tabela 6.9 mostra a precisão do descritor proposto na base 1200Tex [30], em comparação com alguns dos últimos resultados publicados na literatura.

Tabela 6.9 – Comparação do descritor proposto com outros descritores na identificação de espécies de plantas através das imagens da base 1200Tex.

Method Accuracy (%) LBPV [110] 70.8 Network diffusion [118] 75.8 FC-CNN VGGM [46] 78.0 Gabor [30] 84.0 FC-CNN VGGVD [46] 84.2 Schroedinger [119] 85.3 SIFT + BoVW [112] 86.0 FV-CNN VGGVD [112] 87.1 Proposed 87.1

A base 1200Tex é um conjunto de imagens de folhas de plantas para 20 espécies brasileiras. Para cada espécie foram coletadas 20 amostras. A imagem de cada amostra foi dividida em três janelas não sobrepostas com tamanho 128 ˆ 128. Essas janelas foram extraídas de regiões da folha com menor variação de textura e foram convertidas em imagens em escala de cinza, resultando em uma base de 1200 imagens. De cada espécie, 30 imagens foram selecionadas aleatoriamente para treinamento e as imagens restantes para teste. Esse procedimento foi repetido 10 vezes, sendo então feito o cálculo da média de classificação correta e do respectivo desvio.

A Figura 6.13complementa a Tabela 6.9 exibindo a matriz de confusão para o método proposto na classificação das imagens da base 1200Tex. De um modo geral, as precisões em todas as classes são altas e a situação mais crítica ocorre na classe 8, que é confundida, por exemplo, com a classe 6. Elas correspondem a amostras com texturas semelhantes, especialmente no que diz respeito ao arranjo de nervuras, elemento importante para o processo de distinção entre amostras de diferentes espécies.

De um modo geral, o descritor proposto ainda demonstra competitividade quando comparado com várias abordagens de ponta para reconhecimento de imagens de texturas. É sabido que características intrínsecas à forma como esses materiais são formados na natureza contribuem para essa relação de forma significativa. Isso pode ser observado com mais facilidade em conjuntos de dados de texturas como UIUC e UMD, bem como em problemas práticos onde esses tipos de imagens surgem naturalmente, e este é o caso em muitas aplicações biológicas. Os resultados incentivam mais pesquisas sobre esse tópico, ao mesmo tempo em que apresentam os descritores fractais como uma alternativa que deve ser verificada em problemas práticos, pois eles podem alcançar desempenho competitivo,

Figura 6.13 – Matriz de confusão para o descritor proposto na classificação das imagens da base 1200tex.

por exemplo, sem exigir grandes quantidades de dados ou recursos computacionais para um treinamento efetivo.

Documentos relacionados