(1)TÍTULO: Ajuste de Hiperparâmetros de Redes Neurais Artificiais e Seleção de Atributos para o Problema de Classificação de Qualidade da Madeira

(1)

TÍTULO:

Ajuste de Hiperparâmetros de Redes Neurais Artificiais e Seleção de Atributos para o Problema de Classificação de Qualidade da Madeira.

AUTORES:

Mateus Roder; André Luis Debiaso Rossi, Itapeva, C.E. Unesp Itapeva, Engenharia de Produção, mateusroder@hotmail.com, bolsista FAPESP (proc. n° 2018/02822-1).

INTRODUÇÃO:

Na manufatura de produtos que utilizam madeira como matéria-prima, a classificação da qualidade e a detecção de defeitos geralmente é feita por operadores treinados para essa tarefa. Entretanto, essa abordagem possui diversas desvantagens, como a subjetividade, principalmente devido ao cansaço, por exemplo, depois de realizar a mesma tarefa durante longos períodos. Por isso, pode-se encontrar na literatura estudos que investigam técnicas de aprendizado de máquina (AM) na classificação de defeitos da madeira [1,2].

Porém, as técnicas de AM possuem hiperparâmetros que podem ser ajustados visando melhorar a capacidade de generalização e predição de novos casos apresentados ao modelo gerado. Além disso, ao se trabalhar com imagens deve- se utilizar atributos que as descrevam de forma eficiente, ou seja, convertam as imagens em variáveis representativas com seus respectivos valores.

OBJETIVOS:

O objetivo geral desse trabalho é melhorar o desempenho preditivo de modelos gerados por redes neurais artificiais para o problema de classificação da qualidade da madeira, por meio do ajuste de seus hiperparâmetros e da seleção de atributos que melhor descrevem as imagens das madeiras.

MATERIAL E MÉTODOS:

O conjunto de dados utilizado é composto por 374 exemplos, obtidos de imagens de tábuas de madeira, classificadas em três níveis. Os atributos preditivos das imagens foram extraídos por dois descritores de texturas. A classificação foi realizada por uma rede neural artificial do tipo MultiLayer Perceptron (MLP) treinada com algoritmo backpropagation e momentum, possuindo três hiperparâmetros a serem ajustados: taxa de aprendizagem, momentum e número de neurônios na camada oculta. Para as tarefas de ajuste de hiperparâmetros e seleção de atributos foi utilizada a meta-heurística Particle Swarm Optimization (PSO). A geração da MLP foi baseada no método de validação cruzada estratificada com 10 partições. A avaliação de desempenho foi feita com a métrica de acurácia balanceada (BAC) [3] e o desempenho preditivo da rede MLP otimizada foi comparado com três métodos referência. Foram utilizadas as linguagens R e Python.

RESULTADOS:

Os resultados estão resumidos na Tabela 01, para dez repetições de todos os métodos utilizados.

Tabela 1. Resultados experimentais.

M1 M2 M3 Proposto

Média 0,725 0,860 0,840 0,872 Desvio Padrão 0 0,003 0,004 0,006

Sendo que M1 representa a utilização de todos atributos do conjunto de dados, com os hiperparâmetros padrão da MLP;

M2 utiliza o ajuste dos hiperparâmetros pela PSO com todos os atributos do conjunto de dados; M3 utiliza os hiperparâmetros padrão com a PSO para realizar a seleção de atributos.

DISCUSSÃO:

Da Tabela 1, nota-se a superioridade da rede MLP com a utilização da PSO para ambas as tarefas (BAC de 0,872), com resultado maior que M2 e M3 em 1,2% e 3,2%, respectivamente. Porém, ao realizar o ajuste de hiperparâmetros e a seleção de atributos observa-se a dificuldade do problema, uma vez que a diferença em relação às tarefas isoladas não foi tão grande.

É expressiva e notável a importância de se realizar o ajuste de hiperparâmetros, ao observar M1 e M2, em que a diferença passa de 13%. Do comparativo entre M3 e M1 também se confirma a necessidade de selecionar corretamente os atributos, uma vez que M3 foi 11,5% maior que M1.

Além disso, foi utilizado o teste de Wilcoxon a 95% de confiança, resultando em um p-valor inferior a 0,05 e confirmando haver diferença significativa entre a PSO e os outros métodos de referência para a melhoria de desempenho da rede MLP, no problema de classificação da qualidade da madeira.

REFERÊNCIAS:

[1] Gu, I.; Andersson, H.; Vicen, R. Automatic classification of wood defects using support vector machines. In: Bolc, L.;

Kulikowski, J.; Wojciechowski, K., Computer Vision and Graphics, v. 5337 de Lecture Notes in Computer Science, Springer Berlin Heidelberg, p. 356-367, 2009.

[2] Vieira, F. H. A. Image processing through machine learning for wood quality classification. Tese de Doutoramento, Faculdade de Engenharia de Guaratinguetá (FEG), UNESP, 2016.

[3] Brodersen, K. H.; Ong, C. S.; Stephan, K. E.; Buhmann, J. M. The balanced accuracy and its posterior distribution. In:

2010 20th International Conference on Pattern Recognition, 2010, p. 3121-3124.