TÍTULO:
Ajuste de Hiperparâmetros de Redes Neurais Artificiais e Seleção de Atributos para o Problema de Classificação de Qualidade da Madeira.
AUTORES:
Mateus Roder; André Luis Debiaso Rossi, Itapeva, C.E. Unesp Itapeva, Engenharia de Produção, mateusroder@hotmail.com, bolsista FAPESP (proc. n° 2018/02822-1).
INTRODUÇÃO:
Na manufatura de produtos que utilizam madeira como matéria-prima, a classificação da qualidade e a detecção de defeitos geralmente é feita por operadores treinados para essa tarefa. Entretanto, essa abordagem possui diversas desvantagens, como a subjetividade, principalmente devido ao cansaço, por exemplo, depois de realizar a mesma tarefa durante longos períodos. Por isso, pode-se encontrar na literatura estudos que investigam técnicas de aprendizado de máquina (AM) na classificação de defeitos da madeira [1,2].
Porém, as técnicas de AM possuem hiperparâmetros que podem ser ajustados visando melhorar a capacidade de generalização e predição de novos casos apresentados ao modelo gerado. Além disso, ao se trabalhar com imagens deve- se utilizar atributos que as descrevam de forma eficiente, ou seja, convertam as imagens em variáveis representativas com seus respectivos valores.
OBJETIVOS:
O objetivo geral desse trabalho é melhorar o desempenho preditivo de modelos gerados por redes neurais artificiais para o problema de classificação da qualidade da madeira, por meio do ajuste de seus hiperparâmetros e da seleção de atributos que melhor descrevem as imagens das madeiras.
MATERIAL E MÉTODOS:
O conjunto de dados utilizado é composto por 374 exemplos, obtidos de imagens de tábuas de madeira, classificadas em três níveis. Os atributos preditivos das imagens foram extraídos por dois descritores de texturas. A classificação foi realizada por uma rede neural artificial do tipo MultiLayer Perceptron (MLP) treinada com algoritmo backpropagation e momentum, possuindo três hiperparâmetros a serem ajustados: taxa de aprendizagem, momentum e número de neurônios na camada oculta. Para as tarefas de ajuste de hiperparâmetros e seleção de atributos foi utilizada a meta-heurística Particle Swarm Optimization (PSO). A geração da MLP foi baseada no método de validação cruzada estratificada com 10 partições. A avaliação de desempenho foi feita com a métrica de acurácia balanceada (BAC) [3] e o desempenho preditivo da rede MLP otimizada foi comparado com três métodos referência. Foram utilizadas as linguagens R e Python.
RESULTADOS:
Os resultados estão resumidos na Tabela 01, para dez repetições de todos os métodos utilizados.
Tabela 1. Resultados experimentais.
M1 M2 M3 Proposto
Média 0,725 0,860 0,840 0,872 Desvio Padrão 0 0,003 0,004 0,006
Sendo que M1 representa a utilização de todos atributos do conjunto de dados, com os hiperparâmetros padrão da MLP;
M2 utiliza o ajuste dos hiperparâmetros pela PSO com todos os atributos do conjunto de dados; M3 utiliza os hiperparâmetros padrão com a PSO para realizar a seleção de atributos.
DISCUSSÃO:
Da Tabela 1, nota-se a superioridade da rede MLP com a utilização da PSO para ambas as tarefas (BAC de 0,872), com resultado maior que M2 e M3 em 1,2% e 3,2%, respectivamente. Porém, ao realizar o ajuste de hiperparâmetros e a seleção de atributos observa-se a dificuldade do problema, uma vez que a diferença em relação às tarefas isoladas não foi tão grande.
É expressiva e notável a importância de se realizar o ajuste de hiperparâmetros, ao observar M1 e M2, em que a diferença passa de 13%. Do comparativo entre M3 e M1 também se confirma a necessidade de selecionar corretamente os atributos, uma vez que M3 foi 11,5% maior que M1.
Além disso, foi utilizado o teste de Wilcoxon a 95% de confiança, resultando em um p-valor inferior a 0,05 e confirmando haver diferença significativa entre a PSO e os outros métodos de referência para a melhoria de desempenho da rede MLP, no problema de classificação da qualidade da madeira.
REFERÊNCIAS:
[1] Gu, I.; Andersson, H.; Vicen, R. Automatic classification of wood defects using support vector machines. In: Bolc, L.;
Kulikowski, J.; Wojciechowski, K., Computer Vision and Graphics, v. 5337 de Lecture Notes in Computer Science, Springer Berlin Heidelberg, p. 356-367, 2009.
[2] Vieira, F. H. A. Image processing through machine learning for wood quality classification. Tese de Doutoramento, Faculdade de Engenharia de Guaratinguetá (FEG), UNESP, 2016.
[3] Brodersen, K. H.; Ong, C. S.; Stephan, K. E.; Buhmann, J. M. The balanced accuracy and its posterior distribution. In:
2010 20th International Conference on Pattern Recognition, 2010, p. 3121-3124.