Software WEKA e classificadores utilizados

FUNDAMENTAÇÃO TEÓRICA

2.5.1. Software WEKA e classificadores utilizados

O software WEKA consiste em um ambiente computacional de domínio público e é composto de diversos algoritmos de aprendizado de máquina específicos para tarefas de MD. O WEKA foi desenvolvido pela Universidade de Waikato, na Nova Zelândia. Os algoritmos disponíveis nesse ambiente foram implementados em linguagem Java, e os códigos são abertos (WITTEN e FRANK, 2005; BOUCKAERT et al., 2010).

Com relação aos algoritmos de classificação utilizados, o algoritmo de classificação NB emprega o teorema desenvolvido no século XVIII pelo clérigo Inglês Thomas Bayes. Esse teorema trata de probabilidade e teoria da decisão e emprega o conceito de probabilidade condicional para previsão de eventos (WITTEN e FRANK, 2005; HAN et al., 2012). O classificador NB assume os atributos utilizados para uma dada classe como independentes (class-conditional independence) de modo a simplificar e agilizar os processamentos e cálculos envolvidos na classificação. Por causa dessa característica, é denominado de naive. Esse classificador apresenta bom desempenho se os atributos forem independentes e pode ser tão preciso quanto as ADs e algumas redes neurais. Além disso, apresenta flexibilidade para tratar de ausência de dados numéricos (WITTEN e FRANK, 2005; HAN et al., 2012).

A AD J48 consiste em uma representação gráfica computacional aplicada a tarefas interativas e iterativas de aprendizado de máquina e emprega diferentes conjuntos de dados e instâncias independentes. Ela utiliza a abordagem “dividir-e-conquistar” (divide-and-conquer), também denominada de indução top-down (de cima para baixo) das ADs (WITTEN e FRANK, 2005).

Uma AD é constituída de nós, nós-folhas e ramos. Os nós testam atributos de instâncias que geralmente são comparados com determinadas constantes. Nós-folhas se encontram nas extremidades de uma AD e são responsáveis por atribuir classes a todas as instâncias que alcançam as folhas. A seleção dos atributos e seus limiares para a divisão dos ramos fundamenta-se no cálculo do ganho de informação ou entropia. O atributo que apresentar maior valor de ganho ou entropia será utilizado na divisão do ramo (SILVA et al., 2008; SHARMA et al., 2013). Conforme já destacado, no software WEKA 3.8, está disponível o algoritmo AD J48, o qual consiste na recodificação em linguagem Java do indutor C4.5, originalmente escrito em linguagem C (BOUCKAERT et al., 2010).

O RF é um classificador do tipo ensemble (de conjunto) e bagging (ensacamento). Ensemble porque reúne e emprega um conjunto de classificadores do tipo Classification and Regression Trees (Árvores de Regressão e Classificação - CART) e realiza diversas classificações. Bagging porque as árvores são criadas a partir de subconjuntos do mesmo conjunto amostral, com reposição. Os usuários devem previamente definir o número de atributos e o número de árvores. Cada árvore realiza sua classificação e, ao final, a cada instância, será atribuída a respectiva classe com o maior número de votos oriundos de cada árvore (BELGIU e DRAGUT, 2016).

Por sua vez, um perceptron é um tipo de rede neural artificial que consiste em um hiperplano contido em um espaço de instâncias. Inspirado no funcionamento do cérebro humano, o algoritmo MLP emprega uma grande quantidade de neurônios artificiais interconectados de forma a decompor problemas complexos em problemas menores. Esses problemas menores são solucionados no nível do neurônio artificial, que corresponde a uma unidade de processamento virtual (WITTEN e FRANK, 2005).

As redes neurais artificiais são constituídas de uma camada de entrada, nenhuma, uma ou várias camadas escondidas e uma camada de saída. Segundo Witten e Frank (2005), o grande desafio está no aprendizado, ou seja, no treinamento da estrutura artificial de neurônios, o que inclui o ajuste iterativo dos pesos dos nós entre as camadas internas. O algoritmo MLP utiliza o método backpropagation (retropropagação) para treinamento da rede. A partir dos resultados da camada de saída, esse método calcula os erros e ajusta os pesos dos nós em cada neurônio artificial. Esse ajuste é feito com base no algoritmo de otimização gradient descent (gradiente descendente) que emprega funções sigmoidais (KASPERCZUK e DARDZIŃSKA, 2016).

SVMs são algoritmos de classificação que têm a capacidade de gerar variados hiperplanos e, por conseguinte, separações não-lineares em um espaço multidimensional de atributos. O algoritmo SVM emprega um modelo linear que busca o hiperplano marginal máximo, de modo a encontrar a melhor separação possível entre instâncias. As instâncias mais próximas ao hiperplano marginal máximo são denominadas de support vectors (vetores de suporte). Para a construção de hiperplanos não-lineares, os SVMs utilizam funções kernel (polinomial, gaussiana e sigmoidal) para transformar um espaço de atributos linear para outro não-linear. O algoritmo SMO é utilizado para o treinamento, sendo responsável pela resolução do problema de programação quadrática que surge ao se utilizar SVMs (WITTEN e FRANK, 2005; HAN et al., 2012).

REFERÊNCIAS

BELGIU, M.; DRĂGUŢ, L. Random forest in remote sensing: A review of applications and future directions. ISPRS Journal of Photogrammetry and Remote Sensing, v. 114, p. 24–31, 2016.

BOUCKAERT, R. R.; FRANK, E.; HALL, M. A.; HOLMES, G.; PFAHRINGER, B.; REUTEMANN, P.; WITTEN, I. H. WEKA - experiences with a Java open-source project. Journal of Machine Learning Research, v. 11, p. 2533–2541, 2010.

CLOUDE, S. R.; POTTIER, E. A review of target decomposition theorems in radar polarimetry. IEEE Transactions on Geoscience and Remote Sensing, v. 34, n. 2, p. 498–518, 1996.

CLOUDE, S. R.; POTTIER, E. An entropy based classification scheme for land applications of polarimetric SAR. IEEE Transactions on Geoscience Remote Sensing, v. 35, n. 1, p. 68–78, 1997.

EMBRAPA. Empresa Brasileira de Pesquisa Agropecuária. As principais fitofisionomias do Cerrado. 2018. Disponível em: <https://www.embrapa.br/cerrados/colecao-entomologica/bioma-cerrado>. Acesso em: 14 ago. 2018.

FREEMAN, A.; DURDEN, S. L. A three-component scattering model for polarimetric SAR Data. IEEE Transactions on Geoscience and Remote Sensing, v. 36, n. 3, p. 963–973, 1998.

HAN, J.; KAMBER, M.; PEI, J. Data Mining: Concepts and Techniques. 3a_ed.,

Whaltan: Elsevier, 2012. 744 p.

HSU, W.; LEE, M. L.; ZHANG, J. Image mining: trends and developments. Journal of Intelligent Information Systems, v. 19, n. 1, p. 7–23, 2002.

HELLMANN, M. P. SAR polarimetry tutorial. Rennes: University of Rennes, 2001. 109 p. Disponível em: <http://epsilon.nought.de/>. Acesso em: 01 fev. 2017.

KASPERCZUK, A.; DARDZIŃSKA, A. Comparative evaluation of the different data mining techniques used for the medical database. Acta Mechanica et Automatica, v. 10, n. 3, p. 233–238, 2016.

LEE, J.; GRUNES, M. R. Classification of multilook polarimetric SAR imagery based on the complex Wishart distribution. International Journal of Remote Sensing, v. 15, n.11, p. 2.299-2.311, 1994.

LEE, J.; POTTIER, E. Polarimetric Radar Imaging: from Basics to Applications. Nova York: CRC Press, 2009, 398 p.

LEWIS, A. J.; HENDERSON, F. M. Radar fundamentals: the geoscience perspective. In: HENDERSON, F. M.; LEWIS, A. J. Manual of Remote Sensing: Principles and

Applications of Imaging Radars. 3a ed., Nova York: John Wiley & Sons, p. 131–181, 1998.

OUCHI, K. Recent trend and advance of synthetic aperture radar with selected topics. Remote Sensing, v. 5, n. 2, p. 716–807, 2013.

REIGBER, A. Synthetic Aperture Radar: Basic Concepts and Image. Rennes: University of Rennes, 2001. Disponível em: <http://epsilon.nought.de/>. Acesso em: 05 nov. 2016.

RIBEIRO, J. F.; WALTER, B. M. T. As principais fito-fisionomias do Cerrado. In: SANO, S. M.; ALMEIDA, S. P.; RIBEIRO, J. F. (Eds.). Cerrado: Ecologia e Flora, Planaltina: Embrapa Cerrados, 2008, p. 151–199.

RICHARDS, J. A. Remote Sensing with Imaging Radar. Berlim: Springer, 2009. 361 p.

SANO, E. E.; ROSA, R.; BRITO, J. L. S.; FERREIRA, L. G. Land cover mapping of the tropical savanna region in Brazil. Environmental Monitoring and Assessment, v. 166, p. 116–124, 2010.

SILVA, M. P. S.; CÂMARA, G.; ESCADA, M. I. S.; SOUZA, R. C. M. Remote- sensing image mining: Detecting agents of land-use change in tropical forest areas. International Journal of Remote Sensing, v. 29, n. 16, p. 4803–4822, 2008.

SHARMA, R.; GHOSH, A.; JOSHI, P. K. Decision tree approach for classification of remotely sensed satellite data using open source support. Journal of Earth System Science, v. 122, n. 5, p. 1237–1247, 2013.

VAN DER SANDEN, J. J. Radar remote sensing to support tropical forest management (tese de doutorado em Agronomia), 1997, Wageningen: Wageningen Agricultural University, 1997, 330 p.

VAN ZYL, J. J. Unsupervised classification of scattering behavior using radar polarimetry data. IEEE Transactions on Geoscience Remote Sensing, v. 27, n. 1, p. 36–45, 1989.

WITTEN, I. H.; FRANK, E. Data Mining: Practical Machine Learning. Tools and Techniques. 2a_{ed., San Francisco: Morgan Kaufmann, 2005, 560 p.}

YAMAGUCHI, Y.; MORIYAMA, T.; ISHIDO, M.; YAMADA, H. Four-component scattering model for polarimetric SAR image decomposition. IEEE Transactions on Geoscience Remote Sensing, v. 43, n. 8, p. 1699–1706, 2005.

CAPÍTULO 3 _____________________________________________________________________ ARTIGO 1

TÉCNICAS DE MINERAÇÃO DE DADOS APLICADAS ÀS IMAGENS DO

No documento Avaliação de imagens polarimétricas do sensor ALOS-2/PALSAR-2 e de técnicas de mineração de dados na classificação de uso e cobertura de terras do Cerrado (páginas 54-58)