• Nenhum resultado encontrado

Como explanado anteriormente, para elaboração de abordagens automatizadas de seleção de atributos se faz necessário a utilização de técnicas computacionais que permitam a automação durante o processo de seleção de atributos. A ideia de automação pode ser aplicada em relação ao processo de escolha de algoritmos de seleção, a escolha de critérios de avaliação de relevância e/ou a definição dinâmica de atributos. No entanto, a grande maioria dos trabalhos existentes na área de seleção de atributos visa a seleção estática, ao invés da automatização do processo. Nesse sentido, os trabalhos relacionados serão apresentados de acordo com as técnicas empregadas para realizar o processo de seleção de atributos, sendo as categorias: fusão de algoritmos de seleção de atributos e seleção dinâmica de atributos e classificadores.

3.1

Fusão de Algoritmos de Seleção de Atributos

Algoritmos de redução de dimensionalidade são técnicas populares utilizadas para re- mover ruídos e atributos redundantes em tarefas de Aprendizado de Máquina, como clas- sificação e agrupamento (CHANDRASHEKAR; SAHIN, 2014; TANG; ALELYANI; LIU, 2014). Como já mencionado, existem duas grandes categorias desses algoritmos: extração e se- leção de atributos (LIU; MOTODA, 2007). Este trabalho restringe os estudos à algoritmos de seleção de atributos.

O principal objetivo de algoritmos de seleção de atributos é encontrar um subconjunto no espaço de atributos que seja capaz de prover uma representação eficiente do conjunto original de dados. Tradicionalmente, os algoritmos de seleção de atributos fazem uso de algumas heurísticas para guiar o processo de busca de atributos que melhor representem o conjunto original de dados. Com isso em mente, diversos trabalhos têm sido propostos como em: (ROGATI; YANG, 2002), (JANECEK et al., 2008), (HONG et al., 2008), (HIRA; GILLIES, 2015), (XUE et al., 2016), (YIJING et al., 2016), (JAFFEL; FARAH, 2018).

analisaram o impacto da utilização de algoritmos de seleção de atributos no desempenho geral de algoritmos de classificação como k-NN, Naive Bayes e SVM para classificação de textos e imagens. Em (HONG et al., 2008), os autores utilizaram algoritmos de agrupamento como forma de definir a relevância dos atributos.

No trabalho desenvolvido em Hira e Gillies (2015), técnicas de redução de dimensiona- lidade foram utilizadas em dados de microarray de alta dimensão com objetivo de auxiliar na análise de expressão gênica. Nesse contexto, foram aplicados três tipos de métodos de seleção de atributos: embutidos, baseados em filtro e baseados em wrapper, com intuito de realizar uma investigação acerca do impacto da utilização de diferentes abordagens de seleção de atributos para encontrar relações complexas entre informações de natureza biológica. Além da aplicação na bioinformática, algoritmos de seleção de atributos têm sido utilizados em outras aplicações do mundo real, como em Jaffel e Farah (2018), onde foi proposto um método de seleção de atributos baseado em um algoritmo de otimização combinatória para o treinamento de redes neurais, onde o principal objetivo era melhorar o desempenho de classificação de imagens de sensoriamento remoto por meio da escolha dos atributos mais relevantes.

Por outro lado, diferente do contexto de aplicações, alguns autores têm investigado formas de tornar o processo de seleção de atributos mais robusto através do uso de técnicas computacionais. Em Xue et al. (2016), foi explorada a aplicação de técnicas de compu- tação evolucionária (CE) na seleção de atributos, tendo como foco a elaboração de um survey, onde foi reunida uma pesquisa sobre o estado da arte acerca dos pontos fortes e fracos da aplicação da CE no campo da seleção de atributos. Em Yijing et al. (2016), os autores aplicaram a técnica de comitês de classificadores com seleção de atributos para classificação de dados desbalanceados. Nesse trabalho, o método proposto foi elaborado para lidar com o aprendizado de dados desbalanceados com múltiplas classes, onde a se- leção de atributos foi utilizada para selecionar os atributos mais relevantes a partir de dados desbalanceados.

No contexto de fusão, propostas como combinar algoritmos de seleção de atributos têm sido utilizadas com sucesso na literatura de reconhecimento de padrões, tais como em: (CHEN; LI, 2010), (PRATI, 2012), (SHEN; DIAO; SU, 2012) e (BIHL; TEMPLE; BAUER, 2016).

Em Chen e Li (2010), os autores propuseram um método de combinação de quatro mé- todos de redução de dimensionalidade (LDA, F-score, Rough sets theory (RST) e Árvore de Decisão) com SVM para uma aplicação de pontuação de crédito. Nessa abordagem,

cada método de seleção é aplicado sobre um conjunto de treinamento, obtendo-se ao final um subconjunto de atributos para cada método, que em seguida são avaliados individu- almente através de um wrapper. A combinação dos seletores de atributos ocorre por meio da escolha dos atributos que causam melhora na acurácia. Após definir o subconjunto de atributos mais relevante, um classificador baseado em SVM é treinado até que haja a otimização dos seus parâmetros de treinamento.

Prati (2012) propôs uma abordagem de combinação baseada na agregação de ran- kings, onde foram utilizados quatro técnicas de ranking: Borda Count, Condorcet, Schulze e Markov Chain (MC4). Nesse trabalho, os atributos são avaliados por seis medidas de relevância (Ganho de Informação, Taxa de Ganho, Incerteza Simétrica, Qui-quadrado, OneR e ReliefF ), e a partir do cálculo da relevância dos atributos são construídos os rankings para definição final da relevância dos atributos, baseada na posição em que se encontram nos rankings. Em comparação com a Fusão de Dados proposta nesta disserta- ção, a principal diferença entre a Fusão de Dados e o método proposto por Prati (2012), consiste na utilização de uma técnica de cálculo da relevância do atributo, proposta nesta dissertação, de acordo com a posição em que o atributo é ranqueado por algoritmos de seleção de atributos, provendo a fusão dos dados advindos de cada seletor de atributos. Diferentemente de Prati (2012), onde os autores fizeram uso rankings e filtros de relevância já propostos em outros trabalhos.

No trabalho proposto em Shen, Diao e Su (2012) é apresentado um método de fusão intitulado de "Feature Selection Ensemble" (FSE). O FSE é um método baseado em co- mitês que tem por objetivo a construção de um grupo de subconjuntos de atributos e, a partir disso, obter a agregação desse grupo. Segundo o autor do trabalho, Shen, Diao e Su (2012), "ao realizar a combinação de diversos subconjuntos de atributos pode remo- ver atributos irrelevantes, resultando em soluções compactas e eficientes". Nesse trabalho foram propostas três abordagens baseadas em FSE: (1) Algoritmo individual de busca estocástica; (2) Algoritmo individual com o Particionamento do Conjunto de Treino e (3) Mistura de Algoritmos. A partir dos FSE’s gerados, também foi desenvolvido um módulo para agregação da decisão, baseado na votação majoritária utilizada em comitês de clas- sificadores. Quando comparado ao FSE, a Fusão de Decisão proposta nesta dissertação, ao invés de criar um comitê de subconjuntos de atributos, utiliza a própria estrutura de comitês de classificadores como meio de fusão da decisão proveniente dos algoritmos de seleção. Dessa forma, nós utilizamos os benefícios da estrutura de comitês de classifica- dores para obter diferentes perspectivas da base dados, dado os subconjuntos de dados previamente reduzidos pelos seletores de atributos. A partir dessa estrutura, asseguramos

que cada classificador seja treinado com os atributos mais relevantes, de acordo com os algoritmos de seleção de atributos utilizados.

3.2

Seleção Dinâmica de Atributos e Classificadores

Por se tratar de um tópico novo na literatura, a seleção dinâmica não apresenta muitos trabalhos desenvolvidos. No entanto, podemos citar um outro viés da seleção dinâmica, a seleção dinâmica de atributos em comitês de classificadores. O único trabalho conhecido sobre a aplicação da seleção dinâmica de atributos no contexto de comitês de classificado- res foi desenvolvido por Nunes, Dantas e Xavier (2018), onde foi realizada uma extensão do trabalho proposto em Nunes et al. (2016), sendo proposto uma abordagem que permitiu o uso de seleção dinâmica de atributos no contexto de comitês de classificadores.

O processo de definição acerca do melhor, ou mais relevante, subconjunto de atributos impacta diretamente na construção de modelos de classificação. A utilização de técnicas robustas para seleção de atributos pode promover aspectos positivos no processamento de dados. Sendo alguns desses aspectos: a redução do custo computacional de criação do modelo de classificação; o aumento da precisão dos modelos gerados; e a promoção da interpretabilidade acerca da relação subjacente dos dados.

Podemos dividir os métodos de seleção de atributos como estáticos e dinâmicos. Na seleção estática de atributos, todo o conjunto de dados é considerado no processo de avaliação da relevância dos atributos, gerando ao final um único subconjunto de atributos para o treinamento do modelo de classificação. Como alternativa à seleção estática de atributos, em Nunes et al. (2016) foi proposto um método de seleção dinâmica de atributos. Segundo Nunes et al. (2016), a seleção dinâmica faz uso de um algoritmo de agrupamento para extrair o melhor subconjunto de atributos para cada partição criada, dessa forma os atributos selecionados podem variar radicalmente, de acordo com as instâncias contidas em cada grupo da partição. Essa abordagem faz uso de um critério de avaliação, neste caso a Correlação de Spearman, para calcular a relevância dos atributos para cada grupo da partição gerada. Além de promover a dinamicidade na avaliação da relevância dos atributos, na fase de teste, as instâncias de teste são associadas ao classificador mais similar através do uso de uma medida de similaridade através de uma métrica de distância, inicialmente utilizando a distância Euclidiana.

No trabalho realizado em Dantas, Nunes e Xavier (2017), os autores realizaram uma investigação acerca da variação do parâmetro da seleção dinâmica referente a medida de

similaridade e distância, com intuito otimizar o parâmetro que causa maior melhora na seleção dinâmica de atributos. Todavia, pouco têm sido feito para elaboração de aborda- gens que sejam capazes de reduzir a dimensionalidade de conjuntos de dados de forma automatizada. A principal diferença entre o método de seleção dinâmica proposto original- mente em Nunes et al. (2016), para o método de seleção dinâmica baseado na fronteira de pareto proposto nesta dissertação, consiste no uso da técnica da fronteira de pareto para permitir a avaliação automática de múltiplos critérios de avaliação de atributos. O uso dessa técnica nos permite estender o método de seleção dinâmica encontrado na literatura, com um processo automatizado para definição acerca de quais e quantos atributos devem ser considerados mais relevantes para cada grupo nas partições geradas pelo algoritmo de agrupamento.

3.3

Considerações Finais

A partir dos trabalhos existentes na literatura, é possível notar que o emprego de téc- nicas de fusão no contexto de seleção de atributos, bem como a utilização de abordagens de seleção de atributos dinâmicas, vem trazendo grandes avanços na captura de relações complexas contida nos dados quando comparados à abordagens de seleção de atributos individuais. De modo geral, os métodos propostos nos trabalhos alcançam desempenho superior quando comparados a abordagens tradicionais. Logo, devido a robustez apresen- tada por esses métodos, a investigação e proposição de novos métodos de fusão e seleção dinâmica de atributos representa uma etapa promissora na área de seleção de atributos.

4

Seleção Automatizada de

Documentos relacionados