Caracteriza¸ c˜ ao Baseada em Landmarking

6 Meta-Aprendizado

6.3.2 Caracteriza¸ c˜ ao Baseada em Landmarking

A caracteriza¸cão baseada em landmarking consiste da aplica¸cão de algoritmos simples de classifica¸cão, denominados landmarkers, a CD com o intuito de obter informa¸cões importantes sobre a natureza do dom´ınio ao qual eles são aplicados. Usualmente, o landmarking é utilizado para determinar a proximidade de um CD em rela¸cão a outros, por meio da similaridade de desempenho dos landmarkers (PFAHRINGER; BENSUSAN; GIRAUD-CARRIER, 2000). Os critérios utilizados na escolha desses algoritmos estão relacionados com:

• Eficiência computacional: não é aconselhável investir em algoritmos complexos para predizer o desempenho de algoritmos mais simples e

• Diversidade: cada landmarker considerado deve gerar um desempenho diferenciado para cada problema analisado.

Dentre os landmarkers mais comuns, destaca-se o Naive Bayes (HAN; KAMBER; PEI,

2011). O desempenho desse algoritmo de aprendizado pode ser interpretado como uma medida de independˆencia entre atributos.

6.3.3 Caracteriza¸c˜ao via Modelos

A caracteriza¸cão via modelos utiliza algoritmos de classifica¸cão para representar os CD. Desse modo, diferentemente da caracteriza¸cão por landmarking, a via modelos não considera diretamente medidas de desempenho do algoritmo de aprendizado, mas sim a estrutura do próprio classificador, conhecida como hipótese induzida ou modelo ( BENSU-SAN; GIRAUD-CARRIER; KENNEDY, 2000).

Nesse contexto, métodos de indu¸cão de árvores de decisão são comumente empregados para tal tarefa, pois a partir da árvore induzida é poss´ıvel determinar um conjunto de meta-atributos de entrada como, por exemplo, o número de nós, o número de nós folha, a profundidade da árvore e a respectiva altura. Ainda, avalia¸cões experimentais mostram que propriedades dos CD podem estar diretamente relacionadas a estruturas de árvores de decisão não podadas (PENG et al., 2002; VILALTA; DRISSI, 2002).

A vantagem da caracteriza¸cão via modelos é que o CD pode ser sumarizado por uma estrutura de dados que embute a complexidade e o desempenho do modelo constru´ıdo e não apenas a distribui¸cão dos dados. Em determinados casos, a representa¸cão obtida

pode ainda ser utilizada para explicar o desempenho do algoritmo em an´alise (VILALTA; DRISSI, 2002).

6.4 Medidas de Avalia¸c˜ao de Desempenho de

Algo-ritmos

As medidas de avalia¸cão de desempenho são utilizadas para estimar quais algoritmos apresentaram um desempenho melhor que outros (LEE; GIRAUD-CARRIER, 2008; BREI-MAN,1996). Dentre as medidas comumente utilizadas em AM supervisionado destacam-se o desempenho preditivo, a acurácia, a especificidade e a sensibilidade (HAN; KAMBER; PEI,

2011;ALPAYDIN,2004;MITCHELL,1997). Porém, nada impede que duas ou mais medidas que avaliem diferentes aspectos possam ser empregadas em conjunto, atribuindo um peso a cada uma delas, definindo uma ordem de importância entre elas ou empregando t´ ecni-cas de otimiza¸cão multiobjetivo (BRAZDIL; SOARES, 2000). Os resultados obtidos com a aplica¸cão dessas medidas podem ser usados para a elabora¸cão de uma lista de preferência pela utiliza¸cão dos algoritmos investigados.

6.5 Maneiras de Sugest˜ao

Há três abordagens distintas para sugerir algoritmos para a aprecia¸cão do usuário ( KA-LOUSIS, 2002). A primeira consiste em fornecer o melhor algoritmo, ou seja, aquele que produza, supostamente, o melhor resultado para uma dada tarefa ou CD, segundo alguma medida de desempenho. A segunda abordagem indica, dentre os algoritmos considerados, o conjunto de algoritmos que apresentaram a melhor estimativa de desempenho no CD. Nesse conjunto, além do melhor algoritmo, estão presentes os algoritmos que não pos-suam desempenho estatisticamente significativo inferior ao melhor. A última abordagem, denominada de ordena¸cão ou ranking, exibe os algoritmos em ordem de preferência com rela¸cão ao CD. O critério de ordena¸cão pode ser, por exemplo, o desempenho preditivo dos classificadores induzidos, ou ainda, medidas que trabalham com múltiplos objetivos.

6.6 Métodos de Constru¸cão de Sugestões

Os métodos de constru¸cão de sugestões permitem explorar o grau de preferência sobre um conjunto de itens (algoritmos) (BRAZDIL et al.,2009;BRAZDIL; SOARES; COSTA,2003). Desse modo, o modelo de recomenda¸cão induzido pode ser tanto um regressor,

denomi-nado meta-regressor, que associa valores reais a um dos algoritmos analisados, quanto um classificador, designado meta-classificador, que possui como classe os algoritmos avaliados. O resultado obtido para um novo CD utilizando um meta-regressor pode ser a esti-mativa do desempenho do algoritmo associado ao meta-regressor para esse novo conjunto. Os resultados gerados pela aplica¸cão do meta-regressor podem ser usados para gerar um ranking dos algoritmos avaliados. Diferentemente, quando um meta-classificador é con-siderado, o resultado pode ser a previsão de uma ou mais classes. Quando mais de uma classe puder ser prevista, tem-se um problema de classifica¸cão multirrótulo (TSOUMAKAS; KATAKIS, 2007).

Recentemente, a pesquisa em MA tem dado enfoque para a elabora¸cão de rankings como métodos de constru¸cão de sugestões. Dentre os paradigmas usualmente utilizados para a realiza¸cão de tal tarefa, destacam-se os rankings constru´ıdos por meio de vizinhos mais próximos, por regressão e por árvores de decisão (SOUZA,2010;BRAZDIL et al.,2009;

GUERRA; PRUD ˆENCIO; LUDERMIR, 2007; KALOUSIS; GAMA; HILARIO, 2004; PRUD ˆENCIO; LUDERMIR,2004;BRAZDIL; SOARES; COSTA, 2003; BRAZDIL; SOARES, 2000).

6.7 Considera¸c˜oes Finais

No decorrer deste cap´ıtulo foram abordadas algumas das questões que norteiam o problema da recomenda¸cão de algoritmos utilizando MA. Com base nas questões for-muladas, foi poss´ıvel observar que o aprendizado no meta n´ıvel é realizado por meio da busca por fun¸cões que mapeiam CD em rela¸cão às medidas de avalia¸cão de desempenho de algoritmos. Portanto, após a caracteriza¸cão dos CD (meta-atributos de entrada) e a avalia¸cão do desempenho dos algoritmos em análise (meta-atributos alvo), busca-se en-contrar as correla¸cões existentes entre os meta-atributos de entrada e os meta-atributos alvo. As correla¸cões identificadas constituem o meta-conhecimento, o qual é sumarizado pelo meta-modelo de recomenda¸cão de algoritmos.

No próximo cap´ıtulo são apresentados os métodos e ferramentas empregadas na cons-tru¸cão de sistemas de software e escolhidas para auxiliar no planejamento e desenvolvi-mento do Módulo de Monitoramento de Qualidade de Dados com Assistência Inteligente proposto neste trabalho.

7 Desenvolvimento de Sistemas

No documento UNIOESTE - UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CAMPUS DE FOZ DO IGUAÇU (páginas 73-76)