6 Meta-Aprendizado
6.3.2 Caracteriza¸ c˜ ao Baseada em Landmarking
A caracteriza¸c˜ao baseada em landmarking consiste da aplica¸c˜ao de algoritmos simples de classifica¸c˜ao, denominados landmarkers, a CD com o intuito de obter informa¸c˜oes importantes sobre a natureza do dom´ınio ao qual eles s˜ao aplicados. Usualmente, o landmarking ´e utilizado para determinar a proximidade de um CD em rela¸c˜ao a outros, por meio da similaridade de desempenho dos landmarkers (PFAHRINGER; BENSUSAN; GIRAUD-CARRIER, 2000). Os crit´erios utilizados na escolha desses algoritmos est˜ao relacionados com:
• Eficiˆencia computacional: n˜ao ´e aconselh´avel investir em algoritmos complexos para predizer o desempenho de algoritmos mais simples e
• Diversidade: cada landmarker considerado deve gerar um desempenho diferenciado para cada problema analisado.
Dentre os landmarkers mais comuns, destaca-se o Naive Bayes (HAN; KAMBER; PEI,
2011). O desempenho desse algoritmo de aprendizado pode ser interpretado como uma medida de independˆencia entre atributos.
6.3.3 Caracteriza¸c˜ao via Modelos
A caracteriza¸c˜ao via modelos utiliza algoritmos de classifica¸c˜ao para representar os CD. Desse modo, diferentemente da caracteriza¸c˜ao por landmarking, a via modelos n˜ao considera diretamente medidas de desempenho do algoritmo de aprendizado, mas sim a estrutura do pr´oprio classificador, conhecida como hip´otese induzida ou modelo ( BENSU-SAN; GIRAUD-CARRIER; KENNEDY, 2000).
Nesse contexto, m´etodos de indu¸c˜ao de ´arvores de decis˜ao s˜ao comumente empregados para tal tarefa, pois a partir da ´arvore induzida ´e poss´ıvel determinar um conjunto de meta-atributos de entrada como, por exemplo, o n´umero de n´os, o n´umero de n´os folha, a profundidade da ´arvore e a respectiva altura. Ainda, avalia¸c˜oes experimentais mostram que propriedades dos CD podem estar diretamente relacionadas a estruturas de ´arvores de decis˜ao n˜ao podadas (PENG et al., 2002; VILALTA; DRISSI, 2002).
A vantagem da caracteriza¸c˜ao via modelos ´e que o CD pode ser sumarizado por uma estrutura de dados que embute a complexidade e o desempenho do modelo constru´ıdo e n˜ao apenas a distribui¸c˜ao dos dados. Em determinados casos, a representa¸c˜ao obtida
pode ainda ser utilizada para explicar o desempenho do algoritmo em an´alise (VILALTA; DRISSI, 2002).
6.4 Medidas de Avalia¸c˜ao de Desempenho de
Algo-ritmos
As medidas de avalia¸c˜ao de desempenho s˜ao utilizadas para estimar quais algoritmos apresentaram um desempenho melhor que outros (LEE; GIRAUD-CARRIER, 2008; BREI-MAN,1996). Dentre as medidas comumente utilizadas em AM supervisionado destacam-se o desempenho preditivo, a acur´acia, a especificidade e a sensibilidade (HAN; KAMBER; PEI,
2011;ALPAYDIN,2004;MITCHELL,1997). Por´em, nada impede que duas ou mais medidas que avaliem diferentes aspectos possam ser empregadas em conjunto, atribuindo um peso a cada uma delas, definindo uma ordem de importˆancia entre elas ou empregando t´ ecni-cas de otimiza¸c˜ao multiobjetivo (BRAZDIL; SOARES, 2000). Os resultados obtidos com a aplica¸c˜ao dessas medidas podem ser usados para a elabora¸c˜ao de uma lista de preferˆencia pela utiliza¸c˜ao dos algoritmos investigados.
6.5 Maneiras de Sugest˜ao
H´a trˆes abordagens distintas para sugerir algoritmos para a aprecia¸c˜ao do usu´ario ( KA-LOUSIS, 2002). A primeira consiste em fornecer o melhor algoritmo, ou seja, aquele que produza, supostamente, o melhor resultado para uma dada tarefa ou CD, segundo alguma medida de desempenho. A segunda abordagem indica, dentre os algoritmos considerados, o conjunto de algoritmos que apresentaram a melhor estimativa de desempenho no CD. Nesse conjunto, al´em do melhor algoritmo, est˜ao presentes os algoritmos que n˜ao pos-suam desempenho estatisticamente significativo inferior ao melhor. A ´ultima abordagem, denominada de ordena¸c˜ao ou ranking, exibe os algoritmos em ordem de preferˆencia com rela¸c˜ao ao CD. O crit´erio de ordena¸c˜ao pode ser, por exemplo, o desempenho preditivo dos classificadores induzidos, ou ainda, medidas que trabalham com m´ultiplos objetivos.
6.6 M´etodos de Constru¸c˜ao de Sugest˜oes
Os m´etodos de constru¸c˜ao de sugest˜oes permitem explorar o grau de preferˆencia sobre um conjunto de itens (algoritmos) (BRAZDIL et al.,2009;BRAZDIL; SOARES; COSTA,2003). Desse modo, o modelo de recomenda¸c˜ao induzido pode ser tanto um regressor,
denomi-nado meta-regressor, que associa valores reais a um dos algoritmos analisados, quanto um classificador, designado meta-classificador, que possui como classe os algoritmos avaliados. O resultado obtido para um novo CD utilizando um meta-regressor pode ser a esti-mativa do desempenho do algoritmo associado ao meta-regressor para esse novo conjunto. Os resultados gerados pela aplica¸c˜ao do meta-regressor podem ser usados para gerar um ranking dos algoritmos avaliados. Diferentemente, quando um meta-classificador ´e con-siderado, o resultado pode ser a previs˜ao de uma ou mais classes. Quando mais de uma classe puder ser prevista, tem-se um problema de classifica¸c˜ao multirr´otulo (TSOUMAKAS; KATAKIS, 2007).
Recentemente, a pesquisa em MA tem dado enfoque para a elabora¸c˜ao de rankings como m´etodos de constru¸c˜ao de sugest˜oes. Dentre os paradigmas usualmente utilizados para a realiza¸c˜ao de tal tarefa, destacam-se os rankings constru´ıdos por meio de vizinhos mais pr´oximos, por regress˜ao e por ´arvores de decis˜ao (SOUZA,2010;BRAZDIL et al.,2009;
GUERRA; PRUD ˆENCIO; LUDERMIR, 2007; KALOUSIS; GAMA; HILARIO, 2004; PRUD ˆENCIO; LUDERMIR,2004;BRAZDIL; SOARES; COSTA, 2003; BRAZDIL; SOARES, 2000).
6.7 Considera¸c˜oes Finais
No decorrer deste cap´ıtulo foram abordadas algumas das quest˜oes que norteiam o problema da recomenda¸c˜ao de algoritmos utilizando MA. Com base nas quest˜oes for-muladas, foi poss´ıvel observar que o aprendizado no meta n´ıvel ´e realizado por meio da busca por fun¸c˜oes que mapeiam CD em rela¸c˜ao `as medidas de avalia¸c˜ao de desempenho de algoritmos. Portanto, ap´os a caracteriza¸c˜ao dos CD (meta-atributos de entrada) e a avalia¸c˜ao do desempenho dos algoritmos em an´alise (meta-atributos alvo), busca-se en-contrar as correla¸c˜oes existentes entre os meta-atributos de entrada e os meta-atributos alvo. As correla¸c˜oes identificadas constituem o meta-conhecimento, o qual ´e sumarizado pelo meta-modelo de recomenda¸c˜ao de algoritmos.
No pr´oximo cap´ıtulo s˜ao apresentados os m´etodos e ferramentas empregadas na cons-tru¸c˜ao de sistemas de software e escolhidas para auxiliar no planejamento e desenvolvi-mento do M´odulo de Monitoramento de Qualidade de Dados com Assistˆencia Inteligente proposto neste trabalho.