M´etodos de Construc¸˜ ao de Ensembles Propostos

Nos métodos de construção de ensembles descritos anteriormente (bagging e boosting), para que sejam obtidas melhores taxas de erro de classificação, são necess ários muitos classificadores para compor o ensemble final, o que di- ficulta bastante a tarefa de interpretação humana do conhecimento embutido nos ensembles de classificadores finais. Entretanto, o método de combinação utilizado por boosting é considerado bastante interessante, por atribuir pesos aos classificadores que compõem o ensemble conforme o comportamento desses classificadores; e o método de construção de ensembles utilizado por bagging é considerado bastante interessante por ser simples. Assim, baseando-se nas teorias de construção de ensembles descritas anteriormente, e utilizando os métodos de construção de ensembles bagging e boosting como inspiração para realizar combinação de classificadores, propomos neste trabalho métodos de construção de ensembles simb ólicos que consistem de uma combinação de métodos de combinação de classificadores e de critérios de classificação de novos exemplos por um classificador. A Figura 4.6 ilustra a maneira proposta nesta seção para construção de ensembles simb ólicos. Nessa figura, deve ser observado que os L algoritmos de aprendizado utilizados para induzir os classificadores podem ser todos distintos ou até o mesmo algoritmo. Ainda, como os L classificadores são convertidos para o formato padrão de regras PBM — Cap´ıtulo 3 —, a tarefa de combinar classificadores provenientes de diferentes algoritmos de aprendizado simb ólico é facilitada.

Assim, dados L classificadores simb ólicos, os quais podem ser induzidos utilizando o mesmo algoritmo de aprendizado ou algoritmos diferentes, e um exemplo x a ser classificado, os métodos de combinação de classificadores que podem ser utilizados são:

Votação sem peso (Unweighted Voting — UV): Cada classificador classifica o exemplo dado. A classificação do ensemble para o exemplo x é dada

4.3 M étodos de Construç ão de Ensembles Propostos

Figura 4.6: Um esquema dos métodos de construção de ensembles propostos

pela classe que mais recebeu votos dos L classificadores.

Votação com peso (Weighted by Mean Voting — WMV e Weighted by Mean and Standard Error Voting — WMSV): O voto de cada classificador é ponderado por algum peso associado a ele. Uma poss´ıvel técnica de votação com peso é a adaptada da técnica de boosting para construção de ensembles (Freund and Schapire, 1997), a qual classifica um exemplo segundo o seguinte algoritmo:

1. Para cada hip ´otese hl, l = 1, ..., L:

(a) Classificar o exemplo x;

(b) O novo valor total de voto (vt) da classe Cv, v = 1, ..., NCl `a qual o

exemplo x pertence ´e dado por

vt(Cv) = L X l=1 f (hl(x), Cv) com f (hl(x), Cv) =    lg((1 − m err(hl))/m err(hl)) se hl(x) = Cv,

0 caso contr ´ario.

à hip ótese que classifica o exemplo na classe Cv — Equação 2.10;

2. Associar ao exemplo x a classe com maior valor total de voto.

Neste trabalho, a taxa de erro associada à hip ótese consiste de uma estimativa da média da taxa de erro verdadeiro, utilizando o método k-fold cross-validation estratificado, descritos na Seção 2.3. Esse método é nomeado Weighted by Mean Voting — WMV. Também, j á que a técnica for- nece mais uma informação além da estimativa da média da taxa de erro verdadeiro das hip óteses — a estimativa do erro padrão (se) — , além de utilizar o critério acima descrito, também utilizamos outro critério, o qual atribui o seguinte peso à decisão da hip ótese: o novo valor total de voto (vt) da classe Cv, v = 1, ..., NCl à qual o exemplo x pertence é dado por

vt(Cv) = L X l=1 g(hl(x), Cv) com g(hl(x), Cv) =        lg((1 − m err(hl))/m err(hl))

+ lg((1 − se err(hl))/se err(hl))

se hl(x) = Cv,

0 caso contr ´ario.

onde m err(hl) é a estimativa da média da taxa de erro e se err(hl) é a

estimativa do erro padrão da taxa de erro — Equação 2.11 — , associados à hip ótese que classifica o exemplo na classe Cv. Esse método é nomeado

Weighted by Mean and Standard Error Voting – WMSV.

Pode-se pensar que em ambas situações, votação com e sem peso, o resultado da classificação de um novo exemplo x é o mesmo. O seguinte exemplo mostra que isso não é necessariamente verdade: dadas 3(três) hip óteses h1, h2 e h3, um exemplo x a ser classificado e as taxas de erro

das hip óteses α1 = 0, 10, α2 = 0, 30e α3 = 0, 30. Supondo que a classificação

para o exemplo x seja C1 segundo a hip ´otese h1 e C2 segundo as hip ´oteses

h2 e h3, caso for utilizado o método de votação sem peso, a classificação

do ensemble para o exemplo x ´e a classe C2; entretanto, se for utilizado o

4.3 M étodos de Construç ão de Ensembles Propostos

valor total de votos para a classe C1:

vt(C1) = lg((1 − m err(h1))/m err(h1)) + 0 + 0

= lg((1 − 0, 1)/0, 1) = 0, 95

valor total de votos para a classe C2:

vt(C2) = 0 + lg 1 − m err(h1) m err(h1) + lg1 − m err(h2) m err(h2) = lg((1 − 0, 3)/0, 3) + lg((1 − 0, 3)/0, 3) = 0, 74

e a classificação do ensemble é a classe C1.

J á em relação ao critério de classificação, dado um exemplo x a ser classificado e um classificador h, podem ser considerados dois critérios para se classificar esse exemplo:

Decisão do pr óprio classificador: O método implementado no algoritmo de aprendizado que induziu o classificador é o respons ável pela classificação do exemplo;

Decisão pela melhor regra do classificador: A “melhor” regra do classifica- dor que cobre o exemplo, segundo alguma medida de avaliação de regra de conhecimento (Apêndice A na p ágina 155), é respons ável pela classificação do exemplo.

Existem diversas medidas de avaliação de regras, como pode ser observado no Apêndice A, que podem ser utilizadas, o que aumenta o n úmero de métodos de construção de ensembles simb ólicos. Para melhor compreender essa afirmação, é necess ário explicitar a maneira que se pretende construir os ensembles simb ólicos. Dados L conjuntos de exemplos S1, ..., SL ⊂ S, pode-se

induzir L classificadores h1, ..., hL. O critério de classificação utilizado por cada

classificador hl para classificar novos exemplos, juntamente com o m´etodo de

combinação para combinar as decisões realizadas pelas hip óteses para fornecer a classificação final desses novos exemplos, caracterizam um ensemble simb ólico h∗_{. Assim, o n ´}_{umero de métodos de construç˜}_{ao de ensembles}

de combinação de classificadores com o n úmero de critérios de classificação considerados.

Como sa´ıda, os métodos aqui propostos fornecem a classificação de um exemplo dado e um conjunto de regras que cobrem esse exemplo. Entretanto, em muitos casos esse conjunto de regras contém regras que são especiali- zações de outras regras. Para facilitar a explicação ao usu ário, foi decidido fornecer como explicação ao usu ário somente as regras mais gerais, por ser essa a explicação sintaticamente mais simples. Assim, na pr óxima seção, é proposto um método para resumir esse conjunto de regras, baseado nas definições descritas na Seção 2.5, relacionadas à especificação e generalização de regras.

4.4 Um Método para Simplificar a Explicação de En-

No documento Combinação de classificadores simbólicos utilizando medidas de regras de conhecimento e algoritmos genéticos (páginas 80-84)