• Nenhum resultado encontrado

6.2 Bases de Dados Utilizadas

6.3.1 Critérios de avaliação das soluções candidatas

Nesse trabalho, foram adotados três critérios de avaliação baseados em filtro, ou seja, independentes do algoritmo de classificação que será aplicado a posteriori para a validação da solução. Esses critérios utilizam uma medida de correlação que visa identificar o quão fortemente os atributos estão correlacionados entre si, objetivando encontrar subconjuntos de atributos diversos, ou seja, pouco correlacionados.

A medida de correlação utilizada nesse trabalho foi o coeficiente de correlação de Pe- arson, que mede o grau de correlação e a direção dessa correlação, se positiva ou negativa, entre duas variáveis, no caso, entre dois atributos. O coeficiente de correlação de Pearson pode ser calculado pela seguinte equação, Equação (6.1):

ρ = Pn i=1(xi− ¯x) ∗ (yi− ¯y) q Pn i=1(xi− ¯x)2∗ Pn i=1(yi− ¯y)2 (6.1) Onde,

i é um padrão em um conjunto de n padrões; xi é o valor do atributo x no padrão i;

¯

x é a média do atributo x, dada por:

¯ x =

Pn

i=1xi

n (6.2)

yi é o valor do atributo y no padrão i;

¯

y é a média do atributo y, dada por:

¯ y =

Pn

i=1yi

6.3 A Seleção de Atributos 85 Esse coeficiente assume apenas valores entre -1 e 1, onde:

• ρ = 1 significa uma correlação perfeita positiva entre as duas variáveis;

• ρ = −1 significa uma correlação perfeita negativa entre as duas variáveis, ou seja, se uma aumenta a outra diminui;

• ρ = 0 significa que as duas variáveis não dependem linearmente uma da outra; Pode-se dizer ainda que, considerando os valores positivos ou negativos:

• 0 < |ρ| < 0, 3 significa fraca correlação;

• 0, 3 < |ρ| < 0, 7 significa correlação moderada; • 0, 7 < |ρ| < 1 significa correlação forte.

Dessa forma, para encontrar um subconjunto com atributos pouco correlacionados, deve-se buscar subconjuntos de atributos com coeficientes de correlação mais próximos a 0, não interessando subconjuntos de atributos que possuam coeficientes de correlação muito próximos a 1 ou a -1. Sendo assim, neste trabalho o valor do coeficiente é modularizado já que valores próximo a 1 ou -1 são igualmente indesejáveis, buscando-se minimizar o coeficiente de correlação de Pearson, ou seja, procurando subconjuntos de atributos com coeficientes próximos a 0.

Dos três critérios de avaliação utilizados nesse trabalho dois são mono-objetivo e um é biobjetivo, são eles:

6.3.1.1 Correlação Interclassificadores

A correlação interclassificadores prioriza a diversidade do comitê de classificadores, ou seja, a diversidade entre os classificadores base utilizados para formar o comitê. Isso é feito construindo os classificadores base a partir de subconjuntos de atributos diferentes ou pouco correlacionados. Para isso, as soluções encontradas pelas metaheurísticas serão avaliadas de acordo com a média da correlação interclassificadores. Isso é feito da seguinte forma:

6.3 A Seleção de Atributos 86 O coeficiente de correlação de Pearson é calculado para cada atributo de cada classi- ficador em relação a todos os atributos dos outros classificadores e então feita a média. Esse procedimento pode ser visualizado na Figura 6.1, para o caso de um comitê com três classificadores, C1, C2e C3. Nesse caso, cada atributo de C1 deverá ter seu coeficiente de

correlação calculado para cada atributo dos classificadores C2 e C3, e assim por diante, ou

seja, cada atributo de C2 terá seu coeficiente de correlação calculado para cada atributo de

C3. Não estão presentes nessa figura todas as ligações entre os atributos para não dificultar

o entendimento da ilustração. A média da correlação interclassificadores será então cal- culada e utilizada para avaliar as soluções candidatas. Ao final da execução do algoritmo de busca, a solução que tiver apresentado a menor média de correlação interclassificadores será escolhida.

Figura 6.1: Ilustração do cálculo do coeficiente de correlação interclassificadores

Dessa forma, os atributos selecionados para a construção de um classificador devem ter uma baixa correlação com os atributos selecionados para a construção dos demais classificadores, possibilitando, assim, o aumento da diversidade e consequente aumento da acurácia final do sistema. O Algoritmo 8 apresenta o cálculo da correlação média interclassificadores.

6.3 A Seleção de Atributos 87 Algoritmo 8 Algoritmo simplificado para o cálculo da correlação média interclassificadores

Seja m a quantidade de classificadores do comitê;

Seja n[x] a quantidade de atributos selecionados para o classificador x; contador ← 0;

for i = 0 → m − 1 do for j = i + 1 → m do

for k = 0 → n[i] do for l = 0 → n[j] do

8: Fazer somatório dos coeficientes de correlação de todos os atributos do clas-

sificador i com todos os atributos do classificador j; contador ← contador + 1

end for end for end for end for

Calcular correlação média, dividindo o somatório pelo contador;

6.3.1.2 Correlação Intraclassificadores

A correlação intraclassificadores, por sua vez, prioriza a diversidade interna ao clas- sificador, ou seja, busca atributos diversos para compor um subconjunto. Evitando, dessa forma, a correlação dos dados na construção do classificador.

Nesse caso, o coeficiente de correlação de Pearson é calculado para cada atributo de cada classificador em relação a todos os atributos do mesmo classificador e então feita a média. Esse procedimento pode ser visualizado na Figura 6.2 para um comitê com três classificadores. A média da correlação intraclassificadores será então utilizada para avaliar as soluções candidatas. Ao final da execução do algoritmo de busca, a solução que tiver apresentado a menor média de correlação intraclassificadores será escolhida.

Dessa forma, os atributos selecionados para a construção de um classificador devem ter baixa correlação com os demais atributos selecionados para o mesmo classificador. O Algoritmo 9 apresenta o cálculo da correlação média intraclassificadores.

6.3 A Seleção de Atributos 88

Figura 6.2: Ilustração do cálculo do coeficiente de correlação intraclassificadores

Algoritmo 9 Algoritmo simplificado para o cálculo da correlação média intraclassificadores Seja m a quantidade de classificadores do comitê;

Seja n[x] a quantidade de atributos selecionados para o classificador x; contador ← 0;

for i = 0 → m do

for k = 0 → n[i] − 1 do for l = k + 1 → n[i] do

Fazer somatório dos coeficientes de correlação entre todos os atributos do clas- sificador i;

contador ← contador + 1

9: end for

end for end for

6.3 A Seleção de Atributos 89 6.3.1.3 Correlação Interclassificadores + Intraclassificadores

Já a correlação Inter + Intra procura unir as duas abordagens anteriores, buscando a diversidade interna ao classificador ao mesmo tempo que busca a diversidade entre todos os classificadores base do comitê.

Para isso os dois objetivos anteriores são considerados, efetuando uma busca biobjetivo que deverá retorna um conjunto de soluções não dominadas, ver Seção 4.5. Sendo assim, as soluções candidatas que não forem dominadas por nenhuma outra são retornadas ao final da execução do algoritmo de busca para posterior validação.