Classes Sobrepostas - An´ alise dos resultados dos Experimentos Monte Carlo

6.2 An´ alise dos resultados dos Experimentos Monte Carlo

6.2.2 Classes Sobrepostas

As Tabelas 14, 15 e 16 apresentam os valores m´edios e desvios-padr˜ao do ´ındice CR para os oito algoritmos em estudo, cada um sendo executado com cada uma das nove medidas de dissimilaridade discutidas no Cap´ıtulo 4.

Como esperado, os valores médios de CR foram inferiores aos obtidos para as bases de dados com classes bem separadas. Fixando a medida de dissimilaridade e analisando os resultados obtidos pelos diferentes algoritmos de agrupamento, é poss´ıvel perceber que o DCLUST, único algoritmo de particionamento r´ıgido considerado, apresentou resultados estatisticamente inferiores aos demais na maioria das configura¸cões.

DIST1 DIST21 DIST22 DIST23 DIST24 DIST25 DIST3 DIST4 DIST5

DCLUST 0,45 0,433 0,416 0,43 0,427 0,407 0,377 0,436 0,381 (0,199) (0,129) (0,109) (0,133) (0,213 ) (0,099) (0,124) (0,219) (0,111) FNM 0,751 0,752 0,796 0,751 0,798 0,825 0,646 0,618 0,63 (0,141) (0,147) (0,125) (0,135) (0,062 ) (0,125) (0,01) (0,009) (0,012) FAP 0,666 0,705 0,694 0,63 0,677 0,68 0,558 0,536 0,517 (0,101) (0,108) (0,112) (0,113) (0,128 ) (0,122) (0,053) (0,114) (0,081) RFCM 0,615 0,641 0,612 0,632 0,637 0,63 0,449 0,432 0,426 (0,08) (0,138) (0,085) (0,048) (0,136 ) (0,078) (0,123) (0,093) (0,102) NERFCM 0,638 0,646 0,658 0,628 0,596 0,661 0,43 0,449 0,427 (0,108) (0,134) (0,126) (0,144) (0,096 ) (0,137) (0,092) (0,135) (0,098) FANNY 0,823 0,846 0,826 0,825 0,831 0,83 0,753 0,751 0,757 (0,105) (0,098) (0,041) (0,12) (0,05 ) (0,042) (0,005) (0,006) (0,018) CARDN 0,684 0,687 0,655 0,683 0,666 0,706 0,536 0,574 0,583 (0,124) (0,115) (0,104) (0,117) (0,126 ) (0,108) (0,163) (0,148) (0,152) CARDF 0,586 0,579 0,551 0,532 0,557 0,564 0,526 0,538 0,53 (0,151) (0,151) (0,166) (0,157) (0,155 ) (0,153) (0,165) (0,168) (0,168)

Tabela 14: ´Indice de Rand Corrigido para classes sobrepostas com γ1 e γ2 ∈ [1; 8].

DIST1 DIST21 DIST22 DIST23 DIST24 DIST25 DIST3 DIST4 DIST5

DCLUST 0,384 0,435 0,392 0,387 0,379 0,379 0,436 0,41 0,437 (0,055) (0,127) (0,07) (0,029) (0,064 ) (0,047) (0,107) (0,122) (0,108) FNM 0,69 0,69 0,728 0,655 0,724 0,742 0,456 0,331 0,38 (0,016) (0,015) (0,026) (0,04) (0,068 ) (0,038) (0,093) (0,159) (0,129) FAP 0,642 0,616 0,629 0,643 0,609 0,619 0,504 0,487 0,493 (0,116) (0,08) (0,073) (0,063) (0,105 ) (0,079) (0,154) (0,117) (0,089) RFCM 0,635 0,653 0,603 0,626 0,616 0,617 0,484 0,522 0,532 (0,142) (0,134) (0,088) (0,081) (0,099 ) (0,148) (0,078) (0,103) (0,073) NERFCM 0,608 0,631 0,595 0,617 0,6 0,614 0,481 0,501 0,489 (0,078) (0,135) (0,106) (0,081) (0,099 ) (0,126) (0,088) (0,099) (0,075) FANNY 0,622 0,564 0,66 0,751 0,607 0,604 0,734 0,772 0,774 (0,041) (0,064) (0,176) (0,078) (0,199 ) (0,199) (0,042) (0,092) (0,072) CARDN 0,663 0,665 0,625 0,611 0,654 0,644 0,586 0,638 0,614 (0,127) (0,127) (0,093) (0,151) (0,129 ) (0,111) (0,155) (0,144) (0,158) CARDF 0,573 0,575 0,576 0,422 0,467 0,46 0,541 0,578 0,558 (0,152) (0,162) (0,158) (0,132) (0,122 ) (0,172) (0,157) (0,162) (0,16)

6.2 An´alise dos resultados dos Experimentos Monte Carlo 89

DIST1 DIST21 DIST22 DIST23 DIST24 DIST25 DIST3 DIST4 DIST5

DCLUST 0,381 0,335 0,328 0,317 0,331 0,343 0,341 0,341 0,348 (0,044) (0,036) (0,029) (0,032) (0,028 ) (0,039) (0,036) (0,052) (0,063) FNM 0,688 0,697 0,724 0,612 0,703 0,739 0,63 0,604 0,47 (0,017) (0,01) (0,012) (0,018) (0,023 ) (0,014) (0,019) (0,012) (0,102) FAP 0,498 0,513 0,491 0,495 0,497 0,497 0,428 0,448 0,444 (0,06) (0,051) (0,044) (0,064) (0,059 ) (0,056) (0,044) (0,059) (0,024) RFCM 0,519 0,494 0,511 0,486 0,511 0,524 0,444 0,502 0,484 (0,052) (0,034) (0,074) (0,046) (0,055 ) (0,058) (0,047) (0,076) (0,048) NERFCM 0,499 0,521 0,531 0,502 0,504 0,5 0,443 0,48 0,45 (0,042) (0,039) (0,056) (0,062) (0,05 ) (0,064) (0,059) (0,05) (0,048) FANNY 0,756 0,688 0,304 0,77 0,26 0,249 0,761 0,541 0,754 (0,043) (0,063) (0,026) (0,04) (0,008 ) (0,012) (0,045) (0,076) (0,066) CARDN 0,537 0,513 0,533 0,453 0,506 0,539 0,474 0,545 0,528 (0,026) (0,032) (0,049) (0,039) (0,042 ) (0,048) (0,035) (0,038) (0,04) CARDF 0,455 0,446 0,435 0,388 0,386 0,4 0,43 0,536 0,483 (0,035) (0,02) (0,025) (0,047) (0,028 ) (0,038) (0,02) (0,039) (0,038)

Tabela 16: ´Indice de Rand Corrigido para classes sobrepostas com γ1 e γ2 ∈ [1; 40].

As Figuras 25, 26, 27 e 28 apresentam os intervalos de confian¸ca gerados a partir das médias de CR e desvios-padrão para a configura¸cão de classes sobrepostas com γ1 e

γ2 ∈ [1; 8] (Tabela 14).

O algoritmo DCLUST (Figura 25(a)) obteve resultados estatisticamente inferiores aos obtidos pelos demais algoritmos. Do ponto de vista das medidas de dissimilaridade, n˜ao houve diferen¸cas estatisticamente significativas de desempenho entre elas.

Para o FNM (Figura 25(b)), os melhores resultados foram obtidos com as medidas DIST22, DIST24 e DIST25. J´a as medidas DIST3, DIST4 e DIST5 apresentaram desempenho inferior `as demais.

Com FAP (Figura 26(a)), RFCM (Figura 26(b)), NERFCM (Figura 27(a)) e FANNY (Figura 27(b)) as medidas DIST3, DIST4 e DIST5 foram estatisticamente inferiores `as demais. Entre as demais medidas, n˜ao houve diferen¸cas significativas de desempenho.

Os resultados obtidos pelos algoritmos que utilizam a abordagem CARD (CARDN e CARDF - Figuras 28(a) e 28(b), respectivamente) n˜ao superaram os resultados obtidos pelas vers˜oes originais do algoritmos (NERFCM e FANNY).

6.2 An´alise dos resultados dos Experimentos Monte Carlo 90

(a) DCLUST

(b) FNM

Figura 25: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 8] - Algorit-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 91

(a) FAP

(b) RFCM

Figura 26: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 8] - Algorit-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 92

(a) NERFCM

(b) FANNY

Figura 27: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 8] - Algorit-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 93

(a) CARDN

(b) CARDF

Figura 28: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 8] - Algorit-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 94

As Figuras 29, 30, 31 e 32 apresentam os intervalos de confian¸ca gerados a partir das médias de CR e desvios-padrão para a configura¸cão de classes sobrepostas com γ1 e

γ2 ∈ [1; 24] (Tabela 15).

Analisando o desempenho o algoritmo DCLUST (Figura 29(a)), observa-se que as dissimilaridades DIST21, DIST3, DIST4 e DIST5 apresentaram desempenho estatisticamente superior `as demais medidas.

Para o algoritmo FNM (Figura 29(b)), a medida DIST25 apresentou o melhor resultado, sendo estat´ısticamente superior aos demais. As medidas DIST3, DIST4 e DIST5 apresentaram resultados inferiores aos das outras medidas.

Com algoritmo FAP (Figura 30(a)), novamente, as medidas DIST3, DIST4 e DIST5 apresentaram resultados inferiores aos das outras medidas. Entre as demais, n˜ao houve diferen¸cas de desempenho estatisticamente relevantes. O mesmo ocorreu aos algoritmos RFCM (Figura 30(b)) e NERFCM (Figura 31(a)).

O algoritmo FANNY (Figura 31(b)) obteve melhores resultado, em termos de intervalos de confian¸ca, com as medidas DIST23, DIST3, DIST4 e DIST5.

Os resultados obtidos por CARDN (Figura 32(a)) e CARDF (Figura 32(b)) não superaram os resultados obtidos por suas versões originais (NERFCM e FANNY). Além disso, para esses algoritmos não houve diferen¸cas estatisticamente relevantes entre os desempe- nhos das medidas de dissimilaridades estudadas.

6.2 An´alise dos resultados dos Experimentos Monte Carlo 95

(a) DCLUST

(b) FNM

Figura 29: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 24] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 96

(a) FAP

(b) RFCM

Figura 30: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 24] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 97

(a) NERFCM

(b) FANNY

Figura 31: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 24] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 98

(a) CARDN

(b) CARDF

Figura 32: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 24] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 99

As Figuras 33, 34, 35 e 36 apresentam os intervalos de confian¸ca gerados a partir das médias de CR e desvios-padrão para a configura¸cão de classes sobrepostas com γ1 e

γ2 ∈ [1; 40] (Tabela 16).

Com o algoritmo DCLUST (Figura 33(a)), os melhores resultados, em termos de intervalo de confian¸ca, foram obtidos com as medidas DIST1. Importante ressaltar que os resultados do DCLUST foram inferiores aos resultados obtidos pelos demais algoritmos.

Para FNM (Figura 33(b)), o melhor resultado, com significˆancia estat´ıstica, foi obtido com DIST25. As medidas DIST23, DIST3, DIST4 e DIST5 obtiveram resultados inferiores aos das demais medidas.

Para o FAP (Figura 34(a)), mais uma vez, as medidas de dissimilaridade DIST3, DIST4 e DIST5 obtiveram resultados estatisticamente inferiores aos das demais medidas. Com o algoritmo RFCM (Figura 34(b)), a medida DIST3 obteve resultados estatisticamente inferiores aos demais. Já com o NERFCM (Figura 35(a)), as configura¸cões utilizando DIST3 e DIST5 obtiveram resultados inferiores, de acordo com a análise de seus intervalos de confian¸ca, às demais configura¸cões.

O FANNY (Figura 35(b)) obteve seus melhores resultados com as medidas DIST1, DIST23, DIST3 e DIST5. J´a as medidas DIST22, DIST24 e DIST25, apresentaram resultados inferiores aos das demais medidas.

Os resultados obtidos por CARDN (Figura 36(a)) e CARDF (Figura 36(b)) não superaram os resultados obtidos por suas versões originais (NERFCM e FANNY). Para CARDN, os melhores resultados foram obtidos por DIST1, DIST22, DIST25, DIST4 e DIST5. Já para o CARDF, o desempenho da medida DIST4 foi estatisticamente superior aos demais.

6.2 An´alise dos resultados dos Experimentos Monte Carlo 100

(a) DCLUST

(b) FNM

Figura 33: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 40] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 101

(a) FAP

(b) RFCM

Figura 34: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 40] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 102

(a) NERFCM

(b) FANNY

Figura 35: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 40] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 103

(a) CARDN

(b) CARDF

Figura 36: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 40] - Algo-

No documento Metodos de Agrupamento de Dados Simbolicos Baseados em funções de Dissimilaridades (páginas 104-120)