• Nenhum resultado encontrado

6.2 An´ alise dos resultados dos Experimentos Monte Carlo

6.2.2 Classes Sobrepostas

As Tabelas 14, 15 e 16 apresentam os valores m´edios e desvios-padr˜ao do ´ındice CR para os oito algoritmos em estudo, cada um sendo executado com cada uma das nove medidas de dissimilaridade discutidas no Cap´ıtulo 4.

Como esperado, os valores m´edios de CR foram inferiores aos obtidos para as bases de dados com classes bem separadas. Fixando a medida de dissimilaridade e analisando os resultados obtidos pelos diferentes algoritmos de agrupamento, ´e poss´ıvel perceber que o DCLUST, ´unico algoritmo de particionamento r´ıgido considerado, apresentou resultados estatisticamente inferiores aos demais na maioria das configura¸c˜oes.

DIST1 DIST21 DIST22 DIST23 DIST24 DIST25 DIST3 DIST4 DIST5

DCLUST 0,45 0,433 0,416 0,43 0,427 0,407 0,377 0,436 0,381 (0,199) (0,129) (0,109) (0,133) (0,213 ) (0,099) (0,124) (0,219) (0,111) FNM 0,751 0,752 0,796 0,751 0,798 0,825 0,646 0,618 0,63 (0,141) (0,147) (0,125) (0,135) (0,062 ) (0,125) (0,01) (0,009) (0,012) FAP 0,666 0,705 0,694 0,63 0,677 0,68 0,558 0,536 0,517 (0,101) (0,108) (0,112) (0,113) (0,128 ) (0,122) (0,053) (0,114) (0,081) RFCM 0,615 0,641 0,612 0,632 0,637 0,63 0,449 0,432 0,426 (0,08) (0,138) (0,085) (0,048) (0,136 ) (0,078) (0,123) (0,093) (0,102) NERFCM 0,638 0,646 0,658 0,628 0,596 0,661 0,43 0,449 0,427 (0,108) (0,134) (0,126) (0,144) (0,096 ) (0,137) (0,092) (0,135) (0,098) FANNY 0,823 0,846 0,826 0,825 0,831 0,83 0,753 0,751 0,757 (0,105) (0,098) (0,041) (0,12) (0,05 ) (0,042) (0,005) (0,006) (0,018) CARDN 0,684 0,687 0,655 0,683 0,666 0,706 0,536 0,574 0,583 (0,124) (0,115) (0,104) (0,117) (0,126 ) (0,108) (0,163) (0,148) (0,152) CARDF 0,586 0,579 0,551 0,532 0,557 0,564 0,526 0,538 0,53 (0,151) (0,151) (0,166) (0,157) (0,155 ) (0,153) (0,165) (0,168) (0,168)

Tabela 14: ´Indice de Rand Corrigido para classes sobrepostas com γ1 e γ2 ∈ [1; 8].

DIST1 DIST21 DIST22 DIST23 DIST24 DIST25 DIST3 DIST4 DIST5

DCLUST 0,384 0,435 0,392 0,387 0,379 0,379 0,436 0,41 0,437 (0,055) (0,127) (0,07) (0,029) (0,064 ) (0,047) (0,107) (0,122) (0,108) FNM 0,69 0,69 0,728 0,655 0,724 0,742 0,456 0,331 0,38 (0,016) (0,015) (0,026) (0,04) (0,068 ) (0,038) (0,093) (0,159) (0,129) FAP 0,642 0,616 0,629 0,643 0,609 0,619 0,504 0,487 0,493 (0,116) (0,08) (0,073) (0,063) (0,105 ) (0,079) (0,154) (0,117) (0,089) RFCM 0,635 0,653 0,603 0,626 0,616 0,617 0,484 0,522 0,532 (0,142) (0,134) (0,088) (0,081) (0,099 ) (0,148) (0,078) (0,103) (0,073) NERFCM 0,608 0,631 0,595 0,617 0,6 0,614 0,481 0,501 0,489 (0,078) (0,135) (0,106) (0,081) (0,099 ) (0,126) (0,088) (0,099) (0,075) FANNY 0,622 0,564 0,66 0,751 0,607 0,604 0,734 0,772 0,774 (0,041) (0,064) (0,176) (0,078) (0,199 ) (0,199) (0,042) (0,092) (0,072) CARDN 0,663 0,665 0,625 0,611 0,654 0,644 0,586 0,638 0,614 (0,127) (0,127) (0,093) (0,151) (0,129 ) (0,111) (0,155) (0,144) (0,158) CARDF 0,573 0,575 0,576 0,422 0,467 0,46 0,541 0,578 0,558 (0,152) (0,162) (0,158) (0,132) (0,122 ) (0,172) (0,157) (0,162) (0,16)

6.2 An´alise dos resultados dos Experimentos Monte Carlo 89

DIST1 DIST21 DIST22 DIST23 DIST24 DIST25 DIST3 DIST4 DIST5

DCLUST 0,381 0,335 0,328 0,317 0,331 0,343 0,341 0,341 0,348 (0,044) (0,036) (0,029) (0,032) (0,028 ) (0,039) (0,036) (0,052) (0,063) FNM 0,688 0,697 0,724 0,612 0,703 0,739 0,63 0,604 0,47 (0,017) (0,01) (0,012) (0,018) (0,023 ) (0,014) (0,019) (0,012) (0,102) FAP 0,498 0,513 0,491 0,495 0,497 0,497 0,428 0,448 0,444 (0,06) (0,051) (0,044) (0,064) (0,059 ) (0,056) (0,044) (0,059) (0,024) RFCM 0,519 0,494 0,511 0,486 0,511 0,524 0,444 0,502 0,484 (0,052) (0,034) (0,074) (0,046) (0,055 ) (0,058) (0,047) (0,076) (0,048) NERFCM 0,499 0,521 0,531 0,502 0,504 0,5 0,443 0,48 0,45 (0,042) (0,039) (0,056) (0,062) (0,05 ) (0,064) (0,059) (0,05) (0,048) FANNY 0,756 0,688 0,304 0,77 0,26 0,249 0,761 0,541 0,754 (0,043) (0,063) (0,026) (0,04) (0,008 ) (0,012) (0,045) (0,076) (0,066) CARDN 0,537 0,513 0,533 0,453 0,506 0,539 0,474 0,545 0,528 (0,026) (0,032) (0,049) (0,039) (0,042 ) (0,048) (0,035) (0,038) (0,04) CARDF 0,455 0,446 0,435 0,388 0,386 0,4 0,43 0,536 0,483 (0,035) (0,02) (0,025) (0,047) (0,028 ) (0,038) (0,02) (0,039) (0,038)

Tabela 16: ´Indice de Rand Corrigido para classes sobrepostas com γ1 e γ2 ∈ [1; 40].

As Figuras 25, 26, 27 e 28 apresentam os intervalos de confian¸ca gerados a partir das m´edias de CR e desvios-padr˜ao para a configura¸c˜ao de classes sobrepostas com γ1 e

γ2 ∈ [1; 8] (Tabela 14).

O algoritmo DCLUST (Figura 25(a)) obteve resultados estatisticamente inferiores aos obtidos pelos demais algoritmos. Do ponto de vista das medidas de dissimilaridade, n˜ao houve diferen¸cas estatisticamente significativas de desempenho entre elas.

Para o FNM (Figura 25(b)), os melhores resultados foram obtidos com as medidas DIST22, DIST24 e DIST25. J´a as medidas DIST3, DIST4 e DIST5 apresentaram desem- penho inferior `as demais.

Com FAP (Figura 26(a)), RFCM (Figura 26(b)), NERFCM (Figura 27(a)) e FANNY (Figura 27(b)) as medidas DIST3, DIST4 e DIST5 foram estatisticamente inferiores `as demais. Entre as demais medidas, n˜ao houve diferen¸cas significativas de desempenho.

Os resultados obtidos pelos algoritmos que utilizam a abordagem CARD (CARDN e CARDF - Figuras 28(a) e 28(b), respectivamente) n˜ao superaram os resultados obtidos pelas vers˜oes originais do algoritmos (NERFCM e FANNY).

6.2 An´alise dos resultados dos Experimentos Monte Carlo 90

(a) DCLUST

(b) FNM

Figura 25: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 8] - Algorit-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 91

(a) FAP

(b) RFCM

Figura 26: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 8] - Algorit-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 92

(a) NERFCM

(b) FANNY

Figura 27: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 8] - Algorit-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 93

(a) CARDN

(b) CARDF

Figura 28: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 8] - Algorit-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 94

As Figuras 29, 30, 31 e 32 apresentam os intervalos de confian¸ca gerados a partir das m´edias de CR e desvios-padr˜ao para a configura¸c˜ao de classes sobrepostas com γ1 e

γ2 ∈ [1; 24] (Tabela 15).

Analisando o desempenho o algoritmo DCLUST (Figura 29(a)), observa-se que as dissimilaridades DIST21, DIST3, DIST4 e DIST5 apresentaram desempenho estatistica- mente superior `as demais medidas.

Para o algoritmo FNM (Figura 29(b)), a medida DIST25 apresentou o melhor resul- tado, sendo estat´ısticamente superior aos demais. As medidas DIST3, DIST4 e DIST5 apresentaram resultados inferiores aos das outras medidas.

Com algoritmo FAP (Figura 30(a)), novamente, as medidas DIST3, DIST4 e DIST5 apresentaram resultados inferiores aos das outras medidas. Entre as demais, n˜ao houve diferen¸cas de desempenho estatisticamente relevantes. O mesmo ocorreu aos algoritmos RFCM (Figura 30(b)) e NERFCM (Figura 31(a)).

O algoritmo FANNY (Figura 31(b)) obteve melhores resultado, em termos de inter- valos de confian¸ca, com as medidas DIST23, DIST3, DIST4 e DIST5.

Os resultados obtidos por CARDN (Figura 32(a)) e CARDF (Figura 32(b)) n˜ao supe- raram os resultados obtidos por suas vers˜oes originais (NERFCM e FANNY). Al´em disso, para esses algoritmos n˜ao houve diferen¸cas estatisticamente relevantes entre os desempe- nhos das medidas de dissimilaridades estudadas.

6.2 An´alise dos resultados dos Experimentos Monte Carlo 95

(a) DCLUST

(b) FNM

Figura 29: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 24] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 96

(a) FAP

(b) RFCM

Figura 30: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 24] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 97

(a) NERFCM

(b) FANNY

Figura 31: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 24] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 98

(a) CARDN

(b) CARDF

Figura 32: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 24] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 99

As Figuras 33, 34, 35 e 36 apresentam os intervalos de confian¸ca gerados a partir das m´edias de CR e desvios-padr˜ao para a configura¸c˜ao de classes sobrepostas com γ1 e

γ2 ∈ [1; 40] (Tabela 16).

Com o algoritmo DCLUST (Figura 33(a)), os melhores resultados, em termos de intervalo de confian¸ca, foram obtidos com as medidas DIST1. Importante ressaltar que os resultados do DCLUST foram inferiores aos resultados obtidos pelos demais algoritmos.

Para FNM (Figura 33(b)), o melhor resultado, com significˆancia estat´ıstica, foi obtido com DIST25. As medidas DIST23, DIST3, DIST4 e DIST5 obtiveram resultados inferiores aos das demais medidas.

Para o FAP (Figura 34(a)), mais uma vez, as medidas de dissimilaridade DIST3, DIST4 e DIST5 obtiveram resultados estatisticamente inferiores aos das demais medidas. Com o algoritmo RFCM (Figura 34(b)), a medida DIST3 obteve resultados estatis- ticamente inferiores aos demais. J´a com o NERFCM (Figura 35(a)), as configura¸c˜oes utilizando DIST3 e DIST5 obtiveram resultados inferiores, de acordo com a an´alise de seus intervalos de confian¸ca, `as demais configura¸c˜oes.

O FANNY (Figura 35(b)) obteve seus melhores resultados com as medidas DIST1, DIST23, DIST3 e DIST5. J´a as medidas DIST22, DIST24 e DIST25, apresentaram resultados inferiores aos das demais medidas.

Os resultados obtidos por CARDN (Figura 36(a)) e CARDF (Figura 36(b)) n˜ao su- peraram os resultados obtidos por suas vers˜oes originais (NERFCM e FANNY). Para CARDN, os melhores resultados foram obtidos por DIST1, DIST22, DIST25, DIST4 e DIST5. J´a para o CARDF, o desempenho da medida DIST4 foi estatisticamente superior aos demais.

6.2 An´alise dos resultados dos Experimentos Monte Carlo 100

(a) DCLUST

(b) FNM

Figura 33: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 40] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 101

(a) FAP

(b) RFCM

Figura 34: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 40] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 102

(a) NERFCM

(b) FANNY

Figura 35: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 40] - Algo-

6.2 An´alise dos resultados dos Experimentos Monte Carlo 103

(a) CARDN

(b) CARDF

Figura 36: Intervalos de confian¸ca para classes sobrepostas com γ1 e γ2 ∈ [1; 40] - Algo-

Documentos relacionados