• Nenhum resultado encontrado

6 An ´alises e Resultados

6.2 Resultados Obtidos

O conjunto de dados descrito na sec¸˜ao anterior foi utilizado para a obtenc¸˜ao dos resultados que ser˜ao apresentados nesta sec¸˜ao e comparados com outros resultados obtidos com o aux´ılio das ferramentasReHCE.

Os parˆametros utilizados na ferramenta desenvolvida para obtenc¸˜ao de resultados foram tamb´em empregados na gerac¸˜ao de novos resultados junto com as outras duas

Figura 60: Brushplot do conjunto de dados ´Iris.

ferramentas em an ´alise. Esses resultados ser˜ao exibidos na forma de dendrogramas para todas as ferramentas.

Os resultados obtidos para o conjunto de dados ´Iris, utilizando a ferramenta de- senvolvida neste projeto, foram satisfat´orios, assim como em outros conjuntos de dados testados. Quando esses resultados s˜ao comparados com os das outras duas ferramentas mencionadas, a parte gr ´afica visualizada pelo usu ´ario da ferramenta de- senvolvida apresenta uma qualidade superior, uma vez que todas as informac¸˜oes exi- bidas puderam ser facilmente localizadas e armazenadas pelo usu ´ario, al´em de sua interac¸˜ao com a ferramenta ser maior e mais simples.

Os resultados obtidos com a ferramenta desenvolvida podem ser visualizados no dendrograma da Figura 62(a) (p ´agina 119), onde os agrupamentos obtidos s˜ao vistos de forma objetiva, ou seja, todos os agrupamentos s˜ao bem visualizados e em todos os n´ıveis do gr ´afico. Ao contr ´ario do dendrograma gerado pela ferramenta desen- volvida, os gerados pelas ferramentasR(Figura 62(b), p ´agina 119) e HCE (Figura 62(c), p ´agina 119) n˜ao exibem os dados de forma clara, uma vez que os dendrogramas gera- dos com a primeira ferramenta apresentam o erro de sobreposic¸˜ao dos dados (muito comum em outras ferramentas) quando o conjunto de dados a ser agrupado possui um tamanho consider ´avel, impedindo a correta visualizac¸˜ao dos resultados; e os den- drogramas gerados com a segunda ferramenta apresentam as alturas dos n´ıveis muito pequenas, impendindo dessa forma que o pr´oprio dendrograma seja visualizado.

(a) Ferramenta Desenvolvida 42 45 37 16 15 6 19 17 33 34 23 25 14 43 9 39736 26 30 31 46 13 2 10 35 3 4 48 21 32 12 44 24 27 5 38 41 50 29 28 8 40 1 18 11 49 47 20 22 118 13261 9958 94 135 110 119 106 123 136 103 108 131 126 130109 101142 146 116 137 149 113 140 125 121 144 141 145 111 148 112 104 117 138 105 129 133 107 115 120 69 888674 79 64 92 75 98 87 66 76 55 59 52 5778 77 51 53 122 114 102 143 84 15071128 139147 124 127 73 13463 80 65 60 72 625667 859170 81 82 54 90 95 10089 96 97 68 83 93 0.0 1.0 2.0 3.0 hclust (*, "centroid") dist(x) Height (b) FerramentaR (c) FerramentaHCE

dendrograma da Figura 62(a) (p ´agina 119) separados por n´ıveis, como pode ser visto na Figura 63. Esses cortes na ´arvore do dendrograma s˜ao ´uteis por permitirem que n´ıveis n˜ao importantes possam ser ocultados e apenas os n´ıveis necess ´arios `a analise do usu ´ario sejam exibidos e, dessa forma, n˜ao haja confus˜ao por causa da quantidade de informac¸˜ao apresentada.

(a) N´ıveis 0 e 5

(b) N´ıveis 0 e 21

Figura 63: Diferentes n´ıveis para um mesmo dendrograma.

Outros resultados obtidos a partir dos dendrogramas da ferramenta desenvolvida s˜ao os que fazem parte da an ´alise descritiva dos dados pertencentes aos agrupamen- tos. Quando algum n ´o do dendrograma ´e selecionado, atrav´es do clique do mouse, ´e exibida ao usu ´ario essa an ´alise descritiva contendo os ind´ıviduos que fazem parte do agrupamento, em que n´ıvel eles se agruparam, algumas medidas estat´ısticas (m´edias, quartis, variˆancia, m ´aximo, m´ınimo, curtose, entre outras) e uma matriz de correlac¸˜ao das v ´ariaveis do conjunto de dados, ver Figura 64 (p ´agina 121). Essas medidas per- mitem que o usu ´ario tenha um conhecimento maior sobre os dados que est˜ao sendo analisados. A ferramentaRtamb´em permite que tais medidas sejam calculadas, mas o usu ´ario ter ´a que calcular cada uma delas individualmente e atrav´es de func¸˜oes dispon´ıveis na ferramenta que dever˜ao ser executadas atrav´es de linha de comando.

Para cada grupo formado no dendrograma ´e poss´ıvel, al´em da an ´alise descritiva mostrada, visualizar um brushplot para cada grupo selecionado. De acordo com o resultado exibido na Figura 64 (p ´agina 121), o brushplot equivalente para tal grupo seria o apresentado na Figura 65 (p ´agina 121).

Dessa maneira ´e poss´ıvel obter uma vis˜ao completa e geral do conjunto de da- dos e de seus grupos, uma vez que para cada grupo os resultados das Figuras 64

Figura 64: An ´alise Descritiva para um grupo do conjunto de dados ´Iris.

(p ´agina 121) e 65 (p ´agina 121) s˜ao f ´aceis e interativamente exibidos aos usu ´arios do sistema.

Ap ´os a verificac¸˜ao dos resultados obtidos para a interface desenvolvida ´e inte- ressante discutir tamb´em os resultados obtidos para a nova t´ecnica de agrupamento SPC. Segundo Blatt et al. (1997), foram realizados testes para verificac¸˜ao da eficiˆencia no agrupamento de seis conjuntos de dados, entre eles o ´Iris, incluindo sua carac- ter´ıstica de esp´ecies. Os 150 pontos desse conjunto de dados foram dividos em trˆes esp´ecies, sendo que 50 deles pertencentes `a esp´ecie setosa, outros 50 pertencentes `a esp´ecie virg´ınica e outros 50 `a esp´ecie multicores.

A partir dos resultados obtidos por Blatt et al. (1997), foi poss´ıvel verificar que o conjunto de dados ´Iris, durante o processo de agrupamento, ´e divido em grupos em dois est ´agios. Isto reflete o fato de duas das trˆes esp´ecies possuirem valores mais aproximados uma da outra do que da terceira. A t´ecnica SPC trabalha com tal organizac¸˜ao hier ´arquica muito bem, visto que 125 pontos do conjunto de dados foram agrupados corretamente (como comparado com agrupamento manual) e 25 pontos n˜ao foram classificados. Pode ser observado no dendrograma da Figura 62(a) (p ´agina 119) que um agrupamento muito semelhante ao gerado por Blatt et al. (1997) foi obtido, uma vez que 21 dos 150 pontos n˜ao foram agrupados (grupos isolados com apenas um ind´ıviduo). Isto ocorreu por causa dos diferentes parˆametros utilizados na realizac¸˜ao dos agrupamentos.

Os melhores resultados de todos os algoritmos de agrupamento utilizados por Blatt et al. (1997) na verificac¸˜ao da eficˆencia da t´ecnicaSPCest˜ao sumarizados na Tabela 26.

T´ecnica Maior Grupo Grupo M´edio Menor Grupo

´Arvore de Cobertura M´ınima 50 50 50

SPC 45 40 38 Procura do vale 67 42 37 Junc¸˜ao Completa 81 39 30 Grafo Direcionado 90 30 30 K-Vizinhos compartilhados 90 30 30 Junc¸˜ao Simples 101 30 19

Valor de vizinhanc¸a m ´utua 101 30 19

Tabela 26: Resultados dos agrupamentos para as oito t´ecnicas testadas. Apenas as t´ecnicas de ´Arvore de Cobertura M´ınima e a SPC retornaram grupos onde os pontos pertencentes a diferentes esp´ecies n˜ao foram misturados, ou seja, ou os pontos foram agrupados corretamente ou n˜ao foram agrupados.

Uma vez apresentados os resultados obtidos para a ferramenta desenvolvida neste projeto e a nova t´ecnica de agrupamento utilizada, o pr´oximo cap´ıtulo aponta as principais conclus˜oes verificadas neste projeto.

Documentos relacionados