• Nenhum resultado encontrado

CAPÍTULO 7 – CRITÉRIO DE VALIDAÇÃO INTERNA SD-SPATIAL

7.4 Experimentos

para maxK. Nesse contexto, maxK é a quantidade máxima de grupos utilizada pelo usuário final para a geração dos agrupamentos, permitindo que o critério seja utilizado de maneira relativa comparando agrupamentos com diferentes quantidades de grupos. Diferentemente do que acontece no critério SD, onde apenas o fator de ponderação α é utilizado, o uso do fator de ponderação β pelo critério SD-Spatial permite, de certa forma, atenuar a tendência de queda no valor da medida de separação dos grupos considerando o espaço de atributos quando o espaço de coordenadas é considerado pela abordagem de agrupamento.

7.4 Experimentos

Com o intuito de verificar a eficácia do critério SD-Spatial em validar agrupamentos de dados espaciais considerando tanto o espaço de atributos quanto o espaço de coordenadas, ex- perimentos com dados reais foram realizados confrontando os resultados obtidos pelo novo critério SD-Spatial com relação aos critérios SD e largura de silhueta. Nesse sentido, foram utilizados mapas de UGDs gerados pelas abordagens FCM e HACC-Spatial e dados espaciais coletados a partir das UPs referenciadas na Seção 6.5 do Capítulo 6. Além disso, para verificar a eficácia dos métodos em analisar agrupamentos de maneira relativa, foram utilizados mapas contendo de 2 a 5 CGDs, que é o intervalo normalmente utilizado na prática. Nesses mapas, cada CGD é representada graficamente por um tom de cinza. A Figura 7.2 mostra exemplos de mapas de CGDs gerados pelos algoritmos FMC e HACC-Spatial, considerando como entrada o conjunto de atributos UP-CA1.

7.4 Experimentos 140 Figura 7.2: Mapas de CGDs gerados utilizando o conjunto de atributos UP-CA1 e as abordagens (a) FCM; e (b) HACC-Spatial.

(a) (b)

A Figura 7.2 nos permite verificar claramente as restrições espaciais impostas pela aborda- gem HACC-Spatial para redução da estratificação dos mapas de UGDs obtidos, característica esta que não é tratada pela abordagem FCM. Os gráficos da Figura 7.3 mostram o resultado da aplicação dos critérios de validação da largura de silhueta, SD e SD-Spatial nos mapas de UGDs da Figura 7.2, considerando o parâmetro porcDMU com valor igual a 5% para o último critério.

Figura 7.3: Critérios de validação interna (a) largura de silhueta; (b) SD; e (c) SD-Spatial com porcDMU=5%, utilizados de maneira relativa para comparação de mapas de CGDs gerados pelas abordagens FCM e HACC-Spatial e pelo conjunto de atributos UP-CA1.

7.4 Experimentos 141

Tanto o gráfico referente ao critério da largura de silhueta (Figura 7.3 (a)), onde se espera índices maiores para agrupamentos melhores, quanto o gráfico referente ao critério SD (Figura 7.3 (b)), onde se espera índices menores para agrupamentos melhores, mostram uma tendência parecida de queda na qualidade dos agrupamentos, conforme a quantidade de grupos aumenta. Apesar da diferença pequena entre os resultados obtidos, a abordagem FCM apresentou um melhor desempenho em uma avaliação considerando apenas o espaço de atributos, obtido muito em função das restrições espaciais impostas pela abordagem HACC-Spatial. Essas restrições prejudicam as medidas de coesão e separação obtidas pelos resultados proporcionados por essa abordagem no espaço de atributos, porém permitem a obtenção de resultados visuais melhores, quando os agrupamentos representam mapas de UGDs. Como essa questão só é tratada pelo SD-Spatial, o gráfico dos resultados obtidos com a utilização desse critério (Figura 7.3 (c)), onde também se espera índices menores para agrupamentos melhores, mostra um desempenho muito superior da abordagem HACC-Spatial com relação à abordagem FCM.

Apesar de proporcionar resultados que privilegiam questões relacionadas à visualização dos mapas de UGDs, o parâmetro porcDMU deve ser utilizado com cautela pelo usuário final, pois está relacionado diretamente à sua percepção em identificar se determinadas UGDs e buracos devem ser considerados como estratos ou não devem ser considerados como estratos. A Figura 7.4 exibe gráficos dos resultados da aplicação do critério SD-Spatial nos mesmos mapas da Figura 7.2, considerando três valores distintos para o parâmetro porcDMU.

Figura 7.4: Critério de validação interna SD-Spatial com variações do parâmetro porcDMU de (a) 0% ; (b) 10% ; e (c) 20% .

(a) (b) (c)

Por meio da Figura 7.4, é possível verificar que a não identificação de UGDs e buracos como estratos por parte do usuário final, que ocorre quando o valor de 0% para o parâme- tro porcDMU é utilizado (Figura 7.4 (a)), permite que a abordagem FCM alcance resultados

7.4 Experimentos 142

melhores em alguns casos. Esses resultados ocorrem devido à maior coesão obtida pela aborda- gem FCM com relação à abordagem HACC-Spatial considerando apenas o espaço de atributos. Nesse caso, o primeiro e segundo fatores de ponderação do cálculo de SD − SpatialScat se tor-

nam neutros, fazendo com que a variância no espaço de atributos prevaleça. Por outro lado, a utilização de valores mais altos para porcDMU, entre 10% (Figura 7.4 (b)) e 20% (Figura 7.4 (c)), por exemplo, mostram uma tendência geral de aumento no índice alcançado pelo cri- tério conforme a quantidade de grupos aumenta. Nesses casos, algumas UGDs obtidas tanto pela abordagem FCM quanto pela HACC-Spatial, principalmente nos mapas com 4 e 5 CGDs, passam a ser consideradas como estratos, fazendo com que os índices obtidos para o critério SD-Spatial aumentem. Apesar dos valores atribuídos para o parâmetro porcDMU dependerem exclusivamente do usuário final, experimentos como os descritos nesta seção mostram que valo- res entre 5% e 10% para esse parâmetro produzem resultados dentro do esperado para o critério SD-Spatial.

Outro experimento foi realizado utilizando uma quantidade maior de atributos. A Figura 7.5 mostra exemplos de mapas de CGDs gerados pelas abordagens FMC e HACC-Spatial, con- siderando agora como entrada o conjunto de atributos UP-CA2.

Figura 7.5: Mapas de CGDs gerados utilizando o conjunto de atributos UP-CA2 e as abordagens (a) FCM; e (b) HACC-Spatial .

(a) (b)

Por meio dos mapas da Figura 7.5, é possível perceber que a estratificação praticamente não existe e foi reduzida drasticamente, principalmente considerando os resultados da aborda- gem FCM, quando comparados aos mapas exibidos na Figura 7.2. Nesse caso, a utilização de

7.4 Experimentos 143

atributos de qualidade e com boa correlação permitiram a obtenção de mapas de UGDs mais uniformes e contínuos. Os gráficos da Figura 7.6 mostram o resultado da aplicação dos crité- rios de validação da largura de silhueta, SD e SD-Spatial nos mapas de UGDs da Figura 7.5, considerando novamente o parâmetro porcDMU com valor igual a 5% para o último critério.

Figura 7.6: Critérios de validação interna (a) largura de silhueta; (b) SD; e (c) SD-Spatial com porcDMU=5%, utilizados de maneira relativa para comparação de mapas de CGDs gerados pelas abordagens FCM e HACC-Spatial e o conjunto de atributos UP-CA2.

(a) (b) (c)

Os gráficos das figuras 7.6 (a) e 7.6 (b) mostram índices muito próximos obtidos pelas abordagens FCM e HACC-Spatial para os critérios da largura de silhueta e SD. Entretanto, segundo esses critérios, a abordagem HACC-Spatial obteve sempre resultados melhores, exceto para 5 grupos. Já os resultados obtidos pelo critério SD-Spatial (Figura 7.6 (b)) exigem uma análise mais elaborada. Para 3 grupos, podemos verificar ausência de estratificação em ambos os mapas, porém um maior equilíbrio no tamanho das CGDs que fez com que o resultado fornecido pela abordagem FCM fosse considerado melhor pelo critério. Esse desbalanceamento no tamanho das CGDs obtidas pela abordagem HACC-Spatial foi provocado pela fusão dos dois grupos localizados na parte inferior do mapa de 4 CGDs, fazendo com que uma das 3 CGDs ficasse com tamanho em área desbalanceado com relação às outras. Para os mapas de 5 CGDs, o critério SD-Spatial mostra uma penalização grande para a estratificação mínima gerada por uma das CGDs do mapa de UGDs obtido pela abordagem FCM. Essa CGD foi dividida em duas UGDs, sendo uma delas muito pequena, o que causou uma diferença considerável no índice obtido pelo critério SD-Spatial em favor da abordagem HACC-Spatial.

A partir dos experimentos descritos nesta seção, foi possível verificar a eficácia do critério SD-Spatial em identificar agrupamentos espaciais de qualidade, considerando não só o espaço de atributos como também as questões relativas ao espaço de coordenadas, que no contexto desta tese estão totalmente relacionadas à visualização dos mapas de UGDs. Desse modo, esse

7.5 Considerações Finais 144

critério foi utilizado para avaliar os mapas de UGDs obtidos nos experimentos subsequentes desta tese.

7.5 Considerações Finais

Neste capítulo foi apresentado, de maneira detalhada, o critério de validação interna SD- Spatial, uma nova abordagem para o critério SD que avalia, de maneira qualitativa, os agrupa- mentos obtidos a partir de dados espaciais considerando tanto o espaço de atributos quanto o espaço de coordenadas. Considerando a aplicação de delineamento de UGDs em AP, esse novo critério permite ao usuário final definir uma porcentagem de área mínima para uma UGD com relação à área total, possibilitando a identificação de UGDs e buracos que podem contribuir para a obtenção de mapas estratificados e de difícil interpretação.