• Nenhum resultado encontrado

3.4 VNS-PPMHLP: resultados computacionais

3.4.2 Recuperação da informação

Na Subseção 3.4.1 mostrou-se que o algoritmo VNS-PPMHLP é a melhor alternativa para a resolução do novo modelo proposto neste trabalho, o PPMHLP. Isto devido ao fato de que as formulações PPMHLP1 e PPMHLP2 não puderam ser resolvidas via algoritmos exatos tradicionais em tempo razoável para as instâncias consideradas.

Nesta seção, analisa-se a precisão com que os algoritmos VNS-PPMHLP e VNS- PPMH recuperam a estrutura de categorias previamente definida por meio da Simulação de Monte Carlo, assim como a segmentação correta dos indivíduos. De modo a compa- rar o VNS-PPMHLP e o VNS-PPMH e seus respectivos problemas, PPMHLP e PPMH, considerou-se que utilizar o ARI [Hubert & Arabie 1985] é apropriado, pois os mode- los não são equivalentes em razão de suas funções objetivo e da forma como limitam o número de medianas para cada segmento.

O ARI permite comparar se os valores preditos em ambos os modelos para as variáveis e correspondem aos valores observados Wi

jl, que representam em qual categoria l um

indivíduo i classificou o objeto j durante a tarefa de triagem. Obviamente os valores para as variáveis e que serão comparados à estrutura de categorias feita pelo indivíduo i estão condicionados à pertinência deste indivíduo em um dos segmentos g, ou seja, o valor de pig. O ARI tem como resultado um valor cujo teto é 1 (escalar) e este valor indica uma

recuperação perfeita da informação.

De forma a ilustrar a obtenção dos valores de entrada considerados no cálculo do ARI para as variáveis e, suponha que um indivíduo i∗ construiu uma estrutura de categorias

com ci∗ = 3 pilhas ao analisar J = 5 objetos. O resultado de sua classificação é dado pela matriz Wi∗

apresentada a seguir, na qual cada linha representa um objeto j e sua respectiva pertinência em uma das pilhas l:

3.4. VNS-PPMHLP: RESULTADOS COMPUTACIONAIS 51 Wi∗=         1 0 0 0 1 0 0 0 1 1 0 0 1 0 0 .         (3.13) Para fins de simplificação, pode-se reescrever este resultado como um vetor Ui∗

= [uj]J, no qual cada posição j conterá o número da pilha l em que o objeto j foi colocado.

Desta forma, tem-se:

Ui∗ =h 1 2 3 1 1 i. (3.14) O vetor Ui∗

representa a estrutura de categorias feita pelo indivíduo i∗durante a tarefa

de triagem. Para que se possa calcular o ARI para este indivíduo i∗em relação às variáveis

e, deve-se agora considerar outro vetor Vg∗, o qual irá representar a estrutura de categorias recuperada para o segmento g∗. Obviamente, para que esta comparação faça sentido,

deve-se supor que o indivíduo i∗foi alocado a um segmento g, o que implica que pi∗g

= 1.

A partir disto, considera-se que a estrutura de categorias recuperada pelo PPHMLP para o segmento g∗ é dada pela matriz eg∗

= [ejk]J×J. Para fins de exemplificação,

considera-se também que esta matriz contém os seguintes valores: eg∗ =         1 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 .         (3.15) Pela definição do modelo do PPMHLP, os valores na diagonal principal desta matriz, quando iguais a 1, indicam que o objeto referente a esta linha e coluna é uma mediana. Portanto, ao se observar a matriz dada em (3.15), vê-se que existem 3 medianas, sendo elas os objetos 1, 2 e 4. Como existem três medianas, existem três categorias às quais os demais objetos foram atribuídos, sendo que o objeto 5 foi atribuído à mediana referente ao objeto 1 e o objeto 3 foi atribuído à mediana representada pelo objeto 4.

Pode-se reescrever a matriz dada em (3.15) como uma nova matriz qg∗

suas colunas que contenham apenas zeros, ou seja: qg∗ =         1 0 0 0 1 0 0 0 1 0 0 1 1 0 0 .         (3.16) A partir desta matriz qg∗

, então, obtém-se o vetor Vg∗

:

Vi∗ =h 1 2 3 3 1 i. (3.17) De posse dos vetores Ui∗

e Vg∗

, pode-se facilmente calcular o ARI (ver [Hubert & Arabie 1985]) relativo à comparação entre a estrutura de categorias feita pelo indivíduo i∗ na tarefa de triagem e a estrutura de categorias recuperada para o segmento gpelos

algoritmos VNS-PPMHLP e VNS-PPMH.

Utiliza-se também o ARI para comparar os modelos em relação às variáveis p esti- madas com relação aos valores gerados na criação das instâncias. Para todos os casos, variáveis e e variáveis p, o ARI médio é apresentado 1.33para cada instância. A Tabela 3.4 mostra estes resultados. Como a extração dos valores para o cálculo do ARI em rela- ção às variáveis p é um tanto simples, este processo não será explicado. As subseções a seguir analisam os resultados obtidos.

Variáveis e

Um teste-t para dados pareados em relação às variáveis e mostra que a diferença entre o ARI médio observado para os algoritmos VNS-PPMHLP e VNS-PPMH é significante. Para o VNS-PPMHLP, tem-se que ARIV NS−PPMHLP= 0, 952 e DPV NS−PPMHLP= 0, 059.

Para o VNS-PPMH, ARIV NS−PPMH = 0, 801 e DPV NS−PPMH = 0, 263. Para estes valo-

res, a diferença entre as médias é significante, pois valor-t(26) = 3,20 e valor-p < 0,01. Desta forma-se, mostra-se que o VNS-PPMHLP é mais preciso ao recuperar a estrutura de categorias que o VNS-PPMH.

Adicionalmente, pode-se analisar os mesmos resultados removendo-se as instâncias cujo ARI obtido foi igual a 1 em ambos os algoritmos. Para as instâncias remanescentes, ao todo 18, observa-se que o VNS-PPMHLP supera o VNS-PPMH em 14 casos. Conclui- se novamente, a partir desta observação, que o VNS-PPMHLP demonstra superioridade em relação ao VNS-PPMH na recuperação da estrutura de categorias.

3.4. VNS-PPMHLP: RESULTADOS COMPUTACIONAIS 53 Variáveis p

As variáveis p, por sua vez, indicam a qual segmento g cada um dos I indivíduos per- tence. Ambos os modelos apresentam boa performance em relação ao ARI. Para estas va- riáveis, tem-se ARIV NS−PPMHLP= 0, 893 e DPV NS−PPMHLP= 0, 169. Para o VNS-PPMH,

tem-se ARIV NS−PPMH= 0, 851 e DPV NS−PPMH= 0, 236. Apesar de o VNS-PPMHLP pa-

recer superior, à primeira vista, a diferença entre estas médias não é significante, pois um teste-t apresenta como resultados valor-t(26) = 1,18 e valor-p = 0,25. Portanto, neste quesito os modelos e algoritmos são equivalentes, apresentando o mesmo grau de preci- são ao recuperar a segmentação pré-definida no processo de simulação para os indivíduos.

Documentos relacionados