• Nenhum resultado encontrado

Convergência do número de classificações para o número correto de habitantes

5 TESTES REALIZADOS

5.3 Convergência do número de classificações para o número correto de habitantes

A partir da recombinação de peças de vestuário pelos habitantes, é esperado que, após certo tempo de funcionamento, o sistema seja capaz de classificar sob um mesmo código de habitante os casos que possuírem, entre si, similaridade igual ou maior do que um valor mínimo pré-estipulado. Também é esperado que, quanto maior o valor da similaridade mínima estipulado, menos casos similares entre si existam.

Nas seções 5.3.1 e 5.3.2 são comparados resultados de classificações, quanto ao número de habitantes obtidos pelo simulador, modificando-se os valores de similaridade.

5.3.1 Classificação variando-se os valores de similaridade mínima

Os gráficos da Figura 5.2 mostram uma comparação na classificação utilizando os seguintes critérios e valores de similaridade:

O gráfico 5.2(a) mostra a variação da quantidade de habitantes obtida pelo classificador na base de casos de teste, utilizando-se como critério de similaridade a quantidade de objetos iguais, variando esse valor de 1 até 5. O gráfico 5.2(b) mostra a quantidade de classificações corretas, incompletas e erradas para estes mesmos valores.

O gráfico 5.2(c) mostra a variação da quantidade de habitantes obtida, utilizando como critério de similaridade a porcentagem de objetos iguais, variando esse valor de 5% até 50%, com granularidade de 5%. O gráfico 5.2(d) mostra a quantidade de classificações corretas, incompletas e erradas para estes mesmos valores.

(a) qte. habitantes / número do caso: sim = qte. de obj. iguais (b) qualidade das classificações / qte. de obj. iguais

(c) qte. habitantes / número do caso: sim = % de obj. iguais (d) qualidade das classificações / % de obj. iguais Figura 5.2: Gráficos da relação entre o número do caso classificado e a quantidade de habitantes gerada pelo CAPBC e do valor de similaridade mínima e a qualidade das classificações obtida, utilizando-se a BC original. Legenda dos eixos: QTE_HABS: Quantidade de Habitantes; CASO_NUM: Número do Caso; QTE_CASOS: Quantidade de Casos; SIM_N_IGUAIS: Similaridade pela Quantidade de Objetos Iguais; SIM_%_IGUAIS: Similaridade pela Porcentagem de Objetos Iguais.

Analisando-se o gráfico 5.2(a), é possível observar que, quanto maior for o valor de similaridade mínima estipulado, maior será o número de habitantes que o classificador encontrará. O único valor de similaridade mínima que levou à convergência da quantidade de habitantes para o valor correto foi o de apenas um objeto igual.

No gráfico 5.2(c), foi obtida a convergência da quantidade de habitantes para o valor correto, antes do milésimo caso, para os valores de similaridade mínima de até 25%. Para os valores de 30%, 35% e 40%, aparentemente, há uma convergência deste valor, embora ela não tenha chegado à quantidade esperada, até a análise do milésimo caso. As curvas obtidas para os valores de 45% e 50% não aparentam convergir até o último caso em análise.

Os gráficos 5.2(b) e 5.2(d) permitem visualizar a relação entre o valor de similaridade mínima e a quantidade de casos classificados corretamente (CLASS_OK) ou de forma incompleta (CLASS_INC) após os 1000 casos.

Pôde-se observar, primeiramente, que não houve classificações erradas (CLASS_ERR) sob nenhum dos critérios utilizados. Isto ocorreu pois a base de casos utilizada nestes primeiros testes não possui objetos permutados, nem leituras incorretas inseridas. Também foi possível observar que, apesar do crescimento na quantidade de habitantes diferentes, quando o valor de similaridade mínima foi aumentado, a quantidade de classificações corretas nos gráficos 5.2(b) e 5.2(d) ainda permaneceu alta. Isto indica que a maioria dos casos foi corretamente agrupada e que as classificações incompletas pertencem a pequenos subgrupos, os quais não alcançaram o valor de similaridade mínima com os casos dos grupos maiores.

5.3.2 Classificação fixando-se os valores de similaridade mínima e variando-se os pesos de objetos

Os gráficos da Figura 5.3 mostram uma comparação na classificação utilizando os seguintes critérios e valores de similaridade. A base de casos utilizada nestas simulações também é a base de casos original.

O gráfico 5.3(a) mantêm fixo o valor de similaridade mínima em 50% e mostra a variação da quantidade de habitantes obtida, utilizando-se o incremento de peso de 0 a 1, com granularidade de 0,1, a cada 1 caso contendo o objeto. A atribuição dos pesos é feita de acordo com o exposto na seção 4.1.2.5. O gráfico 5.3(b) mostra a quantidade de classificações corretas, erradas e incompletas para esses mesmos valores. O gráfico 5.3(c) mostra a quantidade de classificações corretas, erradas e incompletas para esses mesmos valores, porém, considerando que a classificação de todos os casos somente é feita após a entrada da combinação de número '1000', onde os mesmos pesos finais calculados são utilizados na classificação de todos os casos.

No gráfico 5.3(a) pode-se perceber o resultado da aplicação dos pesos aos objetos mais relevantes. Há uma grande diferença no comportamento das curvas obtidas, principalmente entre o gráfico onde nenhum peso é atribuído e aquele em que é somado '0,1' ao peso em cada ocorrência do objeto. As demais curvas seguem a mesma tendência desta.

Nos gráficos 5.3(b) e 5.3(c) pode ser observada, também, a grande alteração na relação entre as classificações, sem e com a aplicação dos pesos nos objetos mais relevantes, onde a

quantidade de casos classificados corretamente subiu de aproximadamente 50% para 80%, com a aplicação de pesos.

Entre os gráficos 5.3(b) e 5.3(c), foi observada a mesma tendência nas curvas, obtendo pequenas diferenças nas classificações, que ocorreram devido aos diferentes pesos aplicados aos objetos em cada um deles.

(a) qte. habs. / num. do caso: inc. de peso critério 1 (b) qualidade das classificações / inc. de peso critério 1

(c) qualidade das classificações / inc. de peso critério 2

Figura 5.3: Gráficos da relação entre o número do caso classificado e a quantidade de habitantes gerada pelo CAPBC e do incremento no peso dos objetos e a qualidade das classificações obtida, utilizando-se a BC original. Legenda dos eixos: QTE_HABS: Quantidade de Habitantes; CASO_NUM: Número do Caso; QTE_CASOS: Quantidade de Casos; INC_PESO: Incremento do Peso.

Não foi traçado um gráfico de evolução da quantidade de habitantes de acordo com o número do caso, pois, nesta situação, a classificação de todos os casos ocorre somente após a entrada do caso '1000'.

Por ainda se tratar da mesma base de casos anterior (base de casos original), também não foram observadas classificações erradas com o uso de nenhum peso.

5.3.3 Conclusões sobre a quantidade de habitantes gerados pelo CAPBC

Os testes efetuados com a base de casos original, ou seja, sem objetos permutados, estranhos ou casos concatenados, permitiu observar o comportamento das classificações alterando-se os critérios e valores de similaridade mínima.

Se fosse possível garantir que os casos obtidos em uma residência real tivessem essas características, poder-se-ia escolher o critério de similaridade mínima apenas pela convergência mais rápida para a quantidade correta de habitantes obtida pelo classificador. Neste caso, critérios como 1 objeto igual, 5% ou 10% de objetos iguais obteriam os melhores resultados.

Os próximos testes visam verificar a capacidade do CAPBC em classificar corretamente casos com objetos permutados, objetos estranhos ou casos concatenados, por meio dos mesmos critérios avaliados até este ponto.