6 EXPERIMENTOS, RESULTADOS E AVALIAÇÕES
6.2 Descrição dos Experimentos
6.2.1 Primeiro Conjunto de Experimentos – Influência do Tamanho do Criptograma
6.2.1.4 Subconjunto de Experimentos para o Algoritmo RSA
Para o RSA, foram definidos 11 tamanhos de textos diferentes, em bytes: 64, 128, 192, 256, 512, 1024, 2048, 4096, 6144, 8192 e 10240, cada tamanho com 30 textos, cifrados com 50 chaves diferentes e aleatórias, utilizados cinco tamanhos diferentes de chaves (250 chaves aleatórias), totalizando 82.500 criptogramas. Na figura 6.6, pode ser observada uma árvore que descreve os experimentos realizados. Note que cada seta leva a uma ramificação. Cada um desses ramos se constitui em uma combinação de itens, a qual define um experimento.
Os cinco tamanhos de chaves utilizados foram 64, 128, 256, 512 e 1024 bits. Embora os tamanhos de chaves utilizados com o algoritmo RSA estejam normalmente entre 512 e 2048
menores do que os recomendados, para testar se as técnicas utilizadas neste trabalho são válidas, em algum momento, para o RSA, pois como visto nos experimentos com o AES, chaves a partir de 192 bits alcançaram valor máximo de 0,23 para a recall (apêndices 5 e 6).
FIG. 6.6: Primeiro conjunto de experimentos: subconjunto para o algoritmo RSA 6.2.1.4.1 RESULTADOS E AVALIAÇÕES
A observação feita para o algoritmo AES sobre o tamanho dos criptogramas necessários para realizar o agrupamento com máximas precision e recall, também são válidas para o RSA. Neste caso, teremos espaços de termos que vão de 2 até 64 21024.
(a) (b)
GRA. 6.11: Recall e tempo decorrido para o algoritmo RSA com, com chaves de 64 bits, com o método Single-Link
De uma maneira geral, os métodos de agrupamento e as medidas de similiraridade e distância produziram resultados semelhantes aos dos experimentos anteriores. Nos gráficos 6.11 a 6.13, (a) e no apêndice 7, estão os resultados para chaves de 64 bits. Para estas chaves , observa-se que as medidas de similaridade, nos métodos single-link e group average-link, alcançaram precision e recall máxima com textos a partir de 256 bytes. Com o método complete-link, estas medidas alcançaram estes valores com textos a partir de 2048 bytes. Os valores de precision foram um em todos os casos.
Já as medidas de distância, tiveram resultados pouco expressivos, do ponto de visgta da recall. O maior valor de recall, com precision um, foi 0,03, o que significa que foram formados 1500 grupos, cada grupo com um criptograma. Contudo, a precision foi um em quase todos os experimentos, só ficando abaixo de um em dois experimentos com a distância Manhattan e em dois experimentos com a distância Euclidiana.
Os valores relativos ao tempo decorrido nas medidas de similaridades e distância, apresentados nos gráficos 6.11 a 6.13, (b), foram semelhantes aos experimentos anteriores e apresentaram crescimento compatível com o tamanho dos textos.
(a) (b)
GRA. 6.12: Recall e tempo decorrido para o algoritmo RSA com, com chaves de 64 bits, com o método Complete-Link
(a) (b)
GRA. 6.13: Recall e tempo decorrido para o algoritmo RSA com, com chaves de 64 bits, com o método Group Average-Link
O valor da precision foi um para todas as medidas. Nos gráficos 6.14 a 6.16, (a) e no apêndice 8, podem ser vistos os resultados para as chaves de 128 bits, nos quais as medidas de similaridade, nos métodos single-link e group average-link, alcançaram precision e recall
máxima com textos a partir de 4096 bytes. Com o método complete-link, estas medidas alcançaram o valor máximo de 0,17 para a recall. As medidas de distância tiveram como maior valor de recall 0,03, o que significa que foram formados 1500 grupos, cada grupo com um criptograma.
(a) (b)
GRA. 6.14: Recall e tempo decorrido para o algoritmo RSA com, com chaves de 128 bits, com o método Single-Link
Os valores relativos ao tempo decorrido nas medidas de similaridades e distância, apresentados nos gráficos 6.14 a 6.16, (b), foram semelhantes aos experimentos anteriores e apresentaram crescimento compatível com o tamanho dos textos.
(a) (b)
GRA. 6.15: Recall e tempo decorrido para o algoritmo RSA com, com chaves de 128 bits, com o método Complete-Link
(a) (b)
GRA. 6.16: Recall e tempo decorrido para o algoritmo RSA com, com chaves de 128 bits, com o método Group Average-Link
Com chaves de 256, 512 e 1024 bits o valor de precision foi um para todos os experimentos. Mas não foi possível alcançar precision e recall máxima em nenhum dos métodos com nenhuma das medidas de similaridade e distâncias. O máximo valor de recall
alcançado foi 0,08 para chaves de 256 bits, 0,06 para chaves de 512 bits e 0,07 para chaves de 1024 bits, com criptogramas de até 10240 bytes. Foi realizado um novo experimento com criptogramas entre 12240 e 20160 bytes, sendo alcançado o valor de precision um em todas as medidas de similaridade em todos os métodos e com a distância Euclidiana e Canberra, nos métodos single-link e group average-link e o valor máximo de recall de 0,67 (ver seção 6.2.6, para maiores detalhes). Os resultados completos podem ser vistos nos apêndices 9, 10, 11 e 16.
Para este experimento, conclui-se que os métodos single-link e group average-link trabalham melhor com as medidas de similaridade, o método complete-link não obteve bons resultados, chegando ao valor máximo de 0,20 para recall. Todas as medidas de distâncias obtiveram recall 0,03 na maioria dos experimentos deste subconjunto, indicando a formação de grupos com apenas um criptograma em cada grupo.
Comparando os resultados obtidos com o algoritmo RSA, chave de 64 bits e 128 bits, com o algoritmo DES, chave 64 bits, e o AES, chave de 128 bits, respectivamente, pode se observar que para as medidas de similaridade os valores relativos a recall foram melhores, isto é, o RSA obteve valores máximos de precision e recall com criptogramas menores do que o DES e o AES. Já com as medidas de distância, os resultados pioraram ainda mais para o RSA, pois em alguns casos com o DES e o AES foram alcançados precision e recall máxima. Já para o RSA isto não aconteceu em nenhum momento.
Com o espaço de termos de 2 (chaves de 256 bits), o AES produziu grupos melhores 256
atingindo 0,23 como o melhor valor de recall, enquanto o RSA obteve o valor 0,08 como valor máximo para a recall.
6.2.2 SEGUNDO CONJUNTO DE EXPERIMENTOS – CRIPTOGRAMAS COM