Aritm´ etica el´ıptica - 6 Projeto e Implementa¸ c˜ ao do Sistema

6 Projeto e Implementa¸ c˜ ao do Sistema

6.3.5 Aritm´ etica el´ıptica

O último detalhe importante da implementa¸cão é o sistema de coordenadas empregado para aritmética el´ıptica. É definida uma estrutura de dados para curvas el´ıpticas e pontos sobre as mesmas, além de opera¸cões sobre pontos, no arquivo elliptic.h, enquanto a implementa¸cão destas opera¸cões é realizada no arquivo elliptic.cpp.

Não são utilizadas as coordenadas afins e projetivas discutidas na Se¸cão 3.3, mas sim as chamadas coordenadas de Montgomery, propostas em (34). Este é um sistema de coordenadas projetivas com uma mudan¸ca crucial: os valores da coordenada y de pontos da curva nunca são calculados. Embora isso possa parecer absurdo, existem muitas situa¸cões em que as coordenadas y são dispensáveis. Aqui, a aplica¸cão da aritmética el´ıptica é na verifica¸cão das condi¸cões do Teorema 4.3.1, em que basta decidir se um ponto corresponde ao ponto no infinito O ou não, e para esta opera¸cão basta verificar se as coordenadas x, z são nulas ou não.

Através do descarte das coordenadas y, é poss´ıvel eliminar diversas adi¸cões e multi-plica¸cões da aritmética em coordenadas projetivas, porém há um detalhe importante: as fórmulas para a adi¸cão de dois pontos P₁ e P₂ exigem, além das coordenadas dos pontos em si, as coordenadas do ponto P₁ − P₂. Embora isto pare¸ca limitar a utilidade das co-ordenadas de Montgomery, é poss´ıvel forjar um algoritmo de multiplica¸cão de pontos por inteiros empregando as cadeias de Lucas discutidas na Se¸cão 4.1.2. Recorda-se daquela se¸cão que a cada itera¸cão da cadeia, as coordenadas de kP, (k + 1)P são conhecidas, e é poss´ıvel calcular as coordenadas de 2kP, (2k + 1)P ou (2k + 1)P, (2k + 2)P , onde k é um inteiro e P é um ponto sobre uma curva. Observa-se que a diferen¸ca entre os dois elementos dos pares de coordenadas citadas é sempre P , que obviamente é conhecido.

No entanto, as cadeias de Lucas apresentam uma desvantagem: o cálculo de nP exigirá invariavelmente 2dlog₂ne + 1 opera¸cões el´ıpticas, enquanto uma cadeia de exponencia¸cão comum exigirá bem menos – mesmo o simples Algoritmo 2.3.4 exigirá cerca de 1, 5dlog₂ne opera¸cões, supondo que n é um inteiro com uma distribui¸cão aproximadamente igual de bits 1 e 0 em sua representa¸cão binária. Algoritmos mais sofisticados exibirão uma quan-tidade até menor de opera¸cões. No entanto, (2) defende as coordenadas de Montgomery em fun¸cão da grande economia de opera¸cões modulares para cada opera¸cão el´ıptica indi-vidual. Seria interessante implementar a aritmética em outros sistemas de coordenadas para efeito de compara¸cão, porém isto não foi feito neste trabalho.

7 Resultados

Dentre as subrotinas do algoritmo ECPP, o maior esfor¸co foi dispendido na imple-menta¸cão da constru¸cão de curvas com multiplica¸cão complexa. Assim, os resultados deste trabalho consistirão exclusivamente de computa¸cões de curvas com multiplica¸cão complexa por √

−D, para valores bastante grandes de D.

As computa¸cões consistiram nas curvas citadas na dedicatória e agradecimentos do trabalho. Alguns dados a respeito destas computa¸cões são fornecidos na Tabela 7.1, em que todos os discriminantes são dados na forma fundamental, ao invés da forma reduzida empregada no restante do trabalho.

D h(D) h(D) precis˜ao usando precis˜ao usando

esperado heur´ıstica inical nova heur´ıstica

-1000147768 4128 14597 12832 -2001806020 5904 20651 19104 -3006633688 7248 25309 22656 -4004850712 9536 29209 28864 29120 -5022511288 9968 32711 30816 -6005976568 9616 35770 31040 31296 -7005075940 12504 38631 39648 40480 -8011737892 12192 41313 39104 40000 -9003700612 12760 43796 41408 42368 -10000129528 16336 46156 50944 51968 -20029259608 19676 65322 66880 -50051763448 26272 103261 93792

Tabela 7.1: Dados das computa¸c˜oes realizadas neste trabalho.

Deve-se observar que os números de classe dos discriminantes escolhidos estão muito abaixo da média, dada pela fórmula 0, 461559p|D| (12). Isto foi proposital; o número de classe afeta diretamente o tempo de execu¸cão do algoritmo (lembrando que o grau do polinômio de classe a ser constru´ıdo é igual ao número de classe). Além disso, a precisão necessária para os cálculos também é fun¸cão do número de classe.

Para realizar estes cálculos, criamos uma versão modificada do software que busca por discriminantes com número de classe abaixo de um certo limite, e comunica ao usuário os discriminantes encontrados e seu número de classe. Para cada um destes discriminantes, foi executada a primeira passada do algoritmo de cálculo do polinômio de classe (em-pregando baixa precisão), para estimativa da precisão real necessária. Os discriminantes mais favoráveis encontrados nessa etapa são os listados na Tabela 7.1. A quantidade de processamento empregada nessa etapa foi cerca de 1,5 dia, em um computador Pentium 4 2,6 GHz com 1 GB de memória RAM.

As curvas foram calculadas neste Pentium 4 2,6 GHz e em um Athlon XP 1,83 GHz com 1 GB de RAM, gentilmente cedido por Heron Franklin, exceto pela última linha da tabela. Esta computa¸cão exigiu uma quantidade maior de memória RAM e utilizou um computador Athlon MP 1,66 GHz com 4 GB de RAM, pertencente a um dos laboratórios do Departamento de Engenharia Elétrica. Os dez menores discriminantes foram calcu-lados em menos de 2 dias de processamento nos dois computadores citados no in´ıcio do parágrafo, sendo que ao mesmo tempo o programa de busca de discriminantes com baixo número de classe era executado no computador Pentium 4, de modo que o tempo real de processamento é ainda menor. O discriminante -20029259608 exigiu pouco mais de 1 dia de processamento no Athlon XP 1,83 GHz, enquanto o discriminante -50051763448 exigiu mais de 2 dias de processamento no Athlon MP 1,66 GHz.

Deve-se observar que, durante as computa¸cões iniciais, foi descoberto que a heur´ıstica para estimativa de precisão dos cálculos estava subestimando a precisão real necessária. Os discriminantes -4004850712 e -6005976568 não puderam ser calculados com a esti-mativa inicial de precisão, mas a heur´ıstica de reestimativa de precisão em face deste problema, que adiciona um múltiplo do número de falhas devidas a baixa precisão até então, permitiu o cálculo ainda na segunda tentativa. Atribu´ımos este problema ao con-junto de dados utilizado para desenvolvimento da heur´ıstica inicial, que era composto de discriminantes com números de classe mais próximos da média. Ademais, essa heur´ıstica dependia somente da precisão estimada pelos cálculos em baixa precisão e do número de classe. No entanto, observa-se na Tabela 7.1 que discriminantes com número de classe aproximadamente igual ainda apresentam divergências na precisão necessária, indicando uma dependência da precisão com o valor do discriminante em si. Este fato foi levado em conta na formula¸cão da nova heur´ıstica, que também depende do valor do discriminante. Através dela, os polinômios de classe restantes foram calculados na primeira tentativa sem erros de baixa precisão.

E poss´ıvel perceber que todos os discriminantes calculados são divis´ıveis por 4, e ne-nhum é divis´ıvel por 3. De fato, estes discriminantes apresentam propriedades desejáveis. A divisibilidade por 3 leva a requerimentos muito maiores de precisão, em torno de 3 vezes maiores. Já a divisibilidade por 4 leva a caracter´ısticas mais próximas de discriminantes menores, facilitando as computa¸cões: os números de classe são visivelmente menores, e a precisão exigida para as computa¸cões também é ligeiramente menor, que discriminantes na mesma faixa não divis´ıveis por 4.

Acreditamos que estes discriminantes representam novos recordes de computa¸cão: o maior discriminante anteriormente calculado (julho/2004), até onde sabemos, é -8581560955 (39). Até dezembro de 2004, nossas computa¸cões permanecem recordes.

8 Conclus˜ao

Argumentou-se neste trabalho (particularmente nas Se¸cões 5.1 e 5.2) que é poss´ıvel realizar demonstra¸cões de caráter primo em sistemas distribu´ıdos de larga escala. In-felizmente, o objetivo original do trabalho, que era fornecer uma prova concreta disso, através de um software que realizasse esta tarefa e fosse mais eficiente que as alternativas monoprocessadas existentes, não pode ser atingido por questões de tempo.

Apesar disso, a implementa¸cão parcial do sistema mostrou-se competitiva, pelo menos na área em que foi dedicado mais esfor¸co, a constru¸cão de curvas el´ıpticas com multi-plica¸cão complexa. Os resultados relatados nos Agradecimentos do trabalho, e discutidos na Se¸cão 7, incluem uma curva el´ıptica com multiplica¸cão complexa por um discriminante que é (até o conhecimento do autor) o maior já empregado neste tipo de cálculo.

Embora esse resultado pare¸ca impressionante, ele também enfatiza uma das princi-pais deficiências da implementa¸cão nesse ponto: conforme são empregados discriminantes progressivamente maiores nos cálculos, a ineficiência das rotinas de aritmética modular de polinômios fica mais clara, assim como as limita¸cões do algoritmo de Cantor-Zassenhaus implementado para a fatora¸cão desses polinômios. Mas otimiza¸cão nenhuma nessas áreas permitirá atingir resultados realmente espetaculares; para tanto, é preciso implementar uma técnica como a fatora¸cão sobre o corpo de gênero, ou uma das técnicas de solubi-lidade por radicais introduzidas por Fran¸cois Morain, que levam em conta a estrutura especial dos grupos de Galois dos polinômios de classe (40, Cap. 3.1) (41).

Outra deficiência está relacionado ao uso dos invariantes IEEE P1363 (20). Para discriminantes divis´ıveis por 3, esses invariantes exigem uma precisão cerca de 3 vezes maior que a média para discriminantes do mesmo tamanho. Outros invariantes foram propostos na literatura, como γ2 (14), e devem ser implementados futuramente.

Também está claro que as rotinas de aritmética modular empregadas poderiam ser melhoradas. Em (17), é utilizada a biblioteca FFTW para substituir as rotinas de mul-tiplica¸cão da biblioteca GMP, obtendo-se um grande ganho de desempenho. Por outro

lado, o website do GMP (27) afirma que a versão 5.0 da biblioteca está planejada para novembro de 2005, incluindo diversos algoritmos de complexidade reduzida e uma rotina de FFT mais eficiente para multiplica¸cão de inteiros. Desta forma, a melhor estratégia é não otimizar a aritmética modular neste momento, mas sim completar a implementa¸cão do sistema e otimizar outras áreas que necessitam de melhorias com maior urgência, como as descritas no parágrafo acima. Neste ponto, em que a nova versão do GMP já deve estar dispon´ıvel, pode-se avaliar se ainda é vantajoso substituir suas rotinas de multiplica¸cão por uma implementa¸cão baseada na biblioteca FFTW.

Outra grande área de estudo é a sele¸cão de parâmetros para os algoritmos de fatora¸cão de inteiros. Experimentos preliminares indicam que os parâmetros atuais estão longe de serem competitivos com outras implementa¸cões do ECPP. Neste sentido, o autor vislum-brou uma nova forma de análise do algoritmo ECPP, que pode contribuir com esta sele¸cão de parâmetros, mas isto será objetivo de um trabalho futuro. Deve-se estudar também a precisão necessária para cálculo dos polinômios de classe: mesmo na gera¸cão de alguns resultados para este trabalho, foram observadas deficiências na heur´ıstica utilizada até então para estimativa de precisão. Nesse sentido, talvez uma abordagem experimental para a determina¸cão do comportamento desse parâmetro seja válida, uma vez que as abordagens teóricas se mostraram insatisfatórias.

No documento Caráter Primo em Larga Escala (páginas 99-105)