Algoritmos para distribui¸ c˜ ao de dados

5 Sistemas Distribu´ ıdos

5.2 Algoritmos para distribui¸ c˜ ao de dados

A motiva¸cão para esta se¸cão é o seguinte problema: dada uma certa informa¸cão, presente em um nó de um sistema distribu´ıdo, como transmitir esta informa¸cão para todos os nós do sistema da forma mais eficiente poss´ıvel? No contexto do algoritmo ECPP, esta informa¸cão poderia ser, por exemplo, um comando para migrar para a próxima tarefa de certifica¸cão, ou as precomputa¸cões necessárias para execu¸cão do algoritmo. Na literatura, esta opera¸cão é conhecida como broadcast (7).

Vamos considerar o primeiro exemplo. Neste caso, o servidor central, que coordena todas as tarefas da rede, recebeu de um cliente a informa¸cão de que é poss´ıvel proceder a uma nova etapa de certifica¸cão. Após verificar a veracidade dessa informa¸cão, o servidor precisa notificar todos os clientes da rede que devem migrar para uma nova tarefa.

O servidor poderia conectar em cada um dos clientes e transferir esta informa¸cão, porém isto exigiria c conexões (onde c é o número de clientes na rede) por parte do servidor, implicando em um alto custo de comunica¸cão para o mesmo. A quantidade de tempo necessária para realizar todas as conexões também seria relativamente grande.

Permitindo aos clientes conectarem-se entre si, é poss´ıvel distribuir a carga de conexões de maneira aproximadamente uniforme entre todos os elementos da rede. Primeiramente numera-se cada elemento da rede de maneira aleatória, exceto que ao servidor é atribu´ıdo o número 0. Num primeiro instante, o nó 0 (o servidor) envia os dados aos nó 1. Num segundo instante, o nó 0 envia os dados ao nó 2, e o nó 1 envia os dados ao nó 3. Prosseguindo desta forma, após dlog₂ce passos, todos os nós da rede terão recebido os dados, e a quantidade máxima de conexões realizadas por nó também é dlog₂ce. O processo é ilustrado graficamente na Figura 5.1.

Figura 5.1: Propaga¸c˜ao eficiente de dados.

Pode não ser desejável envolver todos os usuários na retransmissão das informa¸cões, por exemplo por motivos de seguran¸ca. Outra razão é que dois usuários que estejam

por trás de firewalls não conseguirão conectar-se entre si. Uma organiza¸cão semelhante seria uma estrutura hierárquica de nós, conforme ilustrada na Figura 5.2. Estes nós poderiam ser nós privilegiados, executando um software diferente (e possivelmente nem mesmo contribuindo para as tarefas com tempo de processamento), ou simplesmente nós comuns, em que o administrador da máquina configurou a rede de maneira a permitir conexões. Em ambos os casos, estes nós serão conhecidos como proxies.

Figura 5.2: Estrutura hier´arquica de rede.

Além de reduzir os requerimentos de comunica¸cão no servidor central e o tempo necessário à propaga¸cão de informa¸cões pela rede inteira, as estruturas hierárquicas de rede apresentam outra vantagem: é poss´ıvel realizar verifica¸cões distribu´ıdas de validade de resultados, uma medida descrita na se¸cão seguinte para deteçcão de usuários maliciosos ou com hardware defeituoso. No entanto, utilizar máquinas não-confiáveis para verificar a confiabilidade de resultados não provê garantias de validade, de modo que alguns nós na hierarquia devem ser nós cuja confiabilidade possa ser garantida de alguma forma. Mesmo assim, verifica¸cões em n´ıveis mais baixos da hierarquia permitem a elimina¸cão de alguns (senão todos) os resultados incorretos, diminuindo a carga sobre os n´ıveis superiores.

5.3 Computa¸cão em ambientes não-confiáveis

Como garantir que uma computa¸cão realizada em um computador desconhecido esteja correta, ou mesmo que ela tenha sido realizada de fato? Este é um dos grandes problemas enfrentados pelas redes de computa¸cão distribu´ıda atuais.

Primeiramente, é preciso questionar as razões que levam participantes da rede a reali-zar computa¸cões incorretas. Alguns casos estão relacionados a falhas de hardware, devidas a componentes de baixa qualidade, susperaquecimento, ou a prática conhecida como

over-clocking, que é a opera¸cão de alguns subsistemas do computador fora de sua espefica¸cão. Outra possibilidade são indiv´ıduos com inten¸cões maliciosas, dispostos a demonstrar a vulnerabilidade dos sistemas distribu´ıdos a ataques. Uma última e importante possibi-lidade está relacionada às ‘estat´ısticas’ do projeto, que coletam dados como os usuários e times de usuários que mais contribu´ıram para o projeto; alguns indiv´ıduos, sem poder computacional para avan¸car nesta lista, empregam meios il´ıcitos para manipulá-la.

A vulnerabilidade de um sistema distribu´ıdo a computa¸c˜oes incorretas depende, em ´

ultima instância, da vulnerabilidade do algoritmo implementado no sistema (o ECPP no caso deste trabalho) para resolver o problema proposto. Felizmente, o ECPP possibi-lita diversas verifica¸cões intermediárias da validade da computa¸cão, todas de baixo ou médio custo, que serão estudadas agora. Serão feitas referências aos passos do algoritmo fastECPP na ordem descrita na Se¸cão 5.1.

Primeiramente, seja uma potencial fatora¸c˜ao da ordem do grupo de uma curva el´ıptica, realizada durante o passo 2 do algoritmo. A verifica¸c˜ao da validade deste resultado poderia proceder da seguinte maneira:

1. Primeiramente, verifica-se se o discriminante em questão é válido. É razoável exigir que, ao invés de transmitir o discriminante em si, o cliente transmita os fatores do discriminante, utilizando a representa¸cão binária de subconjuntos da base de fatores discutida na Se¸cão 5.1. Através deste artif´ıcio, a verifica¸cão da validade do discriminante é dispensada.

2. Verifica-se então que a ordem do grupo é válida. Exceto para os casos D = −3, −4, a ordem é dada por n_i+1±U , onde n_ié conhecido, e U satisfaz a rela¸cão 4n_i = U2+ DV2, sendo que D também é conhecido. Pode-se exigir a transmissão de V junto com o resultado, simplificando consideravelmente a verifica¸cão, mas aumentando os requerimentos de comunica¸cão; ou pode-se verificar que (4n_i− U2)/D é um inteiro e quadrado perfeito. Nem é preciso calcular uma raiz quadrada do valor para verificar que o mesmo é um quadrado perfeito; pode-se utilizar os métodos descritos em (12), que testam se o inteiro em questão é um res´ıduo quadrático módulo primos pequenos, o que sempre ocorre quando o mesmo é um quadrado perfeito.

3. Por fim, determina-se se a fatora¸cão relatada da ordem de grupo é válida. É desejável que os fatores encontrados sejam transmitidos junto com o resultado; geralmente o tamanho dos mesmos será de algumas dezenas (ou no máximo poucas centenas) de bits. Dividindo a ordem do grupo pelos fatores, o resultado deve ser um inteiro,

o que é de fácil verifica¸cão, mas também um primo provável; a verifica¸cão desta ´

ultima propriedade exige uma quantidade razo´avel de computa¸c˜ao.

O último passo, que envolve um teste de caráter pseudoprimo, parece indicar que a verifica¸cão de validade não possui tão baixo custo quanto desejável. No entanto, é preciso colocar este fato em perspectiva: a obten¸cão de valores que satisfa¸cam as verifica¸cões anteriores é uma tarefa relativamente custosa, bem mais custosa que o teste de caráter pseudoprimo. Isto sugere a seguinte estratégia: ao realizar o teste de caráter pseudoprimo sobre o cofator do resultado em questão, caso o teste afirme que o cofator é composto, o proxy não descartará os parâmetros em questão (como discriminante, ordem de grupo, fatores, etc.) após a verifica¸cão, como poderia se esperar. Ao invés disso, estes parâmetros são armazenados (e possivelmente enviados a outros proxies) para que tentativas poste-riores de verifica¸cão usando este resultado sejam detectadas imediatamente, evitando o desperd´ıcio de computa¸cão. Assim, um adversário malicioso precisa executar uma quan-tidade muito grande de computa¸cão em troca de um pequeno desperd´ıcio nos proxies, tornando tais ataques fúteis.

Deve-se verificar também a validade dos resultados obtidos no item 3 e 4 do algoritmo fastECPP. Felizmente, isto também é fácil, uma vez que é a mesma tarefa que deve ser realizada para verificar a validade de um certificado do ECPP. Poderia-se argumentar que o custo de O ((log n_i)²⁺), onde n_i é o primo atual da cadeia de certificados, não é tão baixo assim. Porém, deve-se lembrar que a constru¸cão de curvas é um evento que ocorre com baix´ıssima frequência; há no total O(log n) destes eventos durante a certifica¸cão de um inteiro n.

Assumindo que resultados incorretos sejam devidos somente a hardware defeituoso, o custo computacional das verifica¸cões é desprez´ıvel. No entanto, caso a rede seja alvo de um ataque malicioso bem planejado, os protocolos de rede do sistema deverão levar este fato em conta para evitar desperd´ıcios e até uma poss´ıvel exaustão de recursos.

Uma possibilidade é o esquema de (22) e seus sucessores; quando o cliente conectar a um proxy para retornar resultados, será exigido do cliente a realiza¸cão de uma computa¸cão de alguns segundos, espec´ıfica para aquela conexão. Isto limita a taxa de conexões de adversários, enquanto usuários honestos, que conectam pouco frequentemente, não são afetados.

Ao mesmo tempo, pode-se empregar um sistema seguro de identifica¸cão de usuários, baseado em assinaturas digitais. Deste modo, é poss´ıvel associar resultados ao usuário

que produziu os mesmos, e rejeitar resultados de usuários suspeitos. Poderia-se empre-gar o esquema de (23) ou as versões melhoradas de (24, 25), que permitem verifica¸cão extremamente rápida de assinaturas.

Por outro lado, devido aos problemas de hardware defeituoso já mencionados, não se deve assumir que um resultado incorreto é sinal de ataque à rede: o usuário deve ser informado do fato e posto em quarentena até que corrija o suposto problema de hardware.

6 Projeto e Implementa¸c˜ao do

No documento Caráter Primo em Larga Escala (páginas 83-88)