Escalabilidade e Elasticidade para Computação de Alta Vazão

Alta Vaz˜ao

Computação paralela é uma tecnologia chave para permitir o processamento tempestivo da quantidade crescente de dados que está sendo gerada por sensores, experimentos cient´ıficos, modelos de simulação e, ultimamente, como um efeito da era de digitalização que a nossa sociedade como um todo está experimentando. De fato, algumas das cargas de trabalho (workloads) que precisam ser processadas são tão grandes, que a única maneira viável para lidar com elas, em um tempo razoável, é quebrar o processamento em uma determinada quantidade de tarefas menores, e executá-las em paralelo no maior número dispon´ıvel de processadores. Em uma classificação bastante ampla, notadamente quando se consideram as diferenças entre as caracter´ısticas das cargas de trabalho, a computação paralela é normalmente dividida em Computação de Alta Performance (HPC, do inglês High Performance Computing) e Computação de Alta Vazão (HTC) [Litzkow, Livny e Mutka 1988].

Obviamente, paralelismo em larga escala só pode ser alcançado se houver unidades de processamento dispon´ıveis e um n´ıvel relativamente elevado de independência entre as tarefas que compõem a aplicação paralela. Felizmente, muitas das cargas de trabalho das aplicações paralelas podem ser mapeadas em tarefas que podem ser processadas de forma completamente independente uma das outras, compondo uma classe de aplicações conhecida como “bag-of-tasks” (BoT) [Cirne et al. 2003]. O fato de que as tarefas de uma aplicação BoT são totalmente independentes, não só faz o agendamento trivial, mas também faz com que a tolerância a falhas seja muito mais fácil, já que um mecanismo de repetição simples

3.2 Escalabilidade e Elasticidade para Computação de Alta Vazão 45

pode ser usado para recuperar tarefas que eventualmente falhem durante a execução. Como consequência, as aplicações BoT são menos exigentes com a qualidade do serviço suportado pela infraestrutura computacional subjacente.

A vazão obtida quando se executam aplicações HTC, em geral, e BoT, em particular, sobre uma infraestrutura computacional distribu´ıda depende diretamente da escala que a mesma permite. O tamanho do pool de processamento, definido como o número de processadores alocados, é o principal promotor de desempenho, enquanto que o esforço de coordenação envolvido é o principal fator de limitação. Para atingir uma vazão extremamente alta é necessário operar eficientemente em escala extremamente alta, assumindo que a distribuição de tarefas para os processadores dispon´ıveis e o fornecimento de qualquer dado de entrada necessário ou coleta dos resultados gerados não sejam um gargalo.

De fato, a execução eficiente de aplicações BoT tem sido relatada em uma variedade de infraestruturas para computação de alta vazão (HTC), que vão desde grades P2P [Litzkow, Livny e Mutka 1988; Cirne et al. 2006] até sistemas massivos de computação voluntária [An- derson et al. 2002; Anderson 2004].

O paradigma de grades de desktops (desktop grids) já se consagrou como um ambiente apropriado para computação de alta vazão. O Projeto Condor [Litzkow, Livny e Mutka 1988] é reconhecido como o melhor representante existente de tecnologias para dar suporte a grades de desktops de alta vazão. Outros sistemas que seguiram a filosofia do Condor provaram também ser igualmente eficazes [Cirne et al. 2006; Oliveira, Lopes e Silva 2002]. Estas infraestruturas genéricas são, entretanto, sistemas de escala limitada. Mesmo se algum tipo de mecanismo de incentivo for usado [Andrade et al. 2007], é improvável que um sistema que integra mais do que algumas dezenas de milhares de computadores possa ser montado. De fato, os maiores sistemas existentes que usam estas tecnologias não possuem mais do que alguns poucos milhares de computadores [Thain, Tannenbaum e Livny 2006].

Plataformas para computação voluntária (Voluntary Computing) [Anderson et al. 2002; Anderson 2004], por outro lado, já provaram a sua adequação para prover HTC e podem congregar quantidades enormes de recursos para processar a carga extremamente alta de suas aplicações t´ıpicas. Estas infraestruturas poderosas são, entretanto, menos flex´ıveis em relação aos tipos de aplicações que suportam. Primeiro, porque configurar uma infraestrutura de computação voluntária tem um custo significativamente mais elevado do que executar

aplicações BoT de ciclos de vida curtos sobre grades de desktops - isto se deve, principal- mente, pelo fato de que é necessário conseguir voluntários para a iniciativa. Desta forma, tais plataformas tendem a ser mais apropriadas para executar aplicações BoT de longa duração cuja carga de trabalho é virtualmente infinita [Anderson et al. 2002]. Além disso, a eficácia da obtenção de recursos voluntários para tais plataformas é profundamente influenciada pelo impacto percebido da aplicação que irá ser executada sobre elas. Em conseqüência, somente algumas aplicações de forte apelo popular podem beneficiar-se da vazão extremamente alta que os sistemas de computação voluntária podem entregar. Mesmo assim, isso só pode ser alcançado se um esforço significativo for dedicado a convencer os participantes voluntários a aderir ao sistema o que, por sua vez, depende, em maior ou menor grau, de fatores tais como o mérito e o apelo público da aplicação, da quantidade de cobertura da m´ıdia recebida, de campanhas de publicidade expl´ıcita em meios populares de comunicação, de marketing viral, dos incentivos para os voluntários e de outras atividades de relações públicas [Shiers 2010]. A escalabilidade na implantação deste tipo de projeto também depende de tornar a tarefa de instalação extremamente simples e contar com o proprietário do recurso envolvido ativamente na configuração do sistema. Normalmente, a implantação é bem simplificada, constando basicamente do download e da instalação de um programa, o que pode ser fa- cilmente realizado pelo proprietário do recurso. Entretanto, não há uma padronização do que deve ser instalado por cada projeto de computação voluntária, o que requer a repetição do esforço de instalação por parte do voluntário. Por exemplo, um usuário que deseja doar recursos computacionais para os projetos SETI@home [Anderson et al. 2002] ou Fight- AIDS@home [Scripps 2011] deve instalar duas aplicações espec´ıficas e diferentes, cada uma com os seus próprios protocolos e parâmetros.

Se por um lado, o envolvimento do usuário permite a implantação potencial em milhões de recursos com baixo custo, do outro lado, isto torna o crescimento da infraestrutura lento e fora do controle do gestor do projeto de computação voluntária. Além disso, as mudanças no software instalado nos recursos são mais dif´ıceis de serem realizadas, a menos que algum procedimento de atualização automática seja fornecido. Isto, por sua vez, pode aumentar as preocupações de segurança por parte dos voluntários e, eventualmente, afetar negativamente a sua vontade de aderir ao sistema. Além disso, a singularidade intr´ınseca de cada aplicação e a necessidade de configuração inicial, diminui consideravelmente a flexibilidade destas pla-

No documento Just in time clouds: uma abordagem baseada em recursos terceirizados para a ampliação da elasticidade de provedores de computação na nuvem. (páginas 61-64)