• Nenhum resultado encontrado

4. Análise de Grid Computing

4.1.3 Estudo de Caso – Worldwide LHC Computing Grid

4.1.3.3 Análise

Incia-se a análise do WLCG com base em no principal desafio que influenciou o CERN a adotar a tecnologia de Grid Computing para a construção de sua infra-estrutura

OV Afiliação LHC

ALICE ALICE experimento

ATLAS ATLAS experimento

CMS CMS experimento

DTEAM

LHCb LHCb experimento

SixTrack Single Particle Tracking Code Grupo de deployment do LCG

computacional: O alto custo do projeto.

Grid Computing teve um papel importante para adequar o modelo de investimento

financeiro para habilitação do projeto WLCG. Conforme abordado anteriormente, o CERN investiu em torno de 100 milhões de Euros em materiais e recursos humanos para a construção da infra-estrutura computacional do LHC. Entretanto, esse investimento corresponde a somente 20% do total do custo do projeto, sendo que as outras instituições que fazem parte do projeto foram responsáveis por seus próprios investimentos, que somados correspondem ao custo total do WLCG.

É importante notar que Grid Computing é uma tecnologia que fornece eficientes funcionalidades para este tipo de modelo de investimento, permitindo que inúmeras instituições possam construir em conjunto um ambiente computacional compartilhado, e que o seu investimento total seja distribuído por todos os participantes.

Embora o CERN seja o fundador do projeto, é notório que sozinho não teria condições financeiras de habilitar um ambiente computacional com a capacidade necessária para o processamento dos dados do LHC. Estima-se que o experimento possa gerar em torno de 15

Petabytes por ano, e que essa quantidade possa aumentar ao longo do tempo. Assim, somente

uma infra-estrutura de larga escala e com alta capacidade escalável poderia processar esses dados com eficiência, situação que corresponde a um alto custo de investimento, tanto em recursos computacionais como também em pessoal especializado.

O CERN contou com a ajuda de mais de 140 instituições para a construção do WLCG, considerado um dos ambientes computacionais com mais poder de processamento na atualidade. O WLCG é uma infra-estrutura de Grid Computing que integra recursos computacionais de universidades, centros de computação, instituições de pesquisas espalhados ao redor do mundo. A maioria dos envolvidos na construção do WLCG colabora através do compartilhamento de recursos computacionais e também do fornecimento de mão- de-obra especializada.

É importante destacar que a capacidade de processamento do WLCG é proveniente da colaboração de cada entidade envolvida no projeto. Conforme visto no Gráfico 3, a segunda camada (Tier-1) e a terceira camada (Tier-2) são os grandes responsáveis pelo nível de processamento do ambiente, uma vez que são os maiores colaboradores de recursos de CPU. A mesma situação também pode ser observada para o espaço de armazenamento em disco.

a segunda camada corresponde a 11 instituições com link dedicado ao CERN e a terceira camada é composta por mais de 140 sítios de computação ao redor do mundo. A transferência de dados inicia-se no CERN, que os envia para os sítios da segunda camada, que por sua vez são responsáveis por abastecer os sítios da terceira camada.

Percebe-se assim uma estrutura de confiança baseada em hierarquia entre todas as camadas. O CERN (Tier-0) é a camada principal da estrutura do WLCG, pois é o responsável por receber os dados gerados pelo LHC, efetuar o processamento inicial, enviá-los para os sítios da segunda camada (Tier-1) e armazená-los para propósito de backup. O CERN tem uma importância fundamental para o funcionamento do WLCG, pois se seu sítio de computação estiver fora do ar, nenhum outro sítio das outras camadas receberão novos dados.

Já os sítios da segunda camada são responsáveis por receber os dados do CERN, analisá-los de forma intensiva e também oferecer suporte regional para os sítios da terceira camada (Tier-2). Geralmente os sítios de terceira camada são associados, baseando-se em proximidade geográfica, a um sítio de segunda camada, o qual é responsável pela transferência dos dados necessários de acordo com o modelo de Organizações Virtuais.

É perceptível que nessa situação o impacto de um problema causado em qualquer sítio da segunda camada é bastante preocupante, pois uma situação de emergência colocaria o próprio sítio de segunda camada e todos os seus respectivos sítios de terceira camada em estado de alerta. Entretanto, é importante citar que o ambiente do WLCG continuaria funcionando com base nos outros sítios de segunda e terceira camada. Em uma configuração de Grid Computing baseada totalmente na descentralização, onde um sítio não depende do outro, um problema que ocorresse em uma determinada localidade teria um impacto ainda menor.

Essa característica é importante para ressaltar questões como segurança e transparência em uma infra-estrutura de Grid Computing. No projeto do WLCG, o qual utiliza uma configuração em camadas, percebe-se que nem mesmo o CERN (Tier-0) tem controle absoluto do ambiente informacional. O CERN pode afetar o ambiente apenas não enviando novos dados, porém aqueles que já foram transferidos estão em poder de inúmeras instituições ao redor do mundo.

Foi visto até o momento que a colaboração é um fator importante para o projeto do WLCG para a constituição de sua infra-estrutura computacional. Entretanto, conforme foi destacado anteriormente, Grid Computing favorece o 2-Ways Collaboration, ou seja, os

envolvidos no projeto colaboram inicialmente através do compartilhamento de seus recursos computacionais para habilitar um ambiente de larga escala, o qual fornece funcionalidades para o trabalho colaborativo, execução de aplicações em conjunto e compartilhamento de dados de forma transparente, principalmente devido à arquitetura descentralizada da tecnologia.

O projeto do WLCG tem o objetivo de prover os dados gerados pelo LHC para mais de sete mil cientistas pertencentes a diferentes entidades, as quais podem estar associadas a uma, ou mais, Organizações Virtuais. É importante citar que o modelo de OV tem papel importante no WLCG para organizar o acesso aos dados, trazendo maior confiabilidade e confiança para o ambiente colaborativo. Assim, uma instituição que participa apenas do experimento ALICE (consequentemente é associada à OV ALICE), não poderá receber dados provenientes do experimento ATLAS, mesmo ambos os experimentos estarem disponibilizando seus dados na mesma infra-estrutura.

Destaca-se também que o WLCG desempenhou uma função interessante para a inclusão científica do projeto do LHC. Primeiro, esse projeto tornou possível a criação de um ambiente computacional de larga escala e com custo distribuído, o que favoreceu o investimento a partir de diversas fontes. Segundo, o WLCG permite que as instituições de pesquisas que não tinham a possibilidade de efetuar pesquisas na área de físicas de partículas, principalmente de uma riqueza tão abrangente como a do LHC, possam participar ativamente de um dos maiores experimentos científicos da humanidade, seja apenas acessando os dados, executando aplicações ou até mesmo compartilhando resultados.

Basicamente, o que o WLCG proporciona é um ambiente de trabalho compartilhado por cientistas espalhados por todo o globo terrestre. Os cientistas do CERN podem trabalhar em conjunto com cientistas do Japão, Índia, Estados Unidos, e Brasil, por exemplo. Onde cada instituição tem um papel a desempenhar para contribuir com uma parcela significante para o projeto, e que todos juntos possam tornar a grande descoberta da humanidade uma realidade. Até mesmo os cientistas individuais podem ter acesso a esse ambiente através de recursos de uma quarta camada (Tier-3), que pode ser constituída de servidores de um departamento de uma universidade ou até mesmos de um simples computador pessoal.

Com base na análise das características do WLCG, pode-se (PODEM-SE) destacar algumas vantagens da tecnologia de Grid Computing:

• Múltiplas cópias de dados podem estar armazenadas em diferentes sítios de computação, garantindo assim acesso para todos os cientistas envolvidos independentemente de suas localizações geográficas.

• Aperfeiçoamento da utilização da capacidade excedente de recursos computacionais, tornando-os mais eficientes.

• Redução dos pontos únicos de falha no ambiente.

• O custo de operação e manutenção é distribuído por todos os envolvidos, onde cada um é responsável por seus equipamentos, mas todos juntos colaboram para o objetivo global.

• Pesquisadores e cientistas não precisam deixar os seus países para participar do projeto, uma vez que os dados estarão disponíveis em seus recursos computacionais.

• A comunidade é beneficiada com o surgimento de novas tecnologias que favorecem a redução do custo e também o consumo de energia.

A colaboração é o fundamento do projeto do WLCG, e não está englobando apenas as entidades científicas que fazem parte dos projetos. Há indústrias que também apóiam o projeto ajudando os cientistas do CERN a desenvolver novas tecnologias e também melhorar as já existentes. Inclusive, existem alguns produtos vendidos no mercado que são frutos de esforços do projeto do WLCG. O projeto CERN Openlab (2009) tem foco na contribuição de parceiros de indústrias especializadas, como Intel, Oracle e HP. Essa situação fortalece o cenário de que a colaboração pode ditar o desenvolvimento de novos produtos, tanto nas comunidades sociais, como também nas indústrias especializadas.