Sistemas de computação e
análise de dados
I Workshop RENAFAE
Eduardo Gregores
LHC: Uma nova escala em computação
21500 MByte/s
100 MByte/s
20 MByte/s
Stored
(After Level 3)
Processamento Distribuído
Eduardo Gregores XXVII ENFPC
Águas de Lindóia, 2006 4
Tier 0
Tier 1
Arquitetura Grid de Processamento
• Grid é um sistema que coordena recursos sem um sistema de
controle central.
• Usa protocolos padrão e código aberto.
• Possue diferentes níveis de funcionalidade.
•
Aplicativos e Serviços
– Programas dos Usuários
– Interfaces de Uso
– Interfaces de Monitoramento.
•
Middleware
– Acesso aos processadores
– Acesso aos dados
– Servicos de Informação
•
Recursos
– Servidores, Discos, etc..
•
Infraestrutura de Rede
– Conexões, Roteadores, etc...
5Rede KyaTera‐GridUNESP
Rio Claro
UNESP UFSCar PUCC CPqD UNICAMP CenPRA11
6
2
1
1
1
21
MackenzieRibeirão Preto
USP COC USPBaurú
São José Rio Preto
Unesp 15 kmUnesp
Araraquara
4
1
1
1
ITASão José Campos
UF ABCSto André
UNISANTOSSantos
São Paulo
1
1
1
11
1
USP USP1 Gb/s
Campinas
Terremark InternacionalSão Carlos
20
Rede Experimental
Americana Catanduva Arujá10 Gb/s
Amplificadores ópticos
UNESPBotucatú
1
Barra FundaIlha Solteira
UnespC‐Wave traffic ‐ Rio & São Paulo contribution
Recursos Heterogêneos
T0 CERN
T2 UERJ
T2 SPRACE
GridUnesp
8 Clusters & 33.3 Teraflops
•
Central Cluster (2,048 cores)
– 4 Servers
– 256 two Quad Core nodes
– RAID =108 TB
– Infiniband technology
127 X
•
Distributed Clusters (896 cores)
– 1 Server
– 16 two Quad Core nodes
– RAID = 12 TB
– Gigabit
Elementos do Grid
Alocador de Recursos
– Recebe os pedidos dos usuários – Encontra os recursos necessários – Pergunta ao Índice de InformaçõesÍndice de Informações
– Mantém a informaçào sobre os recursos disponíveis – Pode residir na mesma máquina que o Alocador de RecursosGerenciador de Réplicas
– Coordena o replicação dos dados – Providencia a redundância dos dados – Move os dados para a proximidade do local onde será realizado o processamentoCatálogo de Réplicas
– Pode residir na mesma máquina que o Catálogo de Réplicas – Mantém a informação sobre as réplicas – Associa o nome lógico do dado a um ou mais nomes físicosElemento de Processamento
– Recebe os pedidos de trabalho e os distribui aos trabalhadores – Provê a interface entre o Grid e os sistema de ordenamento de trabalhos – Pode gerenciar um ou mais trabalhadores.Nó de Trabalho
– É a máquina que faz o processamento dos dados.Elemento de Armazenamento
– Provê espaço de armazenamento de dados – Provê uma interface homogênea aos diversos Sistemas de Armazenamento.Interface do Usuário
– Habilita o acesso ao Grid. 13Arquitetura Básica de um Grid
Arquitetura Típica de Site
15 Gateway GatekeeperComputing
Element
Head Node
OSG Condor Home NFS / NIS PhEDEx SRMStorage
Element
Head Node
PNFS dCacheWorker Nodes
Condor Pool
Login WebUsers
Access
Condor Pool GSIFtpDisk Server
NFS dCachePool
Pool
Pool
Pool
Files
Pool
LAN
WAN
Home OSGVO’s software
Data
Jobs
dCacheLHC Computing Grid (LCG)
16177 localidades
31 paises
27.500 CPU’s
44.300 TB de disco
Open Science Grid ‐ OSG
1766 localidades
5 paises
24.000 CPU’s
83.500 TB de disco
CMS Grid Applications
• Monte Carlo Production
– Allows processing tasks to be distributed to Grids and Farms.
– Centrally managed by dedicated teams.
• ProdRequest: User and admin request management frontend application.
• ProdMgr: Supplies work to ProdAgent based on requests from ProdRequest.
• ProdAgent: Network of agents that execute the workflows on some resource.
• Analysis Jobs
– CRAB (CMS Remote Analysis Builder)
• Run CMSSW on Grid environments
• Enqueue the following steps: job creation, submission, status check, output
retrieval.
– JobRobot
• Perform user analysis using CRAB on CMS resources on a large scale
• use the LCG/EGEE resource broker to submit jobs.
• run analysis jobs on all datasamples at all sites individually.
• PhEDEx: The CMS data replication service
– One copy at Cern; one distributed copy at regional centers
– Among and between regional and local centers
GridUNESP Research Areas
Medical
Physics
Biological
Networks
Molecular
Dynamics
19Lattice
QCD
Relativistic
Chemistry
Geological
Modeling
Turbulence
Network
Security
High Tc
Superconductivity
Structure Factor S(k) - F = 1.2 - Kagomé Lattice
X Direction
Uso do SPRACE pelas VO’s
VO Last Min Avg Max
ATLAS 2 0 0.908 11 CMS 11 0 19.66 221 DZERO 139 0 93.91 226 FERMILAB 0 0 1.177 101 GLOW 10 0 50.56 117 LIGO 32 0 80.11 224 OSG 0 0 0.736 18