• Nenhum resultado encontrado

Computação Paralela: Algoritmos e Aplicações. Prof. Amit Bhaya, Programa de Engenharia Elétrica, COPPE/UFRJ 09/05/ /05/2000

N/A
N/A
Protected

Academic year: 2021

Share "Computação Paralela: Algoritmos e Aplicações. Prof. Amit Bhaya, Programa de Engenharia Elétrica, COPPE/UFRJ 09/05/ /05/2000"

Copied!
64
0
0

Texto

(1)

Computação Paralela: Algoritmos e Aplicações

Prof. Amit Bhaya,

Programa de Engenharia Elétrica, COPPE/UFRJ 09/05/2000 -- 12/05/2000

(2)

Conteúdo do minicurso

Conteúdo do minicurso •Computação paralela e de alto desempenho.

Taxonomia básica. A experiência da COPPE.

• Justificativa e ganhos com o paralelismo. •Algoritmos numéricos paralelos síncronos e

assíncronos.

•Modelos matemáticos. Análise de convergência.

Exemplos.

• Resolução de sistemas complexos de grande porte. •Algoritmos combinados. Critérios de partição.

•Distribuição de carga. Exemplos.

• Técnicas de otimização natural. Meta-heurística. • Adequação às máquinas paralelas e de alto

desempenho.

(3)

HIPÓTESES

HIPÓTESES

Os alunos (não) têm noções de computação paralela – o grupo é heterogêneo

Os alunos têm algum conhecimento de métodos numéricos simples

(4)

Bibliografia

Bibliografia

!T.L. Freeman & C. Phillips, “Parallel Numerical Algorithms”, Prentice Hall,

1993*

•F.Thomson Leighton, “Introduction to Parallel Algorithms and Architectures:

Arrays. Trees. Hypercubes, Morgan Kaufmann Publishers, 1992

•Dan I. Moldovan, “Parallel Processing from Applications to Systems”, Morgan

Kaufmann Publishers, 1993

•Daniel E. Lenoski & Wolf-Dietrich Weber, “Scalable Share-Memory

Multiprocessing”, Morgan Kaufmann Publishers, 1995

•Geoffrey G. Fox, Roy D. Williams and Paul C. Messina, “Parallel Computing

Works!”, Morgan Kaufmann Publishers, 1994

•Russ Miller & Quentin F. Stout, “Parallel Algorithms for Regular Architectures:

Meshes and Pyramids”, MIT Press Cambridge, 1996

•Kai Hwang, “Advanced Computer Architecture: Parallelism, Scalability,

Programmability”, McGraw-Hill Series in Computer Engineering, 1993

•A. Cichocki & R. Unbehauen, “Neural Networks for Optimization and Signal

Processing”, John Wiley & Sons, 1993

(5)

Noções e conceitos

Noções e conceitos

Noções e Conceitos de Paralelismo / Taxonomia / Arquiteturas (fundamentos)

Algumas considerações sobre software

Paralelismo na resolução (iterativa) de equações simultâneas

(6)

Paralelismo

Paralelismo

O paralelismo é natural no dia a dia !!

Exemplos:

" " "

" Caixas de supermercado ou banco

pouca ou nenhuma comunicação entre os

agentes

com supervisor/ou não

(7)

Paralelismo (continuação)

Paralelismo (continuação)

Serviço de despertador (7h)

não pode ser feito sequencialmente (por razões óbvias)

nenhuma comunicação entre os agentes

embarassing parallelism

" Aula de ginástica

ginastas

(8)

No contexto dos computadores

No contexto dos computadores

Pergunta: se é tão comum e importante porque é

que os computadores eram puramente sequenciais?

Resposta: o paralelismo trazia problemas extras de:

comunicação

sincronização

hardware/software

(9)

No contexto dos computadores( continuação)

No contexto dos computadores( continuação)

O modelo de Von Neumann de apenas uma CPU

Memória CPU

execução

(10)

No contexto dos computadores( continuação)

No contexto dos computadores( continuação)

Mais tarde surgiram os “Pipelines”

Performance :

• Megaflops (Millions of floating point

operations per second)

• Mips Millions of instructions per second)

Nominais (pico) X

(11)

Evolução de computadores.

Evolução de computadores.

#1946 – ENIAC Pennsylvania #1953 – IBM 701

#(Evolução nos semicondutores)

# 1975 – CRAY – supercomputadores ( Megaflops) # 1985 – CRAY 2/Y-MP (Gigaflops)

paralelismo limitado

paralelismo a nível de instruções básicas/pipelines

unidades de processamento poderosas e caras/trabalhando em paralelo

(12)

Evolução de computadores.( contimuação )

Evolução de computadores.( contimuação )

Caltech cube (Fox)

# 1985 – Multiprocessadores/Intel (128 nós)/N Cube etc.

arranjos de múltiplos processadores/CPU’s

para competir com o preço dos supercomputadores (na mesma faixa de Flopagem)

#Hoje a Silicon Graphics/CRAY aumenta o número de processadores

#Tendência é de Multiprocessadores/

Multicomputadores/ escaláveis (centenas de nós)

a programação dependente das arquiteturas?

(13)

Evolução de alguns computadores de alto desempenho

(14)

Processadores vetoriais (com Pipelines)

Processadores vetoriais (com Pipelines)

Cada instrução é dividida em quatro fases

busca de instrução

cálculo do endereço do operando

busca do operando

operação aritmética

Algumas dessas fases podem ser feitas concorrentemente (pipelining in vector operations)

CRAY $$$$ (system and pipeline/paralelismo)*

discussão da taxonomia shared/distributed/vector ficou misturada, todavia é utilizada como referência

(15)

Processadores vetoriais (com Pipelines)

(16)

Evolução de flopagem

(17)

Objetivos do Paralelismo

Objetivos do Paralelismo

Reduzir tempos

(Possibilidades de cálculos em “tempo real”) / simulação em tempo real. Meteorologia. Previsão de tempo (em tempo hábil).

Viabilizar a resolução de problemas que não poderiam ser considerados anteriormente

Maior precisão (no mesmo tempo)

(refinar malhas)

superar limites físicos na velocidade de processamento sequencial

Desejável ➜➜➜➜ (1015 operações por segundo)

(18)

Aplicações mais usuais

Aplicações mais usuais

Previsão do tempo/simulação de fenômenos globais (El Niño)

Engenharia: modelos de turbulência/aviões

Física do plasma: gases ionizados em altas temperaturas

Ciência dos Materiais, “Automated Reasoning”

Economia: modelos nacionais

Inteligência Artificial

Sistemas de Defesa

Obs.: (MULTI + vector ) (VECTOR + multi)

(19)

Aplicações mais usuais

(20)

Aplicações de Computação de Alto Desempenho

(21)

Mercados da Silicon Graphics

(22)

Capacidade de Memória Capacidade de Memória 10 Mb 1 Gb 100 Gb Airfoil 1980 48- Hour Weather Oil Reservoir Modeling 1988 3d plasma Modeling 10 Gb 1991 1000 Gb Global change. Human genone. Fluid turbulence. Vehicicle Dinamics . Ocean circulation. viscous Fluids Dynamics. super conductor modeling. Semiconductor modeling. Quantum chromodynamics vision. Structural Biology Pharmaceutical Design Chemical Dynamics 1995 and beyond Memory capacity 1993

(23)

Linguagem de programação no ambiente paralelo

Linguagem de programação no ambiente paralelo“vetorial” #### mais software disponível

•“paralelo” #### menos software disponível

• Em geral são extensões (versões paralelas)

FORTRAN / (90) (vector) PASCAL /

BASIC /

C /

ADA /

OCCAM / (Transputers) (message passing) 80’s

•Compiladores têm a capacidade de gerar um código paralelo a partir de um código

sequencial (vetorização)

BIBLIOTECAS BLAS

BASIC LINEAR ALGEBRA

(24)

Estilos de Programação

(25)

Programação Paralela

(26)

Taxonomia de Flynn

Taxonomia de Flynn

•Classificação baseada nas relações entre dados e instruções •Single instruction stream -- single data stream (SISD)

( Modelo de Von Neumann )

•Single stream-- multiple datas stream (simd) •( inclui máquinas do tipo array )

•Multiple instruction stream -- multiple data stream ( mimd ) •( Os sistemas multiprocessadores mais difundidos )

(27)

Arquiteturas

(28)

Arquiteturas (continuação)

(29)

Arquiteturas (continuação)

(30)

Sistemas de memória local

(31)

Arquiteturas híbridas

(32)

Arquiteturas híbridas

(33)

Arquitetura hipercúbica

(34)

Arquitetura hipercúbica

(35)

Arquitetura de transputer

(36)

Arquiteturas do ponto de vista de programas

(37)

Array de trnasputers

(38)

Conexão via barramento

(39)

Conexão via chaves “crossbar”

(40)

Redes de interconexão

(41)

Redes de interconexão

(42)

Redes de interconexão

(43)

Redes de interconexão

(44)

Comparação de arquiteturas (tempo)

(45)

Arquitetura heterogênea

(46)

Tipos de paralelismo (granularidade)

(47)

Sistemas heterogêneos

(48)

Níveis de paralelismo

(49)

Conceito de speedup

(50)

Lei de Amdahl

(51)

Redes de interconexão

(52)

Laborarório de computação de alto desempenho coppe/UFRJ

Laborarório de computação de alto desempenho coppe/UFRJ 1988 #### INÍCIO DO PROJETO “COMPUTAÇÃO PARALELA”

Transputer / INMOS

Transistor for multicomputer NCP construído na COPPE (08 nós)

1990 #### INTEL – IPSC 860 / 08 nós Características:

Memória: 8 x 8 Mb = 64 Mb

Flopagem: 8 x 80 MFlops = 640 MFlops

1995 #### CRAY J90 / 04 processadores Características:

Memória: 2 Gb memória RAM

Flopagem: 4 x 200 MFlops = 800 MFlops

(53)

Pesquisadores envolvidos

Pesquisadores envolvidos

INICIAL: 13 (com Doutorado) 30 alunos

SISTEMAS E COMPUTAÇÃO: HARDWARE

ENGENHARIA CIVIL: CÁLCULO, SIMULAÇÃO E OTIMIZAÇÃO DE ESTRUTURAS

ENGENHARIA ELÉTRICA: SIMULAÇÃO E OTIMIZAÇÃO DE REDES ELÉTRICAS ESTATÍSTICAS Período 1990 a 1996 Publicações Períodos Internacionais Congressos Número de teses Defendidas

(54)

Decomposição para programação paralela

(55)

Integração numérica

(56)

Mapeamento do problema

(57)

Mapeamento do problema

(58)

Programa paralelo (hípercubo)

(59)

Ajuste fino de um programa paralelo

(60)

Ajuste fino

(61)

Aplicação: Simulação de tráfego aéreo

(62)

Aplicação: Simulação de tráfego aéreo

(63)

Aplicação: Simulação de tráfego aéreo

(64)

Fim da primeira aula

Referências

Documentos relacionados

As técnicas de solução serão motivadas pelo desenvolvimento de modelos oriundos do estudo de mecanismos usados na transmissão de informação multimídia, e medição de tráfego

A colocação e bênção da primeira pedra de nova igreja do convento do Carmo de Évora foi, como se viu, um importante momento, não só na dinâmica religiosa da cidade, mas também

– Multiplas instruções Agindo sobre um dado – Nunca se ouviu falar de exemplos. ● MIMD Multiple Instruction

O modelo condicional ou PWP considera que o equipamento só está em risco da ocorrência da falha “n” somente após a ocorrência da falha “n-1” ou seja, existe uma

desportivo sem carácter de competição, tendo no entanto registo e divulgação de tempos, sendo aberta a todos os participantes a partir de 16 anos e sem limitações

Esta disserta¸c˜ ao teve como proposta o estudo de uma alternativa para o controle de golfadas severas geradas na linha de produ¸c˜ ao, e a avalia¸c˜ ao do impacto econˆ omico que

ALIENAÇÃO FIDUCIÁRIA BUSCA E APREENSÃO NOTIFICAÇÃO EXTRAJUDICIAL NÃO APERFEIÇOADA - FALTA DE COMPROVAÇÃO DA MORA EMENDA DA INICIAL ART. 284 DO CPC CABIMENTO A

As mulheres foram estatisticamente mais numerosas em Ivoti e em Campina Grande; os homens em Poços de Caldas; 65,1% da amostra tinham entre 65 e 74 anos, mas não foi observa-