• Nenhum resultado encontrado

Arquiteturas de processadores avançadas

N/A
N/A
Protected

Academic year: 2022

Share "Arquiteturas de processadores avançadas"

Copied!
6
0
0

Texto

(1)

Arquiteturas de processadores avançadas

MAC 412- Organizãção de Computadores

- Siang W. Song

(2)

Superescalar

Uma CPU superescalar possui múltiplas unidades funcionais no processador (e.g. várias ALUs e várias unidades para operações ponto flutuante).

Pode assim executar várias instruções no mesmo ciclo.

A execução de uma instrução está baseada na disponibilidade de seus operandos.

Instruções podems ser executadas fora de ordem. O algortimo de Tomasulo, implementado em hardware, pode ser usado para não violar a dependência de dados.

O paralelismo implementado por uma CPU superescalar é do tipo ILP (Instruction Level Parallelism) dentro de um memso processador.

Exemplo: PowerPC 970 (4 ALUs, 2 unidades de ponto-flutuante e 2 SIMD, com capacidade de até 8 instruções por ciclo). Alpha 21264 (até 6 instruções por ciclo).

MAC 412- Organizãção de Computadores - Siang W. Song Arquiteturas de processadores avançadas

(3)

VLIW - Very Long Instruction Word

Para que várias instruções possam ser executadas em paralelo, ou fora de ordem, há um custo de verificação de dependência entre as instruções.

VLIW executa instruções em paralelo com base num escalonamento feito pelo compilador, sem necessitar de um hardware de escaolonamento.

Uma instrução VLIW contém múltiplas instruções. Por exemplo, se há 5 unidades de execução, há 5 campos numa instrução VLIW, especificando cada um qual operação deve ser feita em cada unidade de execução.

VLIW implementa o paralelismo do tipo ILP (Instruction Level Parallelism).

A diferença entre VLIW e superescalar é que VLIW usa software para determinar quais instruções podem ser executadas em parelelo, ao contrário da superescalar que usa hardware.

Exemplos: Itanium IA-64 (até 6 instuções por ciclo).

(4)

Multi-core

Dois ou maiscoresou núcleos integrados numa mesma pastilha de silício. Cada núcleo atua como um

processador independente.

Cada núcleo em geral tem sua memória cache. Pode também haver caches compartilhados. O uso de cache fica cada vez mais importante para atenuar o problema de gargalo de acesso à memória.

O aumento do número decoresjustifica o aparecimento denetwork on chip. As interconexões típicas entre os coresincluem anel, 2-d grade ecross-bar.

Há muitos exemplos, e.g. Core 2 Duo, Core 2 Quad, Xeon dual- quad- e hexa-core, Nvidia GeForce 200 (10cores), Tesla multi-core GPGPU (10cores), UltraSparc T2 (8 cores), Tilera TILE64 (64cores).

MAC 412- Organizãção de Computadores - Siang W. Song Arquiteturas de processadores avançadas

(5)

Palestra Yale Patt - SBAC-PAD 2009

No evento SBAC-PAD 2009, Yale Patt deu uma palestra intitulada “The 1000 core microprocessor: Will we be ready for it?”

http://regulus.pcs.usp.br/sbac2009/KeynoteTalks/

Em 6 a 8 anos (Lei de Moore) podemos ter um chip com 50 bilhões de transistores, o que daria para fabricar um chip ocm 1.000 cores.

Yale Patt questiona se devemos projetar um chip desses e, caso sim, se estaremos preparados para enfrentar as dificuldades:

desenvolvimento de algoritmo paralelo

largura de banda de memória (on-chip e off-chip) considerações de potência

(6)

Palestra Yale Patt - SBAC-PAD 2009

Destaca o papel crucial da educação:

“Think in parallel is natural !

Ensinar programação paralela (parallel thinking) aos alunos do primeiro ano (e.g. como calcular fatorial dencom dois cores).

Enfatizar a abordagembottom-upe livrar-se datop-down.

Entender todas as camadas: algoritmo, linguagem, compilador, micro-arquitetura.

MAC 412- Organizãção de Computadores - Siang W. Song Arquiteturas de processadores avançadas

Referências

Documentos relacionados

Portanto, por um contexto computacional, os números binários são estudos porque “os computadores atualmente utilizam o sistema binário para representar

Há alunos que freqüentarão o AEE mais vezes na semana e outros, menos. Não existe um roteiro, um guia, uma fórmula de atendimento previamente indicada e, assim sendo, cada aluno terá

Nos termos de referido contrato, o acionista e Diretor Presidente, mediante o prévio pagamento (o valor foi recebido na data da divulgação da informação ao mercado) de

17 CORTE IDH. Caso Castañeda Gutman vs.. restrição ao lançamento de uma candidatura a cargo político pode demandar o enfrentamento de temas de ordem histórica, social e política

Sendo assim, este curso visa a propiciar ao aluno uma visão sistêmica e prática do Direito Societário, percorrendo, desde os conceitos teóricos gerais até a estruturação

Uma vez que a falta de confiabilidade na comunicacao e um dos fatores mais criticos para a implementadio das RSSF na industria, foi realizado um estudo de desempenho de radios

Seminário Internacional sobre a memória Lusófona A saída da Corte para o Brasil Organização do Arquivo Histórico Ultramarino Dia 8, 9 e 10 de Outubro no Arquivo Histórico

sólidos totais, proteínas, lipídios, fibra, cinza e carboidratos, compostos fenólicos totais, 15.. flavonóides e carotenóides totais, sólidos insolúveis em álcool