Processadores Intel e AMD
Prof. Remy Eskinazi
Agenda
• Introdução
• Conceitos básicos Microprocessadores
• Histórico dos processadores X86 (Intel e AMD)
• Linha evolutiva dos processadores
• Mercado de processadores
• Breve Comparativo Intel x AMD
• Resumo Processador Celeron
• Processadores 64 bits
• Conclusões
• Bibliografia e sites relacionados
Resumo Evolução Intel X AMD
8088 / 8086 80286
80386
80486
Pentium
Pentium Pro Pentium II Pentium III AMD 386
AMD 486
AMD K5
AMD K6
AMD K6-II
AMD K6-III
Celeron
Evolução X86
Nome Data Transistores
• 8086 1978 29K
– Processador de 16-bit. Base para o IBM PC & DOS
– Limitado a 1MB de espaço de endereçamento. DOS disponibiliza ao usuário apenas 640K
• 80286 1982 134K
– Modo de endereçamento mais complexo, mas não muito útil – Base para IBM PC-AT e Windows
• 386 1985 275K
– Extensão para 32 bits. Adicionado um novo tipo de endereçamento
– Capaz de rodar Unix (modos Real, Protegido)
Evolução X86
• Nome Data Transistores
• 486 1989 1.9M
• Pentium 1993 3.1M
• Pentium II/MMX 1997 4.5M
– Adicionada uma coleção especial de instruções para operar em vetores de 64-bit de dados inteiros de 1, 2, ou 4 bytes
• PentiumPro 1995 6.5M
– Adionadas as instruções de mov condicional – Grande mudança na microarquitetura
• Preempção de tarefas (saltos)
Evolução X86
• Nome Data Transistores
• Pentium III 1999 8.2M
– Adicionadas instruções “streaming SIMD” para operar sobre vetores de 128-bits de dados inteiro ou ponto flutuante de 1, 2 ou 4 bytes
• Pentium 4 2001 42M
– Adicionados formatos de 8-bytes e 144 novas instruções para o modo
streaming SIMD
Evolução AMD
197 5
197 9
8080A 8086
198 2
286
199 1
Am386
199 3
Am486
199 5
AMD-K5™
199 7
AMD-K6®
199 9
AMD Athlon™
200 2
Transistores 5k 29k 134k 275k 1.200k 3.500k 9.300k 22.000k 37.000k
AMD Athlon XP™
200 3
0.80um 0.35um 0.25um 0.18um 0.13um 10um
200 4
+
200
5
Evolução AMD
1991 1992 1993 1994 1995 1996 1997 1998
1999 2000 2001 2002 2003 2004 2005 2006
am386 am486
+
Arquitetura Interna de Microprocessador
Arquitetura 8086
– arquitetura de 16 bits
• comunicação com a memória em 16 bits (8086)
• capacidade máxima de memória de 1 MByte
• 14 registradores (4 dados, 4 endereços, 4 segmentos, ponteiro do programa, flags)
• endereço físico = segmento * 16 + deslocamento
• 85 instruções básicas
• coprocessador: 8087 (67 instruções básicas)
• sem cache, sem memória virtual
– 8088 - mesma arquitetura, barramento externo de 8 bits
8086 - primeiro
microprocessador de 16 bits da
Intel
Características da Arquitetura 8086
Características da Arquitetura 8088
Características da Arquitetura 8086
Características da Arquitetura 8086
15 8 7 0
AX AH AL acumulador
BX BH BL base
CX CH CL contador
DX DH DL dado
SP ponteiro para pilha
BP ponteiro base
SI índice fonte
DI índice destino
IP apontador de instruções
FLAGS flags
CS segmento de código
DS segmento de dados
SS segmento de pilha
ES segmento extra
Dados
Endereços
Segmento
Registradores de Segmento 8086
• São registradores de endereços;
• Armazena endereços de programa e dados;
• Organização de memória:
– Cada byte na memória possui um endereços de 20 bits iniciando em 0 até 2
20-1 ou seja, 1M de memória endereçável;
– Endereços são representados por 5 dígitos hexadecimais; de 00000 - FFFFF
– Problema: 20 bits de endereços é grande demais para ser colocado em registradores de 16 bits;
– Solução: Segmentação de memória
• Blocos de memória de 64K consecutivos (65.536);
• Um número de segmento é um número de 16 bits;
• Faixa de um endereços de um segmento vai de 0000 a FFFF
• Em um segmento, uma posição de memória em particular é especificado
como sendo um offset (deslocamento);
Características da Arquitetura 8086
Segmentação de memória no 8086
lin e ar a d d re ss e s
one segment
Geração de endereço físico
Geração de endereço físico
• Registrador de segmento * 16 + offset
Adder
Segment Register (16 bits)
0 0 0 0
Offset Value (16 bits)
Organização de memória
Bloco Dados
01 Área de memória para o usuário (64 Kb) 02 Área de memória para o usuário (128 Kb) 03 Área de memória para o usuário (192 Kb) 04 Área de memória para o usuário (256 Kb) 05 Área de memória para o usuário (320 Kb) 06 Área de memória para o usuário (384 Kb) 07 Área de memória para o usuário (448 Kb) 08 Área de memória para o usuário (512 Kb) 09 Área de memória para o usuário (576 Kb) 10 Área de memória para o usuário (640 Kb) 11 Memória de Vídeo
12 Memória de Vídeo
13 Área de Extensão da ROM 14 Área de Extensão da ROM 15 ROM-BIOS do sistema
16 ROM-BIOS do sistema e ROM-BASIC
Microprocessador Intel 80286
– Praticamente a mesma arquitetura do 8086
– Data bus 16 bits (D0 – D15), Address bus 24 bits (16Mb memória) – Modos real (8086) e protegido (memória vitual & 16Mb memória) – 4 Unidades funcionais
• EU – Unidade de execução de Instruções
• BU – Unidade de Acesso e Controle de Barramento
• IU – Unidade de decodificação de instruções
• AU – Unidade de Formação de endereços
– Comunicação com a memória em 16 bits – 14 registradores (os do 8086)
– Endereço físico ou virtual
– 15 instruções extras (92 + 15 = 107 instr. básicas) – Co-processador: 80287
– Sem cache
– Memória virtual segmentada (apenas no modo protegido) – Maior parte dos programas desenvolvidos para modo Real
Microprocessador Intel 80386
– Modos real (8086), protegido e virtual86 – 6 Unidades funcionais
• EU – Unidade de execução de Instruções
• BU – Unidade de Acesso e Controle de Barramento
• IU – Unidade de decodificação de instruções
• PU – Unidade de pre-fetch com fila de até 16 bytes
• PgU – Unidade de formação de endereços (paging unit)
• SU – Unidade de formação de endereços (segmentation unit)
– Comunicação com a memória
• 16 (SX) ou 32 bits (DX)
• Capacidade máxima de memória de 4 GByte
– 14 registradores
• do 8086, com 32 bits, e mais 2 regs. de segmento
– 44 instruções extras
• 107 + 44 = 153 instruções básicas
– Endereço físico ou virtual (64 TByte)
• Memória virtual segmentada (sempre) e paginada (opcional), ambas
apenas no modo protegido
Microprocessador Intel 80386
15 8 7 0
EAX AH AL
EBX BH BL
ECX CH CL
EDX DH DL
ESP EBP ESI EDI EIP
EF CS DS SS ES FS GS
16
31 acumulador
base contador dado
ponteiro para pilha ponteiro base
índice fonte índice destino
apontador de instruções flags
segmento de código
segmento de dados
segmento de pilha
segmento extra
segmento extra
segmento extra
Microprocessador Intel 80386
Conceito do Memória Virtual
processador
memória virtual
mapeador
memória física endereço
virtual
endereço físico
grande espaço de endereçamento
pequeno espaço de endereçamento endereço gerado
pelas instruções sendo executadas
mapeamento por hardware
Microprocessador Intel 80386
Questões da Memória Virtual:
• quando mover um bloco da memória secundária para a memória primária (real) ?
– por demanda
• quando mover um bloco da memória real para a memória secundária?
– quando faltar espaço na memória real
• qual o tamanho ideal de um bloco?
– constante (paginação) ou variável (segmentação)
• onde colocar um novo bloco transferido para a memória principal?
– onde houver área livre (paginação) ou no “melhor” lugar (segmentação)
Microprocessador Intel 80386
Dinâmica da Memória Virtual:
• programa gera endereço virtual
– CPU transforma endereço virtual em endereço físico (hardware)
• bloco está na memória principal?
– Sim: calcular o endereço físico (hardware)
– Não: buscar o bloco da memória secundária (software)
• existe espaço para o bloco na memória principal?
– Sim: carregar o bloco e atualizar descritor (software)
– Não: retirar um outro bloco, carregar o bloco e atualizar descritores (software)
Microprocessador Intel 80386
Memória Virtual Segmentada: (Segmentação => Converte endereços lógicos em endereços lineares)
0 ( g l o b al o u l o c al )s e g 3
15 4 31 0
Seletor de tabela (Global ou Local)
Registrador de segmento Deslocamento
31 0 Tabela de descritores
Descritor de segmento (8 bytes)
Endereço base (32 bits)
(32 bits)
Endereço linear
+
GDTR ou LDTR
endereço lógico ou virtual
endereço linear
(ainda não é o físico)
CS DS SS ES ...
Memória virtual segmentada
• programa gera endereço virtual
– CPU transforma endereço virtual em endereço físico
• segmento está na memória principal?
– Sim: calcular o endereço físico. Se este endereço estiver fora do segmento, gerar erro
– Não: buscar o segmento da memória secundária
• existe espaço suficiente para o o segmento na memória principal?
– Sim: carregar o segmento na “melhor posição” e atualizar descritor
– Não: retirar um (ou mais) segmentos, carregar novo segmento e atualizar
descritores
Memória virtual paginada
PDE (32bits)
0 31
Endereço linear
22 21 12 11
Diretório Página Deslocamento
Diretório de Páginas (PD)
PTE (32 bits)
Tabela de Páginas (PT)
CR3
31 12 11 0
Deslocamento Endereço de page frame
...
(Paginação => Converte endereços lineares em endereços físicos)
... (PT)
Memória virtual paginada
• programa gera endereço virtual
– CPU transforma endereço virtual em endereço físico
• página está na memória principal?
– Sim: calcular o endereço físico. Este endereço sempre está dentro da página.
– Não: buscar a página da memória secundária
• existe espaço suficiente para a página na memória principal?
– Sim: carregar a página em qualquer lugar e atualizar descritor
– Não: retirar uma página (é suficiente), carregar nova página e atualizar
descritores
Microprocessador Intel 80386
• outras características
– Co-processador: 80387 (67 + 7 -1 = 73 instr. básicas) – Sem cache
– TLB:
• pequena memória associativa que retém os últimos e mais freqüentes endereços de página acessado
• uma pequena cache de endereços físicos
• apareceram vários microprocessadores compatíveis no mercado
– AM386
Microprocessador Intel 80486
• Idêntico ao 386
– Modos real (8086), protegido e virtual86 – Comunicação com a memória em 32 bits – Capacidade máxima de memória de 4 GByte
– 16 registradores (os do 80386, também em 32 bits) – 6 instruções extras (151 + 6 = 157 instruções básicas) – Endereço físico ou virtual
• Memória virtual segmentada
• e paginada (opcional)
– Co-processador: 80487 (para 80486SX) integrado no 80486DX – Com cache de 8 KByte
FPU
Microprocessador Intel Pentium
• Reestruturação do 486
– Modos real (8086), protegido e virtual86
– 16 registradores (os do 80386, também em 32 bits) – Memória virtual segmentada e paginada
• Comunicação com a memória em 64 bits
• Capacidade máxima de memória de 4 GByte
• 5 instruções extras (157 + 5 = 162 instr. básicas)
• FPU: coprocessador aritmético integrado
• Cache de 16 KByte (2 x 8 KByte)
Microprocessador Intel Pentium
• 2 pipelines para inteiros, operando em paralelo
• cada pipeline inteiro consta de 5 estágios:
– busca de instrução (a partir da cache de instruções), – decodificação de instrução,
– geração de endereço, – execução,
– escrita (write back).
• FPU também em pipeline (mas não em paralelo)
• operação super-escalar: mais de uma instrução
pronta em um ciclo de relógio
Microprocessador Intel Pentium
BIU
Cache Instr.
ALU
FPU
Registradores Buffer de instruções
barramentos de 64 bits externos e internos
caches separadas dados e instr.
8 KB cada bus interface
unit
2 pipelines paralelos de 5 estágios
para inteiros
ALU
BTB
reg.
stack
+
U-pipe ÷
V-pipe
FPU-pipe
com circuitos dedicados para soma, divisão e multiplicação
Microprocessador Intel Pentium Pro (P6)
• Re-estruturação do Pentium (P5)
– Mesmas características de 80386 (mem. virtual) e do Pentium (largura de dados de 64 bits)
– FPU
– cache de 16 KByte (2 x 8 KByte)
• 5 instruções extras (162 + 5 = 167 instr. básicas)
• Operação super-escalar
• 14 unidades internas
• Execução fora de sequência
• Execução especulativa
Microprocessador Intel Pentium MMX
• Arquitetura do Pentium (P5)
– Novo tipo de dado: “packed”
– 57 instruções extras (além das 167 instr. básicas) – Com cache de 32 KByte (2 x 16 KByte)
– Operação super-escalar
– Não possui as características do Pentium Pro (execução fora de sequência, exec.especulativa)
– Instruções para processamento de vetores (8 bytes, 4 palavras ou 2 palavras duplas)
– 8 novos registradores lógicos (MMX0 a MMX7)
Intel Pentium II (P6)
• Pentium Pro com MMX
– Mesmas características do Pentium Pro – Instruções MMX
– Cinco unidades internas
– Execução fora de sequência – Execução especulativa
Pentium
Pro MMX
PentiumII
Intel Pentium III
– Novo tipo de dado: “floating packed” (Ponto flutuante) – 70 instr. extras (além das 167 básicas e 57 MMX)
– Instruções para processamento de vetores inteiros (MMX) ou de ponto flutuante (SSE)
– 8 novos registradores físicos (XMM0 a XMM7), de 128 bits, para as instruções SSE
– No de série do processador (Inst. CPUID)
Intel Pentium 4
• Lançado em novembro de 2000
Pipeline de 20 estágios (“hyper pipeline”)
Até 128 instruções em execução (3 vezes mais que no Pentium III)
Algoritmo melhorado para previsão de desvios, com tabela de 4K
Novo sistema de cache de nível 1
Cache de execução de 12 K micro-operações (Execution Trace Cache)
Cache de dados de 8 KBytes
Intel Pentium 4
• Instruções SSE2 (Streaming SIMD Extensions 2) - 144 novas instruções
– 67 instruções para vetores de pontos flutuante de precisão dupla (64 bits)
– 69 novas instruções MMX, para vetores inteiros de 128 bits (utilizando os registradores XMM)
– 8 instruções para controle de cache
Barramento do sistema “Net Burst” de 400 MHz
Intel Pentium 4 - Diagrama Resumido
Mercado de Processadores
• Low –End
– Destinado à construção de máquina de baixo poder computacional
• Usuário iniciante
– (Celeron D (Intel), Semprom (AMD)
• Mid-Range
– Destinado à construção de máquinas de maior poder computacional
• Ferramentas CAD, design house – Pentium IV (Intel), Athlon (AMD)
• High-End
– Destinado à maquinas de alto poder computacional e compartilhamento
• Servidores de Rede
• Gerenciamento de Clusters
– Pentium HT (Intel), Athlon 64 D (AMD)
Comparativo entre Processadores Intel e AMD
• Intel foi isoladamente a líder em fabricação de CPUs até início dos anos 90
– Até a fabricação do 80286 Não houve concorrência da AMD – Concorrência começou devido a fabricação do AM386 DX
• Intel Pentium X AMD AM5x86
• Intel Pentium, Pentium PRO X AMD K5
– Equivalente mas lançado 3 anos depois do Pentium
• Intel Pentium MMX, II X AMD K6
– Vantagem AMD: Mais barato
• Intel Celeron X AMDK6
– Celeron:Versão “light” do Pentium II
• Intel Celeron X AMD Sempron
Estado da Arte em Processadores
• AMD
• Desktop: AMD Athlon 64 FX, AMD Athlon 64
• Server: AMD Opteron
• Intel
• Desktop: Intel Pentium 4 w/
HT, Intel Pentium 4 Extreme Edition
• Server: Intel Itanium 2, Xeon
Resumo Processadores Celeron
• Os processadores Celeron diferenciam-se dos
processadores Pentium II, III e IV pela limitação das seguintes características:
– Tamanho da Cache L2 – Clock interno
– Clock do barramento externo
Resumo Processadores Celeron
Modelo Nome- código
Baseado no Cache L1
Cache L2
Tecnolo gia
Barramento Externo
Soquete
Celeron SEPP Convingto n
Pentium II com núcleo Deschutes
32KB - 0.25µm 66MHz Slot 1
Celeron A Mendocino
Pentium II com núcleo Deschutes
32KB 128KB 0.25µm 66MHz Slot 1
Celeron PPGA Mendocino
Pentium II com núcleo Deschutes
32KB 128KB 0.25µm 66MHz Soquete 370
Celeron Coppermine
Coppermi ne
Pentium III com núcleo Coppermine
32KB 128KB 0.18µm 66MHz / 100MHz
Soquete 370
Celeron Tualatin
Tualatin Pentium III com núcleo Tualatin
32KB 256KB 0.13µm 100MHz Soquete 370
Celeron Willamette
Willamette
Pentium 4 com núcleo Willamette
8KB 128KB 0.18µm 400MHz Soquete 478
Celeron Northwood
Northwoo d
Pentium 4 com núcleo Northwood
8KB 128KB 0.13µm 400MHz Soquete 478
Celeron D Prescott Pentium 4 com
8KB 256KB 0.09µm 533MHz Soquete 478 / Soquete 775
Resumo Processadores Celeron D
Processador Clock Interno Clock Externo Cache L2 Soquete Hyper-Threading
350 3,2 GHz 533 MHz 256 KB 478 ou 775 Não
345 3,06 GHz 533 MHz 256 KB 478 ou 775 Não
340 2,93 GHz 533 MHz 256 KB 478 ou 775 Não
335 2,80 GHz 533 MHz 256 KB 478 ou 775 Não
330 2,66 GHz 533 MHz 256 KB 478 ou 775 Não
325 2,53 GHz 533 MHz 256 KB 478 ou 775 Não
Resumo Processadores Sempron
Processador Clock Interno Clock Externo Cache L1 Cache L2 Soquete
Sempron 2200+ 1,50 GHz 333 MHz 128 KB 256 KB 462
Sempron 2300+ 1,58 GHz 333 MHz 128 KB 256 KB 462
Sempron 2400+ 1,67 GHz 333 MHz 128 KB 256 KB 462
Sempron 2500+ 1,70 GHz 333 MHz 128 KB 256 KB 462
Sempron 2600+ 1,83 GHz 333 MHz 128 KB 256 KB 462
Sempron 2800+ 2 GHz 333 MHz 128 KB 256 KB 462
Sempron 3000+ 2 GHz 333 MHz 128 KB 512 KB 462
Resumo Processadores Celeron
• Exemplo: Celeron D
– 16Kb Cache L1 – 256Kb Cache L2
– Clock ext. 533MHz (Burst 133MHz) – Clock int. 2,13 GHz a 3,2 GHz
– Suporte Hyper – Threading => não disponível
Intel Extreme Edition
Intel Extreme Edition
Características:
•Primeiro processador desktop da Intel com tecnologia dual-core.
•Basicamente é evolução do Pentium IV
• Hyper-Threading (HT) : 2 processadores (lógico + Físico)
•Processador dual-core : 4 processadores (2 lógicos + 2 Físicos)
• Hyper-Threading + dual-core: execução de 4 threads
simultaneamente
Intel Extreme Edition
•Processador “lógico”
•barramentos, caches e unidades de execução são compartilhados
•cada processador lógico tem estado próprio, bem como registradores de propósitos gerais.
•Processador físico
•tem seus próprios conjuntos de registradores e
caches .
Intel Extreme Edition
• Cache
•2 caches de 16KB (L1).
•2 caches de 1 MB (L2), sendo 1 MB para cada core .
•principal vantagem: redução do tráfego do barramento.
• Trace cache
•cada core tem uma trace cache de até 12KB de micro- operações já decodificadas.
•principais vantagens: remoção da etapa de decodificação em
loops e em execução de desvios.
Intel Extreme Edition
•Segurança: bit para desabilitar execução:
•recurso aliado ao S.O
•define áreas ativas ou não-ativas de memória.
•Conjunto de instruções
•instruções dedicadas ao processamento de imagens e compressão de dados
•mantém compatibilidade com IA-32.
•Gerenciamento de energia: capacidade de desligamento de
pinos e outras partes do chip.
Intel Extreme Edition
Perspectivas:
•Aumento da velocidade do barramento PCI e AGP (média de 3.5 vezes).
•Facilidades para os softwares multi-threads do futuro.
• Dual-core : será base para as pesquisas da Intel nas tecnologias
Hyper-Threading e EM64T.
AMD Athlon 64
AMD Athlon 64
• Resumo Processadores AMD Atuais
– Desktop
• Semprom (Low End)
• Athlon 64 (Mid Range)
• Athlon 64 FX
• Athlon 64 X2
– Notebooks
• Athlon 64 Mobile
• Turion 64
– Servidores
• Opteron
AMD Athlon 64
197 5
197 9
8080A 8086
198 2
286
199 1
Am386
199 3
Am486
199 5
AMD-K5™
199 7
AMD-K6®
199 9
AMD Athlon™
200 2
Transistores 5k 29k 134k 275k 1.200k 3.500k 9.300k 22.000k 37.000k
AMD Athlon XP™
200 3
0.80um 0.35um 0.25um 0.18um 0.13um 10um
200 4
+
200
5
AMD Athlon 64
UCP Bridge’ ‘North
L1/L2 L3
‘South Bridge’
USB
E/ISA
Bus E / ISA Bus PCI
REDE
LAN
Bus SCSI
Adaptador SCSI
Super I/O
Interface Gráfica
ROM BIOS
RAM
PCI I/O
PCMCIA Interface
Som CD-ROM
CD-ROM
HD HD
Scaner
Floppy Mouse
RAM
AGP
COM LPT
AMD Athlon 64
• Novas características incorporadas
– 1MB L2 Cache
– Controlador de Memória DDR incorporado – HyperTransport Channel
– Menor consumo de potencia – Novo Core Processador
– Registradores em dobro
– Pipeline maior (10 12 estágios)
– Maior “Look Aside Buffer” (TLB)
AMD64 Architecture
Register Differences: AMD64 vs x86
• AMD64
– 64-bit integer registers – 48-bit Virtual Address – 40-bit Physical Address
• REX - Register Extensions
– Sixteen 64-bit integer registers – Sixteen 128-bit SSE registers
• SSE2 Instruction Set
– Double precision scalar and vector operations – 16x8, 8x16 way vector
MMX operations
– SSE1 already added with AMD Athlon MP
RAX
63
G G P P R R
x x 8 8 7 7
0 79
31
EAX AH AL
0 7 In x86 15
S
MMX0S S S E E
127 0
MMX7
EAX
EIP Added by AMD64
EDI
XMM8
MMX8
MMX15
R8
R15
32-bit 32-bit
Um Processador AMD64 pode rodar sistemas operacionais de 32 ou 64 bits START
START START START BOOT UP BOOT UP
Using 32 bit BIOS Using 32 bit BIOS
BOOT UP BOOT UP
Using 32 bit BIOS Using 32 bit BIOS
Look Look at OS at OS Look Look at OS at OS Load 32 bit OS
Load 32 bit OS Load 32 bit OS Load 32 bit OS
Run 32 bit Run 32 bit Applications Applications
Run 32 bit Run 32 bit Applications Applications
Load 64 bit OS Load 64 bit OS Load 64 bit OS Load 64 bit OS
64-bit 64-bit
Run 32 & 64 Run 32 & 64
bit apps bit apps Run 32 & 64 Run 32 & 64
bit apps bit apps
OS for x64-based Systems
32-bit and 64-bit on a single platform
Características da arquitetura AMD64
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Tecnologia Hyper Transport
• Cool’n’quiet (PowerNow! para servers e mobile)
• Proteção anti-vírus por hardware
• Benefícios
• Excelente desempenho
• Melhor custo/benefício
• Sistemas mais confiávies
• Preparado para software de 64 bits
Arquitetura do sistema com AMD64
Sistema típico
CPUCPU CPUCPU
North Bridge North Bridge
South Bridge South Bridge
IDE, FDC, PCI
USB, Etc.
DDR
Sistema AMD64
CPUCPU AMD64 AMD64
CPUCPU AMD64 AMD64
PCI Bridge - Túnel HT PCI Bridge -
Túnel HT
IDE, FDC, I/O DDR
PCI-X PCI Express PCI
Bridge PCI Bridge
PCI-X PCI Express
Processadores AMD64 de dois núcleos
Diferenças na fabricação e compatibilidade de socket e placa
Núcleo • Athlon 64
• Athlon 64 FX
• Sempron
• Opteron
• Turion
Processador “single-core”
Processador “dual-core”
• Athlon 64 X2
• Opteron
Processadores AMD64 de dois núcleos
Diferenças na fabricação e compatibilidade de socket e placa
Fluxo de Dados em um AMD64 CPU
1MB
L2 Cache 1MB
L2 Cache
AMD64 CPU
L1 Data CacheL1 Inst. Cache
Memory Controller
DRAM Controller
Crossbar Switch
64-bits wide
Bussing Unit
Processor Core Cache, Load/Store &
Bussing Unit Integrated North Bridge
Load/Store Unit
System RequestQueue (SRQ)
HyperTransport Technology BUS 144-bit wide DRAM interface
FP Unit
Execution Unit Fetch Scan Align
128-bits wide
Arquitetura Interna
Memory Controller
DRAM Controller
Crossbar Switch
System Request Queue (SRQ)
144-bit wide DRAM interface
1MB
L2 Cache 1MB
L2 Cache
AMD64 CPU
L1 Data CacheL1 Inst. Cache
64-bits wide
Bussing Unit Load/Store Unit
FP Unit Execution Unit Fetch Scan Align
128-bits wide
1MB
L2 Cache 1MB
L2 Cache
AMD64 CPU
L1 Data CacheL1 Inst. Cache
64-bits wide
Bussing Unit Load/Store Unit
FP Unit Execution Unit Fetch Scan Align
128-bits wide
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport
• Cool’n’quiet para modelos acima do Sempron 2800+
• Proteção anti-vírus por hardware
• Acesso à memória em 64 bits
• Computação do dia-a-dia
Processadores AMD Sempron
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport
• Cool’n’quiet - Gerenciamento avançado de energia
• Proteção anti-vírus por hardware
• Excelente custo/benefício
• AMD Athlon 64 FX:
• Campeão em aplicações single thread
• Jogos
Processadores AMD Athlon 64
• Dois núcleos AMD64 (Dual Core)
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport de 2.0GHz
• Cool’n’quiet - Gerenciamento avançado de energia
• Proteção anti-vírus por hardware
• Acesso à memória em 128 bits
• Alto desempenho multi-tarefa
Processadores AMD Athlon 64 X2
• Para servidores com 1, 2, 4 ou 8 processadores
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport – Sem gargalos de FSB
• Power Now! - Gerenciamento avançado de energia
• Acesso à paralelo à memória, em 128 bits
• Inclui modelos Dual Core
• Excelente consumo de energia
Processadores AMD Opteron
Funcionamento de servidor Dual
Alta demanda - controlador de memória no chipset
Funcionamento de servidor Dual
Alta demanda – arquitetura AMD64
Típico sistema multiprocessado
South Bridge South
Bridge PCI
IDE, FDC, USB, Etc.
PCI-X PCI-X
Bridge PCI-X Bridge
North Bridge North Bridge
Processor Processor Processor Processor
Processor Processor Processor Processor
Processor Processor Processor Processor Processor
Processor Processor Processor
PCI-X PCI-X
Bridge PCI-X Bridge
PCI-X PCI-X
Bridge PCI-X Bridge DDR
DDR
Memory Expander Memory Expander
Memory Expander Memory Expander
PCI-X Bridge PCI-X
Bridge PCI-X
I/O Hub I/O
Hub PCI
IDE, FDC, USB, Etc.
AMDAMD Opteron Opteron
AMDAMD Opteron Opteron
AMDAMD Opteron Opteron
AMDAMD Opteron Opteron AMDAMD
Opteron™
Opteron™
AMDAMD Opteron™
Opteron™
AMD AMD Opteron Opteron
AMD AMD Opteron Opteron
PCI-X Bridge PCI-X Bridge PCI-X
Other Bridge Other Bridge Other
I/O DDR
DDR
DDR
DDR
Sistema AMD Opteron™
Sistema Quad-processado
Solução do problema de gargalo no chipset/FSB
I/O Hub I/O Hub
USBUSB PCIPCI
PCI-E Bridge PCI-E Bridge PCI-E
Bridge PCI-E Bridge PCI-E
Bridge PCI-E Bridge I/O Hub
I/O HubI/O HubI/O Hub
PCI-E Bridge PCI-E Bridge PCI-E Bridge PCI-E Bridge PCI-E Bridge PCI-E Bridge Memory
Controller Hub Memory Controller
Hub
CPUCPU CPUCPU
Multiprocessamento com CPUs de núcleo duplo
Necessidade da evolução da arquitetura de interconexão
Arquitetura x86 tradicional
• FSB compartilhado por CPUs, Memória e I/O
• Mais CPUs ≠ Maior performance
AMD64 com DirectConnect
• Arquitetura x86 padrão de mercado
• Sem gargalo de FSB
SRQ Crossbar
HT Mem.Ctrlr
SRQ Crossbar
HT Mem.Ctrlr
CPUCPU CPUCPU CPUCPU CPUCPU 8 GB/S
8 GB/S 8 GB/S
8 GB/S
CPU de 16 núcleos
O futuro do Microprocessador
Mais transistores, mais núcleos, mais threads
• Mais núcleos
• Núcleos especializados
• Mais controladores integrados
• ...
BenchMark AMD X Intel
BenchMark AMD X Intel
Conclusões
• Processadores AMD atuais são mais
indicados para aplicativos (Business), Jogos, Aplicativos 2D com melhor taxa de preço
• Processadores Intel estão mais indicados
para aplicativos 3D e Multitasking
Bibliografia e Sites Recomendados
Patterson, D. - Organizacao e projeto de computadores - a interface hard/software Torres, G. – Hardware – Curso completo
Weber, R. – Arquitetura de computadores pessoais Intel Home page: http://www.Intel.com
AMD Home Page: http://www.amd.com