FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 196
Síntese do datapath
unidades funcionais
• Unidades funcionais do datapath
– operadores aritméticos• operandos inteiros, vírgula fixa ou vírgula flutuante
• operadores com constantes, mais eficientes do que operadores genéricos
– operadores lógicos, manipulação de bits
• funções lógicas, rotações, deslocamentos, bitreverse
– operadores específicos de uma aplicação • A*B-(C+D), x[k]*x[k+t1]*x[k+t2]
• Numa abordagem top-down (HDL+síntese)
– operadores inferidos e construídos no processo de síntese• implementados como circuitos combinacionais
– nem todos os operadores disponíveis
• FPGA Express (V3.6.1)suporta apenas divisões entre constantes
– arquitecturas dos operadores definidas nas bibliotecas da tecnologia alvo
• em Verilog todas as operações são consideradas com operandos sem sinal
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 197
Operadores aritméticos
adição e subtracção
– ripple carry adder (RCA)
• propagação do carry limita a rapidez de cálculo
• resultado garantido após o maior tempo de propagação do carry
– carry select adder
• dividido em secções e cada secção inclui 2 somadores de k bits • exemplo: somador de 12 bits em secções de 4 bits:
Kay Hwang, “Computer Arithmetic - Principles, Architecture and Design”, John Wiley & Sons, 1990
A3-0 A3-0 B3-0 B3-0 1 0 4 bit add 4 bit add C-1 C3,1 C3,0 A7-4 A7-4 B7-4 B7-4 1 0 4 bit add 4 bit add C7,1 C7,0 C3,0 C3,1 CS A11-8 A11-8 B11-8 B11-8 1 0 4 bit add 4 bit add C11,1 C11,0 CS C3,0 C3,1 C7,0 C7,1 S3-0 S7-4 S11-8 C11 C7 C4
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 198
Operadores aritméticos
adição e subtracção
– carry generate, carry propagate, lookahead
• generate• propagate
• equações do somador escrevem-se
• os carry de todos os andares podem ser obtidos em paralelo
Gi= Ai. Bi significa que o carry é gerado no andar i
Pi= Ai
⊕
Bi significa que o andar i propaga o carry que lhe chegaSi= Ai
⊕
Bi⊕
Ci-1 = Pi⊕
Ci-1Ci= Ai
.
Bi+
Ai.
Ci-1+
Bi.
Ci-1 = Ai.
Bi+
Ai.
Ci-1.
Bi+
Bi.
Ci-1.
Ai= Ai
.
Bi+
Ci-1.(
Ai.
Bi+
Bi.
Ai)= Ai.
Bi+
Ci-1.(
Ai⊕
Bi)
= Gi+
Pi.
Ci-1 C1= G1+
C0.
P1 C2= G2+
C1.
P2=
G2+
(G1+
C0.
P1).
P2=
G2+
G1.
P2+
C0.
P1.
P2. . .
Ck= Gk+
Gk-1.
Pk+
Gk-1.
Pk-1.
Pk+ ... +
C-1.
P0.
P1.
....
PkFEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 199
Operadores aritméticos
– adição e
subtracção
– somadores assíncronos
• tempo de propagação depende dos operandos
• circuitos para detectar que a propagação do carry está concluída • somador de 32 bits: média de 5 bits de carry
– 6 para um somador de 64 bits
• tempo pior é igual ou pior do que um somador ripple carry
– subtractores
• em complemento para dois basta complementar o subtractor
– trocar todos os bits (com XOR) e adicionar 1 fazendo C-1=1
– melhor implementação depende da tecnologia
• em FPGAs XC4000 e usando fast carry logic– somador ripple carry melhor do que carry select ou lookahead carry
• para ASICs há arquitecturas mais eficientes
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 200
1 1 0 1 0 (a = 26 ou -6) 0 1 0 1 1 (b = 11 ou +11) + 1 1 0 0 0 (c = 24 ou -8) 0 1 1 0 0 0 1 1 + 1 0 1 1 1 1 0 1 (a+b+c = 61 ou -3)
Operadores aritméticos
adição e subtracção
• Adição de vários operandos
– Carry save adder
• produz 2 resultados (z e 2y) cuja soma é igual à adição dos 3 operandos
• Os resultados y e z são gerados em tempo constante ( O(1) ) • Para obter o resultado z+2y é necessário um somador adicional
FA a3b3c3 z3 y3 FA a2b2c2 z2 y2 FA a1b1c1 z1 y1 FA a0b0c0 z0 y0
a+b+c = z+2y
0+1+0=01 1+1+0=10 z = 01001 y = 11010FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 201
Operadores aritméticos
adição e subtracção
• Adição de vários operandos com RCA
– Exemplo: adição de 7 operandos com n bits cada
Half adder Full adder a b c d e f g 3(n-1) FA, 3 HA 2n-1 FA, 3 HA n n n n n n n n+1 n+1 n+1 n+2 n+2 n+3 n+1 FA, 1 HA n ... ... ... ... ... ... 6n-3 FA, 7 HA lognK
Tempo de propagação: (n+3+1)tp
FAFEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 202
Operadores aritméticos
adição e subtracção
• Árvore de CSA para adicionar n operandos
a b c d e f g 2n FA n-1 FA, 1 HA n n n n n n n n n n n FA n 6n-3 FA, 3 HA n n+1 n n+1 n n-1 FA, 1HA n+2 n n-1 FA, 1HA CSA Somador de n bits n n n n n sum carry Half adder Full adder bypass
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 203
Operadores aritméticos
multiplicação
• Multiplicação binária
– multiplicação de números com sinal
• facilmente tratados com representação em sinal e magnitude • o produto é
– negativo se os operandos tiverem sinais diferentes – positivo caso contrário
• custo: complementar os operandos e o resultado
1101 (13) 0101 (5) 1101 0000 1101 0000 01000001 (65 ≠ -15) x (-3) (5) sem sinal complemento para dois
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 204
Operadores aritméticos
multiplicação
• Multiplicador iterativo (shift-add)
– multiplicando=Md[m-1:0], multiplicador=Mr[n-1:0]
– Acc[m+n:0] = 0
– para cada bit k do multiplicador desde 0 até n-1
• se Mrk= = 1 Acc[m+n:n] = Acc[m+n-1:n] + Md[m-1:0] • Acc = Acc >> 1– produto = Acc[m+n-1:0]
– exemplo:
Md Mr k Mrk Acc oper. 1101 0101 - - 00000 0000 1101 0101 0 1 01101 0000 add 00110 1000 shift 1101 0101 1 0 00110 1000 add 00011 0100 shift 1101 0101 2 1 10000 0100 add 01000 0010 shift 1101 0101 3 0 01000 0010 add 00100 0001 shiftFEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 205
Operadores aritméticos
multiplicação
• Multiplicador shift-add
– implementação
• em cada ciclo, os m+1 bits do produto parcial são carregados em Acc • o resultado parcial é deslocado para o registo que contém
inicialmente Mr m bit adder Mr Mr0 P[m+n-1:0] Acc Md shr ld shr ld m n n m ld m+1
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 206
Operadores aritméticos
multiplicação
• Multiplicação binária, complemento para dois
– se só for negativo o multiplicando
• basta estender o sinal dos produtos parciais
1101 0101 1111101 000000 11101 0000 11110001 x (-3) (5) (-15) extensão de sinal
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 207
Operadores aritméticos
multiplicação
• Multiplicação binária em complemento para dois
– se o multiplicador for negativo
• basta subtrair o último produto parcial (é igual a zero se for positivo)
– Recordando a representação complemento para dois
• para um número positivo com m bits • se for negativo
• para os dois casos
valor(x) = 0 + Xm-2.2m-2 + …+ X121 + X0.20
valor(x) = -2m + 2m-1+ X
m-2.2m-2 + …+ X121 + X0.20
valor(x) = - Xm-1.2m-1 + Xm-2.2m-2 + …+ X121 + X0.20
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 208
Operadores aritméticos
multiplicação
• Multiplicação em complemento para dois
– se o multiplicador for negativo
– … e se ambos negativos
– implementação: fácil incluir no multiplicador shift-add!
1101 1101 1111101 000000 11101 11110001 11101 00001001 x (-3) (-3) (+9) + -somar os 3 produtos parciais subtraír o último produto parcial extensão de sinal 0101 1101 0101 0000 0101 0011001 0101 11110001 x (5) (-3) (-15) + -somar os 3 produtos parciais subtraír o último produto parcial se o multiplicador
for positivo, o último produto parcial é zero!
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 209
Operadores aritméticos
multiplicação
• Multiplicador shift-add
– avaliação de k bits do multiplicador de cada vez
• número de ciclos reduzido k vezes (shift de k bits de cada vez) • exemplo para k=2
• aumento da complexidade do somador
– é necessário somar 3.Md
– somadores em cascata, tempo de atraso superior
Mr1 Mr0 somar a Acc 0 0 0 0 1 Md 1 0 2.Md 1 1 2.Md+Md m bit adder Mr Mr0 Md shr ld n ld m+1 bit adder Mr1 2.Md Acc m m m m+1 m+2
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 210
Operadores aritméticos
multiplicação
• Multiplicação - recodificação de Booth
– pela propriedade:
• pode substituir-se • por• objectivo: eliminar sequências de uns
– permite evitar em cada ciclo a soma de 3 operandos (2.Md+Md)
1 0 0 1 1 1 0 0 1 2i+k- 2i = 2i+k-1 + 2i+k-2 + 2i+1 + 2i
1 0 1 0 0 1 0 0 1 2i+k - 2i 00 10 11 10 11 01 10 00 10 11 10 11 10 10 00 10 11 11 00 10 10 00 11 00 01 00 10 10 01 01 00 01 00 10 10 factores: 0 2 3 2 3 1 2 factores: 1 -1 0 -1 0 -2 -2
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 211
Operadores aritméticos
multiplicação
• Multiplicação - recodificação de Booth
– algoritmo
• percorrer todos os bits desde o lsb até encontrar um 1 • trocar esse 1 por 1 e percorrer uns até encontrar um zero • trocar esse 0 por 1 e continuar
– exemplo
– tabela de recodificação, analisando 2 bits de cada vez
• é necessário acrescentarum bit zero à direita do lsb: b-1=0
0011 1101 1001 = 512 + 256 + 128 + 64 + 16 + 8 + 1 = 985
0100 0110 1011 = 1024 - 64 + 32 - 8 + 2 - 1 = 985
bi bi-1 zi valor caso 0 0 0 0 cadeia de zeros 0 1 1 +1 fim dos uns 1 0 1 -1 inicio dos uns 1 1 0 0 cadeia de uns
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 212
Operadores aritméticos
multiplicação
• Multiplicação - recodificação de Booth
– multiplicação com sinal: basta recodificar o multiplicador
– para cada bit do multiplicador
• se é 0 não soma nada • se é 1 soma o multiplicando
• se é 1 soma o simétrico do multiplicando
– exemplo
-7 -5 -(-7)x20 +(0)x21 +(-7)x22 -(-7)x23 7-28+56=35 x + 1001 1101 00000111 0000000 111001 00111 00100011 x + (-7) x (-5) = +35 -7 = 1001 -5 = 1011 recodificar -5 (ver tabela) 1011 0 1011 0 1011 0 1011 0 1101FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 213
Operadores aritméticos
multiplicação
• Multiplicador de Booth iterativo
– multiplicador Mr acrescentado de um bit à direita: Mr
-1= 0
– comparados dois bits de Mr de cada vez
• se bi= bi-1desloca produto parcial (11 ou 00 → 0)
• se bi< bi-1soma Md e desloca produto parcial (01 → 1)
• se bi> bi-1subtrai Md e desloca produto parcial (10 → 1)
• deslocamento aritmético do produto • exemplo: – Mr = -3 (1101) – Md = +7 (0111) 1101 0 1 -7 1001 0000 1100 1000 1101 0 1 +7 0011 1000 0001 1100 1101 0 1 -7 1010 1100 1101 0110 1101 0 0 +0 1101 0110 1110 1011 Mr-1 Mr opr. produto
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 214
Operadores aritméticos
multiplicação
• Multiplicador de Booth
– recodificando pares de bits em dígitos com sinal
• são analisados 3 bits de cada vez
• cada par de bits produz uma multiplicação por 0, +1, +2, -1 ou -2 • reduz para metade o número de iterações (shift de 2 bits de cada vez)
– tabela de recodificação
bi bi-1 bi-2 zi zi-1 valor caso 0 0 0 0 0 cadeia de zeros 0 0 1 1 +1 fim de uns 0 1 0 1 +1 1 isolado 0 1 1 1 +2 fim de uns 1 0 0 1 -2 início de uns 1 0 1 1 -1 zero isolado 1 1 0 1 -1 início de uns 1 1 1 0 0 cadeia de uns
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 215
Operadores aritméticos
multiplicação
• Multiplicador de Booth
(n/2 iterações)add/sub Multiplicador Multiplicando n m recode x2 0 1 add/sub sel zero prod b-1 b0 b1 recode
b1 b0 b-1 val sel zero add/sub
0 0 0 0 x 1 x 0 0 1 1 0 0 1 0 1 0 1 0 0 1 0 1 1 2 1 0 1 1 0 0 -2 1 0 0 1 0 1 -1 0 0 0 1 1 0 -1 0 0 0 1 1 1 0 0 1 x
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 216
Operadores aritméticos
multiplicação
• Multiplicação paralela (unsigned)
a4.b0 a3.b0 a2.b0 a1.b0 a0.b0 a4.b1 a3.b1 a2.b1 a1.b1 a0.b1 a4.b2 a3.b2 a2.b2 a1.b2 a0.b2 a4.b3 a3.b3 a2.b3 a1.b3 a0.b3 a4.b4 a3.b4 a2.b4 a1.b4 a0.b4
a4 a3 a2 a1 a0 b4 b3 b2 b1 b0
x
p9 p8 p7 p6 p5 p4 p3 p2 p1 p0
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 217
Operadores aritméticos
multiplicação
• array multiplicador (unsigned)
– cada nó é um full adder
FA FA FA FA FA FA FA FA FA FA FA FA FA FA FA FA FA FA FA FA p0 p1 p2 p3 p4 p5 p6 p7 p8 p9 0 0 0 0 0 a0.b0 a0.b1 a1.b0 a2.b0 a3.b0 a4.b0 a1.b1 a2.b1 a3.b1 a4.b1 a1.b2 a2.b2 a3.b2 a4.b2 a1.b3 a2.b3 a3.b3 a4.b3 a0.b2 a0.b3 a0.b4 a1.b4 a2.b4 a3.b4 a4.b4 FA A B Cin S Cout
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 218
Operadores aritméticos
multiplicação
• multiplicação paralela (signed)
(a4.b0) a3.b0 a2.b0 a1.b0 a0.b0 (a4.b1) a3.b1 a2.b1 a1.b1 a0.b1 (a4.b2) a3.b2 a2.b2 a1.b2 a0.b2 (a4.b3) a3.b3 a2.b3 a1.b3 a0.b3 a4.b4 (a3.b4) (a2.b4) (a1.b4) (a0.b4)
(a4) a3 a2 a1 a0 (b4) b3 b2 b1 b0 x (p9) p8 p7 p6 p5 p4 p3 p2 p1 p0 bit de sinal (peso -24) termos de soma negativos
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 219
Operadores aritméticos
multiplicação
• array multiplicador de Pezaris (n
xn, signed)
– 4 tipos de full adders diferentes
• FA0, FA1, FA2, FA3
FA3 FA2 FA2 p0 p1 p2 p3 p4 p5 p6 p7 p8 (p9) 0 0 0 0 0 a0.b0 a0.b1 a1.b0 a2.b0 a3.b0 a4.b0 a1.b1 a2.b1 a3.b1 a4.b1 a1.b2 a2.b2 a3.b2 a4.b2 a1.b3 a2.b3 a3.b3 a4.b3 a0.b2 a0.b3 a0.b4 a1.b4 a2.b4 a3.b4 a4.b4 FA2 FA2 FA1 FA1 FA1 FA2 FA0 FA0 FA0
FA2 FA0 FA0 FA0 FA2 FA0 FA0 FA0
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 220
Operadores aritméticos
multiplicação
• multiplicador bi-secção (signed)
– separando os termos positivos dos negativos
a3.b0 a2.b0 a1.b0 a0.b0 a3.b1 a2.b1 a1.b1 a0.b1 a3.b2 a2.b2 a1.b2 a0.b2 a4.b4 0 a3.b3 a2.b3 a1.b3 a0.b3
(a4.b3) (a4.b2) (a4.b1) (a4.b0) (a3.b4) (a2.b4) (a1.b4) (a0.b4)
(a4) a3 a2 a1 a0 (b4) b3 b2 b1 b0 x (p9) p8 p7 p6 p5 p4 p3 p2 p1 p0 secção positiva secção negativa
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 221
Operadores aritméticos
multiplicação
• multiplicador bi-secção
– só dois tipos de full-adders
– fácil de expandir para m
xn
FA2 FA2 FA2 p0 p1 p2 p3 p4 p5 p6 p7 p8 (p9) 0 a4.b0 a4.b1 a4.b2 a4.b3 a3.b4 a4.b4 FA2 FA2 FA2 FA2 FA2
FA0 FA0 FA0
0 0 0 a0.b0 a0.b1 a1.b0 a2.b0 a1.b1 a2.b1 a1.b2 a2.b2 a1.b3 a2.b3 a0.b2 a0.b3
FA0 FA0 FA0 FA0 FA0 FA0
a3.b0 a3.b1 a3.b2 a3.b3
FA0 FA0 FA0
a2.b4 a1.b4 a0.b4 0
secção positiva secção negativa
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 222
Operadores aritméticos
– divisão
• divisão de números inteiros sem sinal
– processo parecido com a multiplicação: shift-subtract
– o resultado de uma subtração define a próxima operação
• dependência entre as várias operações • mais complexo do que a multiplicação
– exemplo (sem sinal):
147/11=13, 147%11=410010011 1011 1011 00001101 001110 1011 001111 1011 100 -1 < -10-1-1 10 < 1011 ... 111 < 1011 subtrai divisor resto quociente dividendo divisor
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 223
Operadores aritméticos
– divisão
• divisão unsigned - algoritmo
A=0; // fica com o resto, n bits M=Divisor; // n bits
Q=Dividendo; // “apanha” quociente, m bits cnt=m;
repeat
{A,Q} = {A,Q} << 1;
A = A - M; // subtrai o divisor ao dividendo
if (A>=0)
Q[0] = 1; // divisor “coube” no dividendo
else begin
Q[0] = 0; // divisor não “coube” no dividendo A = A + M; // repõe o valor do dividendo
end cnt = cnt - 1; until (cnt==0); A Q 0011 11000011 0111 10000110 quociente dividendo resto
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 224
Operadores aritméticos
– divisão
• divisão de números inteiros com sinal
(compl.para 2)
M=Divisor; // n bits{A,Q}=Dividendo; // dividendo com extensão de sinal (n+m bits) // A fica com o resto (n bits)
cnt=m; // m bits do dividendo sD = sign({A,Q});// guarda sinal do dividendo
repeat
{A,Q} = {A,Q} << 1;
sA = sign(A); // sinal do resto actual A0 = A; // guarda A
if ( sign(A) == sign(M) )
A = A - M;
else
A = A + M;
if ( sign(A) == sA || ( A == 0 && Q == 0 ) ) // trocou sinal de A
Q[0] = 1;
else begin
Q[0] = 0; // bit do quociente é zero A = A0; // restaura o valor de A
end
cnt = cnt - 1;
until (cnt==0);
if ( sD != sign(M) ) // dividendo e divisor com sinais opostos
Q = -Q;
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 225
Operadores aritméticos
– divisão
• exemplo (signed): -7 / 3
({A,Q} = -7, M = +3)-7 / 3 = -2 -7 % 3 = -1 {A,Q} = -7 = 1001 M = +3 = 0011 ... Q = -2 = 1110 R = -1 = 1111
1111 1001 dividendo com extensão do sinal
1111 0010 shift e guarda A (A=1111)
0011 A e M com sinais diferentes, soma M a A
0010 o resultado trocou o sinal de A
1111 0010 Q[0]=0 e restaura o valor de A
1110 0100 shift e guarda A ( A=1110)
0011 M e A com sinais diferentes, soma M a A
0001 o resultado trocou o sinal de A
1110 0100 Q[0]=0 e restaura o valor de A
1100 1000 shift e guarda A (A=1100)
0011 M e A com sinais diferentes, soma M a A
1111 o resultado não trocou o sinal de A
1111 1001 Q[0]=1
1111 0010 shift e guarda A (A=1111)
0011 M e A com sinais diferentes, soma M a A
0010 o resultado trocou o sinal de A
1111 0010 Q[0]=0, restaura o valor de A
1111 1110 dividendo e divisor com sinais opostos troca o sinal do quociente: Q=-2, R=-1 +
+
+
+
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 226
Operadores aritméticos
– divisão
• Divisor celular (combinacional)
– Array divisor (non-restoring)
CAS CAS CAS CAS
CAS CAS CAS CAS
CAS CAS CAS CAS
CAS CAS CAS CAS
n6 n5 n4 n3 n2 n1 n0 r0 r1 r2 r3 q0 q1 q2 q3 1 d3 d2 d1 d0 dividendo divisor quociente resto CAS (Controlled Add/Subtract) FA Bi Ai Ci Bi Ci+1 Si P P
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 227
Síntese do datapath
outros operadores
• Operadores aritméticos específicos de uma
aplicação
– quadrado
• AxA é mais eficiente do que a multiplicação
– operações com constantes
• propagação de constantes simplifica o hardware (geralmente...) • multiplicação traduzida em shifts, adições e subtracções
– raíz quadrada
• aproximação algorítmica
– funções transcendentes
• aproximações por tabelas, polinómios ou segmentos de recta • domínio da função e precisão pretendida condiciona o método
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 228
Exemplo: Filtro FIR
sptool (MatLab) passband: ripple=1dB Fc=4KHz stopband Fs=6KHz G=-30dBfiltro FIR 31 coeficientes resposta impulsional:
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 229
Exemplo:filtro FIR
multiplicações xk*hn
assign p0 = - ( {1'b0, din } << 1 ); // 9 bits
assign p1 = 8'b0; // 8 bits
assign p2 = din; // 8 bits
assign p3 = -p0; // 9 bits
assign p4 = { {2{din[7]}},din} + ( { {2{din[7]}}, din} << 1 ); // 10 bits
assign p5 = p3; // 9 bits
assign p6 = 0; // 8 bits
assign p7 = p0; // 9 bits
assign p8 = - ( { {3{din[7]}},din} + ( { {3{din[7]}}, din} << 2 ) ); // 11 bits
assign p9 = p8; // 11 bits
assign p10 = -p4; // 10 bits
assign p11 = p4; // 10 bits
assign p12 = ( {{4{din[7]}}, din } << 3 ) + ( {{4{din[7]}}, din } << 1 ) + {{4{din[7]}}, din}; // 12 bits assign p13 = ( {{5{din[7]}}, din } << 4 ) + ( {{5{din[7]}}, din } << 2 ); // 13 bits assign p14 = ( {{5{din[7]}}, din } << 4 ) + ( {{5{din[7]}}, din } << 3 ) + ({{5{din[7]}}, din } << 1);// 13 bits assign p15 = ( {{5{din[7]}}, din } << 5 ) - ( {{5{din[7]}}, din } << 2 ) + ({{5{din[7]}}, din } );// 13 bits
Coeficientes (/128): -2 0 1 2 3 2 0 -2 -5 -5 -3 3 11 20 26 29
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 230
Exemplo:filtro FIR
adições (x
k*h
n-1)+(x
k*h
n-2)+...+x
k*h
0 if ( enable ) begin t0 <= { p0[8], p0 }; t1 <= t0 + { {2{p1[7]}}, p1 }; t2 <= t1 + { {2{p2[7]}}, p2 }; t3 <= { t2[9], t2 } + { {2{p3[8]}}, p3 }; t4 <= { t3[10], t3 } + { {2{p4[9]}}, p4 }; t5 <= t4 + { {3{p5[8]}}, p5 }; t6 <= t5 + { {4{p6[7]}}, p6 }; t7 <= t6 + { {3{p7[8]}}, p7 }; t8 <= { t7[11], t7 } + { {2{p8[10]}}, p8 }; t9 <= t8 + { {2{p9[10]}}, p9 }; t10 <= t9 + { {3{p10[9]}}, p10 }; t11 <= t10 + { {3{p11[9]}}, p11 }; t12 <= { t11[12], t11} + { {2{p12[11]}}, p12 }; t13 <= t12 + {p13[12], p13}; t14 <= { t13[13], t13} + { {2{p14[12]}}, p14 }; t15 <= t14 + { {2{p15[12]}}, p15 }; t16 <= { t15[14], t15 } + { {3{p14[12]}}, p14 }; ...FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 231
Exemplo:filtro FIR
divisão final, arredondamento e clipping
always @( t30 ) begin
corr_bit = ( t30[6] & ( | t30[5:0] ) ) // add 1 if decimal part is 0.1bbbbb with at least one b==1 | ( t30[6] & t30[7] ); // add 1 if decimal part is 0.100000 and integer part is odd dout_bc = t30[15:7] + { 7'd0, corr_bit };
dout = dout_bc[7:0];
// clipping to maxint and minint
if ( dout_bc[8:7] == 2'b01 ) // overflow positive in 8 bits, set to maximum positive dout = 8'b01111111;
if ( dout_bc[8:7] == 2'b10 ) // overflow negative in 8 bits, set to minimum negative dout = 8'b10000000;
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 232
Exemplo: filtro IIR
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 20 40 60 80 100
Normalized Frequency (×π rad/sample)
P has e (d egr ee s ) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 -40 -30 -20 -10 0 10
Normalized Frequency (×π rad/sample)
M agn it ude (d B ) 0 0.05 0.1 0.15 0.2 0.25 0.3 20 40 60 80
Normalized Frequency (×π rad/sample)
P has e (d egr ee s ) 0 0.05 0.1 0.15 0.2 0.25 0.3 -20 -10 0
Normalized Frequency (×π rad/sample)
M agn it ude (d B ) Y/X = 0.86* 1 - z -1 1 - 0.738z-1 Yk = (Xk – Xk-1 + 0.738Yk-1)*0.86
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 233
Exemplo: filtro IIR
assign add1 = -{ {2{dind[15]}}, dind} + { {2{din[15]}}, din} + yd1; always @( add1d or yd1i )
begin
yd1i = { {10{add1d[17]}}, add1d} * 27'd756; yd1 = yd1i[27:10];
end
/* // ou então: always @( add1d or yd1 ) begin
yd1 = add1d - { {2{add1d[17]}}, add1d[17:2] }; yd1 = add1d - { {4{yd1[17]}}, yd1[17:4] }; yd1 = add1d + { {1{yd1[17]}}, yd1[17:1] }; yd1 = { {1{yd1[17]}}, yd1[17:1] }; end
*/ // douti = add1d * int( 0.86 * 256 ) / 256;
always @( add1d or doutii ) begin
doutii = { {8{add1d[17]}}, add1d} * 25'd220; douti = doutii[25:8];
end
/* // uma forma alternativa de codificar o mesmo: always @( add1d or douti )
begin
douti = add1d - { {3{add1d[17]}}, add1d[17:3] }; douti = add1d + { {1{douti[17]}}, douti[17:1] }; douti = add1d + { {1{douti[17]}}, douti[17:1] }; douti = { {1{douti[17]}}, douti[17:1] }; end
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 234
Teste de sistemas digitais
• Definição
– determinar se um sistema (fabricado) funciona correctamente
• aplicar estímulos seleccionados• observar as respostas
• compará-las com as respostas esperadas
• Níveis de hierarquia
– sistemas - interligação de cartas de circuito impresso
• defeitos em cartas ou interligações– cartas - interligação de componentes
• defeitos nas interligações, componentes mal colocados
– componentes (chips) - interligações de transistores
• defeitos nos contactos, curto circuitos ou circuitos abertos nas pistas
Baseado em ”Digital Systems Testing and Testable Design”,
M. Abramovici, M.A. Breuer, A.D. Friedman, Computer Science Press, 1990
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 235
Testar quando ?
• O teste de um CI pode ser feito
– na wafer
• contactos directos aos pads ou outros pontos de teste
– após o encapsulamento
• pelos terminais do CI
– após a inserção numa carta
• usando autoteste ou infraestruturas residentes para teste
– integrado num sistema antes da distribuição
• teste pós-produção
– integrado num sistema após instalação no utilizador final
• field testFEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 236
Testar quando ?
• Quanto mais cedo melhor
– custo de detectar uma falta
wafer $0.01 - $0.1 CI encapsulado $0.1 - $1 carta $1 - $10 sistema $10 - $100 utilizador $100 - $1000 aumento de 10x
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 237
Tipos de teste
• Quando é realizado o teste ?
– em simultâneo com a operação do sistema (on-line, concurrent)
– como uma actividade separada (off-line)
• O que se procura com o teste ?
– erros de projecto (design verification testing)
– erros de fabrico (acceptance testing)
– defeitos de fabrico, falhas no processo (burn-in)
– falhas físicas infantis (quality assurance testing)
– falhas físicas, factores externos (field testing, maintenance)
• permanentes, intermitentes, transitóriasFEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 238
Tipos de teste
• Que fonte de estímulos, quem verifica resultados ?
– produzida pelo próprio sistema (self testing)– proveniente de um equipamento externo dedicado (external testing)
• Como são produzidos os estímulos e respostas ?
– armazenados em memória (stored pattern testing)
– produzidos durante o teste (algorithmic testing, comparision testing)
• Como são aplicados os estímulos ?
– numa ordem pré-determinada (non-adaptative testing) – dependendo dos resultados obtidos (adaptative testing)
• Que rapidez de aplicação dos estímulos ?
– muito mais lentos do que em funcionamento normal (DC ou static) – à velocidade normal de funcionamento (AC- ou at-speed testing)
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 239
Tipos de teste
• Que resultados são observados ?
– as respostas de todas as saídas
– uma função da resposta (compact testing)
• Que sinais são usados para teste ?
– só os terminais de entrada e saída (edge-pin testing,
GO/NO GO)
– terminais de E/S e nós internos
• guided probe testing - ao nível da carta, localizar falhas • bed of nails - contacto directo a nós internos
• in-circuit - isolar componentes montados numa carta
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 240
Teste funcional e teste
estrutural
• Teste funcional
– verificar que o projecto do circuito implementa a especificação
• ao nível funcional, RTL ou lógico– verificar que o circuito realiza a função pretendida
• após a sua implementação na tecnologia alvo• Teste estrutural
– verificar que os componentes do sistema funcionam
– verificar que as interligações entre os componentes funcionam
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 241
Qualidade e fiabilidade
• Qualidade
– satisfação de especificações funcionais, eléctricas e físicas
• projecto e manufactura• qualidade de materiais • controlo do yield
• Fiabilidade
– capacidade de um componente cumprir a sua função em
condições determinadas e durante um período de vida
especificado
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 242
Yield e nível de defeitos
• Yield (processo de fabrico)
• nível de defeitos (no cliente)
nº componentes bons nº componentes fabricados nº componentes defeituosos nº de componentes enviados teste fabrico enviados (bons e avariados) rejeitados
(dados como avariados)
matéria prima
fabricados
Y =
DL =
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 243
Modelos de faltas
• Defeitos físicos manifestam-se como
– falhas ao nível eléctrico (curto circuito, circuito aberto) – falhas ao nível lógico (trocas de zero por uns)
• Modelos de faltas
– representação da forma como um defeito físico afecta o comportamento
• em diferentes níveis de abstração (RTL, lógico ou eléctrico)
– o mesmo defeito físico é representado por diferentes modelos
• modelos de faltas realistas
– conhecimento dos mecanismos físicos e eléctricos que podem causar faltas – fundamentais para a geração eficaz de estímulos de teste
– estímulos de teste
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 244
Cobertura de faltas
• Teste exaustivo é impraticável
– circuito com N entradas ⇒ 2Nvectores (N=75, 1µs/vector = 1.2G anos)
• Estímulos de teste
– conjunto limitado de valores para as entradas
– objectivo: detectar resultados errados para qualquer falta no circuito – modelos de faltas simplificados
• admite-se uma só falta de cada vez do tipo stuck-at-1, stuck-at-0
• Cobertura de faltas (fault coverage)
FC = nº faltas detectadas
nº faltas consideradas x 100%
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 245
Yield, Defect level, Defect coverage
DL = 1 - Y
(1-DC) 0 0 .1 0 .2 0 .3 0 .4 0 .5 0 .6 0 .7 0 .8 0 .9 1 0 0 .2 0 .4 0 .6 0 .8 1 Y=1% Y=10% Y=25% Y=50% Y=75% Y=90% Y=99% cobertura de defeitos (DC) nível de def eitos (DL ) DC = nº faltas detectadas nº faltas possíveis x 100% (DC <= FC)FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 246
Modelo de faltas Single Stuck-at
• Modela uma falta como colagem de um nó a 1 ou 0
– considera que não ocorrem várias faltas simultâneamente– estímulos de teste devem produzir saídas erradas se o nó em análise estiver sempre a 1 ou sempre a 0
– vantagens
• simplicidade
• traduz o comportamento (ao nível lógico) de muitas falhas físicas • independente da tecnologia
• possibilita o tratamento matemático do teste (geração de estímulos) • testes criados para SSF também detectam outros tipos de faltas (MSF)
– num circuito combinacional grande, o número de faltas SS é nF≈2.G.f
• G = número de portas lógicas • f = fanout médio
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 247
Geração de testes
(faltas lógicas)
• Um vector de teste t detecta uma falta
– se a saída do circuito for diferente com a falta e sem a falta
• Teste de um circuito lógico
– conjunto T de vectores de teste aplicados em sequência
– num circuito combinacional podem ser aplicados em qualquer ordem – detecção de uma falta
• activar a falta - forçar nesse nó um valor diferente do imposto pela falta • propagar o erro para a saída - conduzir a valores diferentes na saída
– exemplo: a b c d 0 0 1 1 0 0 0/1 0/1 0/1 sa1
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 248
Detecção de faltas
• Faltas indetectáveis
– não são detectadas por nenhum vector de teste – invalidam a consideração uma só falta ss@ de cada vez
– todas as faltas stuck-at de um circuito não-redundante (simplificado) são detectáveis
• Equivalência funcional
– duas faltas f e g são funcionalmente equivalentes se Zf(x) = Zg(x)
• Zf(x) e Zg(x) são a resposta do circuito na presença da falta f e g
– nenhum teste distingue entre duas faltas funcionalmente equivalentes – basta considerar uma falta de cada classe (equivalence fault
collapsing)
• Localização de faltas
– para além de detectar, interessa saber a que classe pertence uma falta
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 249
Equivalência funcional e
estrutural
• Equivalência funcional com o modelo SS@
– determinar a equivalência entre faltas é um problema NP-completo – solução é calcular a resposta do circuito com uma e outra falta
• Equivalência estrutural
– um circuito com uma SSF pode ser simplificado
• removendo todas as linhas (excepto entradas) que ficam constantes com a presença da falta
– duas faltas são estruturalmente equivalentes se os circuitos simplificados forem idênticos
– faltas estruturalmente equivalentes são funcionalmente equivalentes – equivalência estrutural pode ser determinada por uma análise local da
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 250
Simulação de faltas
• Simular o circuito na presença de faltas
• Avaliar a qualidade de um teste
– determinar a cobertura de faltas ( FC >= DC)
• Geração de vectores de teste
– construir, modificar e avaliar testes para obter uma dada cobertura
• Construção de diccionários de faltas
– identificar faltas pelas respostas do circuito• Análise do comportamento na presença de faltas
– em que medida uma falta afecta o comportamento do circuito ?FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 251
Simulação de faltas
• Simulação série
– o circuito é acrescentado de uma falta de cada vez e simulado – processo lento, repetido para cada falta
– requer apenas um simulador lógico
– possibilita a simulação de qualquer tipo de falta
– é impraticável para simular um número elevado de faltas
• Simulação paralela
– simulação em paralelo de N circuitos, cada um com uma falta introduzida – número de iterações (simulações) é reduzido N vezes
– é mantida uma lista com os estados de cada nó na presença de cada falta.
1 0 1 0 0 1 1 1 0 1
resposta do circuito bom
para cada nó i
k ssa-1 k ssa-0 l ssa-1 l ssa-1 …
faltas consideradas
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 252
Simulação de faltas
• Deductive
– simula o circuito bom e deduz o comportamento de “todos” os circuitos faltosos (para o conjunto de faltas considerado) – em cada nó i é mantida uma lista Li das faltas observáveis nesse
nó
• o valor do nó i é diferente para o circuito bom e para o circuito faltoso
• se i é uma saída primária, Li é o conjunto de faltas detectáveis em i
– operação básica para simular um elemento lógico
• dados os valores das entradas sem faltas e a lista de faltas para cada entrada, calcular a saída sem falta e a lista de faltas na saída. • simulador propaga eventos de modificação das listas de faltas
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 253
Simulação de faltas
• Concorrente
– numa simulação de faltas, a maior parte dos valores nos circuitos faltosos Nfé igual aos do circuito bom N
– simulação concorrente:
• simula o circuito bom
• para cada circuito Nfsão simulados apenas os elementos que diferem de N
– durante a simulação e para cada elemento x em N (xfem Nf)
• a lista Vx (Vxf) das entradas, saídas e estados internos de x (xf) • a lista CLx representa todos os elementos xfque são diferentes de x
– porque Vx ≠ Vxf: a falta f foi propagada para as entradas ou saídas de x
– porque a falta f é local a xf, mesmo se Vx = Vxf (falta f não activada)
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 254
Geração de testes
• Geração de testes - problema complexo
– custo requerido para construir e avaliar a qualidade do teste – depende da complexidade do circuito - design for testability – random test generation (RTG) - testes gerados aleatóriamente – deterministic test generation - usa um modelo do circuito
• geração manual ou automática de testes
• testes gerados para uma falta específica ou sem definir qualquer falta
– qualidade do teste
• número de faltas que podem ser detectadas - fault coverage (FC) • extensão do teste: para a mesma FC, quanto mais curto melhor.
– custo da aplicação do teste
• tempo de aplicação do teste, tempo de processamento das respostas • requisitos de memória do testador
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 255
Geração automática de testes
(ATG)
• Faltas SSF em circuitos combinacionais fan-out free
– passos básicos para gerar uma falta l do tipo s-a-v• definir entradas primárias que activem a falta: forçar v nesse nó • propagar o erro para uma saída primária
– para cada sinal considera-se um par de valores, com e sem a falta
– operações lógicas: processando separadamente os dois valores
D . 1 = 1/0 . 1/1 = 1.1/0.1 = 1/0 = D
– operações são consistentes com a álgebra booleana
D.D = 0, D+D = 1, D+D = D.D = D, D.D = D+D = D v/vf 0/0 0 1/1 1 1/0 D 0/1 D situações de erro
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 256
ATG para SSF
(combinacionais, fan-out free)
• Algoritmo para gerar um teste para l s-a-v
set all values to x (undefined logic value)justify(l,v) if (v == 0)
propagate(l,D) else
propagate(l,D)
justify(l,v) determina as entradas primárias que forçam v no nó l
propagate(l,D) propaga D de l para uma saída primária, determinando os valores necessários para as entradas primárias
a b c d e f s-a-0 g i h j
inicial: justify(f,1); propagate(f,D) justify(f,1): a=1; b=1
propagate(f,D): justify(g,0); propagate(h,D) justify(g,0): c=0; d=x
propagate(h,D): justify(i,1) justify(i,1): e=0 Teste para f s-a-0: 110x0
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 257
ATG para SSF
(combinacionais, fan-out)
• Em circuitos fan-out free
– problemas justify()podem ser resolvidos independentemente • os conjuntos de entradas definidas por cada são mutuamente exclusivos
• Em circuitos com fan-out
– objectivos básicos iguais: activar uma falta e propagar o erro – activar uma falta l s-a-v consiste em justificar v em l – propagar o erro: vários caminhos até à saída, escolher um. – dificuldade: em geral os problemas justify não são independentes – necessário backtracking quando são encontradas inconsistências
• exploração sistemática do espaço de soluções (enumeração implícita)
– se existir, encontra um teste
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006
José Carlos Alves 258
ATG para SSF
(combinacionais, fan-out)
• Algoritmo recursivo para ATG
solve()if imply_and_check() = FAIL return FAIL
if (error at PO and all lines justified) return SUCCESS
if (no error can be propagated to a PO) return FAIL
select an unsolved problem repeat
select one untried way to solve it if Solve() = SUCCESS
return SUCCESS
until all ways to solve the problem have been tried return FAIL
imply_and_check() encontra a solução para os problemas que podem ser resolvidos por implicação
verifica a consistência do resultado em circuitos fan-out free encontra a solução
FEUP/DEEC, Projecto de Sistemas Digitais, 2005/2006 259
ATG - exemplo
activar f implica justificar g1=0 justificar g1=0 implica a=b=c=1 o erro pode ser propagado para f1 ou f2 escolhendo f1 é necessário justificar g2=1
justificar g2=1 implica d=a=0: inconsistência com a=1 para justificar g1=0 backtrack: propagar a falta para f2, implica justificar g4=1
justificar g4=1 implica c=1, e=0
teste para f f s-a-1: abcde=111x0 a b c d e f s-a-1 f2 f1 g2 g1 g3 g4