Métodos Quantitativos para
Ciência da Computação Experimental
‐Aula #2c
Virgílio A F Almeida Virgílio A. F. Almeida Abril 2010Departamento de Ciência da Computação Universidade Federal de Minas Gerais Universidade Federal de Minas Gerais
Servidor Web: medições experimentais
Request No CPU time (sec) I/O time (sec) Elapsed time (sec) Request No. CPU time (sec) I/O time (sec) Elapsed time (sec)
1 0.0095 0.0400 0.0710 2 0.0130 0.1100 0.1450 3 0.0155 0.1200 0.1560 4 0.0088 0.0400 0.0650 5 0 0111 0 0900 0 1140 5 0.0111 0.0900 0.1140 6 0.0171 0.1400 0.1630 7 0.2170 1.2000 4.3800 8 0.0129 0.1200 0.1510 9 0.0091 0.0500 0.0630 10 0 0017 0 1400 0 1890 10 0.0017 0.1400 0.1890 Average 0.03157 0.205 0.5497
Servidor Web: medições experimentais
como descrever?
e se fosse uma grande quantidade de dados?
Request No CPU time (sec) I/O time (sec) Elapsed time (sec) Request No. CPU time (sec) I/O time (sec) Elapsed time (sec)
1 0.0095 0.0400 0.0710 2 0.0130 0.1100 0.1450 3 0.0155 0.1200 0.1560 4 0.0088 0.0400 0.0650 5 0 0111 0 0900 0 1140 5 0.0111 0.0900 0.1140 6 0.0171 0.1400 0.1630 7 0.2170 1.2000 4.3800 8 0.0129 0.1200 0.1510 9 0.0091 0.0500 0.0630 10 0 0017 0 1400 0 1890 10 0.0017 0.1400 0.1890 Average 0.03157 0.205 0.5497
Servidor Web: medições
ç
Request No CPU time (sec) I/O time (sec) Elapsed time (sec) Request No. CPU time (sec) I/O time (sec) Elapsed time (sec)
1 0.0095 0.0400 0.0710 2 0.0130 0.1100 0.1450 3 0.0155 0.1200 0.1560 4 0.0088 0.0400 0.0650 5 0 0111 0 0900 0 1140 5 0.0111 0.0900 0.1140 6 0.0171 0.1400 0.1630 7 0.2170 1.2000 4.3800 8 0.0129 0.1200 0.1510 9 0.0091 0.0500 0.0630 10 0 0017 0 1400 0 1890 10 0.0017 0.1400 0.1890 Average 0.03157 0.205 0.5497
Como sumarizar os dados experimentais?
Como sumarizar os dados experimentais?
P f
B D i
M
é & Al
id
Performance By Design, Menascé & Almeida
i
ib i õ
d
iá i
l
ó i
Distribuições Comuns de Variáveis Aleatórias
Discretas
if
1. Uniforme
2. Bernoulli
3. Binomial
4 Geometrica
4. Geometrica
5. Poisson
Distribuição Discreta Uniforme
• A v.a. discreta X que assume n valores discretos
com probabilidade p (i) = 1/n 1
≤
i
≤
n
com probabilidade p
X(i) = 1/n, 1
≤
i
≤
n
f
(
)
⎨
⎧
1
/
n
,
se
x
i∈ X
• pmf
⎩
⎨
=
contrário
caso
x
p
X i i,
0
)
(
• CDF:
F
t
p
i
t
t X=
=
∑
(
)
)
(
n
i X∑
=1Variável de Bernoulli
– V.A gerada por um experimento único de Bernoulli tem um resultado binário {0,1}
– A v a binária X é chamada variável de Bernoulli tal que:A v.a. binária X é chamada variável de Bernoulli tal que:
–Função de massa de probabilidade
:
)
1
(X
P
p
)
0
(
1
)
1
(
=
=
−
=
=
=
X
P
p
q
X
P
p
)
(
p
q
Distribuição de Bernoulli
• CDF
p+q=1 x 0 0 1 0 q 0.0 1.0Binomial
Binomial
Numa distribuição binomial, tem‐se:
1 Todos experimentos são independentes 1. Todos experimentos são independentes.
2. Número de sucessos x numa sequência de experimentos de Bernoulli.
2 C d lt d é “ ” “f lh ” 2. Cada resultado é um “successo” ou “falha”.
3. A probabilidade de sucesso de um experimento é dado por p. A probabilidade de uma falha é 1‐ p.
4. Uso do modelo: número de processadores “down” num cluster; número de pacotes que chegam ao destino sem erro.
Distribuição Binomial
Distribuição Binomial
A distribuição binomial com parâmetros
n 0 and 0 < p < 1, is
≥
n
x n x( )
⎛
⎜
⎞
⎟
(
1
)
−≥
p x
x
p
p
x n x( )
=
⎛
(
)
⎝⎜
⎞
⎠⎟
1
−
Qual a média e variância????
Distribuição Binomial
Distribuição Binomial
A distribuição binomial com parametros n 0 and 0 < p < 1, is
≥
n
x n x⎛
⎜
⎞
⎟
A édi iâ i d bi i l ãp x
n
x
p
p
x n x( )
=
⎛
(
)
⎝⎜
⎞
⎠⎟
−
−1
A média e variância da binomial são: 2μ
=
np
σ
2=
np
(
1
−
p
)
Distribuição Geométrica
• Número de experimentos até incluir o 1o sucesso
• Número de experimentos até incluir o 1o sucesso.
• Em geral S pode ter um tamanho infinitamente contávelEm geral , S pode ter um tamanho infinitamente contável
• Definir a v.a Z (
∈
S): amostra: 0 i-1 1 = i • Por causa da independência:pGeométrica
• A distribuição geometrica é a única distribuição
discreta que exibe a propriedade MEMORYLESS
discreta que exibe a propriedade MEMORYLESS.
• Resultados futuros são independentes de eventos
passados
passados.
• n experimentos completaram todos com falhas. Y
experimentos adicionais são executados antes de
experimentos adicionais são executados antes de
um sucesso, i.e. Z = n+Y or Y=Z-n
Geométrica: ausência de memória
• Y=Z-n
) | ( ) | ( n Z i n Z P n Z i Y P > = − = > = = ) ( ) | ( n Z and i n Z P n Z i n Z P > + = = > + = = ) ( ) ( ) ( ) ( i n p i n Z P i n Z P n Z P Z + = + = = + = = > = ) ( ) ( 1 ) ( 1 ) ( 1 1 i pq n F n F n Z P i i n Z Z − = − = > = − − + ) ( ) 1 ( 1 q pq p i pq Z i n = = − − =V.A. Geometrica
• Exercício: Mostre que
1
∞ 11
( )
1 and ( )
XP x
E x
p
∞=
=
∑
1 x=p
Poisson: propriedades
• Considere que um servidor espera receber 100 transações em um minuto: transações em um minuto: • Espera‐se que: – O início de cada transação é independente dos outros;ç p ; – Para cada pequeno intervalo de tempo Δt, a probabilidade de uma nova transação chegar é λΔt – A probabilidade de chegar duas transações ao mesmo tempo é zero!• O processo de Poisson tem as propriedades acima • O processo de Poisson tem as propriedades acima.
Di t ib i ã d P i
•
F ã d d b bilid d ( f)Distribuição de Poisson
•
Função de massa de probabilidade (pmf):)
(
λ
t
k{
}
k!
)
(
)
(
t
k
e
t
N
P
p
k=
=
=
−λtλ
•
CDF:)
(
λ
k( )
⎣ ⎦k!
)
(
0 k∑
−=
x k tt
e
x
F
λλ
k!
0 = kPoisson
Poisson
Poisson pmf
p
kp
Poisson pmf
p
kp
λt=4.0
Poisson
• Uma v.a. de Poisson X tem sua pmf:: xλ
(
)
0,1, 2,...
!
P X
x
e
x
x
λλ
−=
=
=
Ondeλ
> 0 é uma constanteE
i i
λ
• Exercicio:
mostre que: E(X) =λ
P x
( ) 1
∞Σ
λ
E(X) =λ
0 X( ) 1
xΣ
=P x
=
Poisson: aplicações
• A v.a. de Poisson é boa para modelar
vários fenômenos, como o número de
transações que chega num servidor em
uma hora, ou o número de queries que
chega numa máquina de busca em 1
minuto ou número de pacotes que chega
p
q
g
num roteador em 1 segundo.
Exponencial
Exponencial
Search Algorithms: Is the Web‐Graph a
Search Algorithms: Is the Web Graph a
Random graph? No!
• Random graph Gn,p: – n nodes
– Every directed edge occurs with probability pEvery directed edge occurs with probability p • Is the Web‐graph a random graph Gn,p? • The probability of high degrees decrease exponentially • In a random graph degrees are distributed according to a Poisson distribution distribution • Therefore: The degree of a random graph does not obey a power law
Experimental results
Experimental results
• Player/Stage simulations; • Sensor Network of 25 • Sensor Network of 25 motes;• Groups of 1-4 robots, 10Groups of 1 4 robots, 10 trials/group
• 10 Alarms are drawn from
h P i di ib i
the Poisson distribution with λ=1/60;
• Empty environment A = • Empty environment, A =