Por que a variável é denominada aleatória? Porque seus valores ocorrem de forma aleatória ou probabilística.

(1)

UNIDADE III - Elementos de probabilidades UNIDADE III - Elementos de probabilidades

3.1. Introdução à teoria das probabilidades 3.1.1. Introdução

3.1.2. Conceitos fundamentais 3.1.3. Conceitos de probabilidade

3.1.4. Teoremas para o cálculo de probabilidades 3.1.5. Probabilidade condicional e independência 3.2. Variáveis aleatórias

3.2.1. Introdução e conceito

3.2.2. Variáveis aleatórias discretas 3.2.3. Variáveis aleatórias contínuas 3.3. Distribuições de probabilidade

3.3.1. Distribuições de probabilidade de variáveis discretas 3.3.2. Distribuições de probabilidade de variáveis contínuas

Profa. Clause Piana 1

Por que a variável é denominada aleatória?

Porque seus valores ocorrem de forma aleatória ou probabilística.

Uma das mais importantes maneiras pelas quais a aleatoriedade nos afeta é por meio de sua influência nas medições.

Por exemplo, quando um professor avalia um trabalho de um aluno a nota não é uma descrição do grau de qualidade do trabalho, mas uma mediçãodessa qualidade. Nesse caso, o instrumento de medição é o professor, e a avaliação de tal profissional, como qualquer medição, está sujeita a variações e erros aleatórios.

A incerteza da medição é ainda mais problemática quando a quantidade medida é subjetiva.

Para entender as medições é fundamental conhecer a forma como os dados estão distribuídos.

As medidasdescritivas são uma ferramenta essencial para obter essas informações.

(2)

Outro exemplo: suponha que 15 enólogos vão avaliar um vinho.

Situação 1.Os 15 enólogos concordam que a nota do vinho é 90.

Situação 2.Os enólogos expressam as notas 80, 81, 82, 87, 89, 89, 90, 90, 90, 91, 91, 94, 97, 99 e 100.

Uma das maneiras de gerar um número único a partir de uma série de medições discordantes é calcular a média. Assim, podemos resumir as opiniões utilizando a média das notas atribuídas ao vinho. Mas essa informação é suficiente?

Os dois conjuntos de dados tem a mesma média, mas diferem no quanto variam a partir dessa média.

O desvio padrão caracteriza o quanto um conjunto de dados se aproxima da média, o que também pode significar a incerteza dos dados.

Na situação 2, o desvio padrão é 6 e o que podemos realmente dizer sobre o vinho é que sua nota provavelmente se situe entre 84 e 96.

A Estatística busca a regularidade presente na variabilidade Esta regularidade permite que as variáveis aleatórias sejam representadas por modelos matemáticos, que são

denominados distribuições de probabilidade.

As distribuições de probabilidade constituem a espinha dorsal da metodologia estatística, pois é com base nesses modelos que a Estatística cria técnicas que possibilitam tomar decisões válidas apesar da variabilidade e na presença de incerteza.

Notamos assim que a aleatoriedade (os erros aleatórios) gera variabilidade.

Na pesquisa científica o pesquisador precisa tomar decisões e obter conclusões na presença de variabilidade.

(3)

Distribuições de probabilidade

O que é uma distribuição de probabilidade?

Uma distribuição de probabilidade é essencialmente um modelo de descrição probabilística de uma população.

População estatística é o conjunto de todos os valores de uma variável aleatória.

X=x 0 1 2

Σ

P(X=x) 0,1 0,6 0,3 1

População estatística

Distribuição de probabilidade

Distribuições de probabilidade:são modelos matemáticos para descrição probabilística da ocorrência de valores de uma variável aleatória

Os modelos têm aplicações gerais e são individualizados por meio dos parâmetros

Parâmetros:caracterizações numéricas que permitem a individualização de um modelo em determinado contexto As ideias de população e distribuição de probabilidade são indissociáveis e serão tratadas como sinônimos. O termo

“distribuição” se refere ao modo como as probabilidades se distribuemaos diferentes valores do espaço amostral.

(4)

1.O tipo de distribuição, que é determinado pela função de probabilidade da variável

2.Os parâmetrosda distribuição

3.As medidas descritivas da distribuição (média, variância, assimetria)

No estudo de uma variável aleatória é importante saber:

1. Distribuição de Bernoulli 2. Distribuição Binomial

3. Distribuição Hipergeométrica 4. Distribuição de Poisson 5. Distribuição Multinomial 6. Distribuição Geométrica 7. Distribuição Binomial Negativa

8. Distribuição Hipergeométrica Negativa 9. Distribuição Uniforme

Distribuições discretas

(5)

1. Distribuição Uniforme 2. Distribuição Exponencial 3. Distribuição Normal

* Distribuição Normal Padrão 4. Distribuição Gama

5. Distribuição Beta 6. Distribuição Lognormal 7. Distribuição Seminormal 8. Distribuição Weibull 9. Distribuição Gumbel

Distribuições contínuas

Distribuições de probabilidade de

variáveis discretas

(6)

1. Distribuição de Bernoulli

Definição: Modelo que descreve

probabilisticamente os resultados de um experimento de Bernoulli.

O experimento (ou ensaio) de Bernoulli é definido como o experimento aleatório que possui apenas dois resultados possíveis.

Deduzida no final do século XVII pelo matemático suíço Jakob Bernoulli.

Jakob Bernoulli (1654 – 1705)

Exemplo: Uma semente é colocada para germinar S = {germinar, não germinar}

Consideramos um dos resultados como sucesso:

sucesso = germinar fracasso = não germinar

Definimos a variável X como número de sucessos em uma repetição do experimento.

X = número de sucessos

X = , se germinar , se não germinar 0

1 S_X = {0,1}

(7)

Função de probabilidade

De modo geral, se X é uma variável que tem distribuição de Bernoulli, sua função de probabilidade será:

X = x ⁰ ¹ Σ

P(X = x) 1-ππππ ππππ ¹

Representação tabular ππππ = probabilidade de sucesso

1-ππππ = probabilidade de fracasso

Representação analítica

, para S_X= {0, 1}

A distribuição de Bernoulli tem apenas um parâmetro:

π = probabilidade de sucesso X~ Ber (π)

parâmetro Parâmetro

X tem distribuição de Bernoulli com parâmetro ππππ

.

⁻

= = π

^x

− π

^{1 x}

P(X x) (1 )

(8)

Medidas descritivas

Média ou valor esperado E(X) =µ=

∑

∈S_X x

p(x) x

Para S_X= {0, 1}

= × −0 (1 π) 1+ × =π π E(X) = µ=

∑

∈S_X x

p(x) x

Teorema: E(X)=µµµµ=ππππ

X = x ⁰ ¹ Σ

P(X = x) ^1-π π 1

Variância

Para S_X= {0, 1}

E(X²) =

∑

∈S_X x

2p(x) x

V(X) =

σ

² =E(X²)−µ²

= −π π² ⁼π (1⁻π)

Teorema:

V(X) =

σ

² =E(X²)−µ²

X = x ⁰ ¹ Σ

P(X = x) ^1-π π 1

=0²× −(1 π) 1+ ²× =π π

V(X)=

σ σ σ σ

²=ππππ(1-ππππ)

(9)

Coeficiente de assimetria

3 2

3 3

3

2 2 2

2

2 ) E(X 3 ) E(X )

E(X

) E(X )

E(X

µ + µ

−

= µ

−

= µ

µ

−

= µ

−

= µ

2 2

3

a

3

µ µ

= µ

− −

= −

π π

3

(1 )

a (1 )

Teorema:

desvio padrão

3 2 3

3 2

3 3

2 2

2 3 2

3 2

) E(X 3 ) E(X

1 )

E(X

π + π

− π

= π + ππ

− π

= µ + µ

−

= µ

π

− π

= π

− π

= µ

−

=

µ ( )

2 2 3 3

a µ µ

= µ

− −

= −

π π π π

3

(1 )

a (1 )

Teorema:

desvio padrão

) (

) ( ) (

) )(

( ) ( ) (

) (

) ( ) (

) (

) ( ) (

π

− π

π

= − π

− π

π

= − π

− π π

−

π

− π

= − π

− π π

−

π + π

= −

π

− π π

− π

π + π

−

= π

π

− π π

− π

π + π

−

= π

1 2 1 1

2 1 1

1

2 1 1 1

1

2 3 1

1 1

2 3 1

1 1

2 a 3

2 2 3 2 3

2 2 2

2 2

2 1 1

1 2 3 1

π

− π

π + π

−

π

− π

+

π

− π + π

−

(10)

2. Distribuição binomial

Definição: Modelo que descreve probabilisticamente os resultados de uma seqüência de experimentos de Bernoulli independentes entre si, ou seja, onde a probabilidade de sucesso é constanteem todas as repetições do experimento.

n 2

1

Y Y

Y

X = + + ... +

onde:

Y_i~ Ber (π);

Y_i’ssão independentes;

então, a variável X tem distribuição binomial.

Se

Distribuição binomial processo finito de Bernoulli

n experimentos de Bernoulli independentes, com probabilidade de sucesso ππππ constante para todos eles

É importante no contexto de amostragem com reposição

Exemplo: Em uma estância 60% dos bovinos foram vacinados contra uma determinada doença. Se um bovino dessa estância é escolhido ao acaso e sua situação em relação a vacinação é registrada, temos um experimento de Bernoulli.

S = {vacinado, não vacinado}

onde:

p(não vacinado) = p(vacinado) = 0,6

1 - 0,6 = 0,4

Se três bovinos são escolhidos, um a um, e o resultado é registrado, temos uma seqüência de três experimentos de Bernoulli independentes, pois, a cada escolha, a probabilidade de sucesso permanecerá inalterada.

(11)

S = {VVV

#S = 2³= 8 V = vacinado N = não vacinado

, VVN, VNV, NVV, NNV, NVN , VNN, NNN}

A variável X é definida como o número de sucessos em n experimentos de Bernoulli independentes, com probabilidade de sucesso igual a ππππ.

S_X= {0, 1, 2, 3}

Sucesso = vacinado

n=3 e π=0,6

Qual é a função de probabilidade P(X=x) associada a variável X?

P(X=0) = 0,4³

S = {VVV, VVN, VNV, NVV, NNV, NVN, VNN, NNN}

S_X = {0,1,2,3}

P(X=1) = 3 ×0,6¹× 0,4² P(X=2) = 3 × 0,6²×0,4¹ P(X=3) = 0,6³

P(X=x) = ?

= 1× π⁰ ×(1 – π)³ = 0,064

= 3× π¹ ×(1 –π)²= 0,288

= 1× π³ ×(1 –π)⁰ = 0,216

Como podemos determinar de quantas maneiras diferentes teremosxsucessos e3-xfracassos?

x 3 x,

P

3 ⁻ Permutação com repetição

= 3× π² ×(1 –π)¹ = 0,432

(12)

P(X=0) = P(X=1) = P(X=2) = P(X=3) =

1,2

P3 0,3

P3

x 3 x

x 3 x,

3 (1 )

P x)

P(X= = ⁻ π −π ⁻

Qual é a função de probabilidade P(X=x) associada a variável X?

x n x

x n x,

n (1 )

P x)

P(X= = ⁻ π −π ⁻

3,0

P3

x)!

n x!

P_n^x,ⁿ ^x n!

= −

−

( 1

2,

P3

π¹ (1–π)² π⁰ (1–π)³

π² (1–π)¹ π³ (1–π)⁰

Generalizando para n repetições do ensaio de Bernoulli:

x 3 x

x 3 x,

3

0,6 (1 0,6)

P x)

P(X = =

⁻

−

⁻

X = x

⁰ ¹ ² ³

Σ

P(X = x)

0,064 0,288 0,432 0,216 1 Representação tabular

, para S_X= {0, 1, 2, 3}

Número de casos

Probabilidade de um caso

(13)

q)n

(p+ π= p

1–π= q

n = repetições

q p q 1p q 1p q)

(p+ ¹ = ¹ ⁰ + ⁰ ¹ = +

2 2

2 0 1 1 0 2

2 1p q 2p q 1p q p 2pq q

q)

(p+ = + + = + +

1 q p 1 q)

(p+ ⁰= ⁰ ⁰=

3 0 2 1 1 2 0 3

3 1p q 3p q 3p q 1p q

q)

(p+ = + + +

←Binômio de Newton

P(X=0) = P(X=1) = P(X=2) = P(X=3)=

1 π⁰ (1 –π)³

3 π¹ (1 – π)² 3 π² (1 –π)¹ 1 π³ (1 –π)⁰

Por que esta distribuição é denominada binomial?

Fazendo: Temos:

q)n

(p+

4 0 3 1 2 2 1 3 0 4

4 1p q 4p q 6p q 4pq 1p q

q)

(p+ = + + + +

5 0 4 1 3 2 2

3 1

4 0 5

5 1p q p q 1 p q 1 p q p q 1p q

q)

(p+ = +5 + 0 + 0 +5 +

←Binômio de Newton 1

q p 1 q)

(p+ ⁰= ⁰ ⁰ =

q p q 1p q 1p q)

(p+ ¹ = ¹ ⁰ + ⁰ ¹ = +

2 2

2 0 1 1 0 2

q)

(p+ = + + = + +

3 2 2

3 3 0 2 1 1 2 0 3

3 1p q 3p q 3p q 1p q p 3p q 3pq q

q)

(p+ = + + + = + + +

Coeficientes

↓

Número binomial

x)!

n x!

n!

x n

= −



 





(

(14)

q)n

(p+

4 0 3 1 2 2 1 3 0 4

4 1p q 4p q 6p q 4pq 1p q

q)

(p+ = + + + +

Triângulo de Pascal

5 0 4 1 3 2 2

3 1

4 0 5

5 1p q p q 1 p q 1 p q p q 1p q

q)

(p+ = +5 + 0 + 0 +5 +

←Binômio de Newton 1

q p 1 q)

(p+ ⁰= ⁰ ⁰ =

q p q 1p q 1p q)

(p+ ¹ = ¹ ⁰ + ⁰ ¹ = +

2 2

2 0 1 1 0 2

q)

(p+ = + + = + +

3 2 2

3 3 0 2 1 1 2 0 3

3 1p q 3p q 3p q 1p q p 3p q 3pq q

q)

(p+ = + + + = + + +

Outro método para obter os coeficientes:

Triângulo de Pascal

(15)

x 3 x

x 3 x,

3

0,6 (1 0,6)

P x)

P(X = =

⁻

−

⁻

X = x

⁰ ¹ ² ³

Σ

P(X = x)

0,064 0,288 0,432 0,216 1 Representação tabular

, para S_X= {0, 1, 2, 3}

De modo geral, se X é uma variável que tem distribuição binomial, sua função de probabilidade será:

− −

= = _n^{x,n x}

π

^x −

π

^{n x}

P(X x) P (1 ) ^{, para S}X= {0, 1, ..., n}

Parâmetros

A distribuição binomial tem dois parâmetros:

n = número de repetições do experimento de Bernoulli ππππ = probabilidade de sucesso

X~ Bin (n,π)

X tem distribuição binomial com parâmetros n e ππππ parâmetros

− −

= = _n^{x,n x}

π

^x −

π

^{n x}

P(X x) P (1 )

(16)

E(X) =µ=

∑

∈S_X x

p(x) x

n 2

1

Y Y

Y

X = + + ... +

) E(Y )

E(Y )

E(Y

E(X) =

₁

+

₂

+ ... +

_n

) Y Y

E(Y

E(X) =

₁

+

₂

+ ... +

_n

=n

π

= + + +

π π

...

π

E(X)

Média ou valor esperado

Teorema: E(X)=µµµµ=nππππ

Bernoulli E(Y) =π

n 2

1 Y Y

Y

X= + +...+ V(X) =

σ

² =E(X²)−µ²

) Y Y

V(Y

V(X)= ₁+ ₂+...+ _n

) V(Y )

V(Y ) V(Y

V(X)= ₁ + ₂ +...+ _n

= π − π + π − π + + π − π...

V(X) (1 ) (1 ) (1 ) = π − πn (1 )

Variância

Teorema: V(X) =

σ σ σ σ

²= nππππ(1-ππππ)

Bernoulli E(Y) =π V(Y) = π(1-π)

(17)

Teorema:

desvio padrão

Se π<(1-π), a distribuição binomial é assimétrica positiva Se π=(1-π)=0,5, a distribuição binomial é simétrica

Se π>(1-π), a distribuição binomial é assimétrica negativa Interpretação:

2 2

3

a

3

µ µ

= µ

− −

= −

π π π π

3

(1 ) a n (1 )

− −

= −

π π π π

3

(1 )

a (1 )

Bernoulli

Teorema:

Coeficiente de curtose

( )

π π

′ = π π

4

1 - 6 1- a n 1 -

= µ µ

4

4 2

2

a

Se <3, a distribuição é platicúrtica Se =3, a distribuição é mesocúrtica Se >3, a distribuição é leptocúrtica

a4

′ = −

4 4

a a 3

Interpretação:

Se <0, a distribuição binomial é platicúrtica Se =0, a distribuição binomial é mesocúrtica Se >0, a distribuição binomial é leptocúrtica

4′ a

(18)

X = x

⁰ ¹ ² ³

Σ P(X = x)

0,064 0,288 0,432 0,216 1

V(X) =

σ

² =E(X )² − µ² E(X) =µ=

∑

∈S_X x

p(x) x

E(X) =µ= 0×0,064+1×0,288+2×0,432+3×0,216=1,8

3,24 0,216

3 0,432 2

0,288 1

0,064 0

)

E(X² = ²× + ²× + ²× + ²× = 0,72

1,8 3,24− ²=

=

0,8485 0,72

V(X) = =

= σ

Significado: Se o experimento for repetido um grande número de vezes, a variação média do número de sucessos em torno do valor esperado será de 0,85.

V(X) = nπ(1-π)

Significado: Se o experimento (escolher três bovinos) for repetido um grande número de vezes, o número médio de sucessos (bovinos vacinados) obtidos nesses experimentos será 1,8.

=3×0,6=1,8

= 3×0,6×0,4 = 0,72

bovinos vacinados

bovinos vacinados² bovinos vacinados E(X)=nπ

Utilizando os teoremas: X ~ Bin (n=3,π=0,6)

(19)

1 2 0,1

0,3 0,4 p(x)

3 x 0,2

0 0,5

( ) ( )

π π

′ = π π

− × ×

= × ×

= −

4

1 - 6 1 - a n 1 -

1 6 0,6 0, 4 3 0,6 0, 4 0,61

Significado:As chances para os valores maiores que a média (1,8) são maiores que para os menores.

A distribuição é platicúrtica.

A distribuição é assimétrica negativa.

− = −

× ×

− −

= =

− π π

π π

3

0, 4 0,6 3 0,6 0, 4 0,24 (1 )

a n (1 )

3. Distribuição hipergeométrica

A distribuição hipergeométrica não configura um processo de Bernoulli porque a probabilidade de sucesso muda de um experimento para o outro

Essa distribuição é extremamente importante no contexto de amostragem sem reposição

Definição: Modelo que descreve probabilisticamente os resultados de uma seqüência de experimentos de

Bernoulli dependentes. Refere-se a experimentos que se caracterizam por retiradas sem reposição, onde a

probabilidade de sucesso se alteraa cada retirada.

(20)

Exemplo: Uma bandeja contém 10 xícaras de cafezinho, sete com açúcar e três com adoçante. Três pessoas se aproximam da bandeja e se servem. Se a variável aleatória X é definida como o número de xícaras de café com açúcar, construa a distribuição de probabilidade de X.

7 Açúcar

3 xícaras 3 Adoçante

X = número de xícaras de café com açúcar 10 Xícaras

(n=3)

S = {A₁A₂A₃, A₁A₂A₄,…, A₁A₂a₁, ..., a₁a₂a₃}

#S = C₁₀³ ^{= 120}

A= açúcar a= adoçante

# S =

X = número de xícaras de café com açúcar S_X= {0, 1, 2, 3}

0,008333 120

1 120

1 1 C

C C

3 10

3 3 0

7 × = =

=

0,175 120

21 120

3 7 C

C C

3 10 2 3 1

7 × = =

=

0,525 120

63 120

3 21 C

C C

3 10

1 3 2

7 × = =

=

0,2917 35

1 C 35

C₇³ ₃⁰

=

× =

= P(X =0) =

P(X =1) =

P(X =2) = P(X =3) =

3

C10^{= 120}

S = {A₁A₂A₃, A₁A₂A₄,…, A₁A₂a₁, ..., a₁a₂a₃} A= açúcar a= adoçante

(21)

X = x 0 1 2 3 Σ P(X = x) 0,00833 0,175 0,525 0,2917 1

3 10

x - 3 3 x 7

C C x) C

P(X = =

Representação tabular

, para S_X= {0, 1, 2, 3}

Como generalizar esta função para qualquer variável X que tenha distribuição hipergeométrica?

(sucesso)

n elementos (sem reposição)

(fracasso) X= número de sucessos em n retiradas N

N₁ N₂

=N₁+N₂

sub-populações

população

Do ponto de vista probabilístico não faz diferença considerar retiradas individuais sem reposição ou retirada conjunta de grupos

Cada grupo de tamanho n formado é denominado amostra.

Todas as amostras têm a mesma chance de ocorrência.

Convencionamos usar a seguinte notação:

(22)

X = x 0 1 2 3 Σ P(X = x) 0,00833 0,175 0,525 0,2917 1

3 10

x - 3 3 x 7

C C x) C

P(X = =

Representação tabular

, para S_X= {0, 1, 2, 3}

De modo geral, se X é uma variável que tem distribuição hipergeométrica, sua função de probabilidade será:

n N

x - n N x N

C C x) C

P(X = =

¹ ² ^{, para S}X={max(0, n-N₂), ..., min(n,N₁}

Parâmetros

A distribuição hipergeométrica tem três parâmetros:

n = número de repetições do experimento de Bernoulli N = tamanho da população

N₁ = tamanho da sub-população de interesse

X~ Hip (n, N, N₁)

X tem distribuição hipergeométrica com parâmetros n, N e N₁

n N

x - n N x N

C C x) C

P(X = =

¹ ² _parâmetros

(23)

E(X) =µ=

∑

∈S_X x

p(x) x

Teorema:

V(X) =

σ

² =E(X )² − µ²

Teorema:

Variância

probabilidade de fracasso

Binomial E(X) = nπ V(X) = nπ(1-π)

 

= σ =  

2 N N 1 2 N -n

V(X) n

N N N -1

= µ = N¹ E(X) n

N

probabilidade de sucesso

Fator de correção para

populações finitas

População finitaé aquela que pode ser esgotada por processo de amostragem.

Uma população será considerada finita quando tiver um número finito de elementos ea amostragem for efetuada sem reposição.

População infinitaé aquela que não se esgota por processo de amostragem.

Uma população será considerada infinita quando tiver um número infinito de elementos ou quando amostragem for efetuada com reposição.

(24)

Teorema: = N¹ E(X) n

N

 

=  

1 2

N N N -n V(X) n

N N N -1 Teorema:

Variância

A dependência não altera a média, mas

altera a variância

Fator de correção é irrelevante para N grande

V(X) =

σ

² =E(X )² − µ² E(X) =µ=

∑

∈S_X x

p(x) x

E(X) =µ=0×0,00833+1×0,175+2×0,525+3×0,2917 =2,1

4,9 0,525 3

0,525 2

0,175 1

0,00833 0

)

E(X² = ²× + ²× + ²× + ²× =

0,49 2,1

4,9− ²=

=

X = x 0 1 2 3 Σ

P(X = x) 0,00833 0,175 0,525 0,2917 1 No exemplo:

(25)

Utilizando os teoremas: X ~ Hip (n=3, N=10, N₁=7)

0,7 0,49

V(X)= =

= σ

Significado: Se o experimento for repetido um grande número de vezes, a variação média do número de sucessos em relação ao valor esperado será 0,7.

Significado: Se o experimento (escolher três xícaras) for repetido um grande número de vezes, o número médio de sucessos (xícaras de café com açúcar) obtidos será 2,1.

N nN

E(X)= ¹ 2,1

10 3 7 =

=



 



= 

1 - N

n - N N N N n N

V(X) ¹ ² 0,49

1 - 10

3 - 10 10

3 10

3 7 =



 



= 

xícaras com açúcar

xícaras com açúcar²

4. Distribuição de Poisson

A distribuição de Poisson foi assim designada em homenagem ao matemático e físico francês Siméon Denis Poisson.

Siméon D. Poisson

(1781 – 1840) Exemplo clássico da distribuição de Poisson:

número de soldados do exército da Prússia mortos anualmente por coice de cavalo, entre 1875 e 1894.

Modelo de descrição de acontecimentos de ocorrência rara

(26)

Matemático e físico francês, nascido em Pithiviers, considerado o sucessor deLaplaceno estudo da mecânica celeste e da atração de esferóides. Filho de um administrador público, entrou para a École Polytechnique (1798), em Palaiseau, onde se formou, estudando com professores comoJoseph Louis Lagrange,Pierre Simon

LaplaceeJean Baptiste Fourier, dos quais se tornou amigo pessoal.

Ocupou cargos acadêmicos na Ecole Polytechnique e na Sorbonne e contribuiu para as teorias da eletricidade e do magnetismo e estudou também o movimento da lua. Desenvolveu pesquisas sobre mecânica, eletricidade (a constante de Poisson), elasticidade (razão de Poisson), calor, som e estudos matemáticos (integral de Poisson na teoria do potencial e ocolchete de Poisson nas equações diferenciais), com aplicação na medicina e na astronomia.

Siméon Denis Poisson (1781 – 1840)

Produziu escritos sobre movimentos de ondas em geral e coeficientes de contração e a relação entre estes e a extensão. Publicou trabalhos (1812) que ajudaram a eletricidade e o magnetismo tornarem-se um ramo da física matemática. Ganhou o título de barão (1825). Na hidrodinâmica seu mais notável trabalho foiMémoire sur les équations générales de l'équilibre et du

mouvement des corps solides élastiques et des fluides (1829), relacionando equilíbrio de sólidos elásticos e correntes de fluidos compressíveis. Publicou o importante tratadoTraité de mécanique (1833), em dois volumes, na termodinâmica a Teoria matemática do calor (1835) e emRecherches sur la probabilité des jugements (1837) apareceu a famosa distribuição de Poisson, de intensa aplicação em estatística. Na teoria de probabilidades descobriu a forma limitada da distribuição binomial que posteriormente recebeu o seu nome e hoje considerada uma das mais importantes distribuições na probabilidade, sendo ométodo de Poisson é um processo randômico de importância fundamental. Publicou cerca de quatrocentos trabalhos e morreu em Sceaux, próximo a Paris, França.

(Só Biografias. Disponível em http://www.dec.ufcg.edu.br/biografias/SimeonDe.html)

4. Distribuição de Poisson

Definição: descreve probabilisticamente a seqüência de um grande númerode fenômenos independentesentre si, cada um com probabilidade de sucesso muito pequena.

Ocorre naturalmente quando se deseja contar o número de um tipo particular de eventos que ocorrem por unidade de tempo, de superfícieou de volume.

Distribuição de Poisson processo infinito de Bernoulli

Pode ser considerada como uma binomial onde o número de experimentos (n) é grande, ππππé pequeno (sucesso raro) e nπ(média de sucessos) é constante.

(27)

número de peças defeituosas observadas em uma linha de produção num determinado período de tempo;

número de acidentes de trabalho ocorridos numa grande empresa num determinado período de tempo;

número de ciclones ocorridos em certa região num determinado período de tempo;

número de formigueiros por unidade de área em uma região;

número de bactérias por unidade de área em uma lâmina com extratos de uma planta;

número de espermatozóides inviáveis de um touro por unidade de volume de sêmen.

Exemplos:

A distribuição de Poisson tem inúmeras aplicações na simulação de sistemasmodelando o número de eventos ocorridos num intervalo de tempo, quando os eventos ocorrem a uma taxa constante.

De modo geral, se X é uma variável que tem distribuição de Poisson, sua função de probabilidade será:

, para S_X= {0, 1, 2, ...}

e x!

x) P(X

λ

x

=

⁻^λ

onde:

X: número de sucessos

e = 2,718 (base dos logaritmos neperianos)

λλλλ

: número médio de sucessos(sempre maior que zero) espaço amostral

infinito

(28)

∑

^∞

=

∞ −

=

0 x

x λ 0

x x!

e λ p(x)

3! ...

λ 2!

λ λ 1 e

3 2

λ = + + + +



 



 + + + +

=



 



 + + + +

=

−

3! ...

λ 2!

λ λ 1 e

3! ...

λ 2!

λ 1!

λ 0!

e λ

3 2 λ

3 2 1 0 λ

1 e e

e e

0 λ λ

λ λ

=

+

−

Demonstra-se que é uma função de probabilidade, provando que

Série de Taylor . Como S_X= {0, 1, 2, ...}, temos:

3! ...

x 2!

x x 1 e

3 2

x = + + + +

x λ λ p(x) e

x!

= −

1 p(x)

0 x

∑

^∞

=

∑

^∞

=

= − 0 x

x λ

x!

e λ

e x!

x) P(X

λ

x

−λ

=

Parâmetros

A distribuição de Poisson tem apenas um parâmetro:

λλλλ

= número médio de sucessos

X~ Poi (

λ

)

X tem distribuição de Poisson com parâmetro

λλλλ

parâmetro

(29)

Medidas descritivas

E(X) =µ=

∑

∈S_X x

p(x) x

Média ou valor esperado:

Teorema: E(X) =

µµ µ µ

=

λλλλ

2 2) µ E(X −

=

Variância:

Teorema: V(X) =

σ σ σ σ

²=

λλλλ

Na Poisson média e variância são iguais!!

V(X) =

σ

²

, fazendo , temos Demonstração

E(X) =µ=

∑

∈S_X x

p(x) x

∑

^∞

=

−

∈

=

0 x

x λ S

x x!

e λ x p(x)

x E(X)

X

1)!

(x λ x x λ x! e

xλ e

1 x

1 x λ 0

x x λ

= −

= ^∞ ⁻

=

∞ −

=

−

∑ ∑

λ λ 0

y y

λ e λ e

! y λ λ

e ⁻

∞

=

− =

=

∑

⁼^e⁻^λ⁺^λ^λ⁼^e⁰^λ⁼^λ

λ 0

y y

! e y λ =

∑

^∞

=

1 x y= −

∑

^∞

=

− −

∞ −

=

−

= −

1 x

1 x λ

1 x

1 x λ

1)!

(x λ λ 1)! e (x λ λ e

Teorema: E(X) =

µ µµ µ

=

λλλλ

(30)







 +

=



 



 +

= +

=

∑ ∑ ∑ ∑

^∞

=

∞

=

∞ −

=

∞ −

=

−

0 y

y

0 y

y λ

0 y

y y λ

0 y

y λ

! y λ

! y yλ λ

! e y λ

! y yλ λ

! e y )λ 1 y ( λ e

, fazendo , temos

λ λ λ e λ e λ e e λ e λe ) e λe ( λ

e ^λ ^λ+ ^λ = ^λ ^λ + ^λ ^λ = ⁰ ² + ⁰ = ² +

= ⁻ ⁻ ⁻

∞ λ

=

∑

^x^λ_x_! =^λe

0 x

x

1 x y= −

∑

^∞

=

−

∈

=

0 x

x λ 2 S

x 2 2

x!

e λ x p(x) x )

E(X

X

1)!

(x λ x x λ x! e

x λ e

1 x

2 λ 0

x

x 2 λ

= −

= ^∞ ⁻

=

∞ −

=

−

∑ ∑

∑

^∞

=

− −

= −

1 x

1 x λ

1)!

(x x λ λ e

V(X) =

σ

² =E(X )² − µ²

λ 0

y y

! e y λ =

∑

^∞

=

λ λ λ λ µ ) E(X

V(X)= ² − ² = ²+ − ² =

Variância:

Teorema: V(X) =

σ σ σ σ

² =

λλλλ

Demonstração

= 1λ a₃ Teorema:

λ

4

= a

Teorema:

Coeficiente de curtose

A Poisson é assimétrica positiva, tendendo para a simetria quando µµµµ cresce.

A Poisson é platicúrtica, tendendo

(31)

X~ Poi (

λ

=1)

X~ Poi (

λ

=2,5)

1 2

0,1 0,3 0,4 p(x)

3 x 0,2

0 4

x

1 2

p(x)

3 0

0,1 0,3

0,2

4 5 6 7

A Poisson tende para a simetria quando µµµµ=λ λ λ cresce.λ

(32)

Exercício proposto:

A taxa média de chegada de clientes em um posto de serviços é de 0,5 por minuto. Calcular a probabilidade de, em um dado minuto, chegarem dois clientes.

Resumo das distribuições discretas

(33)

Descreve probabilisticamente resultados de experimentos quepossuem apenas dois resultados possíveis.

Distribuição de Bernoulli

Função de probabilidade

= =

π

^x −

π

^{1 x}−

P(X x) (1 ) , para S_X= {0, 1}

π= probabilidade de sucesso Parâmetro:

V(X) = σ² = π(1-π) E(X) =µ= π

Medidas descritivas

− −

= −

π π π π

3

(1 )

a (1 )

Descrição probabilística de uma seqüência de experimentos de Bernoulli independentes. Importante no contexto de amostragemcom reposição.

Distribuição binomial

− −

= = _n^{x,n x}

π

^x −

π

^{n x}

P(X x) P (1 ) , para S_X= {0, 1, ..., n}

n = número de repetições no experimento Parâmetros:

V(X) =

σ

²= nπ(1-π) E(X) =µ= nπ

π= probabilidade de sucesso

( ) ( )

π π

′ = π π

4

1 -6 1- a n 1 -

− −

= −

π π π π

3

(1 )

a n (1 )

(34)

Descrição probabilística de uma seqüência de experimentos de Bernoulli dependentes. Importante no contexto de amostragem sem reposição.

Distribuição hipergeométrica

, para S_X= {0, 1, ..., n}

n = número de repetições do experimento N = tamanho da população

N₁ = tamanho da sub-população de interesse Parâmetros:

Medidas descritivas

n N

x - n N x N

C C x) C

P(X = =

¹ ²

= µ = N¹ E(X) n

N

 

= σ =  

 

2 N N 1 2 N -n

V(X) n

N N N -1

Descrição probabilística da seqüência de um grande número de fenômenos independentes, todos com probabilidade de sucessomuito pequena, e média de sucessos constante.

Distribuição de Poisson

, para S_X= {0, 1, 2, ...}

Parâmetro:

Medidas descritivas

V(X) =

σ

² =

λ

E(X) =

µ

=

λ

= número médio de sucessos

e x!

x) P(X

λ

x

=

⁻^λ

λ

4

= a

= 1 λ

a

₃

(35)

Formas limites da distribuição binomial

1. Hipergeométrica →→→→ Binomial

Em determinadas circunstâncias, uma distribuição de probabilidade pode tender para outra.

Os casos mais importantes de aproximações entre distribuições são:

2. Binomial →→→→ Poisson 3. Binomial →→→→ Normal

(36)

Quando N (tamanho da população) é muito grande (ou tende para +∞∞∞∞), a distribuição hipergeométrica se aproxima da distribuiçãobinomial.

tende a +∞ tende a zero

− −

≅ = − = − ≅

−

N n N n N n n

1 1

N 1 N N N N

= π π V(X) n (1 - )

Binomial

 

=  

 

1 2

N N N -n V(X) n

N N N -1 Hipergeométrica 1. Hipergeométrica →→→→ Binomial

Quando N tende para infinito, o fator de correção se aproxima de 1.

fator de correção

População

Amostra

N

n

Quando o tamanho da amostra representa menos de 5% do tamanho da população, a população é tão grande em relação

n ≤≤≤≤0,05N

Esta aproximação é considerada satisfatória quando o número de elementos retirados (n) não excede 5% da população (N), isto é, n ≤≤≤≤0,05N.

(37)

Quando n (número de repetições do experimento) é muito grande (ou tende para +∞) e π(probabilidade de sucesso) é muito pequena (ou tende para 0) a distribuição binomial se aproxima da distribuição de Poisson.

nπ< 10 e n ≥100 E(X)

2. Binomial →→→→ Poisson

Quando n (número de repetições do experimento) é grande (ou tende para +∞) e π(probabilidade de sucesso) se aproxima de 0,5, a distribuição binomial se aproxima da distribuição normal.

Seπ=(1-π)=0,5, a distribuição binomial será simétrica.

3. Binomial →→→→ Normal

(38)

X ~ Bin (n=15,π=0,5)

2 x p(x)

6 0,02

8 10 12 13

0,06 0,1 0,14 0,18

4

X ~ Nor (µ=7,5,σ²=3,75)

3 5 7 9 11

Um auditor foi contratado para examinar uma coleção de 6.000 faturas, das quais 128 contêm erros. Se foi selecionada uma amostra de 120 faturas, qual é a probabilidade de esta amostra conter exatamente duas faturas com erros?

Sendo de 1% o percentual de canhotos numa população, qual é a probabilidade de haver apenas um canhoto numa classe de 30 alunos?

Exercícios propostos:

(39)

Distribuições de probabilidade de variáveis contínuas

Em geral é difícil identificar o tipo de distribuição de probabilidade de uma variável contínua. Inicialmente, uma revisão bibliográfica pode útil para verificar se a variável de interesse já foi estudada e seu modelo de descrição probabilística já é conhecido.

A observação do campo de variação (espaço amostrar) da variável também pode ajudar nesta identificação.

Existem vários tipos de distribuições contínuas. Por exemplo:

Distribuição gama:descreve variáveis que só assumem valores positivos.

Distribuição beta:descreve variáveis que assumem valores no intervalo [0, 1].

Distribuição normal →→→→mais importante

(40)

1. Distribuição Exponencial 2. Distribuição Normal

* Distribuição Normal Padrão 3. Distribuição Uniforme

4. Distribuição Gama 5. Distribuição Beta 6. Distribuição Lognormal 7. Distribuição Seminormal 8. Distribuição Weibull 9. Distribuição Gumbel

Distribuições contínuas

→

→→

→ eventos climáticos extremos

y y

t t

y

t

A distribuição exponencial está relacionada com a distribuição de Poisson.

Na distribuição de Poisson, a variável aleatória é definida como o número de sucessos em determinado período de tempo t, sendo a média de sucessos no período definida como λ.

Na distribuição exponencial, a variável aleatória é definida como o tempo entre dois sucessos.

Processo de Poisson

Y = número de sucessos → variável discreta

X = tempo decorrido entre sucessos sucessivos → variável contínua E(Y) = λ

1. Distribuição exponencial

(41)

X = tempo entre atendimentos (em segundos)→→→→ distribuição exponencial 20 s

Exemplo:Se a média de atendimentos no caixa de uma loja é de 3 clientes por minuto, então, o tempo decorrido entre atendimentos é uma variável com distribuição exponencial.

45 s 18 s 15 s 20 s 55 s

A distribuição exponencial é extensivamente utilizada para modelar o tempo entre ocorrências de eventos num sistema, onde os eventos ocorrem a uma taxa constante. Desse modo, tem grande aplicabilidade em estudos de sobrevivência, confiabilidade, teoria das filas e simulação.

S_X= (0, ∞)

Y=2 Y=4 Y=1

t = 1 min t = 1 min t = 1 min

Y = número de atendimentos → distribuição de Poisson E(Y) = λ= 3

S_Y= {0, 1, 2, ...}

De modo geral, se X é uma variável aleatória contínua que tem distribuição exponencial, então, sua função densidade de probabilidade será:

onde:

X: tempo decorrido entre dois sucessos e = 2,718 (base dos logaritmos neperianos)

λ: número médio de sucessos (sempre maior que zero)

x

e-

f(x) = λ ^λ

.

Função densidade de probabilidade

x

x x

S 0 0

f(x) dx e dx e e e ⁰ 0 ( 1) 1

∞ −λ  −λ ∞ − ∞λ −λ

= λ =  = − = − − =

∫ ∫

1 dx f(x)

Sx

∫

=

Podemos demonstrar que f(x) é uma função densidade de probabilidade provando que

, para S_X=[0, ∞) X só assume valores reais não negativos

(42)

Representação gráfica:

Função densidade de probabilidade

λ

= λ

= e ^λ e⁰ f(0) ^- ⁰

x

e-

f(x) = λ ^λ

Exemplos:

Função de distribuição ou de probabilidade acumulada

.

x x

−λ −λ

> = − = − − =

x x -

0 t

- dt 1 e

e )

x X ( P ) x (

F = ≤ =

∫

λ ^λ = − ^λ

Representação gráfica:

(43)

Parâmetros

A distribuição exponencial tem apenas um parâmetro:

λλλλ

= número médio de sucessos X~ Exp (

λ

)

X tem distribuição exponencial com parâmetro

λλλλ

parâmetro

λ

^{- x}λ

f(x) = e

Medidas descritivas

E(X) =µ=

∫

SX

f(x)dx x

Teorema: E(X) =

µ µµ µ

=

∞ −λ

= =

µ

λ λ

∫

Sx

x 0

E(X) x f(x) dx x e dx 1

λ

1

(44)

Medidas descritivas

2 2) µ E(X −

=

Variância: V(X) =

σ

²

( )

Sx

x 0

V(X) x f(x)dx

1 1

x e dx

2 2 2

2

2 2

∞ −λ

 

= =   −

 

 

 

= − =

 

σ µ

λ λ λ

∫

Teorema:

1 V(X) = σ

²

=

₂

λ

Exercícios propostos:

1. Os tempos até a falha de um dispositivo eletrônico seguem o modelo exponencial, com uma taxa de falha λ = 0,012 falhas/hora. Indique qual a probabilidade de um dispositivo escolhido ao acaso sobreviver a 50 horas? E a 100 horas? Qual o tempo esperado até que ocorra falha?

2. Suponha que um componente eletrônico tenha um tempo de vida X (em unidades de 1000 horas) que segue uma distribuição exponencial de parâmetro λ = 1.

Suponha que o custo de fabricação do item seja 2 reais e que o preço de venda seja 5 reais. O fabricante garante devolução total se X < 0,9. Qual o lucro esperado por item?