• Nenhum resultado encontrado

Distribuições Contínuas de Probabilidade

N/A
N/A
Protected

Academic year: 2021

Share "Distribuições Contínuas de Probabilidade"

Copied!
42
0
0

Texto

(1)

Distribuições Contínuas

de Probabilidade

Pedro Paulo Balestrassi

pedro.unifei.edu.br

ppbalestrassi@gmail.com

35-36291161 / 999012304 (cel)

Pratique:

(2)

( )

x

0

f

( )

=

1

f

x

(

)

=

b

>

a

f

x

dx

b

a

b

X

a

P

(

)

(

)

Algumas Distribuições Contínuas:

Normal Uniforme Chi-square Fisher(F) Student(t)

Beta Cauchy Exponential Gamma Laplace Logistic Lognormal Weibull

f(x) => fdp

Função densidade

de probabilidade

Área da curva é unitária

Probabilidade está

associada a área

Distribuições contínuas de probabilidade

descrevem variáveis aleatórias contínuas

(3)

Histogramas e Boxplots revelam o formato

de uma distribuição de probabilidade

(4)
(5)

Distribuição Normal (ou Gaussiana): A

distribuição Benchmark

Observe no programa

Quality

Gamebox o Processo de Construção de

uma Distribuição Normal.

A distribuição mais importante em Estatística (“The Bell Curve”)

Aplicações: Pesos, alturas, índices de saúde,

(6)

Erro padrão da média: uma forma popular

de associar variabilidade à média

⎯NHES:National Health Examination Survey (USA)

UOL.com.br

𝑠𝑠𝑠𝑠 ̅𝑥𝑥 =

𝑠𝑠

𝑛𝑛

(7)

e) Máx f(x) ocorre em x = µ

f) Os pontos de inflexão são x = µ ± σ

g) E(X) = µ

h) Var(X) = σ

2

f ( x )

µ

µ

+

σ

a)

−∞

f x dx

( )

=

1

b) f(x) ≥ 0

c) lim ( )

lim ( )

x→∞

f x

=

0

e

x→−∞

f x

=

0

d) f(µ + x) = f(µ - x)

( )

+∞

<

<

=

    − −

x

e

x

f

x

,

2

1

)

(

2 2 1

σ

µ

π

σ

A distribuição normal pode ser sempre transformada na

normal padronizada

( )

<

<

+∞

=

e

z

z

f

z

,

2

1

)

(

1 2 2

π

σ

σ

µ

= x

z

X:N(μ;σ)

Z:N(0;1)

(8)
(9)

Pouca Utilidade

Prática

Retorna a probabilidade

Acumulada

Retorna a Variável quando

é dada a probabilidade

acumulada

Exemplo

X:N(100,5)

P(X<=95)=F(95)=0,1587

Pratique: cálculos da distribuição

normal com o Minitab

F(X)

(10)

A) Cumulative Probability

Em uma população onde as medidas tem

Média

100 e Desvio Padrão 5

, determine a

probabilidade de se ter uma medida:

a) Entre 100 e 115

b) Entre 100 e 90

c) Superior a 110

d) Inferior a 95

e) Inferior a 105

f) Superior a 97

g) Entre 105 e 112

h) Entre 89 e 93

i) 98

B) Inverse Cumulative Probability

Em uma população onde as medidas tem

Média

100 e Desvio Padrão 5

, determine os valores k

tais que se tenha a probabilidade:

a) P(X<k)=0,32

b) P(X>k)=0,26

c) P(100-k<100<100+k)=0,47

d) P(x<100-k)+P(x>100+k)=5%

Pratique <Calc><Probability Distribution>

F(115)-F(100)

F(100)-F(90)

1-F(110)

F(95)

F(105)

1-F(97)

F(112)-F(105)

F(93)-F(89)

0

InvCum(0,32)=97,66

InvCum(0,74)=103,21

InvCum(0,265)=96,86  k=3,14

InvCum(0,025)~90,20  k~9,8

(11)

µ

T

LSE

p(d)

)

;

(

:

N

µ

σ

X

Se a dimensão de uma peça

segue uma distribuição Normal

X: N(80,3) qual a Probabilidade

de ter uma peça defeituosa de

acordo com a figura?

Target e p(d): um conceito de

(12)

Pratique: distribuição normal

Exemplo

Uma companhia produz lâmpadas cuja vida segue uma

distribuição normal com média 1.200 horas e desvio

padrão de 250 horas. Escolhendo-se aleatoriamente uma

lâmpada, qual é a probabilidade de sua durabilidade estar

entre 900 e 1.300 horas?

(13)

Observe:

Dados no eixo X e

Espaços diferentes no eixo Y

… são propositais devido aos percentis da curva Normal!

Normal Probability Plot: outra forma

de observar a normalidade

25 35 45 55 1 5 10 20 30 40 50 60 70 80 90 95 99

Data

Per

cent

20 30 10 70 80 90 50 10% 10% 10% 10% 10% 10%

Gere uma sequência de dados qualquer. Ex.: 100 valores

Weibull (5,8) e faça o gráfico Probability Plot

(14)

3 Maneiras de ver se os dados estão

distribuídos normalmente

80 70 60 50 40 30 20 10 0 300 200 100 0 C3 Fr eq ue nc y

Normal Probability Plots

130 120 110 100 90 80 70 60 300 200 100 0 C2 Fr eq ue nc y

Normal Probability Plots

110 100 90 80 70 60 50 40 30 20 100 50 0 C1 Fr eq ue nc y

Normal Probability Plots

106 96 86 76 66 56 46 36 26 .999 .99 .95 .80 .50 .20 .05 .01 .001 Pr ob ab ility Normal p-value: 0.328 A-Squared: 0.418 Anderson-Darling Normality Test N of data: 500 Std Dev: 10 Average: 70 Normal Distribution 130 120 110 100 90 80 70 60 .999 .99 .95 .80 .50 .20 .05 .01 .001 Pr ob ab ility Pos Skew p-value: 0.000 A-Squared: 46.447 Anderson-Darling Normality Test N of data: 500

Std Dev: 10 Average: 70

Positive Skewed Distribution

80 70 60 50 40 30 20 10 0 .999 .99 .95 .80 .50 .20 .05 .01 .001 Pr ob ab ility Neg Skew p-value: 0.000 A-Squared: 43.953 Anderson-Darling Normality Test N of data: 500

Std Dev: 10 Average: 70

Negative Skewed Distribution

Se o Teste de

Normalidade

mostrar um

"valor-P"

Menor que

0,05, então os

dados

NÃO

ESTÃO bem

representados

por uma

distribuição

normal

(15)

A distribuição pode ser

considerada Normal

Exercício:

Gere diferentes sequências de dados de uma forma aleatória e

teste a normalidade usando o Minitab

(16)

Simulação de Monte Carlo: um exemplo trivial 1/3

Processo I

T

1

=40s

Processo II

T

2

=30s

T=T

1

+T

2

=70s

A)

Processo I

T

1

:N(40s;4s)

Processo II

T

2

:N(30s;3s)

B)

Considere o seguinte cenário:

T=T

1

+T

2

=?

T=T

1

-T

2

=?

(17)

3

7

Processo A

Processo B

Tempo Total (A+B) ? = 3 s = 1 X = 7 s = 2 X

3

2

1

2.23

5

(2)

(1)

S

S

S

A B 2A 2B 2 2

=

+

=

=

+

=

+

=

+

Correto;

Some as

variâncias e

depois

obtenha o

Desvio

Padrão

Incorreto;

Soma de Normais

(18)

-10

-5

0

5

10

15

Linha A

Linha B

Diferença:

Linha A – Linha B

?

= 3 s = 1 X = 7 s = 2X

4

-7

-3

X

-X

X

A

B

=

A

B

=

=

1

2

1

2.23

5

(2)

(1)

S

S

S

A

B

2

A

B

2

2

2

= −

=

=

+

=

+

=

Correto

Incorreto

Diferença de Normais

(19)

Uma variável aleatória contínua X tem distribuição uniforme com

parâmetros α e β se sua função de densidade de probabilidade é dada

por:



=

c

c

x

x

f

.

,

0

,

1

)

(

β

α

α

β

(

)

12

)

(

,

2

)

(

X

=

α

+

β

Var

X

=

α

β

2

E



<

=

β

β

α

α

β

α

x

x

x

x

x

F

1

0

0

)

(

A função de distribuição acumulada é dado por:

Notação: X~U(α , β)

)

Distribuição Uniforme: a distribuição de máxima

ignorância

(20)

Pratique: Distribuição Uniforme

Exemplo:

A dureza X de uma peça de aço pode ser pensada como

uma variável aleatória uniforme no intervalo (50,70) da escala

Rockwel. Qual é a probabilidade de que uma peça tenha dureza

entre 55 e 60?



=

c

c

x

x

f

.

,

0

70

50

,

20

1

)

(

Solução: Seja X: dureza de uma peça de aço, X~U(50,70)

20

5

20

1

)

60

55

(

60

55

=

=

<

<

X

dx

P

Portanto,

60

2

50

70

)

(

X

=

µ

=

+

=

E

Também,

3

,

33

12

)

50

70

(

2

2

=

=

σ

Minitab

F(60)-F(55)

(21)

A assimetria da distribuição exponencial

t 96h 1.744h 1.051h 763h 498h 257h 3500 3000 2500 2000 1500 1000 500 0 100 80 60 40 20 0 t Pe rc en t Mean 734 N 6 Empirical CDF of t Exponential

Exemplo:

Tempo de vida de seis

equipamentos iguais.

(22)

x F( x) 140 120 100 80 60 40 20 0 0,06 0,05 0,04 0,03 0,02 0,01 0,00 0 0 Função Exponencial

Na distribuição exponencial, E(X)=DP(X)

( )

(

)

2 0 2 2 2

(

)

1

1

λ

λ

λ

µ

σ

λ

=

=

=

=

+∞

+∞

− ∞ −

dx

e

x

dx

x

f

x

X

Var

x

( )

λ

λ

µ

λ

1

0

=

=

=

E

X

x

e

x

dx

( )

x

e

x

i

f

=

λ

.

λ

Minitab: E(X)=Scale

(23)

Exemplo

O tempo entre chegadas de um cliente a um banco em determinado

horário é distribuído exponencialmente com um tempo médio de 2

minutos entre as chegadas.

Determine:

a) A probabilidade de que se tenha um cliente chegando após o outro

em exatos 2 minutos.

Resp: 0

b) A probabilidade de que se tenha um cliente chegando após o outro

em menos de 2 minutos.

Resp: F(2)

c) A probabilidade de que se tenha um cliente chegando após o outro

em mais de 4 minutos.

Resp: 1-F(4)

d) 90% dos clientes chegarão em um tempo entre eles em menos de

quantos minutos?

Resp: InvCum(0.9)

(24)

X-Data

Y-Da

ta

10

8

6

4

2

0

1,0

0,8

0,6

0,4

0,2

0,0

0

0

Variable C7 * Weibull 1 1 C8 * Weibull 3,4 2 C9 * Weibull 4,5 6.2

Weibull

( )

β

δ

β

δ

δ

β

=

x

e

x

x

f

1

Distribuição Weibull: a preferida em estudos

de confiabilidade

Minitab:

Shape: Forma (~ Desvio Padrão)

Scale : Escala (~Média)

(25)

Use Best Fitting para escolher a melhor distribuição dos dados

X

536,1954

370,5728

539,4727

436,7933

797,3647

640,6208

290,2329

484,8414

342,0040

504,2830

.

.

.

Fitting.mtw

1000 100 10 99,99 95 80 50 20 5 2 1 X Pe rc en t Goodness of F it Test Weibull A D = 0,184 P-V alue > 0,250 Weibull - 95% CI

Goodness of Fit Test

Distribution AD P

Weibull

0,184 >0,250

ML Estimates of Distribution Parameters

Distribution Location Shape Scale Threshold

Weibull

2,01362 408,13153

(26)

Pratique Best Fitting no Minitab

2/3

Fitting.mtw

Teste de Anderson-Darling:

H0: Os dados seguem a

distribuição

H1: Os dados

Não seguem a

distribuição

Likelihood Ratio Test

LRT P <0.05: O incremento

de parâmetros

melhora

o

ajuste.

LRT P >0.05: O incremento

de parâmetros

Não melhora

o ajuste.

Ex.: 3 Paramenter Weibull

não melhora Weibull

Goodness of Fit Test

Distribution AD P LRT P

Normal 2,886 <0,005

Box-Cox Transformation 0,377 0,409

Lognormal 5,921 <0,005

3-Parameter Lognormal 0,651 * 0,000

Exponential 49,414 <0,003

2-Parameter Exponential 39,585 <0,010 0,000

Weibull

0,184 >0,250

3-Parameter Weibull 0,230 >0,500 0,198

Smallest Extreme Value 16,113 <0,010

Largest Extreme Value 0,995 0,013

Gamma 1,380 <0,005

3-Parameter Gamma 0,618 * 0,031

Logistic 2,340 <0,005

Loglogistic

3,925 <0,005

3-Parameter Loglogistic

1,306 * 0,000

Johnson Transformation 0,272 0,669

(27)

Fitting.mtw

ML (Maximum Likelihood)Estimates of Distribution Parameters

Distribution Location Shape Scale Threshold

Normal* 361,39206 188,57349

Box-Cox Transformation* 18,31572 5,09689

Lognormal* 5,72721 0,62234

3-Parameter Lognormal 6,41874 0,29341 -278,59139

Exponential 361,39206

2-Parameter Exponential 336,42293 24,96913

Weibull

2,01362 408,13153

3-Parameter Weibull 1,91320 391,28792 14,04125

Smallest Extreme Value 460,59571 216,91010

Largest Extreme Value 272,98187 155,80312

Gamma 3,22925 111,91203

3-Parameter Gamma 4,77417 88,20447 -59,71086

Logistic 349,94251 106,97856

Loglogistic

5,78130 0,34363

3-Parameter Loglogistic

6,35544 0,18288 -239,77999

Johnson Transformation* 0,01291 0,99414

(28)

Best Fitting também pode ser feito no Crystal Ball

Fitting.mtw

X

536,1954

370,5728

539,4727

436,7933

797,3647

640,6208

290,2329

484,8414

342,0040

504,2830

.

.

.

Exemplo de parametrização de uma distribuição de

Weibull pelo Crystal Ball – Use

Tools (Ajuste)

Observe que a melhor

distribuição no Ranking

do Crystal Ball é similar

à escolhida pelo

Minitab. Mas não é a

mesma!

(29)

A planilha

Tfalha.mtw representa os tempos de

falha(em milhares de horas) de um determinado

mecanismo.

a) Quais as distribuições de Probabilidade

factíveis para o Tempo de Falha?

b) Qual o tempo de vida a ser definido, de tal

forma que apenas 50% dos mecanismos

falhem antes de tal tempo? (nesse caso 50%

dos compradores dos mecanismos estarão

propensos a comprar uma extensão de

garantia)

(30)

Box-Cox transformation: Lambda = 0,272814

Johnson transformation function:

2,32858 + 1,04650 * Ln( ( X + 0,573926 ) / ( 44,5110 - X ) )

Goodness of Fit Test

Distribution AD P LRT P

Normal 4,291 <0,005

Box-Cox Transformation 0,177 0,919

Lognormal 1,862 <0,005

3-Parameter Lognormal 0,361 * 0,000

Exponential 0,414 0,614

2-Parameter Exponential 0,478 >0,250 1,000

Weibull

0,184 >0,250

3-Parameter Weibull 0,236 >0,500 0,662

Smallest Extreme Value 10,840 <0,010

Largest Extreme Value 1,165 <0,010

Gamma 0,197 >0,250

3-Parameter Gamma 0,139 * 1,000

Logistic 2,351 <0,005

Loglogistic

0,930 0,009

3-Parameter Loglogistic

0,558 * 0,051

Johnson Transformation 0,191 0,896

Várias

distribuições

poderiam ser

utilizadas.

Um estudo de confiabilidade 2/6

(31)

ML Estimates of

Distribution Parameters

Distribution Location Shape Scale Threshold

Normal* 5,25518 5,04776

Box-Cox Transformation* 1,43473 0,41127

Lognormal* 1,14178 1,24371

3-Parameter Lognormal 1,44925 0,83097 -0,62980

Exponential 5,25518

2-Parameter Exponential 5,29151 -0,03633

Weibull

1,06601 5,38729

3-Parameter Weibull 1,04728 5,33683 0,01331

Smallest Extreme Value 8,17880 7,62049

Largest Extreme Value 3,24281 3,11166

Gamma 1,10312 4,76392

3-Parameter Gamma 1,24112 4,31492 -0,10015

Logistic 4,53039 2,45997

Loglogistic

1,26545 0,64739

3-Parameter Loglogistic

1,38330 0,53713 -0,32774

Johnson Transformation* -0,00400 1,02901

Um estudo de confiabilidade 3/6

(32)

Para

F(X)=50%

Inverse Cumulative Distribution Function

Exponential

with mean = 5,25518

P( X <= x ) x

0,5

3,64261

Weibull

with shape = 1,06601 and scale = 5,38729

P( X <= x ) x

0,5

3,81990

Gamma

with shape = 1,1 and scale = 4,76

P( X <= x ) x

0,5

3,76171

(33)

BOX COX Transformation

Y´=Y

λ

λ=0,27

Normal with mean = 1,435 and

standard deviation = 0,4113

P( X <= x ) x

0,5

1,435

LOG(Y´)= λLOG(Y)

Y=ANTILOG(

LOG(1,435)

/

0,27

)=

3,81

Um estudo de confiabilidade 5/6

(34)

JOHNSON Transformation

35 20 5 -10 99,9 99 90 50 10 1 0,1 Pe rc en t N 100 AD 4,291 P-Value <0,005 4 0 -4 99,9 99 90 50 10 1 0,1 Pe rc en t N 100 AD 0,191 P-Value 0,896 1,2 1,0 0,8 0,6 0,4 0,2 0,8 0,6 0,4 0,2 0,0 Z Value P-Va lu e fo r A D te st 0,51 Ref P

P-V alue for Best F it: 0,895527 Z for Best F it: 0,51

Best Transformation Ty pe: SB Transformation function equals

2,32858 + 1,04650 * Ln( ( X + 0,573926 ) / ( 44,5110 - X ) )

Probability Plot for Original Data

Probability Plot for T ransformed Data

Select a T ransformation

(P-Value = 0.005 means <= 0.005)

N(-0,004; 1,029)

Y´=-0,004  X~3,9

Um estudo de confiabilidade 6/6

(35)

A empresa Vision Research completou o

desenvolvimento

preliminar

de uma nova droga,

codificada como ClearView, que corrige miopia.

Este novo produto revolucionário poderá ser

completamente desenvolvido e testado a tempo

de ser liberado no próximo ano se o FDA

aprovar o produto.

Embora a droga funcione bem para alguns

pacientes, a taxa de sucesso completo é marginal, e

a Vision Research está incerta se o FDA aprovará o

produto.

Um estudo no Crystal Ball 1/7

(36)

Até agora, a Vision Research gastou $10.000.000 desenvolvendo

a ClearView e espera gastar um adicional de $3.000.000 a

$5.000.000 para testá-lo baseado nos custos dos testes anteriores. Para

esta variável, “custos de testes”, a Vision Research pensa que qualquer

valor entre $3.000.000 e $5.000.000 tenha uma chance igual de ser o

custo real do teste.

A Vision Research planeja gastar uma quantia considerável em

marketing da ClearView se o FDA aprová-lo. Eles esperam requerer

os serviços de uma grande força de venda e promover uma extensiva

campanha de propaganda para educar o público sobre este novo e

excitante produto. Incluindo comissões de vendas e custos de

propaganda, a Vision Research espera gastar entre $12.000.000 e

$18.000.000, com uma quantia mais provável de $16.000.000.

(37)

Antes do FDA aprovar a ClearView, a Vision Research deve

conduzir um teste controlado em uma amostra de 100

pacientes por um ano. A Vision Research espera que o FDA

concorde com a aprovação se a ClearView corrigir completamente

a miopia de 20 ou mais destes pacientes sem quaisquer

efeitos colaterais significativos. Em outras palavras, 20% ou

mais dos pacientes testados devem mostrar a visão corrigida

depois de usar a ClearView por um ano.

A Vision Research está muito encorajada pelos seus testes

preliminares, os quais mostram uma taxa de sucesso de cerca

25%. A ClearView se adequará aos padrões da FDA?

(38)

A Vision Research determinou que a miopia atinge

aproximadamente 40.000.000 pessoas nos Estados Unidos, e

um adicional de 0% a 5% de pessoas desenvolverão esta

condição de miopia durante o ano em que a ClearView é testada.

Entretanto, o departamento de marketing descobriu que há uma

chance de 25% de que um produto concorrente seja lançado

no mercado em breve. Se isso ocorrer haverá - ao invés de um

adicional - uma diminuição do mercado potencial da ClearView de

5% a 15%.

Custom [25%Uniform(-15%;-5%), 75%Uniform(0;5%)]

(39)

O departamento de marketing estima que a eventual fatia

do mercado total da Vision Research para o produto está

distribuída normalmente ao redor do valor médio de 8% com um

desvio padrão de 2%.

O baixo valor da média de 8% é uma estimativa conservadora que

leva em conta os efeitos colaterais da droga que não foram

notados durante os testes preliminares. Ainda mais, o

departamento de marketing estima um mercado mínimo de

5%, dado o interesse mostrado no produto durante os testes

preliminares.

O valor de venda do produto no mercado deverá ser de 12 dólares.

(40)

O presidente da Vision Research deparou-se com uma decisão difícil:

a companhia deverá abandonar o projeto ClearView ou prosseguir no

desenvolvimento e lançar no mercado a nova droga revolucionária?

(41)

O projeto Clearview tem cerca de 78% de ser lucrativo!

(42)

• Livro Texto: Montgomery/Runger 5e

Chapter 4 (Resolver todos os exercícios

relacionados às distribuições existentes no Minitab).

Referências

Documentos relacionados

5 “A Teoria Pura do Direito é uma teoria do Direito positivo – do Direito positivo em geral, não de uma ordem jurídica especial” (KELSEN, Teoria pura do direito, p..

We propose a conformance testing theory to deal with this model and describe a test case generation process based on a combination of symbolic execution and constraint solving for

The lagrangian particle tracking model was used to stu- dy the dispersion of particles released in different lagoon channels, the advection of particles released

As inscrições serão feitas na Comissão Permanente de Vestibular da UFMG (COPEVE), situada no Prédio da Reitoria da UFMG, à Av. Presidente Antônio Carlos, 6627 – Campus da

EXPERIMENTANDO E DESCOBRINDO: A CONTRIBUIÇÃO DE UMA OFICINA PARA DESPERTAR ALUNOS DE NÍVEL MÉDIO PARA AS DIMENSÕES DA ÓPTICA COMO DISCIPLINA E CAMPO DE PESQUISA..

A iniciativa parti- cular veiu em auxílio do govêrno e surgiram, no Estado, vá- rios estabelecimentos, alguns por ventura falseados em seus fins pelos defeitos de organização,

Observa-se que as ações para possibilitar o acesso das mulheres à APS, à realização do exame citopatológico e a promoção da saúde se dá por meio de campanhas do outubro rosa,

caracterização, paciente com 37 anos, casada, vendedora, com queixa principal de perda de urina durante atividade física. Incontinência por esforço. Perda em gotas. Uso de