• Nenhum resultado encontrado

NotasdeAula2016Vers˜aoParcial RonaldTarginoNojosa Estat´ısticaComputacional

N/A
N/A
Protected

Academic year: 2022

Share "NotasdeAula2016Vers˜aoParcial RonaldTarginoNojosa Estat´ısticaComputacional"

Copied!
22
0
0

Texto

(1)

Estat´ıstica Computacional

Ronald Targino Nojosa

DEMA-UFC

Notas de Aula 2016

Vers˜ ao Parcial

(2)

Na Estat´ıstica Computacional abordaremos:

programa computacional R

gera¸c˜ ao de n´ umeros pseudo-aleat´ orios m´ etodos para gera¸ c˜ ao de vari´ aveis aleat´ orias

◦ invers˜ ao, rejei¸c˜ ao e composi¸ c˜ ao m´ etodos num´ ericos

◦ Monte Carlo, Newton-Raphson, escore de Fisher t´ ecnicas de reamostragem

◦ bootstrap, jackknife

(3)

M´etodos de Monte Carlo

(4)

M´ etodos de Monte Carlo: classe de algoritmos de simula¸ c˜ ao Duas principais classes de problemas num´ ericos em inferˆ encia estat´ıstica

Classes de problemas

Otimiza¸ c˜ ao: associado ` a abordagem por M´ ax. Verossimilhan¸ ca

Integra¸ c˜ ao: associado geralmente ` a abordagem bayesiana

(5)

Problema geral: calcular a integral Z

χ

h(x)f (x)dx = E f [h(X)]

Princ´ıpio de MC: aproximar integrais da forma acima por

¯ h n = 1 n

n

X

j=1

h(x j )

Para isso geramos uma amostra (X 1 , X 2 , . . . , X n ) de f .

¯ h n converge quase certamente para E f [h(X)] (LGN)

Regras de Simpson e do Trap´ ezio s˜ ao alternativas ao uso de

m´ etodos de simula¸ c˜ ao para aproximar integrais.

(6)

Nota:

h 2 n (X) tendo esperan¸ ca finita sob f , a variˆ ancia assint´ otica da aproxima¸c˜ ao ´ e

var(¯ h n ) = 1 n

Z

χ

(h(x) − E f [h(X)]) 2 f (x)dx

e pode ser estimada a partir da amostra (X 1 , X 2 , . . . , X n ) por v n = 1

n 2

n

X

j=1

[h(x j ) − ¯ h n ] 2

(7)

Nota:

Devido ao TCL, para n grande, (¯ h n − E f [h(X)])

√ v n

∼ N (0, 1)

Fun¸c˜ oes no R para aproximar integrais unidimensionais (n˜ ao usam o princ´ıpio de Monte Carlo)

area (biblioteca MASS): n˜ ao trata com limites infinitos

integrate (biblioteca stats): aceita limites infinitos, mas ´ e

fr´ agil e pode produzir resultados n˜ ao confi´ aveis

(8)

C´ alculo de probabilidades

Seja X uma vari´ avel aleat´ oria.

P(X ∈ A) = E[I A (X)] ≈ 1 n

n

X

i=1

I A (X i ),

X i vari´ aveis aleat´ orias i.i.d., i = 1, 2, . . . , n, n grande.

(9)

C´ alculo de integrais definidas do tipo I = R b

a h(x)dx (M´ etodo de Monte Carlo Simples)

I = Z b

a

h(x)dx = Z b

a

(b − a)h(x) 1

(b − a) dx = (b − a)E U [h(X)],

em que E U [h(X)] ´ e a esperan¸ ca calculada considerando uma

distribui¸ c˜ ao U (a, b).

(10)

C´ alculo de integrais definidas do tipo I = R b

a h(x)dx (M´ etodo de Monte Carlo Simples)

Note que o c´ alculo da integral se resume ao c´ alculo de uma esperan¸ ca que pode ser “estimada”a partir de uma amostra simulada de uma U (a, b). Portanto,

I ˆ = (b − a) P n

i=1 h(u i )

n ,

com u i , i = 1, 2, . . . , n, de U ∼ U (a, b).

(11)

C´ alculo de integrais impr´ oprias da forma I = Z ∞

0

h(x)dx

Transforma¸ c˜ ao: y = 1 x + 1 Assim, dy = − 1

(x + 1) 2 dx ⇒ dx = − dy y 2

e y = 1

x + 1 ⇒ x = 1 − y

y .

(12)

Exemplo 1 Para obter a estimativa de MC para a Z 1

0

[cos(50x) + sin(20x)] 2 d(x),

podemos considerar h(x) = [cos(50x) + sin(20x)] 2 e f (x) = 1.

Como 0 < x < 1, Z 1

0

h(x)f (x)d(x) = E f [h(X)], com X ∼ U (0, 1).

Assim, podemos gerar x 1 , x 2 , . . . , x n de X ∼ U (0, 1) e aproximar a integral por

¯ h n = P n

i=1 h(x i )

n .

(13)

Exemplo 2 Para obter a estimativa de MC para a P (X > 4,5), com X ∼ N (0, 1), note que

P(X > 4,5) = Z ∞

4,5

f (x)d(x) = Z ∞

−∞

I (x)

{x>4,5}

f(x)d(x) = E[ I(X)

{x>4,5}

].

Portanto, ¯ h n = 1 n

n

X

j=1

I(x i )

{x

i

>4,5} .

(14)

Problema geral da integra¸ c˜ ao de MC: calcular E f [h(X)]

E f [h(X)] = Z

χ

h(x)f (x)dx

Solu¸c˜ ao: aproximar por ¯ h n

¯ h n = 1 n

n

X

j=1

h(x j )

(15)

Geramos uma a.a. de f : x 1 , x 2 , . . . , x n

Calculamos h(x j ), j = 1, 2, . . . , n, e ¯ h n = 1 n

P n

j=1 h(x j ) V ar(¯ h n ) = V ar( 1

n

n

X

j=1

h(X j )) = V ar(h(X j ))

n = V ar(h(X)) n V ar(h(X)) ´ e estimada por 1

n P n

j=1 [h(x j ) − h ¯ n ] 2

Portanto, a variˆ ancia do estimador ¯ h n de MC ´ e estimada por v n = V ar(¯ d h n ) = 1

n 2

n

X

j=1

[h(x j ) − ¯ h n ] 2

O erro de MC(erro padr˜ ao do estimador de MC) ´ e √

v n .

(16)

Erro de Monte Carlo

O erro de Monte Carlo ´ e “confi´ avel”se v n ´ e um estimador

adequado para a variˆ ancia de ¯ h n . Se v n n˜ ao converge ou n˜ ao

converge r´ apido o bastante para a aplica¸ c˜ ao do TCL, a estimativa

e a regi˜ ao de confian¸ ca associada a ele n˜ ao pode ser “confi´ avel”.

(17)

Motiva¸c˜ ao: “Dif´ıcil”simular a partir de f , visando estimar E f [h(X)] =

Z

χ

h(x)f (x)dx

Proposta: Amostragem por Importˆ ancia ou Monte Carlo via Fun¸c˜ ao de Importˆ ancia

O m´ etodo de amostragem por importˆ ancia ´ e baseado em uma

representa¸ c˜ ao alternativa de E f [h(X)].

(18)

Dado uma densidade g que ´ e estritamente positiva quando h × f ´ e diferente de zero, podemos reescrever E f [h(X)] como

E f [h(X)] = Z

χ

h(x) f (x)

g(x) g(x)dx = E g [ h(X)f (X)

g(X) ] = E g [w(X)]

(19)

Assim, definimos o estimador 1 n

n

X

j=1

h(X j )f (X j ) g(X j ) ,

baseado em uma a.a. X 1 , X 2 , . . . , X n gerada a partir de g.

(20)

Segue:

1 n

n

X

j=1

h(X j )f (X j )

g(X j ) −→ E f [h(X)]

Como E f [h(X)] pode ser escrita como uma esperan¸ ca sob g, a convergˆ encia acima se verifica pela mesma raz˜ ao que o estimador

¯ h n converge, qualquer que seja a escolha de g.

(21)

Nota:

g ´ e chamada de fun¸ c˜ ao de importˆ ancia O suporte de g deve incluir o suporte de f

As caudas de g devem ser mais pesadas do que as caudas de f

Resultados melhores s˜ ao obtidos quando g for uma boa

aproxima¸ c˜ ao de f

(22)

Exemplo 3 Para obter a estimativa de MC para a P(0,3 < X < 0,7), com X ∼ Beta(2, 3), note que

P(0,3 < X < 0,7) = Z 0,7

0,3

f (x)d(x) = Z 0,7

0,3

12x(1− x) 2 d(x) =

= Z 1

0

I(x)

(0,3;0,7)

12x(1 − x) 2

g(x) g(x)d(x) = Z 1

0

w(x)g(x) = E g [w(X)],

com g(x) = 1 I (x)

(0,1)

e X ∼ U (0, 1).

Referências

Documentos relacionados

(b) Vocˆ e diria que os usu´ arios de telefone celular parecem ter uma taxa de incidˆ encia de cˆ ancer no c´ erebro diferente da taxa de incidˆ encia deste tipo de cˆ ancer em

(b) Para melhorar o processo, o Controle de Qualidade da empresa decidiu que apenas as pe¸cas com pesos maiores do que 1,68 kg e menores do que 2,32 kg ser˜ ao comercializadas..

Aten¸ c˜ ao: N˜ ao ser˜ ao aceitas respostas sem justificativa: as express˜ oes que levaram a alguma resposta num´ erica devem ser indicadas nos espa¸cos apropriados.. Duas

Em um grande torneio internacional, em que estas mesmas condi¸c˜ oes acontencem, o atleta precisa acertar pelo menos duas vezes na mosca, em trˆ es tentativas, para ir ` as finais..

(a) Como temos reposi¸c˜ ao, segue que X pode ser visto como o n´ umero de sucessos (sortear um rei num baralho de 52 cartas) em 4 ensaios independentes e com mesma probabilidade

Para quanto deveria aumentar a m´ edia da receita di´ aria para que nesse mˆ es, uma vez mantido o desvio padr˜ ao da receita di´ aria em 300 reais, essa meta fosse atingida

(c) Encarando agora esse boxplot como se ele fosse uma distribui¸ c˜ ao de probabilidade, ou seja, encarando os quartis amostrais como se fossem quartis populacionais, suponha que

(a) Seja X uma vari´ avel aleat´ oria que representa o n´ umero di´ ario de clientes de um posto