• Nenhum resultado encontrado

Simulação Monte Carlo

N/A
N/A
Protected

Academic year: 2022

Share "Simulação Monte Carlo"

Copied!
12
0
0

Texto

(1)

Simulação Monte Carlo

Tópicos de Inferência Estatística

José Passos

ISEG-ULisboa

10 de Outubro de 2019

(2)

A simulação Monte Carlo remonta aos anos 40 do século XX, associada aos trabalhos de pesquisa em torno do

desenvolvimento da primeira bomba atómica.

O objectivo é resolver problemas complexos utilizando a força bruta computacional.

O método de Monte Carlo assenta em técnicas de amostragem e probabilisticas.

Tem a virtude de poder simular um fluxo "infindável"de variáveis aleatórias, para uma distribuição conhecida, possibilitando-nos de uma forma simples, a utilização dos resultados frequencistas e assintóticos (Lei dos grandes números e TLC).

Esta simulação baseia-se na distribuição U(0,1), que

constitui a representação probabilística básica de aleatoriedade num computador.

(3)

No R os valores U(0,1)são gerados a partir da instrução runif().

Em rigor, os valores supostamente aleatórios, gerados num computador, são efectivamente pseudo aleatórios pois são gerados com recurso a um algoritmo, de forma deterministica.

De modo simplificado fala-se simplesmente em números aleatórios ou gerador de aleatórios.

Uma sequência de números pseudo aleatórios deverá ter as mesmas propriedades estatísticas de uma sequência i.i.d.. Este é o critério que se utiliza para avaliar a qualidade de um gerador de (pseudo) aleatórios.

(4)

Em geral pretendem-se valores aleatórios provenientes de outras distribuições, para além da uniforme, U(0,1).

Existe uma técnica (transformação inversa) que nos permite transformar qualquer v.a. numa uniforme e vice versa.

Definição

SejaX uma v.a. contínua com f.d.p. f e f.d. F. A v.a.

U =F(X) tem distribuiçãoU(0,1)

Exemplo: seXE(1)entãoF(x) = 1−e−x. Resolvendo u= 1−e−x em ordem a x obtém-sex=−log(1−u).

Portanto, se UU(0,1)entãoX =−log(U)∼E(1). Na prática gera-se computacionalmente ue resolve-se a equação anterior em ordem a xpara obter valores com a distribuição desejada.

(5)

Para gerar v.a.s discretas usa-se também a técnica de transformação inversa.

Para gerar XPθ, onde Pθ tem suporte inteiro, calculam-se as probabilidades,

p0=Pθ(X ≤0) p1=Pθ(X ≤1) p2=Pθ(X ≤2) ...

De seguida gera-se UU(0,1)e faz-se X =k se pk−1 < U < pk

(6)

Existem distribuições onde a técnica da transformação inversa não funciona. Neste caso existem métodos alternativos designados métodos indirectos (método de aceitação-rejeição).

O R tem a vantagem de gerar directamente a generalidade das distribuições com que trabalhamos, não sendo necessário a aplicação dos métodos referidos.

(7)

Tabela:Geradores de aleatórios no R Distribuição Comando R

N(µ, σ2) rnorm(n,mu,sigma) B(α, β) rbeta(n,alpha,beta) Bi(N, p) rbinom(n,N,p)

P o(θ) rpoi(n,theta) χ2(ν) rchisq(n,nu)

t2(ν) rt(n,nu)

... ...

(8)

Teorema: Lei Forte dos Grandes Números

SejaX1, X2, . . . , Xn uma amostra casual proveniente de uma populaçãoX com média µ finita. Então quandon→ ∞,

X= 1 n

n

X

i=1

Xiq.c.µ

Aplicação frequente:

aproximarE(X)a partir de x, para uma amostra observada.¯

(9)

Integração de Monte Carlo:

pretende-se calcular o integral:

E[h(X)] = Z

χ

h(x)f(x)dx

a utilização do método de Monte Carlo para calcular E[h(X)]

consiste em gerar uma amostra de dimensãon (comn grande) a partir de f, propondo como aproximação,

¯hn= 1 n

n

X

i=1

h(xi)

pela lei forte dos grandes números ¯hn converge quase certamente paraE[h(X)]

(10)

adicionalmente, se E[h2(X)] existe finito tem-se pelo TLC,

¯hnE[h(X)]

vndN(0,1)

onde vn é uma estimativa devar(¯hn),

vn= 1 n

n

X

i=1

hh(xi)−¯hn

i2

(11)

Outras utilizações: o método de Monte Carlo pode ser utilizado para aproximar a distribuição por amostragem de uma estatística T(X):

vamos supor a população XFθ, com Fθ conhecida;

vamos fixar a dimensão da amostra em n;

vamos gerar g= 1,2, . . . , G amostras da populaçãoFθ cada uma com dimensão n:

amostra 1: x11, x12, . . . , x1n amostra 2: x21, x22, . . . , x2n

...

amostra G: xG1, xG2, . . . , xGn

(12)

para cada amostra g, calcula-se o valor da estatística, tg: t1=T(x11, x12, . . . , x1n)

t2=T(x21, x22, . . . , x2n) ...

tG=T(xG1, xG2, . . . , xGn)

no final tem-se uma amostra de dimensãoG, proveniente da distribuição por amostragem da estatística T(X1, . . . , Xn), que pode ser utilizada para estudar as suas propriedades, calcular o histograma, probabilidades, momentos, etc.

Referências

Documentos relacionados

As cultivares mais tolerante a requeima foram „Clara‟, „Eliza‟ e „Itararé‟, e as cultivares com menor número de orifícios e danos causados pela larva alfinete

A retrospective descriptive study based on analysis of data from medical records of patients with syndactyly treated by Discipline of Hand and Microsurgery, Hospital das Clínicas

Maringá (Unicesumar) onde serão feitos os ensaios de massa específica dos agregados, rompimentos de corpos de prova para análise de resistência (conforme a idade do molde e

A pesquisa visa ainda estudar os seguintes objetivos específicos: i compreender a relação entre geografia e turismo através do debate das categorias da ciência geográfica:

Resumo da análise de variância da produção de MS t/ha do capim-braquiária na capineira nova, do primeiro e do segundo períodos de avaliação...... Resumo da análise de variância

Staphylinidae is one of the largest families in Coleoptera, comprising about 62.820 species (Newton, 2017), and the viviparous condition in the group is rare, recorded only

O Brasil tem destaque mundial na produção de alimentos. A produção anual de leite em 2016 foi estimada pela Companhia Nacional de Abastecimento - CONAB em 35 bilhões

A elaboração do cenário de investimento necessário para melhorar o desempenho das cidades catarinenses em relação à sustentabilidade hídrica considerou três fases distintas