• Nenhum resultado encontrado

MAE0524: An´alise Bayesiana de Dados

N/A
N/A
Protected

Academic year: 2022

Share "MAE0524: An´alise Bayesiana de Dados"

Copied!
27
0
0

Texto

(1)

MAE0524: An´ alise Bayesiana de Dados

Aula 3: Uma introdu¸c˜ao ao R Gualberto Segundo Agamez Montalvo Instituto de Matem´atica e Estat´ıstica - USP

23 de fevereiro de 2016

(2)

Sum´ ario

1 Explorando a robustez da estat´ısticat.

Introdu¸c˜ao.

Programa¸c˜ao de uma simula¸c˜ao de Monte Carlo.

Aplica¸c˜ao.

2 Desempenho do intervalo de confian¸ca tradicional para uma propor¸c˜ao.

3 Referˆencias.

(3)

Explorando a robustez da estat´ısticat.

Sum´ ario

1 Explorando a robustez da estat´ısticat.

Introdu¸c˜ao.

Programa¸c˜ao de uma simula¸c˜ao de Monte Carlo.

Aplica¸c˜ao.

2 Desempenho do intervalo de confian¸ca tradicional para uma propor¸c˜ao.

3 Referˆencias.

(4)

Explorando a robustez da estat´ısticat. Introdu¸ao.

Sum´ ario

1 Explorando a robustez da estat´ısticat.

Introdu¸c˜ao.

Programa¸c˜ao de uma simula¸c˜ao de Monte Carlo.

Aplica¸c˜ao.

2 Desempenho do intervalo de confian¸ca tradicional para uma propor¸c˜ao.

3 Referˆencias.

(5)

Explorando a robustez da estat´ısticat. Introdu¸ao.

Introdu¸c˜ ao

Sejamx= (x1,· · · , xm)tey= (y1,· · · , yn)tduas amostras independentes. Que- remos testar a hip´otese de que a m´edia da popula¸c˜aox´e igual `a m´edia da popula¸c˜ao y, isto ´e,

H0xy.

O teste padr˜ao desta hip´otese ´e baseiado na estat´ısticat dada por T =

X¯−Y¯ spp

1/m+ 1/n,

(6)

Explorando a robustez da estat´ısticat. Introdu¸ao.

Introdu¸c˜ ao

sendo:

X¯ eY¯ as m´edias amostrais dexey, respectivamente;

sp o desvio padr˜ao combinado dado por

sp= s

(m−1)s2x+ (n−1)s2y m+n−2 .

(7)

Explorando a robustez da estat´ısticat. Introdu¸ao.

Introdu¸c˜ ao

Sob a hip´oteseH0, a estat´ısticaT tem uma distribui¸c˜aot−student comm+n−2 graus de liberdade quando

xey s˜ao amostras aleat´orias independentes com distribui¸c˜ao normal;

os desvios padr˜ao das popula¸c˜oesxey s˜ao iguais, isto ´e,σxy.

Portanto, para um n´ıvel de significˆanciaα,H0 ´e rejeitado quando

|T| ≥tm+n−2,α/2,

sendo,tdf,αo quantil de uma vari´avel aleat´oriat−student comdfgraus de liberdade.

(8)

Explorando a robustez da estat´ısticat. Introdu¸ao.

Exemplo

> t.teste <- function(x,y){

+ m <- length(x) + n <- length(y)

+ sp <- sqrt(((m-1)*sd(x)^2+(n-1)*sd(y)^2)/(m+n-2)) + t.estat <- (mean(x)-mean(y))/(sp*sqrt(1/m+1/n)) + return(t.estat)

+ }

> x <- c(1,4,3,6,5)

> y <- c(5,4,7,6,10)

> t.teste(x,y) [1] -1.937926

(9)

Explorando a robustez da estat´ısticat. Programa¸ao de uma simula¸ao de Monte Carlo.

Sum´ ario

1 Explorando a robustez da estat´ısticat.

Introdu¸c˜ao.

Programa¸c˜ao de uma simula¸c˜ao de Monte Carlo.

Aplica¸c˜ao.

2 Desempenho do intervalo de confian¸ca tradicional para uma propor¸c˜ao.

3 Referˆencias.

(10)

Explorando a robustez da estat´ısticat. Programa¸ao de uma simula¸ao de Monte Carlo.

Programa¸c˜ ao de uma simula¸c˜ ao de M.C.

Suponha que temos interesse no n´ıvel de significˆancia verdadeiro para a estat´ısticat quando as popula¸c˜oes n˜ao seguem as hip´oteses de normalidade e variˆancias iguais.

De forma geral, o n´ıvel de significˆancia verdadeiro depender´a de:

o n´ıvel de significˆanciaαestabelecido;

a forma e a dispers˜ao das popula¸c˜oes;

os tamanhos de amostraismen.

O verdadeiro n´ıvel de significˆancia ´e determinado por αT =P |T| ≥tm+n−2,α/2

.

(11)

Explorando a robustez da estat´ısticat. Programa¸ao de uma simula¸ao de Monte Carlo.

Programa¸c˜ ao de uma simula¸c˜ ao de M.C.

Um algoritmo de simula¸c˜ao para calcular αT:

Simular uma amostra aleat´oria xm de uma primeira popula¸c˜ao e yn de uma segunda popula¸c˜ao.

Calcular a estat´ısticaT.

Decida se|T|excede o ponto cr´ıtico eH0´e rejeitado.

Repetir os passos 1-3 do algoritmo N vezes. Uma estimativa do verdadeiro n´ıvel de significˆancia ´e dada por

ˆ

αT =n´umero de rejei¸c˜oes deH0

N .

(12)

Explorando a robustez da estat´ısticat. Programa¸ao de uma simula¸ao de Monte Carlo.

Exemplo

> Nivel.verd <- function(alpha,m,n,N){

+ n.reject <- 0 + for (i in 1:N) + {

+ x <- rnorm(m, 0, 1) # simular da popula¸c~ao 1 + y <- rnorm(n, 0, 1) # simular da popula¸c~ao 2 + t.estat <- t.teste(x,y)

+ if (abs(t.estat) > qt(1-alpha/2,n+m-2)) + n.reject <- n.reject + 1

+ }

+ Niver.sig.verd <- n.reject/N + print(Niver.sig.verd)

+ }

(13)

Explorando a robustez da estat´ısticat. Programa¸ao de uma simula¸ao de Monte Carlo.

Exemplo

Os resultados obtidos s˜ao:

> alpha <- 0.1; m <- 10; n <- 10; N <- 10000

> Nivel.verd(alpha,m,n,N) [1] 0.097

(14)

Explorando a robustez da estat´ısticat. Aplica¸ao.

Sum´ ario

1 Explorando a robustez da estat´ısticat.

Introdu¸c˜ao.

Programa¸c˜ao de uma simula¸c˜ao de Monte Carlo.

Aplica¸c˜ao.

2 Desempenho do intervalo de confian¸ca tradicional para uma propor¸c˜ao.

3 Referˆencias.

(15)

Explorando a robustez da estat´ısticat. Aplica¸ao.

Aplica¸c˜ ao.

Nesta aplica¸c˜ao vamos obter o valor do verdadeiro n´ıvel de significˆancia do teste para os casos:

Popula¸c˜oes normais com dispers˜ao diferente.

Popula¸c˜oest−students com graus de liberdade iguais.

Popula¸c˜oest−students com graus de liberdade diferentes.

Popula¸c˜oes exponenciais com taxas iguais.

Popula¸c˜oes exponenciais com taxas diferentes.

(16)

Explorando a robustez da estat´ısticat. Aplica¸ao.

Aplica¸c˜ ao.

Nivel.apli <- function(alpha,m,n,N,Metodo,Par){

n.reject <- 0 if(Metodo=="norm"){

for (i in 1:N) {

x <- rnorm(m, mean = 0, sd=Par[1]) # simular da popula¸c~ao 1 y <- rnorm(n, mean = 0, sd=Par[2]) # simular da popula¸c~ao 2 t.estat <- t.teste(x,y)

if (abs(t.estat) > qt(1-alpha/2,n+m-2)) n.reject <- n.reject + 1

}

Niver.sig.verd <- n.reject/N print(Niver.sig.verd)

}else if(Metodo=="exp"){

(17)

Explorando a robustez da estat´ısticat. Aplica¸ao.

Aplica¸c˜ ao.

for (i in 1:N) {

x <- rexp(m,rate=Par[1]) # simular da popula¸c~ao 1 y <- rexp(n,rate=Par[2]) # simular da popula¸c~ao 2 t.estat <- t.teste(x,y)

if (abs(t.estat) > qt(1-alpha/2,n+m-2)) n.reject <- n.reject + 1

}

Niver.sig.verd <- n.reject/N print(Niver.sig.verd)

}else if(Metodo=="t"){

(18)

Explorando a robustez da estat´ısticat. Aplica¸ao.

Aplica¸c˜ ao.

for (i in 1:N) {

x <- rt(m,df=Par[1]) # simular da popula¸c~ao 1 y <- rt(n,df=Par[2]) # simular da popula¸c~ao 2 t.estat <- t.teste(x,y)

if (abs(t.estat) > qt(1-alpha/2,n+m-2)) n.reject <- n.reject + 1

}

Niver.sig.verd <- n.reject/N print(Niver.sig.verd)

}}

(19)

Explorando a robustez da estat´ısticat. Aplica¸ao.

Aplica¸c˜ ao.

Os resultados obtidos com nossa fun¸c˜ao s˜ao:

> alpha <- 0.1; m <- 10; n <- 10; N <- 100000

>

> Par <-c(1,10)

> Nivel.apli(alpha,m,n,N,"norm",Par) [1] 0.11736

>

> Par <-c(4,4)

> Nivel.apli(alpha,m,n,N,"t",Par) [1] 0.09792

>

> Par <-c(2,7)

> Nivel.apli(alpha,m,n,N,"t",Par) [1] 0.09016

(20)

Explorando a robustez da estat´ısticat. Aplica¸ao.

Aplica¸c˜ ao.

> Par <-c(1,1)

> Nivel.apli(alpha,m,n,N,"exp",Par) [1] 0.09613

>

> Par <-c(0.5,5)

> Nivel.apli(alpha,m,n,N,"exp",Par) [1] 0.98653

(21)

Explorando a robustez da estat´ısticat. Aplica¸ao.

Aplica¸c˜ ao.

Tabela:Resultados.

X∼N(0,1)eY ∼N(0,10) 0.1174

X∼t(df = 4)eY ∼t(df= 4) 0.0979 X∼t(df = 2)eY ∼t(df= 7) 0.0902 X∼exp(rate= 1)eY ∼exp(rate= 1) 0.0961 X∼exp(rate= 2)eY ∼exp(rate= 1/10) 0.9865

(22)

Desempenho do intervalo de confian¸ca tradicional para uma propor¸ao.

Sum´ ario

1 Explorando a robustez da estat´ısticat.

Introdu¸c˜ao.

Programa¸c˜ao de uma simula¸c˜ao de Monte Carlo.

Aplica¸c˜ao.

2 Desempenho do intervalo de confian¸ca tradicional para uma propor¸c˜ao.

3 Referˆencias.

(23)

Desempenho do intervalo de confian¸ca tradicional para uma propor¸ao.

Desempenho do I.C. para uma propor¸c˜ ao.

Suponha quey´e uma observa¸c˜ao de uma vari´avel aleat´oria binomial com tamanho amostraisne probabilidade de sucessop. O intervalo de confian¸ca ao 90%parap

´

e dado por

C(y) = pˆ−1.645

rp(1ˆ −p)ˆ

n , pˆ+ 1.645

rp(1ˆ −p)ˆ n

! ,

sendopˆ=y/n.

(24)

Desempenho do intervalo de confian¸ca tradicional para uma propor¸ao.

Desempenho do I.C. para uma propor¸c˜ ao.

Exemplo: Suponha que o tamanho amostral ´e n = 20 e o verdadeiro valor da propor¸c˜ao ´e p = 0.5. Usando o comando rbinom, simular um valor de y e usar binomial.conf.intervalpara calcular o I.C. ao90%. Repetir este procedimento 20vezes, e estimar a verdadeira probabilidade de coberturaP(p∈C(y)).

binomial.conf.interval <- function(y,n){

z <- qnorm(.95) phat <- y/n

se <- sqrt(phat*(1-phat)/n) return(c(phat-z*se,phat+z*se))}

(25)

Desempenho do intervalo de confian¸ca tradicional para uma propor¸ao.

Desempenho do I.C. para uma propor¸c˜ ao.

Solu¸c˜ao:

> n <- 20; p <- 0.5; n.contador <- 0; i <- 1

> while(i <= 20){

+ y <- rbinom(1,n,p)

+ IC <- binomial.conf.interval(y,n) + if(min(IC) < p & p < max(IC)){

+ n.contador <- n.contador + 1 + }

+ i <- i + 1 + }

>

> n.contador/n [1] 0.85

(26)

Referˆencias.

Sum´ ario

1 Explorando a robustez da estat´ısticat.

Introdu¸c˜ao.

Programa¸c˜ao de uma simula¸c˜ao de Monte Carlo.

Aplica¸c˜ao.

2 Desempenho do intervalo de confian¸ca tradicional para uma propor¸c˜ao.

3 Referˆencias.

(27)

Referˆencias.

Albert, Jim (2009). Bayesian Computation with R. Springer, 2a.Edi¸c˜ao.

Referências

Documentos relacionados

tanto para melhorar ou manter o bem- estar e não entrar no ciclo vicioso que leva ao estresse financeiro, quanto para deixar a situação de estresse financeiro e recuperar a

Areas com PPV baixo n˜ ´ ao variam muito mesmo com poucas rela¸c˜ oes verdadeiras;. Significˆ ancia estat´ıstica n˜ ao est´ a ligada a

CAP´ ITULO 3: Inferˆ encia Estat´ıstica para Duas Amostras An´ alise da Variˆ ancia e da Propor¸c˜ ao.. 1 Inferˆ encia sobre as variˆ ancias duas popula¸ c˜ oes

A an´ alise da variˆ ancia baseia-se na premissa que, sendo verdadeira a hip´ otese H 0 , existem trˆ es maneiras pelas quais a variˆ ancia σ 2 comum a todas as popula¸ c˜ oes,

Obteremos agora rela¸c˜ oes de ortogonalidade para os polinˆomios de Legendre associados, rela¸c˜ oes essas de grande importˆ ancia na An´alise Harmˆ onica e que inspiram

Abre caminho para personagens como MV Bill, ao grupo Planet Hamp e o principal grupo do gênero: os Racionais MC’s, que abordam a condição do jovem negro da periferia

Informações no terminal central: número e nome das linhas; horários ou intervalos entre veículos; mapa esquemático das linhas com localização dos pontos e indicação

Com isso, alguns objetivo foram tra¸ cados tais como: o estudo te´ orico e a implementa¸ c˜ ao num´ erica de m´ etodos aplicados ` a resolu¸ c˜ ao de Sistemas de Equa¸ c˜ oes n˜