• Nenhum resultado encontrado

MPCE Aula6 v1

N/A
N/A
Protected

Academic year: 2021

Share "MPCE Aula6 v1"

Copied!
18
0
0

Texto

(1)

(aula 6)

Modelos Probabil´ısticos Hier´

arquicos

Paul G. Kinas

(2)

Modelos Probabilisticos Sobredispersos

1 Binomial Negativo = Poisson + Gama 2 Beta-binomial = Binomial + Beta 3 Student = Normal + Gama

Modelos Probabilisticos Zero-inflados

1 Poisson Zero-inflado (ZIP)

(3)

Binomial Negativa

X |A ∼ Poisson(A · f )

A ´e m´edia por unidade e f o n´umero de unidades.

A ∼ Gama(α, β)

marginalizando o parˆametro A

p(x ) = Z

dpois(x , A · f )dgamma(A, α, β)dA X ∼ Binomial Negativa(a, θ)

a = α θ = β+fβ

(4)

Binomial Negativa

Exemplo dos Ninhos e Ovos (Lista 3, Exercicio 3) > mOvos <- 6.5 > set.seed(2345) > x1 <- rpois(500,mOvos) > alfa <- 13; beta <- 2 > set.seed(45678) > m <- rgamma(500,alfa,beta) > set.seed(78910) > x2 <- rpois(500,m) x1 dPois x2 dBinN media 6.444000 6.50000000 6.54600 6.5000000 variancia 6.111086 6.50000000 10.43676 9.7500000 P(x>10) 0.062000 0.06683879 0.11800 0.1068764

(5)

Beta-binomial

X |θ ∼ Binomial(n, θ) θ ∼ Beta(α, β)

E (θ) = α+βα = µ

V (θ) = (α+β)2αβ(α+β+1) = σ2

marginalizando o parˆametro θ

p(x ) = Z dbinom(x , n, θ)dbeta(θ, α, β)d θ X ∼ Beta-binomial(n, α, β) E (X ) = nµ V (X ) = nµ(1 − µ)α+β+nα+β+1

(6)

Beta-binomial

Exemplo: Um conjunto de n = 15 barcos de espinhel saem ao mar levando observadores de bordo. No retorno, o registro de capturas

de cada barco ´e examinado quanto a ocorrˆencia (S) ou n˜ao (F) da

capturas de tubar˜ao azul. A vari´avel X : ”n´umero de barcos que

registraram capturas de tubar˜ao azul”. O modelo Beta-binomial ´e

um candidato se os dados forem sobre-dispersos com rela¸c˜ao ao

modelo Binomial convencional. Condideramos:

α = 4 e β = 12. Notar que E (θ) = 0.25 X |θ ∼ Binomial(n = 15, θ)

Comparar:

a distribui¸c˜ao Binomial supondo θ = 0.25; a distribui¸c˜ap Beta-binomial(15, 4, 12)

(7)

Beta-binomial

> n <- 15; alfa <- 4; beta <- 12 > set.seed(34567) > y1 <- rbinom(500,n, alfa/(alfa+beta)) > set.seed(760986) > m <- rbeta(500,alfa,beta) > set.seed(5578) > y2 <- rbinom(500,n,m) y1 dBin y2 dBetabin media 3.7480 3.7500 3.7120 3.7500 variancia 2.4133 2.8125 4.6664 5.1287 P(x>7) 0.0140 0.0001 0.0500 NA

(8)

Beta-binomial

0 5 10 15 0.0 0.4 0.8 binomial 0:15 pbinom(0:15, n, m u) 0 5 10 15 0.0 0.4 0.8 beta−binomial 0:15 pbinom(0:15, n, m u) 0 12 34 56 78 9 10 12 14 binomial 0.00 0.10 0.20 0.30 01 23 45 67 89 10 12 14 beta−binomial 0.00 0.10 0.20 0.30

(9)

Student

Como definir uma distribui¸c˜ao de Student generalizada com graus

de liberdade g , m´edia µ e parˆametro de escala σ. X |(µ, v ) ∼ Normal(µ,√1

v)

v ∼ Gama(α, β)

α = g2 e β = g2 · σ2 e E (v ) = 1 σ2

marginalizando o parˆametro v

p(x ) = Z

dnorm(x , µ, 1/√v )dgamma(v , α, β)dv

X ∼ Student(g , µ, σ)

(10)

Student

Exemplo: Supondo uma vari´avel X Normal com m´edia µ = 20, e

desvio padr˜ao (dp) σ = 3. Alternativamente se o dp ´e aleat´orio, tal que a precis˜ao v (definida como v = 1/(dp)2) ´e

Gama(g /2, (g /2)σ2), a disttribui¸c˜ao de X resultar´a em uma Student. Usamos g = 4 no exemplo.

Se X ∼ Student(g , µ, σ) ent˜ao

T = X − µ

σ

tem distribui¸c˜ao Student padronizada T ∼ Student(g , 0, 1).

(no R ´e necess´ario transformar de X para T antes de utilizar as

(11)

Student

> mu <- 20; sigma <- 3; g <- 4 > # x1 ~ Normal(mu, sigma) > set.seed(25)

> x1 <- rnorm(1000,mu,sigma) > #x2 ~ Student(g, mu, sigma) > set.seed(35)

> alfa <- g/2; beta <- (g/2)*(sigma^2) > v <- rgamma(1000,alfa,beta) > set.seed(45) > x2 <- rnorm(1000,mu,sqrt(1/v)) x1 dNorm x2 dStu media 20.0111 20.0000 19.8145 20.0000 variancia 9.0128 9.0000 19.3421 18.0000 P(x>26) 0.0220 0.0228 0.0590 0.0581

(12)

Student

0 10 20 30 40 0.0 0.4 0.8 normal x pnor m(x, m u, sigma) 0 10 20 30 40 0.0 0.4 0.8 student x pnor m(x, m u, sigma) normal x1 Density 0 10 20 30 40 0.00 0.05 0.10 0.15 student x2 Density 0 10 20 30 40 0.00 0.04 0.08 0.12

(13)

Student

Teste de Kolmogorov-Smirnov (KS) para testar distribui¸c˜oes

> # Comparando com modelo Normal(20, 3) > ks.test(x1,"pnorm",mu,sigma)$p.value [1] 0.4081848

> ks.test(x2,"pnorm",mu,sigma)$p.value [1] 0.005470993

> # Comparando 'x2' com modelo Student(4,20,3)

> ks.test((x2-mu)/sigma,"pt",g)$p.value [1] 0.6482302

(14)

S˜ao modelos ´uteis quando h´a excessos de zero nos dados (muitas vezes causados pela sobreposi¸c˜ao de v´arias fontes)

P. ex.: Ocorrˆencia (Sim/N˜ao) e Detec¸c˜ao (Sim/N˜ao) Poisson zero-inflacionado (ZIP)

Binomial-negativo zero-inflacionado (ZINB) Binomial zero-inflacionado (ZIB)

(15)

1 X denota vari´avel Bernoulli de ocorrˆencia

X ∼EB(θ)

2 (Y |X = 1) denota n´umero de detec¸oes quando h´a ocorrˆencia

(Y |X = 1) ∼Poisson(µ)

3 D ´e a vari´avel zero-inflacionada seguindo modelo ZIP

D = dpois(Y , µ) · dbinom(X , 1, θ)

4 E (D) = θµ

V (D) = µθ(1 − θ) + θ(1 − θ)µ2+ µθ2

(16)

> teta <- 0.7 > mu <- 2.5 > set.seed(234) > x <- rbinom(1000,1,teta) > set.seed(427) > y <- rpois(1000,mu) > d <- x*y y Poi d ZIP media 2.4824 2.5000 1.8320 1.7500 variancia 2.4780 2.5000 3.0208 3.0625 P(==0) 0.0650 0.0821 0.3270 0.3575

(17)

0 1 2 3 4 5 6 7 8 Poisson Zero−inflacionado (ZIP)

d 0 50 100 150 200 250 300 0 1 2 3 4 5 6 7 8 Poisson (blue) y[x!=0] (blue) 0 50 100 150 200 250 300 0 1 2 3 4 5 6 7 8 0 50 100 150 200 250 300

(18)

OBRIGADO paulkinas@furg.br

Referências

Documentos relacionados

Mais comumente, os dados envolvem valores de v´ arias vari´ aveis, obtidos da observa¸ c˜ ao de unidades de investiga¸ c˜ ao que constituem uma amostra de uma popula¸ c˜ ao. A

Neste diret´ orio est˜ ao, tamb´ em, localizados programas para manipula¸ c˜ ao de arquivos Postscript e L A TEX gerados pelo Scilab. • demos/ - onde est˜ ao localizados os

Para cada vari´ avel preditora cont´ınua n˜ ao suavizada, perde-se um grau de liberdade; para as vari´ aveis suavizadas a atribui¸ c˜ ao de graus de liberdade ´ e mais complexa

A an´ alise de dados amostrais possibilita que se fa¸ ca inferˆ encia sobre a distribui¸ c˜ ao de probabilidades das vari´ aveis de interesse, definidas sobre a popula¸ c˜ ao da

magn´ etica por aquele baseado na medida da distˆ ancia aberta por meio de ultrassonografia, podemos estimar as probabilidades de sucesso para todas as articula¸ c˜ oes e identificar

Em geral, cada linha da matriz de dados corresponde a uma unidade de investiga¸c˜ ao (e.g. uni- dade amostral) e cada coluna, a uma vari´ avel. Uma planilha bem elaborada

Alta dimens˜ ao relativa: modelos com muita vari´ aveis (p) comparado com o n´ umero de amostras (n), mas usualmente com p &lt; n;.. Alta dimens˜ ao moderada: modelos com n´ umero

A an´ alise de dados amostrais possibilita que se fa¸ ca inferˆ encia sobre a distribui¸ c˜ ao de probabilidades das vari´ aveis de interesse, definidas sobre a popula¸ c˜ ao da