• Nenhum resultado encontrado

do vetor de parˆametros desconhecidos β.

O primeiro tipo de res´ıduo bin´ario aqui considerado ser´a o res´ıduo ri = yi− pi. Este

res´ıduo tem fun¸c˜ao de distribui¸c˜ao cont´ınua e ´e fun¸c˜ao do vetor de parˆametros β, logo, o conhecimento a posteriori que temos sobre β ser´a refletido na distribui¸c˜ao a posteriori dos res´ıduos. O suporte do res´ıduo ri ´e o intervalo (yi− 1, yi). Assim, se o valor de yi e

a distribui¸c˜ao a posteriori de pi est˜ao em conflito, a distribui¸c˜ao a posteriori do res´ıduo

estar´a concentrada nos valores extremos. A observa¸c˜ao yi= 0 ser´a considerada discrepante

se a distribui¸c˜ao a posteriori de ri estiver concentrada pr´oxima do valor −1. Por outro

lado, a observa¸c˜ao yi = 1 ser´a considerada discrepante se a distribui¸c˜ao a posteriori de ri

estiver concentrada pr´oxima do valor 1.

Nos cap´ıtulos 2 e 3 foram descritas algumas formas de obten¸c˜ao de uma amostra da distribui¸c˜ao a posteriori do vetor de parˆametros desconhecidos θ para os modelos probito e log´ıstico (θ = β), e para o modelo probito-assim´etrico [θ = (β, λ)⊤]. Seja{θ(t)}T

t=1 uma

amostra de tamanho T da distribui¸c˜ao a posteriori de θ. Como yi e xi s˜ao conhecidos,

para obter uma amostra destes res´ıduos, basta considerar r(t)i = yi− Fλ(t)(x⊤i β(t)), t≤ T .

A partir dessa amostra podemos obter medidas descritivas e densidades estimadas das distribui¸c˜oes a posteriori dos res´ıduos. Albert e Chib (1995) prop˜oem o uso de gr´aficos do tipo boxplot para representar as amostras geradas das distribui¸c˜oes a posteriori dos res´ıduos contra as probabilidades ajustadas. Tais gr´aficos considerados conjuntamente ajudam a visualizar os res´ıduos discrepantes.

4.2 Res´ıduos latentes

Uma maneira alternativa de definir res´ıduos bayesianos ´e baseada no uso de vari´aveis auxiliares. Nos cap´ıtulos anteriores foram apresentadas representa¸c˜oes do modelo de re- gress˜ao bin´aria dado em (1.1) utilizando vari´aveis auxiliares. O modelo (3.3) apresenta uma representa¸c˜ao geral para modelos de regress˜ao bin´aria que abrange todos os modelos sim´etricos e assim´etricos apresentados nos cap´ıtulos 2 e 3.

Podemos definir v´arios tipos de res´ıduos latentes sob o modelo (3.3). O primeiro res´ıduo

4.2 Res´ıduos latentes 37 latente que ser´a considerado aqui ´e dado por

ǫ∗i(zi, β) = zi− x⊤i β. (4.1)

Esse res´ıduo foi definido por Albert e Chib (1993) para detec¸c˜ao de observa¸c˜oes discrepantes em modelos com fun¸c˜ao de liga¸c˜ao sim´etrica. Entretanto, ele tamb´em pode ser ´util para o diagn´ostico em modelos assim´etricos.

Para modelos sim´etricos, o res´ıduo dado em (4.1) ´e distribu´ıdo a priori com a mesma distribui¸c˜ao utilizada para definir a fun¸c˜ao de liga¸c˜ao. Por exemplo, se o modelo adotado ´e o logito, ent˜ao o res´ıduo (4.1) tem distribui¸c˜ao a priori log´ıstica padr˜ao. Por outro lado, se o modelo ´e assim´etrico, o res´ıduo (4.1) tamb´em tem distribui¸c˜ao a priori assim´etrica. Entre- tanto, observamos que o parˆametro de assimetria desta distribui¸c˜ao tem sinal contr´ario ao da distribui¸c˜ao utilizada para definir a fun¸c˜ao de liga¸c˜ao. Por exemplo, no modelo probito- assim´etrico dado em (3.6), F (u) = ΦCDS(u, λ) e o res´ıduo ǫ∗i(zi, β) tem fda ΦCDS(·, −λ),

seguindo a distribui¸c˜ao da vari´avel latente zi. Note que a distribui¸c˜ao do res´ıduo ǫ∗i ´e fun-

¸c˜ao do parˆametro de assimetria λ. Se λ n˜ao for conhecido, a distribui¸c˜ao desse res´ıduo ser´a fun¸c˜ao da distribui¸c˜ao a priori de λ. Por exemplo, quando λ ´e normalmente distribu´ıdo, a distribui¸c˜ao a priori de ǫ∗i ´e desconhecida e a interpreta¸c˜ao do tamanho dos res´ıduos ´e prejudicada. Uma alternativa ´e utilizar uma estimativa pontual para esse parˆametro ou de- finir um res´ıduo que n˜ao dependa de parˆametros a priori. Deste modo, definimos o seguinte res´ıduo

ǫi(zi, wi, β, λ) = zi− (x⊤i β− λwi). (4.2)

Este res´ıduo tem distribui¸c˜ao sim´etrica F com suporte nos reais. Se o modelo adotado ´e sim´etrico, o parˆametro de assimetria λ ´e igual a zero e o res´ıduo dado em (4.2) se reduz ao res´ıduo definido em (4.1). Se o modelo adotado ´e o probito-assim´etrico, o res´ıduo ǫi tem

distribui¸c˜ao normal padr˜ao.

Para entender melhor como as observa¸c˜oes yi alteram a distribui¸c˜ao a posteriori dos

res´ıduos, considere a distribui¸c˜ao a posteriori do res´ıduo (4.2) condicionado `a {β, λ}. A densidade desse res´ıduo ´e dada por

f (ǫi|y, β, λ) =        f (ǫi) F (x⊤i β)I(ǫi >−x ⊤ i β) se yi= 1, f (ǫi) F (−xi β)I(ǫi <−x ⊤ i β) se yi= 0, (4.3)

4.2 Res´ıduos latentes 38 sendo f a fun¸c˜ao densidade associada a fda F definida em (4.2). A distribui¸c˜ao a posteriori apresentada acima tem distribui¸c˜ao F truncada, onde o ponto de truncamento ´e o negativo do preditor linear x⊤i β. A distribui¸c˜ao a posteriori do res´ıduo latente ǫiser´a significamente

diferente da distribui¸c˜ao a priori somente se as observa¸c˜oes yi est˜ao com sinais contr´arios

ao do preditor linear. A probabilidade desse res´ıduo ser maior que um valor pr´e-especificado k >| − xi β| ´e dada por

IP (i| > k|y, β, λ) =        1− F (k) F (x⊤i β)I(ǫi >−x ⊤ i β) se yi= 1, F (−k) F (−xi β)I(ǫi <−x ⊤ i β) se yi= 0. (4.4)

Por exemplo, no modelo log´ıstico, assumindo que yi = 1, a probabilidade desse res´ıduo

exceder k ´e dada por

IP (ǫi > k|yi= 1, β) =

1 + e−x⊤i β

1 + ek .

Mas, a probabilidade a priori deste evento ocorrer ´e igual a 1/(1 + ek). Portanto, estas

probabilidades estar˜ao mais pr´oximas quanto mais pr´oximo de zero for e−x⊤iβ, isto ´e,

quanto maior for o preditor linear x⊤i β.

No modelo probito, quando yi= 1, a esperan¸ca e a variˆancia a posteriori de ǫi s˜ao dadas

por

IE(ǫi|yi= 1, β) = di e Var(ǫi|yi = 1, β) = 1− di(x⊤i β+ di),

respectivamente, sendo di = φ(x⊤i β)/Φ(x⊤i β). Estes momentos ser˜ao significamente dife-

rentes dos momentos a priori, IE(ǫi) = 0 e Var(ǫi) = 1, quando di for grande, ou equiva-

lentemente quando o preditor linear x⊤i β ´e menor que alguma constante negativa C. Nos modelos sim´etricos em geral, os res´ıduos ǫi(zi, β), i = 1, . . . , n, podem ter variˆancias

a priori diferentes de um. Portanto, para modelos de mistura no parˆametro de escala de normais, ou seja, quando F ∈ FS, com FS definido em (2.1), definimos o seguinte res´ıduo

τi(β, δi) =

zi− x⊤i β

p δi(ψ)

, (4.5)

sendo δ(ψ) e ψ dados em (2.4). O res´ıduo (4.5) condicionado `a{β, δi} tem distribui¸c˜ao nor-

mal padr˜ao. Portanto, podemos utilizar esse res´ıduo e assumir que um ponto ´e discrepante com o mesmo crit´erio utilizado para o caso probito, isto ´e, assumiremos que uma observa- ¸c˜ao ser´a discrepante se a probabilidade desse res´ıduo em m´odulo ultrapassar 1,96 for alta.

4.3 Aplica¸c˜ao 39

Documentos relacionados