• Nenhum resultado encontrado

Inferˆ encia

No documento Modelos Lineares Generalizados e (páginas 70-77)

2.5 Metodologia

2.5.3 Inferˆ encia

A etapa de inferˆencia tem como objetivo principal verificar a adequa¸c˜ao do modelo como um todo e realizar um estudo detalhado quanto a discrepˆancias locais. Essas discrepˆancias, quando significativas, podem implicar na escolha de outro modelo, ou em aceitar a existˆencia de observa¸c˜oes aberrantes. Em qualquer caso, toda a metodologia de trabalho dever´a ser repetida.

Deve-se, nessa etapa, verificar a precis˜ao e a interdependˆencia das estimati- vas, construir regi˜oes de confian¸ca e testes sobre os parˆametros de interesse, analisar estatisticamente os res´ıduos e realizar previs˜oes.

A precis˜ao das previs˜oes depende basicamente do modelo selecionado e, por- tanto, um crit´erio de adequa¸c˜ao do ajuste ´e verificar se a precis˜ao de uma previs˜ao em particular ´e maximizada. Muitas vezes, ´e poss´ıvel otimizar a precis˜ao por simples altera¸c˜ao do componente sistem´atico do modelo.

Um gr´afico dos res´ıduos padronizados versus valores ajustados, sem nenhuma tendˆencia, ´e um indicativo de que a rela¸c˜ao funcional variˆancia/m´edia proposta para os dados ´e satisfat´oria. Gr´aficos dos res´ıduos versus vari´aveis explanat´orias que n˜ao

est˜ao no modelo s˜ao bastante ´uteis. Se nenhuma vari´avel explanat´oria adicional for necess´aria, ent˜ao n˜ao se dever´a encontrar qualquer tendˆencia nesses gr´aficos. Ob- serva¸c˜oes com erros grosseiros podem ser detectadas como tendo res´ıduos grandes e leverages pequenos ou res´ıduos pequenos e leverages (h) grandes, ou o modelo ajus- tado deve requerer mais vari´aveis explanat´orias, por exemplo, intera¸c˜oes de ordem superior. A inspe¸c˜ao gr´afica ´e um meio poderoso de inferˆencia nos MLG.

Para verificar o ajuste do MLG, pode-se adotar o crit´erio da raz˜ao da veros- similhan¸cas em rela¸c˜ao ao modelo saturado e a estat´ıstica de Pearson generalizada (Se¸c˜ao 4.2). Quase toda a parte de inferˆencia nos MLG ´e baseada em resultados as- sint´oticos, e pouco tem sido estudado sobre a validade desses resultados em amostras muito pequenas.

Um modelo mal ajustado aos dados pode apresentar uma ou mais das se- guintes condi¸c˜oes: (a) inclus˜ao de um grande n´umero de vari´aveis explanat´orias no modelo, muitas das quais s˜ao redundantes e algumas explicando somente um pe- queno percentual das observa¸c˜oes; (b) formula¸c˜ao de um modelo bastante pobre em vari´aveis explanat´orias, que n˜ao revela e nem reflete as caracter´ısticas do mecanismo gerador dos dados; (c) as observa¸c˜oes mostram-se insuficientes para que falhas do modelo sejam detectadas.

A condi¸c˜ao (a) representa uma superparametriza¸c˜ao do modelo implicando numa imprecis˜ao das estimativas e (b) ´e a situa¸c˜ao oposta de (a): uma subparame- triza¸c˜ao que implica em previs˜oes ruins. A terceira condi¸c˜ao ´e um tipo de falha dif´ıcil de se detectar, e ´e devida `a combina¸c˜ao inadequada distribui¸c˜ao/fun¸c˜ao de liga¸c˜ao, que nada tem a ver com as observa¸c˜oes em quest˜ao.

2.6

Exerc´ıcios

1. Para o modelo binomial as fun¸c˜oes de liga¸c˜ao mais comuns s˜ao: log´ıstica, probito e complemento log-log. Comparar os valores do preditor linear para essas fun¸c˜oes de

liga¸c˜ao no intervalo (0, 1). 2. Mostre que lim λ→0 µλ− 1 λ = log(µ).

3. Considere a fam´ılia de fun¸c˜oes de liga¸c˜ao definida por Aranda-Ordaz (1981)

η = log [ (1− π)−λ− 1 λ ] , 0 < π < 1 e λ uma constante.

Mostre que a fun¸c˜ao de liga¸c˜ao log´ıstica ´e obtida para λ = 1 e que quando λ → 0, tem-se a fun¸c˜ao de liga¸c˜ao complemento log-log.

4. Comparar os gr´aficos de η = log [ (1− µ)−λ− 1 λ ] versus µ para λ =−1, −0.5, 0, 0.5, 1 e 2.

5. Explicar como um modelo de Box-Cox poderia ser formulado no contexto dos

MLG.

6. Demonstrar que se Y tem uma distribui¸c˜ao binomial B(m, π), ent˜ao para m grande Var(arcsen√Y /m) ´e, aproximadamente, 1/(4m), com o ˆangulo expresso em radianos. Em que situa¸c˜oes uma estrutura linear associada a essa transforma¸c˜ao poder´a ser adequada?

7. Suponha que Y tem distribui¸c˜ao binomial B(m, π) e que g(Y /m) ´e uma fun¸c˜ao arbitr´aria. Calcular o coeficiente de assimetria assint´otico de g(Y /m). Demonstrar que se anula quando g(π) =0πt−1/3(1− t)−1/3dt e, portanto, a vari´avel aleat´oria definida por [g(Y /m)− g(α)]/[π1/6(1− π)1/6m−1/2], em que α = π− (1 − 2π)/(6m),

tem distribui¸c˜ao pr´oxima da normal reduzida (Cox e Snell, 1968).

8. Sejam Y1 e Y2 vari´aveis aleat´orias binomiais de parˆametros π1 e π2 em dois

grupos de tamanhos m1 e m2, respectivamente. O n´umero de sucessos Y1 no primeiro

hipergeom´etrica generalizada de parˆametros π1, π2, m1, m2 e r. Demonstrar que essa

distribui¸c˜ao ´e um membro da fam´ılia (2.4) com parˆametro θ = log{π1(1−π2)/[π2(1

π1)]}, ϕ = 1 e π = D1(θ)/D0(θ), em que Di(θ) =xx i(m1 x )(m2 r−x ) exp(θx) para i = 0, 1. Calcular a express˜ao do r-´esimo cumulante dessa distribui¸c˜ao.

9. Se Y tem distribui¸c˜ao de Poisson P(µ), demonstrar:

(a) que o coeficiente de assimetria Y2/3 ´e de ordem µ−1 enquanto que aqueles de Y e Y1/2 ao de ordem µ−1/2;

(b) que o logaritmo da fun¸c˜ao de verossimilhan¸ca para uma ´unica observa¸c˜ao ´e, aproximadamente, quadr´atico na escala µ1/3;

(c) a f´ormula do r-´esimo momento fatorial E[Y (Y − 1) . . . (Y − r + 1)] = µr;

(d) a f´ormula de recorrˆencia entre os momentos centrais µr+1 = rµµr−1+ µdµr/dµ;

(e) que 2√Y tem, aproximadamente, distribui¸c˜ao normal N(0, 1).

10. Se Y tem distribui¸c˜ao gama G(µ, ϕ), demonstrar que:

(a) quando ϕ < 1, a fun¸c˜ao densidade ´e zero na origem e tem uma ´unica moda no ponto µ(1− ϕ);

(b) o logaritmo da fun¸c˜ao de verossimilhan¸ca para uma ´unica observa¸c˜ao ´e, apro- ximadamente, quadr´atico na escala µ−1/3;

(c) a vari´avel transformada 3[(Y /µ)1/3− 1] ´e, aproximadamente, normal.

11. Se Y tem distribui¸c˜ao binomial B(m, π), demonstrar que a m´edia e a variˆancia de log[(Y + 0, 5)/(m− Y + 0, 5)] s˜ao iguais a log[π/(1 − π)] + O(m−2) e E[(Y + 0, 5)−1+ (m− Y + 0, 5)−1]+ O(m−3), respectivamente.

em potˆencias de µ−1, e mostrar que o coeficiente de µ−1 ´e zero quando c = 3/8. Achar uma expans˜ao similar para Var[Y1/2+ (Y + 1)1/2].

13. Qual ´e a distribui¸c˜ao da tolerˆancia correspondente `a fun¸c˜ao de liga¸c˜ao arcsen√?

14. Se Y tem distribui¸c˜ao binomial B(m, π), demonstrar que os momentos da es- tat´ıstica Z =±{2Y log(Y/µ)+2(m−Y ) log[(m−Y )/(m−µ)]}1/2+{(1−2π)/[mπ(1−

π)]}1/2/6 diferem dos correspondentes da distribui¸c˜ao normal reduzida N(0, 1) com erro O(m−1). Essa transforma¸c˜ao induz simetria e estabiliza a variˆancia simultanea- mente (McCullagh e Nelder, 1989).

15. Se Y tem distribui¸c˜ao binomial B(m, π), demonstrar a express˜ao aproximada P(Y ≤ y) = Φ(y1), em que y1 = 2m1/2{arcsen[(y+3/8)/(m+3/4)]1/2−arcsen(π1/2)}.

16. Suponha que Y ∼ B(m, π), sendo π = eλ(1 + eλ)−1. Mostre que m− Y tem distribui¸c˜ao binomial com parˆametro induzido correspondente λ′ =−λ.

17. Demonstrar que para a vari´avel aleat´oria Y com distribui¸c˜ao de Poisson, tem-se:

(a) E(Y1/2)≈ µ1/2 e Var(Y1/2) 1

4; (b) E(Y1/2) = µ1/2 ( 1 1 ) + O(µ−3/2) e Var(Y1/2) = 1 4 ( 1 + 3 ) + O(µ−3/2); (c) E(Y2/3)≈ µ2/3 ( 1 1 ) e Var(Y2/3) 1/3 9 ( 1 + 1 ) .

18. Se Y tem distribui¸c˜ao de Poisson com m´edia µ, mostre que:

(a) P(Y ≤ y) = P(χ2 2(y+1) > 2µ); (b) P(Y ≤ y) = Φ(z) − ϕ(z) ( z2− 1 6√µ + z5− 7z3+ 3z 72µ ) + O(µ−3/2), em que z = (y + 0.5− µ)µ−1/2 e Φ(.) e ϕ(.) s˜ao, respectivamente, a f.d.a. e a f.d.p. da distribui¸c˜ao normal reduzida.

Cap´ıtulo 3

Estima¸ao

3.1

Estat´ısticas suficientes

Seja um MLG definido pelas express˜oes (2.4), (2.6) e (2.7) e suponha que as observa¸c˜oes a serem analisadas sejam representadas pelo vetor y = (y1, . . . , yn)T. O

logaritmo da fun¸c˜ao de verossimilhan¸ca como fun¸c˜ao apenas de β (considerando-se o parˆametro de dispers˜ao ϕ conhecido), especificado y, ´e definido por ℓ(β) = ℓ(β; y) e usando-se a express˜ao (2.4), tem-se

ℓ(β) = ni=1 ℓi(θi, ϕ; yi) = ϕ−1 ni=1 [yiθi− b(θi)] + ni=1 c(yi, ϕ), (3.1) em que θi = q(µi), µi = g−1(ηi) e ηi = pr=1 xirβr.

A estima¸c˜ao do parˆametro de dispers˜ao ϕ ser´a objeto de estudo na Se¸c˜ao 4.4. Existem n parˆametros canˆonicos θ1, . . . , θn e n m´edias µ1, . . . , µn que s˜ao desconhe-

cidos, mas que s˜ao fun¸c˜oes de p parˆametros lineares β1, . . . , βp do modelo. Deve-se,

primeiramente, estimar o vetor de parˆametros β para depois calcular as estimati- vas do vetor das m´edias µ e do vetor dos parˆametros θ pelas rela¸c˜oes funcionais µi = g−1(xTi β) e θi = q(µi).

Se o intervalo de varia¸c˜ao dos dados n˜ao depende de parˆametros, pode- se demonstrar para os modelos cont´ınuos (Cox e Hinkley, 1986, Cap´ıtulo 9), que todas as derivadas de

exp[ℓ(β)]dy = 1 podem ser computadas dentro do sinal de integra¸c˜ao e que o ponto ˆβ correspondente ao m´aximo do logaritmo da fun¸c˜ao

de verossimilhan¸ca (3.1) est´a pr´oximo do vetor β de parˆametros verdadeiros com probabilidade pr´oxima de 1. Para os modelos discretos, a integra¸c˜ao ´e substitu´ıda pelo somat´orio. Esse fato ocorre em problemas denominados regulares.

Um caso importante dos MLG surge quando o vetor de parˆametros canˆonicos

θ da fam´ılia (2.4) e o vetor de preditores lineares η em (2.6) s˜ao iguais, conduzindo

`

as fun¸c˜oes de liga¸c˜ao canˆonicas. Tem-se, θi = ηi =

p

r=1xirβr para i = 1, . . . , n.

As estat´ısticas Sr =

n

i=1xirYi para r = 1, . . . , p s˜ao suficientes para os parˆametros

β1, . . . , βp e tˆem dimens˜ao m´ınima p. Sejam sr =

n

i=1xiryi as realiza¸c˜oes de Sr,

r = 1, . . . , p. Ent˜ao, a equa¸c˜ao (3.1) pode ser escrita na forma ℓ(β) = ϕ−1 [∑p r=1 srβr− ni=1 b(θi) ] + ni=1 c(yi, ϕ)

e, portanto, ℓ(β) tem a seguinte decomposi¸c˜ao ℓ(β) = ℓ1(s, β) + ℓ2(y), em que ℓ1(s, β) = ϕ−1p r=1srβr− ϕ−1n i=1b (p r=1xirβr) e ℓ2(y) =n i=1c(yi, ϕ).

Pelo teorema da fatora¸c˜ao, S = (S1, . . . , Sp)T ´e suficiente de dimens˜ao

m´ınima p para β = (β1, . . . , βp)T e, portanto, ocorre uma redu¸c˜ao na dimens˜ao

das estat´ısticas suficientes de n (o n´umero de observa¸c˜oes) para p (o n´umero de parˆametros a serem estimados). As estat´ısticas S1, . . . , Sp correspondem `a maior

redu¸c˜ao que os dados podem ter, sem qualquer perda de informa¸c˜ao relevante para se fazer inferˆencia sobre o vetor β de parˆametros desconhecidos.

Conforme descrito na Se¸c˜ao 2.3, as fun¸c˜oes de liga¸c˜ao que produzem es- tat´ısticas suficientes de dimens˜ao m´ınima p para as diversas distribui¸c˜oes s˜ao de- nominadas canˆonicas. A Tabela 2.6 mostra que essas fun¸c˜oes de liga¸c˜ao para os modelos normal, Poisson, binomial, gama e normal inverso s˜ao η = µ, η = log(µ), η = log[µ/(m− µ)], η = µ−1 e η = µ−2, respectivamente.

As fun¸c˜oes de liga¸c˜ao canˆonicas produzem propriedades estat´ısticas de in- teresse para o modelo, tais como, suficiˆencia, facilidade de c´alculo, unicidade das estimativas de m´axima verossimilhan¸ca e, em alguns casos, interpreta¸c˜ao simples.

Em princ´ıpio, pode-se trabalhar com as fun¸c˜oes de liga¸c˜ao canˆonicas quando n˜ao existirem indicativos de outra prefer´ıvel. Entretanto, n˜ao existe raz˜ao para se consi- derarem sempre os efeitos sistem´aticos como aditivos na escala especificada pela fun¸c˜ao de liga¸c˜ao canˆonica. A escolha da fun¸c˜ao de liga¸c˜ao ser´a descrita, com mais detalhes, na Se¸c˜ao 4.10.

No documento Modelos Lineares Generalizados e (páginas 70-77)

Documentos relacionados