CE225 - Modelos Lineares Generalizados
Cesar Augusto Taconeli
02 de setembro, 2019
Aula 7 - Inferência em modelos lineares
generalizados
Testes de hipóteses
Vamos discutir neste momento testes para hipóteses do tipo:
H0 : β = β0 H1 : β 6= β0 (1)
Nas hipóteses apresentadas, β representa um ou mais parâmetros do
modelo ajustado, e β0 valores postulados (fixados) para esses
parâmetros na hipótese nula.
Testes de hipóteses
Apenas para ilustração, considere o seguinte modelo:
ln(µ) = β0+ β1x1+ β2x2+ β3x3+ β4x4 (2) Exemplos de hipóteses: H0 : β1 β2 β3 β4 = 0 0 0 0 vs H1: β1 β2 β3 β4 6= 0 0 0 0 ;
Testes de hipóteses
H0 : β1 β3 ! = 0 0 ! vs H1: β1 β3 ! 6= 0 0 ! ; H0 : β2 = 0 vs H1: β26= 0; H0 : β1 β2 β3 β4 = 1 −1 0 2 vs H1 : β1 β2 β3 β4 6= 1 −1 0 2 ...Os principais testes de hipóteses em modelos lineares generalizados são:
Teste da razão de verossimilhanças; Teste de Wald;
Teste escore.
Ilustração - Testes
Figura 1: Log-verossimilhança e ilustração dos três testes para a hipótese H0: α = a0.
Testes da razão de verossimilhanças
Seja L0 a verossimilhança maximizada sob a hipótese nula, e L1 a
verossimilhança maximizada de forma não restrita (permitindo que H0
ou H1 seja verdade).
A razão Λ = L0/L1 ≤ 1, uma vez que L0 resulta da maximização sobre
um conjunto restrito de valores para β.
Testes da razão de verossimilhanças
A estatística do teste da razão de verossimilhança é definida por:
−2lnΛ = −2ln(L0/L1) = −2(l0− l1), (3)
sendo l0 e l1 as log-verossimilhanças maximizadas sob restrição e irrestrita,
respectivamente.
Sob H0 e φ conhecido, a estatística do teste tem distribuição
assintótica χ2 com q graus de liberdade, sendo q o número de
parâmetros fixados em H0.
Nota: se o parâmetro de dispersão é desconhecido (sendo estimado), o
teste da razão de verossimilhança tem melhor aproximação pela distribuição F.
Testes de Wald
Seja β = (β0, β1), com β0 e β1 compondo uma partição do vetor de
parâmetros original β, com q e p − q parâmetros, respectivamente.
Para testar H0: β0 = 0, a estatística do teste de Wald fica definida
por
ˆ
β00Vard
−1
( ˆβ0) ˆβ0, (4)
em que ˆβ0 é a estimativa de β0 obtida sob o modelo irrestrito, e
d
Var ( ˆβ0) é o bloco da matriz de variâncias, correspondente aos elementos de ˆ
β0, também obtido sob o modelo irrestrito.
A estatística de Wald, sob H0 e considerando φ conhecido, também
tem distribuição assintótica χ2 com q graus de liberdade, sendo q o
número de parâmetros fixados em H0.
Testes de Wald
Para o teste de um único parâmetro, com hipótese nula H0 : βk = β0,
a estatística do teste de Wald fica dada por:
z = ˆ βk− β0 q d Var ( ˆβk) (5)
Testes escore
A estatística do teste escore é definido por:
S0( ˆβ0)Vard0( ˆβ)S( ˆβ0), (6)
em que S( ˆβ0) eVard0( ˆβ) são a função escore e a matriz de variâncias
avaliadas sob o modelo restrito (sob H0).
O teste escore não requer o ajuste do modelo sob H1, sendo
conveniente quando H1 define modelos bem mais complexos do que H0.
O teste escore sob H0 também tem distribuição assintótica χ2 com q
graus de liberdade, sendo q o número de parâmetros fixados em H0.
Intervalos de confiança
Intervalos de confiança para qualquer dos três métodos podem ser obtidos invertendo as respectivas estatísticas de teste.
Por exemplo, um intervalo de confiança 95% para um único parâmetro
βk, é definido pelo conjunto de valores β0 tais que H0: βk = β0 não é
rejeitada ao nível de significância de 5%.
Um intervalo de confiança assintótico 100(1 − α)% para βk, baseado
no teste de Wald, tem limites:
IC (βk; 1 − α) = ˆβk ± zα/2 q
d
Var ( ˆβk), (7)
Intervalos de confiança
Pode-se obter um intervalo de confiança para βk baseado na
verossimilhança perfilada.
Seja H0: βk = β0 e Ψ representando o conjunto dos demais
parâmetros do modelo.
Ao inverter o teste da razão de verossimilhanças, para determinar o
conjunto de valores β0 que compõem o intervalo de confiança, a
estimativa de máxima verossimilhança de Ψ varia para os diferentes valores de β0.
Intervalos de confiança
O intervalo de confiança baseado na verossimilhança perfilada de βk é
definido pelo conjunto de valores β0 tais que:
−2[l(β0, ˆΨ(β0)) − l ( ˆβk, ˆΨ)] < χ21(α), (8)
sendo l (β0, ˆΨ(β0)) a log-verossimilhança maximizada para βk = β0 e l ( ˆβk, ˆΨ) a log-verossimilhança maximizada de forma irrestrita.
Intervalos de confiança
Além de intervalos de confiança para os parâmetros, é interessante
também obter intervalos de confiança para µx = E [y |x], sendo
x0 = (x1, x2, ..., xp) um específico vetor de covariáveis.
A estimativa pontual para µx é dada por:
ˆ
µx = g−1(x0β)ˆ (9)
Seja ˆηx = x0β. Como ˆˆ ηx é uma combinação linear dos ˆβ0s, decorre
que, assintoticamente:
ˆ
ηx ∼ Normal(x0β, x0Var ( ˆβ)x) (10)
Intervalos de confiança
Um intervalo de confiança assintótico 100(1 − α)% para ηx = x0β fica
dado por:
IC (ηx; 1 − α) = x0β ± zˆ α/2 q
Intervalos de confiança
Dessa forma, um intervalo de confiança assintótico 100(1 − α)% para
µx = g−1(ηx) fica dado por:
IC (µx; 1 − α) = (g−1(LI); g−1(LS)), (12)
se g (·) é uma função estritamente crescente, e:
IC (µx; 1 − α) = (g−1(LS); g−1(LI)), (13)
se g (·) é uma função estritamente decrescente, onde LI e LS denotam os limites de confiança inferior e superior para ηx.