Slides

(1)

CE225 - Modelos Lineares Generalizados

Cesar Augusto Taconeli

02 de setembro, 2019

(2)

Aula 7 - Inferência em modelos lineares

generalizados

(3)

Testes de hipóteses

Vamos discutir neste momento testes para hipóteses do tipo:

H0 : β = β0 H1 : β 6= β0 (1)

Nas hipóteses apresentadas, β representa um ou mais parâmetros do

modelo ajustado, e β₀ valores postulados (fixados) para esses

parâmetros na hipótese nula.

(4)

Testes de hipóteses

Apenas para ilustração, considere o seguinte modelo:

ln(µ) = β0+ β1x1+ β2x2+ β3x3+ β4x4 (2) Exemplos de hipóteses: H0 :      β1 β2 β3 β4      =      0 0 0 0      vs H1:      β1 β2 β3 β4      6=      0 0 0 0      ;

(5)

Testes de hipóteses

H0 : β1 β3 ! = 0 0 ! vs H1: β1 β3 ! 6= 0 0 ! ; H0 : β2 = 0 vs H1: β26= 0; H0 :      β1 β2 β3 β4      =      1 −1 0 2      vs H1 :      β1 β2 β3 β4      6=      1 −1 0 2      ...

Os principais testes de hipóteses em modelos lineares generalizados são:

Teste da razão de verossimilhanças; Teste de Wald;

Teste escore.

(6)

Ilustração - Testes

Figura 1: Log-verossimilhança e ilustração dos três testes para a hipótese H0: α = a0.

(7)

Testes da razão de verossimilhanças

Seja L0 a verossimilhança maximizada sob a hipótese nula, e L1 a

verossimilhança maximizada de forma não restrita (permitindo que H0

ou H1 seja verdade).

A razão Λ = L0/L1 ≤ 1, uma vez que L0 resulta da maximização sobre

um conjunto restrito de valores para β.

(8)

Testes da razão de verossimilhanças

A estatística do teste da razão de verossimilhança é definida por:

−2lnΛ = −2ln(L0/L1) = −2(l0− l1), (3)

sendo l0 e l1 as log-verossimilhanças maximizadas sob restrição e irrestrita,

respectivamente.

Sob H0 e φ conhecido, a estatística do teste tem distribuição

assintótica χ2 com q graus de liberdade, sendo q o número de

parâmetros fixados em H0.

Nota: se o parâmetro de dispersão é desconhecido (sendo estimado), o

teste da razão de verossimilhança tem melhor aproximação pela distribuição F.

(9)

Testes de Wald

Seja β = (β₀, β₁), com β₀ e β₁ compondo uma partição do vetor de

parâmetros original β, com q e p − q parâmetros, respectivamente.

Para testar H0: β0 = 0, a estatística do teste de Wald fica definida

por

ˆ

β₀0Vard

−1

( ˆβ0) ˆβ0, (4)

em que ˆβ0 é a estimativa de β0 obtida sob o modelo irrestrito, e

d

Var ( ˆβ0) é o bloco da matriz de variâncias, correspondente aos elementos de ˆ

β0, também obtido sob o modelo irrestrito.

A estatística de Wald, sob H0 e considerando φ conhecido, também

tem distribuição assintótica χ2 com q graus de liberdade, sendo q o

número de parâmetros fixados em H0.

(10)

Testes de Wald

Para o teste de um único parâmetro, com hipótese nula H0 : βk = β0,

a estatística do teste de Wald fica dada por:

z = ˆ βk− β0 q d Var ( ˆβk) (5)

(11)

Testes escore

A estatística do teste escore é definido por:

S0( ˆβ0)Vard₀( ˆβ)S( ˆβ0), (6)

em que S( ˆβ0) eVard₀( ˆβ) são a função escore e a matriz de variâncias

avaliadas sob o modelo restrito (sob H0).

O teste escore não requer o ajuste do modelo sob H1, sendo

conveniente quando H1 define modelos bem mais complexos do que H0.

O teste escore sob H0 também tem distribuição assintótica χ2 com q

graus de liberdade, sendo q o número de parâmetros fixados em H0.

(12)

Intervalos de confiança

Intervalos de confiança para qualquer dos três métodos podem ser obtidos invertendo as respectivas estatísticas de teste.

Por exemplo, um intervalo de confiança 95% para um único parâmetro

βk, é definido pelo conjunto de valores β0 tais que H0: βk = β0 não é

rejeitada ao nível de significância de 5%.

Um intervalo de confiança assintótico 100(1 − α)% para βk, baseado

no teste de Wald, tem limites:

IC (βk; 1 − α) = ˆβk ± zα/2 q

d

Var ( ˆβk), (7)

(13)

Intervalos de confiança

Pode-se obter um intervalo de confiança para βk baseado na

verossimilhança perfilada.

Seja H0: βk = β0 e Ψ representando o conjunto dos demais

parâmetros do modelo.

Ao inverter o teste da razão de verossimilhanças, para determinar o

conjunto de valores β0 que compõem o intervalo de confiança, a

estimativa de máxima verossimilhança de Ψ varia para os diferentes valores de β0.

(14)

Intervalos de confiança

O intervalo de confiança baseado na verossimilhança perfilada de βk é

definido pelo conjunto de valores β0 tais que:

−2[l(β₀, ˆΨ(β0)) − l ( ˆβk, ˆΨ)] < χ21(α), (8)

sendo l (β0, ˆΨ(β0)) a log-verossimilhança maximizada para βk = β0 e l ( ˆβk, ˆΨ) a log-verossimilhança maximizada de forma irrestrita.

(15)

Intervalos de confiança

Além de intervalos de confiança para os parâmetros, é interessante

também obter intervalos de confiança para µx = E [y |x], sendo

x0 = (x1, x2, ..., xp) um específico vetor de covariáveis.

A estimativa pontual para µx é dada por:

ˆ

µx = g−1(x0β)ˆ (9)

Seja ˆηx = x0β. Como ˆˆ ηx é uma combinação linear dos ˆβ0s, decorre

que, assintoticamente:

ˆ

ηx ∼ Normal(x0β, x0Var ( ˆβ)x) (10)

(16)

Intervalos de confiança

Um intervalo de confiança assintótico 100(1 − α)% para ηx = x0β fica

dado por:

IC (ηx; 1 − α) = x0β ± zˆ α/2 q

(17)

Intervalos de confiança

Dessa forma, um intervalo de confiança assintótico 100(1 − α)% para

µx = g−1(ηx) fica dado por:

IC (µx; 1 − α) = (g−1(LI); g−1(LS)), (12)

se g (·) é uma função estritamente crescente, e:

IC (µx; 1 − α) = (g−1(LS); g−1(LI)), (13)

se g (·) é uma função estritamente decrescente, onde LI e LS denotam os limites de confiança inferior e superior para ηx.