TESE
DE
MESTRADO
APRESENTADA
À
EPGE
t=»OR :
DA FUNDAÇÃO GETULIO VARGAS
PRAIA DE BOTAFOGO, 190/10.0 ANDAR
RIO DE JANEIRO - BRASIL - CEP 22.250
CIRCULAR N9 50
Assunto; Apresentação e defesa pública
de Dissertação de Mestrado em
Economia.
Comunicamos formalmente â Congregação da Escola que
está marcada para o dia 16 de setembro de 1987 (4a. feira) ãs 15:00h,
no
Auditório
Eugênio
Gudin
(109
andar),
a apresentação
e defesa
pú
blica da Dissertação de Mestrado, intitulada: "TÓPICOS CLÁSSICOS DE
ECONOMETRIA", do candidato ao título de Mestre em Economia, ALEXAN
DRE PORCIÚNCULA GOMES PEREIRA.
Anexamos uma súmula dessa Dissertação de Mestrado pa
ra seu prévio estudo, recentemente,através da Circular n? 49.
A Banca Examinadora "ad hoc" designada pela Escola se
rã
composta
pelos
doutores:
Antônio
Carlos
Porto
Gonçalves,
Sérgio
Ribeiro da Costa Werlang e Carlos Ivan Simonsen Leal (Presidente).
Com esta convocação oficial da Congregação de Profes
sores da Escola, estão ainda convidados a participarem desse ato
acadêmico os alunos da EPGE, interessados da FGV e de outras insti
tuições.
Rio de Janeiro, 04 de setembro de 1987
írio Henri monsen.
Diretor da EPGE.
A-4 Formato Internacional
RIO DE JANEIRO - BRASIL - CEP 22.250
LAUDO SOBRE DISSERTAÇÃO DE MESTRADO
Como membro da Banca Examinadora, designada pela
EPGE para julgar a Dissertação de Mestrado intitulada, "TÕPICOS
CLÁSSICOS DE ECONOMETRIA" do candidato ao título ALEXANDRE PORCI
ÚNCULA GOMES PEREIRA, apresento as seguintes ponderações que jus_
tificam meu parecer e voto:
1) 0 candidato apresenta uma tese de elevado rigor
e clareza, a qual contêm uma inovadora apresenta
ção da Teoria das Séries de Tempo.
2) Ele apresenta tópicos pouco divulgados na litera.
tura de econometria brasileira, como a estatísti_
ca de Portmanteau.
3) Ele fornece uma excelente digressão sobre os fun
damentos estatísticos da econometria, voltando
aos fundamentos da Teoria da Medida.
Assim e nestas condições, sou de parecer que a re
ferida Dissertação seja aprovada e outorgado o título pretendido
pelo candidato e autor deste trabalho.
Rio de Janeiro, 16 de setembro de 1987.
Sérgio Ribeiro da Costa Werlang,
Professor da EPGE .
A-4 Formato Internacional
DA FUNDAÇÃO GETULIO VARGAS
PRAIA DE BOTAFOGO, 190/10.° ANDAR
RIO DE JANEIRO - BRASIL - CEP 22.250
LAUDO SOBRE DISSERTAÇÃO DE MESTRADO
Como membro da Banca examinadora, designada pela
EPGE para julgar a Dissertação de Mestrado,intitulada
"TÕPI-COS CLÁSSICOS DE ECONOMETRIA", do aluno ALEXANDRE
PORCIÜNCU-LA GOMES PEREIRA, julgo que a referida Dissertação seja apro
vada e outorgado o título pretendido pelo candidato e autor
do trabalho, visto que demonstrou bom conhecimento no campo
de estudo de sua Dissertação, o que se traduziu num trabalho
claro e rigoroso.
Rio de Janeiro, 16 de setembro de 19 87
JTONIO CARLOS PORTO ÇÒNÇALVES,
Professor da E
A-4 Formato Internacional
RIO DE JANEIRO - BRASIL - CEP 22.250
LAUDO SOBRE DISSERTAÇÃO DE MESTRADO
Como membro da Banca Examinadora, designada pela
EPGE para julgar a Dissertação de Mestrado intitulada, "TÓPICOS
CLÁSSICOS DE ECONOMETRIA" do candidato ao titulo ALEXANDRE PORCI^
ONCULA GOMES PEREIRA, apresento as seguintes ponderações que jus_
tificam meu parecer e voto:
1) 0 candidato possui ótimo conhecimento no campo
da sua dissertação, fazendo nesta um apanhado
geral das idéias fundamentais e avançadas da
E-conometria, bem como uma excelente apresentação
da Teoria das Séries de Tempo.
2) Sua tese apresenta tópicos pouco divulgados na
língua portuguesa como, por exemplo, a introdu
ção que faz a Teoria das Séries de Tempo.
3) A sua tese apresenta elevado rigor e clareza
de apresentação. Ê fundamental a sedimentação
que faz usando a Teoria da Probabilidade ã Ia
Kolmogorov.
Assim e nestas condições, sou de parecer que a re
ferida Dissertação seja aprovada e outorgado o titulo pretendido
pelo candidato e autor deste trabalho.
Rio de «Iánéiffa,/7>i6 de
an S
Professor da EPGE e
Presidente da Banca.
Agradeço ao Prof. Carlos Ivan Simonsen Leal
pela sua orientação, dedicação, paciência e estímulo, sem o
que, muito provavelmente, esta tese de mestrado não se teria
concretizado.
Agradeço aos Profs. Sérgio Ribeiro da Costa
Werlang e Antônio Carlos Porto Gonçalves a leitura da versão
final do texto e sugestões.
Agradeço â Maria Zilma de Queiroz Barros pela
presteza, eficiência e paciência com que datilografou o texto
e deu o lay-out.
Agradeço o apoio recebido de meus familiares,
que me estimularam nos momentos mais difíceis.
Agradeço â direção da EPGE e todos que
ÍNDICE
CAPÍTULO 1; PROBABILIDADE 1
1.1- Introdução 1
1.2 - Medidas Positivas e Espaços Mensuráveis 2
1.3 - Variáveis Aleatórias 11
1.4 - Seqüência de Variáveis Aleatórias e Definições
de Convergência 15
1.5 - Lei Fraca de Tchebyschev e Teorema Central do
Limite 18
- Apêndice 2 3
CAPÍTULO 2: ESTATÍSTICA PARAMÉTRICA 24
2.1- Introdução 2 4
2.2 - Conceitos Básicos 26
2.3- Teoria de Rao-Cramer 32
2.4 - Método da Máxima Verossimilhança 43
2.5 - Teste de Hipótese Estatística 61
CAPÍTULO 3: TÓPICOS DE REGRESSÃO LINEAR 76
3.1 - Introdução 76
3.2 - Regressão Linear Simples 79
3.3- Previsão 104
3.4 - Mínimos Quadrados Generalizados 10 8
3.5 - Analise dos Resíduos de uma Regressão 118
3.6- Multicolinearidade 122
3.7 - Erro nas Observações e Variáveis Instrumentais 12 5
3.8 - Coeficientes de Correlação-Parcial 12 8
CAPÍTULO 4: REGRESSÕES NÃO-LINEARES E SÉRIES DE TEMPO ... 13 9
4.1 - Introdução 13 9
4.2- NHo-Linearidade 140
4.3 - Series Temporais 153
INTRODUÇÃO
Este trabalho tem como objetivo discutir os
Tópicos Clássicos de Econometria, mas dando também ênfase aos
conceitos de Probabilidade, Estatística e Álgebra Linear.
Os pontos abordados seguem a ordem tradicional.
0 Capítulo 1 ê destinado a exposição dos con
ceitos de Probabilidade e Teoria da Medida. Estes conceitos
são importantes para a compreensão dos Conceitos de Estatísti
ca.
0 Capítulo 2 segue introduzindo os Conceitos
de Estatística e testes de hipóteses.
0 Capítulo 3 apresenta regressões lineares e
os testes de hipóteses usuais.
0 Capítulo 4 aborda regressões não-lineares e
CAPÍTULO 1
PROBABILIDADE
1,1 - Introdução
Neste item se define formalmente o que vem a
ser uma medida de probabilidade P sobre um conjunto W. A
partir desta definição e da definição de variável aleatória,
também dada abaixo, enunciam-se os principais conceitos de
convergência num espaço dei probabilidade: convergência quase
certa, convergência em probabilidade e convergência em distri
buição.
A Lei dos Grandes Números de Tchebyschev e pro_
vada e enuncia-se, sem fornecer prova, o Teorema Central do
1-2 - Medidas Positivas e Espaços Mensuráveis
1.2.1 - Definição
Uma. coleção M de subconjuntos de W é chama
°" álgebra de W se possui as seguintes propriedades:
a) W 6 M
b)
Se
m 6 M,
então
m°
6 M
c)
Se
m ê a reunião
de
uma
família
enumerãvel
de elementos de M, então m pertence a M
Os m- são chamados conjuntos mensuráveis e W
e um espaço mensurável.
1.2.2 - Definição
Dado um espaço mensurável (W, M) dizemos que a
função
P:M
-»
[ü,
°°J
ê uma
medida
positiva
a-aditiva
se:
NOTA: c
m
ê o
conjunto
complementar
de
m,
ou
seja
b) PCU m.) = Z P(m.) onde
todos os nu são mensuráveis e disjuntos.
1.2.3 - Exemplos
Ex. 1: P: CÍN) -» [0 ,
6 1
PCn) =
tt2 n2
Ex.
2:
Medida
de
Lebesgue
Cem
IR
)
Sejam
a,
b 6 lK
tais
que
a < b:
Escrevemos
Ca,b)
= {x
6 IR
: a < x < b};
a medida de Lebesgue de Ca,b) é o número ÀCa,b) = b - a. Se
ja M a menor CT- álgebra que contem todos os intervalos Ca,b).
A medida de Lebesgue de um conjunto A ê o número
n n
UA.) = inf{E Cb. - a.): U Ca.,b.) 0 A}
É possível provar que
XCA) = supíXCK): K C A e K ê compacto}.
N0TA:Se
V m
6 M ? PCm)
<; » então,
P é
chamada
uma
medida
fini-ta.
oo 2
Z
-4-
= V
CKreider)
4.
1.2.4 - Lema
Se P e uma. medida positiva o - aditiva A C B
são
conjuntos
mensuráveis,
então
P(A)
<
P(B).
Demonstração
/
B = A UCB\A) =>PCB) = PCA) + PCB \A) =>
PCB.) > PCA) pois PCB \A) > 0
Temos também que se
A C B=>PCB\A) = PCB) - PCA).
1,2.5 - Teorema
Seja uma medida positiva P, então
a) PC0) = 0
b) se mi G m2... onde cada m. é mensurável, en
tao:
lim PCm.) -* PCU m. )
1
1
c) se mx o m2 onde cada m. é mensurável e
lim PCm.) -> PCÍ1 m.)
X X
d) Se os m- são mensuráveis, então
PCÜ
m.)
- Z
PCm.)
±=
X
i=i
X
Demonstração
a) Seja m tal que PCm) < °°.
m fl 0 = 0=>PCm.) = PCmU0) = PCm) + PC0)
donde PC0) = 0.
b) Se Bx = mi e B, = m, n m se k > 2.
K
K
k-i
Então m, = U B. ê a união disjunta dos
k
Então PCm,PCm,) ) == EE PCB.PCB.] )
k
i=i
1
Logo:
lim PCmk) = E PCBi) = PCU B±) = PCU m.)
c) Ponha B, = mi\m.
EntHo 0 = Bj C B2 C ...
Pov Cb) lim PCB.) > ;PCU B.)
?
PCB ) = P(m;1) - PCm, )
K K
Por outro lado,
U
EU
= U
(mj.flm?)
= mjíl
(U
mV)
oo oo
= mjnCO m.) = mj^Cn. m.)
oo oo
Então PCU B.) = PCmj) - PCíl m.)
Logo,
lim PCB.) * PCU B. )
implica, que:
lim PCmj) - ECnu) -> PCmx) - PCn mj.)
ou seja:
lim PCm.) -> PCn m.)
Í->oo i = 1
d) Note-se que PCA U B) < PCA) + PCB)
De fato:
CA
U B)
= CA
n Bc) U
CA°
n B)
U (A
íl B)
como os conjuntos do lado direito são disjuntos:
PCA
U B)
= PCA
íl BC)+
PCAC
fl B)
+ PCA
fl B)
<
pca
n bc)
+ pca
n b)
+ pca-
n b)
+ pca
n b)
n n
PCU m.) < E P(m.)
. _ 1 ~ «_ i
1-1 1-1
Ora,
k k
Z PCm.) = lim Z PCm.) > lim PCU m.) = PCU m.)
T - 1"~t «1 *_-L
i=i k^-00 1=1 i-i
Ra,sta tomar B,. = U m. , como B 3 B , aplicar (b)
K _ 1 K+ 1 X
1,2.6 - Integral de Funções Mensuráveis
1,2.6.1 - Definigao
Seja E um subconjunto qualquer de um espaço
mensurável CW, M).
Seja
a função:
Xv
: W
"*" íR
0 se x & E
1 se x 6 E
XE
ê
chamada
função
característica,
Seja s: W ->
n
s = £ «;L
onde os A. são subconjuntos enumeraveis e disjuntos de W. Cha
1 ~
ma-se s de função simples. Se os A. são mensuráveis, s e
uma função mensurável.
1.2.6.2 - Definição
Uma função real e mensurável se ela e o limite
pontual de funções simples mensuráveis. Decorre então que se
f é positiva e mensurável,existe uma seqüência ís }
n= *
tal que: a) 0 < Si < s2 < f
b) s Cw) converge para f(w)
para todo w quando n > °°,
1.2.6.3 - Definição
Dado um espaço CW, M) com uma medida positiva
\i, define-se a integral de uma função simples mensurável como
sendo:
n
s d\x - Z a. ia CA.)
1.2.6.4 - Definição
Se
f;
W "*"
[_Q,
°°J
ê uma
função
mensurável,
a
integral de f e definida como sendo:
f dy
= supí
a dy;
s é
simples
e
0
<
s
5
f^
1.2.6.5 - Definição
Se
f:
W "*"
L-°°5
°°0
é uma
função
mensurável
qua]L
quer, então a integral de f é definida como:
f dy
= í f+ dy - í f" dy
-L «a
onde f = max Cf,0); f = max C-f, 0), são funções mensuráveis
Diz-se que f é integrãvel quando ambos os ter
mos â direita da igualdade forem finitos.
1.2.7 - Teorema da Convergência Monótona
Seja, O&p M, P) um espaço mensurável com medida
10,
que:
a) f (w) < f (w) para todo w 6 W
b) existe fCw) = lim f (w) para todo w 6 W
Então
lim
f f
ridP -> f f dP
1.2.8 - Teorema da Convergência Dominada
Seja
f
: W >
£-°°,
°°3
uma
seqüência
de
funções
mensuráveis tais que para todo w 6 W exista f(w) = lim fn(w).
Se existir g: W * £0, °°] mensurável tal que
g dP < oo e j fn | < g então:
a)
[jf|dP
< oo
b)
lim
[ fn
dP
= | f dP
c)
lim
í|fn
- f|dP
= 0
1.3 - Variáveis Aleatórias
1.3.1 - Definição
Da,do um, espaço mensurável com uma medida posi
tiva CW, M, P) , diz-se que a medida P ê uma probabilidade se
PCW) = 1. Diz-se, então, que (W, M, P) ê um espaço de proba
bilidade e os m. 6 H são chamados eventos.
1.3.2 - Definição
Uma variável aleatória real (v.a.r.) ê uma furi
çao mensurável real num espaço de probabilidade.
1.3.3 - Definição
Dada uma v.a.r. X o seu valor esperado ê defi
nido como: EX = X dP
NOTA:
Esta definição de v.a.r. pode parecer redundante, mas ê
1.3.4 - Exemplo
Ê possível
que
P seja uma
probabilidade
e
que
a v. a. r. não tenha EX < °° .
Seja W = IN e suponha que P(X = n) = 6 1
2 n2 2 '
que
ê uma
probabilidade,
já que:
PC
IN)
= E
JL.
= l
2 9
1 = 1 "n n*
Contudo:
EX = XdP = ndP = E
i=i
n2
u2
tt2
i=i
n
0 seguinte teorema ilustra um ponto importante
sobre
as
variáveis
aleatórias
de
valor
esperado
finito.
1.3.5 - Teorema
Seja X uma v.a.r., temos:
Z
PC
|X
|
>
n)
<'
E i X |
<
1 +
E
PC
[X
1
>
n)
n=i n=i
se E|X| < »
oo
l PC|X| > n) =
n=i
Demonstração
Ponha AR = {n < | X| < n + 1} para n = 0, 1, 2 ... e
g
=
{ xA
+
+ XA
> * i X i.
A seqüência
g
-» | X |
n
Aa
An
n
e obedece âs condições do Teorema da Convergência Monoto_
na, logo:
| gn dP ^ | | X| dP
Por outro lado,
[gndP
= E } |X|XA.
dP
J X=QJ X
donde vem que:
E|X|
= £
f |x|Xa
dP
J
Ai
Trivialmente temos que:
nPCA)
n^
[ |x|Xa
F /\dP
<
(n + 1) P(A)
iio que acarreta que:
nPCA
n) <
ElXl
i i<
_1 + Ê
nPCA
n)
(*)
n-i
Temos que:
k k
E nPCAn)
= Z
n(P(|x|
>
n)
- P(|x|
>
n + D)
=
n=i n=i
k
E
PC|X|
>
n)
- k PC|x|
>
k + 1)
Ora,
{ |X|X
C|X|
>
k + l)aF
O lado direito da desigualdade tende a zero,jã
que pelo Teorema da Convergência Monótona, temos que
E|X|
= lim
(|X|
xMy,
. + n.dP
Então
£
nPCAR)
= E
P(|x|
>
n)
n=i n=i
oo
Finalmente,
se
E |'X | = °°,
então
l
nP(A
) = °°
de
(*)
n= i
k -k
Como £ nP(An) ;< i P(|X| > n) segue que
n=j " n=i
E PC |X | > n) = «o.
n=i
1.3.6 - Corolário
Demonstração
Se X > 0 e EX = 0
Então X = |X|.
Tomo r > 0.
Segue que rX > 0 e ErX = rEX = 0
oo
Pelo Teorema anterior £ P(rX > n) > 0.
Como PCrX > n) > 0 para n > 1 temos que
PCrX > 1) = 0.
Isto ê o mesmo que dizer que
PCrX = 0) = 1 CPois P(W) = 1)
Como por hipótese r > 0, então X = 0
Logo, PCX = 0) = 1.
1.4 - Seqüência de Variáveis Aleatórias e
Definições de Convergência
1.4.1 - Definição
Seja CW, M, P) um espaço de probabilidade;
Diz-se que:
a) X converge quase certamente para X
se Xn(w) -* XCw) para todo w 6 (W N) , on
de
PCN)
=0.
CX
9^Ç>
x)
n
b) X converge em probabilidade para X
se
lim
PCJX
- Xj
>
e)
= 0
para
n
qualquer
e>0.
CX
í>
X) .
Demonstra-se que convergência quase certa im
plica em convergência em probabilidade. Abrevia-se convergên
cia de probabilidade como plim P(|X - X| > e) = 0.
1.4.2 - Definição
Seja X uma v.a.r., a função F^: fR -> [0>ll
definida por FyCx) = P(X < x) ê chamada função de distribui,
ção.
Demonstra-se que:
a)
0
à
Fv(x)
A^
1
para
todo
b) x < y -> FYCx) £ FY(y)
Ccontinuidade pela direita)
e) lim Fx(x) = 0 e lim Fy(x) = 1
x>°°
1.4.3 - Definição
Dada uma seqüência de v.a.r. X , diz-se que
Xn converge em distribuição para X se F (x) -> Fx(x) em todo
n
ponto
X no
qual
Fv
ê contínua
escreve-se
(X
>X).
A chave para compreender-se convergência em
distribuição ê o seguinte resultado.
D
Demonstra-se que X^ > X se, e somente se,pa
ra
toda
função
f:
[R
-*- IR
contínua
e limitada
E fCXn) -> E f(X).
NOTA:
No Capítulo 3 apresentam-se exemplos de convergência em
1.4.4 - Teorema (Slutsky)
Se
Xn
> X e
Zn
P > c
(constante)
então:
a)
X_
+ Z_
^>
X + c
ZnXn
>
cX
1.5 - Lei Fraca de Tchebyschev e Teorema Central do Limite
1.5.1 - Definição
Uma família de v.a.r. F ê formada de v.a.r,
independentes se
pcx. e a. , v i e i) = tt pcx. e a.)
i e i
1
pa.:ra tqdo I finito e quaisquer A. mensuráveis, onde X. 6 F.
i.õ.2 - Lei Fraca dos Grandes Números de Tchebyschev
entre si tais que EX = O e E(X )2 = K < °° para todo n.
Então:
-^
CXX
+ X2
+ . . . X ) ->
0
n n
Demonstração
Usando a desigualdade de Tchebyschev
PC|X - EX| > e) < ~~ var X
e
Fazendo S = Xx + X2 + ... + X
tem-se que^ ES n = nEX, * = 0
var S = nK
Então
S
> e)
= P(|Snl
> ne)
)|
)
P(|Snl
5
- ~-
var
S
= -^-
K =>
> o
* n 2
0 Teorema que enunciamos a seguir é um dos re
sultados mais notáveis da Teoria da Probabilidade. Ele garan
te que quando temos amostras grandes, podemos considerar a
distribuição como sendo normal. Define-se uma distribuição
1.5.3 - Teorema Central do Limite de P. Levy
Seja,
X uma
v.a.r
tal
que
EX
= 0
e
EX2
=1.
Sejam X , X , ..., X independentes e Ídenticamente distribui
das como X. (Ver caso geral no Apêndice)
Então
í
C)
n2 (X
i+ X
2+ . . . + X ) -^>
nN [0 , l]
Corolário:
Seja X uma seqüência v.a.r. independente e
Ídenticajr.ente
distribuída
tal
que
EX
=0,
EXn2
<
°°
então:
n
Z X.
1 = 1
3
D
a) Ji : > Normal
n j
CE
X.2
)T
/n 2 X.
b)
í^i
-^>
Normal
Demonstração
a) Seja EX2 = o'
y
Então Y = _JL_=>e y = 0 E
cr
n n j n
E
X.
E
Y.
C-^-)7
E
Y
n i n i -, n
Z
CX.)2)T
CS
Y.2)"2"
^L_
E
D
3
n
Pelo Teorema Central do Limite
-i
n
E Y.) E Y
n j=1 D
Pela Lei Forte dos Grandes Números
n j
Pois, se os X. são independentes, os Y. também
~ P «
o sao, e se Y > c, dada uma f continua, demonstra-se que
P ~ «
fCY ) -> fCe). Ora, a função raiz ê contínua e usando o
Teorema 1.4.4 temos:
n
E X
3
CE.
X.2)Í"
/PT
E
n
= i
X
X.
2
O
n
Z
n
E Y.
n JJ
Y.2
i ^ 1
a
n
Pelos mesmos argumentos
APÊNDICE
Seja X um vetor aleatório p-dimensional tal que
EX = y
EXX1 = X
Então
f.d.p.CX|y,E) =
2 exp[
|-(X
- y)'
- y)]Diz que X e uma V.A. N (y, E)
Teòrema:
Seja
v = CXx , X2 , ...» X ) onde X. são v.a.r. independentes e
n
' n
n
1
A = cov v
n
n n
cov(Xx ,X2 ) ... covíX, ,X ]
n n n n
covCXj ,X
n
rn
cov(X n ,X nonde A independe de n
E vn = 0
Então n1 v.
CAPÍTULO 2
ESTATÍSTICA PARAMÉTRICA
2.1 - Introdução
Muitos estudos, experimentos científicos e in
dustriais produzem dados cuja analise e compreensão são de in
teresse dos pesquisadores. Em geral, esses dados podem se:?
modelados como o resultado de um experimento aleatório, ao
qual se tenta atribuir uma distribuição de probabilidades ade
quada.
Âs vezes, sabe-se qual a família de distribui
ções que ê a mais adequada â modelagem, mas não se pode deter
minar os parâmetros da distribuição.
Exemplo:
Tome um processo industrial que produza lotes
de N peças, das quais N.6 são defeituosas.(8 desconhecido).
Deseja-se tomar uma amostra de tamanho n pa
de-feituosas na amostra, tem-se:
( N9 . . N - N9 ,
pfi
[x
= k]
=
k
n - k
(N)
nonde, max (n - N(l - 9), 0) < k < min (N9, n)
Assim, pode-se determinar, no experimento aci
ma, a família de distribuições que modela o experimento
(hi-pergeomêtrica,
no
caso).
Porem, o parâmetro 9 é desconhecido.
A pergunta ê como determinar 6?
A resposta ê: Formula-se uma hipótese sobre o
verdadeiro valor de 9, e a validade desta hipótese ê testada
por um Teste de Hipótese. Neste Teste de Hipótese aceita-se
ou rejeita-se o valor atribuído a 9.
Na seção 2.2 introduzérn-se diversos conceitos
de Estatística e o Teorema da Fatorização. Em 2.3 abordam-se
as desigualdades de Rao-Cramer e de Bhattacharya.Na seção 2.4
se apresentam os Estimadores de Máxima Verossimilhança, com
suas propriedades de Consistência e Normalidade Assintotica.
Por ultimo, na seção 2.5 têm-se os Testes de Hipótese, Erros
fundamen-tal Lema de Neyman-Pearson.
2.2 -.Conceitos Básicos
2.2.1 - Estrutura Estatística
Seja T uma família de medidas de probabilida
de
num
espaço
mensurável
(X,<X
).
Na
linguagem
de
probabilidade
(X,tX
) ê o
con
junto de possíveis eventos, denominado espaço amostrai, e
CX,t/,i ) e chamada uma estrutura estatística.
Se T for um conjunto unitário, a estrutura es
tatística ê um espaço de probabilidade.
Em geral, T = {PQ ; 8 60}, onde
Cp
-0 e o espaço dos parâmetros; í.e., T e parame
trizada.
-01!£92 -» Pg ^Pfi diz-se que a
pa-rametrização e identificável.
Caso contrário, diz-se que ê não identificável
e dominada por uma medida a - finita V em (X,t/() se para tp_
das
as
medidas
PQ
S <P
existir
uma
função
L (xj
9)
de x
6 X,
tal que:
Pfl
CA)
=
L(x|0)y(dx)
V AeU
0
} A
onde a função L Cx|Q): X x 0 -> [O,00)
é chamada
função
de
verossimilhança
(F.V.).
Se
Pa
satisfaz
* t>
âs
condições
acima,
diz-se
que
PQ
ê
absolutamente
contínua
com
o
respeito a \\ .
Obs. : jj não precisa ser uma probabilidade.
2.2.2 - Estatística
Seja a estrutura estatística (X,tX,T ). Então,
uma
função
T:
(X,uí)
-*
(jR
, B ),
onde
3 é
a a
- álgebra
de
Bo-rel
de
IR
, é uma
estatística.
CV.
NOTA)
Ou
seja,
para
qualquer
Pfi
G*P
a estatística
T
e uma V.A. do espaço de probabilidade (X,tA, Pfl^*
- Sejam duas estatísticas T i : X -* Y e
T2 : X -» Y
NOTA;
A cr-ãlgebra
de
Borel
em
ÍR
é
gerado
pelos
conjuntos
são
Ti e T2 são chamadas equivalentes se o evento
A = {x
: Ti (x)
¥= T2 (x)}ei
for tal
que
PQ CA) =0 V 6 6 0
0
evento
A
é
chamado
t
- desprezível.
- Duas
estatísticas
Ti , T2
em
(X,tÁ
,*P
)
chamadas independentes se V pQ G T as V.A. Ti, T2 são inde
pendentes
considerando
o espaço
de
probabilidade
(X,c4,PQ).
- A
estatística
T
em
(X,tA,T
) ê
chamada
inte-grável
se
V P§
G ?
a V.A.
T
ê considerada
em
(X,t4
,PQ)
for
uma função integrãvel.
0 valor esperado de T associado a PQ ê repre
sentado por Eq T(.x).
2.2.3 - Estatística Suficiente
Uma
estatística
T:
X +
Y
e
chamada
suficiente
se para um dado valor da estatística T, a distribuição das
observações x independe de 6.
Ou seja, para qualquer A 6 1/1 , temos que:
independe de 0, i.e., o montante de informação sobre o verda
deiro valor de 0 em x é o mesmo disponível em T(x).
2.2.4 - Teorema da Fatorização - Como achar
uma estatística suficiente.
Seja L uma F.V. A estatística T: X -»- Y é
suficiente se, e somente se, existe uma função h - mensu
ravel, estritamente positiva em X e uma função gQ
3-mensu-rãvels
estritamente
positiva
em
Y,
tal
que:
L(x|0) = g CT(x)) « hCx)
Demonstração: Para o caso em que X ê finito ou
enuméravel.
C =>) Se T ê uma estatística suficiente, x 6 X
e T(.x) = t. Então, pela definição de Radon-Nikodyn
dp
L(x I 8 ) = i
dy
mas como X e enuméravel
dP,
= x)
Então,
L(x 6)
à\x
= P (£ = *)
D
Ç = x
= Pe CÇ = x;TCÇ) = t) =
= Pç ÍTCÇ) = t} PQ {Ç = x|T(Ç) = t} =
= gQ {TCx)} h(.x)
Ja
que
T(.x)
é
suficiente,
vem
que
h(x)
independe
de
(.<= ) Seja agora L(x|6) = gQ (T(x)) h(x)
Se T (x) = t e PQ'{T(Ç) = t} > 0, obtem-se:
PQ (Ç = x, TU) = t)
Pfl CÇ = x|T(.Ç) = t) = 6
PQ(T(Ç) = t)
= x) PQ (Ç = x)
P CTCÇ) = t) E Pfi (Ç= y)
y
y:T(y)
= t
ü
(t) . h (x) h(x)
E gfl(t)h(y) S , h(y)
y:T(y) = t y 6 T" (t)
E esta ultima expressão independe de 6 .
No caso geral, a prova dependera do Teorema de
2.2.5 - Estatística Completa
Uma estatística T ê chamada completa se para
qualquer
função
f: [R
* (Jv
mensurável
limitada
valer
que:
EQ f(TCx)) = 0; V 6 -> f(T(x)) = 0 q.t.p.
Conseqüentemente:
Pfi
ífCTC.x))=
0}
= lj
V
6
2.2.6 - Estatística Livre
Um
conjunto
A
6 J[
e chamado
livre
(com
respei
to
a uma
família
9={pQ:ee©}
de
medidas
de
probabilida
de
em
CX,tX
))
se
PQ(A)
não
depende
de
9 G 0.
A estatística
T : (X,
iA
) -* (Y,3)
é chamada
li
vre se a distribuição desta estatística não depende de 6 6 0.
Isto e, íx:T(x) 6 B} e um conjunto livre para todo B 6 3.
NOTA:
{f(.T(.x)) = 0; q.t.p} = PQ{f(T(x)) é 0) = 0;V6>
q.t.p = quase toda parte, isto ê, exceto num conjunto de
2.3 - Teoria de Rao-Cramer
2.3.1 - Estimadores não-viesados de mínima variância
Seja CX, i/C ,r ) uma estrutura estatística e
uma função de 0 no (R .
A estatística
t
com
valores
no
[ft
e um
es
timador não-viesado CENV) de t se:
EQ tCx) = xC9) V 9 G 0
supondo que x tenha distribuição Pg.
Seja A. a família de todos os ENV de t , t é
cha,mado (^stimador não-viesado de mínima variância (ENVMV) se:
var0 t $ var@ tl;V0e0,t'eA.
2.3.2 - Teorema (Unicidade do ENVMV)
Sejam tx e t2 dois ENV da função t com va
riância mínima.
Então tjCx) = t2(x) qtp
Pe {t x(x) = t2(x)} = 1; V 6 0
Demonstração:
Para todo 0 6 0, faça t3 = -~~(.t 1 + t2),
v = varQti = varQt2
Ora, t3 e não viesado, logo v ^ var t3.
Por outro lado:
FUNDAÇÃO GETÚLIO VARGAS
TÓPICOS CLÁSSICOS DE ECONOMETRIA
DISSERTAÇÃO SUBMETIDA Â CONGREGAÇÃO DA
ESCOLA DE P(5S-GRADUAÇÃO EM ECONOMIA (EPGE)
DO INSTITUTO BRASILEIRO DE ECONOMIA
PARA OETENÇAO DO GRAU DE
com
respeito
a uma
certa
medida
y em
(X,tX
).
Considere também um estimador não viesado t da
função t .
Suponha que L, t e. t satisfazem âs condições
de regularidade:
1) { x: L(x|0 ) > 0} V x, v 6
2)
L(x|9
) é diferenciavel
com
respeito
ao
e:
j t(x)
L(x|6)
y(dx)
= | t(x)
^-
L(x|9):y(dx)
d
d9
X X
3)
t é diferenciavel.
Teorema: Satisfeitas as condições acima, se t
e um ENV de t com segundo momento finito, então:
lnL>
a igualdade
se
verificando,
se
e somente
se,
^j-
In
L = A (9)
[t(x)
- T(0)]
y q.c
para uma certa fundão A (9).
NOTA:
q.c = quase certamente se, exceto no conjunto onde a me
Demonstração
dPfi
r r
(D
I
L(x|e)
y(dx)
=
X
(2)
í t(x)
L(x|e)
p(dx)
= EQ t(x)
= x(9)
V9
X
Derivando (1) e (2) em relação a 6 temos,
Í3_Ldvl=í_l___9:LLdí
J
ae
J
l
ae
J
a In LXX X
X X
Então,
T ' - í tfv^
9ln
L
,fll
í 9 In
L . .
x - ttx; - L dy - x v.8 ; L dy
J 96 J 99
X X .
x1
= { [t(x)
-t(6)]
*j!l±
L dy
X
Aplicando a desigualdade de Cauchy-Schwarz pa
ra
integrais
â última
integral
e representando
L =
/TT
* ^~L.
[t'(0)]2
<
í [t(x)
-t(9)J2
Ldp
. í (ilTLii)
l dy
X ' X
(O)]2
< var
t . E ( AiH
o 8 ae
In L( x I 8)' e r. t|t(x) \ - t(6)J ,Ovi
3 9 U -+
forem
paralelas
no
espaço
vetorial
das
funções
de
x,
ou
seja
8'3 6 L(X|9)
= A(8)
jt(x)
- t(6)1
para um certo valor de A(e).
Finalmente:
varn t
2
e 2
0 39
°
0 lado direito da desigualdade e o limite in.fe
rior para a variância do ENV.
0 estimador que atinge este limite é chamado
estimador eficiente £EE) .
2.3.4 - Corolário
Para que o ENV da função t seja EE, é necessá
rio e suficiente que
L = A(8)
[t(x)
- T(0)l
Demonstração
A primeira afirmação decorre da definição de
EE e da desigualdade de Cauchy-Schwarz.
A segunda decorre da igualdade ja demonstrada:
t' = f [t(x)
J- t(8)]AIELÍí
8 9L ÚM = f A(8)[t(x)
J- t(6)]2
L á]i =
X X
= A(8) . varQ t
2.3.5 - Exemplos
Seja x = (xl, x2, ..., x ) e as observações
x1? x2, ..., x independentes cada uma com distribuição
N
[8,a
2 i c°m
variancia
a
conhecida.
A função
densidade
de
cada observação e da forma:
(v ~9)
2
4
p
2
Neste caso,faça:
L(x|6)
= tf f(xj6)
j
= a-n(?TT)2
2exp{
p
,,Z
nnZ
(xv
(x
-8)
8)
}
2
-5-
In
L = -
(x - 6)
onde
x = -4-
?
x,
Esta
igualdade
é
da
forma
A(6) =
t(x) =
t(6) =
n
a2
X
e
d In
39
L = A( 6) [t(x)
Então x e o EE.
Fazendo o mesmo raciocínio para xl5 x2, ... x
com
distribuição
N
[ y,8
j,
y
conhecido,
chega-se
a:
A(g)
= -^r
n
t(x) = £ (xk - y)
k=i
= 62
0» O xx»
-Assim se obtém um EE para 8 , mas nao ha um
EE para 6 propriamente dito.
É intuitivo que se t e um EE de t , então
2.3.6 - Desigualdade de BhattacharyaC Caso unidimensional)
Pode-se achar um maior limite inferior para a
variância do ENV, caso não exista o EE em 2 . 3 . 3 .
A
condição
para
existência
do
EE
é
que
In
L
= A(6)
|t(x)
- t(6)]
.
86
Caso isso não aconteça, e possível que exista
estimador onde [_t(x| - t(8) 2 seja uma combinação linear
das funções: 1 L L 86 1 L
82
88 L.2 ' "
1
L
8S
L
8es
Para simplificar, chame:
f| T
86*
36K
Suponha validas as mesmas condições de regula
ridade impostas em 2.3.3, e também que a função L admita de_
rivadas ate a ordem s.
Tcorema: Seja t um ENV de t
Então:
s
onde
e os coeficientes Ci = CAQ) são determinados pelo sis
tema :
Se a matriz A = {a..} for inversível e
A"1
= {a13},
então:
var
t > f
a^
^
x^
(3)
iji
A ultima expressão e chamada desigualdade de
Bhattacharya.
Tem-se"a igualdade se, e somente se:
t- - t(9)
= ZS
C. ^
(4)
para certos C. = C. (e).
Jl JL
Demonstração:
A. Lema: Seja a, ai, ... a_ s elementos de um
certo espaço vetorial com norma e produto interno tal que
1/2
Então
s
| a
|2
>
E
(a.,
a.)
C. C.
(5)
13=
3
X
3
onde os C. satisfazem ao sistema:
E (a^, a.) C. = (a, a.) (6)
A igualdade em (5) ocorre se, e somente se
s
C , para certos Cj , . . . , C
De fato, seja V o espaço vetorial gerado por
s
a ,>«£. e, 3 = projv a = E C^ a.
1 i= i
a projeção de V neste espaço.
Entãoj
|a|2
> |B|2
=(ES
C.a.5ES
C.
a.)
= ES
(a,a.)
C.C.
i=i
1 1 j=i
D :
i,j=i
3
X
3
que é (5).
Como (a - g) _J_u. V. , resulta (6) (que nada mais e que
a equação matricial de Gram).
E |a| = |6| se. e somente se a P. V o que implica (?)*
B. Para um valor fixo do parâmetro 8 considere
(ç, n) = Efi (ç, n).
T 1
Ponha a = Ct - t (6 )) e a . = -=
Então,
por
definição
|a|2
= var
tfl
e
ECa , cx-j_) = t pois, pelas igualdades
que seguem,:
j LCx|Q)
\x (dx)
= 1
j t(x)
L(x|6)
y (dx)
= x (6)
X X
Derivando-se:
J L
X X
Ou seja;
. = 0
Donde Ca ,a.) = EA t a. - t(6) Eq a. = t1
10 1 Dl
C. Falta apenas provar que o lado direito de
Cl) e de (3) coincidem' quando A for invertível.
Escreva c = (c , c , . .., c ) e
12 o
T
= (T1,
T2,...,
TS).
que varQ t > (Ac, c).
Mas
"1
CAc,
c)
= (t,
A"1
t)
= (A"1!,
t)
= E
2.4 - Método da Máxima Verossimilhança
2.4.1 - Estimador de Máxima Verossimilhança
Um método útil para se conseguir estimadores
com boas propriedades e o da máxima verossimilhança.
0 = 0
(.x)
ê chamado
estimador
de
máxima
verossi-milhança (EMV) se:
LCx
| 9)
^
L(x|6)
v
6
Se
0 6 [Rs,
e se
para
qualquer
x 6 X
a
F.V.
L
Cx
| 0 ) for
diferenciãvel
com
respeito
a 0,
atingindo
o máximo
num ponto interior a 0, então o EMV 0 satisfaz:
Se
o EE
do
parâmetro
8
existir,
ele
pode
ser
obtido
pelo
método
da
máxima
verossimilhança
para
s = 1
sem
pre.
Pois neste caso:
= AC9)
[t(x)
- 9]
39
No caso geral, quando a estrutura estatística
admite
uma
F.V.
e o EMV
for
único
para
cada
realização,
então
o EMV 6(x) depende de x através de uma estatística suficiente
T(.x).
Pois,
pelo
Teorema
da
Fatorização
se
existir
F.V.
e
T(.x) for suficiente, ter-se-ã:
L(x|9) = gQ (T(x)) .
h(x)-pela definição de EMV em:
L(x|9) = g" (T(.x)) . h(x) > L(x|9)
e,
como
o máximo
é único
para
cada
x,
conclui-se
que
9 depende
de x através de T(x).(x fixo => T(x) fixo => 3 8 que maximiza).
Exemplos
1) Suponha que x = (x,x ,...,x)
í 2 n
Então:
'L(xle)
= ir
-
exp
{-= i cr
Sejam y e q os parâmetros desconhecidos
Cy,a)
= cei,
eo
e fR
x ÍR+
= o
L = 0 em toda fronteira de 0, logo o máximo ê
interior.
In L =
2S
(x
Ç- y)
= 0
3a
Os EMV são então:
k=i
L = Z_J2 + _L_ e (xv - y)2 = O
-> -, n
y = x = E x,
n
k=i
k
n
E (x, - x)
k=i
2) Suponha agora que x = (x , x ,... x ) e que
x , x , ... x são vetores V.A. com distribuição N (i.e.,
í ' 2' n r
normal multidimensional).
Então 0 = (y, A):
H6,
r
i
1 (2n)?|A|Í
Í
exp
{ - _I_
2
(A
* (x,-
y ) , x,-
y )}
- - n
2
i
= (2TT)
|A|
exp{--^-E
(A
* (x,
- x)
,x,
- x)
+
v ~i
- -4J-
CA"1 Cx
- y),
x - y)}
O máximo
de
L(.x|6)
depende
deCA"1
(x
- y),
x - y),
que
de
pende de y. Como A Ce, portanto, A~ ) é positiva
semi-definida, o mínimo ocorre em:
n
n
k=i
k
n _ ,
Faça. A = £ (x - x) (x, - x)
n
k=i
k
k
Levando em conta que (a,b) = tr ab' se a e b são veto
res coluna, tem-se que;
n
-í
-
-
n
X
CA
Cx
- x),x
- x)
= i
tr(A
J . (xv
- x)
. (x,
- x)')
k=i k=x k k
n
= trCA"1
X
Cx
- x)(.x,
- x)')
= n tr(A-1
A)
k.= i
k
k
nr _ _n_
Logo,
L(x|y
, A)
< L(x|y
, A)
É
necessário
mostrar
que:
...'LCxlu,
A)
<
,L(x|y
,A)
para toda A positiva semidefinida.
Tomando o logaritmo. na ultima desigualdade:
- -2-
ln|A|
- -ü-
tr(A"x
A)
< -^-
ln|Â|
- -2-
tr
Ir
2 2 2 2
qu seja
lnjA"1
A| - trCA"1
A)
+ r i 0
Como A e A são matrizes positivas semidefinidas, vale es
crever:
A = B2
j A
= B2
onde B e B são matrizes simétricas.
Ponha
C = CB"1
B)
x
(b"1
B)
e esta
também
é matriz
posi
tiva semidefinida.
Se
f ê
uma
função
numérica
da
matriz
A
da
forma
fCA)
=
|A|
ou
f(A)
= tr
A
então, f(AB) = f(BA).
In
ICI -
tr
C + r
<
G
ou
r.
E Cln X:.. - X: + 1) £ 0
1
onde \. sao os auto-valores da matriz C, pois
i C | =' X í X 2 ... A r tr C = X 12 ' + X + . . . + X n
Como X^ f* 0 e In x £ x-1 x > 0, ; a desigualdade
se verifica e:
.. _ "£ n
= C2Tre)
2.4.2 - Estimadores Consistentes
Seja x , x ... uma seqüência de resultados de
1 2
observações de um evento.
Chame t = t Cx , x , . . . ,x ) o estirnador do
n n i 2 n
parâmetro construído a partir das n primeiras observações x ,
A « » * yV
2 n
0 estimador t depende do numero de observações,
lim P { jt - 6 | > e } -> 0
n
*
oo
°
n
No caso geral, quando se estima a função t(6) a
condição ê análoga:
lim
PQÍ
jt
-
tC8)
n -*- oo ° n
2.4.3 - Consistência do EMV
Suponha, para cada inteiro n > 1, a F.V.
LCx|6) = L n Cx|9) tenha a forma:
L Cx|9) = f(x |0) . f(x |6) ... f(x |
n ' i ' 2 n
O que quer dizer que a V.A. x. são iid. com densidade f(yj9).
A família de distribuições Ffi das V.A.s x. para
0 G 0 ê. dominada por uma certa medida y e
fCy|9)
= f
Cy)
"Caso onde 0 seja um conjunto finito."
As seguintes hipóteses são necessárias:
Al: 0 conjunto Y = {y: f(y[0) > 0} não depende de 0.
po-sitivos.
A2: 6! = 62 <==> f Cy J6a ) = f(y|62) q.c. com respei
to a medida \\.
f(xj
|6o
)
A3:
Existe
EQ
lrii
= \|»(e|e0
) =
i|K0)
00
fCxJO)
onde 90 6 0 .
A4: Para cada inteiro n > 1, o EMV 6 ê único q.c,
- n ^
Satisfeitas as condições anteriores:
Teorema
lim P {0 = 0O } -»- 1 onde 90 é o verdadeiro
n -> oo °o n .
valor de 0 .
Corolário
Se A.3 valer V 0O 0 então
lim PD{9 = 6}
o n
n -> «>
-isto ê, o EMV 0 ê consistente
n
Demonstração:
A demonstração serã dividida em três partes
i|»(6) -O VeSO e que
il> ce) = o <=> 6 = e0 .
Usando a desigualdade de Jensen com
gCx)
= -
lnCx)
x 6
fR
|
Faça
fCxje)
f(xi|eQ )
É obvio que
(e ). = e ín = o <=> e = e0 e
i |eQ
)'
f(x.
|e)
f(x,
)} E { l()} l(E
|Q | , |
« {inC -)} = EO { - ln( )} > - ln(EQ ) = 0
v0
j
e
eC)
«
v0
fCxje)
eo
fCxje,
)
pois
= í iMLL.
fCy|e0
) U(dy)
= 1
J
fCy|e0)
Y
2. parte - Faça
n
(6 ) = -^L-
nX
nIn
fCx |60 )NOTA:
Desigualdade de Jensen
Se
Ç ê uma
V.A.R
e ip uma função
convexa
no
fft
então
Como E Ç C9 ) = \\> (0 ) pela Lei dos Grandes Nume_
ros, jã que Ç ê uma variável aleatória e
lnCx) ê uma função contínua, tem-se que
Se 8 *=£-- 0O e, portanto, ip (0 ) > 0, então
V a !> Q
3 N ta,l que:
PA { 6: Ç (0) > 0> > 1 - a
©o n
para n > N.
Como
0
ê
finito,
podemos
dizer
que
isto
vale
para todo 9 =f= 0o .
3. parte - Faça por comodidade P = Pfi e
AnQ =Í0: Çn(6) > 0)
Como 0 é finito, suponha |0| = m.
Ora,
K
n(0
n) = -^-
(L
n(x|8o)
- L (x|0
n ' n))
Mas 9 maximiza L (x 0), então
n n
í (0 ) < 0.
n n
Note que í (0 ) = 0 <=> 60 = 0
= p(çnce) < o) < pcç cê) < o)
<
pc
y
í cê)
<
o)
= pc
u
a Qc)
n
"
e^e
n6
<
Z
PCA
AC)
= Cm
- Da
e*e
n6
Como
a
é
arbitrário;
PC8
=7^ 60
) +
0
quando n
2.4,4 - Normalidade Assintotica dos EMV
Dão-se aqui as condições sob as quais o EMV 0
e assintoticamente normal.
Isto ê, a distribuição de V.A.
- 9) > NCO, AQ)
Suponha novamente que para qualquer n > 1;
LCx|0)
= L
Cx|8)
= fCx
|6)
fCx
|0) ...
f(xn|6)
Façam-se as seguintes hipóteses:
Al: A função densidade f ê definida em Y x 0
A2:
0
é um
conjunto
convexo
A3:
A
F.V.
atinge
o máximo
global
num
ponto
interior.
A4:
0
né consistente;
»plim
-f6=6
n oA5:
A função
fCy|e)
ê duas
vezes
diferenciavel
no
ponto
0 = 0Q dentro do sinal de integral, isto ê:
rf-
í fCy|6)
y(dy)
= í
-?-OD1 ) ) dü i
í fCy|8)
ViCdy)
= í
3l__f(y|6)
vCdy)
J
J
90
36
v 39 , i J 30 30
^ D Y Y i j
para 0 = 0o
A6: Se
FCxi|9)
= -ÍÍ
In
2
ln
302
30Í
96
então
|0O')|
|
<
c(Xl
|60)
g(6|e0)
com
c(xí
|0o
)
>
0
e
EQ
cCxj
160
)
<
~
.
onde
g (6
| 9Q)
é contínua
com
respeito
a
0 no
ponto
0o
A7: A Matriz Jo = J(9o ) ê inversível onde
- {E
(9ln
f(xil6)
. 3ln
f(xil6)
6
dQ±
86j
Teorema:
A
distribuição
da
V.A.
/n(6
- 8o
)
tende
a, distribuição
N
CO,
Jq"1)
quando
n -* °°.
s
.e. :
lim
Pq
{/n~(e
- e0
) < u)
*
P(Ç
< u)
onde
N (0, Jq ) e u 6
Corolário: Se A5 - A7 são validos V 6 £ 0,
então
lira PQ{/nCe - 6) < u> -» P(Ç < u)
o n
n -> °°
Demonstração
1) Ponha:
gCt) = uCx jet);et = et(x) = d - t)e0 + te
onde
In
5 5 )
301 302
Então:
gQ) = uCx,
38 = 0
gCl)
= gCO)
+ jg'.Ct)
dt
Logo
uCx|0Q ) = gCQ) = - I g'Ct) dt
Faça agora:
w(x|0) = = nE F(x, , 8)
k
A =
n
w(x|9t)dt
Como
g'Ct)
= -£_
uCx|0t)
=
-~
d0= w(x
I et)
(0
- 0o )
tem-se integrando que:
uCxJ0Q) = - n
-i-
[ wCx|0t)dtl
wCx|0t)dtl.
(8
u(x|60
) = - A /7T(6
- 6o
)
n
0 lado esquerdo da expressão anterior ê da forma:
uCx|6
n fCxn n k=i 96
_ ç
°
pois
36
In
fCy|60
)
f(y|60
) u(dy)
=
f
f(y|60
)
y(dy)
=
{ f(y|
1 = 0
Então, de acordo cem o Teorema Central do Limite, a
Y.A..
uCxle0)
=
n (Ç, - Efi Ç,k
e°
k
converge para uma distribuição normal multivariada
N CO, Jo ) quando n -y °°, pois as V.A. £. são iid e
S 1
60
?1
var. = E
2) Mostra-se agora que
-J,
De fato, faça,:
A°
= ~n
Como
A
= A.o
+
(A
- Ao
) , basta
que
Ao
->
- Jo
e que
CA - AQ ) -* 0
Ora, pode-se escrever:
1 n
AQ = £- Z ^ nk onde n, = F(x J60
Os x\, são Cmatrizes) V.A. iid e
Kfl
Hi
- ~ Jo
Cserã
demonstrado
adiante).
Pela Lei dos .Grandes Números:
An
-£->
J,
Ao ' <J 0
De CA6) tem-se
i 1
|A - Aa|
<
\-j~
J wCx|9t)dt
- -i-
í w(x|80)dt
Q 0
1
wCxle^.) t - w(x|e0 ) dt <
o
< E |FCx |6 ) - F(x |00)|dt
k= i *
1 n
í1
< -j-p-
s
c(xk|e0
)gce
|e0
)dt
= anBn
=i J Q
onde
a
=±
2
cCxJe0
)
n n
k=i
k
P P
Basta mostrar que a >const e . 3n > 0.
- P
Pela Lei dos Grandes Números cx > const, pois
cCx.
| ©q
) são
iid
Cpois
x.
são
iid)
e têm
primeiro
mo
mento finito.
E
g
é uma
função
contínua
dos
pontos
0 6 0
pois
Ve>053ô>0
tal que
0
<
gO
190
)
<
e
se
|Q
-
9q|
<
ô.
Em
particular,
g(6.
|9o
) <
e
quando
j 9 -
0oJ
<
<5,
ou
seja
0
<.
3^(9)
<
e
quando
|9 - 90| < <5.
Como 0 é consistente:
n
3) Prova-se agora que E rii > - Jp 6 o
De CA5)
32
du
-
f
Tf 9 ln
f;
y
i
j
i
Jln f ±ln f
30 30 30 39
i- j i j
]f
39.
3 In f 3 In fi
^7 ^7 J
Então para 9 = 9r
ni = - Jo
Considere as seguintes afirmativas
" * P
A) Se uma seqüência de matrizes aleatórias A > I
então
A"1
n>
I.
se uma seqüência de vetores Ç é assintótica normal
n
NCO, B)
Então
A
K
e assintoticamente
NCO,
A BA*)
Então como Jo ê invertível
- Ao"1
>
-Logo
/nC8n
- 0o ) = -A
x-i-
n(x|60
)
/n
tende
para
N (0,
sJ^1
Jo
J^"1
' ) = N (0,
s2.5 - Teste de Hipótese Estatística
2.5.1 - Hipóteses
Seja
C^,
cX
,*P
) uma
estrutura
estatística
e
X: Í2 -> |R uma V.A.R. com distribuição Pn G T . Deseja-se esti.
mar o verdadeiro valor do parâmetro 8, usando para isso o va
lor observado de x da V.A.R. X.
Para
isso
estabelece-se
um
teste
de
hipótese.
Tome (J; o espaço dos parâmetros e considere as seguintes
Ho : 6 S 0o (hipótese nula)
Hj: 9 6 0i (hipótese alternativa)
onde
0 = 0q U 0i Cunião dijunta)
Uma hipótese H^: 6 G 0^ ê dita simples se
0- for um conjunto unitário e composta, caso contrário.
Um teste de hipótese ê uma regra de decisão
que consiste em aceitar ou rejeitar Ho.
De uma forma geral, um teste e uma estatística
que toma valor 0 ou valor 1, conforme aceita-se ou rejei
ta-se a hipótese nula. Mais adiante haverá necessidade de
considerar-se
testes
randomizados,
onde
a
estatística
atribui
rã
uma
probabilidade
de
rejeição
â hipótese
nula.
Usar-se-á
a
notação
c|> (x)
para
a
estatística
do teste de hipótese.
A função $ e chamada função crítica e o con
junto dos pontos tais que:
C = { w 6 fi / <HX(w)) = 1}
A seguir se apresenta o exemplo de um teste.
Exemplo:
Suponha que um novo remédio deva melhorar a ta
xa de recuperação dos enfermos de uma certa moléstia.
A hipótese nula é que o remédio não faça ne
nhum efeito.
Suponha que a proporção passada de recuperação
tenha, sido de 00 =0,2.
Então:
HQ : e0 =0,2
Ei : 6Q > 0,2
Ora, se deve tomar uma amostra de n enfermos .
S ê o
numero
de
pacientes
que
ficam
bons
na
amostra.
Se
n -> °°,
S tem distribuição binomial ê(n, 0).
Neste
exemplo
©
=
[6q
, l]
e 0q é simples e 0i composta.
Ê" conveniente, neste caso, trabalhar com um in
dicador.
'l
se
S
>
k
A região crítica ê o conjunto ík, k + 1,. . .. n}
subconjunto do espaço amostrai.
{1,2, ... n }
2.5.2 - Tipos de Erro
Um teste pode induzir que se suponha que o pa
râmetro 0 tenha um valor diferente de seu verdadeiro valor
0o Existem dois tipos de erro.
Erro do tipo I - rejeitar Ho quando Ho é vali
da.
ã ê
Erro do tipo II - aceitar Ho quando Ho não ê v£
lida.
Aceitar Ho
Rejeitar Ho
Ho é
verdade
não ha
erro
erro
tipo I
Ho ê
falsa
erro
tipo II
não há
erro
pode incorrer nos dois
pos de erro simultaneamente.
a =P(erro
tipo
I)
= PCrejeitar
Ho
| Ho
verdade)
3 =PCerro
tipo
II)
= PCaceitar
Ho
| Hi
verdade)
Cada teste tem valores a, 3 a ele associados,
e não ê possível minimizar ot, 3 simultaneamente. Na medida
em que aumenta a região de aceitação de Ho aumentando 3, redu
zo a de rejeição diminuindo o, e vice-versa.
Exemplo 1:
Suponha Xi, X2, ..., X9 uma amostra de V.A.
normais com cr = 1.
Seja Ho : y = 2
: y = 3
Usando o EMV X para estimar y.
Seja o teste (não randomizado) aceitar
Hq se x 5 c e rejeitar se x > c, onde
2 < c < 3.
3
a
de Ho , aumentando c, diminuindo a, mas aumento 3.
Exemplo 2:
No exemplo de 2.4.5.1
kl
S
("
) 6p Cl
- 60V~
i=k
:
pel>k(x)
= o]
= p6cs
< k>
k-i .
t
C?
) e3(i
- Q)n~1
3
2.5.3 - Poder de um Teste e Função Potência
Um teste não randomizado associa a cada valor
possível de x G X uma decisão do (aceitar Ho) ou di (rejei
tar HQ ) .
Seja ô(X) a regra de decisão, função da obser
vação, Xq região de aceitação, Xi região crítica.
XQ U Xi = X
Como dito anteriormente, não ê possível minimizar a e 3
Então, é" comum arbitrar 0 < a < l} que é cha
mado nível de significância:
P0{ôcx)
= di>
= pQíx
e
xi>
<
a
V
e e
©o
e então minimizar 3:
PQ{<S(X) = d0} V 6 6 0i
que
ê o mesmo
que
maximizar
PD{<5CX) = dj = PQ{ x 6 Xi } V 6 6 0i
Chama-se:
F(9) = PO{<5(X) = dJ- V 9 G 0
de função Potência.
Chama-se Pe{ôCX) = dj com ÕG 6,
de poder do teste contra a alternativa 6. Ou seja, dada a hi
põtese alternativa o 6 0, , o poder do teste nos da a probabi
lidade de, sendo verdadeira a hipótese alternativa, ela ser
aceita.
Exemplo:
No exemplo de 2.4.5.1 a função potência é:
FCe)
=s
(n ) eDci
- e)n~j
v e e [0,2.
( *? )
eD(i
- e )n
D
e e (0,2;
íj
j=k
3
Dado um teste randomizado, a probabilidade de
rejeição de Hq quando X tiver distribuição P ê:
E. (j) (X) = <}> (x) dPQ (x)
tí J O
a probabilidade condicional <j) (x) de rejeição dado x, integra
do com respeito â distribuição de probabilidade de X.
0 problema ê selecionar <í> para maximizar a furi
ção potência.
Eg <kx) v e e ei
sujeito a
eo D <kx) < a v e e 0O
Em alguns casos acontece que o mesmo teste $
maximiza a potência para todas as alternativas em ©i , mesmo
quando ha mais de uma.
Neste caso, <j> ê chamado teste uniformemente
mais poderoso CTUMP).
Para o caso de duas hipóteses simples, temos o
2.5.4 - Lema Neyman-P, earson
Sejam
Po
e Pi
distribuições
de
probabilidade
com
densidade
p0
e pn
, respectivamente,
com
respeito
a uma
me
dida Csem
perda
de
generalidade,
pode-se
admitir
y
= Pj +
P2).
i)
Existência:
Para
testar
H:
p0
contra
a
al
ternativa K: pj existe um teste <|> e uma constante k tal que:
Eo <f>OO = a (1)
1 se pa Cx) > k po Cx)
(2)
.0 se p! Cx) < k Po Cx)
ii) Condição suficiente para T.U.M.P.
Se um teste satisfaz Cl) e (2) para algum k,en
tão
ê o
T.U.M.P.
para
testar
p0
contra
pi
no
nível
a.
iii) Condição necessária para T.U.M.P.
Se
<J)
é T.U.M.P.
no
nível
a para
testar
p0
con
tra pi , então para algum k ele satisfaz (2) q.t.p. y.
Também
satisfaz
Cl)
a menos
que
exista
um
tes
te de tamanho <; çx, e potência 1.
Qbs: Tamanho de um teste é definido como: