Tópicos clássicos de econometria

(1)

TESE

DE

MESTRADO

APRESENTADA

À

EPGE

t=»OR :

(2)

DA FUNDAÇÃO GETULIO VARGAS

PRAIA DE BOTAFOGO, 190/10.0 ANDAR

RIO DE JANEIRO - BRASIL - CEP 22.250

CIRCULAR N9 50

Assunto; Apresentação e defesa pública

de Dissertação de Mestrado em

Economia.

Comunicamos formalmente â Congregação da Escola que

está marcada para o dia 16 de setembro de 1987 (4a. feira) ãs 15:00h,

no

Auditório

Eugênio

Gudin

(109

andar),

a apresentação

e defesa

pú

blica da Dissertação de Mestrado, intitulada: "TÓPICOS CLÁSSICOS DE

ECONOMETRIA", do candidato ao título de Mestre em Economia, ALEXAN

DRE PORCIÚNCULA GOMES PEREIRA.

Anexamos uma súmula dessa Dissertação de Mestrado pa

ra seu prévio estudo, recentemente,através da Circular n? 49.

A Banca Examinadora "ad hoc" designada pela Escola se

rã

composta

pelos

doutores:

Antônio

Carlos

Porto

Gonçalves,

Sérgio

Ribeiro da Costa Werlang e Carlos Ivan Simonsen Leal (Presidente).

Com esta convocação oficial da Congregação de Profes

sores da Escola, estão ainda convidados a participarem desse ato

acadêmico os alunos da EPGE, interessados da FGV e de outras insti

tuições.

Rio de Janeiro, 04 de setembro de 1987

írio Henri monsen.

Diretor da EPGE.

A-4 Formato Internacional

(3)

LAUDO SOBRE DISSERTAÇÃO DE MESTRADO

Como membro da Banca Examinadora, designada pela

EPGE para julgar a Dissertação de Mestrado intitulada, "TÕPICOS

CLÁSSICOS DE ECONOMETRIA" do candidato ao título ALEXANDRE PORCI

ÚNCULA GOMES PEREIRA, apresento as seguintes ponderações que jus_

tificam meu parecer e voto:

1) 0 candidato apresenta uma tese de elevado rigor

e clareza, a qual contêm uma inovadora apresenta

ção da Teoria das Séries de Tempo.

2) Ele apresenta tópicos pouco divulgados na litera.

tura de econometria brasileira, como a estatísti_

ca de Portmanteau.

3) Ele fornece uma excelente digressão sobre os fun

damentos estatísticos da econometria, voltando

aos fundamentos da Teoria da Medida.

Assim e nestas condições, sou de parecer que a re

ferida Dissertação seja aprovada e outorgado o título pretendido

pelo candidato e autor deste trabalho.

Rio de Janeiro, 16 de setembro de 1987.

Sérgio Ribeiro da Costa Werlang,

Professor da EPGE .

(4)

DA FUNDAÇÃO GETULIO VARGAS

PRAIA DE BOTAFOGO, 190/10.° ANDAR

Como membro da Banca examinadora, designada pela

EPGE para julgar a Dissertação de Mestrado,intitulada

"TÕPI-COS CLÁSSICOS DE ECONOMETRIA", do aluno ALEXANDRE

PORCIÜNCU-LA GOMES PEREIRA, julgo que a referida Dissertação seja apro

vada e outorgado o título pretendido pelo candidato e autor

do trabalho, visto que demonstrou bom conhecimento no campo

de estudo de sua Dissertação, o que se traduziu num trabalho

claro e rigoroso.

Rio de Janeiro, 16 de setembro de 19 87

JTONIO CARLOS PORTO ÇÒNÇALVES,

Professor da E

(5)

Como membro da Banca Examinadora, designada pela

EPGE para julgar a Dissertação de Mestrado intitulada, "TÓPICOS

CLÁSSICOS DE ECONOMETRIA" do candidato ao titulo ALEXANDRE PORCI^

ONCULA GOMES PEREIRA, apresento as seguintes ponderações que jus_

tificam meu parecer e voto:

1) 0 candidato possui ótimo conhecimento no campo

da sua dissertação, fazendo nesta um apanhado

geral das idéias fundamentais e avançadas da

E-conometria, bem como uma excelente apresentação

da Teoria das Séries de Tempo.

2) Sua tese apresenta tópicos pouco divulgados na

língua portuguesa como, por exemplo, a introdu

ção que faz a Teoria das Séries de Tempo.

3) A sua tese apresenta elevado rigor e clareza

de apresentação. Ê fundamental a sedimentação

que faz usando a Teoria da Probabilidade ã Ia

Kolmogorov.

Assim e nestas condições, sou de parecer que a re

ferida Dissertação seja aprovada e outorgado o titulo pretendido

pelo candidato e autor deste trabalho.

Rio de «Iánéiffa,/7>i6 de

an S

Professor da EPGE e

Presidente da Banca.

(6)

(7)

Agradeço ao Prof. Carlos Ivan Simonsen Leal

pela sua orientação, dedicação, paciência e estímulo, sem o

que, muito provavelmente, esta tese de mestrado não se teria

concretizado.

Agradeço aos Profs. Sérgio Ribeiro da Costa

Werlang e Antônio Carlos Porto Gonçalves a leitura da versão

final do texto e sugestões.

Agradeço â Maria Zilma de Queiroz Barros pela

presteza, eficiência e paciência com que datilografou o texto

e deu o lay-out.

Agradeço o apoio recebido de meus familiares,

que me estimularam nos momentos mais difíceis.

Agradeço â direção da EPGE e todos que

(8)

ÍNDICE

CAPÍTULO 1; PROBABILIDADE 1

1.1- Introdução 1

1.2 - Medidas Positivas e Espaços Mensuráveis 2

1.3 - Variáveis Aleatórias 11

1.4 - Seqüência de Variáveis Aleatórias e Definições

de Convergência 15

1.5 - Lei Fraca de Tchebyschev e Teorema Central do

Limite 18

- Apêndice 2 3

CAPÍTULO 2: ESTATÍSTICA PARAMÉTRICA 24

2.1- Introdução 2 4

2.2 - Conceitos Básicos 26

2.3- Teoria de Rao-Cramer 32

2.4 - Método da Máxima Verossimilhança 43

2.5 - Teste de Hipótese Estatística 61

CAPÍTULO 3: TÓPICOS DE REGRESSÃO LINEAR 76

3.1 - Introdução 76

3.2 - Regressão Linear Simples 79

3.3- Previsão 104

3.4 - Mínimos Quadrados Generalizados 10 8

3.5 - Analise dos Resíduos de uma Regressão 118

3.6- Multicolinearidade 122

3.7 - Erro nas Observações e Variáveis Instrumentais 12 5

3.8 - Coeficientes de Correlação-Parcial 12 8

(9)

CAPÍTULO 4: REGRESSÕES NÃO-LINEARES E SÉRIES DE TEMPO ... 13 9

4.1 - Introdução 13 9

4.2- NHo-Linearidade 140

4.3 - Series Temporais 153

(10)

INTRODUÇÃO

Este trabalho tem como objetivo discutir os

Tópicos Clássicos de Econometria, mas dando também ênfase aos

conceitos de Probabilidade, Estatística e Álgebra Linear.

Os pontos abordados seguem a ordem tradicional.

0 Capítulo 1 ê destinado a exposição dos con

ceitos de Probabilidade e Teoria da Medida. Estes conceitos

são importantes para a compreensão dos Conceitos de Estatísti

ca.

0 Capítulo 2 segue introduzindo os Conceitos

de Estatística e testes de hipóteses.

0 Capítulo 3 apresenta regressões lineares e

os testes de hipóteses usuais.

0 Capítulo 4 aborda regressões não-lineares e

(11)

CAPÍTULO 1

PROBABILIDADE

1,1 - Introdução

Neste item se define formalmente o que vem a

ser uma medida de probabilidade P sobre um conjunto W. A

partir desta definição e da definição de variável aleatória,

também dada abaixo, enunciam-se os principais conceitos de

convergência num espaço dei probabilidade: convergência quase

certa, convergência em probabilidade e convergência em distri

buição.

A Lei dos Grandes Números de Tchebyschev e pro_

vada e enuncia-se, sem fornecer prova, o Teorema Central do

(12)

1-2 - Medidas Positivas e Espaços Mensuráveis

1.2.1 - Definição

Uma. coleção M de subconjuntos de W é chama

°" álgebra de W se possui as seguintes propriedades:

a) W 6 M

b)

Se

m 6 M,

então

m°

6 M

c)

Se

m ê a reunião

de

uma

família

enumerãvel

de elementos de M, então m pertence a M

Os m- são chamados conjuntos mensuráveis e W

e um espaço mensurável.

1.2.2 - Definição

Dado um espaço mensurável (W, M) dizemos que a

função

P:M

-»

[ü,

°°J

ê uma

medida

positiva

a-aditiva

se:

NOTA: c

m

ê o

conjunto

complementar

de

m,

ou

seja

(13)

b) PCU m.) = Z P(m.) onde

todos os nu são mensuráveis e disjuntos.

1.2.3 - Exemplos

Ex. 1: P: CÍN) -» [0 ,

6 1

PCn) =

tt2 n2

Ex.

2:

Medida

de

Lebesgue

Cem

IR

)

Sejam

a,

b 6 lK

tais

que

a < b:

Escrevemos

Ca,b)

= {x

6 IR

: a < x < b};

a medida de Lebesgue de Ca,b) é o número ÀCa,b) = b - a. Se

ja M a menor CT- álgebra que contem todos os intervalos Ca,b).

A medida de Lebesgue de um conjunto A ê o número

n n

UA.) = inf{E Cb. - a.): U Ca.,b.) 0 A}

É possível provar que

XCA) = supíXCK): K C A e K ê compacto}.

N0TA:Se

V m

6 M ? PCm)

<; » então,

P é

chamada

uma

medida

fini-ta.

oo 2

Z

-4-

= V

CKreider)

(14)

4.

1.2.4 - Lema

Se P e uma. medida positiva o - aditiva A C B

são

conjuntos

mensuráveis,

então

P(A)

<

P(B).

Demonstração

/

B = A UCB\A) =>PCB) = PCA) + PCB \A) =>

PCB.) > PCA) pois PCB \A) > 0

Temos também que se

A C B=>PCB\A) = PCB) - PCA).

1,2.5 - Teorema

Seja uma medida positiva P, então

a) PC0) = 0

b) se mi G m2... onde cada m. é mensurável, en

tao:

lim PCm.) -* PCU m. )

1

c) se mx o m2 onde cada m. é mensurável e

(15)

lim PCm.) -> PCÍ1 m.)

X X

d) Se os m- são mensuráveis, então

PCÜ

m.)

- Z

PCm.)

±=

X

i=i

X

Demonstração

a) Seja m tal que PCm) < °°.

m fl 0 = 0=>PCm.) = PCmU0) = PCm) + PC0)

donde PC0) = 0.

b) Se Bx = mi e B, = m, n m se k > 2.

K

k-i

Então m, = U B. ê a união disjunta dos

k

Então PCm,PCm,) ) == EE PCB.PCB.] )

k

i=i

1

Logo:

lim PCmk) = E PCBi) = PCU B±) = PCU m.)

c) Ponha B, = mi\m.

EntHo 0 = Bj C B2 C ...

Pov Cb) lim PCB.) > ;PCU B.)

(16)

?

PCB ) = P(m;1) - PCm, )

K K

Por outro lado,

U

EU

= U

(mj.flm?)

= mjíl

(U

mV)

oo oo

= mjnCO m.) = mj^Cn. m.)

oo oo

Então PCU B.) = PCmj) - PCíl m.)

Logo,

lim PCB.) * PCU B. )

implica, que:

lim PCmj) - ECnu) -> PCmx) - PCn mj.)

ou seja:

lim PCm.) -> PCn m.)

Í->oo i = 1

d) Note-se que PCA U B) < PCA) + PCB)

De fato:

CA

U B)

= CA

n Bc) U

CA°

n B)

U (A

íl B)

como os conjuntos do lado direito são disjuntos:

PCA

U B)

= PCA

íl BC)+

PCAC

fl B)

+ PCA

fl B)

<

pca

n bc)

+ pca

n b)

+ pca-

n b)

+ pca

n b)

(17)

n n

PCU m.) < E P(m.)

. _ 1 ~ «_ i

1-1 1-1

Ora,

k k

Z PCm.) = lim Z PCm.) > lim PCU m.) = PCU m.)

T - 1"~t «1 *_-L

i=i k^-00 1=1 i-i

Ra,sta tomar B,. = U m. , como B 3 B , aplicar (b)

K _ 1 K+ 1 X

1,2.6 - Integral de Funções Mensuráveis

1,2.6.1 - Definigao

Seja E um subconjunto qualquer de um espaço

mensurável CW, M).

Seja

a função:

Xv

: W

"*" íR

0 se x & E

1 se x 6 E

XE

ê

chamada

função

característica,

Seja s: W ->

n

s = £ «;L

(18)

onde os A. são subconjuntos enumeraveis e disjuntos de W. Cha

1 ~

ma-se s de função simples. Se os A. são mensuráveis, s e

uma função mensurável.

1.2.6.2 - Definição

Uma função real e mensurável se ela e o limite

pontual de funções simples mensuráveis. Decorre então que se

f é positiva e mensurável,existe uma seqüência ís }

n= *

tal que: a) 0 < Si < s2 < f

b) s Cw) converge para f(w)

para todo w quando n > °°,

Dado um espaço CW, M) com uma medida positiva

\i, define-se a integral de uma função simples mensurável como

sendo:

n

s d\x - Z a. ia CA.)

(19)

Se

f;

W "*"

[_Q,

°°J

ê uma

função

mensurável,

a

integral de f e definida como sendo:

f dy

= supí

a dy;

s é

simples

e

0 <

s

5 f^

Se

f:

W "*"

L-°°5

°°0

é uma

função

mensurável

qua]L

quer, então a integral de f é definida como:

f dy

= í f+ dy - í f" dy

-L «a

onde f = max Cf,0); f = max C-f, 0), são funções mensuráveis

Diz-se que f é integrãvel quando ambos os ter

mos â direita da igualdade forem finitos.

1.2.7 - Teorema da Convergência Monótona

Seja, O&p M, P) um espaço mensurável com medida

(20)

10,

que:

a) f (w) < f (w) para todo w 6 W

b) existe fCw) = lim f (w) para todo w 6 W

Então

lim

f f

_ri

dP -> f f dP

1.2.8 - Teorema da Convergência Dominada

Seja

f

: W >

£-°°,

°°3

uma

seqüência

de

funções

mensuráveis tais que para todo w 6 W exista f(w) = lim fn(w).

Se existir g: W * £0, °°] mensurável tal que

g dP < oo e j fn | < g então:

a)

[jf|dP

< oo

b)

lim

[ fn

dP

= | f dP

c)

lim

í|fn

- f|dP

= 0

(21)

1.3 - Variáveis Aleatórias

1.3.1 - Definição

Da,do um, espaço mensurável com uma medida posi

tiva CW, M, P) , diz-se que a medida P ê uma probabilidade se

PCW) = 1. Diz-se, então, que (W, M, P) ê um espaço de proba

bilidade e os m. 6 H são chamados eventos.

1.3.2 - Definição

Uma variável aleatória real (v.a.r.) ê uma furi

çao mensurável real num espaço de probabilidade.

1.3.3 - Definição

Dada uma v.a.r. X o seu valor esperado ê defi

nido como: EX = X dP

NOTA:

Esta definição de v.a.r. pode parecer redundante, mas ê

(22)

1.3.4 - Exemplo

Ê possível

que

P seja uma

probabilidade

e

que

a v. a. r. não tenha EX < °° .

Seja W = IN e suponha que P(X = n) = 6 1

2 _n2 2 '

que

ê uma

probabilidade,

já que:

PC

IN)

= E

JL.

= l

2 9

1 = 1 "n n*

Contudo:

EX = XdP = ndP = E

i=i

n2

u2

tt2

i=i

n

0 seguinte teorema ilustra um ponto importante

sobre

as

variáveis

aleatórias

de

valor

esperado

finito.

1.3.5 - Teorema

Seja X uma v.a.r., temos:

Z

PC

|X

|

>

n)

<'

E i X |

<

1 +

E

PC

[X

1 >

n)

n=i n=i

se E|X| < »

(23)

oo

l PC|X| > n) =

n=i

Demonstração

Ponha AR = {n < | X| < n + 1} para n = 0, 1, 2 ... e

g

=

{ xA

+

+ XA

> * i X i.

A seqüência

g

-» | X |

n

Aa

An

n

e obedece âs condições do Teorema da Convergência Monoto_

na, logo:

| gn dP ^ | | X| dP

Por outro lado,

[gndP

= E } |X|XA.

dP

J X=QJ X

donde vem que:

E|X|

= £

f |x|Xa

dP

J

Ai

Trivialmente temos que:

nPCA)

_n

^

[ |x|Xa

_F _/\

dP

<

(n + 1) P(A)

_ii

o que acarreta que:

nPCA

n

) <

ElXl

i i

<

_

1 + Ê

nPCA

n

)

(*)

n-i

(24)

Temos que:

k k

E nPCAn)

= Z

n(P(|x|

>

n)

- P(|x|

>

n + D)

=

n=i n=i

k

E

PC|X|

>

n)

- k PC|x|

>

k + 1)

Ora,

{ |X|X

_C|X|

_>

_{k + l)aF}

O lado direito da desigualdade tende a zero,jã

que pelo Teorema da Convergência Monótona, temos que

E|X|

= lim

(|X|

xMy,

. + n.dP

Então

£

nPCAR)

= E

P(|x|

>

n)

n=i n=i

oo

Finalmente,

se

E |'X | = °°,

então

l

nP(A

) = °°

de

(*)

n= i

k -k

Como £ nP(An) ;< i P(|X| > n) segue que

n=j " n=i

E PC |X | > n) = «o.

n=i

1.3.6 - Corolário

(25)

Demonstração

Se X > 0 e EX = 0

Então X = |X|.

Tomo r > 0.

Segue que rX > 0 e ErX = rEX = 0

oo

Pelo Teorema anterior £ P(rX > n) > 0.

Como PCrX > n) > 0 para n > 1 temos que

PCrX > 1) = 0.

Isto ê o mesmo que dizer que

PCrX = 0) = 1 CPois P(W) = 1)

Como por hipótese r > 0, então X = 0

Logo, PCX = 0) = 1.

1.4 - Seqüência de Variáveis Aleatórias e

Definições de Convergência

1.4.1 - Definição

Seja CW, M, P) um espaço de probabilidade;

(26)

Diz-se que:

a) X converge quase certamente para X

se Xn(w) -* XCw) para todo w 6 (W N) , on

de

PCN)

=0.

CX

9^Ç>

x)

n

b) X converge em probabilidade para X

se

lim

PCJX

- Xj

>

e)

= 0

para

n

qualquer

e>0.

CX

í>

X) .

Demonstra-se que convergência quase certa im

plica em convergência em probabilidade. Abrevia-se convergên

cia de probabilidade como plim P(|X - X| > e) = 0.

1.4.2 - Definição

Seja X uma v.a.r., a função F^: fR -> [0>ll

definida por FyCx) = P(X < x) ê chamada função de distribui,

ção.

Demonstra-se que:

a)

0 à

Fv(x)

_A

^

1 para

todo

b) x < y -> FYCx) £ FY(y)

(27)

Ccontinuidade pela direita)

e) lim Fx(x) = 0 e lim Fy(x) = 1

x>°°

1.4.3 - Definição

Dada uma seqüência de v.a.r. X , diz-se que

Xn converge em distribuição para X se F (x) -> Fx(x) em todo

n

ponto

X no

qual

Fv

ê contínua

escreve-se

(X

>X).

A chave para compreender-se convergência em

distribuição ê o seguinte resultado.

D

Demonstra-se que X^ > X se, e somente se,pa

ra

toda

função

f:

[R

-*- IR

contínua

e limitada

E fCXn) -> E f(X).

NOTA:

No Capítulo 3 apresentam-se exemplos de convergência em

(28)

1.4.4 - Teorema (Slutsky)

Se

Xn

> X e

Zn

P > c

(constante)

então:

a)

X_

+ Z_

^>

X + c

ZnXn

>

cX

1.5 - Lei Fraca de Tchebyschev e Teorema Central do Limite

1.5.1 - Definição

Uma família de v.a.r. F ê formada de v.a.r,

independentes se

pcx. e a. , v i e i) = tt pcx. e a.)

i e i

1

pa.:ra tqdo I finito e quaisquer A. mensuráveis, onde X. 6 F.

i.õ.2 - Lei Fraca dos Grandes Números de Tchebyschev

(29)

entre si tais que EX = O e E(X )2 = K < °° para todo n.

Então:

-^

CXX

+ X2

+ . . . X ) ->

0

n n

Demonstração

Usando a desigualdade de Tchebyschev

PC|X - EX| > e) < ~~ var X

e

Fazendo S = Xx + X2 + ... + X

tem-se que_^ ES _n = nEX, _* = 0

var S = nK

Então

S

> e)

= P(|Snl

> ne)

)|

)

P(|Snl

5

- ~-

var

S

= -^-

K =>

> o

* n 2

0 Teorema que enunciamos a seguir é um dos re

sultados mais notáveis da Teoria da Probabilidade. Ele garan

te que quando temos amostras grandes, podemos considerar a

distribuição como sendo normal. Define-se uma distribuição

(30)

1.5.3 - Teorema Central do Limite de P. Levy

Seja,

X uma

v.a.r

tal

que

EX

= 0

e

EX2

=1.

Sejam X , X , ..., X independentes e Ídenticamente distribui

das como X. (Ver caso geral no Apêndice)

Então

í

C)

_n

2 (X

_i

+ X

₂

+ . . . + X ) -^>

_n

N [0 , l]

Corolário:

Seja X uma seqüência v.a.r. independente e

Ídenticajr.ente

distribuída

tal

que

EX

=0,

EXn2

<

°°

então:

n

Z X.

1 = 1

3 D

a) Ji : > Normal

n j

CE

X.2 )T

/n 2 X.

b)

í^i

-^>

Normal

(31)

Demonstração

a) Seja EX2 = o'

y

Então Y = _JL_=>e y = 0 E

cr

n n j n

E

X. E

Y. C-^-)7

E

Y

n i n i -, n

Z

CX.)2)T

CS

Y.2)"2"

^L_

E

D

3 n

Pelo Teorema Central do Limite

-i

n

_E _Y.

) E Y

n j=1 D

Pela Lei Forte dos Grandes Números

n j

Pois, se os X. são independentes, os Y. também

~ P «

o sao, e se Y > c, dada uma f continua, demonstra-se que

P ~ «

fCY ) -> fCe). Ora, a função raiz ê contínua e usando o

Teorema 1.4.4 temos:

n

E X

3 CE.

X.2)Í"

(32)

/PT

E

n

= i

X

X.

2

O

n

Z

n

E Y.

n JJ

Y.2

i ^ 1

a

n

Pelos mesmos argumentos

(33)

APÊNDICE

Seja X um vetor aleatório p-dimensional tal que

EX = y

EXX1 = X

Então

f.d.p.CX|y,E) =

2 exp[

|-(X

- y)'

- y)]

Diz que X e uma V.A. N (y, E)

Teòrema:

Seja

v = CXx , X2 , ...» X ) onde X. são v.a.r. independentes e

n

' n

n

1

A = cov v

n

n n

cov(Xx ,X2 ) ... covíX, ,X ]

n n n n

covCXj ,X

n

rn

cov(X n ,X n

onde A independe de n

E vn = 0

Então n1 v.

(34)

CAPÍTULO 2

ESTATÍSTICA PARAMÉTRICA

2.1 - Introdução

Muitos estudos, experimentos científicos e in

dustriais produzem dados cuja analise e compreensão são de in

teresse dos pesquisadores. Em geral, esses dados podem se:?

modelados como o resultado de um experimento aleatório, ao

qual se tenta atribuir uma distribuição de probabilidades ade

quada.

Âs vezes, sabe-se qual a família de distribui

ções que ê a mais adequada â modelagem, mas não se pode deter

minar os parâmetros da distribuição.

Exemplo:

Tome um processo industrial que produza lotes

de N peças, das quais N.6 são defeituosas.(8 desconhecido).

Deseja-se tomar uma amostra de tamanho n pa

(35)

de-feituosas na amostra, tem-se:

( N9 . . N - N9 ,

pfi

[x

= k]

=

k

n - k

(N)

_n

onde, max (n - N(l - 9), 0) < k < min (N9, n)

Assim, pode-se determinar, no experimento aci

ma, a família de distribuições que modela o experimento

(hi-pergeomêtrica,

no

caso).

Porem, o parâmetro 9 é desconhecido.

A pergunta ê como determinar 6?

A resposta ê: Formula-se uma hipótese sobre o

verdadeiro valor de 9, e a validade desta hipótese ê testada

por um Teste de Hipótese. Neste Teste de Hipótese aceita-se

ou rejeita-se o valor atribuído a 9.

Na seção 2.2 introduzérn-se diversos conceitos

de Estatística e o Teorema da Fatorização. Em 2.3 abordam-se

as desigualdades de Rao-Cramer e de Bhattacharya.Na seção 2.4

se apresentam os Estimadores de Máxima Verossimilhança, com

suas propriedades de Consistência e Normalidade Assintotica.

Por ultimo, na seção 2.5 têm-se os Testes de Hipótese, Erros

(36)

fundamen-tal Lema de Neyman-Pearson.

2.2 -.Conceitos Básicos

2.2.1 - Estrutura Estatística

Seja T uma família de medidas de probabilida

de

num

espaço

mensurável

(X,<X

).

Na

linguagem

de

probabilidade

(X,tX

) ê o

con

junto de possíveis eventos, denominado espaço amostrai, e

CX,t/,i ) e chamada uma estrutura estatística.

Se T for um conjunto unitário, a estrutura es

tatística ê um espaço de probabilidade.

Em geral, T = {PQ ; 8 60}, onde

Cp

-0 e o espaço dos parâmetros; í.e., T e parame

trizada.

-01!£92 -» Pg ^Pfi diz-se que a

pa-rametrização e identificável.

Caso contrário, diz-se que ê não identificável

(37)

e dominada por uma medida a - finita V em (X,t/() se para tp_

das

as

medidas

PQ

S <P

existir

uma

função

L (xj

9)

de x

6 X,

tal que:

Pfl

CA)

=

L(x|0)y(dx)

V AeU

0 } A

onde a função L Cx|Q): X x 0 -> [O,00)

é chamada

função

de

verossimilhança

(F.V.).

Se

Pa

satisfaz

* t>

âs

condições

acima,

diz-se

que

PQ

ê

absolutamente

contínua

com

o

respeito a \\ .

Obs. : jj não precisa ser uma probabilidade.

2.2.2 - Estatística

Seja a estrutura estatística (X,tX,T ). Então,

uma

função

T:

(X,uí)

-*

(jR

, B ),

onde

3 é

a a

- álgebra

de

Bo-rel

de

IR

, é uma

estatística.

CV.

NOTA)

Ou

seja,

para

qualquer

Pfi

G*P

a estatística

T

e uma V.A. do espaço de probabilidade (X,tA, Pfl^*

- Sejam duas estatísticas T i : X -* Y e

T2 : X -» Y

NOTA;

A cr-ãlgebra

de

Borel

em

ÍR

é

gerado

pelos

conjuntos

(38)

são

Ti e T2 são chamadas equivalentes se o evento

A = {x

: Ti (x)

¥= T2 (x)}ei

for tal

que

PQ CA) =0 V 6 6 0

0 evento

A

é

chamado

t

- desprezível.

- Duas

estatísticas

Ti , T2

em

(X,tÁ

,*P

)

chamadas independentes se V pQ G T as V.A. Ti, T2 são inde

pendentes

considerando

o espaço

de

probabilidade

(X,c4,PQ).

- A

estatística

T

em

(X,tA,T

) ê

chamada

inte-grável

se

V P§

G ?

a V.A.

T

ê considerada

em

(X,t4

,PQ)

for

uma função integrãvel.

0 valor esperado de T associado a PQ ê repre

sentado por Eq T(.x).

2.2.3 - Estatística Suficiente

Uma

estatística

T:

X +

Y

e

chamada

suficiente

se para um dado valor da estatística T, a distribuição das

observações x independe de 6.

Ou seja, para qualquer A 6 1/1 , temos que:

(39)

independe de 0, i.e., o montante de informação sobre o verda

deiro valor de 0 em x é o mesmo disponível em T(x).

2.2.4 - Teorema da Fatorização - Como achar

uma estatística suficiente.

Seja L uma F.V. A estatística T: X -»- Y é

suficiente se, e somente se, existe uma função h - mensu

ravel, estritamente positiva em X e uma função gQ

3-mensu-rãvels

estritamente

positiva

em

Y,

tal

que:

L(x|0) = g CT(x)) « hCx)

Demonstração: Para o caso em que X ê finito ou

enuméravel.

C =>) Se T ê uma estatística suficiente, x 6 X

e T(.x) = t. Então, pela definição de Radon-Nikodyn

dp

L(x I 8 ) = i

dy

mas como X e enuméravel

dP,

= x)

(40)

Então,

L(x 6)

à\x

= P (£ = *)

D

Ç = x

= Pe CÇ = x;TCÇ) = t) =

= Pç ÍTCÇ) = t} PQ {Ç = x|T(Ç) = t} =

= gQ {TCx)} h(.x)

Ja

que

T(.x)

é

suficiente,

vem

que

h(x)

independe

de

(.<= ) Seja agora L(x|6) = gQ (T(x)) h(x)

Se T (x) = t e PQ'{T(Ç) = t} > 0, obtem-se:

PQ (Ç = x, TU) = t)

Pfl CÇ = x|T(.Ç) = t) = 6

PQ(T(Ç) = t)

= x) PQ (Ç = x)

P CTCÇ) = t) E Pfi (Ç= y)

y

y:T(y)

= t

ü

(t) . h (x) h(x)

E gfl(t)h(y) S , h(y)

y:T(y) = t y 6 T" (t)

E esta ultima expressão independe de 6 .

No caso geral, a prova dependera do Teorema de

(41)

2.2.5 - Estatística Completa

Uma estatística T ê chamada completa se para

qualquer

função

f: [R

* (Jv

mensurável

limitada

valer

que:

EQ f(TCx)) = 0; V 6 -> f(T(x)) = 0 q.t.p.

Conseqüentemente:

Pfi

ífCTC.x))=

0}

= lj

V

6

2.2.6 - Estatística Livre

Um

conjunto

A

6 J[

e chamado

livre

(com

respei

to

a uma

família

9={pQ:ee©}

de

medidas

de

probabilida

de

em

CX,tX

))

se

PQ(A)

não

depende

de

9 G 0.

A estatística

T : (X,

iA

) -* (Y,3)

é chamada

li

vre se a distribuição desta estatística não depende de 6 6 0.

Isto e, íx:T(x) 6 B} e um conjunto livre para todo B 6 3.

NOTA:

{f(.T(.x)) = 0; q.t.p} = PQ{f(T(x)) é 0) = 0;V6>

q.t.p = quase toda parte, isto ê, exceto num conjunto de

(42)

2.3 - Teoria de Rao-Cramer

2.3.1 - Estimadores não-viesados de mínima variância

Seja CX, i/C ,r ) uma estrutura estatística e

uma função de 0 no (R .

A estatística

t

com

valores

no

[ft

e um

es

timador não-viesado CENV) de t se:

EQ tCx) = xC9) V 9 G 0

supondo que x tenha distribuição Pg.

Seja A. a família de todos os ENV de t , t é

cha,mado (^stimador não-viesado de mínima variância (ENVMV) se:

var0 t $ var@ tl;V0e0,t'eA.

2.3.2 - Teorema (Unicidade do ENVMV)

Sejam tx e t2 dois ENV da função t com va

riância mínima.

Então tjCx) = t2(x) qtp

(43)

Pe {t x(x) = t2(x)} = 1; V 6 0

Demonstração:

Para todo 0 6 0, faça t3 = -~~(.t 1 + t2),

v = varQti = varQt2

Ora, t3 e não viesado, logo v ^ var t3.

Por outro lado:

FUNDAÇÃO GETÚLIO VARGAS

TÓPICOS CLÁSSICOS DE ECONOMETRIA

DISSERTAÇÃO SUBMETIDA Â CONGREGAÇÃO DA

ESCOLA DE P(5S-GRADUAÇÃO EM ECONOMIA (EPGE)

DO INSTITUTO BRASILEIRO DE ECONOMIA

PARA OETENÇAO DO GRAU DE

(44)

com

respeito

a uma

certa

medida

y em

(X,tX

).

Considere também um estimador não viesado t da

função t .

Suponha que L, t e. t satisfazem âs condições

de regularidade:

1) { x: L(x|0 ) > 0} V x, v 6

2)

L(x|9

) é diferenciavel

com

respeito

ao

e:

j t(x)

L(x|6)

y(dx)

= | t(x)

^-

L(x|9):y(dx)

d

d9

X X

3)

t é diferenciavel.

Teorema: Satisfeitas as condições acima, se t

e um ENV de t com segundo momento finito, então:

lnL>

a igualdade

se

verificando,

se

e somente

se,

^j-

In

L = A (9)

[t(x)

- T(0)]

y q.c

para uma certa fundão A (9).

NOTA:

q.c = quase certamente se, exceto no conjunto onde a me

(45)

Demonstração

dPfi

r r

(D

I

L(x|e)

y(dx)

=

X

(2)

í t(x)

L(x|e)

p(dx)

= EQ t(x)

= x(9)

V9

X

Derivando (1) e (2) em relação a 6 temos,

Í3_Ldvl=í_l___9:LLdí

J

ae

J

l

ae

J

a In L

XX X

X X

Então,

T ' - í tfv^

9ln

L

,fll

í 9 In

L . .

x - ttx; - L dy - x v.8 ; L dy

J 96 J 99

X X .

x1

= { [t(x)

-t(6)]

*j!l±

L dy

X

Aplicando a desigualdade de Cauchy-Schwarz pa

ra

integrais

â última

integral

e representando

L =

/TT

* ^~L.

[t'(0)]2

<

í [t(x)

-t(9)J2

Ldp

. í (ilTLii)

l dy

X ' X

(O)]2

< var

t . E ( AiH

o 8 ae

(46)

In L( x I 8)_' _e r. t_|t(x) \ _- _t(6)J ,Ovi

3 9 U -+

forem

paralelas

no

espaço

vetorial

das

funções

de

x,

ou

seja

8'3 6 L(X|9)

= A(8)

jt(x)

- t(6)1

para um certo valor de A(e).

Finalmente:

varn t

2

e 2

0 39

°

0 lado direito da desigualdade e o limite in.fe

rior para a variância do ENV.

0 estimador que atinge este limite é chamado

estimador eficiente £EE) .

2.3.4 - Corolário

Para que o ENV da função t seja EE, é necessá

rio e suficiente que

L = A(8)

[t(x)

- T(0)l

(47)

Demonstração

A primeira afirmação decorre da definição de

EE e da desigualdade de Cauchy-Schwarz.

A segunda decorre da igualdade ja demonstrada:

t' = f [t(x)

_J

- t(8)]AIELÍí

_{8 9}

L ÚM = f A(8)[t(x)

_J

- t(6)]2

L á]i =

X X

= A(8) . varQ t

2.3.5 - Exemplos

Seja x = (xl, x2, ..., x ) e as observações

x1? x2, ..., x independentes cada uma com distribuição

N

[8,a

2 i c°m

variancia

a

conhecida.

A função

densidade

de

cada observação e da forma:

(v ~9)

2

4 p

2

Neste caso,faça:

L(x|6)

= tf f(xj6)

_j

= a-n(?TT)2

2

exp{

_p

,,

_Z

nn

Z

(xv

_(x

-8)

₈₎

}

2

-5-

In

L = -

(x - 6)

onde

x = -4-

?

x,

(48)

Esta

igualdade

é

da

forma

A(6) =

t(x) =

t(6) =

n

a2

X

e

d In

39

L ₌ _A( ₆₎ _[t(x)

Então x e o EE.

Fazendo o mesmo raciocínio para xl5 x2, ... x

com

distribuição

N

[ y,8

j,

y

conhecido,

chega-se

a:

A(g)

= -^r

n

t(x) = £ (xk - y)

k=i

= 62

0» O xx»

-Assim se obtém um EE para 8 , mas nao ha um

EE para 6 propriamente dito.

É intuitivo que se t e um EE de t , então

(49)

2.3.6 - Desigualdade de BhattacharyaC Caso unidimensional)

Pode-se achar um maior limite inferior para a

variância do ENV, caso não exista o EE em 2 . 3 . 3 .

A

condição

para

existência

do

EE

é

que

In

L

= A(6)

|t(x)

- t(6)]

.

86

Caso isso não aconteça, e possível que exista

estimador onde [_t(x| - t(8) 2 seja uma combinação linear

das funções: 1 L L 86 1 L

82

88 L.

2 ' "

1

L

8S

L

8es

Para simplificar, chame:

f| T

86*

36K

Suponha validas as mesmas condições de regula

ridade impostas em 2.3.3, e também que a função L admita de_

rivadas ate a ordem s.

Tcorema: Seja t um ENV de t

Então:

s

(50)

onde

e os coeficientes Ci = CAQ) são determinados pelo sis

tema :

Se a matriz A = {a..} for inversível e

A"1

= {a13},

então:

var

t > f

a^

^

x^

(3)

iji

A ultima expressão e chamada desigualdade de

Bhattacharya.

Tem-se"a igualdade se, e somente se:

t- - t(9)

= ZS

C. ^

(4)

para certos C. = C. (e).

Jl JL

Demonstração:

A. Lema: Seja a, ai, ... a_ _s elementos de um

certo espaço vetorial com norma e produto interno tal que

1/2

(51)

Então

s

| a

|2

>

E

(a.,

a.)

C. C.

(5)

13=

3 X

3

onde os C. satisfazem ao sistema:

E (a^, a.) C. = (a, a.) (6)

A igualdade em (5) ocorre se, e somente se

s

C , para certos Cj , . . . , C

De fato, seja V o espaço vetorial gerado por

s

a ,>«£. e, 3 = projv a = E C^ a.

1 i= i

a projeção de V neste espaço.

Entãoj

|a|2

> |B|2

=(ES

C.a.5ES

C. a.)

= ES

(a,a.)

C.C.

i=i

1 1 j=i

D :

i,j=i

3 X

3

que é (5).

Como (a - g) _J_u. V. , resulta (6) (que nada mais e que

a equação matricial de Gram).

E |a| = |6| se. e somente se a P. V o que implica (?)*

B. Para um valor fixo do parâmetro 8 considere

(52)

(ç, n) = Efi (ç, n).

T 1

Ponha a = Ct - t (6 )) e a . = -=

Então,

por

definição

|a|2

= var

tfl

e

ECa , cx-j_) = t pois, pelas igualdades

que seguem,:

j LCx|Q)

\x (dx)

= 1

j t(x)

L(x|6)

y (dx)

= x (6)

X X

Derivando-se:

J L

X X

Ou seja;

. = 0

Donde Ca ,a.) = EA t a. - t(6) Eq a. = t1

10 1 Dl

C. Falta apenas provar que o lado direito de

Cl) e de (3) coincidem' quando A for invertível.

Escreva c = (c , c , . .., c ) e

12 o

T

= (T1,

T2,...,

TS).

(53)

que varQ t > (Ac, c).

Mas

"1

CAc,

c)

= (t,

A"1

t)

= (A"1!,

t)

= E

2.4 - Método da Máxima Verossimilhança

2.4.1 - Estimador de Máxima Verossimilhança

Um método útil para se conseguir estimadores

com boas propriedades e o da máxima verossimilhança.

0 = 0

(.x)

ê chamado

estimador

de

máxima

verossi-milhança (EMV) se:

LCx

| 9)

^

L(x|6)

v

6 Se

0 6 [Rs,

e se

para

qualquer

x 6 X

a

F.V.

L

Cx

| 0 ) for

diferenciãvel

com

respeito

a 0,

atingindo

o máximo

num ponto interior a 0, então o EMV 0 satisfaz:

(54)

Se

o EE

do

parâmetro

8 existir,

ele

pode

ser

obtido

pelo

método

da

máxima

verossimilhança

para

s = 1

sem

pre.

Pois neste caso:

= AC9)

[t(x)

- 9]

39

No caso geral, quando a estrutura estatística

admite

uma

F.V.

e o EMV

for

único

para

cada

realização,

então

o EMV 6(x) depende de x através de uma estatística suficiente

T(.x).

Pois,

pelo

Teorema

da

Fatorização

se

existir

F.V.

e

T(.x) for suficiente, ter-se-ã:

L(x|9) = gQ (T(x)) .

h(x)-pela definição de EMV em:

L(x|9) = g" (T(.x)) . h(x) > L(x|9)

e,

como

o máximo

é único

para

cada

x,

conclui-se

que

9 depende

de x através de T(x).(x fixo => T(x) fixo => 3 8 que maximiza).

Exemplos

1) Suponha que x = (x,x ,...,x)

í 2 n

(55)

Então:

'L(xle)

= ir

-

exp

{-= i cr

Sejam y e q os parâmetros desconhecidos

Cy,a)

= cei,

eo

e fR

x ÍR+

= o

L = 0 em toda fronteira de 0, logo o máximo ê

interior.

In L =

₂

S

(x

_Ç

- y)

= 0

3a

Os EMV são então:

k=i

L = Z_J2 + _L_ e (xv - y)2 = O

-> -, n

y = x = E x,

n

k=i

k

n

E (x, - x)

k=i

2) Suponha agora que x = (x , x ,... x ) e que

x , x , ... x são vetores V.A. com distribuição N (i.e.,

í ' 2' n r

normal multidimensional).

Então 0 = (y, A):

(56)

H6,

r

i

1 (2n)?|A|Í

Í

exp

{ - _I_

2 (A

* (x,-

y ) , x,-

y )}

- - n

2 i

= (2TT)

|A|

exp{--^-E

(A

* (x,

- x)

,x,

- x)

+

v ~i

- -4J-

CA"1 Cx

- y),

x - y)}

O máximo

de

L(.x|6)

depende

deCA"1

(x

- y),

x - y),

que

de

pende de y. Como A Ce, portanto, A~ ) é positiva

semi-definida, o mínimo ocorre em:

n

k=i

k

n _ ,

Faça. A = £ (x - x) (x, - x)

n

k=i

k

Levando em conta que (a,b) = tr ab' se a e b são veto

res coluna, tem-se que;

n

-í

-

n

X

CA

Cx

- x),x

- x)

= i

tr(A

J . (xv

- x)

. (x,

- x)')

k=i k=x k k

n

= trCA"1

X

Cx

- x)(.x,

- x)')

= n tr(A-1

A)

k.= i

k

nr _ _n_

(57)

Logo,

L(x|y

, A)

< L(x|y

, A)

É

necessário

mostrar

que:

...'LCxlu,

A)

<

,L(x|y

,A)

para toda A positiva semidefinida.

Tomando o logaritmo. na ultima desigualdade:

- -2-

ln|A|

- -ü-

tr(A"x

A)

< -^-

ln|Â|

- -2-

tr

Ir

2 2 2 2

qu seja

lnjA"1

A| - trCA"1

A)

+ r i 0

Como A e A são matrizes positivas semidefinidas, vale es

crever:

A = B2

j A

= B2

onde B e B são matrizes simétricas.

Ponha

C = CB"1

B)

x

(b"1

B)

e esta

também

é matriz

posi

tiva semidefinida.

Se

f ê

uma

função

numérica

da

matriz

A

da

forma

fCA)

=

|A|

ou

f(A)

= tr

A

então, f(AB) = f(BA).

(58)

In

ICI -

tr

C + r

<

G

ou

r.

E Cln X:.. - X: + 1) £ 0

1

onde \. sao os auto-valores da matriz C, pois

i C | =_' X _í X ₂ ... A _r tr C = X ₁₂ ' + X + . . . + X _n

Como X^ f* 0 e In x £ x-1 x > 0, ; a desigualdade

se verifica e:

.. _ "£ n

= C2Tre)

2.4.2 - Estimadores Consistentes

Seja x , x ... uma seqüência de resultados de

1 2

observações de um evento.

Chame t = t Cx , x , . . . ,x ) o estirnador do

n n i 2 n

parâmetro construído a partir das n primeiras observações x ,

A « » * yV

2 n

0 estimador t depende do numero de observações,

(59)

lim P { jt - 6 | > e } -> 0

n

*

oo

°

n

No caso geral, quando se estima a função t(6) a

condição ê análoga:

lim

PQÍ

jt

-

tC8)

n -*- oo ° n

2.4.3 - Consistência do EMV

Suponha, para cada inteiro n > 1, a F.V.

LCx|6) = L _n Cx|9) tenha a forma:

L Cx|9) = f(x |0) . f(x |6) ... f(x |

n ' i ' 2 n

O que quer dizer que a V.A. x. são iid. com densidade f(yj9).

A família de distribuições Ffi das V.A.s x. para

0 G 0 ê. dominada por uma certa medida y e

fCy|9)

= f

Cy)

"Caso onde 0 seja um conjunto finito."

As seguintes hipóteses são necessárias:

Al: 0 conjunto Y = {y: f(y[0) > 0} não depende de 0.

(60)

po-sitivos.

A2: 6! = 62 <==> f Cy J6a ) = f(y|62) q.c. com respei

to a medida \\.

f(xj

|6o

)

A3:

Existe

EQ

lrii

= \|»(e|e0

) =

i|K0)

00 fCxJO)

onde 90 6 0 .

A4: Para cada inteiro n > 1, o EMV 6 ê único q.c,

- n ^

Satisfeitas as condições anteriores:

Teorema

lim P {0 = 0O } -»- 1 onde 90 é o verdadeiro

n -> oo °o n .

valor de 0 .

Corolário

Se A.3 valer V 0O 0 então

lim PD{9 = 6}

o n

n -> «>

-isto ê, o EMV 0 ê consistente

n

Demonstração:

A demonstração serã dividida em três partes

(61)

i|»(6) -O VeSO e que

il> ce) = o <=> 6 = e0 .

Usando a desigualdade de Jensen com

gCx)

= -

lnCx)

x 6

fR

|

Faça

fCxje)

f(xi|eQ )

É obvio que

(e ). = e ín = o <=> e = e0 e

i |eQ

)'

f(x.

|e)

f(x,

)} E { l()} l(E

|Q | , |

« {inC -)} = EO { - ln( )} > - ln(EQ ) = 0

v0

j

e

eC)

«

v0

fCxje)

eo

fCxje,

)

pois

= í iMLL.

fCy|e0

) U(dy)

= 1

J

fCy|e0)

Y

2. parte - Faça

n

(6 ) = -^L-

_n

X

n

In

fCx |60 )

NOTA:

Desigualdade de Jensen

Se

Ç ê uma

V.A.R

e ip uma função

convexa

no

fft

então

(62)

Como E Ç C9 ) = \\> (0 ) pela Lei dos Grandes Nume_

ros, jã que Ç ê uma variável aleatória e

lnCx) ê uma função contínua, tem-se que

Se 8 *=£-- 0O e, portanto, ip (0 ) > 0, então

V a !> Q

3 N ta,l que:

PA { 6: Ç (0) > 0> > 1 - a

©o n

para n > N.

Como

0 ê

finito,

podemos

dizer

que

isto

vale

para todo 9 =f= 0o .

3. parte - Faça por comodidade P = Pfi e

AnQ =Í0: Çn(6) > 0)

Como 0 é finito, suponha |0| = m.

Ora,

K

_n

(0

_n

) = -^-

(L

_n

(x|8o)

- L (x|0

_n _' _n

))

Mas 9 maximiza L (x 0), então

n n

í (0 ) < 0.

n n

Note que í (0 ) = 0 <=> 60 = 0

(63)

= p(çnce) < o) < pcç cê) < o)

<

pc

y

í cê)

<

o)

= pc

u

a Qc)

n

"

e^e

n6

<

Z

PCA

AC)

= Cm

- Da

e*e

n6

Como

a

é

arbitrário;

PC8

=7^ 60

) +

0

quando n

2.4,4 - Normalidade Assintotica dos EMV

Dão-se aqui as condições sob as quais o EMV 0

e assintoticamente normal.

Isto ê, a distribuição de V.A.

- 9) > NCO, AQ)

Suponha novamente que para qualquer n > 1;

LCx|0)

= L

Cx|8)

= fCx

|6)

fCx

|0) ...

f(xn|6)

Façam-se as seguintes hipóteses:

Al: A função densidade f ê definida em Y x 0

(64)

A2:

0 é um

conjunto

convexo

A3:

A

F.V.

atinge

o máximo

global

num

ponto

interior.

A4:

0

_n

é consistente;

_»

plim

_-f

6=6

_n _o

A5:

A função

fCy|e)

ê duas

vezes

diferenciavel

no

ponto

0 = 0Q dentro do sinal de integral, isto ê:

rf-

í fCy|6)

y(dy)

= í

-?-OD1 ) ) dü i

í fCy|8)

ViCdy)

= í

3l__f(y|6)

vCdy)

J

90

36

v 39 , i J 30 30

^ D Y Y i j

para 0 = 0o

A6: Se

FCxi|9)

= -ÍÍ

In

2 ln

302 30Í

96

então

|0O')|

|

<

c(Xl

|60)

g(6|e0)

com

c(xí

|0o

)

>

0 e

EQ

cCxj

160 )

<

~

.

onde

g (6

| 9Q)

é contínua

com

respeito

a

0 no

ponto

0o

(65)

A7: A Matriz Jo = J(9o ) ê inversível onde

- {E

(9ln

f(xil6)

. 3ln

f(xil6)

6 dQ±

86j

Teorema:

A

distribuição

da

V.A.

/n(6

- 8o

)

tende

a, distribuição

N

CO,

Jq"1)

quando

n -* °°.

s

.e. :

lim

Pq

{/n~(e

- e0

) < u)

*

P(Ç

< u)

onde

N (0, Jq ) e u 6

Corolário: Se A5 - A7 são validos V 6 £ 0,

então

lira PQ{/nCe - 6) < u> -» P(Ç < u)

o n

n -> °°

Demonstração

1) Ponha:

gCt) = uCx jet);et = et(x) = d - t)e0 + te

(66)

onde

In

5 5 )

301 302

Então:

gQ) = uCx,

38 = 0

gCl)

= gCO)

+ jg'.Ct)

dt

Logo

uCx|0Q ) = gCQ) = - I g'Ct) dt

Faça agora:

w(x|0) = = nE F(x, , 8)

k

A =

n

w(x|9t)dt

Como

g'Ct)

= -£_

uCx|0t)

=

_-~

d0

_{= w(x}

_{I et)}

₍₀

_{- 0o )}

tem-se integrando que:

uCxJ0Q) = - n

-i-

[ wCx|0t)dtl

wCx|0t)dtl.

(8

(67)

u(x|60

) = - A /7T(6

- 6o

)

n

0 lado esquerdo da expressão anterior ê da forma:

uCx|6

n fCx

n n k=i 96

_ ç

°

pois

36

In

fCy|60

)

f(y|60

) u(dy)

=

f

_f(y|60

₎

_y(dy)

₌

_{{ f(y|}

1 = 0

Então, de acordo cem o Teorema Central do Limite, a

Y.A..

uCxle0)

=

n (Ç, - Efi Ç,

k

e°

k

converge para uma distribuição normal multivariada

N CO, Jo ) quando n -y °°, pois as V.A. £. são iid e

S 1

60 ?1

var. = E

(68)

2) Mostra-se agora que

-J,

De fato, faça,:

A°

= ~n

Como

A

= A.o

+

(A

- Ao

) , basta

que

Ao

->

- Jo

e que

CA - AQ ) -* 0

Ora, pode-se escrever:

1 n

AQ = £- Z ^ nk onde n, = F(x J60

Os x\, são Cmatrizes) V.A. iid e

Kfl

Hi

- ~ Jo

Cserã

demonstrado

adiante).

Pela Lei dos .Grandes Números:

An

-£->

J,

Ao ' <J 0

De CA6) tem-se

i 1

|A - Aa|

<

\-j~

J wCx|9t)dt

- -i-

í w(x|80)dt

Q 0

1

wCxle^.) _t - w(x|e0 ) dt <

o

< E |FCx |6 ) - F(x |00)|dt

k= i *

(69)

1 n

í1

< -j-p-

s

c(xk|e0

)gce

|e0

)dt

= anBn

=i J Q

onde

a

=±

2 cCxJe0

)

n n

k=i

k

P P

Basta mostrar que a >const e . 3n > 0.

- P

Pela Lei dos Grandes Números cx > const, pois

cCx.

| ©q

) são

iid

Cpois

x.

são

iid)

e têm

primeiro

mo

mento finito.

E

g

é uma

função

contínua

dos

pontos

0 6 0

pois

Ve>053ô>0

tal que

0 <

gO

190 )

<

e

se

|Q

-

9q|

<

ô.

Em

particular,

g(6.

|9o

) <

e

quando

j 9 -

0oJ

<

<5,

ou

seja

0 <.

3^(9)

<

e

quando

|9 - 90| < <5.

Como 0 é consistente:

n

(70)

3) Prova-se agora que E rii > - Jp 6 o

De CA5)

32

du

-

f

Tf 9 ln

f;

y

i

j

i

Jln f ±ln f

30 30 30 39

i- j i j

]f

39.

3 In f 3 In fi

^7 ^7 J

Então para 9 = 9r

ni = - Jo

Considere as seguintes afirmativas

" * P

A) Se uma seqüência de matrizes aleatórias A > I

então

A"1

_n

>

I.

(71)

se uma seqüência de vetores Ç é assintótica normal

n

NCO, B)

Então

A

K

e assintoticamente

NCO,

A BA*)

Então como Jo ê invertível

- Ao"1

>

-Logo

/nC8n

- 0o ) = -A

x-i-

n(x|60

)

/n

tende

para

N (0,

_s

J^1

Jo

J^"1

' ) = N (0,

_s

2.5 - Teste de Hipótese Estatística

2.5.1 - Hipóteses

Seja

C^,

cX

,*P

) uma

estrutura

estatística

e

X: Í2 -> |R uma V.A.R. com distribuição Pn G T . Deseja-se esti.

mar o verdadeiro valor do parâmetro 8, usando para isso o va

lor observado de x da V.A.R. X.

Para

isso

estabelece-se

um

teste

de

hipótese.

Tome (J; o espaço dos parâmetros e considere as seguintes

(72)

Ho : 6 S 0o (hipótese nula)

Hj: 9 6 0i (hipótese alternativa)

onde

0 = 0q U 0i Cunião dijunta)

Uma hipótese H^: 6 G 0^ ê dita simples se

0- for um conjunto unitário e composta, caso contrário.

Um teste de hipótese ê uma regra de decisão

que consiste em aceitar ou rejeitar Ho.

De uma forma geral, um teste e uma estatística

que toma valor 0 ou valor 1, conforme aceita-se ou rejei

ta-se a hipótese nula. Mais adiante haverá necessidade de

considerar-se

testes

randomizados,

onde

a

estatística

atribui

rã

uma

probabilidade

de

rejeição

â hipótese

nula.

Usar-se-á

a

notação

c|> (x)

para

a

estatística

do teste de hipótese.

A função $ e chamada função crítica e o con

junto dos pontos tais que:

C = { w 6 fi / <HX(w)) = 1}

(73)

A seguir se apresenta o exemplo de um teste.

Exemplo:

Suponha que um novo remédio deva melhorar a ta

xa de recuperação dos enfermos de uma certa moléstia.

A hipótese nula é que o remédio não faça ne

nhum efeito.

Suponha que a proporção passada de recuperação

tenha, sido de 00 =0,2.

Então:

HQ : e0 =0,2

Ei : 6Q > 0,2

Ora, se deve tomar uma amostra de n enfermos .

S ê o

numero

de

pacientes

que

ficam

bons

na

amostra.

Se

n -> °°,

S tem distribuição binomial ê(n, 0).

Neste

exemplo

©

=

[6q

, l]

e 0q é simples e 0i composta.

Ê" conveniente, neste caso, trabalhar com um in

dicador.

'l

se

S

>

k

(74)

A região crítica ê o conjunto ík, k + 1,. . .. n}

subconjunto do espaço amostrai.

{1,2, ... n }

2.5.2 - Tipos de Erro

Um teste pode induzir que se suponha que o pa

râmetro 0 tenha um valor diferente de seu verdadeiro valor

0o Existem dois tipos de erro.

Erro do tipo I - rejeitar Ho quando Ho é vali

da.

ã ê

Erro do tipo II - aceitar Ho quando Ho não ê v£

lida.

Aceitar Ho

Rejeitar Ho

Ho é

verdade

não ha

erro

tipo I

Ho ê

falsa

erro

tipo II

não há

erro

pode incorrer nos dois

pos de erro simultaneamente.

(75)

a =P(erro

tipo

I)

= PCrejeitar

Ho

| Ho

verdade)

3 =PCerro

tipo

II)

= PCaceitar

Ho

| Hi

verdade)

Cada teste tem valores a, 3 a ele associados,

e não ê possível minimizar ot, 3 simultaneamente. Na medida

em que aumenta a região de aceitação de Ho aumentando 3, redu

zo a de rejeição diminuindo o, e vice-versa.

Exemplo 1:

Suponha Xi, X2, ..., X9 uma amostra de V.A.

normais com cr = 1.

Seja Ho : y = 2

: y = 3

Usando o EMV X para estimar y.

Seja o teste (não randomizado) aceitar

Hq se x 5 c e rejeitar se x > c, onde

2 < c < 3.

3

a

(76)

de Ho , aumentando c, diminuindo a, mas aumento 3.

Exemplo 2:

No exemplo de 2.4.5.1

kl

S

("

) 6p Cl

- 60V~

i=k

:

pel>k(x)

= o]

= p6cs

< k>

k-i .

t

C?

) e3(i

- Q)n~1

3

2.5.3 - Poder de um Teste e Função Potência

Um teste não randomizado associa a cada valor

possível de x G X uma decisão do (aceitar Ho) ou di (rejei

tar HQ ) .

Seja ô(X) a regra de decisão, função da obser

vação, Xq região de aceitação, Xi região crítica.

XQ U Xi = X

Como dito anteriormente, não ê possível minimizar a e 3

(77)

Então, é" comum arbitrar 0 < a < l} que é cha

mado nível de significância:

P0{ôcx)

= di>

= pQíx

e

xi>

<

a

V

e e

©o

e então minimizar 3:

PQ{<S(X) = d0} V 6 6 0i

que

ê o mesmo

que

maximizar

PD{<5CX) = dj = PQ{ x 6 Xi } V 6 6 0i

Chama-se:

F(9) = PO{<5(X) = dJ- V 9 G 0

de função Potência.

Chama-se Pe{ôCX) = dj com ÕG 6,

de poder do teste contra a alternativa 6. Ou seja, dada a hi

põtese alternativa o 6 0, , o poder do teste nos da a probabi

lidade de, sendo verdadeira a hipótese alternativa, ela ser

aceita.

Exemplo:

No exemplo de 2.4.5.1 a função potência é:

FCe)

=s

(n ) eDci

- e)n~j

v e e [0,2.

(78)

( *? )

eD(i

- e )n

D

e e (0,2;

íj

j=k

3

Dado um teste randomizado, a probabilidade de

rejeição de Hq quando X tiver distribuição P ê:

E. (j) (X) = <}> (x) dPQ (x)

tí J O

a probabilidade condicional <j) (x) de rejeição dado x, integra

do com respeito â distribuição de probabilidade de X.

0 problema ê selecionar <í> para maximizar a furi

ção potência.

Eg <kx) v e e ei

sujeito a

eo _D <kx) < a v e e 0O

Em alguns casos acontece que o mesmo teste $

quando ha mais de uma.

Neste caso, <j> ê chamado teste uniformemente

mais poderoso CTUMP).

Para o caso de duas hipóteses simples, temos o

(79)

2.5.4 - Lema Neyman-P, earson

Sejam

Po

e Pi

distribuições

de

probabilidade

com

densidade

p0

e pn

, respectivamente,

com

respeito

a uma

me

dida Csem

perda

de

generalidade,

pode-se

admitir

y

= Pj +

P2).

i)

Existência:

Para

testar

H:

p0

contra

a

al

ternativa K: pj existe um teste <|> e uma constante k tal que:

Eo <f>OO = a (1)

1 se pa Cx) > k po Cx)

(2)

.0 se p! Cx) < k Po Cx)

ii) Condição suficiente para T.U.M.P.

Se um teste satisfaz Cl) e (2) para algum k,en

tão

ê o

T.U.M.P.

para

testar

p0

contra

pi

no

nível

a.

iii) Condição necessária para T.U.M.P.

Se

<J)

é T.U.M.P.

no

nível

a para

testar

p0

con

tra pi , então para algum k ele satisfaz (2) q.t.p. y.

Também

satisfaz

Cl)

a menos

que

exista

um

tes

te de tamanho <; çx, e potência 1.

Qbs: Tamanho de um teste é definido como: