Econometria parte I novo

(1)

UnB/CCA - Prof. Otávio Medeiros 1

Econometria Parte I

Introdução à Regressão Linear

Métodos Quantitativos Aplicados à

Contabilidade (MQAC)

(2)

Regressão

Regressão

• _{Tem como objetivo a descrição e a avaliação da relação entre uma}

(3)

Notação

• _{Denota-se a variável dependente por}

_y

_e

_as

_variáveis

independentes por

x

₁

, x

₂

, ... , x

_k

onde

k

é o número de variáveis

independentes.

• _{Nomes alternativos para as variáveis}

_y

_e

_x

_:

y

x

variável dependente

variáveis independentes

regressando

regressores

variável efeito

variáveis causais

(4)

Diferença entre Regressão e Correlação

• _{Quando dizemos que}_y_e_x_{são correlacionadas, significa que estamos}

tratando y e x de uma maneira completamente simétrica.

• _{Na regressão, tratamos a variável dependente (}_y_{) e as independentes}

(x’s) de modo muito diferente.

• _{A variável}_y_{é supostamente aleatória ou “estocástica”, i.e. possui uma}

distribuição de probabilidades.

• _{As variáveis}_x_{têm supostamente valores fixos (“não-estocásticos”) em}

(5)

Regressão Linear Simples

• _{Por simplicidade, digamos que}_k_{= 1. Nesta situação,}_y_{depende somente de}

uma variável x.

• _{Exemplos do tipo de relação que podem ser tratadas dessa forma:}

– _{Relação entre o lucro líquido das empresas e o retorno de uma ação.} – _{Relação entre o retorno em excesso de uma ação e o retorno em}

excesso da carteira de mercado.

(6)

Regressão Linear Simples

• _{Se dispomos de uma amostra com valores passados (históricos) para}_y_e_x_,

podemos construir um gráfico de pontos tendo esses valores como coordenadas.

• _{A regressão consiste em encontrar uma reta que passe pelos pontos com o}

(7)

Regressão Linear Simples

• _{Se temos de valores passados para} _y_e_x_{, podemos construir um}

gráfico de pontos com esses valores como coordenadas.

• _{A regressão consiste em encontrar uma reta que passe pelos pontos}

com o melhor ajustamento possível.

• • • • • • • •

y

(8)

Regressão Linear Simples

• • • • • • • •

y

x

a

b

= tg

q

a = intercepto ou constante; q = ângulo

(9)

População e Amostra

• _{População é a coleção total de todos os objetos ou indivíduos a serem}

estudados, por exemplo:

• _{Estamos interessados em} _População

prever o resultado o eleitorado todo

de uma eleição

• _{Uma amostra é uma seleção de alguns itens da população.}

• _{Uma amostra aleatória e uma amostra em que cada item individual tem a}

mesma probabilidade de ser escolhido.

• _{Censo: quando amostra = população}

• _{Notação: por convenção, os coeficientes da verdadeira regressão}

(população) são chamados de  e , enquanto os coeficientes da regressão

estimada (amostral) são chamados de e ).

(10)

FRP e FRA

• _{A função de regressão populacional (FRP) é uma descrição do modelo que}

está supostamente gerando os dados reais e que representa a verdadeira relação entre as variáveis (os valores verdadeiros de  e ).

• _{A função de regressão amostral (FRA) é o modelo obtido com base nos}

dados amostrais

• _{A FRP é}

• _{A FRA é}

• _{Usamos a FRA para inferir os parâmetros da FRP.}

t

t x

yˆ __ˆ __ˆ

t t

t

x

u

y



t t

t y y

(11)

Regressão Linear Simples: Exemplo CAPM

• _{CAPM: Modelo de Precificação de Ativos de Capital}

• _{O CAPM pressupõe que, para investidores com carteiras}

diversificadas, existe uma relação linear entre o retorno em

excesso de uma ação e o retorno em excesso da carteira de

mercado:

( ) ou ( )

R = retorno do ativo; R =retorno da carteira de mercado; R = retorno do ativo livre de risco.

O coeficiente (risco sistemático) pode ser estimado através da reg

a f m f a f m f

a m

f

R R _ R R R R _ R R



     

ressão:

( )

a f m f

t t t t t

(12)

Regressão Simples: Exemplo CAPM

• _{Sejam os seguintes dados sobre os retornos em excesso de um fundo de}

investimentos e os retornos em excesso de um índice de mercado:

• Conforme indica a teoria do CAPM, queremos saber se há uma relação entre x e y com base nos dados disponíveis e se o beta é positivo. O primeiro passo seria construir um gráfico de dispersão.

ano, t

Retorno em excesso do fundo

= Ra_–_Rf

Retorno em excesso do índice de mercado

= Rm_-_Rf

1 17.8 13.7

2 39.0 23.2

3 12.8 6.9

4 24.2 16.8

(13)

Gráfico

Retorno em excesso da carteira de mercado (Rm_-Rf₎

R et or no e m e xc es so d o fu nd o (R i -R f ) 0 5 10 15 20 25 30 35 40 45

0 5 10 15 20 25

Excess return on market portfolio

(14)

A Equação da Reta de Regressão

• _{Podemos usar a equação geral da linha reta,}

y=a+bx

para encontrar a linha que melhor se ajusta aos dados.

• _{Entretanto, essa equação}_(y₌_a₊_bx_{) é determinística: os pontos teriam}

de estar exatamente sobre a reta.

• _{A posição dos pontos em relação à reta é estocástica. Então, é}

necessário acrescentar um erro aleatório, u na equação.

y_t =  + x_t + u_t

(15)

O erro aleatório

• _{O erro pode capturar vários aspectos:}

- Um modelo é uma simplificação do mundo real - Sempre haverá variáveis faltantes para explicar y_t

(16)

Determinação dos coeficientes da regressão

• _{Como determinar}__e__?

• _Escolhemos__e_ _{de modo que as distâncias verticais entre os pontos e a}

reta sejam minimizadas, de modo que a reta se ajuste aos dados o melhor

possível: y

(17)

Método dos Mínimos Quadrados (MMQ = OLS)

• _{O método mais comum para ajustar uma reta aos dados é}

conhecido como mínimos quadrados ou “ordinary least

squares” (OLS).

• _{As distâncias entre cada ponto e a reta são elevadas ao}

quadrado e somadas. Essa soma é então minimizada.

• _Notação:

y

_t

são os dados reais

t

são os pontos correspondentes sobre a reta

são os resíduos,

y

_t

-

yˆ_t

t yˆ

(18)

Método dos Mínimos Quadrados (MMQ)

• _{O Método dos mínimos quadrados foi proposto pelo}

matemático alemão Carl Friedrich Gauss em 1795.

(19)

(20)

Método dos Mínimos Quadrados (MMQ)

•





_ 2 5 2 4 2 3 2 2 2

1

ˆ

u

_



 5 1 2 ˆ t t u



ˆ



2



yt  yt



2

ˆ_t

(21)

21

Dedução do estimador de MQ

•

0 ˆ

ˆ

0 )

ˆ

(

_



t t

t t t

x

T

y

x

y

_



yt Ty



xt Tx



t t t i t t

x

y

L

(

ˆ

)

2

(

_

ˆ

_

ˆ

)

2

t

x

y

ˆ

_

ˆ

_

ˆ



t t t

x

y

L

0 )

ˆ

(

2 ˆ



    

t t t t

x y x L 0 ) ˆ ˆ ( 2

ˆ



(22)

Dedução do estimador de MQ

•

(23)

Dedução do estimador de MQ

• _{De (2),} ₍₄₎

• _{De (3),} ₍₅₎

• _{Substituindo (5) em (4),}



  

t t t t

x y

x ( _ˆ _ˆ ) 0

x

y 

ˆ   ˆ



t t t t

t t t t t t

t t t t

(24)

Dedução do estimador de MQ

•

_



x

_t

T

y

x

_t

y

_t

x

T

)

(

ˆ

2 2



2 2

ˆ

t t

_e

_ˆ

ˆ

t

x y

Txy

y

x

Tx



(25)

Fórmula alternativa para

• _{Utilizando os operadores de covariância e variância,}

podemos escrever:

(1)

(2)

• _{Dividindo (1) por (2) obtemos:}

que é equivalente à formula do na página anterior.

•

(26)

Exemplo 1

• _{Considere uma amostra com 5 observações (T=5), sendo y}

uma variável dependente e x uma variável explanatória,

conforme tabela abaixo:

• _{Usando o método de mínimos quadrados, calcule os}

coeficientes e , escreva a equação da reta de regressão e

faça um gráfico da reta.

•

(27)

Solução Exemplo 1

• _Cálculos:

(28)

Solução: gráfico

0.5 1 1.5 2 2.5 3 3.5 4 4.5

0 0.5 1 1.5 2 2.5 3 3.5

f(x) = 0.31 x + 1.46

Regressão

x

(29)

Exemplo em finanças: CAPM

• _{No exemplo do CAPM mostrado anteriormente, utilizar as 5}

observações para estimar a regressão produz as estimativas = -1.74 e = 1.64.

• _{A equação da reta será:}

• _{Pergunta: se uma analista afirma que espera que o mercado produzirá um}

retorno 20% maior que a taxa livre de risco no próximo ano, qual será o retorno esperado do fundo X?

• _{Solução: valor esperado de}_y_{= -1.74 + 1.64*}_x_{, portanto, fazendo}_x_{= 20}

obtem-se o valor esperado de y:





 06 . 31 20 64 . 1 74 . 1

ˆ_i _ _ _ _ _

y

t

x

(30)

Exemplo em finanças: CAPM

• _{Modelo econométrico:}

• _Fórmulas:

• _Solução:

• _Equação:

30 t t

x

y

ˆ

_

1 .

74 _

1 .

64

( )

a f m f

t t t t t

R R   R R u

2 2

ˆ t t _e _ˆ ˆ

t

x y Txy

(31)

Exemplo contábil: relação lucro x

retorno da ação

• _{Desejamos saber se a empresa X apresenta uma relação}

significante entre o retorno da sua ação e a taxa de

crescimento dos seus lucros trimestrais. Os lucros são

divulgados com 3 meses de defasagem e, portanto, o

mercado só é informado sobre o lucro 3 meses após o

encerramento do período. A amostra é de 5 observações,

conforme abaixo:

(32)

Exemplo contábil: relação lucro x

retorno da ação

•

32

2 2

ˆ t t _e _ˆ ˆ

t

x y Txy

y x x Tx

     



(33)

Linearidade

• _{No método de mínimos quadrados, precisamos de um modelo que seja}

linear nos parâmetros ( e  ), mas nao necessariamente linear nas

variáveis (y e x).

• _{Linear nos parâmetros significa que os parâmetros não estão multiplicados}

entre si, divididos, elevados ao quadrado ou ao cubo, etc.

• _{Alguns modelos podem ser transformados em modelos lineares através de}

uma substituição ou manipulação adequada, por exemplo, o modelo de regressão exponencial

• _Fazendo_y

t=ln Yt e xt=ln Xt

t t

t

x

u

y



t t

t u

t

e

X

e

Y

X

u

(34)

Modelos Lineares e Não-lineares

• _{Isso é conhecido como modelo de regressão exponencial, onde os}

coeficientes são interpretados como elasticidades.

• _{Similarmente, se uma teoria sugere que} _y_e _x_{devem ser inversamente}

relacionados:

então a regressão pode ser estimada por mínimos quadrados, substituindo

• _{Alguns modelos são intrinsicamente não-lineares, e.g.}

t t

t u

x y 



t t

x

z

_

1

t t

t

x

u

(35)

Premissas da Regressão Linear

• Os resíduos têm média zero

A variância dos resíduos é constante e finita

Os resíduos são estatisticamente

(36)

Premissas da Regressão Linear

• Uma premissa alternativa à 4, ligeiramente mais forte, é que os x_t’s

são variáveis não-estocásticas ou fixas em amostras repetidas ou, ainda, exógenas.

• _{Uma 5}a_{premissa é necessária se quisermos fazer inferências sobre os}

parâmetrosda população (os verdadeiros  e ) a partir dos parâmetros

amostrais ( e ).

(37)

Propriedades do estimador de mínimos quadrados

•



(38)

Estimativa da variância dos erros (resíduos)

•

2 t

u



2

1

t

u

T

s



2

1 _ˆ

t

u

T

(39)

Estimativa da Variância dos erros (resíduos)

•

• _{Graus de liberdade = tamanho da amostra menos parâmetros a serem}

estimados

2 2 ˆ

2

t

u s

T



(40)

Confiabilidade de

• _{Qualquer conjunto de estimativas de regressão é específico}

para a amostra usada em sua estimativa.

• _{Se uma amostra diferente de dados foi selecionada a partir}

da população, os dados serão diferentes, levando a

diferentes valores das estimativas de OLS.

• _{Seria desejável ter uma ideia de quão boas essas}

estimativas de α e β são, para termos alguma medida da

confiabilidade ou precisão.

• _{Assim, é útil saber se podemos confiar nas estimativas, e}

se elas variam muito de uma amostra para outra amostra

dentro da população dada.

•

(41)

Confiabilidade de (cont.)

• _{Uma ideia da variabilidade amostral e, portanto, da}

precisão das estimativas pode ser calculada usando apenas

os dados amostrais disponíveis.

• _{Esta estimativa é dada pelo erro padrão.}

• _{Considerando as premissas 1 a 4 acima, pode-se}

demonstrar que os estimadores dos erros-padrão são:

(42)

Exemplo 1 (slide 26): Cálculo dos

erros padrões de e

1. Cálculo dos resíduos, da variância e do desvio-padrão dos

resíduos:



•

(43)

Cálculo dos erros padrões de e (cont.)

• _{Cálculo de e :}

•

(44)

Uma Introdução à Inferência Estatística

• _{A estimação dos parâmetros da regressão por si só não nos}

informa qual é o grau de confiabilidade dessas estimativas

• _{Para quantificar esse grau de confiabilidade, é necessário}

(45)

Uma Introdução à Inferência

Estatística

• _{Queremos fazer inferências sobre os valores prováveis da população dos}

parâmetros da regressão.

Exemplo: Suponhamos os seguintes resultados de uma regressão:

• _{é uma estimativa pontual do parâmetro populacional}__{. Quão confiável é essa}

estimativa?

• _{A confiabilidade da estimativa pontual é medida pelo erro padrão do}

coeficiente.

•

ˆ_t 20,3 0,5091 _t

(46)

UnB/CCA - Prof. Otávio Medeiros 46 Testes de Hipóteses: teste bicaudal

• _{Podemos usar a informação contida na amostra para fazer inferências sobre a}

população.

• _{Há sempre 2 hipóteses feitas em conjunto: a hipótese nula (H}₀_{) e a hipótese}

alternativa (H₁).

• _{A hipótese nula é a afirmação que está realmente sendo testada. A hipótese}

alternativa representa o que ocorre se a hipótese nula for rejeitada.

• _{Por exemplo, suponhamos que na regressão anterior, estamos interessados na}

hipótese de que o verdadeiro valor de  é na verdade 0.5. Usaríamos a notação:

H₀:  = 0,5

H₁ :   0,5

(47)

UnB/CCA - Prof. Otávio Medeiros 47 Testes de Hipótese Unicaudais

• _{Algumas vezes, podemos ter alguma informação prévia de que, por exemplo, devemos esperar}

 > 0,5 ao invés de  < 0,5. Nesses casos, faríamos um teste unicaudal:

H₀:  = 0,5

H₁ :  > 0,5

ou, ao contrário, poderíamos ter H₀:  = 0,5

H₁ :  < 0,5

• _{Entretanto, para realizar esses testes de hipóteses precisamos conhecer os erros-padrões dos}

(48)

A Distribuição de Probabilidade dos Estimadores de MQ

• _{Distribuições} _de _{probabilidades} _normais _são

caracterizadas por dois parâmetros: média e variância

• _{Assumimos na premissa 5 que os resíduos têm média}

zero e variância igual a 2, isto é, u_t _ N(0,2)

• _{Os estimadores de MQ são combinações lineares das}

variáveis aleatórias y e x.

• _{Combinações lineares de variáveis normalmente}

distribuídas são também normalmente distribuídas, logo

 N(, Var())  N(, Var())

(49)

A Distribuição de Probabilidade dos Estimadores de MQ

• _{Essas distribuições de probabilidades normais não são}

padronizadas.

• _{Assim, para utilizá-las, teríamos de ter infinitas}

distribuições normais para infinitas possibilidades de

valores de



e var(



) e de



e var(



).

• _{Entretanto, é possível converter qualquer distribuição}

normal em uma distribuição normal padrão, subtraindo-se

do parâmetro a sua média e dividindo-se esse resultado

pelo desvio-padrão do parâmetro.

• _{Essas distribuições normais padrões terão média igual a 0}

(50)

UnB/CCA - Prof. Otávio Medeiros 50 A Distribuição de Probabilidade dos Estimadores de MQ

• _{Variáveis normais padronizadas}_{podem ser construídas para e :}

• _{Mas var(}__{) e var(}__{) são desconhecidas, então as}_{variâncias populacionais}

têm de ser substituídas pelas variâncias amostrais

• _{Com isso, em vez da}_{distribuição normal}_{, é necessário utilizar a} distribuição t-Student:

e

• _{A perda de 2 graus de liberdade ocorre porque é necessário estimar 2}

parâmetros: e

•

  ~  0,1

var ˆ N    

  ~  0,1

(51)

UnB/CCA - Prof. Otávio Medeiros 51 Teste de Hipóteses: O Enfoque do Teste de Significância

• _{Seja a equação de regressão:}

• _{As etapas para a realização de um teste de significância são:}

1) Estimar e , e SE(

2) Calcular as estatísticas-teste t() e t(), dadas pelas fórmulas:

e

onde * e * são respectivamente os valores de  e  sob a hipótese nula.

•

t t t x u

(52)

O Enfoque do Teste de Significância

3) Precisamos de uma distribuição tabulada para comparar a estatística teste estimada. Pode-se demonstrar que na regressão linear simples as estatísticas teste seguem uma distribuição t com T-2 graus de liberdade.

4) Precisamos escolher um “nível de significância”, geralmente denominado  (não é o intercepto da regressão!). É também

chamado de “tamanho do teste” e ele determina a região onde rejeitaremos ou não a hipótese nula que estamos testando.

(53)

UnB/CCA - Prof. Otávio Medeiros 53 Determinando a Região de Rejeição de um Teste de Significância

5) Dado um nível de significância (), podemos determinar a região de

rejeição e a região de não rejeição. Para um teste bicaudal com  = 5%:

f(x)

95% non-rejection region

2.5%

rejection region _{rejection region}2.5%

Região de

rejeiçã o

Região de

rejeiçã o

Região de

(54)

UnB/CCA - Prof. Otávio Medeiros 54 Região de Rejeição para um teste unicaudal (cauda superior) a 5%

f(x)

95% non-rejection

regionRegião de 5% rejection region

não-rejeição

Região de

(55)

UnB/CCA - Prof. Otávio Medeiros 55 Região de Rejeição para um teste uni-caudal (cauda inferior) a 5%

f(x)

95% non-rejection region 5% rejection region

Região de

rejeição

Região de

(56)

Teste de Significância: Conclusão

6) Use as tabelas da distribuição t para obter o valor crítico com o qual comparar a estatística teste.