METODOLOGIA - http://tede.mackenzie.br/jspui/bitstream/tede/3444/5/DANIEL%20JOS%C3%89%20MACHADO

Regressões aparentementes não relacionadas

O artigo original de Zellner (1962) apresenta as considerações econômicas gerais que motivam o estudo da situação de regressões aparentemente não relacionadas. A extensão ao caso não-linear é motivada por uma preocupação com o erro de especificação resultante do uso de uma aproximação linear de um modelo econômico que é mais precisamente descrito de forma não linear.

Zellner (1962) explica que, dado um modelo de regressão normal multivariada em forma padrão com uma matriz de dados e uma matriz de design, é possível converter o problema em um problema de regressão aparentemente não relacionado (SUR) por uma simples transformação da matriz de design. A principal ideia do SUR é que, em vez de ter um vetor de parâmetros comum em todas as séries de dados, você possui um vetor de parâmetro separado associado a cada série separada ou a grupos distintos de séries que, no entanto, compartilham uma covariância residual comum. É essa capacidade de agregar e desagregar séries e realizar testes comparativos em cada projeto que é o poder de SUR

O modelo SUR proposto por Zellner (1962) é uma generalização de um modelo de regressão linear. Consiste em várias equações de regressão, cada um com sua própria variável dependente e potencialmente diferentes conjuntos de variáveis explicativas exógenas. Cada equação é uma regressão linear válida por si só e pode ser estimada em separado – por isso que o sistema é chamado de aparentemente não relacionado. Os termos de erro são considerados correlacionados entre todas as equações12_.

A estimação dos modelos foi feita a partir da metodologia proposta por McElroy e Burmeister (1988), também utilizada por Shor, Bonomo e Pereira (2002) aplicado ao mercado brasileiro, em que equações foram estimadas conjuntamente como um sistema de equações pelo método Seemingly Unrelated Regression (SUR) disponível no Financial Econometrics

Toolbox do MATLAB R2017a. Os estimadores são obtidos em três estágios. Primeiro estima-

se por mínimos quadrados ordinários, equação por equação. No segundo estágio, estima-se a matriz de covariância dos resíduos. Por fim, estimam-se os parâmetros do sistema não-linear que minimizem a forma quadrática. Estes estimadores são consistentes e com distribuição

12_{Dois casos em que não há nenhum ganho na estimativa do sistema em conjunto SUR ≡ OLS equação-}

por-equação: (i) quando a matriz Σ é diagonal, não há correlações cruzadas entre os termos da equação de erro. Sistemas não aparentemente, mas verdadeiramente independentes. (ii) quando cada equação contém exatamente o mesmo conjunto de variáveis explicativas X1 = X2 = ... = Xm, os avaliadores são numericamente idênticos ao OLS.

assintoticamente normal, mesmo na ausência de normalidade na distribuição dos resíduos. Servem de base para os testes de hipóteses, o que não ocorre com estimadores obtidos através da análise fatorial. O método iterativo que ocorre entre o segundo e terceiro estágio, produzem resíduos com distribuição normal e fornece estimadores de máxima verossimilhança.

Teste de razão de verossimilhança para análise empírica do APT

Segue a evolução dos métodos para precificação de ativos utilizados no APT, cuja aplicação também pode ser estendida ao CAPM e aos 3F-FF, desde o método de dois estágios proposto por Fama e MacBeth (1973), até a proposta alternativa em um único estágio de Bekker, Dobbelstein e Wansbeek (1996). Tomando como base o desenvolvimento de Campbell, Lo e MacKilay (1997), como ponto de partida, tem-se:

D = + 3ED+ D (10)

tal que:

%( D) = 0; %( D DF) = 0; %(3ED) = GE;

%)(3ED− GE)(3ED− GE)′* = ΩE; (3ED, D) = 0

Sendo que o é o vetor de retornos dos ativos, o é a matriz de cargas dos retornos dos ativos em relação aos fatores, o 3é o vetor de fatores e o é o vetor de perturbações.

Estimação do modelo:

(i) Usa-se o excesso de retorno do ativo em relação ao portfólio zero-beta e o excesso de retorno do fator em relação a sua média;

(ii) Não pressupõe a existência de uma taxa livre de riscos. Modelo restrito:

D = ( '(− 'I) + 3ED+ D (11)

Em que:

'I≡ GE+ KE (12)

Sendo que o '₍ é o zero-beta, o G_E é a média do K-ésimo fator e o K_E é o prêmio de risco.

A obtenção dos estimadores de máxima verossimilhança (MVS) do modelo restrito é feita através de processo interativo. Os valores iniciais: MVS do modelo irrestrito. A restrição imposta sobre a constante:_{= '}₍_{− '}_I. O teste da restrição é feito a partir da estatística de razão de MVS, ajustada para pequenas amostras. A distribuição assintótica _@₍ é _LM com ₋

= − 1 graus de liberdade. A estimativa dos prêmios de risco é obtida indiretamente através de 'I:

N = −( − − =)OlnRΣSR − lnRΣS∗_RU _D₍₁₃₎

Os testes de MVS mostram que a inclusão de portfólios transacionáveis e de variáveis fundamentais melhora a capacidade de explicar o comportamento de séries de tempo dos retornos esperados dos ativos. Os resultados dos testes rejeitam a hipótese @₍de que os fatores têm coeficientes de sensibilidade (prêmio de risco das variáveis fundamentais) iguais a zero. Entretanto, o teste de razão de MVS requer a estimação dos modelos restrito e irrestrito; além disso, a utilização de estimadores em dois estágios é ineficiente.

Alternativa para o método de estimação de dois estágios pela técnica SUR

Trabalhos de McElroy e Burmeister (1988) e Schor, Bonomo e Pereira (2002): Estimação do APT:

(i) Modelo fatorial com restrição imposta à constante; e

(ii) Através de um modelo de regressão multivariada não-linear.

D = K(D+ V 6K6 E 6WI + V 636D E 6WI + D = 1,⋅⋅⋅, ; - = 1,⋅⋅⋅, ; Y = 1,⋅⋅⋅, = (14)

Em que o _D é o retorno do ativo no tempo -, o K_(D é a constante com restrição no tempo _{-, o} ₆ é a sensibilidade do ativo i às inovações do _{Y − é} fator, o _K₆ são os prêmios de risco associados ao Y − é fator, o 3_6D é o vetor de fatores do Y − é fator no tempo - e o D é o vetor de perturbações no tempo -.

São equações lineares em períodos de tempo e observações de retornos de ativos (portfólios) em função de = fatores. É o ponto de partida para estimar os =| ₆ e os =|K6 parâmetros. Há uma restrição sobre as constantes e uma restrição entre as equações do

modelo. É um modelo de equações não-lineares com uma restrição entre as equações. A estimação do modelo com técnicas SUR – Seemingly Unrelated Regression (regressores aparentemente não relacionados) fornece estimadores eficientes.

Os estimadores são obtidos em três estágios: (i) no primeiro são estimados os parâmetros por mínimos quadrados ordinários, equação por equação. Os K| são identificados e substituídos por uma constante. Este primeiro estágio coincide com a estimação em dois estágios proposta por Fama e MacBeth (1973), mas neste caso o resultado utilizado não é

formado pelos parâmetros estimados, mas pelos resíduos. (ii) no segundo estágio, a partir dos resíduos é estimada a matriz de covariância dos resíduosΣˆ. (iii) no terceiro estágio esta matriz

é utilizada para estimar os parâmetros do sistema não-linear que minimizem a forma quadrática. Rescrevendo a equação (14) por SUR:

[ ≡ − K(= VOK6\] + 36U E

6WI

6+ = 1,⋅⋅⋅, ; Y = 1,⋅⋅⋅, = (15)

Em que \_] é uma matriz de ‘uns’ definida por × 1 vetores. O retorno do ativo é dado por _{= (} _I_,⋅⋅⋅, _])′, sendo o = 1,⋅⋅⋅, . A constante com restrição é dada por K₍₌ (K( I,⋅⋅⋅, K( ])F. A sensibilidade do ativo às inovações do Y − é fator é dada por K6. O

vetor de fatores é designado por ₃₆ _{= O3}_6I_{,⋅⋅⋅, 3}_6]_{U′, sendo Y = 1,⋅⋅⋅, =. Por fim, =} ( I,⋅⋅⋅, ^])′, sendo = 1,⋅⋅⋅, , designa o vetor de perturbações.

A variável dependente em (15) é o excesso taxa de retorno, _{[ ≡ − K}₍, a qual exige que K₍ seja observada, como se tem assumido. Generalizações a uma taxa livre de risco não observada (p. ex., K₍= '₍__D+ '_IK₍∗, em que K₍∗ é observado) são diretas. Reescrevendo (15):

[ = )(K′⨂\]) + a*5 + = b(K)5 + = 1,⋅⋅⋅, (16)

Sendo ⨂ o produto de Kronecker; _E×Ic = (K_I,⋅⋅⋅, K_E)′; _]×Ed = (3_I,⋅⋅⋅, 3_E);

E×I= (5I,⋅⋅⋅, 5E)′ em que = 1,⋅⋅⋅, e g(c)]×E= (K′⨂\]) + a.

Empilhando as _{1 equações de rendimentos:}

( )

             +               ×             =               N 2 1 N 2 1 N 2 1 ε ε ε b b b λ X 0 0 0 λ X 0 0 0 λ X ρ ρ ρ M M L M O M M L L M Em notação matricial: [ = )_h⨂b(K)*5 + ; %(ε) = 0j]; %( F) = )Σ⨂_]* (17)

Foi assumido que × = fatores da matriz a, bem como os grupos × = da matriz de sensibilidades _{2 = k5}₆_{l são colunas de posto cheio. Também foi assumido que > >} = e que > = ( + 1), assegurando que (17) tem mais equações do que incógnitas. Por conseguinte, a condição necessária para que os estimadores não-lineares de regressão

aparentemente não relacionadas – SUR (Seemingly Unrelated Regression) – está satisfeita. A matriz Jacobiana13_{– matriz coluna de posto cheio – da função (18):}

m(KF_{, 5′) = n} o

o(KF_{, 5′)p q)_}h⨂b(K)*5r = )2⨂\], _j⨂b(K)* (18)

Estimadores SUR podem ser obtidos em três passos. Passo (i) é estimar (17) por meio de equação-por-equação (neste caso, ação-a-ação) os Mínimos Quadrados Ordinários (MQO).

Nesta etapa (K_I_{,⋅⋅⋅, K}_E) não é identificado, assim uma substituição K′5 com intercepto , para cada = 1,⋅⋅⋅, , é selecionado um N para minimizar (, − sN )F(, − sN ), em que N = O , 56,⋅⋅⋅, 5EU′ e s = )\], a*. Este primeiro passo coincide com o primeiro passo do

procedimento comum de dois passos de Fama e MacBeth (1973) e outros. O resultado a ser usado deste passo não é, no entanto NS , mas os resíduos. Passo (ii) usa o vetor de resíduos t̂ = , − sNS , em que = 1,⋅⋅⋅, , para estimar Σ como ΣS = kvw6l = k xIt̂ t̂6l. No Passo (iii) o

estimador SUR OKy , 5zU é escolhido para minimizar a forma quadrática:

{OK, 5; ΣSU = q, − )_h⨂b(K)*5rFO|}~•⨂€•Uq‚x)ƒ„⨂g(c)*er (19)

Finalmente, com as condições adicionais de regularidade dadas por Gallant (1975, 1987), OKy , 5zU é fortemente consistente para (KF, 5′) e I M⁄ OKy , 5zU − (KF, 5′) e assintoticamente normal com média 0 e matriz de covariância ΩxI, para qual Ω…xI é um estimador fortemente e consistente, sendo:

Ω… = xI_mFOc_‡,ezFU† _OΣS_xI_{⨂_}

]UmOK…,5z′U (20) F

Aqui mOK′…, 5z′U indica a m(⋅) avaliada em OK′…, 5z′U.

Estes são estimadores SUR, mesmo na ausência de normalidade na distribuição dos resíduos, fortemente consistentes e com distribuição assintoticamente normal, elas formam a base para os testes de hipóteses assintóticos clássicos, o que não ocorre com os estimadores obtidos pela análise fatorial. Se apesar disso, os resíduos continuarem multivariadamente normal, o método iterativo fornece estimadores de máxima verossimilhança (MVS) para determinação de rendimentos SUR (ITNLSUR14_{) MQO (Mínimos Quadrados Ordinários) com}

13_{A Matriz Jacobiana (denominado do matemático alemão Carl Gustav Jakob Jacobi) é a matriz formada}

pelas derivadas parciais de primeira ordem de uma função vetorial. Se uma função é diferenciável num ponto, a sua derivada é dada em coordenadas pela Jacobiana, mas uma função não precisa ser diferenciável para a existência da Jacobiana; basta que as derivadas parciais existam.

14_{McElroy e Burmeister (1988) observam que Iterated nonlinear seemingly unrelated regression}

(ITNLSUR) – estimadores não-lineares iterados de regressão aparentemente não relacionadas seria uma denominação completa e mais apropriada, contudo, esta tese emprega o termo SUR de maneira generalizada.

informação cheia. A iteração ocorre entre estágios dois e três, ou seja, entre a matriz de covariância Σ e os parâmetros (K, 5).

Para a ( + 1) − é iteração, resíduos das estimativas mais recentes,

t̃(Š), − bOKy(Š)U5z(Š), são usados para atualizar a matriz de covariância, Σz(Š) =

kv‹(Š) 6l = k xIt̃′(Š)t̃(Š)6l, que, por sua vez, atualiza a forma quadrática a {OK, 5; Σz(Š)U. A

minimização dessa forma quadrática produz a próxima rodada de estimadores _OKy_ŠŒI_{, 5z}_ŠŒI_{U. Sob} condições de regularidade dadas por Gallant (1987), como tende para o infinito este procedimento converge para o MQO (cauda equivalente).

Sendo estimadores de mínimos quadrados, estes estimadores SUR são também fortemente consistentes e assintoticamente normal, mesmo que a distribuição de erro saia da normalidade. Provas dessas proposições estão contidas em Gallant e Holly (1980), Gallant e Jorgensen (1979) e, especialmente, Gallant (1987). A suposição da normalidade é frequentemente questionada em retornos de ativos. É especialmente importante que os estimadores SUR e os testes sejam robustos em relação aos desvios da normalidade. Ao contrário da análise fatorial e outros métodos comuns com base em erros normais, eles fornecem alguma potencial proteção contra esta importante especificação.

O modelo APT pela técnica SUR

Proposta de Bekker, Dobbelstein e Wansbeek (1996):

O modelo APT geralmente é discriminado em duas etapas, consistindo o primeiro passo na estimação de um modelo de análise fatorial e o segundo passo na regressão dos fatores de variáveis observáveis. McElroy e Burmeister (1988) demonstram que o APT pode ser estimada em uma só etapa, o que leva a um modelo de regressão não-linear aparentemente não relacionados (SUR). A técnica denominada pelos autores como ITNLSUR (Iterated nonlinear

seemingly unrelated regression) é muito exigente do ponto de vista computacional, pois

envolve um problema não-linear em muitos parâmetros. No entanto, o grau de não-linearidade não é muito elevado, porque o modelo só permite a bi-linearidade.

Critérios de informação

Os Critérios de Informação Akaike e Bayesiano foram utilizados para classificar os modelos computados. Conforme o Portalaction (2017), o Critério de Informação de Akaike (AIC) é definido como

em que A_‚ é a função de máxima verossimilhança do modelo e , é o número de variáveis explicativas consideradas no modelo.

O Critério de Informação Bayesiano (BIC) é definido como

2_ ‚= −2 logOA‚U + 2)(, + 1) + 1* log(1) (22)

Tanto o AIC quanto o BIC aumentam conforme SQE (Soma dos Quadrados dos Erros) aumenta. Além disso, ambos critérios penalizam modelos com muitas variáveis sendo que valores menores de AIC e BIC são preferíveis. Como modelos com mais variáveis tendem a produzir menor SQE mas usam mais parâmetros, a melhor escolha é balancear o ajuste com a quantidade de variáveis.

Tanto o critério de seleção de amostras AIC como o BIC impõem um ônus por incluir um número cada vez maior de regressores. Assim, segundo Gujarati e Porter (2011) há um

trade-off entre a qualidade do ajuste do modelo e sua complexidade (julgada pelo número de

regressores). O BIC impõe medidas corretivas mais duras que o AIC, como fica evidente ao comparar a Equação (21) com a (22). Tanto o AIC, como o BIC, podem ser usados para comparar o desempenho do modelo quando as previsões são feitas dentro e fora da amostra. A previsão fora da amostra procura determinar como um modelo ajustado prevê os valores futuros do regressando, dados os valores dos regressores.

Por impor medidas corretivas mais duras, nesta tese o critério BIC foi adotado preferencialmente na seleção dos modelos, sendo o AIC utilizado para efeito de alguma evidenciação.

Critério de avaliação dos betas

Pela hipótese nula (H0) os coeficientes betas não são significativos em determinado

nível de p-value. Pela hipótese alternativa (Ha) os betas são significativos, pode-se rejeitar H0

quando o p-value for menor ou igual a 1% (identificado por ***), 5% (identificado por **), ou 10% (identificado por *), quanto menor, mais significativo, ou t-statistic maior ou igual a 2,58, 1,96 ou 1,65, respectivamente. Para análise desta tese foi adotado o nível de significância de 5%, ou seja, o risco de cometer o erro tipo 1 de rejeitar H0 quando é verdadeira. Os outros dois

No documento http://tede.mackenzie.br/jspui/bitstream/tede/3444/5/DANIEL%20JOS%C3%89%20MACHADO (páginas 39-46)