U IVERSIDADE TÉC ICA DE LISBOA

(1)

1

Instituto Superior de Economia e Gestão

U IVERSIDADE TÉC ICA DE LISBOA

Estimação de elasticidades constantes:

Deveremos logaritmizar?

Fábio Alexandre Campos

Orientação: Professora Doutora Isabel Maria Dias Proença

MESTRADO EM: DECISÃO ECO ÓMIA E EMPRESARIAL

(2)

i

Agradecimentos

Cabe me neste curto espaço agradecer a todos aqueles que de uma forma ou de outra

contribuíram para a prossecução e concretização deste trabalho.

As minhas primeiras palavras vão para a minha orientadora, a Dra. Isabel Maria Dias

Proença. A ela agradeço a incansável ajuda que me prestou nestes últimos meses, pela

presença sempre constante, pela frequente disponibilidade e pelo interesse que

demonstrou desde o início pela realização deste trabalho. Sem ela, dificilmente este

barco teria atingido o seu porto de chegada.

Quero agradecer também a todos os docentes do mestrado de Decisão Económica e

Empresarial, pelo apoio e conhecimentos transmitidos ao longo do ano e meio, que

durou a componente lectiva deste mestrado.

Agradeço também à Sinase, a empresa de consultadoria onde trabalho e onde sempre

trabalhei desde o inicio deste mestrado, e que me permitiu sempre conciliar a

componente laboral com a prossecução do mestrado.

Quero deixar umas palavras de agradecimento para o Joel e para o Bruno, meus colegas

de mestrado, com quem partilhei muitas horas de estudo, preocupações e bons

momentos. Um grande abraço para vocês.

Por último não quero deixar de agradecer à minha mãe e irmãos por todo o apoio

(3)

ii

Resumo

Há muito que os Economistas ignoram as implicações da desigualdade de Jensen. Na

estimação de modelos económicos não lineares, a prática habitual consiste em log

linearizar o modelo. Para que este procedimento seja válido é necessário assumir um

conjunto de hipóteses que na realidade revelam se muito restritas.

Neste trabalho, e seguindo de perto a abordagem de Santos Silva e Tenreyro (2006),

procura se analisar as implicações inerentes à estimação de elasticidades constantes a

partir do modelo não linear e do seu equivalente linear. Estas implicações serão

analisadas dos pontos de vista teórico e empírico.

Do ponto de vista teórico, demonstra se que a prática de estimar modelos linearizados

pode levar a estimativas enviesadas. Por outro lado, a aplicação empírica, não conduz a

uma conclusão tão assertiva. Todavia, a complexidade dos métodos de estimação de

modelos não lineares torna a sua utilização menos atractiva face ao OLS. No entanto, as

razões teóricas são suficientemente fortes para se concluir que o modelo não deverá ser

logaritmizado. Contudo, tal decisão cabe em última análise naturalmente ao utilizador, e

caso este decida não logaritmizar deverá ter em conta as respectivas implicações,

realizar todos os testes de especificação disponíveis e interpretar e analisar as

estimativas obtidas com cautela.

(4)

iii

Abstract

Economists have long ignored the implications of Jensen's Inequality. In the estimation

of non linear economic models, the usual practice is to log linearize the model. For this

procedure to be valid it´s necessary to take a set of assumptions which turn out to be

very strict.

This work, follows closely the approach of Santos Silva and Tenreyro (2006), and seeks

to analyze the implications inherent in the estimation of elasticity constants from the

nonlinear model and its linear equivalent. These implications will be considered in a

theoretical and empirical point of view.

From the theoretical point of view, it’s demonstrated that the practice of estimating

linearized models can lead to biased estimates. On the other hand, the empirical

application does not lead to a conclusion so assertive. However, the complexity of the

estimation methods of nonlinear models makes their use less attractive compared to

OLS. However, the theoretical reasons are strong enough to conclude that the model

should not be taken in logarithmic form. However, ultimately this decision belongs to

the user, if it should decide to apply the logarithm form, it should take into account the

implications, perform all the specification tests available, interpret and analyze the

estimates obtained carefully.

(5)

iv

Índice

1. Introdução ... 1

2. Enquadramento Teórico ... 3

2.1 Introdução ao conceito de Elasticidade ... 3

2.2 Tipos de Elasticidades ... 3

2.2.1 – Elasticidade Preço da Procura ... 3

2.2.2 Elasticidade Preço da Oferta... 4

2.2.3 Elasticidade Preço Cruzada ... 4

2.2.4 – Elasticidade Rendimento da Procura ... 4

2.3 Definição do conceito de elasticidade ... 5

2.4 A elasticidade no seio da Econometria ... 6

2.4.1 O modelo teórico... 6

2.4.2 O modelo empírico ... 6

2.5. O cálculo da elasticidade: modelos lineares e modelos não lineares ... 7

2.5.1 O cálculo das elasticidades nos modelos lineares ... 7

2.5.2 O cálculo das elasticidades nos modelos não lineares ... 7

2.5.2.1 Introdução da variável residual na forma aditiva ... 8

2.5.2.2 Introdução da variável residual na forma multiplicativa ... 8

2.6 – A Desigualdade de Jensen: linearizar vs não linearizar ... 9

2.7 Estimação ... 12

2.7.1 – O Estimador Ordinary Least Squares (OLS) ... 12

2.7.2 – O Estimador on Linear Least Squares (NLS) ... 13

2.7.3 – O Estimador Pseudo Maximum Likelihood (PML) ... 14

3. Análise Empírica ... 16

3.1 Dados ... 16

3.2 Resultados Empíricos ... 18

3.3 Testes de validade do OLS ... 22

3.3.1 Teste de Park ... 22

3.3.2 Testes de Heterocedasticidade na variável residual multiplicativa... 23

3.3.2.1 Teste 1 ... 23

3.3.2.2 Teste 2 ... 24

3.4 Comparação dos resultados obtidos pela aplicação dos estimadores OLS e PML ... 25

4. Conclusão ... 27

(6)

v

Anexos ... 30

Anexo A ... 30

Anexo B ... 34

Anexo C ... 37

Anexo D ... 39

Anexo E ... 41

(7)

1

1. Introdução

“Economists have long been aware that Jensen’s inequality implies that ( ) ≠ ( ) , that is, the expected value of a random variable is different from the logarithm of its expected value. This basic fact however, has been neglected in many econometric

applications.” Santos Silva e Tenreyro (2006).

Esta afirmação de Santos Silva e Tenreyro (2006) é o ponto de partida deste trabalho, e

consequentemente da questão: Estimação de elasticidades constantes: Deveremos

logaritmizar?

Em Economia, na estimação de elasticidades, os economistas têm uma clara preferência

por elasticidades constantes, em parte porque as mesmas são mais fáceis de interpretar,

o que os leva a especificarem modelos não lineares do tipo da função de Cobb Douglas.

O procedimento habitual consiste em log linearizar este modelo permitindo de uma

forma rápida e intuitiva obter a elasticidade pretendida. No entanto, como mencionado

por Santos Silva e Tenreyro (2006), há muito que os Economistas ignoram as

implicações da desigualdade de Jensen ao log linearizar o modelo na estimação dos

respectivos parâmetros desconhecidos. De facto, para que este procedimento seja

correcto, é necessário assumir um conjunto de hipóteses que na prática acabam por ser

muito restritas. Assim, neste trabalho, e seguindo de perto a metodologia de Santos

Silva e Tenreyro (2006), procura se analisar as implicações inerentes à estimação de

elasticidades constantes num modelo na sua forma linear e na sua forma não linear.

Estas implicações serão analisadas primeiro sobre o ponto de vista teórico e depois

através da realização de um estudo empírico.

Este trabalho, encontra se assim estruturado em duas partes fulcrais. A primeira parte

inicia se com um enquadramento geral do conceito de elasticidade, seguindo se uma

abordagem deste conceito nos modelos econométricos, distinguindo se entre modelos

lineares e não lineares com diferentes formas de incorporação da variável residual, e

respectivas consequências na estimação das elasticidades. Esta parte culmina com uma

(8)

2

A segunda parte recai sobre uma análise empírica com dados cedidos por Yatchew e

utilizados no seu estudo “Household Gasoline Demand in Canada” em Yatchew e

Joungyeo (2001).

A aplicação empírica tem como objectivo estimar as elasticidades preço e rendimento

da procura de combustível, usando o procedimento habitual baseado no OLS e a

proposta inovadora de Santos Silva e Tenreyo (2006) que estima os parâmetros

directamente do modelo não linear através do estimador PML. No final serão

(9)

3

2. Enquadramento Teórico

2.1 4 Introdução ao conceito de Elasticidade

A elasticidade no seio da teoria económica é um conceito que assume extrema

importância. Na verdade o conceito de elasticidade é muito útil para compreender o

efeito da variação exógena das variáveis económicas em diversos indicadores

nomeadamente, a incidência de impostos indirectos, conceitos marginais e de como eles

se relacionam com a teoria da empresa, da distribuição da riqueza e de diferentes tipos

de bens, e como a escolha dos bens se relaciona com as escolhas do consumidor. Além

disto é também um conceito crucialmente importante em qualquer debate sobre a

distribuição do bem estar, excedente do consumidor, excedente do produtor e excedente

orçamental.

2.2 4 Tipos de Elasticidades

Em economia a elasticidade aparece indexada a diversos conceitos, que são usados para

determinar reacções e estabelecer algumas relações, sendo exemplos desses conceitos os

referidos a seguir.

2.2.1 – Elasticidade4Preço da Procura

Esta elasticidade, relaciona a variação percentual da quantidade

procurada de um produto com a variação percentual do preço desse

produto sendo usada para determinar as reacções do consumidor às

variações no preço. Este tipo de elasticidade quando conhecida pelos

produtores permite a estes deduzir que tipos de variações deverão incutir

no preço para aumentar a sua receita total;

(10)

4

2.2.2 4 Elasticidade4Preço da Oferta

Este tipo de elasticidade relaciona a variação percentual da quantidade

oferecida de um produto com a variação percentual do seu preço, sendo

determinante para saber as reacções do produtor às variações no preço;

!"# $ =∆% _∆% %&_ç

2.2.3 4 Elasticidade4Preço Cruzada

A Elasticidade Preço Cruzada, relaciona a variação percentual da

quantidade oferecida de um produto X com a variação percentual do

preço de um produto Y, sendo usada para determinar o tipo de relação de

consumo entre os produtos X e Y, permitindo determinar se estes são

bens complementares (Elasticidade Preço Cruzada <0), substitutos

(Elasticidade Preço Cruzada >0) ou se não tem qualquer relação de

consumo entre si (Elasticidade Preço Cruzada =0);

#ç '( ) * =∆% _∆% _ç ₊

2.2.4 – Elasticidade4Rendimento da Procura

Este tipo de elasticidade, mede a relação entre a variação da quantidade

procurada de um bem em função da variação percentual ocorrida no

rendimento, permitindo assim estabelecer se o bem em causa é um bem

de luxo (Elasticidade Rendimento da Procura> 1), normal (0<

Elasticidade Rendimento da Procura<1) ou inferior(Elasticidade

Rendimento da Procura <0)

(11)

5

Os conceitos acima mencionados são de natureza microeconómica, contudo o conceito

de elasticidade estende se a um outro conjunto de áreas, como por exemplo o mercado

cambial e as exportações.

2.3 4 Definição do conceito de elasticidade

Generalizando o conceito de elasticidade, suponha se que existe uma relação funcional

entre e 1, tal que = &(1). A elasticidade de em ordem a 1, representa o grau de sensibilidade da variável , face a variações exógenas na variável 1 que a determina. Algebricamente, a elasticidade é dada pela variação percentual na variável dividida

pela variação percentual na variável 1, sendo determinada pela fórmula

∗_{( ; 1) =}%∆

%∆1 =

∆ × 100 ∆1

1 × 100

= ∆_{∆1 ×}1

No caso particular em que as variáveis e 1 são contínuas e a função f é derivável, a elasticidade pontual de em ordem a 1 será dada por,

( ; 1) = lim_∆:→< ∆_{∆1 ×}1 _{= 1 ×}1 = &(1)_{1 ×}_&(1)1

Com &(1) > 0 e 1 > 0, é o equivalente a ter,

( ; 1) = _{1 =} &(1)₁

Na maioria das ciências económicas, quando abordamos o conceito de elasticidade, a

fórmula que está em causa é a fórmula (1).

(2) (1)

(12)

6 2.4 4 A elasticidade no seio da Econometria

Segundo Goldberger, citado por Silva Ribeiro (2010), a Econometria, pode ser definida

como “ a ciência social em que as ferramentas da teoria económica, da matemática e

da inferência estatística são utilizadas na análise de fenómenos económicos”, pelo que

na Econometria a própria noção de elasticidade, tem de se adaptar ao próprio contexto

estatístico, sem contudo perder o seu sentido intuitivo económico.

2.4.1 4 O modelo teórico

De uma forma geral quando se procura estabelecer a relação entre variáveis, com o

objectivo de determinar, explicar ou prever o seu comportamento, são utilizados

modelos que são especificados tendo por base a teoria económica. Estes modelos

assumem uma relação exacta, sendo designados como modelos teóricos que podem

assumir por exemplo uma relação linear, do género = > + @1, ou uma relação do tipo de função de Cobb Douglas = A1B, entre outros exemplos possíveis. Esta função tem a particularidade de que a elasticidade entre e 1 é constante (não depende nem de 1 nem de ), sendo por isso muito popular entre os economistas.

2.4.2 4 O modelo empírico

Para existir uma maior aderência do modelo à realidade económica e em particular aos

dados, é comum adicionar ao modelo teórico uma variável aleatória que se designa

por variável residual. Esta é não observável e abrange o conjunto de todos os factores

que não foram considerados no modelo teórico, mas que podem afectar o

comportamento da variável explicada, podendo estes factores incluir variáveis não

observáveis, variáveis omitidas e erros de medida. Estes tipos de modelos designam se

por modelos empíricos. Nestes modelos, a relação entre e 1 deixa de ser exacta pois para o mesmo 1 podem corresponder diferentes valores de .

(13)

7 : = D |1F_{1 ×} _{D |1F =}1 &(1)_{1 ×}_&(1)1

de forma a obter uma expressão semelhante a (2).

Caso D |1F > 0 e 1 > 0, a equação (4), é equivalente a,

: = D ( |1)F₍₁₎

2.5. 4 O cálculo da elasticidade: modelos lineares e modelos não lineares

Em Econometria, podem distinguir se dois grandes grupos de especificação no que

concerne à modelação de dados, os modelos lineares nos parâmetros e os não lineares.

Consoante o tipo de modelo adoptado, o cálculo da elasticidade pode assumir diferentes

expressões.

2.5.1 4 O cálculo das elasticidades nos modelos lineares

No que concerne aos modelos lineares empíricos, estes geralmente assumem a

formulação, = @_<+ @_G1 + , e a fórmula a usar será a (4). Como D |1F corresponde ao modelo teórico, = @_<+ @_G1, a elasticidade é igual a,

: = @G×1

2.5.2 4 O cálculo das elasticidades nos modelos não lineares

Relativamente aos modelos não lineares, são geralmente consideradas formulações para

o modelo teórico do tipo = A1BH_{, com} > 0_e1 > 0_{onde, esta formulação é}

facilmente linearizável atendendo a que

(4)

(14)

8

= A1BH = β_IJB_HK-: ⟺ =_β

<+ @G 1.

Neste modelo, facilmente se deduz a elasticidade de em ordem a 1 recorrendo a (3), obtendo se,

:= _{1 = @}G

Na construção do modelo não linear empírico, podem distinguir se duas opções que

diferem na forma como a variável residual é incorporada no modelo teórico, podendo

esta ser integrada de um forma aditiva ou multiplicativa.

2.5.2.1 4 Introdução da variável residual na forma aditiva

No que diz respeito à introdução na forma aditiva, iremos incidir sobre a função = β_IJB_HK-: + M_{, que é um modelo que não é passível de ser linearizado. Assim}

assumindo a hipótese DM|1F = 0 obtêm se D |1F = βIJBHK-:_{, sendo este o modelo}

teórico de partida. Neste caso facilmente se deduz a elasticidade recorrendo a (5) onde,

:= @G.

No entanto, a hipótese DM|1F = 0, pode ser uma hipótese muito restritiva, nomeadamente porque se tem que M > − BIJ BHK-:_{de forma a que} > 0_.

2.5.2.2 4 Introdução da variável residual na forma multiplicativa

Por outro lado temos a forma multiplicativa, que é uma abordagem habitualmente mais

usada, pois permite linearizar o modelo. Nesta iremos recorrer à função =

β_IJB_HK-: × = β_IJB_HK-:J _{, que poderá ser linearizada para} = _β

<+ @G 1 +

(15)

9

Assumindo a hipótese D |1F = 1, então D |1)F = βIJBHK-: _, _:_{calcular se á com}

recurso a (5), e _:= @_G. No entanto, partindo do modelo linearizado = β_<+ @_G 1 + , e assumindo simultaneamente D |1F = 0, chegaríamos ao mesmo resultado se aplicássemos a seguinte fórmula,

: = D ( |1)F₁

O facto de para esta situação particular as fórmulas (5) e (6) conduzirem ao mesmo

resultado, levou a que a forma multiplicativa de adição do termo de erro fosse muito

usada pois a fórmula (6) permite, após a linearização do modelo obter a elasticidade _: de uma forma imediata. Este é o procedimento a que habitualmente se recorre,

independentemente de se verificarem as hipóteses mencionadas ou não.

2.6 – A Desigualdade de Jensen: linearizar vs não linearizar

Como verificado, a obtenção da elasticidade _:, pode ser independente da linearização ou não do modelo em causa. No entanto as fórmulas (5) e (6) podem não ser

equivalentes, todavia para melhor entender esta situação é importante introduzir o

conceito da Desigualdade de Jensen. Este é um resultado, desenvolvido pelo

matemático holandês Johan Jensen. Na sua forma mais simples esta desigualdade define

que para uma função &(1) convexa, verifica se que D&(1)F ≥ &D (1)F, e um dos corolários desta desigualdade, refere que se verifica a inversão da desigualdade para

funções concavas como é o caso da função logaritmica.

Comparando melhor as fórmulas (5) e (6), generaliza se que segundo a desigualdade de

Jensen, verificar se ia que ln D |1F ≥ D |1F donde as fórmulas (5) e (6) nem sempre conduzem ao mesmo resultado. No entanto e como foi constatado, as duas

fórmulas conduzem a resultados idênticos, se se verificarem as hipóteses D |1F = 0 e D |1F = 1.

Todavia na realidade as hipóteses D |1F = 1 e D |1F = 0 podem ser violadas. Como exemplo considerem se as situações abaixo indicadas onde = βIJBHK-: × _.

(16)

10

Exemplo A: D |1F = 0 e D |1F ≠ 1

A.i) Se |1~S(0, UV), (UV > 0)) então é conhecido que, D |1F = WX/V;

Com recurso a (5) vem,

: = ln ( D |1F)₍₁₎ = ln(

β_IJB_HK-: × D |1F)

(1) = ln(

β_IJB_HK-: × WX/V)

(1) = @G

: = D ( |1)F₁ = D (

β_IJB_HK-: × )F

1 =

(β_<+ @_G 1 + D |1F)

1 = @G

A.ii) Com heterocedasticidade em que |1~S(0, UV(1)), supondo , por exemplo que UV(1) = Z_G 1, com Z_G > 0 e 1 > 0 então

D |1F = [V K-:H

e portanto vem,

D |1F = β_IJB_HK-: _{× D |1F =} β_IJB_HK-: _× \H_XK-:

⇔ D |1F = β_IJ(B_HJ \H_X) K-:

:= ln ( D |1F)₍₁₎ = ln(

β_IJ(B_HJ [_{V ) K-:}H ₎

(1) =

Dβ_<+(@_G+ Z_{2 ) 1F}G

(1) = @G + Z2 G

Com recurso a (6) vem

: = D ( |1)F₁ = D (

β_IJB_HK-: × )F

1 =

(β_<+ @_G 1 + D |1F)

(17)

11

Exemplo B: D |1F ≠ 0 e D |1F = 1

B.i) Se |1~S(_, UV), (UV > 0)) então é conhecido que D |1F = `J aXX

e como D |1F = < = 1 vem,

_ +U_{2 = 0 ⇔ _ = D |1F = −}V U₂V

Com recurso a (5) temos,

:= ln ( D |1F)₍₁₎ = ln(

β_IJB_HK-: _{× D |1F)}

(1) = ln(

β_IJB_HK-: ₎

(1) = @G

Com recurso a (6) teremos

: = D ( |1)F₁ = D (

β_IJB_HK-: × )F

1 =

(β_<+ @_G 1 + D |1F) 1

= (β<+ @G 1 − U

V

2 )

1 = @G

B.ii) Com heterocedasticidade em que |1~S(_, UV(1)), supondo , por exemplo que UV(1) = Z_G 1, com Z_G > 0 e 1 > 0 então

D |1F = `J [_{V K-(:)}H

o que implica que

_ = D |1F = − Z_{2 (1)}G

:= D ( |1)F_{(1) =} ln(

β_IJB_HK-: × D |1F)

(1) = ln(

β_IJB_HK-: )

(18)

12

Com recurso a (6) temos,

: = D ( |1)F₁ = D (

β_IJB_HK-: _{× )F}

1 =

(β_<+ @_G 1 + D |1F) 1

= (β<+ @G 1 − Z₁ 2 (1))G = (β<+ (@G− Z₁ 2 ) 1)G = @G− Z₂G

Nos exemplos acima mencionados, no caso em que existe homocedasticidade, o efeito

decorrente da violação das hipóteses D |1F = 1 e D |1F = 0, é absorvido pelo termo independente, conduzindo as fórmulas (5) e (6) ao mesmo resultado. Todavia e como

podemos constatar, a existência de heterocedasticidade, tanto no exemplo A como no

exemplo B, leva a que as fórmulas (5) e (6) conduzam a resultados distintos.

2.7 4 Estimação

Até este ponto, o objectivo concentrou se na dedução da elasticidade em função de

diferentes tipos de modelação que podem ser adoptados. Como a elasticidade depende

dos parâmetros desconhecidos do modelo, também é importante abordar o tópico da

estimação destes parâmetros.

2.7.1 – O Estimador Ordinary Least Squares (OLS)

Um dos estimadores mais populares em econometria é o OLS. Este é um método muito

utilizado quando trabalhamos com modelos lineares nos coeficientes do tipo,

= @<+ @G1 +

O OLS permite assim obter as estimativas @b e _< @b que minimizam a soma do quadrado _G dos resíduos onde c = − c é o resíduo, e,

(19)

13

Este estimador verifica o conhecido resultado de ser centrado e de variância mínima

dentro da classe dos estimadores lineares não enviesados, se verificar as hipóteses

designadas como hipóteses de Gauss Markov, enunciadas de seguida:

1. O modelo em causa deve ser linear nos parâmetros;

2. D |1F = 0;

3. Não deve existir multicolinariedade perfeita;

4. O termo de erro deve ser homocedástico e não autocorrelacionado.

Por outro lado o estimador OLS é também consistente desde que e 1 não sejam correlacionados.

No caso do modelo não linear introduzido na secção anterior, o procedimento de

estimação habitual consiste em aplicar o OLS ao modelo linearizado = @<+ @G 1 + assumindo D |1F = 0. No entanto, este procedimento é inapropriado

por um conjunto de razões. A primeira destas razões é a situação em que = 0, neste caso não será possível obter , não sendo possível linearizar o modelo e aplicar o

OLS. A segunda e terceira razão são abordadas por Santos Silva e Tenreyro (2006).

Segundo estes autores, quando dD |1F é heterocedástica, D |1F pode depender de vários aspectos da distribuição condicional de , (veja se o exemplo B da secção

anterior), podendo verificar se D |1F ≠ 0, ser função de 1 não permitindo assim possível estimar os parâmetros do modelo de forma consistente. Santos Silva e Tenreyo

referem no seu artigo, que mesmo que se estime de forma consistente D |1F, este pode não permitir a identificação dos parâmetros de D |1F. É o caso do exemplo A. Sendo esta apontada como a terceira razão para a inadequabilidade do OLS.

2.7.2 – O Estimador ;on Linear Least Squares ( LS)

Dada a inadequabilidade do OLS para estimar o modelo na sua forma log linear, é

necessário estimar o modelo na forma não linear. Para este efeito um dos estimadores

passíveis de ser usado é o estimador NLS. O NLS é um estimador que assenta nas

(20)

14

1. D |1F = ℎ(1, @), onde ℎ(1, @) representa uma função que deverá ser diferenciável duas vezes;

2. Os parâmetros do modelo devem ser identificáveis;

3. D |ℎ(1, @)F = 0;

4. O termo de erro deve ser homocedástico e não autocorrelacionado.

Tal como o OLS, o NLS procura obter os @f, que minimizem a soma do quadrado dos resíduos, sendo o resíduo c = − ℎ(1, @f). Em relação às propriedades o estimador NLS, não possui um bom comportamento com amostras pequenas, embora verificando

se as hipótese 1 a 3 enunciadas no parágrafo anterior se prove que é consistente. Não se

verificando a hipótese 4, as variâncias devem ser estimadas de forma robusta1.

2.7.3 – O Estimador Pseudo Maximum Likelihood (PML)

Alternativamente ao estimador NLS, Santos Silva e Tenreyro (2006) sugerem a

utilização de estimador baseado na maximização de uma Pseudo Verosimilhança

(PML). Este procedimento tem como base o resultado teórico de Pseudo

Verosimilhanças obtido por Gourieroux, Monfort e Trognon (1984). Segundo estes

autores, caso a distribuição do modelo a estimar pertença à família das distribuições

exponenciais lineares, e desde que exista uma coincidência das médias condicionais

entre a distribuição verdadeira dos dados e uma outra distribuição conveniente, então, o

ponto que maximiza a função de verosimilhança da distribuição que não é a verdadeira,

será estimador consistente dos parâmetros da média condicional da distribuição

verdadeira dos dados. Contudo neste processo as variâncias têm de ser estimadas de

forma robusta. Santos Silva e Tenreyo (2006) sugerem o uso da distribuição de Poisson

para construir a Pseudo Verosimilhança.

Estes autores conduziram um estudo de simulação com o objectivo de aferir a

performance de diferentes métodos, para estimar modelos de elasticidades constantes na

presença de vários padrões de heterocedasticidade. Para o efeito usaram um modelo

multiplicativo do tipo D |1_G, 1_VF = 1g(@_<+ @_G1_G+ @_V1_V), com várias especificações possíveis para d D |1_G, 1_VF.

1

(21)

15

Os resultados obtidos são muito esclarecedores. Por um lado Santos Silva e Tenreyro

(2006), argumentam que o estimador OLS bem como o estimador OLS em que os dados

foram modificados para lidar com a existência de zeros na amostra apresentam uma

baixa performance, concluindo que só em situações excepcionais é que é recomendado

fazer estimações com base em modelos log lineares. Um resultado surpreendente obtido

neste estudo foi o facto do estimador NLS apresentar uma performance muito abaixo da

esperada, devendo se este resultado ao comportamento errático deste estimador na

presença de heterocedasticidade. O estimador PML baseado numa Poisson (PPML)

apresenta resultados encorajadores, apresentando mesmo um comportamento melhor

que o NLS. Por um lado o estimador PPML, apresenta enviesamentos sempre menores,

por outro é um estimador simples de implementar e é confiável para um conjunto de

situações. Com base nestes resultados, e à semelhança de Santos Silva e Tenreyro

(2006), iremos também optar pelo estimador PPML em alternativa ao OLS do modelo

(22)

16

3. Análise Empírica

Nesta secção do trabalho serão analisados e comparados os resultados obtidos através da

aplicação dos estimadores PML e OLS. Esta secção encontra se dividida em 4

subsecções. Na primeira serão apresentados os dados a serem utilizados. A segunda

subsecção irá incluir uma análise inicial dos resultados empíricos obtidos decorrentes da

estimação com as metodologias referidas e a aplicação de alguns testes de

especificação. Na terceira subsecção serão abordados alguns testes realizados com o

intuito de avaliar a validade de aplicação do estimador OLS e na última subsecção as

elasticidades obtidas pelos dois métodos de estimação serão comparadas.

3.1 4 Dados

Os dados usados neste trabalho são uma cross section com 2464 observaçõesreferente

ao ano de 1996 dos dados obtidos do ational Private Vehicle Use Survey, conduzido

por um conjunto de técnicos canadianos entre Outubro de 1994 e Setembro de 1996.

Os dados em causa, contêm informação sobre os veículos, padrões de consumo de

combustível e aspectos socioeconómicos de agregados familiares com pelo menos um

condutor. O preço foi obtido dividindo o valor total gasto mensalmente em combustível

pelo nº total de litros consumido. Relativamente ao rendimento, este é reportado ao ano

anterior. Como proxy para o consumo de combustível a base de dados disponível

considerou a distância percorrida pelo agregado familiar. Para agregados familiares com

mais do que um veículo, é seleccionado um aleatoriamente na altura da entrevista,

sendo a variável dependente igual ao número de quilómetros percorridos por este

veículo. Foi ainda recolhida informação relativa à idade do condutor em que, no caso de

existirem mais do que 1 veículo, representa a idade do condutor do veículo

seleccionado. Dado que tendencialmente os condutores que vivem na cidade tendem a

conduzir menos do que os outros com iguais características, foi incluída uma variável

dummy para avaliar este efeito.

Em resumo, as variáveis que irão ser utilizadas no decurso da análise empírica são:

DIST – Representa a distância percorrida por mês pelo condutor seleccionado;

(23)

17

INCOME – Rendimento anual do agregado familiar;

DRIVERS – Número de condutores habilitados para conduzir existentes no

agregado familiar;

HHSIZE – Tamanho do agregado familiar;

VEH – Número de veículos do agregado familiar;

AGE – Idade do elemento representante do agregado familiar;

AGE2 – Representa a variável AGE ao quadrado;

MONTH j – Mês em que os dados foram recolhidos (j=1,…,8);

YSINGLE – Variável dummy que assume o valor 1 para indivíduos solteiros

com idade até 35 anos;

RETIRE – Variável dummy que assume o valor 1 para representantes do

agregado familiar com idade superior a 65 anos;

DUR – Variável dummy que assume o valor 1 para indivíduos que sejam da

cidade.

As estatísticas descritivas referentes a estas variáveis encontram se na tabela 1,

Tabela 1 4 Estatísticas descritivas

Variáveis Média Desvio

padrão Mínimo Máximo

DIST 1625,25 1210,11 15 17198

PRICE ($CAD/Litro) 0,588 0,059 0,23 0,81

INCOME ($CAD) 50073,1 25272,3 20000 10000

DRIVER 1,911 0,72 1 6

HHSIZE 2,806 1,315 1 6

VEH 1,518 0,631 1 5

AGE 46,59 12,4 19 66

YSINGLE 0,028 0,165 0 1

RETIRE 0,137 0,344 0 1

DUR 0,713 0,452 0 1

Das estatísticas acima, é de mencionar o facto de que no conjunto de dados estudado, só

existem 2,8% de indivíduos solteiros com mais de 35 anos, e que só existem 13,7% de

indivíduos reformados. Por outro lado constata se que grande parte dos elementos da

amostra (71,3%) são condutores urbanos. É de salientar que em média cada agregado

familiar tem 1,5 veículos, e é constituído por 3 indivíduos, e tem 2 condutores com

(24)

18 3.2 4 Resultados Empíricos

Nesta secção apresentam se os resultados obtidos da estimação do seguinte modelo que

explica o consumo de combustível de um agregado familiar, usando como proxy do

consumo a variável DIST,

h i(jklm) = @<+ @G i( 0kn ) + @V i(kSn%o ) + @pj0kd 0 + @qrrlks

+ @td r + @uvw + @xvw V+ @yjz0 + { @yJ|

y

|}G

o%Smr|+

Este modelo foi estimado pelo OLS e o modelo equivalente não linear pelo PML,

recorrendo para o efeito ao programa Time Series Processor (TSP) versão 5.12.

Os resultados obtidos encontram se na tabela 2,

Tabela 2 4 Modelos PML e OLS estimados com todas as variáveis

Variável

PML OLS

Estimativa Erro

Padrão t pobs Estimativa

Erro

Padrão t pobs

CO STA TE 1,5482 0,3732 4,1489 0,0000 4,8010 0,3624 13,2478 0,0000

LPRICE 0,4127 0,1519 2,7179 0,0070 0,5617 0,1367 4,1095 0,0000

LI COME 0,1485 0,0332 4,4714 0,0000 0,1903 0,0306 6,2274 0,0000

DRIVER 0,1641 0,0275 5,9590 0,0000 0,1805 0,0246 7,3372 0,0000

HHSIZE 0,0084 0,0153 0,5502 0,5820 0,0051 0,0141 0,3599 0,7190

VEH 0,1542 0,0328 4,6953 0,0000 0,1945 0,0274 7,0909 0,0000

AGE 0,0248 0,0109 2,2707 0,0230 0,0179 0,0107 1,6798 0,0930

AGE2 0,0003 0,0001 2,7759 0,0060 0,0003 0,0001 2,1984 0,0280

YSI GLE 0,1155 0,1170 0,9868 0,3240 0,0569 0,1040 0,5471 0,5840

RETIRE 0,0912 0,0766 1,1920 0,2330 0,0000 0,0699 0,0001 1,0000

DUR 0,2120 0,0326 6,4960 0,0000 0,2674 0,0292 9,1420 0,0000

MO TH 1 0,2303 0,0686 3,3566 0,0010 0,2162 0,0562 3,8487 0,0000

MO TH 2 0,3131 0,0651 4,8069 0,0000 0,2940 0,0584 5,0304 0,0000

MO TH 3 0,1301 0,0764 1,7025 0,0890 0,1458 0,0587 2,4857 0,0130

MO TH 4 0,1558 0,0605 2,5750 0,0100 0,1006 0,0527 1,9099 0,0560

MO TH 5 0,0183 0,0640 0,2860 0,7750 0,0105 0,0578 0,1821 0,8550

2

(25)

19

MO TH 6 0,0384 0,0608 0,6315 0,5280 0,0234 0,0537 0,4366 0,6620

MO TH 7 0,0532 0,0671 0,7925 0,4280 0,0537 0,0592 0,9078 0,3640

MO TH 8 0,0993 0,0692 1,4350 0,1510 0,0918 0,0575 1,5972 0,1100

Log Likelihood 3552,34 2473,06

º de

observações 2464 2464

Teste RESET 1 Estatística: 0,6841 pobs: 0,4940 Estatística: 0,5311 pobs: 0,5954

Teste RESET 2 Estatística: 2,9952 pobs: 0,2237 Estatística: 5,3256 pobs: 0,0698

ota: Estimador robusto das variâncias

As variâncias do PML foram estimadas com o Estimador de Eicker White dado que este

estimador é obtido através de uma pseudo verosimilhança. Relativamente ao OLS e

como podemos constatar pelos resultados evidenciados na tabela 3, os valor p dos testes

efectuados evidenciam a existência de heterocedasticidade e consequentemente as

variâncias foram estimadas com o estimador robusto de White.

Tabela 3 – Resultado dos testes de heterocedasticidade aplicados ao OLS

Teste

Valor da Estatística de

Teste LM

pobs

Breusch Pagan 55,93 0,00001

White

Simplificado 43,49 0,00

Com o intuito de avaliar a forma funcional dos modelos, foram aplicados testes RESET,

com os valores ajustados ao quadrado (teste RESET 1) e com os valores ajustados ao

quadrado e ao cubo (teste RESET 2).Numa primeira análise dos resultados, constata se

que os testes RESET aplicados não evidenciam má especificação dos modelos a 5%.

Salienta se também que as elasticidades associadas às variáveis PRICE e INCOME

apresentam os sinais esperados. Isto é, um aumento do rendimento do agregado familiar

leva a um aumento no consumo da combustível e um aumento no preço da combustível

leva a uma redução no consumo de combustível. Ao analisar as demais variáveis, é de

(26)

20

significativas, pelo que se procedeu a um teste de significância conjunta das mesmas.

Os resultados deste teste, evidenciados na tabela 4 e sugerem que estas variáveis não

são conjuntamente significativas, pelo que as mesmas foram removidas dos modelos em

estudo.

Tabela 4 4 Resultados do teste de significância conjunta às variáveis HHSIZE, YSI GLE e

RETIRE

Teste

PML OLS

Estatística

Teste pobs

Estatística

Teste pobs

Teste do rácio das

Verosimilhanças 2,6723 0,44495

Teste de coeficientes de

Wald 0,3669 0,947

A nova estimação dos modelos com exclusão das variáveis HHSIZE, YSINGLE e

RETIRE, levou aos seguintes resultados:

Tabela 5 4 Modelos PML e OLS estimados sem as variáveis HHSIZE, YSI GLE e RETIRE

Variável

PML Restrito OLS Restrito

Estimativa Erro

Padrão t pobs Estimativa

Erro

Padrão t pobs

CO STA TE 1,2831 0,3683 3,4837 0,0000 4,8411 0,3432 14,1053 0,0000

LPRICE 0,4148 0,1508 2,7512 0,0060 0,5632 0,1366 4,1226 0,0000

LI COME 0,1435 0,0337 4,2564 0,0000 0,1890 0,0307 6,1592 0,0000

DRIVER 0,1497 0,0246 6,0775 0,0000 0,1829 0,0219 8,3513 0,0000

VEH 0,1540 0,0330 4,6620 0,0000 0,1941 0,0274 7,0708 0,0000

AGE 0,0144 0,0101 1,4259 0,1540 0,0176 0,0090 1,9538 0,0510

AGE2 0,0002 0,0001 1,9553 0,0510 0,0003 0,0001 2,7777 0,0060

DUR 0,2094 0,0326 6,4299 0,0000 0,2669 0,0292 9,1377 0,0000

MO TH 1 0,2343 0,0685 3,4198 0,0010 0,2179 0,0559 3,8917 0,0000

MO TH 2 0,3133 0,0654 4,7897 0,0000 0,2933 0,0584 5,0219 0,0000

(27)

21 MO TH 4 0,1569 0,0608 2,5798 0,0100 0,1004 0,0525 1,9116 0,0560

MO TH 5 0,0203 0,0643 0,3164 0,7520 0,0100 0,0576 0,1740 0,8620

MO TH 6 0,0408 0,0612 0,6668 0,5050 0,0233 0,0536 0,4346 0,6640

MO TH 7 0,0519 0,0676 0,7677 0,4430 0,0545 0,0590 0,9235 0,3560

MO TH 8 0,1008 0,0696 1,4478 0,1480 0,0930 0,0575 1,6172 0,1060

Log Likelihood 3553,68 2473,29

º de

observações 2464 2464

Teste RESET 1 Estatistica: 1,0522 pobs: 0,2930 Estatistica Teste: 0,4774 pobs: 0,6331

Teste RESET 2 Estatistica: 5,6078 pobs: 0,0606 Estatistica Teste: 5,4210 pobs: 0,0665

ota: Estimador robusto das variâncias

Como podemos constatar pela análise da tabela 5, a não inclusão das variáveis HHSIZE,

YSINGLE e RETIRE, pouco influenciou as estimativas das restantes variáveis com

excepção da variável AGE no PML, que passou a ter um valor p superior a 0,05.

Todavia e como a variável AGE2, apresenta significância estatística, resolveu se manter

a variável AGE no modelo.

Nestes novos modelos a variável AGE, apresenta o efeito quadrático que seria de

esperar que tivesse, em que no PML, o aumento de um ano de idade, leva a um aumento

no consumo de combustível de forma decrescente revertendo se este efeito aos 36 anos.

No OLS o ponto de inflexão é atingido pouco depois dos 29 anos.

Relativamente às variáveis, DRIVER e VEH, é de salientar que influenciam o consumo

de combustível em sentidos diferentes. Assim, um aumento de um condutor no

agregado familiar (mantendo tudo o resto constante), faz aumentar o consumo de

combustível, ao passo que, mantendo o número de condutores (e as demais variáveis

constantes), a existência de mais um veículo no agregado familiar fará diminuir o

consumo de combustível no veículo seleccionado.

No que diz respeito à variável DUR, verifica se o esperado ou seja que os condutores

urbanos consomem menos combustível do que os outros com iguais características. Em

que no PML, os condutores urbanos consomem menos 18,97% ao passo que no OLS os

(28)

22

Nos modelos estimados, foram incorporadas variáveis dummy que representam o mês

em que os dados foram recolhidos. Para evitar a dummy trap, foi excluída da análise a

variável dummy que assume o valor 1 se os dados foram recolhidos no mês de

Setembro. Esta variável dummy foi assim assumida como sendo a variável base.

Relativamente às variáveis MONTH, tanto no PML como no OLS, só as variáveis

associadas aos meses de Janeiro a Abril, é que são significativas ao nível de 10%.

Salientando se que nestes meses o consumo de combustível é inferior ao do mês de

Setembro.

Pela análise dos testes RESET 1 e RESET 2 aplicados aos modelos, rapidamente se

deduz que a 5%, não existe evidência da má especificação dos modelos. Pelo que a

demais análise será feita com base nestes modelos.

3.3 4 Testes de validade do OLS

Esta secção irá recair sobre um conjunto de testes aplicados com o intuito de testar a

validade do estimador OLS. Em todos estes testes é analisada a hipótese nula de que sob

H0 é válida a estimação de elasticidades através do OLS.

3.3.1 4 Teste de Park

Suponha se que,

. = :~B+ •.

e

. = :~B€.

O teste de Park baseia se na seguinte regressão auxiliar

ln •̂_.V _{= U}V_{+ ‚1}_._{@f + ƒ}_. _{= > + ‚1}_._{@f + ƒ}_.

com

•̂. = . − :„B… e @f obtido através do PML de β.

(1)

(29)

23

Este procedimento testa a hipótese H0:‚ = 0 contra H1: ‚ ≠ 0. Rejeitando se H0, existe

evidência de que a estimação de elasticidades através do OLS não é válida.

A natureza desta hipótese pode ser melhor compreendida no parágrafo seguinte.

A partir de (1) e (2), conclui se que,

€. = 1 + •_:._~_B

Onde para o OLS ser estimado de forma consistente, €_. não pode depender de 1_., isto é D€.|1.F terá de ser constante. Para que isto aconteça, terá de se verificar a condição,

•. = :~B× M. com DM.|1.F constante

Verifica se,

d D•.|1.F = V:~B× d DM.|1.F e supondo d DM.|1.F igual a uma constante UV então,

d D•_.|1_.F = UV V:~B

Caso esta condição não seja verificada, então (3) não é verdadeira e assim D€_.|1_.F não é constante pelo que o OLS não será válido.

3.3.2 4 Testes de Heterocedasticidade na variável residual multiplicativa

Os testes efectuados neste ponto, designados como Teste 1 e Teste 2, avaliam a hipótese

de existência de heterocedasticidade em €_..

3.3.2.1 4 Teste 1

Suponha se que,

= 1.@ + €.

onde,

€†

‡ = − b e €ˆ = _† K- ‰‡Š_,

(30)

24

Este teste vai avaliar a existência de heterocedasticidade do tipo,

UV_{(1) = d (€}_._|1_._{) = U}V ‹ Œ• :~B…

em que @f, é estimado através dos estimador PML, usando a regressão auxiliar,

€Ž†V = ‚< ‹HK-:~B+ ƒ.

Testando a hipótese H0: ‚G = 0 contra H1: ‚G ≠ 0, e caso exista evidência de que

‚G ≠ 0, então teremos evidência da existência de heterocedasticidade em €., e por

consequência a estimação de elasticidades pelo OLS não será válida.

3.3.2.2 4 Teste 2

Este teste baseia se nos princípios referidos para 3.2.1. com a diferença de que testa a

existência de heterocedasticidade do tipo,

UV_{(1) = d (€}_._|1_.₎

= UV •IJ•HŒ•‘( ,’(“~)J •XŒ•‘(’”(!•“~)J•–—,’˜“,~J•™˜“š~J•›œ•“~J•žœ•“X~J•Ÿ— ,~

recorrendo à regressão auxiliar,

€Ž_†V = ‚_< ‹HŒ•‘( ,’(“~)J ‹XŒ•‘(’”(!•“~)J‹–—,’˜“,~J‹™˜“š~J‹›œ•“~J‹žœ•“X~J‹Ÿ— ,~

E testa a hipótese H0: ‚G = ⋯ = ‚x = 0 contra H1: ∃ ‚. ≠ 0 ( = 1 … 7), e caso se

rejeite H0, existe evidência da existência de heterocedasticidade em €., e por

consequência a estimação de elasticidades pelo OLS não será válida.

(31)

25 Tabela 6 4 Resultados dos testes de validade do OLS

Teste Estatística3 pobs

Teste de

Park 3,7018 0,00022

Teste 1 6,2904 0,00

Teste 2 309,0601 0,00

Pela análise da tabela, todos os testes sugerem que não existe evidência de que o OLS

seja válido.

3.4 4 Comparação dos resultados obtidos pela aplicação dos estimadores OLS e PML

Nesta secção iremos analisar e comparar os resultados obtidos com a estimação dos

modelos restritos incluídos na tabela 5.

No que concerne às variáveis PRICE e INCOME e como já foi referido anteriormente,

estas apresentam os sinais esperados. Assim um aumento de 1% no preço do

combustível, vai diminuir o consumo de combustível em aproximadamente 0,415% de

acordo com o PML e em aproximadamente 0,563% de acordo com o OLS. Por outro

lado de acordo com o PML, um aumento de 1% no rendimento do agregado familiar, ira

fazer aumentar o consumo de combustível em aproximadamente 0,144%. Pelo OLS este

aumento será de 0,189%. Como podemos constatar, as elasticidades estimadas pelo

OLS são maiores em valor absoluto às estimadas pelo PML. Foram construídos os

intervalos de confiança a 90%, 95% e 99% para os coeficientes das variáveis INCOME

e PRICE a fim de se verificar se existe evidência de que existem diferenças

significativas nas elasticidades estimadas pelos dois métodos. Os resultados de tais

intervalos encontram se na tabela 7.

3

(32)

26 Tabela 7 4 Intervalos de confiança para as estimativas das variáveis PRICE e I COME

Variavel ivel de significância

PML OLS

Limite inferior

Limite superior

Limite inferior

Limite superior

PRICE

99% 0,8056 0,0262 0,9151 0,2113

95% 0,7124 0,1194 0,8309 0,2955

90% 0,6648 0,1670 0,7879 0,3385

I COME

99% 0,0570 0,2312 0,1099 0,2681

95% 0,0779 0,2103 0,1288 0,2492

90% 0,0885 0,1997 0,1385 0,2395

Como podemos observar pelos dados presentes na tabela, para as duas variáveis, e

independentemente do nível de significância, existe sobreposição dos respectivos

intervalos de confiança. Pelo que não existe evidência de que as elasticidades calculadas

(33)

27

4 .

Conclusão

Ao longo deste trabalho, procurou se de uma forma clara e concisa responder à questão:

Estimação de elasticidades constantes: Deveremos logaritmizar? E a resposta a esta

questão terá de ser dada recorrendo primeiro ao ponto de vista teórico e depois ao ponto

de vista da aplicação empírica.

Sob o ponto de vista teórico, e como demonstrado na secção 2.6 a resposta é clara, não

deveremos logaritmizar. Isto porque na presença de heterocedasticidade, a prática

comum de estimar os parâmetros do modelo logaritmizado pelo OLS, pode levar a

conclusões erróneas, como demonstrado pelos exemplos A e B da secção 2.6. Estes

exemplos demonstram claramente que as duas metodologias podem levar a resultados

diferentes, tendo como consequência que as estimativas obtidas pelo OLS para as

elasticidades sejam enviesadas.

Recorrendo à aplicação empírica, a resposta à questão em análise já não é tão clara.

Neste trabalho procurou se estimar um modelo que explica o consumo de combustível

de um agregado familiar, (recorrendo à distância percorrida como proxy deste

consumo), tendo se estimado o modelo linear em causa pelo OLS, o equivalente não

linear pelo PML e comparados os resultados.

Uma primeira análise demonstra que os resultados deverão ser analisados com algum

cuidado. Por um lado, os resultados dos testes de validade do OLS demonstram

claramente que as elasticidades obtidas pelo OLS não são válidas, não sendo por isso

aconselhável o recurso a este estimador. Por outro lado, quando comparamos as

diferenças entre as estimativas obtidas pelos dois métodos, constatamos que as

diferenças entre elas não são substanciais. Esta conclusão é também reforçada pelos

intervalos de confiança obtidos para cada elasticidade com os dois métodos que, ao

interceptarem se, permitem concluir que não existe evidência de que as elasticidades

estimadas pelas duas metodologias sejam estatisticamente diferentes.

Todavia, existe uma importante consideração a ter em conta aquando da realização da

aplicação empírica, que é a dificuldade de implementação dos dois estimadores. O OLS

é um estimador muito usado em Econometria, sendo por isso incorporado em muitos

softwares econométricos permitindo assim que seja usado de forma muito simples e

(34)

28

isso incorporado em muitos softwares como é o caso do EVIEWS. A aplicação do PML

obriga o analista a programar a função de maximização de verosimilhança a ser usada,

sendo por isso necessário o recurso a um software que permita esta situação, como é o

caso do TSP.

Culminando, a resposta à questão que deu tema a este trabalho, terá de ser dada de

forma cautelosa. Do ponto de vista teórico existem muitas evidências a favor do PML, e

a própria aplicação prática apoia estas evidências pelo que não se deverá logaritmizar.

Todavia a dificuldade de implementação do método pesa como factor contra. Assim em

suma, na opinião do autor o modelo não deverá ser logarimizado, contudo, tal decisão

cabe em última análise naturalmente ao utilizador. Caso este decida não logaritmizar,

deverá ter em conta as respectivas implicações, realizar todos os testes de especificação

(35)

29

Bibliografia

Bernanke, B. e Frank, R., (2001), Principles of Macroeconomics,McGraw Hill.

Bernanke, B. e Frank, R., (2009), Principles of Economics, 4ª Edição,McGraw Hill.

Dougherty, C., (2001), Introduction to Econometrics, 3ª Edição, Oxford.

Greene, W. H., (2002) Econometric Analysis, 5ª Edição, Prentice Hall.

Gourieroux, C., Monfort, A., Trognon, A.,(1984), “Pseudo Maximum Likelihood

Methods: Applications to Poisson Models”, Econometria, Vol. 52, No. 3, p.p. 701 720.

Gujarati, (2004), Basic Econometrics, 4ª Edição, McGraw Hill.

Krugman, P. e Wells, R., (2005), Microeconomics,Worth Publishers.

Manning, W. G., (1999), “Estimating Log Models: To Transform or not to

Transform?”, ational Bureau of Economic Research, Technical Working Paper Series,

246.

Silva Ribeiro, C., (2011), Econometria [Manuscrito].

Santos Silva, J. M.C., e Tenreyro, S., (2006), “The Log of Gravity”, The Review of

Economics and Statistics, 88(4), p.p. 641 658.

Stock, J. H., e Watson, M. W., ( 2007), Introduction to Econometrics, 2ª Edição,

Pearson.

Wooldrige, J. M., (2002) Econometric Analysis of Cross Section and Panel Data, The

MIT Press.

Wooldrige, J. M., (2003) Introductory Econometrics: A Modern Approach, 2ª Edição

Thomson South Western.

Winkelmann, R., (2003), Econometric Analysis of Count Data, 4ªEdição, Springer.

Yatchew, A. e Joungyeo, A. No, (2001), “Household Gasoline Demand in Canada”,

(36)

30

Anexos

Anexo A

Comandos TSP 4 Regressões do PML e testes RESET aplicados ao PML.

1 OPTIONS MEMORY=5; 2 options double; 3 options crt; 4

4 freq n;

5 smpl 1 2464; 6

6 read(file='F:\TFM\gashouscons96.xls'); 7

7 ? DIST PRICE INCOME DRIVER HHSIZE VEH AGE MONTH YSINGLE RETIRE DUR

7 GENR DIST2=DIST/1000; 8 GENR LDIST=LOG(DIST2); 9 GENR LPRICE=LOG(PRICE); 10 GENR LINCOME=LOG(INCOME); 11 GENR AGE2=AGE**2;

12

12 title 'Estatisticas Descritivas';

13 MSD DIST PRICE INCOME DRIVER HHSIZE VEH AGE YSINGLE RETIRE DUR; 14

14 dummy MONTH; 15

15 list regressores LPRICE LINCOME DRIVER HHSIZE VEH AGE AGE2 YSINGLE RETIRE DUR MONTH1 MONTH2 MONTH3 MONTH4 MONTH5 MONTH6 MONTH7 MONTH8;

16 ?construção da equação bx sabendo que E(y|x)=exp(bx) 16

16 title 'Regressão pelo PML-completo'; 17 frml bx

(37)

31 18

18 frml eql logl=DIST2*bx - exp(bx) - lfact(DIST2); 19 eqsub eql bx;

20

20 param constante bLPrice bLIncome bDriver bHHSize bVeh bAge bAGE2 bM1-bM8 bYSingle bRetire bDur;

21

21 ML(terse,maxit=200,hcov=w) eql; 22 set LLR_PML1=@LOGL;

23

23 MMAKE Xmat c regressores; 24 mat xb=xmat*@coef;

25 unmake xb xbs; 26

26 title 'Teste RESET 1 - PML'; 27 genr xbs2=xbs^2;

28 frml bxreset

constante+bLPrice*LPRICE+bLIncome*LINCOME+bDriver*DRIVER+bHHSize*HH SIZE+bVeh*VEH+bAge*AGE+bAGE2*AGE2+bYSingle*YSINGLE+bRetire*RETIRE+b Dur*DUR+bM1*MONTH1+bM2*MONTH2+bM3*MONTH3+bM4*MONTH4+bM5*MONTH5+bM6* MONTH6+bM7*MONTH7+bM8*MONTH8+breset*xbs2;

29

29 frml eqlreset logl=DIST2*bxreset - exp(bxreset) - lfact(DIST2); 30 eqsub eqlreset bxreset;

31

31 param constante bLPrice bLIncome bDriver bHHSize bVeh bAge bAGE2 bM1-bM8 bYSingle bRetire bDur breset;

32

32 ML(TERSE)(maxit=10000,hcov=w) eqlreset; 33

33 title 'Teste RESET 2 - PML'; 34 genr xbs3=xbs^3;

35 frml bxreset2

constante+bLPrice*LPRICE+bLIncome*LINCOME+bDriver*DRIVER+bHHSize*HH SIZE+bVeh*VEH+bAge*AGE+bAGE2*AGE2+bYSingle*YSINGLE+bRetire*RETIRE+b Dur*DUR+bM1*MONTH1+bM2*MONTH2+bM3*MONTH3+bM4*MONTH4+bM5*MONTH5+bM6* MONTH6+bM7*MONTH7+bM8*MONTH8+breset*xbs2+breset2*xbs3;

(38)

32 36 frml eqlreset2 logl=DIST2*bxreset2 - exp(bxreset2) -

lfact(DIST2);

37 eqsub eqlreset2 bxreset2; 38

38 param constante bLPrice bLIncome bDriver bHHSize bVeh bAge bAGE2 bM1-bM8 bYSingle bRetire bDur breset breset2;

39

39 ML(TERSE)(maxit=10000,hcov=w) eqlreset2; 40 set LLR_RESET=@LOGL;

41

41 ?LLR_PML1 - Loglikelihood do modelo PML restricto; 41 ?LLR_RESET - Loglikelihooddo modelo irrestricto; 41

41 set TRV=-2*(LLR_PML1-LLR_RESET); 42 cdf(chisq,df=2)TRV;

43

43 title 'Regressão pelo PML - Restricto'; 44 frml bx

constante+bLPrice*LPRICE+bLIncome*LINCOME+bDriver*DRIVER+bVeh*VEH +bAge*AGE+bAGE2*AGE2+bDur*DUR+bM1*MONTH1+bM2*MONTH2+bM3*MONTH3+bM4* MONTH4+bM5*MONTH5+bM6*MONTH6+bM7*MONTH7+bM8*MONTH8;

45

47

47 param constante bLPrice bLIncome bDriverbVeh bAge bAGE2 bM1-bM8 bDur;

48

48 ML(terse,maxit=10000,hcov=w) eql; 49 set LLR_PML2=@LOGL;

50

50 set TRV=-2*(LLR_PML2-LLR_PML1); 51

51 cdf(chisq,df=3)TRV;? 52

52 title 'Teste RESET1 PML-Restrito'; 53 genr xbs2=xbs^2;

54 frml bxreset

(39)

33 +bAge*AGE+bAGE2*AGE2+bDur*DUR+bM1*MONTH1+bM2*MONTH2+bM3*MONTH3+bM4* MONTH4+bM5*MONTH5+bM6*MONTH6+bM7*MONTH7+bM8*MONTH8+breset*xbs2; 55

55 frml eqlreset logl=DIST2*bxreset - exp(bxreset) - lfact(DIST2); 56 eqsub eqlreset bxreset;

57

57 param constante bLPrice bLIncome bDriver bVeh bAge bAGE2 bM1-bM8 bDur breset;

58

58 ML(TERSE)(maxit=10000,hcov=w) eqlreset; 59

59 title 'Teste RESET2 -PML-Restrito'; 60 genr xbs3=xbs^3;

61 frml bxreset2

constante+bLPrice*LPRICE+bLIncome*LINCOME+bDriver*DRIVER+bVeh*VEH +bAge*AGE+bAGE2*AGE2+bDur*DUR+bM1*MONTH1+bM2*MONTH2+bM3*MONTH3+bM4* MONTH4+bM5*MONTH5+bM6*MONTH6+bM7*MONTH7+bM8*MONTH8+breset*xbs2 +breset2*xbs3;

62

62 frml eqlreset2 logl=DIST2*bxreset2 - exp(bxreset2) - lfact(DIST2);

63 eqsub eqlreset2 bxreset2; 64

64 param constante bLPrice bLIncome bDriver bVeh bAge bAGE2 bM1-bM8 bDur breset breset2;

65

65 ML(TERSE)(maxit=10000,hcov=w) eqlreset2; 66 set LLR_RESET2=@LOGL;

67

67 ?LLR_PML2 - Loglikelihood do modelo PML restricto; 67 ?LLR_RESET - Loglikelihood do modelo irrestricto; 67

(40)

34 Anexo B

Comandos TSP 4 Testes de validade do OLS

4 freq n;

5 smpl 1 2464; 6

7

7 GENR DIST2=DIST/1000; 8 GENR LDIST=LOG(DIST2); 9 GENR LPRICE=LOG(PRICE); 10 GENR LINCOME=LOG(INCOME); 11 GENR AGE2=AGE**2;

12

12 dummy MONTH; 13

13 list regressores LPRICE LINCOME DRIVER VEH AGE AGE2 DUR MONTH1 MONTH2 MONTH3 MONTH4 MONTH5 MONTH6 MONTH7 MONTH8;

14

14 ?construção da equação bx sabendo que E(y|x)=exp(bx) 14

14 ?title 'Regressão pelo PML-Restricto'; 14 frml bx

constante+bLPrice*LPRICE+bLIncome*LINCOME+bDriver*DRIVER+bVeh*VEH +bAge*AGE+bAGE2*AGE2+bDur*DUR+bM1*MONTH1+bM2*MONTH2+bM3*MONTH3+bM4* MONTH4+bM5*MONTH5+bM6*MONTH6+bM7*MONTH7+bM8*MONTH8;

15

(41)

35 17 param constante bLPrice bLIncome bDriver bVeh bAge bAGE2 bM1-bM8 bDur;

18

18 ML(silent,maxit=200,hcov=w) eql; 19 set LLR_PML=@LOGL;

20

20 title 'Teste de Park'; 21 MMAKE Xmat c regressores; 22 mat xb=xmat*@coef;

23 unmake xb xbs; 24

24 xfit=exp(xbs);

25 res2=(DIST2-xfit)**2; 26 lres2=log(res2); 27 lxfit=log(xfit);

28 ?regressão auxiliar de teste

28 olsq(silent,robustse) lres2 c lxfit; 29

29 title 'Teste de validade do OLS'; 30 set t=(@coef(2)-2)/@ses(2);

31 set gl=@nob-@ncoef; 32 cdf(t,df=gl) t; 33

33 title 'Teste sobre Heterocedasticidade – Teste 1; 34 olsq(silent) ldist c regressores;

35 genr res2=(exp(@res))^2; 36 frml het res2=l0*xfit**l1; 37 param l0 l1;

38 lsq (terse)(maxit=10000)het; 39

39 title 'Teste sobre Heterocedasticidade – Teste 2; 40 olsq(silent) ldist c regressores;

41 genr res2=(exp(@res))^2; 42 frml het

res2=exp(g0+g1*LPRICE+g2*LINCOME+g3*DRIVER+g4*VEH+g5*AGE+g6*AGE2+g7 *DUR);

43 param g0-g7;

(42)

36 46 frml het0 res2=exp(g0);

47 param g0;

48 lsq (terse,maxit=10000)het0; 49 set LLRR=@LOGL;

50

(43)

37 Anexo C

Comandos TSP 4 Regressões do heterocedasticidade sobre o OLS

4 freq n;

5 smpl 1 2464; 6

7

7 GENR LDIST=LOG(DIST); 8 GENR LPRICE=LOG(PRICE); 9 GENR LINCOME=LOG(INCOME); 10 GENR AGE2=AGE**2;

11

11 dummy MONTH; 12

12 list regressores LPRICE LINCOME DRIVER HHSIZE VEH AGE AGE2 YSINGLE RETIRE DUR MONTH1 MONTH2 MONTH3 MONTH4 MONTH5 MONTH6 MONTH7 MONTH8;

13

13 Title 'Regressões - OLS'; 14

14 Title ' OLS ';

15 olsq LDIST c regressores; 16 genr RES2=@res^2;

17 genr YFIT=@FIT; 18 genr YFIT2=YFIT^2; 19

19 title 'Teste de Breusch-Pagan'; 20 OLSQ RES2 c regressores;

(44)

38 23

23 cdf(chisq,df=GL)bp; 24

24 title 'Teste de White Simplificado'; 25 olsq RES2 C YFIT YFIT2;

26 set white=@nob*@rsq; 27

27 cdf(chisq,df=2)white; 28

28 Title'OLS Robusto';

29 olsq(robust) LDIST c regressores; 30

30 Title'OLS Robusto-Restricto';

(45)

39 Anexo D

Output Eviews 4 Testes RESET 1 e 2 aplicados OLS

!! " ! #

" ! $%$

& ' $%$

( ) * & +,- . / - ' &

- 00 & 1 . , & 2 1

- %1%3 #4 41#4!3! !13 $ 5 1 #34

6- . 1$3$% # 1##5#$ 13% !34 143$3

27 -. ,!1$4$3 !1%% %%% , 13% %# 1433

)) 8. 1 !4 ## 1 $$% 1%$3 3 1#!%

7 .7 1$%! 5 1#4!%3! 13%5 5$ 143%

.) , 1$ 5$$4 1#5%4%% , 13%4 %3 1433

97 , 1%3 %# 153%5!% , 13%55 $ 143#%

: . 1 $##!5 1 #433$ 13$$5 ! 14 34

: .; , 1 %5% 1 5 , 13#44 % 14 4#

7. 7. 1 $453 1 5 $3% 1 % !! 1 # #

< 6 . 1!$$44! 1!33#54 15%#434 1$$$!

<= > 7; , 1! 5 1 4! , 1#4! % 1# #$

6 )?! , 1#$ !! 1%4 4$$ , 13%3435 143#4

6 )? , 15$$! 4 13#%%4! , 13%35$$ 143#!

6 )?4 , 145 5 1$ % 3 , 13% 5 1433$

6 )?$ , 1 #%# 3 1 %%5 , 13%$%%$ 14354

6 )?# , 1 # 4 1 %4%%$ , 1$ 3 34 1%34!

6 )?% 1 # $3! 1 33!$ 1%5$53 1$

6 )?5 1!4 # 1!5 5 3 13 %!!% 1$ 4

6 )?3 1 4#4# 1 5 43 13$4$4# 14 !

7, 1!4! #! ' 51!% $%$

: @ 7, 1! $ # 1 1 ' 15 3 53

1.1 0 A 1%% 3 :* * 0 & 1 44 %

" ! 541%#3 & B C & 1 5 ##

A * , $5 13 $ =, & ! 14 #%

,( 1 !$%$! 2 =, & 1

!! " ! %

" ! $%$

& ' $%$

(46)

40

- 00 & 1 . , & 2 1

- ,4 13 3 !551!$!5 ,!15$ $% 1 3 $

6- . , $1$ $5 !$1 ##3$ ,!154%% 5 1 3 %

27 -. 5 1 % 3 $!1$5# % !154%!4# 1 3 5

)) 8. , 1%#! $4 145$%!# ,!1543$4 1 3 4

7 .7 , 41!$ 4 !414443! ,!154%!45 1 3 5

.) $1 4%5! !$14%$ 5 !154# 4 1 3 5

97 4$1 3# % ! 15$# ! !154%4! 1 3 %

: . , 1 3$%! !14 $%#$ ,!154#!$! 1 3 3

: .; 1 4$!%$ 1 ! %3# !154##!5 1 3 3

7. 7. , 1 33% 1 5!# 4 , 1 $ 4## 1 %53

< 6 . ,51 5 $1 # ,!154%! $ 1 3 5

<= > 7; !31!3!% ! 1 454 !155% !4 1 5#

<= > 7;4 , 13#!$3$ 1$5 %%5 ,!13 !$$5 1 5!3

6 )?! 515 3 !#1 % % !154%45! 1 3 %

6 )? 4515 $% !15! 3 !154%##% 1 3 %

6 )?4 !31% $ ! 15% 34 !154% $ 1 3 %

6 )?$ ! 1 5#5 51$4$!#4 !154% #4 1 3 %

6 )?# !14$354$ 155 # !154 ## 1 345

6 )?% ,41 55 !154 3$ ,!1543$3 1 3 4

6 )?5 ,%133## # 41 %5! ,!154#%!$ 1 3 3

6 )?3 ,!!155 % %153 $ 4 ,!154%553 1 3 %

7, 1!4 $# ' 51!% $%$

: @ 7, 1! #3$5 1 1 ' 15 3 53

1.1 0 A 1%% ! :* * 0 & 1 #

" ! 5!14!5 & B C & 1 5!#43

A * , $5 1!4# =, & !315

,( 1 ! $#! 2 =, & 1

(

. .D 4

& 0 2 +

=, & 1%% 3 E $$4 1 5

- , #14 #%!3 1 % 3

6 )+ "" +

6 " C 7 & ? 1 . 1

- ! !31!3!% ! 1 454

- !4 , 13#!$3$ 1$5 %%5

(47)

41 Anexo E

Output Eviews 4 Teste à significância conjunta das variáveis YSI GLE, RETIRE e HHSIZE no OLS

(

. .D !

& 0 2 +

=, & 1! 4 4E $$# 1 $5

- , 14%% %# 4 1 $5

6 )+ "" +

6 " C 7 & ? 1 . 1

- $ 1 # 5! 1 !$

- ! ,315#., % 1 % 3!$

- !! 1 #%333 1! 4$%4

(48)

42 Anexo F

Output Eviews 4 Testes RESET 1 e 2 aplicados OLS restrito

! !! " 45

" ! $%$

& ' $%$

( ) * & +,- . / - ' &

- 00 & 1 . , & 2 1

- %1% %53 41%# % 3 !13 $!# 1 5!4

6- . 1$#!5 4 1##$ 3 13!#4 1$!$

27 -. ,!14# !1%%54!% , 13 543 1$!3

7 .7 1$43%44 1#433#5 13!$ # 1$!#5

.) , 1$%# $3 1#5#%34 , 13 43 1$!3$

97 , 1%4 % 153#5 3 , 13!$ %$ 1$!#5

: . 1 $!$ 3 1 #!5#4 13 !34$ 1$ 5

: .; , 1 %4 1 553 , 13 # 1$!34

<= >7; , 1 5 % 1 4 # , 1$5545! 1%44!

6 )?! , 1#! %4 1%454 , 13!# $3 1$!#

6 )? , 1% 5 ! 13#$$ , 13!#3%# 1$!$5

6 )?4 , 14$5%$! 1$ $ % , 13 #$3 1$!34

6 )?$ , 1 $ 35 1 #3 3 , 13! # 1$!%3

6 )?# , 1 4 ! 1 % 3 , 14% ! 15! !

6 )?% 1 ##$5 1 3553 1%4! 5 1# 5#

6 )?5 1!4 %5 1!5# 3$ 15#55 3 1$$3%

6 )?3 1 43%! 1 3 % $ 15 !335 1$ 3#

7, 1!4 3# ' 51!% $%$

: @ 7, 1! #!5% 1 1 ' 15 3 53

1.1 0 A 1%% $%% :* * 0 & 1 !!3

" ! 5413 # & B C & 1 %! %$

A * , $541 % =, & 41 %$$

,( 1 !# 2 =, & 1

! !! " 4

" ! $%$

& ' $%$