• Nenhum resultado encontrado

A literatura usa o Ordinary Least Squares 12 (OLS) para cross-section e Pooled

Ordinary Least Squares (POLS) para dados em painel.

O método a utilizar nesta dissertação é os modelos de painel. De acordo com Wooldridge (2002), estes fazem uma análise quantitativa das relações económicas, juntando dados temporais (time-series) e seccionais (cross-section) no mesmo modelo – processo pooling. Os dados apresentados em painel permitem estudar em simultâneo as variações das variáveis ao longo do tempo e entre diferentes indivíduos, que podem representar um conjunto de países, regiões, setores, empresas, consumidores, etc. Além disso, os painéis permitem obter uma estimação mais completa e mais eficiente dos modelos econométricos. No entanto, essa estimação pode ser mais complicada devido à heterogeneidade entre os indivíduos. Os painéis podem ser equilibrados/balanceados se todos os indivíduos têm observações ao longo do mesmo período de tempo ou não equilibrados/não balanceados quando tal não se verifica, por exemplo, ter-se-ia as observações todas para uma dada variável de um indivíduo e de outro apenas metade. De forma genérica, pode-se enunciar um modelo painel da seguinte forma:

Y = α + β X + β X + ⋯ + ε , (3.)

com i=1,....,N os indivíduos, t=1,....,T os períodos de tempo (T períodos) e NxT o número total de observações.

11

Ri=(2i-1)/(2xnúmero de categorias).

12

O OLS é uma técnica de otimização matemática que procura encontrar o melhor ajustamento para um conjunto de dados tentando minimizar a soma dos quadrados das diferenças entre o valor estimado e os dados observados (tais diferenças são designadas por resíduos).

40 Neste modelo admite-se que α e β , β , etc. são os mesmos para todos os indivíduos e para todos os períodos, o que representa uma hipótese muito restritiva.

Há que referir que quando se dispõe do mesmo número de dados temporais para todos os indivíduos tem-se um painel balanceado ou equilibrado; se se verificar o contrário tem-se um não balanceado. Em qualquer um dos casos, os métodos de estimação são os mesmos.

Antes de se apresentarem detalhadamente estes métodos, há que apresentar as vantagens e desvantagens dos dados em painel. De referir que as subsecções 4.4. que se seguem foram elaboradas tendo em conta Soukiazis (2010).

4.4.1. Vantagens e desvantagens dos modelos com dados em painel As vantagens são as seguintes:

 Utilização de um número elevado de observações, assegurando assim as propriedades assimptóticas dos estimadores13;

 Os graus de liberdade aumentam nas estimações, tornando as inferências estatísticas mais credíveis (testes t e F mais significativos);

 Redução do risco de multicolinearidade, uma vez que os dados entre os indivíduos apresentam estruturas diferentes;

 Acesso a uma maior informação, combinando a informação temporal (ao longo do tempo) com a informação entre indivíduos (unidades económicas diferentes);

 Aumento da eficiência e da estabilidade dos estimadores, aplicando métodos de estimação adequados e testes de hipóteses que permitem uma escolha segura entre estimações diferentes;

13

Segundo Wooldridge (2002), as propriedades assimptóticas são a da consistência e normalidade assimptótica (a forma da distribuição dos estimadores são aproximadas a uma distribuição normal para amostras grandes). Além disso, há que ter em consideração as propriedades estatísticas dos estimadores. São eles a propriedade de não enviesamento, em que os estimadores dos mínimos quadrados são não enviesados quando os seus valores estimados, obtidos por amostras diferentes, em média, são muito próximos dos valores reais dos parâmetros do modelo; a propriedade de eficiência em que nos estimadores não enviesados o mais eficiente é o estimador que possui a variância mínima; e a propriedade de consistência ou convergência assimptótica, onde o estimador dos mínimos quadrados é consistente quando o seu valor converge para o valor real do parâmetro β assimptoticamente, T. O Teorema de Gauss-Markov define o seguinte: o estimador dos mínimos quadrados β é um estimador linear de uma variável estocástica Y; o estimador dos mínimos quadrados é não enviesado; o estimador dos mínimos quadrados é eficiente e convergente assimptoticamente; o estimador dos mínimos quadrados é o melhor na classe dos estimadores lineares não enviesados; o estimador dos mínimos quadrados é BLUE (Best Linear Unbiased Estimator).

41  Possibilidade de introdução de ajustamentos dinâmicos, que no caso da análise cross-

section não seriam possíveis.

Como desvantagens há duas a apontar:

 O enviesamento resultante da heterogeneidade entre os indivíduos;

 O enviesamento resultante da seletividade dos indivíduos que constituem a amostra. Clarificados os prós e contras dos modelos de dados em painel, define-se de seguida os vários tipos de modelos.

4.4.2. Tipos de modelos com dados em painel e os seus métodos de estimação

Os modelos com dados em painel podem ser de três tipos: modelos agregados “pooled”, modelos com “efeitos fixos” ou modelos com “efeitos aleatórios”.

4.4.2.1. Modelos agregados “pooled”

Os parâmetros α e β são comuns para todos os indivíduos, i.e., há homogeneidade na parte constante e no declive:

Yit= α+βXit+…+eit . (4.)

Estes modelos são estimados pelo Método dos Mínimos Quadrados (OLS) assumindo a parte constante comum para todos indivíduos.

Admite-se que os erros eit são white noise e não se encontram correlacionados com os

regressores, Cov(Xit,eit)=0. Contudo, as hipóteses da constante comum e declive comum

são muito restritivas. Assim, este método pode ser adequado em amostras com indivíduos a priori selecionados que apresentam algumas semelhanças nas suas características estruturais. O estimador será eficiente e consistente, porque o parâmetro α é igual para todos os indivíduos.

4.4.2.2. Modelos com efeitos fixos

A heterogeneidade dos indivíduos é refletida na parte constante, existindo homogeneidade no declive. A parte constante é, assim, diferente para cada indivíduo, captando as diferenças que não variam com o tempo:

Yit= αi+βXit+…+eit . (5.)

42 4.4.2.2.1. Método de estimação com variáveis dummy (Least Squares Dummy Variables, LSDV)

Com este método são introduzidas variáveis Dummy para captar a heterogeneidade dos indivíduos, distinguindo os seguintes casos particulares:

(i) Efeitos Fixos Unilaterais

Utiliza-se uma Dummy Di para cada indivíduo

Y = ∑ α D + βX + ⋯ + ε , (6.)

com = 1, í

0, í . (7.) (ii) Efeitos Fixos Unilaterais:

Utiliza-se uma Dummy Dt para cada período

Y = ∑ α D + βX + ⋯ + ε , (8.)

com = 1, í í

0, í . (9.) (iii) Efeitos Fixos Bilaterais:

Utilizam-se Dummies individuais e temporais

Y = ∑ α D + ∑ α D + βX + ⋯ + ε . (10.)

O método com dummies individuais é o mais utilizado, uma vez que estas captam as diferenças (heterogeneidade) entre os indivíduos. Uma desvantagem do modelo com

dummies individuais (quando N é grande) é a estimação de um número elevado de

parâmetros e a consequente perda de graus de liberdade. 4.4.2.2.2. Método de estimação com primeiras diferenças

Quando os efeitos específicos individuais são admitidos, os efeitos fixos αi podem ser

correlacionados com as variáveis explicativas, Cov(αi,Xit) ≠0. Neste caso, o método

OLS não produz estimadores consistentes. O problema resolve-se removendo os efeitos específicos individuais.

Assim, começa-se por utilizar a função com os valores contemporâneos:

Y = ∑ α D + βX + ⋯ + ε . (11.) De seguida, desfasa-se um período:

43 Y = ∑ α D + βX + ⋯ + ε . (12.) Por fim, subtrai-se a equação (12.) à (11.):

Y − Y = β(X − X ) + ⋯ + (ε − ε ) ↔ ∆Y = β∆X + ⋯ + ∆ε . (13.)

Esta estimação tem como desvantagem a perda de uma observação para cada um dos indivíduos.

4.4.2.2.3. Método de estimação com as variáveis centradas

Este método consiste em centrar as variáveis, ou seja, subtrair às observações de cada indivíduo a média temporal.

Partindo do modelo com efeitos fixos (6.), expressa-se o modelo em termos de médias temporais para cada indivíduo:

Y = ∑ α D + βX + ⋯ + ε . (14.) Posteriormente, subtrai-se à equação (6.) a (14.):

Y − Y = β(X − X ) + ⋯ + (ε − ε ), (15.) com Y = ∑ e X = ∑ as médias temporais das respetivas variáveis para cada indivíduo (group mean).

A desvantagem deste método é que não considera variáveis explicativas cujos valores não se alteram ao longo do tempo. Ou seja, com este método não se perdem observações, mas perdem-se variáveis que não variam ao longo do tempo.

Em termos de estimação o método LSDV e o das variáveis centradas são numericamente equivalentes.

4.4.2.3. Modelos com efeitos aleatórios

A estimação é feita introduzindo a heterogeneidade dos indivíduos no termo de erro, considerando a constante não como um parâmetro fixo mas como um parâmetro aleatório não observável:

Yit= α+βXit+…+(ηi+eit), (16.)

com αi=α+ηi, sendo ηi o efeito aleatório individual não observável.

A equação (16.) é equivalente à seguinte:

44 Assim, decompondo o termo de erro tem-se:

wit= ηi+eit (18.)

com η ~ 0, o erro individual e ε ~ (0, ) o erro misto e admite-se que todos os erros são homoscedásticos e não autocorrelacionados.

A hipótese Cov(ηi,Xit)=0, i.e. de não haver correlação entre o erro ηi (efeitos fixos não

observados) e as variáveis explicativas, é crucial para se obterem estimadores não enviesados e consistentes.

Todas as observações em cada indivíduo têm uma componente comum, o ηi, criando

autocorrelação dos erros dentro do próprio indivíduo.

A autocorrelação dos erros dentro do próprio indivíduo (within-unit autocorrelation) torna os estimadores OLS não eficientes e os erros padrão inválidos.

Assim, para ultrapassar este problema a solução é estimar o modelo de efeitos aleatórios pelo método GLS (Método dos Mínimos Quadrados Generalizados), obtendo-se estimadores eficientes.

O método GLS implica que partindo do modelo com efeitos aleatórios (17.), se expresse o modelo em termos de médias temporais para cada indivíduo e se multiplique toda a equação pelo parâmetro θ. Assim, o método GLS implica a seguinte transformação:

= + + ⋯ + , (19.)

com = 1 −

( ), 0<θ<1.

Subtraindo à equação (17.) a (19.) (conhecido como quasi-demeaned model), tem-se: ( − ) = (1 − ) + ( − ) + ⋯ + ( − ). (20.) No modelo de efeitos aleatórios a cada variável subtrai-se uma fração  da média temporal de cada indivíduo.

é conhecida como variância entre grupos (between variance) uma vez que se refere a variações do erro entre os indivíduos.

é conhecida como variância dentro do grupo (within variance) uma vez que se refere a variações do erro dentro do próprio indivíduo.

45 Se = 0, =1, o modelo de efeitos aleatórios é equivalente ao modelo de efeitos fixos (modelo de variáveis centradas).

Se = 0, =0, o modelo de efeitos aleatórios é equivalente ao modelo pooled.

Como se verifica são três os tipos de modelos em dados em painel. Por um lado, se o número de indivíduos é pequeno, o método de estimação mais aconselhável é o de efeitos fixos. Por outro, se o número é elevado o de efeitos aleatórios é o mais indicado. Além disso, se os efeitos individuais estão correlacionados com as variáveis explicativas, o mais adequado é o de efeitos fixos, já que os aleatórios são inconsistentes. Contudo, há testes estatísticos que permitem verificar qual das estimações é preferível.

4.4.3. Testes

4.4.3.1. Teste F: Pooled versus efeitos fixos

Este teste é aplicado para decidir “to pool or not to pool” a estimação. Na hipótese nula, admite-se a homogeneidade na constante (hipótese pooled) e na hipótese alternativa, a heterogeneidade na constante (efeitos fixos), i.e.,

H0: α1= α2=…= α6 (constante comum – pooled OLS);

H1: α1≠ α2≠…≠ α6 (efeitos fixos– LSDV).

A estatística F utilizada para testar esta hipótese é a seguinte:

=

( )

~ ( , ) , (21.)

onde R2fe é o coeficiente de determinação da estimação do modelo com efeitos fixos,

R2pool é o coeficiente de determinação da estimação do modelo com constante comum,

N o número de países, T os períodos de tempo e k o número de variáveis explicativas. Assim, considera-se o de efeitos fixos se > ( , ).

4.4.3.2. Teste Breusch-Pagan: efeitos aleatórios versus pooled

O teste de Breush-Pagan é utilizado para decidir qual dos modelos é o mais apropriado: o modelo pooled (H0) ou o modelo de efeitos aleatórios (H1):

46 H1: σ2h ≠ 0 (efeitos aleatórios - GLS).

O teste de Breush-Pagan é um teste LM dado pela seguinte relação: =

( )

∑ ∑

∑ ∑ ~ , (22.)

sendo que N representa o número de países, T os períodos de tempo. Assim, considera-se o de efeitos aleatórios se > .

4.4.3.3. Teste de Hausman: efeitos fixos versus efeitos aleatórios

O teste de Hausman é utilizado para decidir qual dos modelos é o mais apropriado: o modelo de efeitos aleatórios (H0) ou o modelo de efeitos fixos (H1):

H0: Cov(hi,Xit) = 0 (efeitos aleatórios - GLS);

H1: Cov(hi,Xit) ≠ 0 (efeitos fixos - LSDV).

Sob a hipótese nula, os estimadores do modelo com efeitos aleatórios (estimação GLS) são consistentes e eficientes.

Sob a hipótese alternativa, os estimadores GLS com efeitos aleatórios (e OLS) são não consistentes, mas os estimadores com efeitos fixos são.

A estatística de Hausman utilizada para testar estas hipóteses é a seguinte:

= − − ( − )~ , (23.)

onde

fe

é o vetor dos estimadores do modelo com efeitos fixos;

re

é o vetor dos estimadores do modelo com efeitos aleatórios;

 

bfe

Var ˆ é a matriz de variâncias-covariâncias dos estimadores bˆfe;

 

bre

Var ˆ é a matriz de variâncias-covariâncias dos estimadores bˆre;

k é o número de regressores.

Se > rejeita-se o modelo com efeitos aleatórios. O modelo com efeitos fixos é, nesse caso, mais apropriado.

Documentos relacionados