Capítulo III – Modelos e Métodos
3. Modelos e Métodos
3.3.1. Pressupostos Subjacentes à Regressão Linear
Para se considerar como válidas as estimações e as inferências obtidas no âmbito das regressões lineares é crucial que se verifiquem um conjunto de pressupostos (Gujarati, 1995; Greene, 2012):
a) Linearidade do modelo de Regressão;
7
Na literatura internacional este conceito é frequentemente designado como Balanced Panel Data. 8
Isto é, comprova-se a existência de uma relação linear entre a variável dependente e a(s) independente(s);
b) Inexistência de relações lineares perfeitas entre as variáveis independentes; c) Exogeneidade das variáveis independentes;
O valor esperado do termo do erro 𝑢 não é determinado em função das variaveis independentes, uma vez que estas não contribuem com informação útil para a previsão do mesmo. Simbolicamente:
E(𝑢|𝑥1, 𝑥2,… , 𝑥𝑘) = 0
( 3
)
d) Homosteceidade;
Este pressuposto prevê que cada termo do erro apresenta uma variância idêntica para todas as observações e os termos do erro não se correlacionados entre si. Simbolicamente:
Var(𝑢|𝑥1, 𝑥2,… , 𝑥𝑘) = 𝜎2
( 4
)
e) Processo de geração de dados para os regressores;
Em termos teóricos, este pressuposto ressalva a importância de se verificar regressores estocásticos9. No entanto, os investigadores sociais raramente desenvolvem modelos em torno de regressores fixos. Assim sendo, em termos práticos, este pressuposto considera a existência de um
mix entre constantes e variáveis aleatórias. Nesta linha de pensamento, a média e variância do erro 𝑢
são independentes das variáveis explicativas 𝑥1, 𝑥2,… , 𝑥𝑘.
f) Normalidade;
Na análise de regressões lineares é crucial assumir que os erros se encontram normalmente distribuídos, e com média de zero e variância constante. Na maioria dos casos o pressuposto de normalidade é razoável, no entanto, alguns autores consideram que este conceito é frequentemente desnecessário uma vez que as regressões múltiplas permitem obter resultados estatísticos exactos. Simbolicamente:
𝑢~Normal(0, 𝜎2)
( 5
)
g) Número de observações deve ser superior ao número de parâmetros a serem estimados.
3.3.2. Testes de Diagnóstico
Dados os pressupostos da regressão lineares anteriormente mencionados, e efetuada estimação dos parâmetros dos modelos, é crucial efetuar testes de diagnóstico para averiguar a validade e veracidade dos modelos adotados.
9
Em termos estatísticos um padrão estocástico é aquele cujo estado é indeterminado, isto é, com origem
Teste de Significância Global (F Snedecor)
Para comprovar a validade da regressão linear é fundamental efetuar o teste de significância global. Este teste contrapõe a inexistência de variáveis com impacto na regressão (hipótese nula) com a observação de pelo menos uma variável significativa (Gujarati, 1995):
H0: 𝛽1= 𝛽2= ⋯ = 𝛽𝑘 = 0
( 6
)
Caso o valor da estatística F obtido seja superior ao valor crítico para o nível de significância escolhido deve-se rejeitar a hipótese nula; caso contrário considera-se a inexistência de variáveis significativas (Gujarati, 1995; Greene, 2012).
Teste de Significância Individual (Teste t)
Dado o pressuposto de normalidade é possível utilizar o teste t para analisar os coeficientes de regressão parciais individuais. Sob a hipótese nula, este teste averigua a inexistência de uma relação entre a variável dependente e independente sob análise:
H0: 𝛽𝑗= 0 e H1: 𝛽𝑗≠ 0, 𝑗 = 0,1, … , 𝑘
( 7
)
Se os resultados obtidos excedem o valor crítico de t para o nível de significância escolhido, deve-se proceder à rejeição da hipótese nula (Gujarati, 1995).
Convém reiterar que os testes de significância individual e global são distintos, uma vez que com base no teste t pode-se ser possível aceitar a hipótese nula. Todavia no teste de significância global pode-se rejeitar a hipótese, dado que todos os coeficientes são zero. Deste modo, Gujarati (1995) citando Fomby (1984) considera que o teste t não é substituto do teste F e vice-versa.
Teste de Autocorrelação (Teste DW)
O teste de mais comum para detetar a existência de correlações entre os resíduos é designado por Teste de Durbin-Watson (DW). Embora este teste seja frequentemente utilizado em séries temporais, o mesmo afigura-se como uma ferramenta crucial na modelação de dados seccionais. (Greene, 2012).
Uma das principais causas da autocorrelação é a inércia presente nos dados traduzida por movimentos de tendência ao longo do tempo conjugados com alguns movimentos cíclicos ou oscilatórios resultantes de recessões ou medidas expansionistas.
Em termos matemáticos, o teste pode ser definido da seguinte forma:
𝑑𝑤 =∑ (𝑢̂𝑡− 𝑢̂𝑡−1) 2 𝑛 𝑡=2 ∑𝑛𝑡=1𝑢̂𝑡2 ( 8
)
onde 𝑛 é o número de observações da amostra e 𝑢̂𝑡 são os resíduos OLS10.. Uma vez que ∑𝑛𝑡=1𝑢̂𝑡2 e ∑𝑛𝑡=1𝑢̂𝑡−12 diferem apenas numa observação, é possível efetuar a seguinte aproximação:
𝑑𝑤 ≈∑ 𝑢̂𝑡𝑢̂𝑡−1 𝑛
𝑡=2 ∑𝑛𝑡=1𝑢̂𝑡2
( 9
)
Contrariamente aos testes t e F o teste de Durbin Watson não apresenta um único valor crítico que leva à rejeição da hipótese nula. Alternativamente, os autores definiram a existência de um limite inferior dL e um limite superior dU, pelo que se o resultado obtido para d, se encontrar fora deste âmbito, é possível constatar a existência de uma correlação positiva ou negativa Os limites mencionados anteriormente dependem exclusivamente do número de observações n e do número de variáveis independentes11.
Teste de Heterocedasticidade (Teste de Breusch-Pagan)
A presença de heterocedasticidade coloca problemas de inferência nos modelos de regressão linear, dada a produção frequente de estimadores enviesados. Este problema é verificado com mais frequência nos dados seccionais do que nas séries temporais, uma vez que a transversalidade dos dados implica a heterogeneidade dos elementos para um determinado período de tempo (Gujarati, 1995; Greene 2012).
Nesta medida, é essencial a utilização de testes que despistem a existência desta característica, um dos testes utilizados de forma mais regular foi proposto por Breusch Pagan e parte da premissa:
𝐻0:Var(𝑢|𝑥1, 𝑥2,… , 𝑥𝑘) = E(𝑢2|𝑥1, 𝑥2,… , 𝑥𝑘) = 𝜎2
( 10
)
Sob efeito da premissa nula, isto é, inexistência de heterocedasticidade, a regressão segue uma distribuição qui-quadrado com um número de graus de liberdade igual aos coeficientes analisados (exceto a constante).
Sempre que o resultado obtido excede o valor crítico para o nível de significância definido, concluí-se que existe heterocedasticidade (Gujarati, 1995).
Para minorar esta situação é fundamental a utilização de acções corretivas, mediante a utilização de regressões por mínimos quadrados ponderados, porém, se o investigador resistir em fazê-lo as conclusões retiradas são falaciosas (Greene, 2012).
3.4. Logit
Com intuito de solucionar questões relacionadas com a modelação linear foi desenvolvida uma classe alternativa de modelos intitulados como modelos binários (ou dicotómicos). Neste âmbito surge o modelo Logit, é caracterizado pela rejeição da variável dependente como uma medida quantitativa.
10
OLS - Ordinary Least Squares (Método dos Mínimos Quadrados). 11
Para um conjunto de observações de 6 até 200 e para um número máximo de 20 variáveis, limites foram tabelados pelos autores.
Desta forma, esta variável traduz-se num indicador de ocorrência de um determinado acontecimento que considera apenas um de dois valores possíveis12 (Gujarati, 1995; Cameron & Trivedi, 2005; Greene, 2012).
A descrição do modelo Logit com múltiplas variáveis é efetuada da seguinte forma: P(𝑦 = 1|𝑥1, 𝑥2,… , 𝑥𝑘) = 𝐹(𝛽0+ 𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑘𝑥𝑘)
( 11
)
No âmbito da estimação dos coeficientes e desvios padrão dos modelos Logit os métodos de máxima verosimilhança são indispensáveis. Todavia, Wooldridge (2002) atenta que a interpretação dos coeficientes desta tipologia de modelos é frequentemente difícil de realizar pelo que são convertidos em rácios de probabilidade13. Estes são alcançados efetuando o expoente do coeficiente obtido:
𝑒(𝛽0+𝛽1𝑥1+𝛽2𝑥2+⋯+𝛽𝑘𝑥𝑘)
( 12
)
Adicionalmente, Wooldridge (2002) ressalva que implícito às particularidades deste método de estimação a questão de heterocedasticidade deve ser considerada.
3.4.1. Testes de Hipóteses
Teste Likelihood Ratio
Em termos práticos, o Teste Likelihood Ratio (LR) permite comparar dois modelos alternativos baseados na estimação de máxima verosimilhança.
A ideia subjacente a este teste advém da contraposição do modelo com restrições (apenas com a constante) cujo log-likelihood é Lu com o modelo sem restrições (o que pretendemos adotar) cujo log- likelihood é Lr. Assim sendo, o teste de LR será efetuado da seguinte forma:
LR = 2(𝐿𝑢− 𝐿𝑟)
( 13
)
Sempre que a dimensão da amostra é significativa, a estatística anteriormente mencionada segue uma distribuição qui-quadrado com um número de graus de liberdade coincidente ao número de restrições efetuadas.
Adicionalmente, caso a restrição efetuada à priori seja válida, o modelo com e sem restrição não diferem pelo que o valor de LR será zero (Gujarati, 1995; Greene, 2012).
3.5. Tobit
O modelo Tobit permite estimar relações lineares pressupondo que as variáveis dependem linearmente de um parâmetro que determina a relação entre as variáveis independentes sendo a variável dependente censurada à esquerda de zero (Tobin, 1958; Gujarati, 1995).
12
No presente estudo, a inclusão do modelo Logit permite averiguar a influência das variáveis independentes na utilização de uma forma de financiamento em detrimento das restantes. Sempre que a entidade recorra a uma modalidade de financiamento a variável dependente assume o valor de 1, caso contrário assume o valor de 0. 13
A utilização desta tipologia de modelos justifica-se sempre que uma elevada fracção das variáveis dependentes não dispõe de informação, sendo a estimação dos parâmetros pelos métodos de regressão convencionais (tais como OLS) frequentemente enviesados e inconsistentes (Henningsen, 2010; Gujarati, 1995).
Em termos matemáticos, o modelo fica definido da seguinte forma:
𝑦𝑖∗= 𝛽0+ 𝛽1𝑥𝑖1+ 𝛽2𝑥𝑖2+ ⋯ + 𝛽𝑘𝑥𝑖𝑘+ 𝑢𝑖= 𝑥𝑖′𝛽 + 𝑢𝑖, 𝑖 = 1,2, … , 𝑛, 𝑢𝑖~Normal(0, 𝜎2) ( 14
)
de modo a que: {𝑦𝑖= 0 se 𝑦𝑖∗ ≤ 0 𝑦𝑖=𝑦𝑖∗se 𝑦𝑖∗> 0 ( 15
)
Apesar dos obstáculos registados inicialmente, o modelo Tobit tem-se tornado numa ferramenta crucial pelo que atualmente a sua estimação encontra-se ao nível da regressão linear. Desta forma, a função probabilidade para os modelos de regressão censurada é traduzida da seguinte forma:
ln 𝐿 = ∑ −1 2 𝑦𝑖>0 [log(2𝜋) + ln𝜎2+(𝑦𝑖− 𝑥𝑖′𝛽)2 𝜎2 ] + ∑ ln [1 − ф ( 𝑥𝑖′𝛽 𝜎 )] 𝑦𝑖=0 ( 16
)
O desenvolvimento desta equação é invulgar uma vez que concilia uma mistura de distribuições discretas e contínuas. Todavia, num dos seus estudos Amemiya (1971) demonstrou que não obstante das suas particularidades, a maximização desta função produz um estimador com as propriedades da estimativa de máxima verosimilhança.
3.5.1. Testes de Hipóteses
Teste de Wald
O teste de Wald surge como uma alternativa ao Teste Likelihood Ratio. A aplicabilidade deste teste efetua-se perante qualquer estimador que seja consistente e assintoticamente normal.
A premissa subjacente a este teste consiste em testar se os parâmetros associados com um grupo de variáveis explicativas tomam o valor zero. (Wooldrige, 2002; Greene 2012).
Para tal, a estatística de teste é quantificada em função da razão dos coeficientes e respetivo erro padrão:
𝑊=𝛽̂𝑗− 𝛽𝑗 𝑠𝑒(𝛽̂𝑗)
( 17
)
Sumariamente, o teste de Wald é equivalente ao teste F aplicável às regressões clássicas. (Wooldrige, 2002; Greene 2012).
3.6. Regressão com Dados em Paínel
A utilização dos modelos em painel difere dos modelos com séries temporais ou dados seccionais, uma vez que se atribui um índice duplo para cada variável. Para Guimarães (2009) e Gujarati (2004), esta tipologia de modelos melhora a inferência dos parâmetros estudados (devido ao maior número de observações e graus de liberdade em contrapartida da redução dos riscos de multicolinearidade14) permitindo simultaneamente a exploração das mudanças das variáveis ao longo do tempo entre as diferentes entidades em estudo.
Ao conjugar a relação entre diversas entidades ao longo do tempo existe propensão para a heterogeneidade entre os elementos em análise. No entanto, existem técnicas de estimação para os dados em painel que controlam a heterogeneidade individual a qual é sistematicamente negligenciada nas séries temporais e dados seccionais (Greene, 2012).
Em termos genéricos, a framework dos dados em painel é determinada da seguinte forma: 𝑦𝑖𝑡= 𝑥𝑖𝑡′𝛽 + 𝑧𝑖′𝛼 + 𝑢𝑖𝑡, 𝑖 = 1,2, … , 𝑛; 𝑡 = 1,2, … , 𝑇𝑖
( 18 ) A heterogeneidade, ou efeitos individuais encontram-se em 𝑧𝑖′𝛼 e 𝑢𝑖𝑡 corresponde ao erro.
Seguidamente encontram-se descritos os diferentes modelos disponíveis neste âmbito: modelo
Pooled, modelo com efeitos fixos (Fixed Effects Model - FEM) e modelo com efeitos aleatórios
(Random Effects Model – REM).