Pressupostos Subjacentes à Regressão Linear

Capítulo III – Modelos e Métodos

3. Modelos e Métodos

3.3.1. Pressupostos Subjacentes à Regressão Linear

Para se considerar como válidas as estimações e as inferências obtidas no âmbito das regressões lineares é crucial que se verifiquem um conjunto de pressupostos (Gujarati, 1995; Greene, 2012):

a) Linearidade do modelo de Regressão;

Na literatura internacional este conceito é frequentemente designado como Balanced Panel Data. 8

Isto é, comprova-se a existência de uma relação linear entre a variável dependente e a(s) independente(s);

b) Inexistência de relações lineares perfeitas entre as variáveis independentes; c) Exogeneidade das variáveis independentes;

O valor esperado do termo do erro 𝑢 não é determinado em função das variaveis independentes, uma vez que estas não contribuem com informação útil para a previsão do mesmo. Simbolicamente:

E(𝑢|𝑥1, 𝑥2,… , 𝑥𝑘) = 0

( 3

)

d) Homosteceidade;

Este pressuposto prevê que cada termo do erro apresenta uma variância idêntica para todas as observações e os termos do erro não se correlacionados entre si. Simbolicamente:

Var(𝑢|𝑥1, 𝑥2,… , 𝑥𝑘) = 𝜎2

( 4

)

e) Processo de geração de dados para os regressores;

Em termos teóricos, este pressuposto ressalva a importância de se verificar regressores estocásticos9. No entanto, os investigadores sociais raramente desenvolvem modelos em torno de regressores fixos. Assim sendo, em termos práticos, este pressuposto considera a existência de um

mix entre constantes e variáveis aleatórias. Nesta linha de pensamento, a média e variância do erro 𝑢

são independentes das variáveis explicativas 𝑥1, 𝑥2,… , 𝑥𝑘.

f) Normalidade;

Na análise de regressões lineares é crucial assumir que os erros se encontram normalmente distribuídos, e com média de zero e variância constante. Na maioria dos casos o pressuposto de normalidade é razoável, no entanto, alguns autores consideram que este conceito é frequentemente desnecessário uma vez que as regressões múltiplas permitem obter resultados estatísticos exactos. Simbolicamente:

𝑢~Normal(0, 𝜎2₎

( 5

)

g) Número de observações deve ser superior ao número de parâmetros a serem estimados.

3.3.2. Testes de Diagnóstico

Dados os pressupostos da regressão lineares anteriormente mencionados, e efetuada estimação dos parâmetros dos modelos, é crucial efetuar testes de diagnóstico para averiguar a validade e veracidade dos modelos adotados.

Em termos estatísticos um padrão estocástico é aquele cujo estado é indeterminado, isto é, com origem

 Teste de Significância Global (F Snedecor)

Para comprovar a validade da regressão linear é fundamental efetuar o teste de significância global. Este teste contrapõe a inexistência de variáveis com impacto na regressão (hipótese nula) com a observação de pelo menos uma variável significativa (Gujarati, 1995):

H0: 𝛽1= 𝛽2= ⋯ = 𝛽𝑘 = 0

( 6

)

Caso o valor da estatística F obtido seja superior ao valor crítico para o nível de significância escolhido deve-se rejeitar a hipótese nula; caso contrário considera-se a inexistência de variáveis significativas (Gujarati, 1995; Greene, 2012).

 Teste de Significância Individual (Teste t)

Dado o pressuposto de normalidade é possível utilizar o teste t para analisar os coeficientes de regressão parciais individuais. Sob a hipótese nula, este teste averigua a inexistência de uma relação entre a variável dependente e independente sob análise:

H0: 𝛽𝑗= 0 e H1: 𝛽𝑗≠ 0, 𝑗 = 0,1, … , 𝑘

( 7

)

Se os resultados obtidos excedem o valor crítico de t para o nível de significância escolhido, deve-se proceder à rejeição da hipótese nula (Gujarati, 1995).

Convém reiterar que os testes de significância individual e global são distintos, uma vez que com base no teste t pode-se ser possível aceitar a hipótese nula. Todavia no teste de significância global pode-se rejeitar a hipótese, dado que todos os coeficientes são zero. Deste modo, Gujarati (1995) citando Fomby (1984) considera que o teste t não é substituto do teste F e vice-versa.

 Teste de Autocorrelação (Teste DW)

O teste de mais comum para detetar a existência de correlações entre os resíduos é designado por Teste de Durbin-Watson (DW). Embora este teste seja frequentemente utilizado em séries temporais, o mesmo afigura-se como uma ferramenta crucial na modelação de dados seccionais. (Greene, 2012).

Uma das principais causas da autocorrelação é a inércia presente nos dados traduzida por movimentos de tendência ao longo do tempo conjugados com alguns movimentos cíclicos ou oscilatórios resultantes de recessões ou medidas expansionistas.

Em termos matemáticos, o teste pode ser definido da seguinte forma:

𝑑𝑤 =∑ (𝑢̂𝑡− 𝑢̂𝑡−1) 2 𝑛 𝑡=2 ∑𝑛𝑡=1𝑢̂𝑡2 ( 8

)

onde 𝑛 é o número de observações da amostra e 𝑢̂𝑡 são os resíduos OLS10.. Uma vez que ∑𝑛𝑡=1𝑢̂𝑡2 e ∑𝑛𝑡=1𝑢̂𝑡−12 diferem apenas numa observação, é possível efetuar a seguinte aproximação:

𝑑𝑤 ≈∑ 𝑢̂𝑡𝑢̂𝑡−1 𝑛

𝑡=2 ∑𝑛𝑡=1𝑢̂𝑡2

( 9

)

Contrariamente aos testes t e F o teste de Durbin Watson não apresenta um único valor crítico que leva à rejeição da hipótese nula. Alternativamente, os autores definiram a existência de um limite inferior dL e um limite superior dU, pelo que se o resultado obtido para d, se encontrar fora deste âmbito, é possível constatar a existência de uma correlação positiva ou negativa Os limites mencionados anteriormente dependem exclusivamente do número de observações n e do número de variáveis independentes11.

 Teste de Heterocedasticidade (Teste de Breusch-Pagan)

A presença de heterocedasticidade coloca problemas de inferência nos modelos de regressão linear, dada a produção frequente de estimadores enviesados. Este problema é verificado com mais frequência nos dados seccionais do que nas séries temporais, uma vez que a transversalidade dos dados implica a heterogeneidade dos elementos para um determinado período de tempo (Gujarati, 1995; Greene 2012).

Nesta medida, é essencial a utilização de testes que despistem a existência desta característica, um dos testes utilizados de forma mais regular foi proposto por Breusch Pagan e parte da premissa:

𝐻0:Var(𝑢|𝑥1, 𝑥2,… , 𝑥𝑘) = E(𝑢2|𝑥1, 𝑥2,… , 𝑥𝑘) = 𝜎2

( 10

)

Sob efeito da premissa nula, isto é, inexistência de heterocedasticidade, a regressão segue uma distribuição qui-quadrado com um número de graus de liberdade igual aos coeficientes analisados (exceto a constante).

Sempre que o resultado obtido excede o valor crítico para o nível de significância definido, concluí-se que existe heterocedasticidade (Gujarati, 1995).

Para minorar esta situação é fundamental a utilização de acções corretivas, mediante a utilização de regressões por mínimos quadrados ponderados, porém, se o investigador resistir em fazê-lo as conclusões retiradas são falaciosas (Greene, 2012).

3.4. Logit

Com intuito de solucionar questões relacionadas com a modelação linear foi desenvolvida uma classe alternativa de modelos intitulados como modelos binários (ou dicotómicos). Neste âmbito surge o modelo Logit, é caracterizado pela rejeição da variável dependente como uma medida quantitativa.

OLS - Ordinary Least Squares (Método dos Mínimos Quadrados). 11

Para um conjunto de observações de 6 até 200 e para um número máximo de 20 variáveis, limites foram tabelados pelos autores.

Desta forma, esta variável traduz-se num indicador de ocorrência de um determinado acontecimento que considera apenas um de dois valores possíveis12 (Gujarati, 1995; Cameron & Trivedi, 2005; Greene, 2012).

A descrição do modelo Logit com múltiplas variáveis é efetuada da seguinte forma: P(𝑦 = 1|𝑥1, 𝑥2,… , 𝑥𝑘) = 𝐹(𝛽0+ 𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑘𝑥𝑘)

( 11

)

No âmbito da estimação dos coeficientes e desvios padrão dos modelos Logit os métodos de máxima verosimilhança são indispensáveis. Todavia, Wooldridge (2002) atenta que a interpretação dos coeficientes desta tipologia de modelos é frequentemente difícil de realizar pelo que são convertidos em rácios de probabilidade13. Estes são alcançados efetuando o expoente do coeficiente obtido:

𝑒(𝛽₀+𝛽₁𝑥₁+𝛽₂𝑥₂+⋯+𝛽_𝑘𝑥_𝑘)

( 12

)

Adicionalmente, Wooldridge (2002) ressalva que implícito às particularidades deste método de estimação a questão de heterocedasticidade deve ser considerada.

3.4.1. Testes de Hipóteses

 Teste Likelihood Ratio

Em termos práticos, o Teste Likelihood Ratio (LR) permite comparar dois modelos alternativos baseados na estimação de máxima verosimilhança.

A ideia subjacente a este teste advém da contraposição do modelo com restrições (apenas com a constante) cujo log-likelihood é Lu com o modelo sem restrições (o que pretendemos adotar) cujo log- likelihood é Lr. Assim sendo, o teste de LR será efetuado da seguinte forma:

LR = 2(𝐿𝑢− 𝐿𝑟)

( 13

)

Sempre que a dimensão da amostra é significativa, a estatística anteriormente mencionada segue uma distribuição qui-quadrado com um número de graus de liberdade coincidente ao número de restrições efetuadas.

Adicionalmente, caso a restrição efetuada à priori seja válida, o modelo com e sem restrição não diferem pelo que o valor de LR será zero (Gujarati, 1995; Greene, 2012).

3.5. Tobit

O modelo Tobit permite estimar relações lineares pressupondo que as variáveis dependem linearmente de um parâmetro que determina a relação entre as variáveis independentes sendo a variável dependente censurada à esquerda de zero (Tobin, 1958; Gujarati, 1995).

No presente estudo, a inclusão do modelo Logit permite averiguar a influência das variáveis independentes na utilização de uma forma de financiamento em detrimento das restantes. Sempre que a entidade recorra a uma modalidade de financiamento a variável dependente assume o valor de 1, caso contrário assume o valor de 0. 13

A utilização desta tipologia de modelos justifica-se sempre que uma elevada fracção das variáveis dependentes não dispõe de informação, sendo a estimação dos parâmetros pelos métodos de regressão convencionais (tais como OLS) frequentemente enviesados e inconsistentes (Henningsen, 2010; Gujarati, 1995).

Em termos matemáticos, o modelo fica definido da seguinte forma:

𝑦𝑖∗= 𝛽0+ 𝛽1𝑥𝑖1+ 𝛽2𝑥𝑖2+ ⋯ + 𝛽𝑘𝑥𝑖𝑘+ 𝑢𝑖= 𝑥𝑖′𝛽 + 𝑢𝑖, 𝑖 = 1,2, … , 𝑛, 𝑢𝑖~Normal(0, 𝜎2) ( 14

)

de modo a que: {𝑦𝑖= 0 se 𝑦𝑖∗ ≤ 0 𝑦𝑖=𝑦𝑖∗

se 𝑦𝑖∗> 0 ( 15

)

Apesar dos obstáculos registados inicialmente, o modelo Tobit tem-se tornado numa ferramenta crucial pelo que atualmente a sua estimação encontra-se ao nível da regressão linear. Desta forma, a função probabilidade para os modelos de regressão censurada é traduzida da seguinte forma:

ln 𝐿 = ∑ −1 2 𝑦_𝑖>0 [log(2𝜋) + ln𝜎2₊(𝑦𝑖− 𝑥𝑖′𝛽)2 𝜎2 ] + ∑ ln [1 − ф ( 𝑥𝑖′𝛽 𝜎 )] 𝑦_𝑖=0 ( 16

)

O desenvolvimento desta equação é invulgar uma vez que concilia uma mistura de distribuições discretas e contínuas. Todavia, num dos seus estudos Amemiya (1971) demonstrou que não obstante das suas particularidades, a maximização desta função produz um estimador com as propriedades da estimativa de máxima verosimilhança.

3.5.1. Testes de Hipóteses

 Teste de Wald

O teste de Wald surge como uma alternativa ao Teste Likelihood Ratio. A aplicabilidade deste teste efetua-se perante qualquer estimador que seja consistente e assintoticamente normal.

A premissa subjacente a este teste consiste em testar se os parâmetros associados com um grupo de variáveis explicativas tomam o valor zero. (Wooldrige, 2002; Greene 2012).

Para tal, a estatística de teste é quantificada em função da razão dos coeficientes e respetivo erro padrão:

𝑊=𝛽̂𝑗− 𝛽𝑗 𝑠𝑒(𝛽̂𝑗)

( 17

)

Sumariamente, o teste de Wald é equivalente ao teste F aplicável às regressões clássicas. (Wooldrige, 2002; Greene 2012).

3.6. Regressão com Dados em Paínel

A utilização dos modelos em painel difere dos modelos com séries temporais ou dados seccionais, uma vez que se atribui um índice duplo para cada variável. Para Guimarães (2009) e Gujarati (2004), esta tipologia de modelos melhora a inferência dos parâmetros estudados (devido ao maior número de observações e graus de liberdade em contrapartida da redução dos riscos de multicolinearidade14) permitindo simultaneamente a exploração das mudanças das variáveis ao longo do tempo entre as diferentes entidades em estudo.

Ao conjugar a relação entre diversas entidades ao longo do tempo existe propensão para a heterogeneidade entre os elementos em análise. No entanto, existem técnicas de estimação para os dados em painel que controlam a heterogeneidade individual a qual é sistematicamente negligenciada nas séries temporais e dados seccionais (Greene, 2012).

Em termos genéricos, a framework dos dados em painel é determinada da seguinte forma: 𝑦𝑖𝑡= 𝑥𝑖𝑡′𝛽 + 𝑧𝑖′𝛼 + 𝑢𝑖𝑡, 𝑖 = 1,2, … , 𝑛; 𝑡 = 1,2, … , 𝑇𝑖

( 18 ) A heterogeneidade, ou efeitos individuais encontram-se em 𝑧𝑖′𝛼 e 𝑢𝑖𝑡 corresponde ao erro.

Seguidamente encontram-se descritos os diferentes modelos disponíveis neste âmbito: modelo

Pooled, modelo com efeitos fixos (Fixed Effects Model - FEM) e modelo com efeitos aleatórios

(Random Effects Model – REM).

No documento Estrutura de financiamento das empresas start-up (páginas 49-55)