Regressão com dados em painel - O impacto do aumento do disclosure na redução da assimetria de

3. METODOLOGIA

3.4 Regressão com dados em painel

Para tratamento das variáveis analisadas nesta pesquisa, utiliza-se o modelo econométrico de dados em painel ou panel data que faz combinações de dados em corte transversal com dados em séries temporais. Larson e Farber (2010) afirmam que, após verificar se a correlação linear entre duas variáveis é significante, o próximo passo é determinar a equação da linha que melhor modela os dados. Essa linha é chamada de linha de regressão e sua equação pode ser usada para prever os valores de y para um dado valor de x. Várias linhas poderiam ser estabelecidas, porém há critérios para se fazer isso. Para cada ponto de um dado, há uma diferença (d) entre o valor observado y e o valor previsto para y, respectivamente em relação a um valor x. Essas diferenças são chamadas resíduos e podem ser positivos, negativos ou zero. O Método dos Mínimos Quadrados prevê que - de todas as linhas que podem ser desenhadas por meio de um conjunto de dados - a regressão (FRA = função de regressão amostral) é a linha para a qual a soma de todos os resíduos é mínima. A equação de uma reta de regressão permite usar a variável X independente (explanatória) para fazer previsões da variável Y dependente – vide figura 2.

Figura 2 - Regressão linear

Segundo Gujarati e Porter (2011) e Wooldridge (2013), a análise de dados em painel é apropriada para o tratamento de problemas econômicos em que variações em corte transversal e efeitos dinâmicos são relevantes. Nas séries temporais, observam-se os valores das variáveis em um período de tempo. Nos dados de corte transversal, os dados referentes às variáveis são relativos a várias unidades ou entidades amostrais no mesmo período de tempo. Nos dados em painel, a mesma unidade de corte transversal, por exemplo os dados das empresas, é monitorada ao longo do tempo.

Gujarati e Porter (2011) e Wooldridge (2013) expõem que há vantagens no uso dos dados em painel. Os dados em painel são referentes, por exemplo, às empresas e, com o tempo, tende a haver heterogeneidade nessas entidades. Os dados em painel permitem levar em consideração esse fato. Além disso, a combinação de séries temporais e observações de corte transversal permite alcançar dados mais informativos, maior variabilidade, menos colinearidade entre variáveis, mais graus de liberdade e eficiência do modelo. Os dados em painel também permitem melhor exame da dinâmica de um processo de mudança, permitindo detectar e medir melhor os seus efeitos. Os dados em painel são chamados de balanceados se cada unidade de corte transversal, por exemplo as empresas, possui o mesmo número de observações. Se cada unidade tiver número diferente de observações, denomina-se painel desbalanceado.

A equação econométrica formulada neste estudo é:

BASit = a + b1IFRSit + b2NGOVit + b3ADRit + b4lnTAMit +

b5FFLOATit + b6BETAit + b7ROAit + uit (10)

A viabilização do uso de dados em painel é verificada pela natureza da organização destes e sua adequação é feita por meio de testes dos seus pressupostos, destacando-se normalidade e homocedasticidade dos resíduos, linearidade dos coeficientes, ausência de multicolinearidade entre as variáveis independentes, ausência de autocorrelação serial nos resíduos e identificação da melhor adequação do modelo com efeitos fixos ou aleatórios.

Faz-se as seguintes explicações quanto ao modelo clássico de regressão linear, método de mínimos quadrados, conforme Gujarati e Porter (2011) e Wooldridge (2013):

a) aplica-se o teste de Hausman, para comparar os estimadores de efeito fixo e aleatório. A hipótese nula do teste de Hausman (H0) contempla que há ausência

de correlação entre as variáveis independentes e o termo de erro e, nessa situação, há dois estimadores consistentes para a matriz de parâmetros: o estimador de mínimos quadrados ordinários e o estimador de variáveis instrumentais. Se H0 for rejeitada, somente o estimador de variáveis

instrumentais é consistente; H0: estimativas de efeitos aleatórios são os

mesmos que de efeitos fixos; HA: estimativas de efeitos aleatórios são

diferentes de efeitos fixos.

b) estabelece-se que o modelo de regressão é linear nos parâmetros, com testes F e teste de Wald, embora possa ser não linear nas variáveis. Para efetuar o teste do pressuposto de linearidade, sua hipótese nula (H0) é que o coeficiente

(β) é igual a zero. Como resultado, deseja-se rejeitar H0;

c) parte-se de Hair et al. (2005 b), os quais afirmam que a suposição mais fundamental em análise multivariada é a normalidade dos resíduos. Sua rejeição torna os testes de regressão inválidos, uma vez que a normalidade é exigida no emprego das estatísticas F e t;

d) considera-se que o termo de erro, no pressuposto, segue distribuição normal. O valor médio esperado do termo de erro é zero. Nesta hipótese, não existe viés de especificação no modelo usado na análise empírica, ou seja, o modelo está especificado corretamente. Um erro de especificação ocorre quando não são consideradas variáveis independentes ou explanatórias relevantes, quando se inclui no modelo variáveis desnecessárias ou quando se escolhe uma relação incorreta funcional entre as variáveis dependente e independentes. O teste de Jarque-Bera é um teste assintótico, ou seja, para grandes amostras, e que se baseia nos resíduos do método de Mínimos Quadrados Ordinários (MQO). A estatística do teste de Jarque-Bera segue a

distribuição Qui-Quadrado com dois graus de liberdade. Sua hipótese nula (H0)

é de que os resíduos se distribuem normalmente;

e) apresenta-se outro pressuposto, no uso da regressão múltipla linear, como a existência de homocedasticidade dos termos de erro. O conjunto de resíduos referentes a cada observação de X deve ter variância constante ou homogênea em toda a extensão das variáveis independentes, ou seja, a dispersão da variável dependente (Y) em relação às observações das variáveis independentes (Xi) deve manter consistência ou ser constante em todas as dimensões dessa variável. O teste geral de heterocedasticidade de White não depende da hipótese de normalidade. A hipótese nula (H0) do teste é que a

variância dos resíduos é constante ou homoscedástica;

f) propõe-se que dados quaisquer valores de variáveis independentes, não há autocorrelação serial entre os termos de erro. (Teste de Breusch-Godfrey).

Para Gujarati e Porter (2011) e Wooldridge (2013), o modelo de efeitos fixos permite usar todas as informações disponíveis, uma vez que o intercepto pode variar livremente entre empresas e/ou tempo. Dessa forma, o efeito de variáveis omitidas pode ser capturado pelo modelo. No entanto, o modelo de efeitos fixos possui limitação quanto aos graus de liberdade. Já o modelo de efeitos aleatórios assume a independência entre o termo de erro e as variáveis independentes, considerando a heterogeneidade como uma variável, que impacta os resíduos da regressão. O modelo estático pode apresentar problemas de heteroscedasticidade ou dispersão ou variância desigual do termo de erro.

No documento O impacto do aumento do disclosure na redução da assimetria de informação, abordada como componente do custo de capital próprio (páginas 62-66)