• Nenhum resultado encontrado

5 METODOLOGIA DA PESQUISA

5.5 Modelagem econométrica

5.5.3 Modelagem com regressão quantílica

O segundo caminho proposto é o da utilização da regressão quantílica, tal como fora adotado nos trabalhos anteriormente citados de Fattouh, Harris e Scaramozzino (2004), Margaritis e Psillaki (2007), Matos, Ferreira e Mergulhão (2008) e Rocha e Bressan (2012). Cameron e Trivedi (2005) destacam que este método é preferível à separação da amostra em subgrupos para análises separadas, pois esta se torna problemática a partir do momento em que diversos atributos são incluídos nas equações de regressão. Assim, eles sugerem a regressão quantílica, que trabalha com os quantis da distribuição condicional da variável dependente, considerando as variáveis independentes como dadas. O ponto de partida é uma equação linear similar à das regressões lineares convencionais, mas dada para cada quantil q possível. No caso de uma regressão de dados cross-sectional a equação seria dada por (NARULA e WELLINGTON, 1982):

(43)

Em que:

yi– valor assumido pela variável dependente y para a i-ésima observação

q – vetor de coeficientes das variáveis independentes no q-ésimo quantil da distribuição de probabilidades de yi.

Xi’ – vetor dos valores assumidos para as variáveis independentes no caso da i-ésima observação.

εi,q – termo de perturbação estocástica para a i-ésima observação, no q-ésimo quantil da

distribuição de probabilidades de yi.

Isolando-se o termo εi,q, tem-se que ele será dado por:

Definindo o multiplicador hi como sendo (NARULA e WELLINGTON, 1982):

{

(45)

Os mesmos autores definem a soma dos desvios absolutos (QN) como sendo:

| | (46)

Para o caso da mediana (q = 0,50), todas as observações terão o mesmo peso. Assim, o valor de QN será igual a duas vezes a soma dos módulos de todos os desvios.

Para o caso de se trabalhar com quantis diferentes, tem-se que os resíduos serão ponderados. Por exemplo, se for assumido q = 0,25 (25º percentil), as observações cujos valores reais da variável dependente (yi) forem iguais ou superiores às estimativas do modelo

(Xi’ q) – ou seja, aquelas cujos resíduos forem positivos – terão os valores de seus erros ponderados por um fator de 0,50 (duas vezes q). Enquanto isso, as observações com valores reais inferiores às suas estimativas pela regressão – ou seja, com resíduos negativos – terão uma ponderação de 1,50 (duas vezes o complemento 1 – q).

Generalizando, a equação para a estimação do vetor de coeficientes q será dada por

(CAMERON e TRIVEDI, 2005):

( ) ∑ | | ∑ | | (47) Em que:

q – número do percentil para o qual se deseja estimar a equação de regressão. yi– valor assumido pela variável dependente y para a i-ésima observação.

q – vetor de coeficientes das variáveis independentes no q-ésimo quantil da distribuição de probabilidades de yi.

Xi – vetor dos valores assumidos para as variáveis independentes no caso da i-ésima observação.

εi,q – termo de perturbação estocástica para a i-ésima observação, no q-ésimo quantil da

O objetivo é minimizar o valor de QN a partir de variações nos estimadores q. Neste

caso, porém, a equação gera resultados distintos para cada um dos quantis q possíveis. Na prática, a tendência é a utilização de apenas alguns deles, mais relevantes para o problema em questão. Caso q = 0,50, todas as observações sofrerão a mesma ponderação, obtendo-se uma análise baseada na mediana da amostra.

Caso se adote um quantil mais baixo, as observações cujos valores reais da variável dependente (yi) forem iguais ou superiores às estimativas do modelo (Xi’ q) – ou seja, com resíduos positivos – terão influência menor na determinação de QN. Por exemplo, se for

assumido q = 0,25 (1º quartil), essas observações terão os valores de seus erros ponderados por um fator de 0,50. Enquanto isso, as observações com valores reais inferiores às suas estimativas pela regressão – ou seja, com resíduos negativos – terão uma ponderação maior nos seus erros. No caso de q = 0,25, essa ponderação será de 1,50. Assim, o objetivo de minimizar QN passa a ser buscado pela redução mais dos resíduos negativos do que dos

resíduos positivos. Em outras palavras, admite-se mais que os valores previstos pelo modelo fiquem abaixo dos valores reais do que acima. No caso de quantis elevados, as conclusões se invertem.

Considerando-se a aplicação desta técnica para a determinação da estrutura de capital – ou seja, que a variável dependente seja o endividamento total (BTL) ou o endividamento de longo prazo (BLTL) – tem-se que, para os percentis inferiores ao 50º o modelo tem maior tolerância para uma estimativa (em função das variáveis consideradas) abaixo da correta para o endividamento, mas não admite uma estimativa muito acima. Isso se mostra condizente com a ideia de que o foco do estudo para percentis inferiores na proposta seria o conjunto de empresas cuja utilização de capital de terceiros é mais baixa. Por exemplo, para empresas cujo endividamento real seja de 10% é mais tolerável que o modelo faça uma previsão de um nível de 8% do que de um nível de 12%.

De forma oposta, para percentis superiores ao 50º o modelo aceita melhor que ocorram estimativas acima do endividamento correto, mas admite pouco que ocorram erros para baixo. Da mesma maneira, há coerência nesse raciocínio, já que o objeto de estudo no caso dos percentis superiores seriam as empresas mais endividadas. Assim, considerar uma empresa muito endividada mais do que ela realmente é não seria muito problemático, mas considerá-la menos do que a realidade causaria grande distorção na análise. Por tudo isso, a utilização das ponderações. Por exemplo, para empresas cujo endividamento real seja de 70%, é mais tolerável uma previsão feita pelo modelo de um nível de 75% do que de um nível de 65%.

Cameron e Trivedi (2005) destacam que esta técnica tem uma grande vantagem em relação aos mínimos quadrados ordinários, pois, como os erros são calculados como desvios absolutos, e não como desvios ao quadrado, a estimação se torna menos sensível à presença de outliers.

De outro lado, a maximização do valor de Q não é possível de ser obtida analiticamente, uma vez que esta função envolve a utilização de módulos. Assim, ela tem que ser obtida necessariamente por meio de técnicas de programação linear.

De maneira distinta dos modelos anteriores, a verificação das diferenças de comportamento não pode ser feita diretamente pelo teste estatístico de coeficientes, uma vez que são estimadas equações separadas para cada quantil. Contudo, Koenker e Bassett (1978) sugerem uma versão alternativa do teste Wald, na qual se comparam os coeficientes que cada variável gera nos quantis envolvidos, a fim de determinar se existe ou não significância nessa diferença estatística.

Um dos principais pontos positivos desta técnica consiste em permitir a determinação do comportamento das firmas que se encontram em diversos níveis de endividamento, sem a necessidade de que se conheça qualquer tipo de forma funcional sobre como esse comportamento evolui ao longo da amostra. Além disso, por utilizar toda a amostra na estimação (embora com ponderação maior para os elementos com determinado tipo de erro, positivo ou negativo, dependendo do caso), isso diminui o problema do viés de seleção. Além disso, Narula e Wellington (1982) argumentam que este é um tipo de modelagem que trata melhor da questão da heterocedasticidade, por considerar diferentes equações para cada parte da amostra.

De outro lado, uma das principais limitações deste modelo está em sua implementação, em especial para o caso de regressão de dados em painel. Da forma como esta metodologia fora apresentada anteriormente, assume-se que cada observação anual fica sendo tratada como se fosse independente das demais daquela firma. Podem-se inserir variáveis

dummy para cada firma, compondo-se uma espécie de painel de efeitos fixos (GREENE,

2003).13 Contudo, não se sabe se esta será a melhor especificação para o painel, já que a montagem de uma estrutura com efeitos aleatórios possui uma complexidade muito maior.

13

Em todas as consultas efetuadas ao Statalist (lista de tópicos relacionados ao software Stata©), a sugestão adotada para o uso de dados em painel foi exatamente a inclusão de variáveis dummy, tal como sugerido em Greene (2003). Isso implica a imposição de que o modelo de efeitos fixos seja utilizado em detrimento do modelo de efeitos aleatórios, cuja implementação em Stata não está desenvolvida, ao menos até onde conhece o autor.

Considerando este problema, foram propostas duas formas de modelagem para esta pesquisa, considerando a metodologia da regressão quantílica. Na primeira delas, foi desconsiderada a defasagem do endividamento, sendo as equações para BTL e BLTL dadas por:

Em que:

btli,t– valor assumido pelo endividamento total para a firma “i” no tempo “t”.

bltli,t– valor assumido pelo endividamento de longo prazo para a firma “i” no tempo “t”.

q – vetor de coeficientes dos determinantes da estrutura de capital no q-ésimo quantil da distribuição de probabilidades de yi.

Zi,t – vetor de valores assumidos pelos determinantes da estrutura de capital para a firma “i” no período “t”, formado pelas variáveis PROFIT, GONPV, NDTS, SIZE, Z_SCORE, CURRLIQ, TANG, PAYOUT, SING e PROPCON.

εi,t,q– termo de perturbação estocástica para a firma “i” no tempo “t”, para o q-ésimo quantil

da distribuição de probabilidades de yi.

Já a segunda seria a versão com a inclusão da defasagem do endividamento. Neste caso, as equações para BTL e BTLT são dadas por (considerando a especificação de ajuste parcial):

Em que:

btli,t– valor assumido pelo endividamento total para a firma “i” no tempo “t”.

btli,t-1– valor assumido pelo endividamento total para a firma “i” no tempo “t – 1”.

bltli,t-1– valor assumido pelo endividamento de longo prazo para a firma “i” no tempo “t – 1”.

q – vetor de coeficientes dos determinantes da estrutura de capital no q-ésimo quantil da distribuição de probabilidades de yi.

λ – fator de ajustamento parcial da estrutura de capital, entre 0 e 1, inclusive.

Zi,t – vetor de valores assumidos pelos determinantes da estrutura de capital para a firma “i” no período “t”, formado pelas variáveis PROFIT, GONPV, NDTS, SIZE, Z_SCORE, CURRLIQ, TANG, PAYOUT, SING e PROPCON.

εi,t,q– termo de perturbação estocástica para a firma “i” no tempo “t”, para o q-ésimo quantil

da distribuição de probabilidades de yi.

Em função das vantagens e desvantagens de cada uma das duas metodologias aqui descritas, ambas foram utilizadas no processo de estimação, a fim de buscar resultados que sejam robustos com relação ao método utilizado. O primeiro modelo sugerido para a regressão quantílica (sem o termo de defasagem de BTL e de BLTL) foca sua avaliação na estática da estrutura de capital; ou seja, na explicação da composição das fontes de financiamento no contexto das demais variáveis no próprio período. Já o segundo modelo para a regressão quantílica (com o uso de defasagens) e o modelo com termos de interação permitem a captação da dinâmica da escolha da estrutura de capital, podendo-se observar tendências de comportamento do endividamento contemporâneo em relação aos seus valores passados.

Como será descrito no próximo capítulo, o uso dessas técnicas permitiu a identificação mais clara de diferenças de comportamento entre as empresas que possuem diversos graus de endividamento, permitindo a análise das hipóteses desta pesquisa.