Procedimentos e técnicas estatísticas para análise dos dados

4. SETOR DE CONSTRUÇÃO NO BRASIL

5.3 Procedimentos e técnicas estatísticas para análise dos dados

O procedimento adotado após a extração das demonstrações financeiras, dos índices de criação de valor já calculados pelo sistema Economática, e as cotações das ações foi o cálculo do índice Q de Tobin, cuja metodologia utilizada foi demonstrada anteriormente neste estudo. Portanto para o cálculo dos índices utilizou-se as demonstrações financeiras de fechamento dos anos de 2010 a 2013 e as cotações de fechamento do último dia útil de cada ano das ações das empresas foco deste estudo. Deve-se ressaltar que foram utilizadas as cotações das ações ON (ordinárias).

Após o cálculo do índice Q de Tobin, chega-se a uma planilha que contém todas as empresas deste estudo com todos os índices calculados para o período de 2010 a 2013 (vide Apêndice II). A próxima etapa foi efetuar a classificação das empresas em 0, empresas classificadas no segmento Nível 1 e Nível 2 e Tradicional da BM&FBOVESPA, e 1, empresas classificadas no segmento especial Novo Mercado (vide Apêndice II).

Com os índices calculados e as empresas corretamente classificadas nos segmentos aplica-se o teste estatístico da regressão logística para verificar se as variáveis (índices escolhidos) podem ou não discrimir as empresas que adotam as boas práticas de governança corporativa.

Sobre a Regressão Logística, quando a variável dependente é qualitativa por natureza e precisa ser representada por uma variável dummy (0 ou 1), o modelo logístico se mostra apropriado para ser utilizado. Alguns exemplos são o problema de explicar se um indivíduo comprará um carro ou não, se um indivíduo estará dentro ou fora da força de trabalho, ou se um indivíduo votará sim ou não em um referendo.

Esse método, assim como as regressões linear e múltipla, estuda a relação entre uma variável resposta e uma ou mais variáveis independentes. A diferença entre estas técnicas de regressão se deve ao fato de que, na regressão logística, as variáveis dependentes estão dispostas em categorias, enquanto na regressão linear estas variáveis são dados contínuos. Outra diferença é que na regressão logística a resposta é expressa por meio de uma probabilidade de ocorrência, enquanto na regressão simples obtém-se um valor numérico (FIGUEIRA, 2006).

A ferramenta que pode fornecer os indícios correlatos diretamente à resposta do problema de pesquisa é a análise de regressão logística. Segundo Fávero et al. (2009, p. 441), a técnica de regressão logística foi desenvolvida tanto para realizar predições como para

explicar fenômenos quando a variável dependente for de natureza binária, podendo as variáveis independentes serem métricas ou não-métricas.

Field (2009, p. 221) simplifica a relação ao dizer que a técnica define a probabilidade de a observação pertencer a uma ou outra categoria, dadas certas informações.

A preferência pela regressão logística em relação a outras técnicas foi baseada nas argumentações dos seguintes autores:

Hair et al. (2005, p. 231), que apresentam a ideia de que a Análise Discriminante também pode ser utilizada quando a variável dependente é categórica, mas quando a variável dependente é binária a regressão logística é preferida por não ficar restrita ao atendimento de pressupostos de normalidade multivariada e de matrizes iguais de variância-‐covariância nos dois grupos.

Fávero et al. (2009, p. 440) defendem a flexibilidade aos pressupostos de normalidade dos resíduos e de presença de homogeneidade das matrizes de variância e covariância para as categorias e ainda relatam sobre a capacidade de a regressão logística não só avaliar a possibilidade de ocorrência do evento de interesse, mas também de avaliar a probabilidade de ocorrência (risco); e

Hair et al. (2005, p. 232) apontam que a regressão logística relaciona variáveis independentes com a probabilidade de ocorrência de determinado evento.

A base da regressão logística, segundo Hair et al. (2005, p. 232), é a natureza não-linear da transformação logística e o método da máxima verossimilhança. As estimativas encontradas são aquelas que maximizam a relação da probabilidade de ocorrência do evento em relação aos coeficientes do modelo.

Tomando como base os conceitos dos autores descritos acima, com o resultado da regressão logística pode-se analisar a relação e relevância dos índices de criação de valor com a probabilidade de ocorrência do evento pesquisado.

Na transformação logística, o coeficiente do modelo compara a probabilidade de o evento ocorrer com a probabilidade de o evento não ocorrer. Os coeficientes estimados são medidas das variações na proporção das probabilidades, uma razão de desigualdade, expressa da seguinte forma:

Prob_{(evento ocorrer)}

Prob_{(evento não ocorrer)}= !

!_!!!

!∗!!!⋯!!!∗!!

A probabilidade da variável Y poderá ser determinada por:,

! ! =_!!!!_!!,

! = ln ! −1

! = !!+ !!∗ !! + ⋯ + !!∗ !!

sendo que,

P(Y) é a probabilidade da empresa pertencer ao Novo Mercado com base nas variáveis explicativas

b_!_{é o coeficiente linear da equação}

b! são os coeficientes angulares da equação

Elucidada a característica da regressão logística, é importante fixar que a variável dependente binária da pesquisa é representada pelo nível de Governança Corporativa, sendo definido o valor (1) para empresas que estão no Novo Mercado e (0) para empresas que não são do Novo Mercado. Os índices de criação de valor que serão utilizados como variáveis

explicativas são: Índice Preço sobre Lucro, Índice Valor de mercado sobre Valor contábil,

Índice Preço sobre Vendas, Índice Preço da ação sobre EBITDA por ação, Índice Preço da

ação sobre fluxo de caixa livre por ação e Índice Q de Tobin.

Hosmer e Lemeshow (1989) propuseram a avaliação de um modelo de regressão logística por meio de um teste de classificação. Os casos são divididos em 10 subgrupos e as probabilidades são calculadas para cada uma das observações de cada subgrupo e classificadas com evento ou sem o evento. Em seguida, os eventos reais e previstos dos subgrupos são comparados, o que possibilita avaliar a precisão preditiva do modelo pela aplicação do teste qui-quadrado. Logo, se o total de casos previstos for superior a 50%, o modelo apresenta um ajuste estatístico adequado.

O método Stepwise (método passo a passo) é o procedimento para seleção ou exclusão de variáveis de um modelo é baseado em um algoritmo que checa a importância das variáveis, incluindo ou excluindo-as do modelo se baseando em uma regra de decisão. A importância da variável é definida em termos de uma medida de significância estatística do coeficiente associado à variável para o modelo. Na regressão logística os erros seguem distribuição binomial e a significância é assegurada via Teste da Razão de Verossimilhança. Assim, em cada passo do procedimento a variável mais importante, em termos estatísticos, é aquela que produz a maior mudança no logaritmo da verossimilhança em relação ao modelo que não contém a variável.

Em estatística, os testes de normalidade são usados para determinar se um conjunto de dados de uma dada variável aleatória, é bem modelada por uma distribuição

normal ou não, ou para calcular a probabilidade da variável aleatória subjacente estar normalmente distribuída. O teste de Jarque-Bera tem como hipótese nula a normalidade. Assim, se o p-valor for menor do que 5% (ou 10%), p<0,05 (p<0,10), então o autor rejeita a normalidade. Já se p>0,05, normalidade é aceita.

O GRETL (Gnu Regression, Econometrics and Time-series Library) é um pacote estatístico livre e multiplataforma desenvolvido, principalmente, para ser usado em pesquisas econométricas.

No documento GOVERNANÇA CORPORATIVA E CRIAÇÃO DE VALOR NO SETOR DE CONSTRUÇÃO CIVIL NO PERÍODO DE 2010 A 2013 (páginas 92-97)