• Nenhum resultado encontrado

Procedimentos e técnicas estatísticas para análise dos dados

4. SETOR DE CONSTRUÇÃO NO BRASIL

5.3 Procedimentos e técnicas estatísticas para análise dos dados

O procedimento adotado após a extração das demonstrações financeiras, dos índices de criação de valor já calculados pelo sistema Economática, e as cotações das ações foi o cálculo do índice Q de Tobin, cuja metodologia utilizada foi demonstrada anteriormente neste estudo. Portanto para o cálculo dos índices utilizou-se as demonstrações financeiras de fechamento dos anos de 2010 a 2013 e as cotações de fechamento do último dia útil de cada ano das ações das empresas foco deste estudo. Deve-se ressaltar que foram utilizadas as cotações das ações ON (ordinárias).

Após o cálculo do índice Q de Tobin, chega-se a uma planilha que contém todas as empresas deste estudo com todos os índices calculados para o período de 2010 a 2013 (vide Apêndice II). A próxima etapa foi efetuar a classificação das empresas em 0, empresas classificadas no segmento Nível 1 e Nível 2 e Tradicional da BM&FBOVESPA, e 1, empresas classificadas no segmento especial Novo Mercado (vide Apêndice II).

Com os índices calculados e as empresas corretamente classificadas nos segmentos aplica-se o teste estatístico da regressão logística para verificar se as variáveis (índices escolhidos) podem ou não discrimir as empresas que adotam as boas práticas de governança corporativa.

Sobre a Regressão Logística, quando a variável dependente é qualitativa por natureza e precisa ser representada por uma variável dummy (0 ou 1), o modelo logístico se mostra apropriado para ser utilizado. Alguns exemplos são o problema de explicar se um indivíduo comprará um carro ou não, se um indivíduo estará dentro ou fora da força de trabalho, ou se um indivíduo votará sim ou não em um referendo.

Esse método, assim como as regressões linear e múltipla, estuda a relação entre uma variável resposta e uma ou mais variáveis independentes. A diferença entre estas técnicas de regressão se deve ao fato de que, na regressão logística, as variáveis dependentes estão dispostas em categorias, enquanto na regressão linear estas variáveis são dados contínuos. Outra diferença é que na regressão logística a resposta é expressa por meio de uma probabilidade de ocorrência, enquanto na regressão simples obtém-se um valor numérico (FIGUEIRA, 2006).

A ferramenta que pode fornecer os indícios correlatos diretamente à resposta do problema de pesquisa é a análise de regressão logística. Segundo Fávero et al. (2009, p. 441), a técnica de regressão logística foi desenvolvida tanto para realizar predições como para

explicar fenômenos quando a variável dependente for de natureza binária, podendo as variáveis independentes serem métricas ou não-métricas.

Field (2009, p. 221) simplifica a relação ao dizer que a técnica define a probabilidade de a observação pertencer a uma ou outra categoria, dadas certas informações.

A preferência pela regressão logística em relação a outras técnicas foi baseada nas argumentações dos seguintes autores:

Hair  et  al.  (2005,  p.  231),  que  apresentam  a  ideia  de  que  a  Análise   Discriminante   também   pode   ser   utilizada   quando   a   variável   dependente   é   categórica,   mas   quando   a   variável   dependente   é   binária   a   regressão   logística   é   preferida   por   não   ficar   restrita   ao   atendimento   de   pressupostos   de   normalidade   multivariada   e   de   matrizes  iguais  de  variância-­‐covariância  nos  dois  grupos.

Fávero   et   al.   (2009,   p.   440)   defendem   a   flexibilidade   aos   pressupostos   de   normalidade   dos   resíduos   e   de   presença   de   homogeneidade   das   matrizes   de   variância   e   covariância   para   as   categorias   e   ainda   relatam   sobre   a   capacidade   de   a   regressão   logística  não  só  avaliar  a  possibilidade  de  ocorrência  do  evento  de   interesse,   mas   também   de   avaliar   a   probabilidade   de   ocorrência   (risco);  e  

Hair   et   al.   (2005,   p.   232)   apontam   que   a   regressão   logística   relaciona   variáveis   independentes   com   a   probabilidade   de   ocorrência  de  determinado  evento.  

A base da regressão logística, segundo Hair et al. (2005, p. 232), é a natureza não-linear da transformação logística e o método da máxima verossimilhança. As estimativas encontradas são aquelas que maximizam a relação da probabilidade de ocorrência do evento em relação aos coeficientes do modelo.

Tomando como base os conceitos dos autores descritos acima, com o resultado da regressão logística pode-se analisar a relação e relevância dos índices de criação de valor com a probabilidade de ocorrência do evento pesquisado.

Na transformação logística, o coeficiente do modelo compara a probabilidade de o evento ocorrer com a probabilidade de o evento não ocorrer. Os coeficientes estimados são medidas das variações na proporção das probabilidades, uma razão de desigualdade, expressa da seguinte forma:

Prob(evento  ocorrer)

Prob(evento  não  ocorrer)= !

!!!!

!∗!!!⋯!!!∗!!

A probabilidade da variável Y poderá ser determinada por:,

! ! =!!!!!!,

! = ln ! −1

! = !!+ !!∗ !! + ⋯ + !!∗ !!

sendo que,

P(Y) é a probabilidade da empresa pertencer ao Novo Mercado com base nas variáveis explicativas

b! é o coeficiente linear da equação

 b!  são os coeficientes angulares da equação

Elucidada a característica da regressão logística, é importante fixar que a variável dependente binária da pesquisa é representada pelo nível de Governança Corporativa, sendo definido o valor (1) para empresas que estão no Novo Mercado e (0) para empresas que não são do Novo Mercado. Os índices de criação de valor que serão utilizados como variáveis

explicativas são: Índice Preço sobre Lucro, Índice Valor de mercado sobre Valor contábil,

Índice Preço sobre Vendas, Índice Preço da ação sobre EBITDA por ação, Índice Preço da

ação sobre fluxo de caixa livre por ação e Índice Q de Tobin.

Hosmer e Lemeshow (1989) propuseram a avaliação de um modelo de regressão logística por meio de um teste de classificação. Os casos são divididos em 10 subgrupos e as probabilidades são calculadas para cada uma das observações de cada subgrupo e classificadas com evento ou sem o evento. Em seguida, os eventos reais e previstos dos subgrupos são comparados, o que possibilita avaliar a precisão preditiva do modelo pela aplicação do teste qui-quadrado. Logo, se o total de casos previstos for superior a 50%, o modelo apresenta um ajuste estatístico adequado.

O método Stepwise (método passo a passo) é o procedimento para seleção ou exclusão de variáveis de um modelo é baseado em um algoritmo que checa a importância das variáveis, incluindo ou excluindo-as do modelo se baseando em uma regra de decisão. A importância da variável é definida em termos de uma medida de significância estatística do coeficiente associado à variável para o modelo. Na regressão logística os erros seguem distribuição binomial e a significância é assegurada via Teste da Razão de Verossimilhança. Assim, em cada passo do procedimento a variável mais importante, em termos estatísticos, é aquela que produz a maior mudança no logaritmo da verossimilhança em relação ao modelo que não contém a variável.

Em estatística, os testes de normalidade são usados para determinar se um conjunto de dados de uma dada variável aleatória, é bem modelada por uma distribuição

normal ou não, ou para calcular a probabilidade da variável aleatória subjacente estar normalmente distribuída. O teste de Jarque-Bera tem como hipótese nula a normalidade. Assim, se o p-valor for menor do que 5% (ou 10%), p<0,05 (p<0,10), então o autor rejeita a normalidade. Já se p>0,05, normalidade é aceita.

O GRETL (Gnu Regression, Econometrics and Time-series Library) é um pacote estatístico livre e multiplataforma desenvolvido, principalmente, para ser usado em pesquisas econométricas.

Documentos relacionados