Comparação entre regressão logística e redes neurais na previsão de falência de bancos brasileiros

(1)

Comparação entre regressão logística e redes neurais na previsão de falência de bancos brasileiros

Fernando Carvalho de Almeida José de Oliveira Siqueira Faculade de Economia Administração e

Contabilidade - Campus Ribeirão Preto

Faculade de Economia Administração e Contabilidade - Campus Ribeirão Preto Departamento de Administração Departamento de Administração

USP USP

C.P. 11498 CEP. 05422-970 - Sao Paulo SP

C.P. 11498 CEP. 05422-970 - Sao Paulo SP E-mail: falmeida@usp.br E-mail: siqueira@usp.br

Resumo

Este trabalho explora o uso de redes neurais com método de backpropagation na previsão de falência de bancos brasileiros. Os resultados de classificação das redes são comparados com a técnica estatística de regressão logística. As redes neurais mostraram algumas vantagens em relação à regressão logística, como por exemplo consideração de instituições que foram desprezadas pela técnica estatística..

Palavras-Chave: Previsão de Falência, Redes Neurais, Estatística Abstract

This paper explores the use of neural networks in bankruptcy prediction of Brazilian banks.

Backpropagation was used to construct the neural networks. The classification results are compared with a statistical technique called logistic regression. Neural networks has shown some advantage in comparison with logistic regression as for example, the statistical technique has discarded some of the banks in reason of lack of information. The neural network model has considered these institutions, being able to classify them.

Keywords: Bankruptcy prediction, Neural Networks, statistical methods Diversos estudos têm explorado o uso de redes

neurais na avaliação de riscos de insolvência nos últimos anos (DE ALMEIDA 1993; WILSON &

SHARDA 1994; PODDIG 1995; etc.). Este estudo explora, em particular, o setor bancário brasileiro. A avaliação de risco de insolvência de bancos brasileiros é uma questão particularmente importante no contexto econômico atual. Em função do processo de estabilização da moeda brasileira, os bancos brasileiros tem sido obrigados a passar por processo rigoroso de adaptação: a forte e rápida redução dos ganhos inflacionários forçou os bancos a aumentarem seus volumes de crédito e, em consequência, os volumes de créditos em liquidação em momento econômico marcado por

elevação dos níveis de recolhimento compulsório. Em decorrência da necessidade de fortes ajustes afloraram problemas de liquidez, levando o Banco Central a decretar a liquidação de diversas instituições e efetivar intervenção em diversas outras.

1. Avaliação de Riscos de Insolvência A avaliação de riscos de insolvência têm sido extensamente efetuada a partir da década de 60, essencialmente voltada para o segmento empresarial não-financeiro (COHEN 1966;

BEAVER 1966; ALTMAN 1968;

(2)

ABATE 1969), fundamentados no uso de regressão e análise discriminante e classificatória. Só mais recentemente partiu-se para a utilização de redes neurais na avaliação de riscos de insolvência, ainda no segmento não-financeiro das economias (ALMEIDA 1993; JOHNSEN 1994; WILSON 1994; PODDIG 1995). A insolvência bancária no Brasil constitui-se em segmento novo de pesquisa, notadamente em razão da política governamental de suporte ao sistema financeiro até agora.

2. Redes Neurais

As redes neurais artificiais reproduzem o funcionamento do cérebro de maneira simplificada.

Noções sobre o funcionamento da memória, como por exemplo, princípios associativos ou capacidade de aprendizado inspiram os modelos de redes neurais artificiais (KOHONEN, 1988). O uso de técnicas de representação do conhecimento sobre avaliação de riscos de insolvência é de especial interesse, pois essas técnicas podem tratar dados quantitativos e qualitativos.

2.1 Redes Feed-forward

Diversos modelos de redes neurais são encontrados na literatura (STANLEY, 1990). Os modelos são divididos em dois grupos principais: redes feed- forward e redes feed-backward. Uma rede neural compreende um conjunto de nós interligados. Esses dois modelos diferem quanto à maneira pela qual estes nós, os neurônios, se interligam para transmitir a informação. Em redes feed-backward há apenas uma camada de neurônios e todos os neurônios são interligados entre si.

Nesta pesquisa foram utilizadas redes feed-forward.

Neste tipo de rede várias camadas são organizadas horizontalmente (figura 1). Cada neurônio se conecta e envia informação para todos os neurônios da camada seguinte. Neurônios pertencentes à mesma camada não são interligados. Estas redes são freqüentemente constituídas de três camadas: a camada de entrada com os neurônios de entrada, a camada intermediária com os neurônios intermediários e a camada de saída com os neurônios de saída. Os neurônios de entrada introduzem informação na rede. Os neurônios de saída transmitem as respostas da rede. Neurônios e camadas intermediárias são colocados entre as camadas de entrada e saída.

O modelo de retro-propagação é um modelo feed- forward sendo o modelo mais conhecido e referenciado na literatura (SHARDA 1994).

Este estudo usa um modelo de retro-propagação baseado nos Modelos de Processamento Distribuído Paralelo propostos por RUMELHART et al. (1986).

A propagação de informação através da rede é efetuada como se segue (figura 1): os valores de entrada são transmitidos de uma camada para a outra e transformados através de pesos de conexões entre os neurônios (Wji: peso da conexão entre o neurônio I e neurônio J). A rede acumula seu conhecimento através dos pesos de conexão.

Figura 1.- Propagação de sinais na rede neural .

Podemos tomar como exemplo um neurônio J na camada Jc:

1 O neurônio J recebe as saídas Oi dos neurônios precedentes e o valor Nj é computado:

Nj=ΣWji0i.

2 Nj é introduzido numa função de ativação f (Nj) que produz um valor de ativação Aj. No modelo de RUMELHART o valor de ativação é igual a Nj.

3 A intensidade do sinal enviado de um neurônio para o outro é uma função da intensidade do valor de ativação. Uma função de transferência toma em conta o valor de ativação e produz o sinal de saída Oj.

1 Oj(t+1) = _______________ (eq.1) 1+e -(ΣWiOi + θj)

Método de Aprendizado por Retro-Propagação

As redes são construídas, isto é, pesos de conexão

apropriados entre os neurônios são determinados,

usando-se um método de aprendizado. Esses pesos

são geralmente valores arbitrários no início do

processo de aprendizado. São corrigidos ao passo

que o aprendizado evolui usando-se exemplos (ou

fatos) representativos do problema em estudo. Estes

fatos são relidos sucessivas vezes até que todos

sejam aprendidos pela rede. A retro-propagação é

um método de aprendizado supervisionado pois os

resultados observados na saída dos neurônios são

usados para ajustar os pesos de conexão. O vetor

(3)

obtido na saída dos neurônios é comparado com o vetor de saída desejado. Se houver uma diferença entre os dois vetores, os pesos de conexão são corrigidos ocorrendo assim o aprendizado.

O modelo de RUMELHART et al. é baseado em uma regra de aprendizado chamada Regra Delta Generalizada:

∆ Wji(n+1) = µ δ jOi + α∆ Wji(n) (eq. 2)

∆ Wji(n+1) é o ajuste introduzido em n+1 no peso de conexão entre os neurônios i e j. µ é uma constante chamada taxa de aprendizado que controla a intensidade de correção feita nos pesos de conexão a cada iteração do processo. Quanto maior a taxa de aprendizado tanto maiores as mudanças que serão introduzidas nos pesos em cada iteração. α é uma constante chamada fator suavizante que faz o processo de aprendizado considerar o valor do peso no momento n. ### é o sinal de erro na saída do neurônio.

3. Análise de Riscos de Insolvência - Visão Geral do Processo

A maioria dos modelos de avaliação de riscos de insolvência são construídos usando-se amostras pareadas: uma parte da amostra contem informações sobre empresas insolventes; a outra parte contem informações sobre empresas não insolventes. Variáveis são então selecionadas segundo seu interesse potencial na avaliação de riscos de insolvência. Um método estatístico é então usado para desenvolver um modelo discriminante (i.e., uma combinação de variáveis que melhor distingua os dois tipos de empresa). Finalmente o sucesso da discriminação é avaliado através de uma amostra de controle (i.e., uma amostra diferente da usada para obter o modelo).

Em geral a amostra de controle contém empresas solventes e empresas comprovadamente insolventes, isto é empresas que estão em processo de concordata, em liquidação, ou no caso de bancos e instituições financeiras, sob intervenção do Banco Central.

No caso desta pesquisa em razão do número reduzido de bancos insolventes na amostra global, não utilizamos bancos insolventes na amostra de controle. Ao invés disto confrontamos os resultados obtidos com a avaliações feitas pela empresa Austin Asis especializada em diagnóstico financeiro de empresas.

4. Regressão Logística

Desde OHLSON (1980) a análise LOGIT é usada freqüentemente para a avaliação de riscos de inadimplência, baseada em características financeiras (índices) das empresas. O modelo LOGIT cria para cada empresa um score Z:

Z=α+βXi (eq. 3)

onde Xi é o valor da i-ésima variável (i.e.

características financeiras)

P = 1

1 + e -( + X α β

_i

)

(eq. 4) Como P sempre se situa entre 0 e 1, o score Z é freqüentemente interpretado como a probabilidade de inadimplência.

5. O Estudo

5.1 Indicadores de Diagnóstico Financeiro de Bancos

Neste estudo, estamos considerando, para a análise de risco de Bancos, 9 indicadores financeiros, expostos na tabela 1 a seguir, descritos nos Manuais de Análise da Austin Asis, empresa brasileira de análise de risco bancário. Além de tais indicadores, foi considerada a variável de indicação de porte log(Ativo).

TABELA 1. Índices Financeiros ESTRUTURA

1.CAPITAL DE GIRO ((Patrimônio Líq. - Ativo Permanente)/

Patrimônio Líquido) 2.ALAVANCAGEM (Captação Total/

Patrimônio Líquido) SOLVÊNCIA

3.COMPROMETIME NTO

(Oper.Créd.Liq Significativo ao.Duvidosa/

Patrimônio Líquido) CUSTOS E

DESPESAS

4.INTERMEDIAÇÃO (Despesa Interm.

Financ. - Prov. CL -

Ajuste Prog.Est.Econ./

Capt.Total) 5.PESSOAL (Despesa Pessoal/

Captação Total) 6.ADMINISTRATIVO (Despesa

Administrativa/

Captação Total)

RENTABILIDADE

(4)

7.GERAÇÃO DE RENDAS

(Receita Intermediação Financeira/Ativo Real - Ativo Permanente) 8.RENTABILIDADE

DO PL

(Resultado Líquido/

Patrimônio Líquido) CRESCIMENTO

9.CAPTAÇÕES TOTAIS

Captação Total do último

período/Captação Total do

período anterior OUTROS

10. ATIVO TOTAL Valor do ativo total (logaritmo) CONCEITOS

ATIVO REAL Ativo Total - Relações Interfinanceiras - Relações

Interdependênciais PASSIVO REAL Passivo Total - Relações

Interfinanceiras - Relações

Interdependênciais APLICAÇÃO TOTAL Ativo Real - Ativo

Permanente - Diversos CAPTAÇÃO TOTAL Passivo Real -

Patrimônio Líquido - Diversos

5.2. Amostra e seleção dos dados

Para a criação de modelos de análise de risco de insolvência, dois grupos são necessários. Um primeiro grupo contendo instituições insolventes e um segundo grupo contendo instituições solventes.

As instituições consideradas insolventes neste estudo são aquelas que sofreram processos de liquidação ou intervenção do Banco Central do Brasil. Para o grupo de solventes, foi escolhido um grupo de bancos considerados tradicionais (27 bancos).

Foram obtidas, através das bases de dados da Austin Asis, informações econômico-financeiras e cadastrais de 225 Bancos atuantes no Brasil. A amostra usada para a criação das redes neurais e das funções logísticas contém 54 bancos, sendo 27 bancos solventes e 27 insolventes. A amostra foi constituída a partir do último balanço disponível (julho de 1995).

A tabela 2 apresenta uma comparação de médias entre entre os dois grupos. Para comparação de médias foi utilizado o teste-t de Student que permite

observar a existência de diferença entre as médias de cada um dos grupos para as diversas variáveis explicativas.

TABELA 2 - Comparação de médias entre os dois grupos de empresas (solvenes e insolventes)

INDICE t-

Student

Probabi l.

Significa tivo ao nível 0.1 ESTRUCTURA

1.CAPITAL DE GIRO

- 0.25 0.805 2.ALAVANCAG

EM

- 0.72 0.475

SOLVÊNCIA 3.COMPROMETI MENTO

1.84 0.072 x

CUSTO E DESPESA 4.INTERMEDIA ÇÃO

3.22 0.003 x

5.PESSOAL 1.53 0.131

6.ADMINISTRA TIVO

2.17 0.034 x

RENTABILIDA DE

7.GERAÇÃO DE RENDAS

3.25 0.002 x

8.RENTABILID ADE DO PL

-1.54 0.147

CRESCIMENT O

9.CAPTAÇÕES TOTAIS

0.72 0.474 OUTROS

10. ATIVO TOTAL

-5.1 0.000 x

Dentre as variáveis selecionadas, 5 são significativas no nível de 0.1%, e 4 são significativas no nível de 0.05%.

5.3 Desenvolvimento dos experimentos

O experimento foi efetuado através da construção de 54 redes e em seguida de 54 funções logísticas.

Cada um dos grupos de 54 modelos, das redes

neurais e da regressão logística, foram criados

utilizando-se do método de Lachenbruch. No

(5)

método de Lachenbruch um modelo é construido contendo n-1 observações. O modelo é então utilizado para a previsão da observação n, colocada de lado. O procedimento é repetido n vezes (54 vezes neste experimento) e a classificação das observações efetuadas é utilizada para avaliar a precisão do modelo.

O processo é descrito por LACHENBRUCH (1976):

“Crie a função discriminate para cada amostra possível contendo n

1

+n

2

- 1, obtida omitindo-se uma observação da amostra original e registre para cada uma destas funções se a observação foi incorretamente classificada. Se m

1

e m

2

são a quantidade de observações classificadas incorretamente, podemos estimar P

1

e P

2

a partir de m

1

/n

1

e m

2

/n

2

. A estimativa do erro obtida é

“unbiased” para a probabilidade de classificação incorreta para uma função discriminante baseada em n

1

-1 e n

2

observações e n

1

e n

2

-1 observações, respectivamente. “

Este procedimento foi utilizado para criar e avaliar a capacidade preditiva das redes, e foi repetido para avaliar a capacidade preditiva da regressão logística.

5.4. Definição de parâmetros na criação das redes neurais

Existe uma série parâmetros na constituição de uma rede neural, que poderão influenciar sua capacidade preditiva. No entanto a falta de metodologia na concepção de redes neurais (MAGNIER 1991, DE ALMEIDA 1993), impossibilita sua escolha de maneira racional (número de neurônios na camada intermediária, número de iterações, taxa de aprendizado, etc.).

Segundo MAGNIER (1991), a escolha adequada dos valores dos parâmetros tende a ficar baseada na experiência e sensibilidade do operador que conduz a construção da rede.

Neste estudo assumimos os seguintes valores de parâmetros:

taxa de aprendizado (α α): igual a 1 momentum (ηη) igual a 0,9,

Lembramos que estes parâmetros que intervém no algoritmo de aprendizado (∆ Wji(n+1) = µ δ jOi + α∆ Wji(n), eq. 2, apresentada anteriormente).

Taxa de precisão do aprendizado: igual a 10%.

Estes valores são sugeridos como default pela ferramenta de concepção de redes neurais utilizada (BRAINMAKER - ver Stanley 1990).

Número de iterações (o número de vezes em que a amostra de base será lida durante o processo de aprendizado): O número de iterações foi limitado a 1500 iterações nas experiências realizadas, uma vez que o processo de aprendizado, não evoluiu com um número maior de iterações, isto o número aprendidas não mais evoluiu. O processo de aprendizado foi encerrado automaticamente quando a taxa de precisão requerida foi alcançada.

Número de neurônios na camada intermediária:

Não existe um critério racional que permita defini- lo (MAGNIER 1991; DUTTA, SHEKHAR &

WONG 1992; WILSON & SHARDA 1994; etc.).

Neste estudo foram criadas redes com 5 neurônios na camada intermediária (figura 2).

Figura 2 - Modelo de rede criado

Neurônios de entrada

5 neurônios intermediários

2 neurônios de saida

6. Resultados

Como resultado obtivemos porcentagem de classificação superior através da técnica Logit, principalmente quando foi utilizado o método enter.

Este método não desconsidera nenhuma variável mesmo que exista correlação entre elas. No entanto apenas 16 das 27 instituições solventes puderam ser utilizadas na regressão logística por indisponibilidade de dados de algumas variáveis.

Este problema não ocorre com as redes que podem

levar em consideração informações incompletas.

(6)

TABELA 3 - Resultados de Previsão

Grupo Porcentagem de

classificação correta Redes

Neurais

R. L.

(Forward stepwise)

R. L.

(Enter) Instituições

solventes

63 92 88

Instituições insolventes

70 43 68

Classificação global

67 68 78

Solventes não classificadas

0 0 4

Insolventes não

classificadas

0 40 40

Regressão logística 1 - Método FORWARD STEPWISE com estatística WALD

Regressão logística 2 - Método ENTER - todas as variáveis obrigatoriamente entram no modelo

5. Conclusões

Apesar dos resultados de classificação não superiores das redes neurais, esta foi capaz de considerar bancos que a regressão logística não pode classificar por falta de dados. A qualidade de classificação das redes poderia eventualmente melhorar a partir da exploração de outros métodos.

Em nosso grupo estamos no momento trabalhando com redes não supervisionadas, que podem ser utilizadas previamente à backpropagation.

7. Referências

ABATE, R.P. - “Numerical Scoring Systems for Commercial Loans” Bankers Monthly, January, 1969.

ALTMAN, E. -“Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy”. -Journal of Finance, vol. 23, n.4, p.589-609, setembro, 1968.

BEAVER, W. “Financial ratios as predictors of failures”, in Empirical Research in Accounting, selected studies, 1966, in supplement to the Journal of Accounting Research, January, 1967.

COHEN, I. J., T.C. GILMORE, e F.A. SINGER,

“Bank procedures for analyzing business loan applications” in Analytical Methods in Banking, K.J. Cohen e F.S. Hammer, Homewood, Ill: R.D. Irwin, 1966.

DE ALMEIDA, F.C. -L'Evaluation des risques de défaillance des entreprises à partir des réseaux de neurones insérés dans les

systèmes d'aide à la décision.- Tese de Doutorado em Administração. -Ecole Supérieure des Affaires, Universidade de Grenoble, 1993.

DUTTA, S., S. SHEKHAR e W.Y. WONG -

“Decision Support in Non-Conservative Domains: Generalization with Neural Networks” - WP n 92-31, INSEAD, 1992.

KOHONEN, T.- "An Introduction to Neural Computing".- Neural Networks, vol.1, p.3-16, 1988.

JOHNSEN, T. e MELICHER, R.W. -“Predictiong corporate bankruptcy and financial distress: Information Value Added by Multinominal Logit Models”. -Journal of Economics & Business, vol.46, n.4, p.269-286, Outubro 1994.

LACHENBRUCH, P.A. “An Almost Unbiased Method of Obtaining Confidence Intervals for the Probability of Misclassification in Discriminant Analysis”. Biometrics, December, 1967.

MAGNIER, J.P. Utilisation des réseaux de neurones pour le développement de systèmes d'aide à la décision. Montpelier: Intitut d'Administratio d'Entreprises, 1991.

(mimeo).

OHLSON, J.A. Financial ratios ande the probabilistic prediction of bankruptcy.

Journal of Accounting Research, p.109- 131, Spring 1980.

PODDIG, T. “Bankruptcy Prediction: A Comparison with Discriminant Analysis”.

in Neural Networks in Capital Markets.

Editado por A.P. REFENES, New York.- John Wiley & Sons, 1995.

RUMELHART, D.E., J.C. McCLELLAND, PDP Research Group.- Parallel Distributed Processing - Exploration in the Microtexture of Cognition.- Volume 1.- London.- The MIT Press.- 1986.

SHARDA, R.- “Neural Networks for the MS/OR analyst: An application bibliography”. - Interfaces, vol.24, n.2, p.116-130, 1994.

STANLEY J. - Introduction to Neural Networks.- CA:Sierra Madre.-Cal. Scientific Software.-3rd edition.-1990.

WILSON, R.L. & SHARDA, R. -”Bankruptcy

Prediction Using Neural Networks”. -

Decision Support Systems, vol. 11, n. 5,

p. 545-557, junho 1994.