Aplicação de redes bayesianas na previsão de crescimento de fluxos de caixa

(1)

FUNDAÇÃO GETÚLIO VARGAS ESCOLA DE ECONOMIA DE SÃO PAULO

RICARDO PEDRETI CHAGAS

APLICAÇÃO DE REDES BAYESIANAS

NA PREVISÃO DE CRESCIMENTO DE FLUXOS DE CAIXA

(2)

Pedreti Chagas, Ricardo.

Aplicação de redes bayesianas na previsão de fluxos de caixa / Ricardo Pedreti Chagas. - 2008.

126 f.

Orientador: Afonso de Campos Pinto.

Dissertação (Mestrado profissional) - Escola de Economia de São Paulo.

1. Fluxo de caixa. 2. Teoria bayesiana de decisão estatística. 3. Previsão econômica. I. Pinto, Afonso de Campos. II. Dissertação (Mestrado

profissional) - Escola de Economia de São Paulo. III. Título.

(3)

Dissertação apresentada à Escola de Economia da Fundação Getúlio Vargas (FGV/EESP) como requisito para obtenção do título de Mestre em Finanças e Economia Empresarial

Campo de conhecimento: Finanças Corporativas

Orientador: Prof. Dr. Afonso Campos Pinto

(4)

Dissertação apresentada à Escola de Economia da Fundação Getúlio Vargas (FGV/EESP) como requisito para otenção do título de Mestre em Finanças e Economia Empresarial.

Campo de conhecimento: Finanças Corporativas

Data de aprovação: 11/02/2008

Banca Examinadora:

____________________________ Prof. Dr. Afonso de Campos Pinto (Orientador)

FGV-SP

____________________________ Prof. Dr. Richard Saito FGV-SP FGV-SP

(5)

AGRADECIMENTOS

Agradeço ao meu orientador, Prof. Dr. Afonso de Campos Pinto pelo suporte,

orientação, estímulo e confiança depositada neste trabalho, sem os quais não seria

possível concluí-lo com sucesso.

Agradeço aos professores do MPFE-FGV que me municiaram de excelente base

teórica que muito facilitou a execução deste trabalho.

Agradeço à minha esposa, Profa. Ma. Angélica Lencione Pedreti, que além de me

encorajar, discutir e debater assuntos controversos, com sua enorme paciência e

compreensão, muito contribuiu para que eu pudesse concluir este trabalho. Agradeço

ainda, meu filho recém nascido, Pedro Henrique, que aguardou pacientemente até o

nono mês de gravidez para vir a este mundo, permitindo que eu mantivesse o foco

(6)

RESUMO

Redes Bayesianas podem ser ferramentas poderosas para construção de modelos

econômico-financeiros utilizados para auxílio à tomada de decisão em situações que

envolvam grau elevado de incerteza. Relações não-lineares entre variáveis não são

capturadas em modelos econométricos lineares. Especialmente em momentos de

crise ou de ruptura, relações lineares, em geral, não mais representam boa

aproximação da realidade, contribuindo para aumentar a distância entre os modelos

teóricos de previsão e dados reais. Neste trabalho, é apresentada uma metodologia

para levantamento de dados e aplicação de Redes Bayesianas na obtenção de

modelos de crescimento de fluxos de caixa de empresas brasileiras. Os resultados são

comparados a modelos econométricos de regressão múltipla e finalmente

comparados aos dados reais observados no período. O trabalho é concluído

avaliando-se as vantagens de desvantagens da utilização das Redes de Bayes para

(7)

ABSTRACT

Bayesian Networks may be powerful tools for Financial-Economics modeling. When

high degree of uncertainty is present, these tools can be used as strongly helpful

advisors in the decision making process. Non-linear relations among variables are

normally not captured in traditional linear econometric models. Moreover, specially on

situation of crisis or rupture, linear relation do no represent anymore a good proxy to

real behavior of financial-economical variables. This contributes for increasing the

distance between the theoretical forecasting model and the real data. Throughout

this work, we show a methodology for gathering and applying data into Bayesian

Networks in order to obtain cash flow growing models for some Brazilian companies

and the economical sector they play. Later on, we compare the results of such

predictions to the traditional econometric models, and finally to the real data

observed in such period. As a conclusion of the study, we make an evaluation of the

(8)

ILUSTRAÇÕES

ILUSTRAÇÃO 1-“MIND MAP”CRESCIMENTO... 19

ILUSTRAÇÃO 2- D-SEPARATION... 38

ILUSTRAÇÃO 3– CONEXÕES CONVERGENTES... 39

ILUSTRAÇÃO 4– CONEXÕES DIVERGENTES... 39

ILUSTRAÇÃO 5–EXEMPLO SIMPLES DE REDES BAYESIANAS... 40

ILUSTRAÇÃO 7–MODELO BAYESIANO SETOR SIDERURGIA... 61

ILUSTRAÇÃO 8–SIDERURGIA:ECONOMÉTRICO X BAYESIANO X DADOS REAIS... 64

ILUSTRAÇÃO 9–MODELO BAYESIANO SETOR ALIMENTOS... 72

ILUSTRAÇÃO 11–MODELO BAYESIANO SETOR ENERGIA... 83

(9)

TABELAS

TABELA 1–CLASSIFICAÇÕES DA INTELIGÊNCIA ARTIFICIAL... 22

TABELA 2–PROBABILIDADES CONDICIONAIS:P(A|B)... 33

TABELA 3-PROBABILIDADES CONJUNTA:P(A,B)... 33

TABELA 4– PROBABILIDADE MARGINAL:P(A)... 34

TABELA 5–PROBABILIDADES BAYESIANA:P(B|A)... 34

TABELA 6:PROBABILIDADE DE ESTAR DOENTE -P(SICK)... 40

TABELA 7:PROBABILIDADE DA FOLHA ESTAR SECA -P(DRY)... 41

TABELA 8:PROB. DE PERDA DADA À DOENÇA/SECA – P(LOSES |SICK,DRY)... 41

TABELA 9–VARIÁVEIS ECONÔMICAS SETOR SIDERURGIA... 50

TABELA 10–VARIÁVEIS MACROECONÔMICAS... 51

TABELA 11–SÉRIES QUADRIMESTRAIS DE CRESCIMENTO–SETOR SIDERURGIA... 53

TABELA 12–SÉRIES DE CRESCIMENTO SUSTENTÁVEL –SETOR SIDERURGIA... 54

TABELA 13–CLASSES DE FREQÜÊNCIA SETOR SIDERURGIA... 58

TABELA 14 -VARIÁVEIS CONTÍNUAS –SETOR SIDERURGIA... 59

TABELA 15–VARIÁVEIS DISCRETAS –SETOR SIDERURGIA... 59

TABELA 16–SIDERURGIA:CRESCIMENTO NO MODELO BAYESIANO... 62

TABELA 17–SIDERURGIA:ECONOMÉTRICO X BAYESIANO X DADOS REAIS... 63

TABELA 18-VARIÁVEIS ECONÔMICAS SETOR ALIMENTOS... 65

TABELA 19–SÉRIES QUADRIMESTRAIS DE CRESCIMENTO–SETOR ALIMENTOS... 67

TABELA 20-SÉRIES DE CRESCIMENTO SUSTENTÁVEL –SETOR ALIMENTOS... 68

TABELA 21–CLASSES DE FREQÜÊNCIA SETOR ALIMENTOS... 69

TABELA 22 -VARIÁVEIS CONTÍNUAS –SETOR ALIMENTOS... 70

TABELA 23–VARIÁVEIS DISCRETAS –SETOR ALIMENTOS... 71

TABELA 24–ALIMENTOS:CRESCIMENTO NO MODELO BAYESIANO... 73

TABELA 25–ALIMENTOS:ECONOMÉTRICO X BAYESIANO X DADOS REAIS... 74

TABELA 27–VARIÁVEIS ECONÔMICAS SETOR ENERGIA... 75

TABELA 28–SÉRIES QUADRIMESTRAIS DE CRESCIMENTO–SETOR ENERGIA... 77

TABELA 29–SÉRIES DE CRESCIMENTO SUSTENTÁVEL –SETOR ENERGIA... 78

TABELA 30–CLASSES DE FREQÜÊNCIA SETOR ENERGIA... 80

TABELA 31-VARIÁVEIS CONTÍNUAS –SETOR ENERGIA... 81

TABELA 32–VARIÁVEIS DISCRETAS –SETOR ENERGIA... 82

TABELA 33–ENERGIA:CRESCIMENTO NO MODELO BAYESIANO... 84

(10)

EQUAÇÕES

EQUAÇÃO 1– CRESCIMENTO (RETORNO E RE-INVESTIMENTO)... 9

EQUAÇÃO 2–CRESCIMENTO SUSTENTÁVEL... 10

EQUAÇÃO 3–FLUXO DE CAIXA DO ACIONISTA X FLUXO DE CAIXA DA FIRMA... 21

EQUAÇÃO 4–TEOREMA DE BAYES... 38

EQUAÇÃO 5–MODELO ECONOMÉTRICO SETOR SIDERURGIA... 55

EQUAÇÃO 6–MODELO ECONOMÉTRICO SETOR ALIMENTOS... 69

(11)

SUMÁRIO

1. INTRODUÇÃO 1

2. REVISÃO BIBLIOGRÁFICA 4

2.1. Incerteza em Finanças Corporativas 4

2.1.1. Projeções Financeiras, Planejamento Estratégico, Planejamento Orçamentário, “Valuation” 4

2.1.2. Principais fontes de Incerteza em projeções financeiras 5

2.1.3. Crescimento 6

2.1.4. Ferramentas tradicionais para lidar com a incerteza 16

2.1.5. Estimando crescimento com incerteza com uma abordagem alternativa 18

2.1.6. Fluxo de Caixa da Empresa versus Fluxo de Caixa ao Acionista 20

2.2. Redes Bayesianas 22

2.2.1. Inteligência Artificial 22

2.2.2. Definição de Redes Bayesianas 37

2.2.3. Alguns Trabalhos realizados com Redes Bayesianas 42

2.2.4. Ferramentas 43

3. METODOLOGIA 46

3.1. Objetivo 46

3.2. Modelos de Crescimento por Setor Econômico 48

3.2.1 Variáveis Econômicas do Setor 48

3.2.2 Variáveis Macroeconômicas 49

3.2.3 Variáveis Financeiras das Empresas 49

3.3. Setor Siderurgia 50

3.3.1 Determinação das variáveis relevantes 50

3.3.2 Modelo Econométrico 54

3.3.3 Modelo Bayesiano 56

3.3.4 Comparação entre os modelos e dados reais 63

3.4. Setor Alimentos 65

3.5. Setor Energia 75

4. RESULTADOS 87

(12)

1. Introdução

Redes Bayesianas têm sido utilizadas em diversos campos do conhecimento que

envolvem incerteza e necessidade de auxílio para tomada de decisão. Estas áreas de

conhecimento passam por: diagnóstico médico, mapas de aprendizado,

entendimento de linguagem, visão, busca heurística, entre muitos outros

[CHARNIAK, 1991].

Em linhas gerais, as Redes Bayesianas são ferramentas bastante poderosas e

convenientes em situações nas quais nos deparamos com problemas que não são

explicáveis, à princípio, logicamente, mas o são probabilisticamente [CHARNIAK,

1991]. Em sua maioria, as técnicas de aprendizado estão fortemente apoiadas em

dados. Entretanto, em muitos casos, os conhecimentos em um sistema especialista

provêm de outras fontes, como por exemplo, o conhecimento teórico de um

especialista ou uma nova informação, a princípio, sem qualquer relação com os

dados originais [HECKERMAN, 1995]. Uma das principais vantagens das Redes

Bayesianas é permitir a co-existência, na mesma rede, de diversas fontes de

conhecimento, independentemente da sua natureza. Outra vantagem bastante

relevante é a possibilidade de utilizar dados incompletos, questão freqüentemente

enfrentada por pesquisadores e analistas.

Em Finanças Corporativas, é comum nos depararmos com cenários de incerteza. Isso

ocorre, com freqüência, quando necessitamos projetar cenários futuros, avaliar a

robustez de modelos teóricos comparados ao comportamento real de empresas e

mercados, avaliar riscos, calcular o valor de alternativas futuras de decisão acerca de

um projeto, entender o papel de variáveis comportamentais nos modelos financeiros

lógicos, entre outros.

Em vários campos da Teoria Financeira existem espaços a serem preenchidos entre

os modelos teóricos conhecidos e os dados empíricos que verificamos na prática.

Acreditamos que uma abordagem através de Redes Bayesianas possa ser um

(13)

podendo resultar na obtenção de modelos que se acerquem cada vez mais dos

resultados reais.

A proposta deste trabalho é utilizar Redes Bayesianas para investigar um dos

inúmeros “gaps” entre modelos teóricos e dados empíricos em finanças corporativas.

Analisamos as taxas de crescimento dos fluxos de caixa de empresas pertencentes a

alguns setores econômicos, utilizando Redes Bayesianas e comparamos os modelos

bayesianos resultantes com modelos tradicionais econométricos de regressão

múltipla.

O Capítulo 2 foi dedicado a revisões bibliográficas importantes para uma melhor

compreensão do trabalho e da metodologia proposta: apresentamos uma breve

revisão bibliográfica acerca das formas tradicionais de tratamento da incerteza em

Finanças Corporativas, focando principalmente na incerteza associada ao crescimento

nas projeções de fluxos de caixa, ferramenta básica para análises econômicas em

Finanças Corporativas. Nas análises de valor por fluxo de caixa, é muito comum

encontrarmos simplificações exageradas associadas às considerações de crescimento

dos fluxos. Assunção de premissas de perpetuidades mal situadas é apenas um

dentre os diversos exemplos; realizamos, neste mesmo capítulo, uma apresentação

conceitual sobre Redes Bayesianas. Procuramos agregar exemplos simples, de fácil

compreensão, para demonstrar a aplicabilidade da técnica de uma forma inteligível

mesmo para não especialistas no tema. Acrescentamos também uma breve revisão

bibliográfica sobre trabalhos afins já realizados com Redes Bayesianas na área

Financeira. Finalmente apresentamos algumas ferramentas de software disponíveis

para aplicação das Redes Bayesianas;

No Capítulo 3, apresentamos detalhadamente a metodologia utilizada para o

levantamento, tratamento, agrupamento, montagem das redes e interpretação dos

dados. apresentamos brevemente os objetivos de nossa análise e um resumo da

metodologia proposta. O Capítulo contém, também, uma apresentação conceitual da

(14)

modelos econométricos tradicionais, quais variáveis utilizar e quais as fontes de

informações para tais variáveis. Adicionalmente, apresentamos a aplicação da

metodologia proposta a três setores econômicos distintos: Siderúrgico, Alimentício e

de Energia, respectivamente. Para cada um dos setores econômicos apresentamos,

detalhadamente, metodologias para i) determinação das variáveis relevantes, ii)

levantamento, tratamento e adequação dos dados disponíveis para sua utilização nos

modelos econométricos e bayesianos, iii) a construção das Redes Bayesianas

utilizando o módulo de aprendizagem de estrutura da ferramenta Hugin; iv) análise

comparativa dos dados reais do período com os resultados obtidos pela metodologia

econométrica tradicional por regressão múltipla e versus os resultados obtidos pela

modelagem por Redes de Bayes.

No Capítulo 4, comentamos os principais resultados observados durante as análises

dos três setores econômicos, ressaltando os pontos fortes identificados na utilização

do ferramental bayesiano comparado às técnicas tradicionais de projeção de fluxos

de caixa, bem como listamos as fragilidades encontradas, principalmente em função

da metodologia utilizada e das ferramentas e informações disponíveis para nosso

trabalho.

Finalmente, no Capítulo 5, apresentamos um resumo de nossas principais conclusões

sobre o trabalho e compartilhamos nossa opinião sobre a possibilidade do uso de

Redes Bayesianas no ambiente das Finanças Corporativas, seja como ferramenta

complementar ou mesmo alternativa, em modelos de projeção de fluxos de caixa.

Acrescentamos também sugestões para aprofundamento da análise e sugestões de

(15)

2. Revisão Bibliográfica

2.1. Incerteza em Finanças Corporativas

Em Finanças Corporativas, a tarefa de realizar projeções financeiras, estimativas e

avaliação de resultados financeiros futuros é freqüente e necessária. Análise e

Planejamento Financeiro, Avaliação de Empresas, Avaliação de Projetos, Fusões e

Aquisições são alguns dos temas que requerem projeções e estimativas e que

demandam uma precisão razoável. Existem dois pontos comuns a todas estas

atividades do analista financeiro:

a) a utilização de fluxos de caixa projetados como ferramenta;

b) a assunção de premissas acerca da incerteza destes fluxos e do crescimento

ou decrescimento das variáveis que os compõem.

2.1.1. Projeções Financeiras, Planejamento Estratégico, Planejamento Orçamentário, “Valuation”

Os planos da companhia, das Unidades de Negócio, de projetos simples ou

complexos ou acerca de outras empresas concorrentes ou alvo, sejam eles de curto

prazo (ex: Plano Orçamentário) ou longo prazo (ex: Plano Estratégico) são

normalmente estabelecidos em relatórios financeiros formais, assim como as

métricas para o acompanhamento destes planos.

Os relatórios financeiros formais (pro forma) são os veículos mais utilizados para

reportar resultados e também para realizar projeções financeiras.

“Um relatório pro forma de projeção financeira é basicamente uma previsão do que

os dados constantes dos relatórios financeiros da companhia deverão ser ao final do

período em análise” [HIGGINS, p.83, tradução nossa]. O relatório resume o que

deverá ser o resultado dos diversos planos de ação e execução pelas várias áreas da

companhia de uma forma sintética, consistente e suficiente sobre o resultado

(16)

2.1.2. Principais fontes de Incerteza em projeções financeiras

Durante a montagem das projeções financeiras é comum o analista financeiro

deparar-se com diversas fontes de incerteza com as quais necessita lidar. As fontes

de incerteza mais comuns, podendo variar de maior a menor importância

dependendo do escopo da projeção, do objetivo ou do ambiente, estão listados

abaixo:

i) quantidades vendidas e/ou mantidas

ii) preço dos produtos/serviços vendidos

iii) sazonalidade das receitas

iv) custos dos produtos/serviços vendidos (custos variáveis)

v) custos fixos da companhia

vi) gastos de capital (Capex)

vii) investimentos não operacionais

viii) taxa de cambio

ix) taxa de inflação

x) custo de capital da companhia (wacc)

xi) taxa de crescimento de longo prazo (g)

xii) impostos

xiii) percentual de participação de mercado (market share)

Algumas destas variáveis podem ser endógenas, isto é, a quantidade de unidades

vendidas pode ser função do preço definido para o produto/serviço ou ainda pode

ser função do nível de investimentos realizados para sustentar um crescimento em

vendas no período atual.

Devido à quantidade de variáveis envolvidas e não linearidades no

inter-relacionamento entre elas, é comum montar cenários e análises de sensibilidades

(17)

2.1.3. Crescimento

Importância de uma análise consistente do Crescimento

Conforme comentamos, o inter-relacionamento entra todas estas variáveis no tempo

é incerto, podendo ocasionar fluxos de caixa crescentes, decrescentes, constantes ou

oscilantes, ou ainda uma combinação destes. Quando analisamos fluxos de caixa, as

taxas de crescimento são extremamente importantes, pois definem o valor da

companhia. Em especial os fluxos mais distantes no tempo ou na perpetuidade, são

os mais difíceis de prever. Felizmente, apesar de quanto mais distante um fluxo

maior a dificuldade de previsão, menor o seu valor relativo a valor presente. Ainda

assim, quando somados os fluxos à perpetuidade representam um montante

razoável em relação ao valor presente dos fluxos totais.

Conforme uma empresa cresce, torna-se cada vez mais difícil manter uma alta taxa

de crescimento. Eventualmente ela pode chegar a crescer menos do que a economia

ou o setor econômico em que se situa. Normalmente, quando a taxa de crescimento

da empresa se estabiliza próxima da taxa de crescimento da economia, nós a

chamamos de taxa de crescimento estável, que pode ser utilizada para avaliar o

valor terminal da empresa na perpetuidade [DAMODARAN, cap. 12].

Existem três formas básicas [DAMODARAN, 2002, cap.11], algumas

inter-relacionadas, para estimação do crescimento de qualquer empresa:

i) Através do histórico passado de crescimento (o que pode ser arriscado,

pois poucas empresas mantêm um ritmo de crescimento constante no

tempo);

ii) Uma segunda alternativa é acreditar nas informações publicadas por

analistas de mercado que acompanham a empresa e o mercado e utilizar

esta estimativa de crescimento (o que também é arriscado porque a

(18)

iii) a terceira alternativa é estimar o crescimento a partir dos fundamentos da empresa, i.e., o crescimento de uma empresa é o resultado de quanto

ela reinveste em novos ativos e da qualidade destes investimentos, onde o

termo investimento é abrangente o suficiente para incluir aquisições,

canais de distribuição, ou expansão de capacidades de mercado. Ao

estimar estas variáveis, em tese, avaliam-se os fundamentos da taxa de

crescimento de uma empresa.

Na prática, estas três formas podem e devem ser utilizadas de forma complementar.

Por exemplo, pode-se usar o histórico de investimentos, quantitativo e qualitativo,

para avaliar a solidez dos fundamentos, a qual certamente será uma das ferramentas

utilizadas por um analista de mercado consciente para fundamentar suas conclusões

em seu relatório.

Segundo [DAMODARAN, cap. 12], uma empresa pode ser valiosa porque possui

ativos que geram fluxos de caixa agora ou porque estes ativos serão adquiridos e

gerarão fluxos de caixa no futuro. Os ativos no primeiro grupo são denominados

Ativos correntes e o segundo grupo de Ativos de crescimento. Na interpretação dos

ativos do segundo grupo podem existir diferenças importantes entre um balanço

contábil e um balanço financeiro, posto que a contabilidade tende a ser conservadora

e inconsistente quanto à contabilização de ativos de crescimento. Em empresas de

rápido crescimento, os balanços contábeis apresentam uma informação bastante

pobre para a avaliação dos ativos de crescimento de uma empresa ao não considerar

os ativos de crescimento. Empresas com forte competência em pesquisa, por

exemplo, não tem seu principal ativo contabilizado: o ativo de pesquisa.

Ainda segundo [DAMODARAN, cap. 12], quando avaliamos se uma empresa será

capaz de manter uma alta taxa de crescimento no longo prazo, alguns fatores devem

(19)

a) Tamanho da Empresa: empresas pequenas, comparadas ao tamanho do

mercado em que atuam, têm uma probabilidade bastante maior de manter

altas taxas de crescimento quando comparadas a grandes empresas;

b) Crescimento existente e retornos excedentes: empresas que já apresentam

taxas de crescimento altas e retornos excedentes tendem a apresentar taxas

de crescimento elevadas quando comparadas a empresas que ainda são

“promessas”;

c) Sustentabilidade do Período de Vantagem Competitiva (CAP*): se existem

significativas barreiras à entrada de concorrentes e vantagens competitivas

sustentáveis, aumenta a probabilidade de um período de crescimento mais

longo. Isto está associado à capacidade de gestão dos executivos que

administram a empresa. Alguns líderes têm maior capacidade de tomar

decisões estrategicamente “mais acertadas” do que outros.

* CAP – Competitive Advantage Period: termo popularizado por Michael Maubossin

do Credit Suisse First Boston para mensurar o período pelo qual se espera que uma

empresa tenha retornos excedentes em função de ter vantagens competitivas que

impeçam seus concorrentes de capturar o mesmo valor excedente no mercado em

que atua. [MAUBOUSSIN, JOHNSON, 1997]

Teoria de Crescimento Sustentável (Estrutura de Capital)

“Uma empresa bem administrada apresentará uma taxa de crescimento sustentável,

i.e., os gestores devem ser capazes de manter um crescimento não tão rápido que

esgote os recursos financeiros nem tão lento que desinteresse seus acionistas ou que

torne a empresa alvo de aquisições por terceiros.” [HIGGINS, p.116]

Em seu trabalho, [HIGGINS, p.116] formula uma pequena, mas consistente teoria

sobre crescimento sustentável: sob determinadas premissas que a princípio podem

(20)

companhia avaliando, basicamente: o giro, o lucro e a alavancagem financeira, sem

complicar demasiadamente a teoria pela introdução de variáveis exógenas que

podem ser analisadas num segundo momento. As premissas para esta análise são:

a) A companhia sempre preferirá crescer tão rapidamente quanto às

condições de mercado permitam;

b) A administração está impedida ou não deseja vender participação;

c) A companhia deseja manter fixas sua estrutura de capital e sua política de

distribuição de dividendos.

Qualquer crescimento que a companhia objetive deverá ser financiado, seja por

capital próprio ou de terceiros. Dadas as condições impostas acima, crescimentos

incrementais só podem ser financiados por crescimentos incrementais de “equity”

que diretamente financiam as operações e indiretamente permitem um

endividamento incremental (mantendo a estrutura de capital como premissa) que

também contribui para o financiamento das operações necessárias ao crescimento.

Em resumo:

inicial

ROE

d

inicial

Equity

g

(

1 )

_

*

=

Δ

=

−

×

(1)

Equação 1 – crescimento (retorno e re-investimento)

Fonte: HIGGINS, 2004, p.117

*

g

: Taxa de Crescimento Sustentável

d

: Dividendos Distribuídos / Lucro do Período

inicial

ROE

_

: Retorno sobre o Patrimônio Líquido (Equity)

Em outras palavras, se não houver distribuição de lucros aos acionistas, todo o

retorno obtido no período anterior será reinvestido na companhia na forma de

aumento de capital, representando, portanto um crescimento do “equity”

(21)

Alternativamente, podemos escrever:

T

A

R

P

g

*

=

×

ˆ

(2)

Equação 2 – Crescimento Sustentável

Fonte: HIGGINS, 2004, p.118

P

: Margem de Lucro (Profit Margin): lucro / receita

A

: Variações do Ativo (Asset turnover): variação no ativo / ativo inicial

T

ˆ

: Alavancagem Financeira (Financial Leverage): ativo / patrimônio líquido

R

: Taxa de Retenção (plowback ratio) : valor reinvestido / lucro total

A Margem de Lucro e as Variações do Ativo resumem o desempenho operacional da

empresa, enquanto que Alavancagem Financeira representa a distribuição entre

capital próprio e de terceiros para o financiamento da companhia. Já a Taxa de

Retenção, ela representa a atitude dos acionistas sobre reinvestir ou não na

companhia.

A taxa de crescimento sustentável ( ) é a única taxa de crescimento em vendas

(ou receitas) que é consistente com valores estáveis das quatro razões. Isso porque,

se a empresa aumentar vendas a uma razão diferente desta, uma ou mais razões

automaticamente mudará (maior ou menor receita, maiores ou menores

necessidades de capital e, portanto, haverá diferentes necessidades de

financiamento, e assim por diante). Isto significa que se uma crescer em vendas

acima da taxa sustentável, ela deverá se preparar para melhorar seu desempenho

operacional (P,A) ou alterar suas políticas financeiras ( *

g

Tˆ,R).

Esta teoria de crescimento sustentável evidencia alguma causalidade entre variáveis

que será útil mais adiante quando pensarmos nos modelos de previsão de

(22)

Crescimento Histórico versus Crescimento Sustentável

Estimar o crescimento de uma variável baseado no seu desempenho histórico requer

cuidado quanto aos seguintes aspectos [DAMODARAN, cap.11]:

a) Como já comentado, o desempenho no passado não é garantia de mesmo

desempenho no futuro, trata-se de um modelo que deve levar em

consideração essa simplificação;

b) As taxas de crescimento passadas, e portanto, a estimativa das taxas futuras,

podem ser observadas em termos aritméticos ou geométricos. Em princípio a

média geométrica é uma medida mais precisa do crescimento real quando os

resultados apresentam volatilidade considerável;

c) Para estimar a taxa de crescimento na prática, costuma-se fazer uma

regressão utilizando o Método dos Mínimos Quadrados (Ordinary Least

Squares) em um modelo log-linear que permite estimar através do coeficiente

de declividade (“b”, na expressão abaixo) a variação percentual do objeto de

análise por período de tempo;

d) Cuidados com “resultados históricos negativos” que podem distorcer as

regressões de desempenho histórico. Nestas situações é muito comum que o

desempenho histórico não acrescente qualquer informação relevante para

projeção futura. Deve ser tratado caso a caso;

e) Modelos de Séries Temporais como Box-Jenkins são utilizados em modelos

ARIMA, que levam em consideração além da média da variável, também as

suas medidas de dispersão (erros, choques, etc). Esses modelos são indicados

desde que os dados não apresentem comportamentos determinísticos,

tendência ou dependência de variáveis externas. Em geral esses modelos tem

melhor previsibilidade (erro em relação aos valores reais das variáveis) do que

os modelos mais simples no curto e médio prazo. No longo prazo, em função

(23)

melhores que modelos mais simples. A maior dificuldade dos modelos de

séries temporais para estimativa de crescimento está na grande quantidade

de dados necessários (maior que 60 períodos), que normalmente não estão

disponíveis;

f) Crescimento de Retornos versus crescimento da receita: Em geral, o

crescimento das receitas tende a ser mais previsível do que o crescimento do

resultado dado que as escolhas contábeis tem menor impacto apenas na

receita do que em todas as demais variáveis;

g) Tamanho da empresa: uma vez que o crescimento da empresa está

determinado em termos percentuais e não absolutos é importante lembrar

que é muito mais fácil uma empresa pequena crescer do que uma empresa

muitas vezes maior. Assim, as taxas de crescimento projetadas devem ser

inversamente proporcionais ao tamanho que a empresa vai adquirindo ao

longo do tempo.

Oportunidades de Crescimento (Negócio)

Perímetro de atuação (Produtos e Serviços, Mercados)

Devemos considerar ainda o perímetro de atuação da companhia, i.e., não faz

sentido utilizar uma taxa de crescimento histórica para projeção futura se a empresa,

por exemplo, vendeu uma de suas unidades de negócio, que representava digamos

40% do seu resultado.

Analogamente, se a empresa pretende entrar em novos mercados, a análise do

crescimento desta nova atividade deve ser realizada em separado para não distorcer

(24)

Participação de Mercado

O “market share”, ou fatia do mercado, pelo qual a companhia responde é uma

variável importante a observar nas projeções de crescimento. Se o mercado como

um todo está crescendo e a companhia cresce no mesmo ritmo do mercado é de se

esperar que a participação de mercado da companhia permaneça relativamente

constante. Por outro lado, se as projeções indicam que a companhia crescerá mais

que o mercado, isso significa afirmar que a companhia vai ganhar mercado frente à

concorrência. Isto significa que existe um plano para ganhar clientes dos

concorrentes. Estas coisas devem ser consistentes, caso contrário a projeção de

crescimento não é realista. Ainda, se a companhia projeta crescer a uma taxa menor

que o mercado, ela estaria perdendo participação de mercado.

Posicionamento Estratégico para o Crescimento

Diversas ações estratégicas estão constantemente em curso numa companhia,

mesmo que não divulgadas ou gerenciadas de forma totalmente clara. É importante,

contudo, que as projeções de crescimento utilizadas estejam alinhadas com as

definições estratégicas. Por exemplo, não faz muito sentido que a projeção de

crescimento em vendas de um determinado produto estejam acima do crescimento

do mercado, se a estratégia da companhia é abandonar esta linha de produtos e

partir para um produto de maior margem, por exemplo.

Crescimento por Fusões e/ou Aquisições

Fusões e Aquisições afetam diretamente o crescimento da companhia, seja pela

incorporação direta de novos ativos, pessoas, portfolios. carteira de clientes, como

pelo crescimento provocado pelas sinergias entre o negócio original e o novo negócio

oriundo da fusão e/ou aquisição. O analista deve atentar para estas possibilidades. É

(25)

assim como é comum tratar possíveis venda de ativos como “Riscos” nas projeções

financeiras.

Crescimento segundo Analistas de Mercado

Em geral, as previsões de analistas de mercado são mais precisas que estimativas

baseadas no crescimento histórico porque eles agregam informações adicionais às

suas análises [DAMODARAN, p.282-283] :

a) Informação específica da empresa que tornou-se pública desde o último

relatório de resultados: esta informação ainda não está incorporada no

resultado histórico da empresa e pode ser relevante na previsão de

crescimento;

b) Informação macroeconômica que pode impactar o crescimento futuro da

empresa: variáveis como índice de inflação, crescimento do PIB, taxas de

juros, são informações relevantes para o resultado futuro da empresa que não

estão incorporadas nos resultados históricos da companhia em análise;

c) Informações de concorrentes em prospectos futuros: podem afetar as

projeções da companhia objeto;

d) Informação privada sobre a empresa: os analistas podem de alguma forma ter

acesso a “inside information” que melhoram a qualidade da sua avaliação e

previsibilidade de crescimento futuro;

e) Outras informações públicas além de resultados financeiros: informações

como retenção de lucros, margens de lucro, movimentação de ativos, que não

estão incorporadas na receita ou lucro histórico, mas que são relevantes para

a projeção de crescimento futuro.

Prever o crescimento não é uma tarefa simples, envolve diversas variáveis, premissas

(26)

variáveis quantitativas e qualitativas, informações disponíveis no mercado e

coletáveis de forma empírica, outras, porém, puramente teóricas e não

comprovadas. Outras ainda, baseadas em opiniões de especialistas, mas sem

fundamentos claramente técnicos. Podemos ainda considerar que para empresas

abertas existem os mais diversos métodos para previsão de crescimento, que vão

desde análises fundamentalistas aqui exploradas até análises técnicas e “grafistas”,

baseadas em padrões de comportamento dos preços das suas ações.

Apesar de toda esta dificuldade, trata-se de uma informação extremamente

importante na determinação do valor de uma empresa, projeto ou produto e

entendemos que este trabalho apresenta uma modesta contribuição para esta

(27)

2.1.4. Ferramentas tradicionais para lidar com a incerteza

“Ainda que os riscos do projeto sejam totalmente diversificáveis, você ainda precisa

entender por que ele poderia fracassar” [BREALEY; MYERS; ALLEN, 2006, p.245]. A

incerteza associada às variáveis de projeção é parte integrante de qualquer projeção

financeira realista. Para lidar com essa incerteza as ferramentas tradicionalmente

utilizadas são [BREALEY; MYERS; ALLEN, 2006, CAP. 10]:

Análise de Sensibilidade

Baseia-se em simulações do modelo de projeção, variando-se uma variável por vez e

analisando o impacto global no modelo. Conhecida coloquialmente como questões

“E-SE”: E se as vendas aumentarem em 15% ao invés de 25% o que acontece com

o resultado? E se o custo do produto vendido for 86% e não 84% das vendas?

É um modelo bastante versátil, contudo apresenta alguns inconvenientes como o

fato de ser um processo muito lento caso existam muitas variáveis a serem testadas

e analisadas. Para evitar que seja necessário realizar o teste de todas as variáveis da

projeção, é requerido um conhecimento prévio acerca de quais variáveis são

realmente relevantes e merecem ser testadas para que se tenha um custo/benefício

que justifique a análise.

Análise de Cenários

Também está baseada na simulação do modelo de projeções. Contudo na Análise de

Cenários, diversas variáveis são alteradas simultaneamente para observar o impacto

no resultado do modelo de projeção. É melhor que a Análise de Sensibilidade quando

as variáveis em teste estão correlacionadas. É comum definir cenários bem

extremados para analisar a elasticidade da incerteza global do modelo. Define-se por

exemplo, um cenário pessimista, um cenário realistas e um cenário otimista. No

(28)

extremos que pioram o resultado do modelo e obtém-se uma projeção do tipo “No

pior dos casos o que pode acontecer é isso”. No cenário otimista, faz-se o inverso,

todas as variáveis de incerteza do modelo são alimentadas com valores que levariam

o modelo ao melhor resultado possível: “Num caso de extremo sucesso, o melhor

resultado atingível é....”. E no cenário realista utiliza-se para as variáveis incertas o

melhor valor disponível no momento da análise. Com base nos resultados dos três

cenários é possível tirar alguma conclusão sobre a incerteza global da projeção e os

riscos envolvidos. Contudo, existem algumas críticas como o fato de não serem

atribuídos pesos a cada um dos cenários, além das definições de melhor caso e pior

caso poderem ser um tanto subjetivas.

Simulação de Monte Carlo

Simulação é uma extensão da análise de sensibilidade, contudo assistida por

ferramentas computacionais que aceleram o processo de investigação, permitindo

uma análise exaustiva das variáveis de incerteza do modelo de projeção. Para cada

variável do problema ao invés de atribuir um valor discreto, atribui-se uma

distribuição de probabilidades. Em seguida, utilizando-se uma ferramenta

computacional adequada são selecionados aleatoriamente, obedecendo as

distribuições de probabilidades informadas, valores para cada variável e calculado o

valor do modelo para esta situação. O software de simulação repete este

procedimento diversas e vezes e vai computando os resultados num histograma, que

após um número suficiente de simulações fornece uma distribuição de probabilidades

dos resultados do modelo de projeção. Um exemplo de software que realiza este tipo

de análise é o “Crystal Ball”.

Opções Reais

Em opções reais, tem-se uma abordagem na qual se atribui valores à incerteza, ou

(29)

fonte de valor, num ambiente onde exista a premissa de aversão ao risco, i.e.,

quanto maior o risco, maior o retorno esperado.

Nas abordagens tradicionais, preocupa-se com o valor esperado do modelo em

função das variáveis de incerteza, mas o valor não está ajustado ao risco, ou seja a

volatilidade do modelo. Na abordagem por opções reais trabalha-se com o valor

esperado ajustado ao risco e por tanto, com uma informação mais rica num

ambiente de incerteza. Nesse caso, além da projeção das variáveis de interesse é

importante analisarmos a projeção das volatilidades destas variáveis.

2.1.5. Estimando crescimento com incerteza com uma abordagem alternativa

Imaginemos agora que temos alguma idéia de como as diversas variáveis que

listamos no item 2.1.2, se inter-relacionam e criam situações de causalidade, mas

não temos certeza absoluta sobre essas associações. Por outro lado temos dados

históricos que talvez nos dessem alguma informação se, pelo menos no passado,

essas relações supostas foram válidas para determinar o crescimento.

No diagrama abaixo, encontra-se um “mind map” de possíveis fontes relevantes de

informação para estimação do crescimento, ainda que não tenhamos certeza

absoluta se são realmente aplicáveis ou não. Em verde estão informações mais

facilmente disponíveis para coleta, em amarelo nível de dificuldade intermediário e

(30)

Ilustração 1- “Mind Map” Crescimento

Fonte: elaboração própria

É razoável imaginar que variáveis econômicas (crescimento do PIB, mercado objeto,

taxa de juros, inflação, impostos) afetem o crescimento da empresa, assim como a

reputação da companhia e/ou dos gestores da companhia perante o mercado

financeiro (analistas de mercado, painéis setoriais). Talvez ainda mais importante

seja o negócio no qual a empresa participa é promissor, se o posicionamento

estratégico da companhia é sólido, se o grupo ao qual a empresa é financeiramente

saudável, tem fôlego para novos investimentos se o negócio depender disso, se tem

crédito no mercado para buscar financiamentos, enfim, podemos a princípio,

imaginar qualquer variável que pudesse afetar o crescimento da companhia.

Imaginemos agora que pudéssemos criar um modelo de inter-relacionamento entre

essas variáveis baseado em causalidade e baseado em algum conhecimento teórico,

mercadológico, baseado em fatos reais, ou baseado em meras suposições, mas que

pudéssemos colocar esse modelo à prova baseado em dados reais. Poderíamos

testar o modelo e revisá-lo caso as suposições originais não “se ajustarem” aos

(31)

necessários até que tivéssemos um modelo razoável, que representasse os dados

reais de que dispomos. Uma vez definido o modelo, este poderia ser utilizado, sob

determinadas premissas e considerações, para fazer previsões acerca do crescimento

em função das nossas variáveis de entrada.

As Redes Bayesianas, que veremos com mais detalhes a seguir, podem ser

ferramentas poderosas para este tipo de análise. Mostrar um primeiro caminho é o

principal objetivo deste trabalho: utilizando-se de probabilidades condicionais,

obtidas a partir de dados históricos ou de mera suposição, pode-se fazer inferência

acerca do inter-relacionamento de variáveis e obter conclusões probabilísticas

interessantes. Imaginamos que as aplicações em Finanças Corporativas possam ser

várias, assim como em precificação de ativos. Neste trabalho, demonstraremos o uso

desta Ferramenta para estimativa acerca do crescimento dos fluxos de caixa para

determinação do Valor de uma empresa/projeto.

Antes, contudo, faremos uma breve revisão bibliográfica de Redes Bayesianas, sua

origem, suas características, sua definição e quais são suas aplicações atuais em

outros campos do conhecimento, para então buscarmos demonstrar a sua aplicação

em análises de determinação de valor em Finanças Corporativas.

2.1.6. Fluxo de Caixa da Empresa versus Fluxo de Caixa ao Acionista

Devemos distintuir entre o Fluxo de Caixa da Firma ou “Free Cash Flow to Firm”

(FCFF) e o Fluxo de Caixa para o Acionista ou Free Cash Flow to Equity (FCFE). O

primeiro refere-se a série temporal do fluxo de caixa livre que a empresa gera

globalmente fruto do capital do acionista mais recursos de terceiros empregados na

companhia. O segundo, FCFE, refere-se efetivamente ao fluxo de caixa livre gerado

para o acionista, portanto já descontados as obrigações com terceiros [DAMODARAN,

2002, Cap.15].

Embora os fluxos de caixa das empresas não sejam uma informação disponível

(32)

Demonstração de Resultados, Balanço Patrimonial, Demonstração de Origem e

Aplicações de Recursos, mais parecer de auditores independentes, é possível sob

determinadas premissas, construir o Fluxo de Caixa com uma aproximação bastante

razoável do fluxo real.

A partir do Balanço Patrimonial e do Demonstrativo de Resultado, conseguimos

inferir o demonstrativo e balanço projetado no tempo que nos permite estimar o

Fluxo de Caixa da companhia e o Fluxo de Caixa ao Acionista [BRIGHAM, 2004,

cap.14]. Como regra geral, podemos calcular o FCFE a partir dos relatórios pro -

forma da companhia da seguinte forma [DAMODARAN, cap. 14]:

FCFE = Lucro Líquido da Firma – (CAPEX – Depreciação) – (Variação do Capital de Giro) – (Dividendos de ações preferenciais + novas emissões de ações preferenciais) + (Emissão de dívida – pagamento de dívida)

Equação 3 – Fluxo de Caixa do Acionista x Fluxo de Caixa da Firma

Fonte: DAMODARAN, P.358

A variação dos fluxos de caixa ao acionista entre períodos subseqüentes é a variável

(33)

2.2. Redes Bayesianas

2.2.1. Inteligência Artificial

Russel e Norvig [RUSSEL, NORVIG, 1995] apresentam uma excelente abordagem do

assunto:

“Formalmente, Inteligência Artificial tornou-se uma disciplina apenas em 1956, embora os estudos sobre o tema tenham se iniciado pouco antes. A definição de Inteligência Artificial não é um consenso. A tabela resume as principais correntes de pensamento, as quais estão divididas segundo 2x2 dimensões, i.e., sistemas baseados em raciocínio versus comportamento e sistemas baseados em desempenho humano versus desempenho racional (ideal)” [tradução nossa].

Tabela 1 – Classificações da Inteligência Artificial

Inteligência humana Inteligência “ideal”

Raciocínio e

processos

i) Pensamento humano ii) Pensamento racional

Comportamentos iii) Ações humanas iv) Ações racionais

Fonte: [RUSSEL,NORVIG, 1995 , p.5]

i) Pensamento Humano

"O excitante novo esforço para fazer computadores pensarem . . . máquinas

com mentes, no sentido complete e literal " [HAUGELAND1, 1985 apud

RUSSEL,NORVIG, 1995]

"[A automação de] atividades que nós associamos com o pensamento

humano, atividades tais como tomada de decisão, resolução de problemas,

aprendizado, . . ." [BELLMAN2, 1978 apud RUSSEL,NORVIG, 1995]

1

Haugeland, J., editor (1985). Artificial Intelligence: The Very Idea. MIT Press, Cambridge, Massachusetts. 2

(34)

ii) Pensamento Racional

"O estudo das faculdades mentais através do uso de modelos computacionais

" [CHARNIAK, MCDERMOTT3, 1985 apud RUSSEL,NORVIG, 1995]

"O estudo de computações que permite perceber, raciocinar e agir”

[WINSTON4, 1992 apud RUSSEL,NORVIG, 1995]

iii) Ações humanas

"A arte de criar máquinas que executam funções que requerem inteligência

quando executadas por pessoas" [KURZWEIL5, 1990 apud RUSSEL,NORVIG,

1995]

" O estudo de como fazer computadores realizarem coisas que no momento

são melhores feitas por pessoas" [RICH, KNIGHT6, 1991 apud

iv) Ações racionais

"Um campo de estudo que busca explicar e emular comportamento inteligente

em termos de processos computacionais" [SCHALKOFF7, 1990 apud

"O ramos da ciência da computação que está preocupado com a automação

do comportamento inteligente " [LUGER, STUBBLEFIELD8, 1993 apud

3

Charniak, E. and McDermott, D. (1985). Introduction to Artificial Intelligence. Addison-Wesley, Reading, Massachusetts..

4

Winston, P. H. (1992). Artificial Intelligence. Addison-Wesley, Reading, Massachusetts, third edition 5

Kurzweil, R. (1990). The Age of Intelligent Machines.MIT Press, Cambridge, Massachusetts 6

Rich, E. and Knight, K. (1991). Artificial Intelligence.McGraw-Hill, New York, second edition 7

Schalkoff, R. I. (1990). Artificial Intelligence: An Engineering Approach. McGraw-Hill, New York 8

(35)

Sistemas baseados em Regras versus Sistemas de Apoio à Decisão

Jensen apresenta ainda interessante visão sobre a importância da Inteligência

Artificial nos sistemas de apoio à decisão [JENSEN, 2001, Preface, tradução nossa]:

“Um fator de grande atraso para o avanço da inteligência artificial foi por um

longo tempo a falta de sucessos na área de robótica. A dificuldade em criar

agentes autônomos que se movessem, observassem, e carregassem um corpo

controlável fez com que muito tempo de pesquisas e fracassos desacreditasse

este campo de estudos.

A maioria dos avanços, contudo, aconteceu nos Sistemas de Suporte à Decisão,

sistema que apóiam o ser humano em atividades altamente especializadas. Com

a Internet, o escopo da inteligência artificial aumentou consideravelmente.

A Internet é o mundo não físico ideal para agentes inteligentes, que são puros

espíritos sem corpo. Nos anos que virão, iremos experimentar uma enchente de

agentes inteligentes na Internet, mas também a manifestação do lado negro do

ser humano. Alguns agentes irão destruir, invadir, mentir, e assim por diante, e

nós teremos que nos defender contra eles. Agentes encontrarão agentes, e eles

terão que decidir como tratar um ao outro, eles terão que aprender a partir de

experiências anteriores e terão que se adaptar à ambientes em mudança.

Os Sistemas Normativos apóiam-se em regras e têm como objetivo reproduzir a

sabedoria humana, i.e., tomar decisões baseado na experiência acumulada e

processada. São tarefas do seguinte tipo: usar observações para interpretar uma

situação; focar uma busca para obter mais informações; decidir por ações de

intervenção; adaptar-se a ambientes em mutação; aprender a partir da

(36)

Conhecimento e Raciocínio Lógico

O componente central de um agente baseado em conhecimento é a sua base de

conhecimento. Informalmente, a base de conhecimento é uma série de

representações de fatos sobre o mundo. Cada representação individual é chamada

de sentença ou regra. Uma forma organizada das sentenças constitui a linguagem e,

portanto uma forma de questionar o que é desconhecido. Informar e questionar

fazem parte de trabalho do mecanismo de inferência que constitui o raciocínio lógico.

O nível do conhecimento é o mais básico, e no qual é possível descrever o agente

simplesmente pelo o que ele sabe. Se informar e questionar funciona bem, então

podemos trabalhar no nível do conhecimento a maior parte do tempo, sem a

necessidade de ir a níveis mais complexos.

O nível lógico é aquele aonde o conhecimento é codificado em sentenças.

O nível de implementação é onde está definido e funciona a arquitetura do agente

inteligente. É o nível onde estão as representações físicas das regras nos níveis

lógicos. A escolha da forma de implementação é muito importante para o

desempenho eficiente do agente, mas é irrelevante para o nível lógico e nível do

conhecimento.

É necessário representar o conhecimento de forma tratável por um computador. Para

tanto utiliza-se a linguagem para a definição das regras. A linguagem é definida em

dois aspectos: a sintaxe (possíveis configurações que podem constituir sentenças) e

a semântica (os fatos do mundo aos quais as regras se referem).

É importante distinguir entre fatos e suas representações. Fatos são parte do mundo

enquanto representações podem ser codificadas de tal forma que possam ser

fisicamente armazenadas dentro de um agente. Não podemos colocar o mundo

(37)

Então todos os mecanismos de raciocínio devem operar como representação de

fatos, ou seja, modelos, ao invés de trabalhar com os próprios fatos. Como as

sentenças são configurações físicas das partes do agente, o raciocínio deve ser um

processo de construção de novas configurações físicas a partir das antigas. O

raciocínio adequado deve garantir que as novas configurações representem fatos que

atualmente seguem dos fatos que as configurações antigas representam.

A conexão entre regras e fatos é provida pela semântica da linguagem. A

propriedade de um fato seguindo de outros fatos é espelhada pela propriedade de

uma sentença sendo criada a partir de outras sentenças. A inferência lógica gera as

novas regras.

Regras

Uma regra é uma expressão na forma:

Se A então B

Onde A é uma assertiva e B pode ser tanto uma ação como outra assertiva. Por

exemplo, as seguintes regras poderiam ser parte de uma série de regras maiores

para lidar com problemas nas bombas de água:

Se a bomba falhar então a pressão está baixa

Se a bomba falhar então cheque o nível de óleo

Se a energia falhar então a bomba falha

Quando informações específicas ocorrem sobre o domínio, conclusões são tiradas e

ações apropriadas são disparadas: isto é chamado I nferência. A Inferência

acontece como uma reação em cadeia. No exemplo acima, se você for informado de

que existe uma falha de energia, a regra três estabelecerá que existe uma falha na

bomba e a regra 1 estabelecerá que a pressão está baixa. A regra 2 também dará

(38)

Inferência

Os termos raciocínio e inferência são geralmente usados para referenciar quaisquer

processos pelos quais se chegue a conclusões. No caso em questão, estamos mais

preocupados com a inferência lógica ou dedução. A inferência lógica é o processo

que implementa a relação de construção entre as sentenças.

Para que seja possível fazer inferências em computadores é necessário que as

sentenças sejam válidas (se e somente se é verdadeira sob todas as possíveis

interpretações em todos os possíveis mundos, independente do que signifique e qual

seu estado no universo descrito) e suficientes (se e somente se existe alguma

interpretação em algum mundo para o qual ela seja verdadeira).

A grande vantagem sobre a inferência formal é que ela pode ser usada para derivar

conclusões válidas mesmo quando o computador não conhece a interpretação que

você está utilizando. O computador apenas reporta conclusões válidas, que devem

ser verdadeiras independente da interpretação. Como você conhece a interpretação,

as conclusões terão muito significado para você, garantido que as premissas foram

seguidas.

Lógica

A Lógica consiste de:

1. Um sistema formal para descrever estados, consistindo de:

a) sintaxe da linguagem, que descreve como fazer sentenças; e

b) semântica da linguagem, que estabelece as restrições sistemáticas sobre como as

sentenças se relacionam aos estados.

2. Uma teoria de provas – uma série de regras para deduzir os vínculos entre uma

(39)

Como exemplo de lógicas, temos a Lógica Booleana e a Lógica de Primeira Ordem

(cálculo com igualdade).

Na lógica proposicional, os símbolos representam proposições inteiras (fatos).

Símbolos podem ser combinados com conectores booleanos para gerar sentenças

com significados mais complexos. Tal lógica tem pouca confiabilidade de como as

coisas são representadas, assim não representa muito fielmente a linguagem.

A lógica de primeira ordem representa melhor mundos em termos de objetos e

atributos sobre objetos (propriedades de objetos ou relações entre objetos) bem

como utilizando conectivos e quantificadores, os quais permitem que as sentenças

sejam escritas sobre quaisquer coisas no universo de uma vez.

A lógica de primeira ordem para estar apta a um bom compromisso entre o que

conhecemos sobre o mundo foi estudada por centenas de anos.

É interessante considerar lógica à luz do compromisso entre a ontologia (natureza da

realidade) e a epistemologia (possibilidade dos estados de conhecimento que um

agente pode ter usando vários tipos de lógica). Em ambas, a lógica proposicional e a

lógica de primeira ordem, uma sentença representa um fato e um agente acredita ou

que a sentença é verdadeira, ou que é falsa, ou não está apto a concluir por uma ou

outra. Esta lógica, portanto, tem três possíveis estados de crença qualquer que seja

a sentença.

Infelizmente o raciocínio lógico é muito limitado em escopo, ele trata de como inferir

a partir de proposições que conhecemos como verdadeiras. Na maioria das vezes

não conhecemos a proposição com certeza, mas ainda assim necessitamos realizar

inferências a partir de informações incompletas e incertas. O raciocínio sob incerteza

ainda não é bem entendido tal que possa ser formalizado completamente para

(40)

delas é utilizar Teoria das Probabilidades, quando o raciocínio termina numa

conclusão sobre tomar uma decisão, assume-se que a decisão a ser tomada é a que

maximiza a utilidade esperada. Essa abordagem é dita normativa porque pressupõe

um comportamento baseado em curvas de utilidade e maximização de retorno, o que

não necessariamente exprime o comportamento humano, pelo menos não na

totalidade dos eventos.

Sistemas que utilizam a teoria da probabilidade podem ter quaisquer graus de crença

variando de 0 (descrença total) a 1 (crença total).

Sistemas alternativos baseados em lógica fuzzy podem ter graus de crença em uma

sentença e também graus de verdade (um fato não precisa ser verdadeiro ou falso

no mundo, mas pode ser verdadeiro em um certo grau). Contudo, não trataremos

destes últimos neste texto.

Incerteza e Teoria de Decisão

Alguns fatores podem condicionar a falta de informação em uma base de

conhecimento, os principais são:

• Impossibilidade: o trabalho exigido para a inserção de todos os

antecedentes ou conseqüentes que configurem uma base de conhecimento,

para que inferências quaisquer a respeito do domínio do problema possam ser

efetuadas, pode ser muito oneroso.

• Ignorância Teórica: Em alguns casos não se possui o conhecimento

completo acerca do domínio do problema.

A falta de informação implica em lidar com incertezas. Nestes ambientes pode ser

necessário trabalhar com níveis de certeza e não apenas valores booleanos,

(41)

Para caracterização de situações de incerteza pode-se utilizar grafos representando

relações causais entre eventos, que lhe permita fazer inferências a partir de

informações conhecidas.

Para fazer estas escolhas, um agente deve inicialmente possuir preferências entre

possíveis efeitos das ações a serem tomadas. Preferências são representadas por

utilidades (utility – indicação do nível de utilidade que possui um estado) combinadas

com probabilidades, resultando na chamada: teoria de decisão.

Teoria de Decisão = teoria de probabilidades + teoria de utilidade

A idéia fundamental em teoria de decisão é: um agente é racional se e somente se

ele escolhe a ação que permite a maior expectativa de utilidade, ponderada pelos

efeitos de todas as possíveis ações, ou princípio da Máxima expectativa de Utilidade

(MEU).

Utilidade

Formalmente, uma função Utilidade é uma função U definida nos números reais,

representando possíveis níveis de riqueza (ou bem-estar) e resultando num número

real. Uma vez definida a função utilidade, todos os níveis de riqueza são ordenados

pela avaliação pelo valor de utilidade esperado. Você pode comparar duas variáveis x

e y avaliando os valores esperados de utilidade E[U(x)] e E[U(y)], o maior valor

obtido define a variável preferida (mais útil). [LUENBERGER, 1998, p.228-229]

Funções utilidade são utilizadas no ambiente financeiro para mensurar a tolerância

ao risco. Em geral, quanto maior o retornado financeiro, maior o risco, por isso as

funções utilidade financeiras normalmente são crescentes e côncavas para

(42)

Probabilidade

Probabilidade incondicional

A probabilidade P(a) de um evento a é um número dentro do intervalo [0,1].

i. P(a) = 1 ÅÆ a é um evento certo;

ii. Se a e b são mutuamente exclusivos, então: P(a ٧ b) = P(a) + P(b)

Por exemplo, considerando que Cárie denota a proposição de que um paciente em

particular tenha cárie, então: P(Cárie) = 0.1, significa dizer que, na ausência de

outra informação, o sistema assinalará a probabilidade 0.1 ao evento ter cárie.

Proposições podem também incluir igualdades envolvendo variáveis aleatórias. Por

exemplo, caso estejamos interessados em uma variável aleatória, Tempo,

poderíamos considerar:

a. P(Tempo = Ensolarado) = 0.7

b. P(Tempo = Chuvoso) = 0.2

c. P(Tempo = Nublado) = 0.1

Em alguns casos, podemos nos referir apenas a variável Tempo, como um vetor de

probabilidades P(Tempo) = <0.7,0.2,0.1>.

Proposições podem, também, assumir o domínio booleano <verdadeiro,falso>, neste

caso, a expressão P(Cárie) pode ser vista como P(Cárie = verdadeiro) e,

analogamente, P(não Cárie) = P(Cárie = falso).

Para expressar todas as combinações de valores de duas probabilidades podemos

utilizar P(Tempo, Cárie), que pode ser vista como uma tabela de probabilidades

(43)

Probabilidade condicional:

Probabilidade condicional P(a|b) = x, pode ser interpretada como: “Dado o evento b,

a probabilidade do evento a é x”.

i. Regra fundamental: P(a|b) = P(a,b)/P(b), ou P(a|b)P(b) = P(a,b). Onde

P(a,b) é a probabilidade do evento conjunto: a Λ b.

Por exemplo, P(Cárie|Dor) = 0.8, indica que caso um paciente esteja com dor (de

dente) e nenhuma outra informação esteja disponível, então, a probabilidade de o

paciente ter uma cárie é de 0.8. É importante ressaltar que P(A|B) pode ser utilizado

apenas quando toda informação disponível é B. Uma vez que outra variável C é

conhecida, deve-se reconsiderar para P(A|B Λ C).

ii. Se P(a,b)=P(b,c), então de i, chegamos em P(a|b)P(b) = P(b|a)P(a), que

resulta em: P(b|a) = P(a|b)P(b)/P(a), chamada Regra de Bayes.

iii. Em alguns casos podemos estar interessados em uma probabilidade

segundo uma evidencia e, neste caso, aplica-se: P(a|b,e)P(b|e) = P(a,b|e)

Variáveis vetoriais serão representadas por letras maiúsculas: A, P(A), B, P(B),...

Em geral, se estamos interessados em uma proposição A, e temos o conhecimento

da evidencia B, devemos calcular P(A|B). Em alguns casos este valor não esta

disponível na base de conhecimento e, portanto, devemos utilizar algum método de

(44)

Conjunção de Probabilidades

Seja A uma variável aleatória com n estados, a1, ..., an, e P(A) a distribuição de

probabilidades para estes estados,

P(A) = (x1, ..., xn); xi ≥ 0; Σxi = 1, onde xi é a probabilidade de A estar no estado

ai, P(A=ai).

Se a variável B possui os estados b1,...bm, então P(A|B) representa uma tabela n x m

contendo os valores P(ai|bj). Por exemplo:

Tabela 2– Probabilidades condicionais: P(A|B)

b1 b2 b3

a1 0.4 0.3 0.6

a2 0.6 0.7 0.4

Fonte: JENSEN, 2001, p.14

A conjunção de probabilidades para as variáveis A e B, ou P(A,B), é também uma

tabela n x m, representada pela probabilidade de cada configuração (ai,bj).

Se impusermos que P(B) = <0.4,0.4,0.2> e aplicarmos a regra P(A|B) =P(A,B) /

P(B), para as variáveis A e B e a Tabela 2, teremos:

Tabela 3 - Probabilidades conjunta: P(A,B)

b1 b2 b3

a1 0.16 0.12 0.12

a2 0.24 0.28 0.08

A probabilidade P(X) pode ser então calculada a partir da Tabela 3, calculando-se:

P(ai)=Σ Pa,bi. Este cálculo é chamado Marginalização de B em P(A,B). O resultado

(45)

Tabela 4 – Probabilidade Marginal: P(A)

P( X)

A1 0.4

A2 0.6

Para obtermos P (B|A), aplicamos regra de Bayes sob a Tabela 1, lembrando que:

P(B|A) = P(A|B) . P(B) / P(A) - regra de Bayes

P(B) = <0.4,0.4,0.2> - imposto

P(A) = <0.4, 0.6> - calculado na Tabela 3

Assim:

A1 a2

b1 =0.4x0.4/0.4 =0.6x0.4/0.6

b2 =0.3x0.4/0.4 =0.7x0.4/0.6

b3 =0.6x0.2/0.4 =0.4x0.2/0.6

Portanto:

Tabela 5 – Probabilidades Bayesiana: P(B|A)

A1 A2

b1 0.4 0.4

b2 0.3 0.47

b3 0.3 0.13

Considerando uma situação real, podemos imaginar um problema contendo centenas

ou milhares de variáveis. Considerando o uso apenas de variáveis que assumam

valores booleanos, teríamos a necessidade do cálculo de 2n entradas para a tabela

de conjunção de probabilidades do sistema. Ou seja, um crescimento exponencial

em relação ao número de variáveis. O que pode tornar-se inviável

computacionalmente. Contudo, uma vez computados os valores, o sistema será

(46)

A regra de Bayes

Como já comentado, o teorema de Bayes é um corolário do teorema da

probabilidade total que permite calcular a seguinte probabilidade:

)

(

)

(

)

|

(

)

|

(

B

P

A

P

A

B

P

B

A

P

=

×

P(A) e P(B) são as probabilidades a priori de A e B. P(B|A) e P(A|B) são as

probabilidades a posteriori de B condicional a A e de A condicional a B,

respectivamente.

A regra de Bayes mostra como alterar as probabilidades a priori tendo em conta

novas evidências de forma a obter probabilidades a posteriori. Para aplicação da

regra de Bayes precisamos de três termos: uma probabilidade condicional e duas

incondicionais.

Vamos considerar um exemplo de diagnostico médico: “um médico sabe que a

meningite causa torcicolo P(T|M) em 50% dos casos. Porém, o médico também

conhece algumas probabilidades incondicionais que dizem que, um caso de

meningite (M) atinge 1/50000 pessoas e, a probabilidade de alguém ter torcicolo (T)

é de 1/20. ”

Aplicando a regra de Bayes:

P(M|T) = P(T|M).P(M)/P(T) = (0.5 x 1/50000)/(1/20) = 0.0002

Ou seja, espera-se que apenas 1 em 5,000 pacientes com torcicolo tenha meningite.

Note que, mesmo tendo torcicolo uma alta probabilidade nos casos de meningite

(0.5), a probabilidade de um paciente ter meningite continua pequena, devido ao

fato de a probabilidade incondicional de torcicolo ser muito maior que a

(47)

Uma argumentação válida surge do fato de que o médico poderia também possuir a

probabilidade incondicional P(M|T), a partir de amostras de seu universo de

pacientes, da mesma forma que P(T|M), evitando o cálculo realizado anteriormente.

Porém, imagine que um surto de meningite aflija o universo de pacientes do médico

em questão, aumentando o valor de P(M). Caso P(M|T) tenha sido calculado

estatisticamente a partir de observações em seus pacientes, o médico não terá

nenhuma idéia de como este valor será atualizado (visto que P(M) aumentou).

Entretanto, caso tenha realizado o cálculo de P(M|T) em relação aos outros três

valores (como demonstrado) o médico verificará que P(M|T) crescerá

proporcionalmente em relação a P(M).

Considere agora que um paciente pode estar com problema de coluna C, dado que

está com torcicolo: P(C|T) = [P(T|C) x P(C)] / P(T).

Utilizando P(M|T) podemos calcular a probabilidade relativa de C em M dado T, ou,

em outras palavras, a marginalização de M e C. Considerando que:

P(T|C) = 0.8

P(C) = 1/1000

P(M|T) / P(C|T) = [P(T|M) x P(M)] / [P(T/C) x P(C)] = (0.5 x 1/50000)/(0.8 x

1/1000) = 1/80

Isto é, Problema de coluna C é 80 vezes mais comum que meningite M, dado