4.5 Redes Bayesianas
4.5.4 Exemplo de Rede Bayesiana
Para compreender as atribuições de probabilidades em uma Rede Bayesiana é apresen- tado o seguinte exemplo adaptado de Yoon (2003). O exemplo descreve o caso hipotético de uma empresa de seguros, que recentemente implementou uma página de seviços on-line para venda de seguros básicos, como, seguro para viagens e seguro para acidentes pessoais. Para garantir a continuidade das suas operações e sua competitividade no mercado, a empresa está implementando ações para se proteger do que ela define como riscos operacionais.
Esses riscos compreendem problemas como: ataque de vírus, quedas no sistema, ação de hackers e outras ameaças que implicam em falhas na operação dos seus serviços on-line. Yoon (2003) selecionou dezessete variáveis para compor os nós da Rede Bayesiana. A relação de variáveis está detalhada na Tabela 2.A fim de medir as consequências econômicas e de mercado que esses riscos podem ocasionar à empresa Yoon (2003) definiu a variável Cost como variável resposta.
A variável Cost representa o montante financeiro a ser investido para cobrir as despesas com os riscos operacionais evitando assim que novos negócios sejam prejudicados e que a reputação da empresa seja acometida.Essa variável é influenciada por todas as outras dezesseis variáveis da rede e por isso, é a variável resposta. Cada um desses dezessete eventos são os nós da Rede Bayesiana, representados pelas suas respectivas abreviações através dos retângulos amarelos na Figura 7 abaixo.
Os nós foram posicionados conforme a percepção da autora quanto a influência de cada um sob a variável Cost.
Cada variável é associada a uma distribuição de probabilidade condicional(CPD), que estabelece uma distribuição de valores de X para cada conjunto de valores atribuídos aos seus pais no modelo. Assim, para os nós que não possuem pais no modelo, a CPD é dada pela distri- buição marginal de cada variável (KOLLER; FRIEDMAN, 2009). As CPDs são representadas na Rede Bayesiana da Figura 8 abaixo através de retângulos e contém o nome da variável e a probabilidade de que cada variável assuma cada um dos valores descritos na Tabela 2, na coluna Values.
Conforme evidências são fornecidas essas probabilidades, representadas nas CPDs, são atualizadas, de maneira que a probabilidade de que cada nó assuma um determinado valor se altera. Suponha, por exemplo, que as seguintes evidências a respeito de seis nós dessa rede sejam dadas, conforme a Tabela 3 abaixo.
A Tabela 3 atribui a cada uma das seis variáveis um valor. Esses valores são então ab- sorvidos pela rede Bayesiana, conforme a Figura 9 a seguir. Comparando as Figuras 8 e 9 é possível notar que após a absorção das evidências na rede, a probabilidade de que a variável
Tabela 2 – Valores e Abreviações para a Rede Bayesiana do Risco Operacional
Fonte: Yoon (2003, p.41)
Cost(Custo) assuma o valor 0 aumenta. O valor que na Figura 8 era de 69,21% passou para 91,27%, conforme exibe a Figura 9. Em outras palavras, podemos interpretar que a atribuição dessas evidências teve um impacto positivo sobre o custo da empresa, uma vez que, a probabi- lidade de que essa empresa tenha poucas despesas com riscos operacionais aumenta.
Tabela 3 – Atribuição de Evidências
Capítulo 4. Grafos Probabilísticos 39
Figura 7 – Rede Bayesiana do Risco Operacional
Figura 8 – Rede Bayesiana do Risco Operacional com CPDs
Capítulo 4. Grafos Probabilísticos 41
Figura 9 – Atribuição de Evidências na Rede do Risco Operacional
Capítulo
5
Base de dados
A base de dados foi obtida através de um convênio de pesquisa firmado entre a Universi- dade de São Paulo, a instituição SERASA S.A. inscrita no CNPJ sob o nº 62.173.620-0001/80, com sede na Alameda dos Quinimuras, 187 – Planalto Paulista – São Paulo – SP e a FUN- DAÇÃO PARA PESQUISA E DESENVOLVIMENTO DA ADMINISTRAÇÃO, CONTABI- LIDADE E ECONOMIA, designada FUNDACE, com sede à Rua Bernardino de Campos, 1001 –sala 401- Higienópolis – Ribeirão Preto – SP, inscrita no CNPJ/MF sob o nº 00.934.542/0001- 31.
Os dados estão organizados em três planilhas, que guardam informações sobre três pe- ríodos distintos: 2013-2015. Os períodos escolhidos estão de acordo com a necessidade de dados da própria instituição para a sua tomada de decisões. O último exercício é usado para avaliar a situação atual da empresa, enquanto os dois anteriores são usados para comparar e cal- cular as variações nos índices financeiros e contas patrimoniais que houveram para cada uma delas durante esse período. Esses três períodos são suficientes para decidir quanto à acréscimos ou decréscimos no rating de cada empresa.
Para cada ano são disponibilizadas 240 contas patrimoniais, divididas entre contas de ativo, passivo e algumas contas de resultado. As observações são identificadas por um conjunto de quatro variáveis: um código confidencial atribuído pela Serasa, o ano a que pertence os valores associados aquela observação, o ramo de atuação em que a instituição enquadra-se e o ratingatribuído para cada empresa. No total, são 852 empresas distribuídas em 155 ramos de atuação. A Tabela 4 abaixo mostra a quantidade de empresas distribuídas em cada um desses ramos.
Capítulo 5. Base de dados 43
Tabela 4 – Distribuição de empresas por segmentos de indústrias
EMPRESAS NÚMERO DE EMPRESAS
USINA DE AÇÚCAR E
ÁLCOOL 47
IND DE PRODUTOS INTERMEDIÁRIOS QUÍMICOS 32
IND DE PRODUTOS FARMACÊUTICOS 30
ABATE E PREPARAÇÃO DE BOVINOS 28
IND DE ADUBOS E FERTILIZANTES 25
IND DE AUTOPEÇAS E ACESSÓRIOS 22
IND DE LATICÍNIOS 18
IND DE MECÂNICA PESADA 18
ABATE E PREPARAÇÃO DE AVES 16
IND DE CANOS E TUBOS DE FERRO E ACO 15
IND DE CALÇADOS 14
IND DO PAPEL 14
IND DE CIMENTO E CLINQUER 13
IND DE MECÂNICA LEVE 13
BENEFICIAMENTO DE ARROZ 12
IND DE EMBALAGENS PLÁSTICAS 12
IND DE SOJA 12
IND DE CONFECÇÕES EM GERAL 11
IND DE DERIVADOS DE PETROLEO 11
IND DE MÁQUINAS E EQUIPAMENTOS AGRÍCOLAS 11
IND DE PISOS E AZULEJOS 11
METALURGIA – METAIS NÃO FERROSOS FORMA
PRIMÁRIA 11
EDITORA DE LIVROS 10
IND DE ADITIVOS INDLS E ÓLEOS VEGETAIS E
ANIMAIS EM BRUTO 10
IND DE RAÇÕES 10
IND DE RESINAS 10
IND DE TRIGO E DERIVADOS 10
IND DE CABOS 8
IND DE GERADORES 8
IND DE LAMINADOS DE AÇO 8
IND DE PRODUTOS VETERINÁRIOS 8
IND DE REFRIGERANTES 8
IND DE TECIDOS SINTETICOS E
ESPECIAIS 8
IND DE ARTEFATOS DE PAPEL 7
IND DE CAFÉ 7
IND DE EQUIPAMENTOS DE COMUNICAÇÃO 7 IND DE EQUIPAMENTOS DE INFORMÁTICA 7
IND DE LIGAS DE METAIS 7