• Nenhum resultado encontrado

Aplicação da estatística bayesiana ao risco de crédito

N/A
N/A
Protected

Academic year: 2021

Share "Aplicação da estatística bayesiana ao risco de crédito"

Copied!
56
0
0

Texto

(1)

MESTRADO

MATEMÁTICA FINANCEIRA

TRABALHO FINAL DE MESTRADO

RELATÓRIO

APLICAÇÃO DA ESTATÍSTICA BAYESIANA AO

RISCO DE CRÉDITO

ADRIANO DINIS OLIVEIRA

(2)

MESTRADO

MATEMÁTICA FINANCEIRA

TRABALHO FINAL DE MESTRADO

RELATÓRIO

APLICAÇÃO DA ESTATÍSTICA BAYESIANA AO

RISCO DE CRÉDITO

ADRIANO DINIS OLIVEIRA

ORIENTAÇÃO:

NOME: DOUTOR FILIPE CORREIA PACCETTI

NOME: PROFESSOR DOUTOR JOÃO AFONSO BASTOS

(3)

Agradecimentos

Em primeiro lugar gostaria de agradecer `a Deloitte, em especial ao Dr. Filipe Pacetti, pela disponibilidade e apoio que sempre demonstrou para esclarecer todas as minhas d ´uvidas.

Agradec¸o tamb ´em ao meu orientador acad ´emico, Professor Doutor Jo ˜ao Afonso Bastos, pela disponibilidade demonstrada no desenvolvimento deste trabalho.

Por fim, gostaria de agradecer `a minha fam´ılia, pai, m ˜ae, irm ˜ao e irm ˜a, que sempre estiveram ao meu lado. Sem eles seria imposs´ıvel.

(4)

Resumo

O c ´alculo de probabilidade de incumprimento de uma carteira de cr ´edito ´e es-sencial para o c ´alculo dos requisitos de fundos m´ınimos dos bancos. No entanto, existem diversas circunst ˆancias em que a informac¸ ˜ao banc ´aria n ˜ao ´e suficiente, ou fi ´avel, fazendo com que uma an ´alise baseada apenas em dados hist ´oricos n ˜ao seja apropriada.

O objetivo principal deste projeto ´e o de desenvolver e implementar um mo-delo que seja capaz de incorporar a informac¸ ˜ao fornecida por um perito com a informac¸ ˜ao hist ´orica de uma carteira de cr ´edito.

Para atingir o objetivo recorreu-se `a estat´ıstica Bayesiana que permite incor-porar, de forma coerente, as duas fontes de informac¸ ˜ao.

O estudo recai sobre uma carteira de cr ´edito de empresas de um banco por-tugu ˆes.

Os resultados do projeto apontam para que o valor m ´edio da probabilidade de incumprimento da func¸ ˜ao a priori e a posteriori sejam semelhantes, no entanto a func¸ ˜ao a posteriori tem uma menor dispers ˜ao. ´E tamb ´em constatado que existe uma correlac¸ ˜ao temporal positiva apesar de n ˜ao ser muito forte.

Palavras-chave:

Risco de Cr ´edito, Estat´ıstica Bayesiana, Monte Carlo via cadeias de Markov

(5)

Abstract

The calculation of probability of default of a loan portfolio is essential for compu-ting the minimum capital requirements that banks need to keep. However, there are several circumstances in which bank data is scarce or not reliable, making historical data analysis not appropriate.

The main goal of this project is to develop and implement a model able to incorporate information given by an expert and historical data.

To pursue the main goal, we have used Bayesian statistics which allows cohe-rent incorporation of both kinds of information (subjective and objective).

This study analyses a commercial loan portfolio of a portuguese bank.

The results indicate that the expected probability of default given by the ex-pert is similar to the expected probability of default computed using the posteriori function. However, the posteriori function has lower dispersion than the priori. It is also found a weak positive correlation between time periods.

(6)

Conte ´

udo

1 Introduc¸ ˜ao 1

2 Risco de Cr ´edito 5

3 Estat´ıstica Bayesiana 8

3.1 Teorema de Bayes . . . 8

3.2 Func¸ ˜ao a priori . . . 9

3.2.1 Recolha de Informac¸ ˜ao . . . 10

3.3 Monte Carlo via Cadeias de Markov . . . 12

3.3.1 Cadeias de Markov . . . 12

3.3.2 Algoritmo Metropolis-Hastings . . . 16

3.3.3 Algoritmo de Gibbs . . . 19

3.3.4 Algoritmo de Metropolis-Hastings dentro de Gibbs . . . 19

3.3.5 An ´alise de resultados das cadeias de Markov . . . 20

4 Metodologia e Resultados 23 4.1 Dados . . . 23

4.2 Modelo . . . 25

(7)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito vii

4.2.2 Func¸ ˜ao a posteriori . . . 29

4.2.3 Implementac¸ ˜ao e Resultados . . . 30

5 Conclus ˜oes 34 Refer ˆencias Bibliogr ´aficas 39 A Esquema Cl ´assico e Bayesiano 40 B Distribuic¸ ˜ao a priori 41 C Algoritmo M-H dentro de Gibbs 42 D Diagn ´ostico Metropolis-Hastings 43 D.1 Converg ˆencia . . . 43

D.1.1 M ´edias e Teste Geweke . . . 43

D.1.2 Teste Raftery e Lewis . . . 44

(8)

Lista de Tabelas

4.1 Dados da carteira Grandes Empresas . . . 24

4.2 M ´edias das vari ´aveis a posteriori . . . 32

D.1 Teste Geweke . . . 43

(9)

Lista de Figuras

2.1 Func¸ ˜ao densidade de probabilidade da perda . . . 6

4.1 Distribuic¸ ˜ao a priori . . . 28

4.2 Func¸ ˜ao π(p|y) . . . . 32

4.3 Func¸ ˜ao π(τ |y) . . . 33

A.1 Esquema Cl ´assico (Paulino et al. 2003) . . . 40

A.2 Esquema Bayesiano (Paulino et al. 2003) . . . 40

B.1 Desfasamento dos quantis da distribuic¸ ˜ao a priori beta e dos quan-tis do especialista . . . 41

D.1 Evoluc¸ ˜ao da M ´edia da vari ´avel p . . . 43

D.2 Evoluc¸ ˜ao da M ´edia da vari ´avel τ . . . 43

D.3 Correlac¸ ˜ao dos resultados . . . 44

(10)

Lista de Algoritmos

1 Metropolis-Hastings . . . 17

2 Gibbs . . . 19

3 Metropolis-Hastings dentro de Gibbs . . . 20

(11)

Abreviaturas

EAD valor da exposic¸ ˜ao dado incumprimento.

EL perda esperada.

IDE ambiente de desenvolvimento integrado.

IRB m ´etodos dos ratings internos.

LGD perda dado incumprimento.

MCMC Monte Carlo Via cadeias de Markov.

MCSE erro standard de Monte Carlo.

PD probabilidade de incumprimento.

(12)

1. Introduc¸ ˜ao

Nas ´ultimas duas d ´ecadas a gest ˜ao de risco tem vindo a ser alvo de uma cres-cente preocupac¸ ˜ao, tanto por parte dos bancos como por parte da supervis ˜ao.

Em 1988, ´e apresentado o primeiro acordo de Basileia, que tinha como ob-jetivos a harmonizac¸ ˜ao global da supervis ˜ao banc ´aria em diversos pa´ıses bem como fortalecer a estabilidade e solidez do sistema banc ´ario. O acordo focava-se, principalmente, no risco de cr ´edito e tinha como principal preocupac¸ ˜ao ga-rantir que o r ´acio entre o capital eleg´ıvel e os ativos ponderados pelo risco fosse superior ou igual a 8% .

No entanto, devido `a metodologia simples de mensurac¸ ˜ao do risco descrita no acordo e `a inovac¸ ˜ao do sistema financeiro e da tecnol ´ogica, que ocorreu prin-cipalmente ao longo da d ´ecada de 90, tornou-se necess ´ario atualizar o acordo de Basileia I. ´E assim que surge, em 2004, a vers ˜ao final do Basileia II e em 2010 o acordo de Basileia III.

O acordo de Basileia III, `a semelhanc¸a do segundo acordo, baseia-se em tr ˆes pilares: Pilar I - Requisitos m´ınimos de capital; Pilar II - Processo de Supervis ˜ao; Pilar III - Disciplina de Mercado. O estudo realizado centra-se no Pilar I, mais precisamente na ´area de risco de cr ´edito, sendo as restantes ´areas o risco de mercado e operacional.

O acordo prop ˜oem dois tipos de modalidades de mensurac¸ ˜ao do risco de cr ´edito: A abordagem ”Padr ˜ao” e a abordagem de m ´etodos dos ratings internos (IRB) que por sua vez se subdivide em duas: ”Foundation” e ”Advanced ”.

(13)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 2

A abordagem Padr ˜ao est ´a sobretudo dependente das cotac¸ ˜oes de rating e de ponderadores de risco definidos pelo Comit ´e de Basileia.

A abordagem IRB pretende promover o desenvolvimento, pelos bancos, de metodologias de mensurac¸ ˜ao do risco. No entanto, estas est ˜ao sujeitas `a validac¸ ˜ao do regulador.

Desde que foi introduzida, a abordagem IRB que as carteiras de cr ´edito com um hist ´orico de poucos incumprimentos t ˆem sido alvo de estudo devido `a difi-culdade de calcular a probabilidade de incumprimento (PD). De facto, na pro-blem ´atica da mensurac¸ ˜ao do risco de carteiras com poucos incumprimentos, le-vou mesmo `a divulgac¸ ˜ao de uma carta explicativa pelo Comit ´e de Basileia de Supervis ˜ao Banc ´aria, em resposta `as preocupac¸ ˜oes levantadas pelos bancos.

A principal preocupac¸ ˜ao demonstrada era com a falta de dados de incumpri-mento, o que levava a que tais carteiras fossem exclu´ıdos da an ´alise avanc¸ada (Basel Committe on Banking Supervision 2005b).

Apesar de a carta n ˜ao sugerir especificamente a abordagem Bayesiana, prop ˜oe que se utilizem outras fontes de informac¸ ˜ao. No entanto, a abordagem Bayesi-ana parece ser a melhor opc¸ ˜ao para resolver o problema, uma vez que permite a inserc¸ ˜ao de opini ˜oes de peritos no c ´alculo das probabilidades de incumprimento (Kiefer 2011).

O objetivo do est ´agio, realizado na Deloitte Consultores, ´e o de desenvolver e implementar uma metodologia de c ´alculo das probabilidades de incumprimento para carteiras que tenham registado poucos incumprimentos.

(14)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 3

de informac¸ ˜ao de dados, uma vez que tamb ´em pode ser utilizada quando: o custo de recolha de informac¸ ˜ao ´e demasiado elevado ou quando a qualidade dos dados ´e question ´avel (Jacobs & Kiefer 2010).

O problema de investigac¸ ˜ao proposto reside no c ´alculo de probabilidades de incumprimento atrav ´es da combinac¸ ˜ao da informac¸ ˜ao fornecida por dados hist ´oricos com a informac¸ ˜ao de um perito.

O estudo realizado tem por base dados de uma carteira de empr ´estimos a empresas com um rating elevado de um banco portugu ˆes, que ir ´a ser mencio-nado por Banco A. O nome do perito tamb ´em ser ´a omitido, sendo referido como Perito A.

Tendo por base o problema de investigac¸ ˜ao, neste trabalho ir ˜ao ser estuda-das metodologias de eliciac¸ ˜ao da opini ˜ao de peritos, algo a que n ˜ao tem sido dado suficiente atenc¸ ˜ao na literatura (Jacobs & Kiefer 2010). A eliciac¸ ˜ao ´e um processo pelo qual se formula uma func¸ ˜ao de distribuic¸ ˜ao que represente o co-nhecimento e expectativas de uma pessoa sobre um dado evento aleat ´orio. Os processos de eliciac¸ ˜ao s ˜ao bastante frequentes em projetos que envolvam a es-tat´ıstica Baysesiana para criar as func¸ ˜oes de distribuic¸ ˜ao a priori (Garthwaite et al. 2005).

O relat ´orio est ´a estruturado da seguinte forma. No cap´ıtulo 2 ´e feita uma introduc¸ ˜ao ao risco de cr ´edito. No capitulo 3 apresenta-se a estat´ıstica Bayesi-ana, metodologias de eliciac¸ ˜ao e, fundamentalmente, Monte Carlo via cadeias de Markov. De seguida, ´e descrita a metodologia utilizada para o c ´alculo da probabi-lidade de incumprimento e a sua implementac¸ ˜ao, bem como os dados utilizados

(15)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 4

no estudo. Neste mesmo cap´ıtulo s ˜ao tamb ´em apresentados os resultados. Por fim, ser ˜ao apresentadas as conclus ˜oes do relat ´orio.

(16)

2. Risco de Cr ´edito

Como seria de esperar, o cr ´edito representa grande parte dos ativos de um banco. Em 2013, o cr ´edito representava aproximadamente 68% dos ativos do sistema banc ´ario portugu ˆes, valor que tem vindo a decrescer desde 2010 (Banco de Portugal 2014).

A gest ˜ao do risco de cr ´edito ´e inerente `a atividade banc ´aria e tem o objetivo de gerir a possibilidade de o devedor n ˜ao cumprir com as obrigac¸ ˜oes estipuladas no contrato, maximizando a taxa de retorno e mantendo uma exposic¸ ˜ao ao risco de cr ´edito dentro de par ˆametros razo ´aveis (Basel Committe on Banking Supervision 2000).

Um aspeto essencial na an ´alise de risco de cr ´edito ´e a definic¸ ˜ao de incum-primento. Segundo Basel Committe on Banking Supervision (2006), o incumpri-mento ocorre quando uma das duas situac¸ ˜oes seguintes se verifica:

1. existe uma atraso no pagamento superior a 90 dias, ou

2. o banco reconhece que o devedor n ˜ao tem qualquer intenc¸ ˜ao de cumprir com as suas obrigac¸ ˜oes.

´

E ent ˜ao de extrema import ˆancia que os bancos utilizem e desenvolvam me-todologias de mensurac¸ ˜ao de risco de cr ´edito adequadas a cada devedor ou a cada carteira. Na atividade banc ´aria ´e sempre incerto o volume das perdas dos bancos, no entanto espera-se que os bancos sejam capazes de calcular uma previs ˜ao anual da perda esperada (EL).Tais perdas devem ser

(17)

provisiona-Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 6

das pelos bancos. No entanto, para al ´em da perda esperada, existe tamb ´em a perda inesperada (UL) que se espera que n ˜ao acontec¸a todos os anos, mas quando acontece tem um grande impacto no banco. Tendo como objetivo prote-ger os bancos de perdas que possam por em risco a sua exist ˆencia surge, assim, legislac¸ ˜ao com base nos acordos de Basileia. ´E imposto o c ´alculo de requisitos de capital que sirva para cobrir essas perdas inesperadas.

Figura 2.1: Func¸ ˜ao densidade de probabilidade da perda

O risco de cr ´edito foi alvo de grande preocupac¸ ˜ao no acordo de Basileia II, uma vez que a metodologia proposta por Basileia I, em 2004, j ´a se encontrava ultrapassada.

O acordo de Basileia II e III n ˜ao diferem nas metodologias apresentadas para o risco de cr ´edito. A metodologia Standard ´e baseada em notac¸ ˜oes de rating atribu´ıdas pelas ag ˆencias. A diferenciac¸ ˜ao entre a ponderac¸ ˜ao de riso a atribuir aos cr ´editos depende da ´area de atuac¸ ˜ao do devedor e do tipo de exposic¸ ˜ao.

(18)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 7

A abordagem IRB promove o desenvolvimento por parte dos bancos de meto-dologias de mensurac¸ ˜ao do risco e divide-se em duas: Foundation e Advanced.

A abordagem foca-se em tr ˆes fatores:

1. A probabilidade de incumprimento de um dado devedor (PD);

2. A perda ocorrida dado que existe incumprimento (perda dado incumpri-mento (LGD));

3. O valor da exposic¸ ˜ao dado incumprimento (EAD).

Na abordagem Foundation os bancos podem, havendo aprovac¸ ˜ao do super-visor nacional, calcular a PD enquanto que os outros par ˆametros s ˜ao fixados externamente. Na abordagem Advanced os bancos, obtendo aprovac¸ ˜ao, podem calcular para al ´em da PD, tamb ´em a LGD.

´

E natural que os bancos optem por desenvolver metodologias internas, uma vez que, normalmente, estas levam a que os requisitos de capital sejam menos elevados em relac¸ ˜ao `a abordagem Standard. Tal deve-se `a exist ˆencia de um maior crit ´erio no c ´alculo (Ant ˜ao & Lacerda 2008).

(19)

3. Estat´ıstica Bayesiana

Em estat´ıstica existem duas grandes filosofias. A mais conhecida ´e a abordagem frequentista. Esta abordagem interpreta o conceito de probabilidade atrav ´es da frequ ˆencia relativa de um acontecimento, quando a amostra tende para infinito, ou o simples r ´acio entre os casos favor ´aveis e os casos poss´ıveis. Esta abor-dagem tem como objetivo utilizar a informac¸ ˜ao recolhida atrav ´es de experi ˆencias passadas para determinar um, ou v ´arios, par ˆametros desconhecidos, que s ˜ao tidos como constantes.

A abordagem Bayesiana toma como vari ´aveis aleat ´orias os par ˆametros a es-timar, uma vez que se desconhece seu valor. Assim, o conceito de probabili-dade ´e interpretado como grau de credibiliprobabili-dade. Passa a ser necess ´ario definir uma distribuic¸ ˜ao para o par ˆametro (func¸ ˜ao a priori) uma vez que o par ˆametro ´e incerto e, segundo a estat´ıstica Bayesiana, toda a incerteza deve ser quantifi-cada em termos de probabilidades. A definic¸ ˜ao da func¸ ˜ao a priori introduz assim uma componente subjetiva ao problema. No anexo A est ´a representada uma esquema l ´ogico que representa as diferenc¸as entre as duas abordagens.

3.1

Teorema de Bayes

O teorema de Bayes assume um papel fundamental uma vez que ´e a partir dele que se combina a func¸ ˜ao de verosimilhanc¸a, que cont ´em a informac¸ ˜ao da amos-tra, com a informac¸ ˜ao a priori do par ˆametro que ´e agora uma vari ´avel aleat ´oria.

(20)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 9

Teorema de Bayes 1. Sendo x uma realizac¸ ˜ao de X, a distribuic¸ ˜ao a posteriori,

com θ ∈ Θ, ´e dada por:

f (θ|x) = R f (x|θ) f (θ)

Θf (x|θ) f (θ)dθ

(3.1)

Observando o numerador constata-se que existe uma junc¸ ˜ao entre a informac¸ ˜ao fornecida pela func¸ ˜ao de verosimilhanc¸a e a func¸ ˜ao a priori. Nota-se tamb ´em que o denominador faz parte da constante de normalizac¸ ˜ao, ficando assim o nume-rador com toda a informac¸ ˜ao relevante sobre o par ˆametro a estimar.

3.2

Func¸ ˜ao a priori

A escolha da func¸ ˜ao a priori ´e a principal forc¸a e fraqueza da estat´ıstica Bayesi-ana. Para os Bayesianos ela permite introduzir informac¸ ˜ao que pode ser sub-jetiva, mas que se justifica pelo problema em quest ˜ao. Para os estat´ısticos cl ´assicos essa fonte de subjetividade ´e o problema, uma vez que introduz informac¸ ˜ao que n ˜ao pode ser replicada.

Dependendo do problema que se pretende estudar, a func¸ ˜ao a priori pode ser definida/representada como n ˜ao-informativa ou informativa. A primeira situac¸ ˜ao surge quando o nosso conhecimento sobre o problema ´e demasiado limitado e n ˜ao ´e poss´ıvel fazer qualquer tipo de suposic¸ ˜ao sobre o par ˆametro a estimar. Na segunda abordagem ´e normalmente utilizado conhecimento de dados hist ´oricos, de peritos ou uma combinac¸ ˜ao dos dois para fazer representar o conhecimento atrav ´es de uma func¸ ˜ao de densidade.

(21)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 10

3.2.1

Recolha de Informac¸ ˜ao

O processo de eliciac¸ ˜ao ´e fundamental para a utilizac¸ ˜ao de estat´ıstica Bayesiana e acrescenta grande valor aos projetos estat´ısticos, pois aproxima os trabalhos estat´ısticos dos seus clientes, incorporando a informac¸ ˜ao que estes possuem sobre o seu neg ´ocio, ´area de estudo ou problema especifico (Garthwaite et al. 2005).

Apesar de extremamente ´util, a opini ˜ao de peritos pode ser bastante dif´ıcil de obter, devido `a complexidade envolvida e demora que um bom processo de eliciac¸ ˜ao requer.

Segundo Garthwaite et al. (2005) o processo de eliciac¸ ˜ao deve ser composto por 4 fases:

1. Definic¸ ˜ao dos aspetos do problema que devem ser objeto de elicac¸ ˜ao; es-colher o perito; treinar o perito para o processo, este passo ´e crucial caso o perito n ˜ao esteja familiarizado com probabilidades.

2. Elaborac¸ ˜ao do m ´etodo de eliciac¸ ˜ao, ou seja define-se que perguntas ser ˜ao feitas ,e de que forma, para obter informac¸ ˜ao que permita a construc¸ ˜ao de uma func¸ ˜ao de distribuic¸ ˜ao.

3. Representac¸ ˜ao da informac¸ ˜ao atrav ´es de uma distribuic¸ ˜ao de probabili-dade.

4. Avaliac¸ ˜ao por parte de perito da eliciac¸ ˜ao. O processo t ˆem de ser interativo, ou seja, ´e necess ´ario confirmar que a func¸ ˜ao representa bem as opini ˜oes do perito, caso contr ´ario ser ´a necess ´ario voltar ao segundo passo.

(22)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 11

Um dos principais obst ´aculos para que a fase dois do processo seja bem sucedida s ˜ao as heur´ısticas mentais que os seres humanos utilizam quando s ˜ao questionados sobre probabilidades de um evento. Por isso, este tem sido um campo que tamb ´em tem sido investigado por psic ´ologos.

Para realizar a terceira fase, existem diversos m ´etodos e a escolha depende do problema que se est ´a a estudar e do perito.

Um dos primeiros fatores a ter em considerac¸ ˜ao ´e se a recolha de informac¸ ˜ao ´e feita com um ou mais peritos. O caso de v ´arios peritos n ˜ao vai ser abordado, uma vez que neste trabalho s ´o ser ´a utilizado um . No entanto, ´e necess ´ario frisar que t ´ecnicas de eliciac¸ ˜ao com o recurso a v ´arios peritos, como o m ´etodo cl ´assico de Cooke (1991), t ˆem vindo a ser estudas, principalmente na ´area de risco ope-racional, onde o regulador exige que se utilize informac¸ ˜ao de especialistas para o c ´alculo dos requisitos de capital. Tal deve-se ao facto de nessa ´area muito poucos, ou mesmo nenhuns, dados hist ´oricos existirem (Bakker 2004).

Recorrendo a um perito existem, ainda assim, v ´arias t ´ecnicas que podem ser utilizadas. Neste trabalho v ˜ao ser referidas apenas duas. Na primeira assume-se que o conhecimento do perito pode ser representado por uma distribuic¸ ˜ao de pro-babilidades espec´ıfica. Kiefer (2009) usa a func¸ ˜ao de distribuic¸ ˜ao beta uma vez que esta est ´a suportada entre 0 e 1, num trabalho ainda muito preliminar sobre a aplicac¸ ˜ao Bayesiana ao risco de cr ´edito. Nesse caso o perito ´e inquirido so-bre quantis que o autor considerou importantes. O mesmo autor, posteriormente (Jacobs & Kiefer 2010), utiliza uma abordagem diferente utilizando um conceito da f´ısica, a Entropia. Neste artigo o autor questiona o perito sobre os quantis da

(23)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 12

distribuic¸ ˜ao da probabilidade de incumprimento. No entanto, uma vez que n ˜ao quer introduzir suposic¸ ˜oes sobre a forma da func¸ ˜ao j ´a definida, decide maximi-zar a entropia, tendo como restric¸ ˜oes os quantis que recebeu. De seguida, para alisar o resultado utiliza o kernel de Epanechnikov.

3.3

Monte Carlo via Cadeias de Markov

Um das desvantagens, iniciais, da abordagem Bayesiana perante a Cl ´assica ´e o facto de, na maior parte dos problemas de interesse, o c ´alculo da func¸ ˜ao a posteriori de forma anal´ıtica e num ´erica n ˜ao ser uma opc¸ ˜ao, principalmente em casos multi-dimensionais. No entanto, a partir da d ´ecada de 90 , devido aos avanc¸os computacionais, passou a ser mais f ´acil e r ´apido o c ´alculo da func¸ ˜ao a posteriori atrav ´es de m ´etodos de simulac¸ ˜ao como Monte Carlo e Monte Carlo Via cadeias de Markov (MCMC). ´E sobre o ´ultimo m ´etodo que vai recair a an ´alise nesta secc¸ ˜ao. Ir ´a ser apresentada uma breve introduc¸ ˜ao `as cadeias de Markov e a m ´etodos de Monte Carlo, pois uma abordagem mais profunda iria consumir muito espac¸o. O leitor interessado poder ´a ler sobre estes assuntos em: Tierney (1994), Robert & Casella (2005) e Gamerman & Lopes (2006).

3.3.1

Cadeias de Markov

Nesta secc¸ ˜ao ser ˜ao apresentados os conceitos fundamentais sobre cadeias de Markov necess ´arios para se compreender os algoritmos de simulac¸ ˜ao que ser ˜ao expostos.

(24)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 13

Seja X um conjunto, F uma σ- ´algebra em X e π uma distribuic¸ ˜ao de probabi-lidade definida em (X, F).

Uma cadeia de Markov {θn} = {θn, n = 0, 1, ...}em X diz-se homog ´enea se a

sua func¸ ˜ao de transic¸ ˜ao P tiver as seguintes caracter´ısticas:

• Para qualquer conjunto fixo A ∈ F a func¸ ˜ao P (., A) ´e mensur ´avel

• Para qualquer x ∈ X , fixo , P (x, .) ´e uma medida de probabilidade em ( X, F )

• para todo o n ≥ 0

P (θn+1 ∈ A|θn = x) = P (x, A)

para todo x ∈ X e A ∈ F.

A func¸ ˜ao transic¸ ˜ao ao fim de i passos ´e dada pela seguinte formula:

P (θi ∈ A|θ0 = x) = Pi(x, A) (3.2)

O problema que a construc¸ ˜ao de algoritmos de MCMC induz ´e o de criar valo-res correlacionados. Isso levanta o problema do c ´alculo do valor esperado, uma vez que a lei forte dos grandes n ´umeros s ´o se aplica a valores independentes. A resposta a este problema ser ´a dada no fim da secc¸ ˜ao, mas primeiro ´e necess ´ario apresentar algumas definic¸ ˜oes.

Definic¸ ˜ao 1. A func¸ ˜ao π ´e estacion ´aria tendo em conta a func¸ ˜ao de transic¸ ˜ao P

se:

πP (A) = Z

(25)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 14

Em MCMC ´e constru´ıda uma cadeia estacion ´aria, no entanto ´e necess ´ario garantir que ela ´e ´unica, caso contr ´ario n ˜ao tem utilidade.

Definic¸ ˜ao 2. A distribuic¸ ˜ao π ´e revers´ıvel tendo em conta a func¸ ˜ao de transic¸ ˜ao

P se:

π(dx)P (x, dy) = P (y, dx)π(dx)∀x, y ∈ X (3.4)

A reversibilidade ´e bastante importante uma vez que se uma cadeia ´e re-vers´ıvel ent ˜ao ´e estacion ´aria. ´E atrav ´es da reversibilidade que se prova que o algoritmo Metropolis-Hastings gera uma distribuic¸ ˜ao estacion ´aria.

Definic¸ ˜ao 3. Uma cadeia de Markov ´e π-irredut´ıvel para um distribuic¸ ˜ao π em X

se π(A) > 0, com A ⊂ X, implica que:

P (inf{n ≥ 1 : θn ∈ A} < ∞|θ0 = x) > 0 (3.5)

para todo x ∈ X

Ou seja, uma cadeia ´e irredut´ıvel se partindo de qualquer estado se consegue chegar a qualquer outro estado.

Definic¸ ˜ao 4. Uma cadeia de Markov θn ´e π-irredut´ıvel com distribuic¸ ˜ao

esta-cion ´aria π ´e recorrente se para cada A ⊂ X com π(A) > 0 se verifica que:

P (θn∈ Ai.o|θ0 = x) > 0para todo o x,

P (θn∈ Ai.o|θ0 = x) = 1para quase todo o x.

(3.6)

(26)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 15

Teorema 1. Supondo que a cadeia de Markov θn ´e irredut´ıvel e tem uma distribuic¸ ˜ao

estacion ´aria π, ent ˜ao a cadeia ´e π-irredut´ıvel, π ´e a ´unica distribuic¸ ˜ao estacion ´aria da cadeia e a cadeia ´e recorrente positiva.

J ´a estamos em condic¸ ˜oes de definir quando a lei forte dos grandes n ´umeros se aplica `as cadeias de Markov.

Teorema 2. Supondo que (θn) ´e uma cadeia de Markov irredut´ıvel com uma

func¸ ˜ao de transic¸ ˜ao P e tem uma distribuic¸ ˜ao estacion ´aria π. Sendo1:

Pn(x, A) = 1 n + 1 n X i=0 Pi(x, A) (3.7) ∀ x ∈ A ⊂ X. Ent ˜ao kPn(x, .) − π(.)k → 0 (3.8)

para π em quase todo x.

Teorema 3. Supondo que θn ´e uma cadeia de Markov irredut´ıvel com uma func¸ ˜ao

de transic¸ ˜ao K, distribuic¸ ˜ao estacion ´aria π e seja f uma func¸ ˜ao real integr ´avel. Ent ˜ao: P " 1 N + 1 N X n=0 f (θn) −−−→ N →∞ Z f (x)π(dx)|θ0 = x # = 1 (3.9)

para quase todos os valores iniciais x.

Os dois teoremas acima mostram que a proporc¸ ˜ao observada e esperada do tempo passado no conjunto A converge para π(A).

Uma func¸ ˜ao de transic¸ ˜ao diz-se peri ´odica se existir um d ≥ 2 e uma sequ ˆencia {E0, ..., Ed−1} composta por conjuntos n ˜ao vazios e disjuntos em F tal que, para

(27)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 16

todo i = 0, ..., d − 1 e para todo x ∈ Ei,

P (x, Ei = 1) para j = i + 1(mod d) (3.10)

como d = 1 a func¸ ˜ao de transic¸ ˜ao diz-se aperi ´odica (Tierney 1994).

O resultado do teorema 2 pode ser fortalecido caso se considere uma cadeia aperi ´odica.

Teorema 4. Supondo que θn ´e uma cadeia de Markov irredut´ıvel, aperi ´odica com

uma func¸ ˜ao de transic¸ ˜ao K e com uma distribuic¸ ˜ao estacion ´aria π. Ent ˜ao

kPn(x, .) − π(.)k → 0 (3.11)

para π quase todo x

Com esta pequena introduc¸ ˜ao `as definic¸ ˜oes e teoremas aplicados a cadeias de Markov tem-se agora condic¸ ˜oes para a expor os algoritmos de simulac¸ ˜ao que utilizam cadeias de Markov.

3.3.2

Algoritmo Metropolis-Hastings

O algoritmo Metropolis-Hastings faz com que ao gerar n ´umeros pseudo-aleat ´orios da distribuic¸ ˜ao q(.|.), normalmente f ´acil de simular, se corrijam os valores de forma a que estes se aproximem da distribuic¸ ˜ao objetivo π . Ou seja, j ´a ´e sa-bido qual ´e a distribuic¸ ˜ao estacion ´aria, assim o problema reside em encontrar a func¸ ˜ao de transic¸ ˜ao apropriada.

(28)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 17

A ideia base dos algoritmos de cadeias de Markov ´e a de, atrav ´es de uma func¸ ˜ao de transic¸ ˜ao P (x, .) gerar uma cadeia que tenha como distribuic¸ ˜ao esta-cionaria a func¸ ˜ao que se quer conhecer π (Robert et al. 2010).

O algoritmo tem a seguinte forma:

Algoritmo 1 Metropolis-Hastings

1: Escolher a func¸ ˜ao q(.|.)

2: Escolher θ1

3: para t ← 2 at ´e n fac¸a

4: Simular Y ∼ q(y|θt−1)e U ∼ U[0,1]

5: Calcular α(θt−1, Y )= min{q(Y |θt−1)π(θt−1)q(θt−1|Y )π(Y ) , 1}

6: se U ≤ α(θt−1, Y )ent ˜ao 7: θt= Y 8: sen ˜ao 9: θt= θt−1 10: fim se 11: fim para Aqui α(θt−1, Y )= min{ q(θt−1|Y )π(Y )

q(Y |θt−1)π(θt−1), 1}representa a probabilidade de aceitac¸ ˜ao

do valor proposto. A principal preocupac¸ ˜ao a ter com o algoritmo ´e que ele res-peite as restric¸ ˜oes necess ´arias para que possa ser usada a lei Forte dos Gran-des N ´umeros. Para tal ´e necess ´ario que se consiga provar que atrav ´es da func¸ ˜ao proposta se gera uma func¸ ˜ao estacion ´aria. Neste ponto entra a condic¸ ˜ao de re-versibilidade que ´e muito ´util para provar a estacionariedade. A prova pode ser encontrada em Geyer (2005).

(29)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 18

Outra propriedade importante ´e a irredutibilidade e aperiodicidade da cadeia. Estas podem ser satisfeitas caso a func¸ ˜ao q consiga gerar o espac¸o da func¸ ˜ao que se quer reproduzir. Ou seja, tem que ter o mesmo suporte.

Por fim, ´e tamb ´em necess ´ario que se conhec¸a o r ´acio q(y|x)π(y) a menos de uma constante.

O algoritmo Metropolis ´e um caso particular muito importante. Neste algo-ritmo utiliza-se uma func¸ ˜ao q(y|x) que ´e sim ´etrica.Essa func¸ ˜ao proposta simpli-fica a probabilidade de aceitac¸ ˜ao, que passa a ser:

α(θt−1, Y ) = min{

π(Y ) π(θt−1)

, 1} (3.12)

A proposta normalmente utilizada ´e y = x + e em que e tem uma distribuic¸ ˜ao normal de m ´edia 0 e vari ˆancia σ2. A escolha da vari ˆancia tem implicac¸ ˜oes na

taxa de aceitac¸ ˜ao.

Est ´a demonstrado por Tierney (1994) que a func¸ ˜ao de transic¸ ˜ao do algoritmo ´e irredut´ıvel e Harris recorrente, logo gera uma cadeia estacion ´aria ´unica π.

Outro caso importante encontra-se a proposta ´e independente do valor ante-rior da cadeia. Esse tipo de algoritmos pode ser muito ´util na estat´ıstica Bayesi-ana caso a func¸ ˜ao a priori se assemelhe `a distribuic¸ ˜ao que se quer inferir (Ga-merman & Lopes 2006).

(30)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 19

3.3.3

Algoritmo de Gibbs

O algoritmo de Gibbs permite simular distribuic¸ ˜oes multivariadas e ´e um caso especial do algoritmo Metropolis-Hastings com uma probabilidade de aceitac¸ ˜ao igual a 1. O algoritmo gera uma cadeia de Markov atrav ´es das distribuic¸ ˜oes con-dicionais completas (”full conditionals”) das vari ´aveis. Assim, ´e requerido, n ˜ao s ´o, que se conhec¸am as distribuic¸ ˜oes condicionais completas, mas que tamb ´em seja poss´ıvel gerar n ´umeros pseudo-aleat ´orio dessas mesmas distribuic¸ ˜oes (Robert et al. 2010).

Em baixo est ´a representado o algoritmo:

Algoritmo 2 Gibbs

1: Escolher (θ1

1, ..., θ1J)

2: para t ← 2 at ´e n fac¸a

3: Simular θ1 t ∼ p1(θt1|θ2t−1, ..., θJt−1) 4: Simular θ2 t ∼ p2(θt2|θ1t, θ3t−1, ..., θJt−1) 5: ... 6: Simular θJ t ∼ pJ(θJt|θt1, ..., θ J −1 t ) 7: fim para

3.3.4

Algoritmo de Metropolis-Hastings dentro de Gibbs

Este algoritmo ´e apenas a inserc¸ ˜ao do algoritmo de Metropolis-Hastings den-tro de cada passo de Gibbs. O algoritmo revela-se de grande utilidade quando ´e dif´ıcil simular as distribuic¸ ˜oes condicionais completas (Gamerman & Lopes 2006).

(31)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 20

Algoritmo 3 Metropolis-Hastings dentro de Gibbs

1: Escolher (θ1

1, ..., θ1J)

2: para t ← 2 at ´e n fac¸a

3: para j ← 1 at ´e J fac¸a

4: Simular Y ∼ qj(y|θjt−1)e U ∼ U[0,1]

5: Calcular α(θjt−1, Y )= min{qj(Y |θt−1qj(θt−1|Y )π(Y |θ−j)π(θ1 )

t−1|θ−j)} 6: se U ≤ α(θjt−1, Y )ent ˜ao 7: θjt = Y 8: sen ˜ao 9: θjt = θt−1 10: fim se 11: fim para 12: fim para θ−j = (θt1, ..., θtj−1, θ j+1 t−1, ..., θt−1J )

Este m ´etodo ´e bastante geral e ´util, sem impor mais restric¸ ˜oes para al ´em das impostas pelos algoritmos anteriores (Paulino et al. 2003).

Uma an ´alise mais aprofundada sobre este tipo de algoritmos ´e feita por Chan & Geyer (1994).

3.3.5

An ´alise de resultados das cadeias de Markov

A construc¸ ˜ao do algoritmo de MCMC ´e apenas a primeira parte da soluc¸ ˜ao de um problema. De seguida, ´e necess ´ario analisar de forma cuidada os resultados.

´

(32)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 21

1. Se o resultado converge para distribuic¸ ˜ao estacion ´aria,

2. Se a cadeia percorre todo o espac¸o da func¸ ˜ao que se quer estimar,

3. Ao contr ´ario dos m ´etodos de Monte Carlo, os algoritmos de MCMC criam amostras correlacionadas.

Para a an ´alise do diagn ´ostico da converg ˆencia pode-se utilizar o m ´etodo de Geweke et al. (1991) que tem como base o teste da diferenc¸a das m ´edias. O m ´etodo utiliza os primeiros 10% dos valores da cadeia e os ´ultimos 50%. O que se pretende investigar ´e se as duas partes da cadeia adv ˆem da mesma distribuic¸ ˜ao (Hip ´otese nula). A estat´ıstica de Geweke ´e um Z-score normalizado em que os desvios padr ˜ao s ˜ao ajustados para a auto-correlac¸ ˜ao.

Raftery & Lewis (1996) apresentaram um m ´etodo para encontrar o n ´umero de valores a serem descartados do in´ıcio da cadeia (”burn-in” ). Este m ´etodo consiste em estimar o quantil q com um erro de +/ − r com uma probabilidade de pro. O q, r e pro, normalmente utilizados s ˜ao, .025, .005 e .95 respetivamente. Quanto ao segundo ponto, nunca se pode garantir que a simulac¸ ˜ao visita todo o espac¸o, no entanto existem t ´ecnicas para minimizar esse erro.

Uma regra utilizada na literatura ´e a escolha de distribuic¸ ˜oes propostas que gerem uma taxa de aceitac¸ ˜ao perto de 25% para problemas com muitos par ˆametros a estimar e 50% para problemas com um ou dois par ˆametros Robert et al. (2010).

Por fim, pode-se optar pelo m ´etodo ”batch means”utilizado por Geyer (1992), para tratar a correlac¸ ˜ao. O m ´etodo consiste em separar a amostra em b amos-tras e fazer a m ´edia das mesmas e utilizar o erro standard de Monte Carlo (MCSE) como crit ´erio de paragem. Ou seja, quanto mais elevado o MCSE

(33)

me-Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 22

nos confi ´avel ´e o resultado. Sendo N o n ´umero de simulac¸ ˜oes e b a quantidade de n ´umeros em cada ”batch”:

b µb,k= 1 b bk+b X i=bk+1 g(Xi) (3.13) em que k = 1, ..., N/b.

A escolha de b adv ´em de uma an ´alise `a correlac¸ ˜ao da cadeia. Escolhe-se ent ˜ao um valor b que fac¸a com que n ˜ao exista correlac¸ ˜ao entre diferentesµbb,k. A

vantagem deste m ´etodo ´e a capacidade de, utilizando µb,k, se poder aplicar o t −

testee obter um intervalo de confianc¸a da m ´edia. Como cada bµb,k ´e aproximada

por uma distribuic¸ ˜ao normal de m ´edia µ e vari ˆancia σ2/b. A a vari ˆancia emp´ırica

´e: σ2 = b N N/b X k=1 (µb,k−µbN) 2 (3.14) O MCSE ´e σ N.

(34)

4. Metodologia e Resultados

Neste cap´ıtulo ser ˜ao analisados, em primeiro lugar, os dados. De seguida, ´e necess ´ario definir um modelo econ ´omico a utilizar para representar a func¸ ˜ao de verosimilhanc¸a. Na terceira fase constr ´oi-se a distribuic¸ ˜ao a priori, esco-lhendo o especialista e definindo, neste caso, os quantis a eliciar. Tendo a informac¸ ˜ao do perito representada passa-se para a construc¸ ˜ao da func¸ ˜ao a pos-teriori atrav ´es de cadeias de Markov. A implementac¸ ˜ao do algoritmo foi feita atrav ´es da combinac¸ ˜ao das linguagens R e C++. Por fim, ´e realizada uma an ´alise dos resultados da simulac¸ ˜ao utilizando as metodologias descritas em 3.3.5.

4.1

Dados

Neste estudo foi utilizada uma carteira que cont ´em grandes empresas portugue-sas. Em baixo ´e feita a descric¸ ˜ao dos dados:

• Per´ıodo Hist ´orico: Setembro de 2010 at ´e Setembro de 2013. Ou seja dados de 4 anos (por conveni ˆencia utiliza-se o m ˆes de setembro como final).

• A carteira ´e composta por 2032 empresas.

• Os empr ´estimos s ˜ao classificados atrav ´es de uma escala de rating de 1 a 100, sendo 1 o rating mais baixo e 100 o mais elevado (o que apresenta menos risco).

(35)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 24

que 1 representa incumprimento e 0 uma situac¸ ˜ao regular.

Os dados possuem alguns problemas evidenciados atrav ´es de uma an ´alise de-talhada que justificam a escolha de uma abordagem Bayesiana. Por exemplo existem empr ´estimos com falta de acompanhamento da sua situac¸ ˜ao (regular ou em incumprimento). Ou seja, existem meses em que n ˜ao h ´a qualquer tipo de informac¸ ˜ao sobre se o cr ´edito esteve regular ou n ˜ao. Por outro lado, o hist ´orico da carteira ´e demasiado curto, apenas 4 anos.

Assim, apesar de os dados hist ´oricos continuarem ser importantes justifica-se a introduc¸ ˜ao de informac¸ ˜ao de um perito na an ´alise do risco da carteira.

Na tabela abaixo pode-se observar algumas caracter´ısticas da carteira. Rating ≤ 50 >50

NoTotal 1319 713

Contratos com 46 meses 911 477 Tabela 4.1: Dados da carteira Grandes Empresas

O estudo ir ´a focar-se nas grandes empresas com um rating superior a 50, uma vez que a abordagem Bayesiana ´e mais relevante precisamente para car-teiras com poucos dados de incumprimento. Assim, a carteira final tem 477 empresas.

Os dados sobre o incumprimento s ˜ao os seguintes: em 2010 n ˜ao existiram contratos em incumprimento; em 2011 existiu 1; em 2012 houve 10; em 2013 observaram-se 18.

(36)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 25

4.2

Modelo

O modelo escolhido para representar a informac¸ ˜ao de dados hist ´oricos ´e uma extens ˜ao do modelo estrutural de um ´unico fator de Vasicek.

A extens ˜ao ao modelo original de Vasicek ´e feita atrav ´es da introduc¸ ˜ao de uma an ´alise a v ´arios per´ıodos de tempo que est ˜ao correlacionados atrav ´es do risco sist ´emico.

O modelo pode ser visto em Lamb & Perraudin (2008) e Jacobs & Kiefer (2010), com poucas diferenc¸as. A ´unica diferenc¸a est ´a na representac¸ ˜ao da correlac¸ ˜ao temporal. Apesar de o modelo que ir ´a ser utilizado ser o de Lamb & Perraudin (2008), para uma melhor compreens ˜ao da intuic¸ ˜ao econ ´omica do modelo deve-se ler Jacobs & Kiefer (2010), uma vez que apresenta gradualmente a derivac¸ ˜ao do modelo e o artigo tem uma como ambic¸ ˜ao ser um guia para a utilizac¸ ˜ao de estat´ıstica bayesiana na modelac¸ ˜ao do risco de cr ´edito.

O modelo assume que numa carteira diversificada o risco idiossincr ´atico et ´e

neutralizado e s ´o o risco sist ´emico ztafeta o valor da empresa.

Supondo que o valor de uma empresa (vt), no momento t, ´e representado por:

vt = √ ρzt+ p 1 − ρet zt = τ zt−1+ √ 1 − τ2w t (4.1) onde t = 1,...,T e |τ | < 1.

A correlac¸ ˜ao temporal (τ ), feita atrav ´es do fator de risco sist ´emico, respeita o facto de o valor da empresa ser representado por uma distribuic¸ ˜ao normal standard.

(37)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 26

A vari ´avel ρ ´e interpretada como a correlac¸ ˜ao entre o valor da empresa e o risco sist ´emico. As vari ´aveis e1, ..., eT e w1, ..., wT s ˜ao i.i.d. N (0, 1).

Normalmente a vari ´avel zt (”o shock da economia”) tem vari ˆancia unit ´aria. O

modelo assim respeita essa suposic¸ ˜ao, uma vez que a distribuic¸ ˜ao n ˜ao condi-cional de zt tem vari ˆancia 1. Esta ´e a diferenc¸a entre o modelo representado

em Lamb & Perraudin (2008) e Jacobs & Kiefer (2010). A escolha do modelo autoregressivo de Jacobs & Kiefer (2010) n ˜ao respeitava esta condic¸ ˜ao.

Sendo um modelo estrutural, o incumprimento acontece quando o valor da empresa ´e inferior a um determinado limite c.

Sendo Y uma func¸ ˜ao indicadora do incumprimento, ent ˜ao:

Yt= I(vt < c)

p = P (Yt= 1) = P (vt < c) = Φ(c)

(4.2)

A probabilidade de incumprimento ´e representada por:

gt(p, ρ, zt) = P (Yt = 1|p, ρ, zt) = P (vt < c|p, ρ, zt) = Φ Φ −1(p) −ρz t √ 1 − ρ ! (4.3)

No modelo existe tamb ´em a simplificac¸ ˜ao de que quando se est ´a a estu-dar uma carteira em que os empr ´estimos possuem o mesmo risco, carteira ho-mog ´enea, o n ´umero de incumprimentos pode ser modelado por uma distribuic¸ ˜ao binomial.

(38)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 27

{n1, n2, ..., nT} o tamanho da carteira, a func¸ ˜ao de densidade de yt dado zt, p, ρ

´e: f (yt|p, ρ, zt) = yy nt  gt(p, ρ, zt)yt(1 − gt(p, ρ, zt))nt−yt (4.4) ondey = (y1, ..., yT)ez = (z1, ..., zT).

Consequentemente a func¸ ˜ao de verosimilhanc¸a que ir ´a ser utilizada na func¸ ˜ao a posteriori ´e dada por:

f (y|p, ρ, z) = T Y t=1 yy nt  gt(p, ρ, zt)yt(1 − gt(p, ρ, zt))nt−yt (4.5)

4.2.1

Func¸ ˜ao a priori

Tendo o modelo v ´arias vari ´aveis, p, ρ, τ,Z ´e necess ´ario introduzir func¸ ˜oes a priori

para cada uma. Para a func¸ ˜ao de p decidiu-se recorrer a um perito. A abor-dagem utilizada foi semelhante `a de Kiefer (2009). O que se pretende eliciar ´e ent ˜ao a func¸ ˜ao de probabilidade da probabilidade de incumprimento tendo como horizonte temporal 1 ano. O perito est ´a bastante familiarizado com estat´ıstica, o que facilitou muito o processo.

Foram inquiridos os quantis: 25%, 50%, 75%, 90%, 95%. A resposta obtida foi: 1.3%, 2%, 3%, 4.5%, 7%.

De seguida, modelou-se a func¸ ˜ao assumindo que ela correspondia a uma distribuic¸ ˜ao beta. A modelac¸ ˜ao ´e feita atrav ´es da minimizac¸ ˜ao da soma dos erros quadr ´aticos entre os a quantis da distribuic¸ ˜ao beta e os quantis fornecidos. Para tal foi utilizado a func¸ ˜ao ”get.beta.par” do pacote ”rrsikDistributions”. O resultado foi uma distribuic¸ ˜ao beta com α = 2.5 e β = 104.98, ou seja uma distribuic¸ ˜ao beta

(39)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 28

com valor esperado ≈ 0.0233 e vari ˆancia ≈ 0.000209.

0.00 0.02 0.04 0.06 0.08 0.10 0 5 10 15 20 25 30 p π ( p )

Figura 4.1: Distribuic¸ ˜ao a priori

No anexo B pode ver-se que o desfasamento entre os quantis da distribuic¸ ˜ao beta definida e os quantis do perito n ˜ao ´e significativo.

Quanto ao par ˆametro ρ, seria muito dif´ıcil conseguir utilizar a informac¸ ˜ao do especialista, uma vez que tem muito pouca sensibilidade para conseguir definir uma func¸ ˜ao para a vari ´avel. Decidiu-se optar por ”eliminar a vari ´avel” utilizando a func¸ ˜ao definida por Kiefer (2011):

ρ(p) = .24 − .12(1 − e−50p) (4.6)

Esta f ´ormula adv ´em da eliminac¸ ˜ao do fator 1

1−e−50 da f ´ormula definida em Basileia

II, uma vez que apenas difere em 1 na 22acasa decimal.

Na base da f ´ormula est ˜ao factos emp´ıricos, bem como intuic¸ ˜ao econ ´omica. Ela sup ˜oe que quanto maior a PD menor a correlac¸ ˜ao com o fator sist ´emico. A raz ˜ao ´e simples, se a empresa tem uma probabilidade de incumprimento elevada

(40)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 29

significa que est ´a mais exposta ao seu pr ´oprio risco do que ao risco sist ´emico (Basel Committe on Banking Supervision 2005a).

Devido ao facto de existir muito pouca informac¸ ˜ao sobre o par ˆametro τ , optou-se por utilizar o princ´ıpio da raz ˜ao insuficiente de Laplace escolhendo a distribuic¸ ˜ao

U]−1,1[, ou seja uma distribuic¸ ˜ao n ˜ao-informativa.

4.2.2

Func¸ ˜ao a posteriori

A func¸ ˜ao a posteriori ´e a seguinte:

π(p,z, τ |y) = f (y|p, z)π(p)π(z|τ )π(τ )

f (y) (4.7)

onde π representa a func¸ ˜ao a priori. Sendo as vari ´aveis independentes t ˆem-se as seguintes distribuic¸ ˜oes condicionais completas:

Func¸ ˜ao condicionada da probabilidade de incumprimento:

π(p|y, z, τ ) ∝ f (y|p, z)π(p) ∝ " T Y t=1 gt(p, zt)yt(1 − gt(p, zt))nt−yt # pα(1 − p)β−1 (4.8)

Func¸ ˜ao condicionada da correlac¸ ˜ao temporal τ :

π(τ |y, z, p) ∝ f (z|τ )π(z) ∝ (1 − τ2)−T −1 2 exp XT t=2 −(zt− τ zt−1) 2 2(1 − τ2)  (4.9)

(41)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 30

Func¸ ˜ao condicionada do fator sist ´emico no momento 1:

π(z1|y, z−1, τ ) ∝ f (y|p, z1)π(z1) ∝ g1(p, z1)y1(1 − g1(p, z1))n1−y1exp −z2 1 2  (4.10)

Func¸ ˜ao condicionada do fator sist ´emico no momento > 1:

π(zt|y, z−t, τ ) ∝ f (y|p, z)π(zt|zt−1, τ ) ∝ gt(p, zt)yt(1 − gt(p, zt))nt−ytexp  − (zt− τ zt−1) 2 2(1 − τ2)  (4.11)

4.2.3

Implementac¸ ˜ao e Resultados

Para a implementac¸ ˜ao do modelo desenvolveu-se um algoritmo de MCMC. O goritmo utilizado ´e o algoritmo de Metropolis-Hastings dentro de Gibbs. Esse al-goritmo foi desenvolvimento atrav ´es da combinac¸ ˜ao da linguagem de programac¸ ˜ao R e C++. O trabalho foi sempre desenvolvido no ambiente de desenvolvimento integrado (IDE) RStudio.

A combinac¸ ˜ao do R com o C++ apresenta grandes vantagens e ´e feita atrav ´es do pacote RCPP1 e RCPPArmadillo2. A principal raz ˜ao para a combinac¸ ˜ao das

linguagens ´e aproveitar a rapidez do C++, uma vez que se ir ´a simular uma grande quantidade de n ´umeros pseudo-aleat ´orios, e ao mesmo tempo ser pr ´atico criar gr ´aficos e utilizar pacotes de diagn ´ostico de MCMC, como o CODA. O algoritmo pode ser visto no anexo C.

Uma etapa crucial em MCMC ´e a escolha das distribuic¸ ˜oes propostas.

1Faz a ligac¸ ˜ao entre o C++ e o R 2Biblioteca em C++ de ´Algebra Linear

(42)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 31

Para p (θ1

n) foi escolhida uma distribuic¸ ˜ao beta que toma como valor esperado o

valor anterior da cadeia: θ1

n|θn−11 ∼ B(cθ1n−1, c(1−θ1n−1)). O valor c e θ1-inicial foram

escolhidos para que a distribuic¸ ˜ao inicial fosse a distribuic¸ ˜ao a priori (c = 107 e θ10 = 0.023).

A escolha da func¸ ˜ao beta ´e adequada uma vez que tem o mesmo suporte de p, [0, 1].

Para a vari ´avel τ escolheu-se a distribuic¸ ˜ao U[−1,1]. A escolha deve-se ao facto

de n ˜ao existir qualquer informac¸ ˜ao sobre o seu valor. Assim, neste passo ir ´a ser usado um algoritmo de Metropolis-Hastings independente.

As vari ´aveis zt foram simuladas atrav ´es do algoritmo de Metropolis utilizando

uma distribuic¸ ˜ao N (0, 1) para definir o salto.

Foi gerada uma cadeia de 1e6 valores aleat ´orios e um ”burn-in”de 1000. No anexo D.1 pode-se observar os testes aplicados ao resultado da simulac¸ ˜ao de Markov.

No anexo D.1.2 ´e apresentado o teste de Raftery que mostra que o ”burn-in” utilizado ´e superior ao necess ´ario, no entanto ´e utilizado por uma quest ˜ao de aumentar a seguranc¸a.

O tamanho de cada ”batch” foi de 250. No anexo D.2 pode-se observar a auto-correlac¸ ˜ao.

Quanto `a converg ˆencia, n ˜ao existe qualquer evid ˆencia que aponte para que esta n ˜ao tenha sido atingida (ver anexo D.1).

As taxas de aceitac¸ ˜ao foram as seguintes: (θ1, θ2, ..., θ6)= (.262, .504, .565, .505, .331, .278)

(43)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 32

realizada ´e bastante semelhante `a feita por (Geyer 2012).

O valor esperado da PD e τ , bem como o MCSE s ˜ao dados na seguinte ta-bela:

p τ z1 z2 z3 z4

Estimac¸ ˜ao 0.01994 0.26851 1.47956 1.09970 -0.42610 -1.03491 MCSE 6.851e-05 7.801e-04 3.114e-03 3.752e-03 3.944e-03 3.609e-03

Tabela 4.2: M ´edias das vari ´aveis a posteriori

Quanto `a forma da func¸ ˜ao da densidade da PD ´e a seguinte:

Figura 4.2: Func¸ ˜ao π(p|y)

Ao observar a figura 4.2 pode-se tirar a conclus ˜ao de que apesar de o valor esperado de incumprimento ser bastante semelhante ao definido pelo perito, a func¸ ˜ao a posterior ´e mais informativa, uma vez que se encontra mais

(44)

concen-Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 33

trada. Diminui-se, portanto, a dispers ˜ao de valores da probabilidade de incum-primento.

−1.0

−0.5

0.0

0.5

1.0

0.0

0.4

0.8

τ

Densidade

Figura 4.3: Func¸ ˜ao π(τ |y)

Quanto `a correlac¸ ˜ao temporal observa-se que ´e positiva, como seria de es-perar. Ou seja, a per´ıodos em que o risco sist ´emico ´e mais elevado seguem-se per´ıodos de elevado risco sist ´emico.

A tabela 4.2 mostra que o fator sist ´emico ´e positivo quando n ˜ao existem in-cumprimentos e `a medida que os inin-cumprimentos aumentam o fator sist ´emico piora, como seria de esperar.

Por fim, definida a func¸ ˜ao a posteriori da PD da carteira de empr ´estimos seria poss´ıvel calcular o capital econ ´omico necess ´ario, utilizando a LGD definida por Basileia para este tipo de carteiras. No entanto, essa an ´alise fica fora do ˆambito do projeto.

(45)

5. Conclus ˜

oes

Este trabalho teve como principal objetivo calcular a probabilidade de incum-primento atrav ´es da incorporac¸ ˜ao da informac¸ ˜ao hist ´orica, de uma carteira de cr ´edito real, com informac¸ ˜ao fornecida por um perito de an ´alise de risco de cr ´edito.

Ao longo do projeto ficou explicitado a import ˆancia da introduc¸ ˜ao da opini ˜ao de peritos, principalmente quando a informac¸ ˜ao hist ´orica ´e insuficiente ou pouco fi ´avel.

No entanto, a utilizac¸ ˜ao de apenas um perito pode ter desvantagens principal-mente se existirem interesses pessoais em causa. Por isso recomenda-se que se desenvolva uma metodologia com um maior n ´umero de peritos, caso se de-seje aplicar este modelo na realidade. Para tal, recomenda-se o modelo cl ´assico de Cooke (1991).

Foi tamb ´em desenvolvido um algoritmo de simulac¸ ˜ao para determinar a func¸ ˜ao a posteriori. ´E de facto crucial o conhecimento de Monte Carlo via cadeias de Markov quando se estuda estat´ıstica Bayesiana.

Seria tamb ´em interessante realizar um estudo comparativo, de m ´edio prazo, entre a abordagem aqui apresentada e a abordagem utilizada pelos bancos de forma a perceber qual a mais adequada.

No que toca `a correlac¸ ˜ao temporal do fator econ ´omico denota-se que existe uma correlac¸ ˜ao positiva, apesar de n ˜ao ser muito forte ( ≈ .269).

(46)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 35

modelos que combinem o c ´alculo da LGD com PD. J ´a existe, pelo menos, um estudo sobre o tema (Shevchenko & Luo 2012), no entanto ainda ´e uma ´area a investigar.

(47)

Refer ˆencias Bibliogr ´aficas

Ant ˜ao, P. & Lacerda, A. (2008), ‘Avaliac¸ ˜ao dos requisitos de capital sob basileia ii: o caso portugu ˆes’, Relat ´orio de Estabilidade Financeira 2008–Banco de Portugal pp. 207–28.

Bakker, M. (2004), Quantifying operational risk within banks according to Basel II, Bakker, MRA.

Banco de Portugal (2014), ‘Sistema banc ´ario portugu ˆes - desenvolvimentos re-centes (1otrimestre 2014)’.

Basel Committe on Banking Supervision (2000), Principles for the management of credit risk, Technical report, Bank for International Settlements.

Basel Committe on Banking Supervision (2005a), ‘An explanatory note on the basel ii irb risk weight functions’.

Basel Committe on Banking Supervision (2005b), ‘Validation of low-default port-folios in the basel ii framework’.

Basel Committe on Banking Supervision (2006), ‘International convergence of capital measurement and capital standards’.

(48)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 37

Chan, K. S. & Geyer, C. J. (1994), ‘Discussion: Markov chains for exploring pos-terior distributions’, The Annals of Statistics pp. 1747–1758.

Cooke, R. (1991), Experts in uncertainty: opinion and subjective probability in science, Oxford University Press, New York.

Gamerman, D. & Lopes, H. F. (2006), Markov chain Monte Carlo: stochastic simulation for Bayesian inference, CRC Press.

Garthwaite, P. H., Kadane, J. B. & O’Hagan, A. (2005), ‘Statistical methods for eli-citing probability distributions’, Journal of the American Statistical Association

100(470), 680–701.

Geweke, J. et al. (1991), Evaluating the accuracy of sampling-based approaches to the calculation of posterior moments, Vol. 196, Federal Reserve Bank of Minneapolis, Research Department.

Geyer, C. J. (1992), ‘Practical markov chain monte carlo’, Statistical Science pp. 473–483.

Geyer, C. J. (2005), ‘Markov chain monte carlo lecture notes’. Dispon´ıvel em: http://www.stat.umn.edu/geyer/f05/8931/n1998.pdf [Acesso em : 2014/3/21].

Geyer, C. J. (2012), ‘Markov chain monte carlo and bayesian inference’. Dispon´ıvel em: http://www.stat.umn.edu/geyer/s12/5102/notes/mcmc.pdf [Acesso em : 2014/3/21].

(49)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 38

Jacobs, M. & Kiefer, N. M. (2010), The bayesian approach to default risk: A guide, Technical report, CAE Working Paper.

Kiefer, N. M. (2009), ‘Default estimation for low-default portfolios’, Journal of Em-pirical Finance16(1), 164–173.

Kiefer, N. M. (2011), ‘Default estimation, correlated defaults, and expert informa-tion’, Journal of Applied Econometrics26(2), 173–192.

Lamb, R. & Perraudin, W. (2008), ‘Dynamic default rates’. Dis-pon´ıvel em: http://www.riskcontrollimited.com/research_papers/Lamb_ Perraudin_ref8_4.pdf [Acesso em : 2014/3/10].

Paulino, C. D. M., Turkman, M. A. A. & Murteira, B. (2003), Estat´ıstica bayesiana, Servic¸o de Educac¸ ˜ao e Bolsas, Fundac¸ ˜ao Calouste Gulbenkian, Lisboa.

Raftery, A. E. & Lewis, S. M. (1996), Implementing mcmc, in ‘Markov chain Monte Carlo in practice’, Springer, pp. 115–130.

Robert, C. P., Casella, . o. et al. (2010), Introducing Monte Carlo Methods with R, Vol. 18, Springer.

Robert, C. P. & Casella, G. (2005), Monte Carlo statistical methods, Vol. 319, 2 edn, Springer.

Shevchenko, P. V. & Luo, X. (2012), ‘Dependent default and recovery: Markov chain monte carlo study of downturn loss given default credit risk model’, AN-ZIAM Journal53, C185–C202.

(50)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 39

Tierney, L. (1994), ‘Markov chains for exploring posterior distributions’, the Annals of Statistics pp. 1701–1728.

(51)

A. Esquema Cl ´assico e Bayesiano

Modelo Experi-mental Dados Amostra Racioc´ınio Indutivo Infer ˆencia Estat´ıstica Figura A.1: Esquema Cl ´assico (Paulino et al. 2003)

Modelo Experi-mental Dados Amostra Teorema de Bayes Distribuic¸ ˜ao a priori Racioc´ınio Dedutivo Infer ˆencia Estat´ıstica

(52)

B. Distribuic¸ ˜ao a priori

0.02 0.04 0.06 0.0 0.2 0.4 0.6 0.8 1.0

Beta (shape1= 2.5, shape2= 104.98)

fit.weights=c(1, 1, 1, 1, 1)Quantiles

Probability

Figura B.1: Desfasamento dos quantis da distribuic¸ ˜ao a priori beta e dos quantis do especialista

(53)

C. Algoritmo M-H dentro de Gibbs

Algoritmo 4 Metropolis-Hastings dentro de Gibbs Utilizado

1: Escolher (θ1

1, θ21, ..., θ61)

2: para t ← 2 at ´e n fac¸a 3: Simular Y ∼ B(c(θ1 t−1), c(1 − θ1t−1))e U ∼ U[0,1] 4: Calcular α(θ1 t−1, Y )= min{ q(θ1 t−1)π(Y |θ−1) q(Y )π(θ1 t−1|θ−1) , 1} 5: se U ≤ α(θ1 t−1, Y )ent ˜ao 6: θ1 t = Y 7: sen ˜ao 8: θt1 = θt−11 9: fim se 10: Simular Y ∼ U[−1,1] e U ∼ U[0,1] 11: Calcular α(θ2 t−1, Y )= min{ π(Y |θ−2) π(θ2 t−1|θ−2), 1} 12: se U ≤ α(θt−11 , Y )ent ˜ao 13: θt2 = Y 14: sen ˜ao 15: θ2 t = θt−12 16: fim se

17: para j ← 3 at ´e 6 fac¸a

18: Simular Y ∼ θjt−1+ N (0, 1)e U ∼ U[0,1]

19: Calcular α(θjt−1, Y )= min{ π(Y |θ−j)

π(θjt−1|θ−j), 1} 20: se U ≤ α(θjt−1, Y )ent ˜ao 21: θjt = Y 22: sen ˜ao 23: θjt = θjt−1 24: fim se 25: fim para 26: fim para θ−j = (θt1, ..., θ j−1 t , θ j+1 t−1, ..., θt−1J )

(54)

D. Diagn ´

ostico Metropolis-Hastings

D.1

Converg ˆencia

D.1.1

M ´edias e Teste Geweke

0e+00 2e+05 4e+05 6e+05 8e+05 1e+06

0.014

0.020

N_Simulações

p

Figura D.1: Evoluc¸ ˜ao da M ´edia da vari ´avel p

0e+00 2e+05 4e+05 6e+05 8e+05 1e+06

−0.2 0.0 0.2 0.4 N_Simulações τ

Figura D.2: Evoluc¸ ˜ao da M ´edia da vari ´avel τ

p τ z1 z2 z3 z4

Resultados -0.154 1.045 0.055 -0.363 -.264 -.462 Tabela D.1: Teste Geweke

(55)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 44

confinac¸ ˜ao de 95% n ˜ao se rejeita a hip ´otese nula (as m ´edias s ˜ao iguais).

D.1.2

Teste Raftery e Lewis

Burn-in Total Lower bound Dependence factor p 140 170324 3746 45.50 τ 8 15888 3746 4.24 z1 51 69615 3746 18.60 z2 66 89738 3746 24.00 z3 124 141856 3746 37.90 z4 124 154473 3746 41.20

Tabela D.2: Teste Raftery e Lewis

D.2

Correlac¸ ˜ao

0 10 20 30 40 50 −1.0 0.5 Lag A utocorrelation p 0 10 20 30 40 50 −1.0 0.5 Lag A utocorrelation tau 0 10 20 30 40 50 −1.0 0.5 Lag A utocorrelation Z1 0 10 20 30 40 50 −1.0 0.5 Lag A utocorrelation Z2 0 10 20 30 40 50 −1.0 0.5 Lag A utocorrelation Z3 0 10 20 30 40 50 −1.0 0.5 Lag A utocorrelation Z4

(56)

Adriano Oliveira

Aplicac¸ ˜ao da Estat´ıstica Bayesiana

ao Risco de Cr ´edito 45 0 5 10 15 20 25 −1.0 0.5 Lag A utocorrelation 0 5 10 15 20 25 −1.0 0.5 Lag A utocorrelation 0 5 10 15 20 25 −1.0 0.5 Lag A utocorrelation 0 5 10 15 20 25 −1.0 0.5 Lag A utocorrelation 0 5 10 15 20 25 −1.0 0.5 Lag A utocorrelation 0 5 10 15 20 25 −1.0 0.5 Lag A utocorrelation

Imagem

Figura 2.1: Func¸ ˜ao densidade de probabilidade da perda
Figura 4.1: Distribuic¸ ˜ao a priori
Tabela 4.2: M ´edias das vari ´aveis a posteriori
Figura 4.3: Func¸ ˜ao π(τ|y)
+6

Referências

Documentos relacionados

Combinados, o rádio portátil APX 8000XE habilitado para todas bandas e o microfone falante remoto XE500 criam uma solução de missão crítica incomparável, projetada para o pessoal

3 O presente artigo tem como objetivo expor as melhorias nas praticas e ferramentas de recrutamento e seleção, visando explorar o capital intelectual para

15, estão representados os teores médios de safrol contido em óleo essencial obtido, no decorrer do progresso de extração, da biomassa aérea de pimenta longa procedente de cultivos

Devido à natureza das operações que o processador realiza, é necessário que este atue no barramento OPB, tanto como mestre, nas operações nas quais ele requisita leitura ou escri-

Muitas vezes as crianças aprendem as letras, sílabas e as palavras sem sentido, mas não entendem o que escrevem, não é considerado alfabetizado, pois a escrita é considerada

Este documento pode ser acessado no endereço eletrônico http://www.tst.jus.br/validador sob código 1003F3D2A712044F47... Firmado por assinatura digital em 09/12/2020 pelo

General: Knowing the conceptual and methodological foundations of the main projective methods; Identify and understand the operational concepts of projection and distress; Identify

II - os docentes efetivos, com regime de trabalho de 20 (vinte) horas semanais, terão sua carga horária alocada, preferencialmente, para ministrar aulas, sendo o mínimo de 8 (oito)