Modelagem de Risco de Crédito

(1)

Modelagem de Risco de Crédito

Douglas Beserra Pinheiro

23/02/2017

(2)

Agenda



Papel da Área de Risco de Crédito



Exemplo de desenvolvimento de um modelo de

previsão de inadimplência



Perfil dos profissionais da área



Referências

(3)

Papel da Área de Risco de Crédito



Modelagem de Risco de Crédito

◦ Estimar os parâmetros de risco que compõem a perda esperada (PD, EAD, LGD)

◦ Acompanhar a performance dos modelos

◦ Sugerir ações que mantenham o risco dentro dos limites definidos pela instituição



Políticas de Crédito

◦ Determina os limites de exposição nos diferentes produtos e acompanha tanto a inadimplência como a rentabilidade dos mesmos.

(4)

Modelo de PD

O objetivo do modelo de PD (Probability of Default) é o de

estimar a probabilidade de um cliente não pagar a dívida,

ou seja, inadimplir.

O modelo pode ser apresentado na forma de classificação

de risco (rating) ou

pontuação (score).

As metodologias são classificadas em:



_Massificado

(5)

Base de Dados - Períodos Definição de Performance Análise Descritiva Segmentação Amostras de Desenvolvimento e Validação

Tratamento das Variáveis Estimação dos Modelos

Verificação da Qualidade dos Modelos

Resultados Finais

Aplicação dos Modelos

Modelo de PD

(6)

Modelo de PD

Mês 0

com base em informações do

perfil do cliente na contratação,

informações de utilização após a contratação do produto para classificar o cliente em BOM ou RUIM informações cadastrais e de restrições na data da contratação do produto para caracterizar o PERFIL DO CLIENTE Mês 12 prever o comportamento futuro utilizando o Escore Base de Dados-Períodos

(7)

Modelo de PD

Definição de Performance



Exclusões

◦ Cartão Fraudado, Roubado/Perdido, Não ativado, Desistente.



Ruins

◦ Cartão com mais de 90 dias de atraso.



Indeterminados

◦ Cartão com atraso entre 31 e 90 dias.



Experiência Insuficiente

◦ Menos de 6 meses de ativação na janela, inativo posteriormente.



Bons

(8)

Modelo de PD

Análise Descritiva

Número de Dependentes Ruins Bons %B ons /% Ruins 0 3818 3576 0,94 1 272 184 0,68 2 300 212 0,71 3 106 72 0,68 4 17 11 0,65 5 4 0 0,00 miss ing 483 945 1,96 Total 5000 5000

Núm e ro de De pende ntes Ruins Bons %Bons/% Ruins

0 3818 3576 0,94

ma ior 1 699 479 0,69 m issing 483 945 1,96 Tot al 5000 5000

Nú mero de D epend en te s Ruin s Bon s % Bon s/% Ruin s 0 413 9 378 7 0 ,9 1 1 27 9 20 4 0 ,7 3 2 7 0 4 6 0 ,6 6 3 2 5 1 6 0 ,6 4 4 2 2 1 ,0 0 5 2 0 0 ,0 0 Missin g 48 3 94 5 1 ,9 6 Total 500 0 500 0

Nú m ero de D epend en te s Ruin s Bon s % Bon s/% Ruin s 0 413 9 378 7 0 ,9 1

m aior 1 37 8 26 8 0 ,7 1

M issin g 48 3 94 5 1 ,9 6

Total 500 0 500 0 Balanceamento da amostra

Análise de observações sem informação (missing)

Quantidade de Dependentes Menores

(9)

Modelo de PD

Segmentação

S

E

G

M

E

N

T

A

Ç

Ã

O

(10)

Modelo de PD

Segmentação

Exemplo de Variáveis Candidatas

Número de

Dependentes Porcentagem

Nenhum 20,3

Um ou mais 5,1

Missing 74,7

Estado Civil Porcentagem

Casado 34,2 Outros 28,5 Missing 37,2 Escolaridade Porcentagem 1º grau (incompleto/completo) 20,1 2º grau, superior ou pós (incompleto/completo) 37,8 Missing 42,1

Telefone próprio Porcentagem

Não 6,7

Sim 14,1

Missing 79,2

Residência própria Porcentagem

Não 10,2

Sim 15,2

Missing 74,6

Segmentação de Variáveis vs Modelo

(11)

Modelo de PD

População Total

Amostra de Exploração para definição da performance e segmentação Amostra de Desenvolvimento

para construção do modelo

50% de Ruins 50 % de Bons Amostra de Validação para validação dos passos de desenvolvimento do modelo Tempo ou aleatória Amostra de Desenvolvimento e Validação

(12)

Modelo de PD

Tratamento das variáveis

Tratamento das Variáveis

Categorização _Estabilidade

Conceitos Dummy

Dummy: Variáveis binárias (categóricas), eficientes nos casos de falta de

(13)

Modelo de PD

Tratamento das variáveis

Idade Bons Ruins % Bons (a) % Ruins (b) % Bons/%Ruins (c) WoE (d)=ln (c) IV (a-b)*d 0-22 124 272 2% 5% 0,46 -0,786 0,023 23-26 161 249 3% 5% 0,65 -0,436 0,008 27-31 248 339 5% 7% 0,73 -0,313 0,006 32-33 350 374 7% 7% 0,94 -0,066 0,000 34-38 384 382 8% 8% 1,01 0,005 0,000 39-41 428 447 9% 9% 0,96 -0,043 0,000 42-46 647 593 13% 12% 1,09 0,087 0,001 47-52 752 717 15% 14% 1,05 0,048 0,000 53-60 862 671 17% 13% 1,28 0,250 0,010 >60 1044 956 21% 19% 1,09 0,088 0,002 Total 5000 5000 100% 100% 0,049

Information Value: Medida usada pela Fair Isaac (FICO) para determinar a importância

da variável. Quanto maior o Information Value, maior é o poder de discriminação e a importância da variável para o modelo.

(14)

Modelo de PD

Tratamento das variáveis IDADE BONS %B RUINS %R %B - %R

(a) %B / %R (b) log(b) (c) (a) * (c) Até 35 anos 2.000 40% 2.000 40% 0,00 1,00 0,00 0,00 35 anos ou mais 3.000 60% 3.000 60% 0,00 1,00 0,00 0,00 Total 5.000 100% 5.000 100% Information Value: 0,00 + 0,00 = 0,00

IDADE BONS %B RUINS %R %B - %R

(a) %B / %R (b) log(b) (c) (a) * (c) Até 35 anos 2.000 40% 3.000 60% -0,20 0,67 -0,41 0,08 35 anos ou mais 3.000 60% 2.000 40% 0,20 1,50 0,41 0,08 Total 5.000 100% 5.000 100% Information Value: 0,08 + 0,08 = 0,16

IDADE BONS %B RUINS %R %B - %R

(a) %B / %R (b) log(b) (c) (a) * (c) Até 35 anos 2.000 40% 4.000 80% -0,40 0,50 -0,69 0,28 35 anos ou mais 3.000 60% 1.000 20% 0,40 3,00 1,10 0,44 Total 5.000 100% 5.000 100% Information Value: 0,28 + 0,44 = 0,72 P ode r de D isc riminação

-+

(15)

Modelo de PD

Tratamento das variáveis Idade 21 22 23 . . . 84 85 86 . . . Idade (Categorizada) Categ1 - 21 a 25 Categ2 - 26 a 30 Categ3 - 31 a 35 . . . Categ n - 61 a 65 Categ n+1 - 66 a 70 Categ n+2 - 70 a 75 . . . Idade (Dummy)

Dummy1 = 1 se idade está em (21 a 25)

Dummy1 = 0 Caso Contrário

Dummy2 = 1 se idade está em (26 a 30)

Dummy2 = 0 Caso Contrário .

. .

Dummy n = 1 se idade está em (61 a 65) Dummy n = 0 Caso Contrário

. . . Exemplo de construção de variáveis binárias.

(16)

Modelo de PD

Estimação dos modelos

Todas as variáveis disponíveis para o estudo que não foram

excluídas na análise descritiva

Variáveis Estáveis e com Alto Poder Preditivo

(escolhidas a priori) Variáveis Selecionadas via procedimento estatístico (Stepwise) Variáveis Não Selecionadas via procedimento estatístico M o d e l o F i n a l Técnicas estatísticas

(17)

Modelo de PD

No exemplo: Média Bons = 635 Variância Bons = 2885 e Média Ruins = 530 Variância Ruins = 3530 Portanto, IV = 3,44

(18)

Modelo de PD

Verificação da qualidade dos modelos O valor do K-S é obtido a partir da distância

máxima entre as curvas dos Clientes Bons e

dos Clientes Ruins

Gráfico da Distribuição Acumulada de Bons e Ruins

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 390 426 441 454 467 480 493 506 519 532 545 558 571 584 597 610 623 636 649 662 675 688 %Bons %Ruins K-S=64,6%

(19)

Modelo de PD

Resultados Finais

Bad Rate: Taxa de Ruins entre os aprovados pelo modelo

Estratégias:

manter aprovação e aumentar qualidade manter qualidade e aumentar aprovação

SITUAÇÃO ATUAL:

80% de aprovação 4,2% de inadimplência

Faixa Número

Clientes Bons Ruins

Taxa Aprovação Bad Rate Acum Bad Rate Marg <390 4 0 4 100% 8,1% 100,0% 391-540 23189 13961 9228 100% 8,1% 39,8% 541-566 22896 19316 3580 90% 4,4% 15,6% 567-684 22545 20093 2452 79% 3,0% 10,9% 585-599 21634 20414 1220 69% 1,8% 5,6% 600-614 23685 23043 642 60% 1,2% 2,7% 615-626 22758 22396 362 49% 0,8% 1,6% 627-637 22249 22008 241 39% 0,6% 1,1% 638-647 21649 21479 170 29% 0,5% 0,8% 648-660 21544 21442 102 19% 0,4% 0,5% 661-694 21452 21400 52 10% 0,2% 0,2% >694 85 85 0 0% 0,0% 0,0% Total 223690 205637 18053

(20)

Modelo de PD

Aplicação dos Modelos



Concessão de Crédito



Cobrança



Fraude



Renovação de limites



Segmentação de produtos e canais de

atendimento

(21)

Perfil dos profissionais da área



Críticos e curiosos



Habilidade com ferramentas de programação e

estatística



Mão na massa



Provenientes de diversas áreas, do

conhecimento, entre elas, Matemática,

Estatística, Administração, Economia, Física,

Contabilidade, Engenharia...

(22)

Perfil dos profissionais da área

 Big Data  Localização  Mobile  Informações Públicas  Softwares SAS, SPSS, R, Stata, Orange, Matlab, etc.

(23)

Referências

 Lima, Jorge Claudio C.O. “Importância de Conhecer a Perda Esperada” Revista do BNDES, Rio de Janeiro, V. 15, N. 30, P. 271-302, dez. 2008

Apesar de focar em modelagem corporate, apresenta de forma simples os conceitos relacionados à perda esperada.

 The Credit Scoring Toolkit: Theory and Practice for Retail Credit Risk Management and Decision Automation. Raymond Anderson.



https://www.datacamp.com/courses/introduction-to-credit-risk-modeling-in-r

Ótimo curso online, apesar do conteúdo resumido, detalha bem a parte de tratamento de dados e validação de modelos.

(24)