Alan Cosme Rodrigues da Silva

(1)

Alan Cosme Rodrigues da Silva

Análise da Coerência de Medidas de Risco no

Mercado Brasileiro de Ações e Críticas ao

Desenvolvimento de uma Metodologia Híbrida

COPPEAD / UFRJ

Março de 2004

(2)

Análise da Coerência de Medidas de Risco no

Mercado Brasileiro de Ações e Críticas ao

Desenvolvimento de uma Metodologia Híbrida

Alan Cosme Rodrigues da Silva

Universidade Federal do Rio de Janeiro

Instituto COPPEAD de Administração

Orientador: Eduardo Facó Lemgruber

Ph.D. em Finanças (UCLA, EUA)

Rio de Janeiro

Março de 2004

(3)

Análise da Coerência de Medidas de Risco no

Mercado Brasileiro de Ações e Críticas ao

Desenvolvimento de uma Metodologia Híbrida

Alan Cosme Rodrigues da Silva

Dissertação submetida ao corpo docente do Instituto COPPEAD de Administração da Universidade Federal do Rio de Janeiro – UFRJ, como parte dos requisitos necessários à obtenção do grau de Mestre.

Aprovada por:

Rio de Janeiro Março de 2004

(4)

Silva, Alan Cosme Rodrigues da.

Análise da Coerência de Medidas de Risco no Mercado Brasileiro de Ações e Críticas ao Desenvolvimento de uma Metodologia Híbrida / Alan Cosme Rodrigues da Silva. – Rio de Janeiro, 2004.

xvii, 87.

Dissertação (Mestrado em Administração) – Universidade Federal do Rio de Janeiro – UFRJ, Instituto COPPEAD de Administração, 2004.

Orientador: Eduardo Facó Lemgruber.

1. Valor em Risco (VaR). 2. Expected Shortfall 3. Medidas coerentes de risco. 4. Finanças – Teses. I. Lemgruber, Eduardo Facó (Orient.). II. Universidade Federal do Rio de Janeiro. Instituto Coppead de Administração. III. Título

(5)

À minha grande família, a quem tanto amo.

(6)

AGRADECIMENTOS

Agradeço primeiramente a Deus nosso Pai não só pela dissertação, mas por tudo em minha vida, pelos acontecimentos bons os quais não mereço por completo e pelos não tão bons que me fortalecem cada vez mais a fé.

Ao Banco Central do Brasil, meu empregador e duplamente aos contribuintes brasileiros, pela oportunidade de fazer este curso de mestrado de excelência.

À minha amada esposa, Gabriela, pelo incentivo para ingressar no curso.

Aos meus pais, Faustino e Ana, pois as oportunidades que me deram foram fundamentais para eu chegar até aqui.

Ao Prof. Eduardo Facó, pela idéia do tema, pela orientação com maestria e pela confiança depositada, à qual espero ter correspondido.

Aos amigos do COPPEAD pelo apoio que me deram durante o curso, em especial, ao amigo Marcelo Nuno, vulgo, De Nuno.

Aos amigos do Depep-RJ pelas trocas de idéias, pelas sugestões que auxiliaram a elaboração desta dissertação e até mesmo por emprestarem seus computadores.

(7)

Ajuizado serás não supondo que sabes o que ignoras. Sócrates

(8)

RESUMO

SILVA, Alan Cosme Rodrigues da. Análise da Coerência de Medidas de

Risco no Mercado Brasileiro de Ações e Críticas ao Desenvolvimento de uma Metodologia Híbrida. Orientador: Eduardo Facó Lemgruber. Rio de

Janeiro: UFRJ/COPPEAD, 2004. Dissertação (Mestrado em Administração).

O trabalho busca analisar empiricamente a coerência do VaR pela definição de Artzner et al. (1997) no Mercado Brasileiro de Ações, calculado pela metodologia da simulação histórica, pela analítica com volatilidade EWMA do RiskMetricsTM e pela híbrida desenvolvida em Boudoukh et al. (1998) com alterações. Utilizam-se como amostra as dez ações mais líquidas da Bovespa em novembro de 2003, com os preços abrangendo o período de 04/jul/1994 a 31/out/2003. É também estudada com os dados empíricos a coerência do

Expected Shortfall calculado pela metodologia definida em Acerbi e Tasche

(2001), pela metodologia analítica com volatilidade EWMA e pela metodologia híbrida, sendo esta última desenvolvida no presente trabalho. Para estas duas últimas, em vez de se utilizar um dado fator de decaimento (lambda), é desenvolvido e implementado um processo de otimização de lambdas que procura obter a melhor estimativa do Expected Shortfall. Todas essas medidas de risco são calculadas para 12 combinações de parâmetros, com os níveis de significância α de 1%, 2,5%, 5% e 10% e com os tamanhos de janela K de 50, 100 e 250 dias. A fim de se testar o VaR utiliza-se o teste desenvolvido em Kupiec (1995) e para o Expected Shortfall, o teste de Berkowitz (2001), concluindo-se que este último não serve para testar as metodologias histórica e híbrida. Chega-se à conclusão de que o Expected Shortfall calculado pela metodologia híbrida passa pelo critério da sub-aditividade, sendo também uma medida coerente de risco.

(9)

ABSTRACT

SILVA, Alan Cosme Rodrigues da. Análise da Coerência de Medidas de

Risco no Mercado Brasileiro de Ações e Críticas ao Desenvolvimento de uma Metodologia Híbrida. Orientador: Eduardo Facó Lemgruber. Rio de

Janeiro: UFRJ/COPPEAD, 2004. Dissertação (Mestrado em Administração).

This work seeks to analyze empirically the coherence of VaR by the definition of Artzner et al. (1997) at Brazilian Stock Market, calculated by historical simulation methodology, analytical methodology with EWMA volatility from RiskMetricsTM_{and hybrid approach with some modifications. The sample}

used were the ten most traded stocks of Bovespa in November 2003 with prices covering the period from July 4th 1994 through October 31st 2003. Using the empirical data, the coherence of Expected Shortfall calculated by methodology from Acerbi and Tasche (2001), analytical methodology and hybrid approach is also studied. This last approach was developed in this work. For analytical methodology and hybrid approach, instead of using a given decay factor (lambda), an optimization process that looks for the best Expected Shortfall was implemented. All these measures of risk were calculated for twelve sets of parameters, covering the significance levels of 1%, 2,5%, 5% e 10% and 50, 100 and 250 days of moving windows. For the purpose of backtesting VaR, the test developed in Kupiec (1995) is used and for Expected Shortfall the test developed in Berkowitz (2001), coming to the conclusion that this last one is not useful to backtesting historical simulation and hybrid approaches. We also came to the conclusion that the Expected Shortfall calculated by the developed hybrid approach is also a sub-additive measure of risk, being considered a coherent measure of risk.

(10)

LISTA DE SIGLAS E ABREVIATURAS

CAS - Casualty Actuarial Society

cdf - cumulative distribution function

ES - Expected Shortfall

EWMA - Exponential Weighted Moving Average iid - Independent and identically distributed

LR - log-likelihood ratio

pdf - probability density function

Qtde - quantidade VaR - Valor em risco

(11)

LISTA DE ILUSTRAÇÕES

Figura 1 - Lucros e perdas da posição vendida nas opções digitais A e B e na carteira vendida

nas duas opções. A opção A, vendida por u, paga 1.000 se o preço do ativo subjacente S for maior que o preço de exercício U, enquanto a opção B, vendida por λ, paga 1.000 se S < L. ... 11

Figura 2 - Função Densidade de Probabilidade (pdf) dos lucros e perdas com distribuição

Normal, e representação do VaR e do Expected Shortfall, obtidos ao nível de significância de α%. ... 15

Figura 3 - Relação linear entre o percentil e a ordem da série de K valores ordenados em

ordem crescente de valor... 36

Figura 4 - Esquematização da definição das janelas de calibragem e de teste no processo de

otimização do lambda das metodologias analítica com EWMA e híbrida com a primeira janela de calibragem iniciando-se após K dias úteis, sendo K o parâmetro que define o tamanho da janela na metodologia híbrida. ... 50

Gráfico 1 - Backtesting do Valor em Risco calculado pela metodologia analítica com EWMA e

pela metodologia de simulação histórica para a posição comprada na carteira igualmente ponderada nas 10 ações mais líquidas da Bovespa em novembro de 2003, abrangendo o período de 15/jul/1996 a 31/out/2003, calculado com os parâmetros α = 5% e K=250. Os lambdas utilizados na metodologia analítica variaram a cada 100 dias da amostra, tendo sido obtidos por processo de otimização que encontrava para a carteira o ES mais próximo da perda efetiva quando o VaR falhava, tendo o parâmetro K definido o início da primeira janela de calibragem de 250 dias. ... 67

Gráfico 2 - Backtesting do Expected Shortfall calculado pela metodologia analítica com EWMA

e pela metodologia de simulação histórica para a posição comprada na carteira igualmente ponderada nas 10 ações mais líquidas da Bovespa em novembro de 2003, abrangendo o período de 15/jul/1996 a 31/out/2003, calculados com os parâmetros α = 5% e K=250. Os lambdas utilizados na metodologia analítica com EWMA variaram a cada 100 dias da amostra, tendo sido obtidos por processo de otimização que encontrava para a carteira o ES mais próximo da perda efetiva quando o VaR falhava, tendo o parâmetro K definido o início da primeira janela de calibragem de 250 dias... 68

(12)

LISTA DE ILUSTRAÇÕES

Gráfico 3 - Backtesting do VaR e do Expected Shortfall calculados pela metodologia híbrida

para a posição comprada na carteira igualmente ponderada nas 10 ações mais líquidas da Bovespa em novembro de 2003, abrangendo o período de 15/jul/1996 a 31/out/2003, calculados com os parâmetros α = 5% e K=250. Os lambdas utilizados variaram a cada 100 dias da amostra, tendo sido obtidos por processo de otimização que encontrava para a carteira o ES mais próximo da perda efetiva quando o VaR falhava, tendo o parâmetro K definido o início da primeira janela de calibragem de 250 dias. ... 77

Gráfico 4 - Backtesting do Expected Shortfall calculado pelas três metodologias para a posição

comprada na carteira igualmente ponderada nas 10 ações mais líquidas da Bovespa em novembro de 2003, abrangendo o período de 15/jul/1996 a 31/out/2003, calculado com os parâmetros α = 5% e K=250. Os lambdas utilizados na metodologia analítica com EWMA e híbrida variaram a cada 100 dias da amostra, tendo sido obtidos por processo de otimização que encontrava para a carteira o ES mais próximo da perda efetiva quando o VaR falhava, tendo o parâmetro K definido o início da primeira janela de calibragem de 250 dias. ... 80

Quadro 1 - VaR ao nível de confiança de 99% e lucros e perdas da posição vendida nas

opções digitais A e B e na carteira vendida nas duas opções. A opção A, vendida por u, paga 1.000 se o preço do ativo subjacente S for maior que o preço de exercício U, enquanto a opção B, vendida por λ, paga 1.000 se S < L. ... 12

Quadro 2 - Janelas de calibragem, de teste e respectivos lambdas selecionados para o

parâmetro janela K = 250 dias no processo de otimização que procurava obter o Expected

Shortfall que mais se aproximava da perda quando esta superava o VaR, abrangendo o

período de 04/jul/1994 a 31/out/2003. ... 52

(13)

LISTA DE ILUSTRAÇÕES

Quadro 5 - Limites de Kupiec e proporção de falhas do VaR calculado pela metodologia

histórica para as 10 ações mais líquidas da Bovespa e para a carteira igualmente ponderada, somente posição comprada, abrangendo o período de 04/jul/1994 a 31/out/2003. ... 60

Quadro 6 - Limites de Kupiec e proporção de falhas do VaR calculado pela metodologia

analítica com EWMA para as 10 ações mais líquidas da Bovespa e para a carteira igualmente ponderada, somente posição comprada, abrangendo o período de 04/jul/1994 a 31/out/2003. Os lambdas utilizados na metodologia analítica variaram a cada 100 dias da amostra, tendo sido obtidos por processo de otimização que encontrava para a carteira o ES mais próximo da perda efetiva quando o VaR falhava, tendo o parâmetro K definido o início da primeira janela de calibragem de 250 dias... 62

Quadro 7 - Limites de Kupiec e proporção de falhas do VaR calculado pela metodologia híbrida

para as 10 ações mais líquidas da Bovespa e para a carteira igualmente ponderada, somente posição comprada, abrangendo o período de 04/jul/1994 a 31/out/2003. Os lambdas utilizados na metodologia híbrida variaram a cada 100 dias da amostra, tendo sido obtidos por processo de otimização que encontrava para a carteira o ES mais próximo da perda efetiva quando o VaR falhava, tendo o parâmetro K definido o início da primeira janela de calibragem de 250 dias. ... 75

Tabela 1 - Ações mais líquidas selecionadas do Ibovespa de forma que contivessem dados

desde 04/07/1994 até 31/10/2003 e a sua respectiva participação relativa na composição do índice em 10/11/2003... 33

Tabela 2 - Exemplo da série de 100 retornos da ação ITAU4, abrangendo o período de 12/06 a

31/10/2003, após a realização do segundo passo definido por Boudoukh et al. (1998), mostrando a ordem original dos retornos, a ordem após o ordenamento crescente dos retornos, o peso dado para o retorno pela metodologia EWMA e o peso acumulado, os quais foram utilizados para o cálculo do VaR híbrido em 31/10/2003, sendo os parâmetros α=5%, K=100 e λ=0,94. ... 41

(14)

LISTA DE ILUSTRAÇÕES

Tabela 3 - Exemplo da série de 100 retornos da ação ITAU4, abrangendo o período de 12/06 a

31/10/2003, após realizado o segundo passo definido por Boudoukh et al. (1998) e a adição da coluna de peso acumulado do retorno anterior, proposta neste trabalho, mostrando também a ordem original dos retornos, a ordem após o ordenamento crescente dos retornos, o peso dado para o retorno pela metodologia EWMA e o peso acumulado, os quais foram utilizados para o cálculo do VaR híbrido em 31/10/2003, sendo os parâmetros α=5%, k=100 e λ=0,94... 44

Tabela 4 - Falhas na sub-aditividade das Medidas de Risco VaR e Expected Shortfall

calculadas pela metodologia histórica e analítica com EWMA para as 10 ações mais líquidas da Bovespa e para a carteira igualmente ponderada, abrangendo o período de 04/jul/1994 a 31/out/2003. Os lambdas utilizados na metodologia analítica variaram a cada 100 dias da amostra, tendo sido obtidos por processo de otimização que encontrava para a carteira o ES mais próximo da perda efetiva quando o VaR falhava, tendo o parâmetro K definido o início da primeira janela de calibragem de 250 dias.. ... 57

Tabela 5 - Resultado do teste de Kupiec com valor crítico de 5% aplicado sobre o VaR

calculado pela metodologia histórica e pela metodologia analítica com EWMA para as 10 ações mais líquidas da Bovespa e para a carteira igualmente ponderada, somente posição comprada, abrangendo o período de 04/jul/1994 a 31/out/2003. Os lambdas utilizados na metodologia analítica variaram a cada 100 dias da amostra, tendo sido obtidos por processo de otimização que encontrava para a carteira o ES mais próximo da perda efetiva quando o VaR falhava, tendo o parâmetro K definido o início da primeira janela de calibragem de 250 dias ... 59

Tabela 6 - Razão de verossimilhança caudal do teste de Berkowitz (2001) calculada para as 10

ações mais líquidas da Bovespa e para a carteira igualmente ponderada, para os níveis de significância α, considerando toda a série de retornos do período de 05/jul/1994 a 31/out/2003, com valor crítico de 5,99. ... 65

(15)

LISTA DE ILUSTRAÇÕES

Tabela 7 - Falhas na sub-aditividade das medidas de risco VaR e Expected Shortfall calculadas

pela metodologia híbrida para as 10 ações mais líquidas da Bovespa e para a carteira igualmente ponderada, abrangendo o período de 04/jul/1994 a 31/out/2003 e tempo de processamento do programa de cálculo elaborado no Excel das metodologias histórica, analítica com EWMA e híbrida. Os lambdas utilizados na metodologia híbrida variaram a cada 100 dias da amostra, tendo sido obtidos por processo de otimização que encontrava para a carteira o ES mais próximo da perda efetiva quando o VaR falhava, tendo o parâmetro K definido o início da primeira janela de calibragem de 250 dias. ... 70

Tabela 8 - Resultado do teste de Kupiec com valor crítico de 5% aplicado sobre o VaR

calculado pela metodologia híbrida para as 10 ações mais líquidas da Bovespa e para a carteira igualmente ponderada, somente posição comprada, abrangendo o período de 04/jul/1994 a 31/out/2003. Os lambdas utilizados na metodologia híbrida variaram a cada 100 dias da amostra, tendo sido obtidos por processo de otimização que encontrava para a carteira o ES mais próximo da perda efetiva quando o VaR falhava, tendo o parâmetro K definido o início da primeira janela de calibragem de 250 dias. ... 74

Tabela 9 - Resultado da aplicação do critério de Pitman para a carteira igualmente ponderada,

comparando dois a dois o ES EWMA, ES Histórico e o ES Híbrido nos dias em que houve falha comum do VaR nas três metodologias, para as 12 combinações de parâmetros nível α e tamanho da janela K, abrangendo o período de 04/jul/1994 a 31/out/2003... 78

Tabela 10 - Resultado da aplicação do critério de Pitman para as 10 ações mais líquidas da

Bovespa em novembro de 2003, comparando dois a dois o ES EWMA, ES Histórico e o ES Híbrido nos dias em que houve falha comum do VaR nas três metodologias, para as 12 combinações de parâmetros nível α e tamanho da janela K, abrangendo o período de 04/jul/1994 a 31/out/2003... 79

(16)

ÍNDICE

1 INTRODUÇÃO... 1

2 REVISÃO DA LITERATURA... 4

2.1 Valor em Risco ... 4

2.2 Medidas Coerentes de Risco... 5

2.3 Críticas ao Valor em Risco ... 7

2.4 Expected Shortfall... 13

2.5 Metodologia Híbrida do Cálculo do VaR – The Best of Both Worlds ... 19

2.6 Metodologias de Backtesting... 22

2.6.1 Critério de Pitman... 29

3 METODOLOGIA ... 32

3.1 Amostra ... 32

3.2 Metodologias de Cálculo do VaR e do Expected Shortfall... 34

3.2.1 Simulação Histórica... 34

3.2.2 Método analítico com utilização do processo EWMA (Exponential Weighted Moving Average) ... 37

(17)

3.2.4 Proposta de uma Metodologia Híbrida para o Cálculo do Expected

Shortfall – The Best of Both Worlds ... 45

3.2.5 Obtenção do lambda ótimo ... 48

3.3 Aplicação do critério de Pitman ... 53

4 RESULTADOS ... 55

4.1 Valor em Risco e Expected Shortfall pela Metodologia Histórica e Analítica com uso da Volatilidade EWMA ... 56

4.2 Valor em Risco e Expected Shortfall pela Metodologia Híbrida – The Best of Both Worlds ... 69

4.3 Resultados do Critério de Pitman ... 77

5 CONCLUSÕES... 81

(18)

1 INTRODUÇÃO

No final dos anos 70 e nos anos 80, um grande número de instituições financeiras nos EUA começou a trabalhar em modelos internos com o objetivo de agregar riscos incorridos pelas instituições como um todo. Inicialmente as empresas desenvolviam os modelos com o propósito de administração do próprio risco e à medida que se tornavam maiores e mais abrangentes, os sistemas ficavam muito mais complexos, mas ao mesmo tempo mais importantes.

O mais conhecido desses sistemas é o sistema RiskMetricsTM desenvolvido pelo banco JP Morgan. Em outubro de 1994, o banco J.P. Morgan deu início à popularização no mercado financeiro do Valor em Risco (VaR-Value at Risk) ao apresentar pela internet e inteiramente grátis, o seu sistema RiskMetricsTM_{, que fornecia orientações e dados para o cálculo do}

VaR.

O primeiro passo para uma administração de risco mais rígida dado pelos órgãos reguladores com relação às instituições financeiras foi o estabelecimento do histórico Acordo de Basiléia de 1988, que definiu exigências mínimas de capital para tais instituições, como forma de proteção contra o risco de crédito. Com o tempo o Valor em Risco cresceu tanto em importância e reconhecimento, que o Comitê de Basiléia publicou em 1996 um adendo ao Acordo de Basiléia, oferecendo o VaR como uma abordagem alternativa para exigências de capital baseadas nos modelos internos dos

(19)

bancos, incorporando definitivamente o conceito dessa medida de risco ao contexto regulamentar, só que desta vez para fazer face ao risco de mercado. Isto contribuiu em muito para a disseminação do VaR no mercado financeiro mundial.

Entretanto, em 1997 alguns pesquisadores definiram o conceito de medidas coerentes de risco e concluíram que o VaR calculado pela simulação histórica não seria uma medida coerente de risco por não atender à propriedade da sub-aditividade, um dos pressupostos da dita coerência. Ao mesmo tempo definiram o conceito da medida de risco Expected Shortfall, a qual seria totalmente coerente pelo referido conceito. Esta nova medida de risco só não teria sido ainda adotada pelo Comitê de Basiléia pela dificuldade existente em se fazer o seu backtesting.

Na mesma época outros pesquisadores propuseram uma nova metodologia de cálculo do VaR, chamada de híbrida ou de The Best of Both

Worlds porque misturava e se propunha a aproveitavar o que havia de melhor

na metodologia de simulação histórica e na metodologia analítica com uso da volatilidade EWMA proposta no RiskMetricsTM.

Surgiu então ao professor Eduardo Facó Lemgruber, a idéia de associar ao conceito do Expected Shortfall ainda não muito abordado no Brasil, o conceito da metodologia híbrida que já havia sido aplicada ao VaR, idéia esta que foi implementada e analisada neste trabalho. Assim, o objetivo principal deste trabalho de pesquisa é o de analisar a coerência do Valor em Risco e do

(20)

simulação histórica, metodologia analítica com uso da volatilidade EWMA e metodologia híbrida), tendo como amostra as ações mais líquidas em novembro de 2003 do Mercado Brasileiro de Ações, no período que vai do início do Plano Real até outubro de 2003, analisando e criticando uma inédita metodologia híbrida para o cálculo do Expected Shortfall.

Uma delimitação do estudo a ser destacada é que não se analisou a coerência das medidas de risco sob todos os seus quatro aspectos, procurando-se ater a discussão à propriedade da sub-aditividade que é a principal crítica ao VaR histórico com relação à sua coerência. A literatura afirma que o VaR atende aos demais critérios da coerência.

Na seção 2 faz-se uma revisão da literatura dividindo-se por sub-tópicos conforme o tema ligado à pesquisa, na seção 3 é realizada uma detalhada descrição da metodologia empregada; os resultados e sua discussão são abordados na seção 4 e finalizando, as conclusões são apresentadas na seção 5.

(21)

2 REVISÃO DA LITERATURA

2.1 Valor em Risco

O VaR é definido como a perda máxima provável num determinando horizonte de tempo dentro de um determinado nível de confiança. O VaR ao nível de confiança de 100 (1-α)%, ou nível de significância α%, é definido como o simétrico do quantil α superior da distribuição dos retornos. O VaR fornece aos usuários uma medida concisa do risco de mercado, resumida num único valor monetário. Por exemplo, diz-se que um VaR de R$ 10 milhões significa a perda máxima provável das posições da empresa com 95% (1-α) de probabilidade para um horizonte de tempo de 1 dia, ou seja, há apenas cinco oportunidades em 100, sob condições normais de mercado, de ocorrer uma perda acima de R$ 10 milhões.

Usou-se o termo simétrico na definição do VaR porque nesta dissertação deseja-se obter um valor de VaR positivo, pois se refere a uma perda máxima provável. Alternativamente, poder-se-ia ter trabalhado com um VaR de valor negativo, o qual seria interpretado como um retorno mínimo provável, mas o importante é entender que o significado é o mesmo. Considerou-se a primeira interpretação como sendo a melhor, daí a sua adoção. Na literatura são encontradas as duas formas de se interpretar o VaR.

A definição formal de quantil superior (_{x ), quantil inferior (}( )α

( )α

x ) e de

(22)

( )α ₌

{

_x_∈_ℜ_Ρ

[

_X _≤ _x

]

_>_α

}

x inf

[

]

{

α

}

α = x∈ℜΡ X ≤ x ≥ x₍ ₎ inf ( )α x

VaR=− , ou seja, o simétrico do quantil α superior.

Sendo X a variável aleatória dos retornos de um ativo ou de uma carteira.

Observando numa curva com a distribuição de probabilidades, se z é o ponto tal que P

[

X ≤ é exatamente igual a α, o quantil α inferior será o z

]

próprio z ou um ponto à direita dele, e o quantil α superior será sempre um ponto à direita de z .

Com a divulgação do sistema RiskMetricsTM e com a adoção dos modelos internos pelo Comitê de Basiléia em 1996, o VaR tornou-se a principal ferramenta de gerenciamento de risco das instituições financeiras. Entretanto, no fim dos anos 90, o VaR passou a ser alvo de críticas que até o momento ainda não provocaram de forma expressiva a diminuição de sua utilização no mercado financeiro. Algumas dessas críticas serão abordadas adiante, mas antes é preciso estudar o conceito de medidas coerentes de risco.

2.2 Medidas Coerentes de Risco

Artzner, Delbaen, Eber e Heath (1997) em um pequeno artigo intitulado

(23)

sucinta um conjunto de propriedades, as quais uma medida de risco deveria possuir para ser considerada uma medida coerente de risco.

Já no artigo Coherent Measures of Risk, publicado no periódico

Matematical Finance, os mesmos Artzner, Delbaen, Eber e Heath (1999) são

bem mais completos, com apresentação de provas matemáticas ao tratar dos axiomas para a definição de medidas coerentes de risco. Meyers (2000) cita que as idéias do artigo de Artzner et al. (1999) mereciam ser bem entendidas pelos membros da Casualty Actuarial Society (CAS), porém, afirma que o artigo de Artzner et al. foi escrito para um público acadêmico com elevado treinamento em Matemática e Estatística, havendo uma grande dificuldade na sua leitura e no seu entendimento pelos membros da CAS. Meyers (2000), então, apresenta as idéias de Artzner et al. (1999) numa linguagem mais acessível àquele público. Baseando-se nestes artigos, apresenta-se a seguir a definição de medidas coerentes de risco.

Sejam X e Y variáveis aleatórias representando as perdas de dois ativos para diferentes cenários e ρ(X), ρ(Y) uma mesma medida de risco tomada para as duas séries X e Y.

Para ser considerada uma medida coerente de risco, ela deve apresentar as seguintes propriedades:

1) Sub-aditividade. ) ( ) ( ) (X Y ρ X ρ Y ρ + ≤ +

(24)

A medida de risco da carteira é menor ou igual à soma das medidas individuais de risco dos ativos. Neste ponto chama-se a atenção para o fato de que nesta verificação, os pesos dos ativos na composição da carteira devem ser aplicados às medidas de risco individuais. A sub-aditividade reflete o efeito da diversificação das carteiras, ou seja, que a associação de ativos em carteiras não cria um risco adicional, pelo contrário, pode diminuir o risco.

2) Monotonicidade. Se X ≤ , para cada cenário, então: Y

) ( ) (X ρ Y

ρ ≤

3) Homogeneidade Positiva. Para todo λ ≥0,

) ( )

(λX λρ X

ρ =

4) Invariância de translação. Para toda constante c,

c X c X + )= ( )+ ( ρ ρ

Uma medida de risco que satisfaça a estas quatro propriedades é chamada de medida coerente de risco. Neste trabalho, será dada atenção somente à propriedade da sub-aditividade.

2.3 Críticas ao Valor em Risco

O VaR tornou-se uma medida padrão usada no gerenciamento de risco devido à simplicidade de seu conceito, facilidade computacional e sua imediata aplicabilidade. Entretanto, muitos autores têm levantado alguns problemas

(25)

com relação ao VaR. Artzner et al. (1997, 1999), por exemplo, citaram que o VaR mede somente percentis da distribuição de lucros e perdas, não considerando quaisquer perdas além do nível do VaR. Apesar de satisfazer as propriedades da monotonicidade, homogeneidade e invariância de translação, o VaR histórico falha no critério da sub-aditividade, não sendo, portanto, uma medida coerente de risco.

Segundo Yamai e Yoshiba (2002), estes problemas na sub-aditividade são mais graves quando a distribuição dos retornos não obedece à distribuição Normal. Quando a distribuição é Normal é mais difícil aparecerem casos de ausência de sub-aditividade, mas não é impossível. Isto ficou evidente num exercício feito no programa Matlab: a partir de uma matriz de correlações entre 5 variáveis, de um vetor com 5 preços iniciais, de um vetor com 5 volatilidades diárias e de outro com 5 retornos médios, foram gerados 5 x 504 preços segundo o modelo geométrico browniano, utilizando a fatoração de Cholesky (HULL, 1999). Calculou-se o VaR histórico utilizando uma janela de 100 retornos para os 5 ativos simulados e mais para a carteira com pesos iguais nos ativos, para os níveis de confiança de 90%. Este experimento foi repetido 10.000 vezes, obtendo-se no total 405.000 valores em risco para os 5 ativos e carteira. Só não foi observada a sub-aditividade em pouquíssimos 27 casos.

Outra importante crítica ao VaR é que o risco presente na cauda da distribuição dos retornos pode trazer sérios problemas práticos em alguns casos. Yamai e Yoshiba (2002) defendem que a informação dada pelo VaR pode enganar investidores racionais que procuram maximizar a função de

(26)

utilidade esperada. Investidores que empregam somente o VaR como medida de risco estão propensos a construir posições arriscadas que podem resultar em grandes perdas nos níveis além do VaR. A relevância da falta da sub-aditividade do VaR vai depender das preferências do administrador de risco sob o ponto de vista da praticidade, pois há quem já tenha tomado conhecimento deste problema e nem por isso deixou de utilizar o VaR histórico. No entanto, com relação às possíveis pesadas perdas na cauda da distribuição, o problema é de suma importância, pois está relacionado à insolvência da instituição financeira causada por condições adversas no mercado, que é um assunto central para a administração de risco das instituições e para os órgãos reguladores.

Artzner et al. (1999) apresentam em seu artigo dois exemplos teóricos que demonstram a deficiência do VaR histórico com relação a prever as perdas presentes na cauda da distribuição e na propriedade da sub-aditividade. Um dos exemplos trabalha com títulos de renda fixa e o outro com posições vendidas em opções digitais, ambos não obedecendo à distribuição Normal. Será reproduzido a seguir, com algumas alterações, o exemplo das posições vendidas nas opções digitais por ser mais interessante e factível.

Considere duas opções digitais sobre uma ação, ambas com a mesma data de exercício T. A primeira opção denominada A, com um prêmio inicial u, paga 1.000 se, e somente se, o valor da ação na data T for maior que U, do contrário não paga nada. A segunda opção denominada B, com prêmio inicial

(27)

(u +λ)<1000, e do contrário, também não paga nada. Uma vez que opções são ativos não-lineares, é claro que a sua distribuição de lucros e perdas não é normal, até mesmo se os preços do ativo subjacente obedecem a uma distribuição Normal.

Suponha que L e U obedeçam a uma distribuição de probabilidade tal que a probabilidade de S<L = Pr(S>U) = 0,008, sendo S o preço da ação na data T, no vencimento. Considere dois operadores, A e B, vendendo uma unidade da opção A e B, respectivamente. Na Figura 1 são apresentados os gráficos de lucros e perdas da posição vendida nas opções e na carteira contendo as duas.

O VaR de nível de confiança 99% (1-α) do operador A é zero, pois o percentil 1% da sua distribuição de lucros e perdas é um lucro igual a u, logo, seu VaR, sua perda máxima provável com 99% de certeza é zero. Similarmente, o VaR de 99% do operador B é zero, pois o percentil 1% de sua distribuição de retornos é um lucro igual a λ, o que resulta em VaR = 0. Este é um claro exemplo de elevado risco presente na cauda da distribuição, ou seja, o VaR não capta na cauda esquerda da distribuição as possíveis elevadas perdas das opções A e B, pois a probabilidade da perda é menor do que o _α (0,01).

(28)

Figura 1

Lucros e perdas da posição vendida nas opções digitais A e B e na carteira vendida nas duas opções. A opção A, vendida por u, paga 1.000 se o preço do ativo subjacente S for maior que o preço de exercício U, enquanto a opção B, vendida por λλλλ, paga 1.000 se S < L.

-(A+B) - A - B S U L u+λ + λ + u Lucros/Perdas -1000+λ+u -1000+λ _-1000+u Pr(S<L)=0,008 Pr(S>U)=0,008 Pr(L<S<U)=0,984

Entretanto, o VaR de 99% da carteira representada pela posição vendida em A e B ao mesmo tempo, é de (1000 – u – λ), uma vez que este é o simétrico de seu percentil 1%, pois Pr(S>U ou S<L) = 0,016, o que é maior do que o α (0,01). Logo, uma vez que VaR(A) + VaR(B) < VaR(A+B), 0+0 < (1000-u-l), fica claro neste exemplo que o VaR nem sempre é sub-aditivo. O Quadro 1 a seguir apresenta os lucros e perdas das opções.

(29)

Quadro 1

VaR ao nível de confiança de 99% e lucros e perdas da posição vendida nas opções digitais A e B e na carteira vendida nas duas opções. A opção A, vendida por u, paga 1.000 se o preço do ativo subjacente S for maior que o preço de exercício U, enquanto a opção B, vendida por λλλλ, paga 1.000 se S < L. Preço da Ação Probabilidade - A - B - (A + B) S < L 0,008 u _-1000+u+λ _-1000+u+λ 0,984 u _λ _u+λ U < S 0,008 -1000+u _λ _-1000+u+λ 0 0 _1000-u-λ VaR U S L ≤ ≤

Yamai e Yoshiba (2002) demonstram que a administração do risco com base somente no VaR pode aumentar a concentração em títulos de crédito, pois o VaR não leva em conta o aumento do risco de grandes perdas devido a esta concentração, o mesmo ocorrendo no exemplo das opções digitais. Baseando-se somente no VaR de 1%, um investidor pode vender a opção A, por exemplo, acreditando que seu risco é baixo pelo fato de o VaR ser zero. Isto ocorre porque ele não está considerando as perdas além do VaR. Daníelsson (2002) também reforça que o embasamento do VaR num simples quantil da distribuição de lucros e perdas implica facilidades na manipulação do risco com estratégias engenhosamente montadas.

O VaR calculado da forma analítica não apresenta o problema de não ser sub-aditivo, uma vez que, assumindo a normalidade dos retornos, o VaR é sempre um múltiplo do desvio-padrão, o que satisfaz a sub-aditividade, pois o desvio-padrão atende sempre à sub-aditividade conforme é demonstrado por Yamai e Yoshiba (2002). O VaR calculado da forma analítica para cada

(30)

unidade monetária investida e assumindo a normalidade, é o simétrico do produto da volatilidade (_{σ ) pela inversa da função distributiva acumulada da} Normal Padrão para o nível de significância α desejado (_Φ−1

( )

α _).

( )

α σ _×_Φ−1 − = VaR

2.4 Expected Shortfall

De acordo com o dicionário Merrian-Webster Online, shortfall é o valor ou tamanho de uma falha.

Para aliviar os problemas de falta de sub-aditividade e de não considerar as perdas presentes na cauda inerentes ao VaR, Artzner et al. (1997, 1999) propuseram o uso do Expected Shortfall (ES). Expected Shortfall é definido como uma esperança condicional, é a expectativa de perda dado que a perda foi maior do que o VaR, definição ilustrada na Figura 2 adiante. Algumas variantes de Expected shortfall têm sido encontradas na literatura, apresentando pequenos detalhes de um nível matemático bem profundo que diferenciam uma definição da outra, aparecendo inclusive com terminologias diferentes. Porém, todas procuram obter basicamente a expectativa de perda uma vez que esta supera o VaR. Acerbi & Tasche (2001, 2002) avaliam algumas destas diferentes definições dadas por diferentes autores, tais como

Tail Conditional Expectations, Conditional Value-at-Risk, Tail Mean e Expected Shortfall, concluindo que a maioria delas leva a resultados semelhantes no que

(31)

contínuas de lucros e perdas. Entretanto, quando a distribuição de resultados apresenta descontinuidade, estas diferentes definições de ES nem sempre serão sub-aditivas. Concluem ainda que a definição generalizada dada por Acerbi e Tasche (2001) para o ES é a única que é robusta no sentido de apresentar sempre a sub-aditividade, independentemente da distribuição de probabilidade por trás dos retornos.

A definição formal generalizada de Expected Shortfall descrita em Acerbi e Tasche (2001, 2002), considerando o corolário 4.3 de Acerbi e Tasche (2002) é dada por: ( ) ( ) { }

(

[

( )

]

)

( )

[

]

       Ε Ι + −Ρ ≤ − = ≤ α α α α α α X x x X ES X x ( ) { }

(

[

( )

]

)

( )

[

]

       Ε Ι − −Ρ ≤− − = ≤− α α α α α X VaR VaR X _X _VaR Onde:

X = série de retornos da janela considerada, é a variável aleatória dos

retornos;

{condição}

Ι = função indicadora, que é 1 se a condição entre as chaves é verdadeira e 0 caso não seja.

( )α

(32)

Quando a distribuição dos retornos é contínua, P

[

X ≤ VaR−

]

=_α, e a equação anterior se reduz para:

( )α

[

X X VaR( )α

]

ES =−Ε ≤−

Informalmente, enquanto o VaR histórico ao nível de confiança de 95%, por exemplo, é o simétrico do percentil 5% de uma distribuição de retornos, o ES é o simétrico da média dos 5% piores retornos, sendo, portanto, um valor sempre maior do que o VaR conforme se observa na Figura 2 a seguir, analisando-se sob a ótica da perda, do valor absoluto. Então, o ES leva em conta a magnitude da perda além do VaR, enquanto o VaR não contém esta informação conforme Kerkhof e Melenberg (2003).

Figura 2

Função Densidade de Probabilidade (pdf) dos lucros e perdas com distribuição Normal, e representação do VaR e do Expected Shortfall, obtidos ao nível de significância de αααα%.

(33)

Conforme Yamai e Yoshiba (2002) e Kerkhof e Melenberg (2003), quando a distribuição por trás da geração dos retornos é conhecida e esta não precisa ser necessariamente a Normal, o ES e o VaR são múltiplos um do outro, porque ambos são múltiplos da volatilidade. Conforme o trabalho desses autores, para a distribuição Normal, o ES é dado pela fórmula:

( )α φ

(

_α

( )

α

)

1 − Φ = ES

Sendo _{φ a função densidade da distribuição Normal padrão, Φ a} função distributiva acumulada da Normal padrão e α o nível de significância.

A partir desta fórmula, entendeu-se no presente trabalho que quando a distribuição dos retornos é a Normal, a relação entre o VaR e o ES é dada por:

( )

(

( )

)

( ) ( ) σ σ σ φ σ α α φ α α α ×     − Φ     − = × Φ = − VaR VaR ES 1 ,

Sendo σ a volatilidade do ativo e o VaR_{( )}α =−Φ−1

( )

α ×σ .

O ES ao nível de α% corresponderá ao VaR a um determinado nível β%, sempre menor que α%. Por exemplo, considerando-se a distribuição Normal, o ES ao nível de 2,5% (o ES calculado considerando-se como condição o VaR de 2,5%) tem o mesmo valor que o VaR ao nível de 1%. Obteve-se então a relação entre o α e o β para a distribuição Normal:

(34)

[

( )

]

      Φ Φ − = − α α φ β 1 1

Da mesma forma, se considerarmos para os retornos uma outra distribuição conhecida como a distribuição Uniforme U(0,1), haverá uma equivalência entre o ES a um nível α e um VaR a um nível β. O ES ao nível de 5% será igual ao VaR ao nível de 2,5%, por exemplo.

Yamai e Yoshiba (2002) também analisaram as implicações práticas do uso do VaR e do ES para o gerenciamento do risco em Finanças. Conforme visto anteriormente, concluíram que a informação dada pelo VaR pode orientar mal investidores que querem maximizar a sua função utilidade, pois se baseando somente no VaR podem estar construindo uma perigosa posição que resultaria numa elevada perda nos níveis além do VaR. Usando o ES, investidores poderiam diminuir este problema, dado que estariam considerando também as perdas além do VaR. Para estes autores, a efetividade do ES, entretanto, ainda depende de se obter estabilidade na estimação de seu valor e da escolha de eficientes métodos de backtesting. É mais difícil de testar o ES do que o VaR e este é um dos motivos pelos quais o ES ainda está ausente do acordo de Basiléia.

O VaR é a medida mais utilizada para calcular o capital econômico na administração de risco financeiro, sendo também adotado pelos órgãos reguladores para as exigências de capital devido à sua simplicidade conceitual: o VaR ao nível de significância de 1% corresponde ao capital necessário para manter a probabilidade de insolvência da empresa abaixo de 1%. Por outro

(35)

lado, o Expected Shortfall mede na média quanto se pode perder nos níveis além do VaR. Como por definição o ES é maior do que o VaR, o cálculo do capital econômico usando o ES é mais conservador do que usando o VaR. Todavia, para Yamai e Yoshiba (2002) o capital econômico calculado pelo ES fica difícil de ser interpretado com relação à probabilidade de insolvência da instituição. Diferentemente do VaR, o ES não corresponde necessariamente ao capital necessário para manter a probabilidade de quebra da empresa abaixo de um determinado nível.

Ramos, Santos e Lemgruber (2002) estudaram para uma amostra da ação Petrobrás, o comportamento do Expected Shortfall, ou BvaR (Beyond VaR), que é como se referem à medida de risco no artigo, calculado pelo método histórico e pela aproximação normal, concluindo que à medida que o nível de confiança é aumentado, o BVaR calculado pelo método histórico tende a divergir do VaR, enquanto que pela aproximação normal o BVaR tende a convergir para o VaR. Entende-se que se adotando uma conhecida distribuição de retornos, há uma relação entre o VaR e o ES conforme explicado anteriormente. Analisando as perdas esperadas além do VaR utilizando a mesma amostra, observaram ainda que as menores razões (BVaR – VaR)/VaR foram obtidas pelo método normal, indicando que na distribuição empírica as perdas esperadas em caso do VaR ser ultrapassado são muito mais dispersas além do VaR do que o previsto pela distribuição Normal.

Longin (2001) é outro autor que afirma que enquanto o VaR se foca na freqüência de ocorrência de valores extremos, o Expected Shortfall se utiliza

(36)

tanto da freqüência das falhas (denominador) como do tamanho das perdas que ultrapassam o VaR (numerador), o que fica evidente na média aritmética presente em sua fórmula. Conclui que o ES pode não convergir, mas, sim, situar-se mais próximo do VaR, como ocorre em distribuições normais, ou ficar mais afastado, como ocorre em distribuições com caudas gordas (fat tail).

De acordo com Longin (2001), uma dificuldade na implementação de medidas de risco baseadas na cauda da distribuição dos retornos como o

Expected Shortfall, é a pouca quantidade de informações. Por exemplo, o ES

estimado com a distribuição empírica envolve somente poucas observações da amostra e a média calculada com poucas observações pode resultar numa elevada estimativa desta medida de risco.

2.5 Metodologia Híbrida do Cálculo do VaR – The Best of Both

Worlds

A abordagem híbrida de cálculo do VaR, apresentada em Boudoukh, Richardson e Whitelaw (1998), combina as duas abordagens mais utilizadas de estimação do VaR, que são a simulação histórica e o método analítico

RiskMetricsTM com o cálculo da volatilidade EWMA (Exponential Weighted

Moving Average), propondo-se a herdar o que há de melhor nas duas.

A utilização do alisamento exponencial (EWMA), aplicando-se pesos exponencialmente decrescentes a retornos passados, tem a vantagem de capturar o comportamento cíclico da volatilidade dos retornos. Entretanto, esta metodologia tem a desvantagem de pressupor a hipótese de normalidade dos

(37)

retornos, estando em desacordo com as séries de dados financeiros, que geralmente apresentam caudas gordas e assimetria. Como previamente documentado por Kendall (1953), Mandelbrot (1963) e Fama (1965), a suposição de normalidade é pouco realista, à medida que a distribuição dos retornos das séries financeiras parece tender para caudas mais gordas do que a da distribuição Normal. Com isso, a suposição de normalidade produz uma subestimação do Valor em Risco. Duffie e Pan (1997) apontam que as possíveis causas para a existência das caudas gordas nas séries financeiras são a presença de saltos, que representam mudanças descontínuas nos preços.

Já a metodologia da simulação histórica não faz hipóteses acerca da distribuição dos retornos. Ela estima percentis diretamente sobre a distribuição histórica dos retornos a fim de obter o VaR, considerando dessa forma, as caudas gordas e assimetrias por ventura existentes na distribuição empírica. Todavia, apresenta dois grandes problemas: a dificuldade de estimar percentis extremos quando há poucos dados e o fato de não considerar que a volatilidade varia com o tempo ao pressupor que os retornos são independentes e identicamente distribuídos (iid)1. Fierli (2002) ressaltou que esta suposição é violada pelas evidências de cluster de volatilidade e que esta violação leva a uma inconsistência na estimativa do Valor em Risco. Papageorgiou e Paskov (1999) também apontaram algumas críticas ao método

1_{Independent and identically distributed. Identicamente distribuída significa que a probabilidade}

de ocorrência de uma específica perda é a mesma para cada dia. Independência implica que a escala do movimento do preço em um período não influenciará o movimento de preços subseqüentes.

(38)

de simulação histórica, dentre elas a suposição de que a distribuição passada dos retornos pode representar a futura distribuição, ou seja, o método considera a distribuição como estacionária, além de apresentar uma grande sensibilidade dos resultados em relação à extensão do período histórico. Jorion (1997) também acrescenta como críticas o fato de o método não tratar de forma adequada as situações de volatilidade temporariamente elevada e o fato de o método ponderar igualmente todas as observações na janela, inclusive os dados mais antigos. O uso de uma janela histórica maior resolveria o primeiro problema, o da dificuldade de estimar percentis extremos com poucos dados, ao mesmo tempo em que deixaria sem solução o segundo, o da consideração que a volatilidade não varia com o tempo, pois a única maneira de atribuir mais peso a informações mais recentes na abordagem da simulação histórica pura e simples, é através da utilização de janelas históricas mais curtas.

Enquanto na simulação histórica atribuem-se pesos iguais a cada observação da janela considerada, na abordagem híbrida do melhor dos dois mundos, atribuem-se pesos exponencialmente decrescentes aos retornos históricos. Logo, enquanto na simulação histórica a obtenção do VaR de 1% com a utilização de uma janela de 250 retornos diários implica identificar a terceira menor observação, isso pode significar mais ou menos observações na abordagem híbrida. O número exato de observações vai depender de os retornos extremamente baixos terem sido verificados num período mais recente ou mais distante no tempo, o que ficará bem claro na seção Metodologia.

(39)

Os resultados empíricos em Boudoukh et al. (1998) mostraram significativas melhorias no desempenho estatístico da metodologia híbrida em relação à metodologia do RiskMetricsTM e da simulação histórica, o que foi ainda mais expressivo nos ativos cuja distribuição dos retornos apresentava caudas gordas.

Pritsker (2001) afirmou que o método híbrido parecer ser o remédio para os principais problemas dos métodos de simulação histórica porque muitas grandes perdas são imediatamente refletidas no VaR, mas conclui dizendo que, infelizmente, o método híbrido não se comporta tão bem. Tanto a simulação histórica como o método híbrido assumem implicitamente que o que acontece na cauda superior da distribuição de lucros e perdas (lucros) não traz nenhuma informação para a cauda esquerda (perdas), que é de onde é tirado o VaR. Isso significa que os grandes lucros nunca refletem num aumento na dispersão do retornos usando este dois métodos, o histórico e o híbrido.

A revisão do método híbrido tem dois propósitos: será analisado neste trabalho a sub-aditividade desta medida no mercado brasileiro de ações e será proposta uma metodologia híbrida de cálculo do Expected Shortfall, a exemplo do que foi realizado com o VaR por Boudoukh et al. (1998).

2.6 Metodologias de Backtesting

De acordo com Yamai e Yoshiba (2002), a medida de risco Expected

Shortfall só não foi ainda recomendada pelo Comitê de Basiléia devido às

(40)

critério da sub-aditividade, ele ainda é a medida de risco mais recomendada pelos órgãos reguladores porque é uma medida de risco que possui amplos, fáceis e bem difundidos processos de backtesting, sendo o mais conhecido aquele desenvolvido em Kupiec (1995).

O backtesting do Expected Shortfall poderia ser feito comparando-se a média das perdas realizadas além do nível do VaR com a perda média estimada, o ES. Isto iria requerer mais dados do que o backtesting do VaR, uma vez que a perda além do VaR não é muito freqüente, o que torna difícil estimar com precisão a média dessas perdas. Para o VaR bastaria contar as falhas, para o ES é necessário calcular uma média, o que requer mais dados caso se deseje ser preciso.

Kerkhof e Melenberg (2003) afirmam que tanto o VaR como o Expected

Shortfall são métodos baseados em níveis de confiança, o que significa que

primeiramente é preciso escolher um nível _{α, e a medida de risco dependerá} da correspondente cauda esquerda da distribuição de lucros e perdas. Como o interesse é proteger-se contra adversidades nas condições do mercado, normalmente estes níveis são baixos como 5 e 1%, que é o nível escolhido pelo Comitê de Basiléia em 1996. Caso se comparassem os resultados do

backtesting do Expected Shortfall e do Valor em Risco calculados com um

mesmo nível _{α num teste como o de Kupiec, encontrar-se-ia que o VaR} apresenta um desempenho superior, ainda que o ES seja um valor mais conservador. Ou seja, o número de falhas do VaR se encaixaria melhor entre os limites de Kupiec do que o número de falhas do ES, que seria um número

(41)

de falhas menor por ser o ES uma medida mais conservadora. Entretanto, para uma comparação válida dos resultados de um backtesting como esse, deve-se olhar para os quantis, z=-2,33, por exemplo, e não para os níveis, α=1%, por exemplo. Fazendo isso para a distribuição Normal, encontra-se que o ES de nível α = 2,5% equivale ao VaR de α = 1%.

Contudo, nesta pesquisa entendeu-se que não há muito sentido em comparar o Expected Shortfall com o retorno efetivo verificando se houve falha, uma vez que o ES é uma esperança condicional, ele não se propõe a dizer a probabilidade de falhas e conseqüentemente, dizer a quantidade esperada de falhas. Já o VaR de _{α = 5% sugere a idéia de que haverá falhas em 5% dos} casos. O ES simplesmente dá uma expectativa da perda caso a mesma supere o VaR.

Testes pontuais como o de Kupiec (1995) verificam somente se o VaR falhou ou não falhou, e não o tamanho da falha. Transformando a informação da distribuição de lucros e perdas em somente uma de suas características, no caso se o VaR foi violado ou não, se falhou ou não falhou, perdem-se relevantes informações contidas na distribuição, como o tamanho da falha, por exemplo. Simplesmente contar o número de violações por ano usa muito pouca informação sobre os dados. Dessa forma, há muitos modelos em Finanças e Economia que envolvem estimativas que não podem ser resumidas por um simples ponto da distribuição de probabilidades prevista. Christoffersen (1998) enfatiza que sendo intervalos de previsão, há mais informações nos intervalos do que num simples ponto, propondo métodos para avaliar previsões

(42)

de intervalos. Estes métodos rebatem de uma certa forma o argumento de Kupiec (1995) de que conjuntos extensos de dados são necessários para verificar a precisão dos modelos. Contudo, Lopez (1999) afirma que até os métodos de avaliação de intervalos permanecem sendo dependentes de vasta quantidade de dados, uma vez que somente observam se uma violação ocorre ou não, e o tamanho da violação.

Os modelos podem também ser testados com bastante precisão examinando-se muitos de seus percentis, o que levado ao extremo significa avaliar toda a distribuição de probabilidades prevista, comparando-se todo percentil da previsão com os dados efetivamente realizados. Apesar de algumas técnicas estarem atualmente disponíveis para testar intervalos ou previsões de distribuição de probabilidade, os métodos existentes tendem a apresentar baixo poder em amostras de pequeno tamanho, o que ocorre com freqüência.

Partindo dos trabalhos de Crnkovic e Drachman (1996) e de Diebold, Gunther e Tay (1997), Berkowitz (2001) apresenta uma nova maneira de avaliar modelos baseando-se na análise de toda a distribuição de probabilidade prevista, fazendo com que a informação contida na previsão acerca da distribuição de retornos combinada às realizações ex-post seja suficiente para construir um teste robusto até com pequenas amostras de poucas 100 observações.

Berkowitz (2001) introduz uma extensão da transformação de Rosenblatt (1952) que produz sob a hipótese nula, variáveis iid conforme a

(43)

distribuição N(0,1), o que permite a estimação da verossimilhança gaussiana e a construção de testes estatísticos baseados na verossimilhança que são convenientes, flexíveis e que possuem boas propriedades com relação ao tamanho da amostra. Apresentam-se a seguir as bases para o teste de Berkowitz (2001).

Seja _Φ−1(_⋅)_{a inversa da função de distribuição da Normal Padrão,}_F

()

_⋅ a função de distribuição prevista no seu modelo e y a série de dados efetivamente realizados, a extensão da transformação de Rosenblatt (1952) é dada por: z_t ₌_Φ−1

[

F

( )

y_t

]

_{, sendo}

t

z os dados transformados. Sob a hipótese

nula de que a distribuição que você está prevendo é igual à distribuição dos dados realizados, z é distribuído conforme a Normal (0,1). Como sob a _t

hipótese nula, z é N(0,1), uma grande variedade de testes pode ser construída _t

para se verificar se os z gerados são realmente N(0,1). Em particular, a _t

hipótese nula pode ser testada contra uma alternativa auto-regressiva de primeira ordem com média e variância possivelmente diferente de (0,1). Pode-se escrever:

(

t

)

t

t z

z −_µ =_ρ ₋₁ −_µ +_ε

Sendo _{µ a média da sua amostra, ρ a auto-correlação de lag 1. Se a} hipótese nula é verdadeira, _{ρ =0 e var(}_{ε )=1. A função de log-verossimilhança}_t associada à função acima é dada por:

(44)

( )

_{( )}

_∑

(

)

= −         − − − − − − − −     − − −     − − − T t t t z z T T z 2 2 2 1 2 2 2 2 1 2 2 2 ln 2 1 2 ln 2 1 1 2 1 2 1 ln 2 2 ln σ ρ µ σ π ρ σ ρ µ ρ σ π

Sendo _{σ a variância do erro e T, o tamanho da amostra. Para testar}2 a hipótese nula de que z é N(0,1), concentra-se no seguinte teste da razão de _t

verossimilhança:

(

)

            − − = 2 0,1,0 µ∧,σ∧ ,ρ∧ 2 L L LR Sendo _µ∧,_σ∧ ,_ρ∧ 2

, os valores estimados dos dados após a transformação. Sob a hipótese nula, este teste estatístico é distribuído conforme a distribuição Qui-quadrada com 3 graus de liberdade.

Entretanto, em muitos casos os administradores de risco estão interessados exclusivamente na precisão da descrição do comportamento das caudas da distribuição, não se interessando em modelos que rejeitem o seu

Expected Shortfall com base em discrepâncias por ventura existentes no meio

de sua distribuição prevista. Então, Berkowitz propõe um teste que intencionalmente ignora falhas do modelo que estão limitadas ao interior, no meio da distribuição, ou seja, não situadas nas caudas. Em outras palavras, o formato da cauda da distribuição estimada é comparado com a cauda dos dados efetivamente observados. Quaisquer observações que não caiam na cauda serão intencionalmente truncadas. Por exemplo, pode-se escolher como

(45)

limite um VaR = -1,64 (sob a ótica de retornos e não perdas) para focar a cauda até o percentil 5%. Então a nova variável de interesse será:

   < ≥ = VaR z se z VaR z se VaR z t t t t *

E a função de log-verossimilhança L (log-likelihood) da cauda será:

(

)

_∑

(

)

(

)

_∑

< =            − Φ − +    ₋ ₋ ₋ = VaR z z VaR t t t VaR z z L * * 1 ln 2 1 2 ln 2 1 / , * 2 2 2 * σ µ µ σ πσ σ µ

Esta expressão contém observações contidas na cauda da distribuição. Os dois primeiros termos representam a usual verossimilhança gaussiana das perdas. Testes baseados nesta expressão podem ser mais poderosos do que abordagens tradicionais, permitindo ainda aos usuários ignorarem falhas que podem não interessar por se localizarem no interior da distribuição. Para construir um teste de razão de verossimilhança, a hipótese nula requer novamente que µ =0 e _σ2 ₌1_{e pode-se avaliar uma verossimilhança restrita,}

) 1 , 0 (

L , com uma irrestrita, ( , ) 2 ∧ ∧

σ µ

L . Então a razão de verossimilhança da cauda será:     − − = 2 (0,1) (∧,∧ ) 2 σ µ L L LR_cauda

Sob a hipótese nula, este teste estatístico é distribuído conforme a Qui-quadrada com 2 graus de liberdade. Neste trabalho será aplicado o teste de razão de verossimilhança caudal proposto por Berkowitz.

(46)

A conclusão a que se chega é que o teste de Berkowitz, assim como outros testes encontrados na literatura, os quais se propõem a ser um bom

backtesting para o Expected Shortfall, estão, na verdade, avaliando se a

previsão que se faz acerca da distribuição de retornos é boa ou não. Ora, se você prevê com boa precisão a distribuição dos retornos, a medida de risco que você calcula por um método analítico em que faz suposições acerca da distribuição de retornos, seja VaR ou ES, terá um bom desempenho naquilo a que ela se propõe: o VaR a acertar a perda máxima com um determinado nível de confiança e o ES a ter uma boa previsão da perda quando o VaR é ultrapassado. Agora, quando se utiliza a própria distribuição empírica para calcular a medida de risco, que é o que se faz bastante nesta pesquisa com a metodologia de simulação histórica e com a híbrida, estes testes se tornam difíceis de se aplicar, ou até mesmo inadequados.

2.6.1 Critério de Pitman

Além de se pretender testar se o Expected Shortfall está sendo uma boa medida de risco, neste trabalho será verificado qual dos Expected

Shortfalls calculados de diferentes maneiras mais se aproxima da perda efetiva

quando o VaR falha. Fazendo isso, será possível analisar se uma metodologia de cálculo do ES é melhor do que outra no sentido de obter resultados que se aproximam mais da perda efetiva uma vez que o VaR tenha falhado. Para isso, utilizou-se uma medida de afastamento conhecida como critério de Pitman.

(47)

Sejam T e ₁ T estimadores do mesmo parâmetro ₂ _{θ calculados por}

metodologias diferentes. Pitman (1937) apresentou o seguinte conceito de proximidade: dizemos que T está mais próxima de ₁ _{θ do que}T se ₂

(

)

1₂

2

1 −θ < T −θ >

T

P . Em seu artigo, Pitman realmente encontrou melhores estimadores de acordo com esta regra.

Embora aparentemente natural, por um longo período este critério não atraiu muita atenção entre estatísticos, o que provavelmente ocorreu devido a dificuldades computacionais. Para um trabalho mais recente, veja Mendes e Merkle (2001) que também se referem a Johnson (1950). Realmente, para decidir qual é o melhor estimador entre dois competidores de acordo com o critério de Pitman, só precisamos conhecer a distribuição conjunta de (T ,₁ T ), o ₂

que poderia ser um requerimento forte, visto que usualmente T e ₁ T não serão ₂

independentes, uma vez que dependem das mesmas observações. O artigo de Rao (1981) marcou o renascimento do critério de Pitman, considerando-o uma alternativa ao erro médio quadrático. Depois do artigo de Rao, muitos estatísticos começaram a explorar o critério de Pitman e suas propriedades, e parece que agora este critério é uma ferramenta bem reconhecida e familiar em teoria e aplicações. (ABRAMOVITZ, 2001)

De acordo com a definição de Rao (1981), T está mais próximo de ₁ _θ

que T se ₂ P

(

T₁−θ ≤ T₂ −θ

)

≥ 1₂. Quando T é mais próximo de ₁ θ do que T 2 de acordo com as definições acima, então dizemos que T é p-melhor que ₁ T ₂

(48)

ou T₁ φ . A seguir são apresentadas algumas propriedades do critério de T₂

Pitman:

• O tamanho dos desvios é irrelevante. Esta propriedade diferencia o critério de Pitman entre outros métodos: ele leva em consideração apenas o tamanho relativo dos desvios, e então registra somente qual estimador está freqüentemente mais próximo do verdadeiro valor do parâmetro. Este é certamente um grande avanço sobre grandes penalidades a elevados desvios quando se usa o erro médio quadrático.

• Não-transitividade. Transitividade significa que se T é p-melhor que 1

2

T e T é p-melhor que ₂ T , então ₃ T deve ser p-melhor que ₁ T . Isto nem ₃

sempre é satisfeito quando comparamos estimadores por certos números associados a cada um deles, no caso a probabilidade de um se aproximar mais do parâmetro verdadeiro do que o outro. Uma vez que o critério de Pitman compara apenas dois estimadores de cada vez, fica claro que eles não precisam ser transitivos, mas quando se comparam três ou mais estimadores, que é o que será feito neste trabalho, a falta de transitividade pode ocorrer, ou seja, é possível que T₁ φ e T₂ T2 φ , porém, T3 T3 φ . T1

(49)

3 METODOLOGIA

3.1 Amostra

Obteve-se pelo site da Bolsa de Mercadorias e Futuros (BM&F), a composição da carteira do Ibovespa em 10/11/2003. Foram obtidos do provedor de informações Economática, optando-se pela série corrigida para eventos, os preços de fechamento das dez ações de maior peso no Ibovespa, consideradas por isso as mais líquidas, e que ao mesmo tempo possuíssem dados disponíveis desde o início do Plano Real, em 04/07/1994. O cuidado em se escolher a correta alternativa do Economática (série corrigida para eventos), assegura que a série de retornos logarítmicos a ser calculada a partir dos preços não estará indevidamente influenciada por eventos tais como: splits ou desdobramentos, distribuição de dividendos e agrupamentos, entre outros eventos.

Nos dias em que não havia informação de preço para uma determinada ação, seja por ela não ter sido colocada em negociação naquele dia ou por realmente não terem ocorrido negócios com a mesma, repetiu-se o preço de fechamento do dia útil imediatamente anterior, acarretando um retorno igual a zero no dia em questão. Entretanto, esta ausência de dados não foi expressiva: para um total de 2.311 dias com preços de fechamento no período supramencionado, o pior caso ocorreu na ação PETR3, com 18 ausências de dados, seguida de ELET3, com 7 ausências, e PETR4 com 4 ausências.

(50)

Considerou-se que a repetição do preço anterior na ação com ausência de cotação num determinado dia, era preferível à eliminação de todos os dados referentes às outras ações relativos àquele dia.

A Tabela 1 apresenta as ações que foram selecionadas com a respectiva participação relativa na composição do Ibovespa em 10/11/2003.

Tabela 1

Ações mais líquidas selecionadas do Ibovespa de forma que contivessem dados desde 04/07/1994 até 31/10/2003 e a sua respectiva participação relativa na composição do índice em 10/11/2003.

Foram excluídas da amostra por não apresentarem dados desde 04/07/1994 ou por não os apresentarem até 31/10/2003, apesar de se encontrarem entre as ações mais líquidas da Bovespa, as ações da Telemar (TNLP3 e TNLP4), Embraer Par (EBTP4), Telesp Cel (TSPP4), Net (PLIM4),

Código da negociação Descrição da ação Especificação da ação Participação relativa PETR4 PETROBRAS PN 8,145% ELET6 ELETROBRAS PNB* 4,443% BBDC4 BRADESCO PN *EJ 4,391% CMIG4 CEMIG PN * 3,095%

ITAU4 ITAUBANCO PN *EJ 3,024%

VALE5 VALE R DOCE PNA 2,871%

PETR3 PETROBRAS ON 2,330%

USIM5 USIMINAS PNA 2,124%

CSNA3 SID NACIONAL ON * 2,032%

(51)

Tele CTR OES (TCOC4), Brasil Telecomunicações (BRTO4), Copel (CPLE6) e Brasil T Participações (BRTP4).

É possível que se suspeitasse que a amostra selecionada estivesse influenciada pelo viés da sobrevivência descrito por Haugen & Baker (1996), porém, esta questão não se aplica ao presente trabalho, uma vez que não se está analisando empresas, mas sim, características de determinadas medidas de risco.

3.2 Metodologias de Cálculo do VaR e do Expected Shortfall

Nesta seção serão apresentadas as metodologias utilizadas para o cálculo do VaR e do ES. Dentre elas é apresentada a proposta para o cálculo do ES por intermédio de uma metodologia híbrida que se utiliza do método histórico e do analítico com uso da volatilidade EWMA, analogamente ao que foi proposto por Boudoukh et al. (1998) para o cálculo do VaR. Ressalte-se que para o VaR híbrido e, conseqüentemente, para o ES híbrido proposto, não foi utilizada a metodologia exatamente da forma apresentada em Boudoukh et al. (1998), mas sim, uma metodologia ligeiramente modificada, conforme será demonstrado com as devidas razões.

3.2.1 Simulação Histórica

O método da simulação histórica se baseia em informações passadas para fazer estimativas com relação aos retornos futuros. Observa-se uma