• Nenhum resultado encontrado

E7 Amostras e Distribuições Amostrais

Quando temos a necessidade de tomar uma decisão que envolva determinada população, o ideal é que tenhamos o conhecimento da distribuição de probabilidade da população, pois, deste modo, a decisão será tomada com o conhecimento dos riscos envolvidos.

O conhecimento da distribuição de probabilidade da população possibilita a obtenção de todos os parâmetros da população, como, por exemplo, o valor espera- do, o desvio padrão, a assimetria e a curtose.

No outro extremo, se a decisão for tomada sem qualquer conhecimento dos parâmetros da população e sem que haja qualquer estimativa desses parâmetros, a decisão será tomada sem o conhecimento dos riscos envolvidos. Neste caso, diz-se que a decisão será tomada em condições de incerteza.

Embora a primeira situação seja a mais desejada para a tomada de deci- sões, na prática nem sempre ela se verifica, inclusive por uma questão de custos (é dispendioso manter o conhecimento permanente de toda a população).

Uma situação intermediária consiste na estimativa dos parâmetros da popula- ção por meio da obtenção dos valores correspondentes das amostras (estatísticas) representativas da população.

Em sentido mais amplo a Estatística cuida da coleta, organização, resumo, apresentação e análise de dados, e também da obtenção de conclusões que aumentem a probabilidade de acertos nos processos de tomada de decisão.

A estatística pode ser dividida em estatística descritiva, que se preocupa em descrever, calcular e analisar dados das amostras, sem tirar conclusões sobre as populações, e em inferência estatística que se utiliza de dados das amostras para que se possa realizar estimativas, previsões e conclusões sobre as populações.

Em sentido mais restrito o termo Estatística pode ser definido como um valor obtido a partir dos dados da amostra, que serve de estimador do valor correspondente da população, o qual é denominado parâmetro.

Em Finanças, os principais parâmetros que necessitamos conhecer são as esperanças de retorno, as volatilidades futuras e as correlações futuras dos diversos ativos sobre os quais necessitamos decidir. Como se trata de parâmetros futuros que variam com o tempo, geralmente é impossível conhecê-los a priori, o que torna

necessário que eles sejam estimados para que as decisões sejam tomadas com maio- res probabilidades de acerto.

Na prática, para estimar as volatilidades dos ativos, utilizam-se amostras das volatilidades diárias de um período anterior ou as volatilidades implícitas nas op- ções de compra e de venda dos ativos12.

Na seção E7.3, estudaremos as estimativas de parâmetros por intervalos, que estão intimamente ligadas ao cálculo do Value at Risk. Na seção E7.5, estudaremos os testes de hipóteses, que são úteis para avaliar se os modelos de cálculo dos Value at Risk os estão calculando de forma satisfatória, ao longo do tempo. Esses testes são conhecidos como backtests.

E7.1 A

MOSTRA

A

LEATÓRIA

O objetivo de utilizar amostras de uma população é obter estimativas dos parâmetros da população que permitam o seu conhecimento sem a necessidade de efetuar o censo da população.

Uma das técnicas de amostragem é por meio da realização de amostras aleatórias13.

E7.2 E

STIMATIVASDOS

R

ETORNOS

,

DAS

V

OLATILIDADESEDAS

C

ORRELAÇÕES

F

UTURASDAS

V

ARIÁVEIS

Para estimar os retornos, as volatilidades e as correlações futuras de diversos ativos, o mais comum é basear-se nos retornos, nas volatilidades e nas correlações dos ativos verificados no passado. A quantidade de dias escolhida representa o tama- nho da janela temporal a ser utilizada para estimar a volatilidade futura. Normal- mente utilizam-se os retornos, as volatilidades e as correlações diárias verificados nos dias mais recentes (por exemplo, 20, 30, 40 ou 252 dias úteis mais recentes). Na seção 22.8.1, discutiremos a conveniência de utilizar janelas temporais maiores ou menores e mencionaremos algumas das técnicas que se vêm destacando para a previsão de parâmetros futuros, a partir dos dados passados.

Distribuição Amostral

É a distribuição de probabilidade de uma estatística de uma amostra. Por exemplo, as distribuições de probabilidade da média e do desvio padrão de uma amostra de uma população são distribuições amostrais.

13 Quando se trata de populações com tamanhos conhecidos, pode-se calcular a quanti- dade de amostras possíveis de serem obtidas.

12 Na seção 22.8, efetuamos uma breve descrição de alguns dos métodos utilizados para prever as volatilidades futuras a partir das volatilidades passadas e, na seção 22.9, avalia- mos as volatilidades implícitas das opções.

E7.3 E

STIMAÇÃOPOR

P

ONTOSOUPOR

I

NTERVALOS

Estimação por Ponto

As estimativas por pontos são representadas por uma estatística (um valor) obtida a partir da amostra. O valor da estatística é considerado o melhor represen- tante para o parâmetro da população. Portanto a estimativa por ponto fornece, por meio de um único valor, uma estimativa para o parâmetro da população.

Por exemplo, quando se diz que o retorno esperado de um patrimônio líqui- do é de 20% ao ano, está-se apresentando uma estimativa por ponto.

Estimação por Intervalo

Consiste em considerar um intervalo em torno do estimador por ponto. Esse intervalo terá uma probabilidade conhecida de conter o verdadeiro valor do parâmetro da população.

As estimativas por intervalos podem ser bilaterais ou unilaterais, conforme definimos a seguir:

• intervalo bilateral – calculam-se limites bilaterais, que delimitam um inter- valo para o qual haja uma probabilidade (nível de confiança) de o parâmetro da população pertencer ao intervalo;

• intervalo unilateral inferior – calcula-se um limite (ou ponto crítico) unilate- ral inferior, que delimita o intervalo para o qual haja uma probabilidade (nível de confiança) de o parâmetro da população ser maior ou igual ao limite unilateral inferior;

• intervalo unilateral superior – calcula-se um ponto crítico unilateral superi- or, que delimita o intervalo para o qual haja uma probabilidade (nível de confiança) de o parâmetro da população ser menor ou igual ao ponto crítico unilateral superior.

Por exemplo, quando se afirma que o patrimônio líquido de uma instituição tem 95% de probabilidade de estar situado entre R$ 90 milhões e R$ 100 mi- lhões, está sendo realizada uma estimativa por intervalo bilateral.

Quando se afirma que o patrimônio líquido tem 95% de probabilidade de ser maior ou igual a R$ 70 milhões (conseqüentemente, admite-se a hipótese de que haja 5% de probabilidade de o patrimônio líquido ser inferior a esse valor), está sendo realizada uma estimativa por intervalo unilateral inferior.

Quando se afirma que o patrimônio líquido tem 95% de probabilidade de ser menor do que R$ 140 milhões (conseqüentemente, admite-se a hipótese de que haja 5% de probabilidade de o patrimônio líquido ser igual ou superior a esse valor), há a estimativa por intervalo unilateral superior.

Para o cálculo do risco de mercado (Value at Risk) utiliza-se o conceito de estimativa por intervalo unilateral inferior, pois há a preocupação com o patrimônio líquido atingir valores muito baixos.

Como não há a preocupação com o patrimônio líquido atingir valores muito elevados, não são utilizados os outros dois métodos de estimação por intervalos mencionados, para o cálculo do Value at Risk.

E7.3.1 E

XEMPLOSDA

E

STIMAÇÃOPOR

P

ONTO EDA

E

STIMAÇÃOPOR

I

NTERVALO Como exemplos de estimadores por ponto, podemos mencionar os estimadores da média e da variância da população:

• o melhor estimador da média da população é a média da amostra, na medida em que é não tendencioso, mais eficiente e consistente14;

• o melhor estimador da σ2 (variância da população) é s2 (variância da amos- tra), na medida em que é não tendencioso, mais eficiente e consistente.

Como exemplos de estimadores por intervalos, mencionaremos intervalos e probabilidades que são freqüentemente utilizados.

Sejam μPL e σPL a média e o desvio padrão de uma distribuição de probabili- dade do PL após decorrido um período (PLt+1).

Se for admitido que a fdp do PLt+1 é normal (nos capítulos 11 e 12 veremos que geralmente a fdp do PLt+1 tem formato desconhecido), pode-se esperar ou estar confiante de encontrar-se o PL (PLt+1) nos intervalos a seguir, com as respectivas probabilidades:

P (μPL - σPL ≤ PL ≤ μPL + σPL) = 68,27% P (μPL - 1,96 . σPL ≤ PL ≤ μPL + 1,96 . σPL) = 95,00% P (μPL - 2 . σPL ≤ PL ≤ μPL + 2 . σPL) = 95,45% P (μPL - 2,58 . σPL ≤ PL ≤ μPL + 2,58 . σPL) = 99,00% P (μPL - 3 . σPL ≤ PL ≤ μPL + 3 . σPL) = 99,73%

Pode-se falar, também, em limites unilaterais:

P (PL > μPL + 1,65 .σPL) =5% (limite unilateral superior com ∝ = 5%)

P (PL < μPL - 1,65 .σPL) =5% (limite unilateral inferior com = 5%)

P (PL > μPL + 2,33 .σPL) =1% (limite unilateral superior com ∝ = 1%)

P (PL < μPL - 2,33 .σPL) =1% (limite unilateral inferior com ∝ = 1%) Se for admitido que a fdp do PL é lognormal, definindo σ como o desvio 14 Essas propriedades de um estimador serão estudadas na seção E7.4.

padrão de uma unidade monetária do PL (geralmente σ é calculada a partir das volatilidades e das correlações dos retornos logarítmicos passados das variáveis que influenciam o PL), pode-se esperar ou estar confiante de encontrar-se o PL (PLt+1) nos intervalos a seguir, com as respectivas probabilidades:

P (μPL - (1 - e - σ) . PL ≤ PL ≤ μ PL + (e + σ -1) . PL) = 68,27% P (μPL - (1 - e – 1,96 . σ) . PL ≤ PL ≤ μPL + (e + 1,96 . σ -1) . PL) = 95,00% P (μPL - (1 - e – 2 . σ) . PL ≤ PL ≤ μPL + (e + 2 . σ -1) . PL) = 95,45% P (μPL - (1 - e – 2,58 . σ) . PL ≤ PL ≤ μ PL + (e + 2,58 . σ -1) . PL) = 99,00% P (μPL - (1 - e – 3 . σ) . PL ≤ PL ≤ μPL + (e + 3 . σ -1) . PL) = 99,73%

Pode-se falar, também, em limites unilaterais:

P (PL > μPL + (e + 1,65 σ - 1) = 5% (limite unilateral superior com ∝ = 5%)

P (PL < μPL - (1 - e - 1,65 σ)= 5% (limite unilateral inferior com ∝ = 5%) P (PL > μPL + (e + 2,33 σ - 1) = 1% (limite unilateral superior com ∝ = 1%) P (PL < μPL – (1 - e - 2,33 σ)= 1% (limite unilateral inferior com ∝ = 1%)

Vale ressaltar que a média do PL após decorrido um período (μPL) será igual ao PL inicial multiplicado pela média de uma distribuição lognormal que é igual a eμ+σ2/2.

Estimação das Médias

Caso se queira estimar o intervalo de confiança da média da população μ (desconhecida) a partir da média da amostra X (conhecida), e tendo-se um σ (conhe- cido), deve-se utilizar a seguinte fórmula:

>> 75

onde: _

X = média da amostra retirada da população; σ = desvio padrão da população;

n = tamanho da amostra retirada (número de elementos da amostra); 1-∝= nível de confiança do intervalo;

∝ = nível de significância;

Z∝/2= valor da normal padronizada tal que P (Z > Z∝/2) = ∝/2.

Pode-se perceber que o intervalo de confiança da média é reduzido à medida que se aumenta o tamanho da amostra (n).

(

)

P X - Z∝/2 . σ/ n . X ≤ μ ≤ X + Z∝/2 . σ/ n . X = 1-∝ >> 75

15 Se a amostra fosse inferior a 30 deveria ser utilizada a distribuição “t” de Student. Os estatísticos admitem que quando a amostra é grande (n≥ 30) a distribuição t aproxima-se muito da distribuição normal e, desse modo, pode ser substituída pela distribuição normal.

Estimação das Freqüências Relativas

Caso se queira estimar o intervalo da probabilidade (desconhecida) da ocor- rência de determinado resultado da população a partir das freqüências relativas (f’) de ocorrência verificadas na amostra (conhecida), e tendo-se um σ (conhecido), deve-se utilizar a seguinte fórmula:

>> 76

Também neste caso observa-se que o intervalo de confiança da probabilidade da população é reduzido à medida que se aumenta o tamanho da amostra (n). Isto está de acordo com a Lei dos Grandes Números, segundo a qual a freqüência relati- va f’ tende para a probabilidade da população p, à medida que o tamanho da amos- tra tenda a infinito.

Para calcular os intervalos de confiança para μ ou para p, se σ não for conhecido e se a amostra tiver n ≥ 30, pode-se utilizar as fórmulas anteriores, procedendo-se a substituição de σ por s (desvio padrão da amostra)15.

E7.4 P

ROPRIEDADES

D

ESEJÁVEISDEUM

E

STIMADOR

É desejável que as estatísticas, que são as estimadoras dos parâmetros da população, apresentem as propriedades de ser não tendenciosas, eficientes e consistentes.

Baseando-se nas definições a seguir, apresentaremos as três propriedades:

θ = uma estatística obtida em uma amostra de uma população;

θ = parâmetro da população, que deverá ser estimado a partir da estatística da amostra.

Não Tendenciosidade

O estimador θ de θ será não tendencioso se:

E (θ) = θ

A diferença [E (θ) - θ] é a tendenciosidade do estimador.

P f’ - Z

(

∝/2 . σ/ n ≤ p ≤ f’ + Z∝/2 . σ/ n = 1- ∝

)

^

^

^

Por exemplo, para efetuar uma simulação Monte Carlo, devem-se inserir no computador que efetuará a simulação, as verdadeiras esperanças de retorno das variáveis, pois, caso contrário, o resultado da simulação será tendencioso (ou viesado).

Eficiência

Um estimador será mais eficiente do que outro, se a sua variância for menor.

Portanto, se VAR (θ1) < VAR (θ2), então θ1será mais eficiente do queθ2. Vale lembrar que é bastante utilizada a análise por erro quadrático médio (EQM) para comparar dois estimadores. O EQM de um estimador é obtido pela fórmula seguinte:

E [θ - θ]2 = VAR (θ) + [E (θ) - θ] 2 = variância de θ + tendenciosidade de θ

Com base nesta análise, um estimador θ1 será preferível a um estimador θ2,se

EQM θ1 2.

Por exemplo, ao efetuar uma mesma Simulação Monte Carlo por diversas vezes, é desejável que os resultados obtidos nas diversas simulações sejam bastante próximos uns dos outros, pois, caso contrário, a simulação Monte Carlo seria ineficiente. Vale lembrar que, como é utilizado um número bastante grande de simulações aleatórias em cada Simulação Monte Carlo, segundo a Lei dos Grandes Números esta metodologia tende a ser bastante eficiente. Conforme mencionamos no início do capítulo 12, há estudos a respeito de técnicas de redução de variância que visam tornar a metodologia da Simulação Monte Carlo ainda mais eficiente.

Consistência

Se a variância de um estimador diminui à medida que o tamanho da amostra é aumentado, o estimador será consistente:

lim E (θ) = θ

n → ∞

e

lim VAR (θ) = 0 (zero)

n → ∞ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^

Conforme vimos na seção E6.12, pela Lei dos Grandes Números, quando se aumenta o número de repetições aleatórias de um evento aleatório, a variância da freqüência relativa de ocorrência do evento aleatório tende para zero. Portanto a freqüência relativa é um estimador consistente e não tendencioso (não viesado) da probabilidade (desconhecida) de ocorrência do evento.

Na mesma seção E6.12, mostramos que a distribuição de probabilidade do PL (pode se visto como uma função de variável aleatória n-dimensional) obtida em uma Simulação Monte Carlo é um estimador consistente e não tendencioso (não viesado) da verdadeira distribuição de probabilidade do PL.

E7.5 T

ESTESDE

H

IPÓTESES

São testes que permitem aceitar ou rejeitar, com determinada probabilidade de acerto, uma hipótese a respeito do valor de um parâmetro populacional, tendo por base os valores obtidos na estatística correspondente da amostra.

Por exemplo, vamos considerar que uma instituição decida testar o seu mo- delo de avaliação do risco de mercado. O modelo que a instituição utiliza admite o nível de significância de 5%, o que eqüivale a dizer que, em 5 dias, a cada 100 dias, a instituição deveria apresentar PLs menores do que os PLs críticos unilaterais inferiores previstos pelo modelo.

Se a instituição observar que, em um número muito pequeno de vezes, os PLs foram inferiores aos PLs críticos unilaterais inferiores previstos pelo modelo, este deverá ser rejeitado, pois está superestimando o risco de perdas.

Por outro lado, se a instituição observar que, em um número muito grande de vezes, os PLs foram inferiores aos PLs críticos unilaterais inferiores previstos pelo modelo, este também deverá ser rejeitado, pois está subestimando o risco de perdas. Para realizar os testes de hipóteses, devem-se admitir duas hipóteses iniciais a respeito do valor do modelo que estará sendo testado, conforme mostramos a seguir.

Hipótese Nula (H0)

É a que vai ser testada. Supõe que a eventual diferença entre o número de vezes em que os PLs diários ficam inferiores aos PLs críticos unilaterais inferiores diários previstos pelo modelo e o número de vezes previsto é devida ao acaso e, portanto, não é significativa.

Para que esta hipótese seja aceita, é necessário que não haja diferença signifi- cativa entre o número de vezes observado e o número de vezes esperado.

Se a diferença for significativa, H0 será rejeitada, e, conseqüentemente, não será aceita a hipótese de que os PLs críticos unilaterais inferiores verdadeiros este- jam contidos na região de aceitação prevista pelo modelo que foi testado.

Hipótese Alternativa (H1)

É uma hipótese diferente de H0, ou seja, admite que os PLs críticos unilate- rais inferiores verdadeiros estejam fora da região de aceitação da hipótese nula. Quando H1 é testada e a diferença entre o número de vezes observado e o número de vezes esperado pela hipótese alternativa não é significativa, H1 será aceita. Quando

H1 é aceita, H0 será rejeitada. Neste caso, a conclusão é que a diferença entre o número de vezes observado e o número de vezes esperado pelo modelo da hipótese nula é significativa.

E7.5.1 A

NÁLISEDAS

H

IPÓTESES

Em torno do valor do parâmetro assumido por H0 cria-se uma região de aceitação. Se a estimativa do parâmetro populacional aceita por H0 estiver compre- endida dentro dessa região, a hipótese nula será aceita. Se estiver fora da região determinada, H0 será rejeitada.

Os limites da região de aceitação são conhecidos como pontos críticos. No caso de teste unilateral, haverá apenas um ponto crítico.

➢ Tipos de Erros

Ao se realizarem testes de hipóteses, há dois tipos de erros possíveis:

• erro Tipo I - é o que se comete quando se rejeita H0 ,sendo ela verdadeira.

Tem probabilidade ∝ (nível de significância da hipótese nula H0);

• erro Tipo II - é o que se comete quando se aceita H0 ,sendo ela falsa. Tem

probabilidade β (nível de significância da hipótese alternativa H1).

Em resumo, teremos:

H0 Verdadeira Decisão Correta Erro Tipo I

Probabilidade (1- ααααα) Probabilidade ααααα H1 Verdadeira (H0 Falsa) Erro Tipo II Decisão Correta

Probabilidade βββββ Probabilidade (1- βββββ)

As probabilidades de ocorrência dos dois tipos de erro podem ser vistas nos gráficos a seguir:

• hipótese de que o parâmetro populacional seja normalmente distribuído:

• hipótese de que o parâmetro populacional seja lognormalmente distribuído:

Exemplo E7.1 – Um banco utiliza modelo analítico de cálculo de risco (Value at Risk – VaR) diário, admitindo que o nível de significância seja de 5%. Ao perceber que, freqüentemente, a perda sofrida é superior ao VaR previsto pelo mo- delo, o banco resolve testá-lo, realizando um backtest. O banco decidiu realizar o backtest nos 100 dias úteis mais recentes e observou que, em 9 dias, a perda verificada foi maior do que o VaR previsto pelo modelo.

Probabilidade de Erro do Tipo I

x Região de Aceitação de Ho

Probabilidade de Erro do Tipo II

Probabilidade de Erro do Tipo I

x Região de Aceitação de Ho

Probabilidade de Erro do Tipo II

Gráfico E7.1a Erros Tipo I e Tipo II, Admitindo Distribuições Normais

O banco deveria aceitar ou rejeitar o modelo de cálculo de VaR, consideran- do um nível de confiança de 95%, admitindo que os percentuais são normalmente distribuídos?

Comentários:

Há somente dois resultados possíveis quando se efetua um back-test, que são:

a) perda superior ao VaR ou b) perda inferior ao VaR.

Caso se queira avaliar se a freqüência absoluta observada (igual a 9) deve ser aceita ou não, deve-se aplicar a esperança e o desvio padrão de uma distribuição de probabilidade Binomial considerando a probabilidade de sucesso igual a 5% e a probabilidade de fracasso igual a 95% e o número de repetições igual a 100. Apli- cando as fórmulas de esperança e de desvio-padrão da distribuição binomial, obte- mos os seguintes resultados:

Esperança = n . p = 100 . 0,05 = 5

Desvio-padrão = n . P . (1-P) = 100 . 0,05 . 0,95 = 2,179

Alternativamente, pode-se avaliar se a freqüência relativa observada (igual a

9%) deve ser aceita ou não. Neste caso deve-se aplicar a esperança e o desvio padrão de uma distribuição de probabilidade de Bernoulli (análoga a uma binomial com n=1) considerando a probabilidade de sucesso igual a 5% e a probabilidade de fracasso igual a 95%. Aplicando as fórmulas de esperança e de desvio padrão obtemos:

Esperança = p = 0,05

Desvio-padrão = P . (1-P) = 0,05 . 0,95 = 0,2179

Logicamente as regiões de aceitação serão equivalentes, sendo que na primei- ra alternativa, a região estará expressa em quantidades e, na segunda, estará expressa em percentual Utilizaremos a segunda alternativa para elaborarmos a resposta.

Resposta - Considerando que iremos avaliar a freqüência relativa, devemos efetuar o seguinte teste de hipóteses a respeito da probabilidade das perdas diárias observadas superarem o VaR que havia sido calculado:

H0 : p = 5% e o modelo é correto

H1 : p ≠ 5% e o modelo subestima ou superestima o VaR

Ao nível de significância de 5% (não confundir com o nível de significância de 5% considerado para o cálculo do VaR) tem-se a seguinte região de aceitação para o percentual de dias em que as perdas superam o VaR:

P (0,05 -1,96 . 0,2179 / 100 ≤ percentual ≤ 0,05 +1,96 . 0,2179 / 100) = 95% P (0,05 - 0,0427 ≤ percentual ≤ 0,05 + 0,0427) = 95%

P (0,0073 ≤ percentual ≤ 0,0927) = 95%

ou

P (0,73% ≤ percentual ≤ 9,27%) = 95%

Conclusão: como o percentual observado de 9% está dentro da região de aceitação ao nível de significância de 5%, o modelo deveria ser aceito.

b) Se o backtest fosse realizado em 252 dias e o modelo tivesse falhado em

22 dias (8,73%), o modelo deveria ser aceito ou rejeitado?

Resposta - Como o número de dias considerado é maior, a região de aceita- ção seria reduzida, conforme mostramos a seguir:

P (0,05 -1,96 x 0,2179 / 252 ≤ percentual ≤ 0,05 +1,96 x 0,2179 / 252) = 95% P (0,05 - 0,0269 ≤ percentual ≤ 0,05 + 0,0269) = 95%

P (0,0231 ≤ percentual ≤ 0,0769) = 95% ou

P (2,31% ≤ percentual ≤ 7,69%) = 95%

Conclusão: como o percentual observado de 8,73% está fora da região de aceitação ao nível de significância de 5%, o modelo deveria ser rejeitado. Portanto a conclusão é a de que o modelo está subestimando o risco, pois as perdas verificadas têm superado o nível de significância de 5% considerado para o cálculo do VaR em um nível significativo. Se o percentual observado estivesse abaixo de 2,31% o mode- lo estaria superestimando o risco, pois as perdas verificadas estariam inferior ao nível de significância de 5% considerado para o cálculo do VaR em um nível significativo.

Documentos relacionados