• Nenhum resultado encontrado

Estimação de Reservas IBNR por Modelos em Espaço de Estado: Empilhamento por Linhas do Triângulo Runoff

N/A
N/A
Protected

Academic year: 2021

Share "Estimação de Reservas IBNR por Modelos em Espaço de Estado: Empilhamento por Linhas do Triângulo Runoff"

Copied!
60
0
0

Texto

(1)

Rodrigo Simões Atherino

Estimação de Reservas IBNR por Modelos

em Espaço de Estado: Empilhamento por

Linhas do Triângulo Runoff

Tese de Doutorado

Tese apresentada ao Programa de Pós-graduação em Engenharia Elétrica do Departamento de Engenharia Elétrica da PUC-Rio como parte dos requisitos parciais para obtenção do título de Doutor em Engenharia Elétrica.

Orientador: Prof. Cristiano Augusto Coelho Fernandes Co-orientador: Prof. Adrian Heringer Pizzinga

Rio de Janeiro Dezembro de 2008

(2)

Livros Grátis

http://www.livrosgratis.com.br

(3)

Rodrigo Simões Atherino

Estimação de Reservas IBNR por Modelos

em Espaço de Estado: Empilhamento por

Linhas do Triângulo Runoff

Tese apresentada como requisito parcial para obtenção do grau de Doutor pelo Programa de Pós-Graduação em Engenharia Elétrica do Departamento de Engenharia Elétrica do Centro Técnico Científico da PUC-Rio. Aprovada pela Comissão Examinadora abaixo assinada.

Dr. Cristiano Augusto Coelho Fernandes Orientador Departamento de Engenharia Elétrica – PUC-Rio Dr. Adrian Heringer Pizzinga Co-orientador PUC-Rio Dr. Álvaro de Lima Veiga Filho Departamento de Engenharia Elétrica – PUC-Rio

Dr. Marcelo Cunha Medeiros Economia – PUC-Rio Dr. Kaizô Iwakami Beltrão ENCE/IBGE

Dr. Nei Carlos dos Santos Rocha UFRJ Prof. José Eugenio Leal Coordenador Setorial do Centro Técnico Científico

(4)

Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, do autor e do orientador.

Rodrigo Simões Atherino Graduou-se em Engenharia Elétrica com ênfase em Telecomunicações pela PUC-Rio, tendo realizado trabalhos de pesquisa na área de Processamento de Imagens, assim como em Mobilidade de Sistemas Celulares. Especializou-se em Redes de Computadores e obteve o título de Mestre em Engenharia Elétrica com ênfase em Métodos de Apoio à Decisão pela mesma instituição. Trabalhou nas empresas Globalstar do Brasil na área de Sistemas de Comunicações Celulares via Satélite; na empresa Embratel, na área de Planejamento de Rede de Dados e Internet; na empresa Telemar, área de Outsourcing e Projetos Complexos de Telecomunicações; e na gestora de recursos JGP, na área de Pesquisas Quantitativas. Ficha Catalográfica CDD: 621.3 Atherino, Rodrigo Simões

Estimação de reservas IBNR por modelos em espaço de estado: empilhamento por linhas do triângulo Runoff / Rodrigo Simões Atherino ; orientador: Cristiano Augusto Coelho Fernandes ; co-orientador: Adrian Heringer Pizzinga. – 2008.

57 f. ; 30 cm

Tese (Doutorado em Engenharia Elétrica) – Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2008.

Inclui bibliografia

1. Engenharia elétrica – Teses. 2. Espaço de estado. 2.

Filtro de Kalman. 3. IBNR. 4. Valores faltantes. I. Fernandes,

Cristiano Augusto Coelho. II. Pizzinga, Adrian Heringer. III. Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Engenharia Elétrica. IV. Título.

(5)

Agradecimentos

Gostaria de fazer os seguintes agradecimentos:

- Ao meu amigo e co-orientador prof. Adrian ``Master'' Pizzinga, não só pela sua orientação e pelo auxílio técnico, mas também pelos agradáveis momentos de convivência;

- Ao meu orientador, prof. Cristiano Fernandes, pelo apoio e pela confiança depositada em mim durante todo este longo trajeto;

- Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) e à Escola Nacional de Seguros (FUNENSEG) pelo apoio financeiro. Sem eles, este trabalho não seria concretizado;

- Aos membros da banca, pelas críticas e sugestões que em muito enriqueceram a versão final desse texto;

- Ao meu amigo Giuliano Lorenzoni, pelo apoio e pelos grandes eventos de apreciação dos ``clássicos'';

- Ao Marcio Lyra, por ter me proporcionado um ambiente de trabalho propício para a conclusão deste trabalho;

- Às funcionárias do Departamento de Engenharia Elétrica da PUC-Rio, Alcina e Márcia, por toda a atenção e paciência.

- À Maria do Carmo Rosas e Silva, pelo carinho e pela revisão do texto desta tese, e ao prof. Raul Rosas e Silva, por todas as conversas e momentos de descontração;

- Aos meus pais, Yolanda e Cristóvão, que com muito carinho, dedicação e amor, sempre possibilitaram-me realizar sonhos e conquistas;

(6)

Resumo

Atherino, Rodrigo Simões; Fernandes, Cristiano Augusto Coelho (Orientador); Pizzinga, Adrian Heringer (Co-orientador). Estimação de Reservas IBNR por Modelos em Espaço de Estado: Empilhamento por Linhas do Triângulo Runoff. Rio de Janeiro, 2008. 57p. Tese de Doutorado – Departamento de Engenharia Elétrica, Pontifícia Universidade Católica do rio de Janeiro.

Este trabalho versa sobre previsão de reservas do tipo IBNR levando-se em conta uma ordenação diferente do triângulo de runoff incremental. Esta se dá por linhas empilhadas, originando, assim, uma série temporal univariada repleta de valores faltantes, cuja soma desses valores constitui o IBNR a ser estimado. Duas abordagens de estimação, inteiramente baseadas na teoria dos modelos em Espaço de Estado e do filtro de Kalman, são desenvolvidas, implementadas com dados reais de empresas seguradoras, e comparadas entre si e a outros métodos de estimação já consagrados na literatura atuarial. A primeira abordagem pauta-se no cálculo da matriz de covariâncias condicionais das componentes do IBNR, e a segunda é um processo de obtenção do IBNR por acumulação. Os resultados obtidos revelam, para as abordagens propostas, os seguintes pontos sumários: (i) plena eficiência e viabilidade computacional; (ii) sistemático ganho em termos de acurácia do IBNR estimado; e (iii) abrangência no que diz respeito às possibilidades de modelagem estatística dos dados de IBNR.

Palavras-chave

(7)

Abstract

Atherino, Rodrigo Simões; Fernandes, Cristiano Augusto Coelho (Advisor). Pizzinga, Adrian Heringer (Co-advisor). State Space Models for IBNR Reserves Estimation: Row-Wise Stacking the Runoff Triangle. Rio de Janeiro, 2008. 57p. Doctorate Thesis – Departamento de Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro.

This work deals with prediction of IBNR reserves under a different ordering of the non-cumulative runoff triangle. This is accomplished by stacking the rows, which results in a univariate time series with several missing values, whose corresponding sum is in fact the IBNR. Two estimation approaches, entirely based on state space methods and Kalman filtering, are developed, implemented with real data, and compared with some well established estimation methods for IBNR. The first approach consists in obtaining the conditional covariance matrix of the IBNR components, and the second tackles the IBNR estimation under an accumulation process. Three remarks emerge from the empirical results: (i)computational feasibility and efficiency; (ii)precision improvement for IBNR estimation; and (iii)flexibility in which concerns the IBNR modelling framework.

Keywords

(8)

Sum´

ario

1 Introdu¸c˜ao 10

2 Reordena¸c˜ao do triˆangulo runoff 12

2.1 O m´etodo Chain-Ladder 14

2.2 Modelo em Espa¸co de Estado proposto 15

3 Metodologia 18

3.1 Modelos em Espa¸co de Estado Lineares Gaussianos 18 3.2 Primeira Abordagem: o m´etodo dos blocos 21 3.3 Segunda Abordagem: o m´etodo do acumulador 25

4 Aplica¸c˜oes 29

4.1 S´erie AFG: resultados 34

4.2 S´erie MC1: resultados 44

4.3 S´erie DJZ: resultados 47

5 Conclus˜oes e Extens˜oes 51

A Provas 55

A.1 Prova do Lema 2 55

A.2 Prova do Lema 3 55

A.3 Prova do Lema 4 56

A.4 Prova do Teorema 1 56

(9)

Lista de figuras

2.1 Triˆangulo de runoff. 12

2.2 Reparametriza¸c˜ao “por linhas” do triˆangulo. 16 2.3 Reparametriza¸c˜ao “por linhas” do triˆangulo com valores ausentes. 16

3.1 Triˆangulo trimestral. 21

4.1 S´eries empilhadas na escala real. 32 4.2 S´eries empilhadas na escala logar´ıtmica. 33 4.3 Resultados do modelo estrutural nos dados sem transforma¸c˜ao

(dados AFG). 35

4.4 Resultados do modelo estrutural nos dados com transforma¸c˜ao

(dados AFG). 35

4.5 Diagn´osticos – modelo estrutural nos dados AFG sem transforma¸c˜ao. 37 4.6 Diagn´osticos – modelo estrutural nos dados AFG com transforma¸c˜ao. 37 4.7 Resultados dados AFG – Modelo I-c (8 interven¸c˜oes). 42 4.8 Resultados dados AFG – Modelo II-c (10 interven¸c˜oes). 42 4.9 Diagn´osticos dados AFG – Modelo I-c (8 interven¸c˜oes). 43 4.10 Diagn´osticos dados AFG – Modelo II-c (10 interven¸c˜oes). 43 4.11 Resultados do modelo estrutural nos dados MC1 com

trans-forma¸c˜ao (10 interven¸c˜oes). 46 4.12 Diagn´osticos – modelo estrutural nos dados MC1 com

trans-forma¸c˜ao (10 interven¸c˜oes). 46 4.13 Resultados do modelo estrutural nos dados sem transforma¸c˜ao

(dados DJZ). 48

4.14 Resultados modelo estrutural nos dados com transforma¸c˜ao (dados

(10)

Lista de tabelas

3.1 Nova dimens˜ao dos vetores e matrizes para o m´etodo do acumuldador. 28 4.1 D´ıvidas gerais facultativas (excluindo ambiental) do estudo da

evolu¸c˜ao hist´orica de perdas (1991 - unidade milhar de d´olar)–AFG. 29 4.2 Triˆangulo de runoff extra´ıdo de Mack (1993). 30 4.3 Triˆangulo de runoff para uma seguradora inglesa (unidade milhar

de libra)–DJZ. 30

4.4 Parˆametros estimados e rela¸c˜oes sinal/ru´ıdo para a base de dados

AFG. 34

4.5 Compara¸c˜ao entre os modelos (dados AFG). 34 4.6 Compara¸c˜ao entre os modelos (dados AFG) – Out of Sample. 36 4.7 Reservas AFG calculadas e CV em %. 36 4.8 Interven¸c˜oes em cada modelo para os dados AFG. 38 4.9 Parˆametros estimados e rela¸c˜oes sinal/ru´ıdo para a base de dados

AFG - modelos com interven¸c˜oes. 38 4.10 Compara¸c˜ao entre os modelos com interven¸c˜oes (dados AFG). 39 4.11 Compara¸c˜ao entre os modelos com interven¸c˜oes (dados AFG) –

Fora da Amostra. 40

4.12 Testes & Diagn´osticos para os dados AFG. 40 4.13 Reservas Estimadas para os modelos com interven¸c˜oes e seus

respectivos CV (%) – AFG. 44

4.14 Interven¸c˜oes em cada modelo para os dados MC1. 44 4.15 Parˆametros estimados e rela¸c˜oes sinal/ru´ıdo para a base de dados

MC1. 45

4.16 Compara¸c˜ao entre os modelos (dados MC1). 45 4.17 Compara¸c˜ao entre os modelos (dados MC1) – Fora da Amostra. 45 4.18 Testes & Diagn´osticos para os dados MC1. 47 4.19 Reservas Estimadas para os modelos com interven¸c˜oes e seus

respectivos CV (%) – MC1. 47

4.20 Parˆametros estimados e rela¸c˜oes sinal/ru´ıdo para a base de dados

DJZ. 49

4.21 Compara¸c˜ao entre os modelos (dados DJZ). 50 4.22 Compara¸c˜ao entre os modelos (dados DJZ) – Fora da Amostra. 50 4.23 Reservas estimadas e seus respectivos CV (%) – DJZ. 50

(11)

1

Introdu¸c˜

ao

O problema da previs˜ao de Reservas IBNR foi um dos mais explorados na literatura atuarial durante as ´ultimas d´ecadas. Ao longo desse tempo, diversas t´ecnicas matem´aticas foram criadas objetivando-se uma maior acur´acia para previs˜ao da reserva, pois sua subestima¸c˜ao ou superestima¸c˜ao podem implicar decis˜oes gerenciais equivocadas (cf. Bornhuetter & Ferguson, 1972).

IBNR ´e uma abrevia¸c˜ao em inglˆes para sinistros “ocorridos por´em n˜ao reportados” (Incurred But Not Reported ). Um sinistro ´e dito IBNR quando ocorre antes da data de an´alise da seguradora, e que ainda n˜ao foi notificado `a mesma. O tempo entre a ocorrˆencia e a notifica¸c˜ao `a seguradora, chamado tempo de aviso, varia de acordo com o tipo de neg´ocio. Por exemplo, sinistros de propriedade tendem a ter um atraso menor, pois a ocorrˆencia do sinistro ´e de f´acil constata¸c˜ao. Por´em, no ramo de seguros de danos a terceiros, em alguns casos, pode-se levar um tempo consider´avel para que se perceba a ocorrˆencia do sinistro, e mais ainda at´e que se desembolse o pagamento. O tempo ´e ainda maior se o sinistro for discut´ıvel (cf. Hart et al., 2001).

Existem ainda os sinistros ditos IBNER (Incurred But not Enough Reported), que s˜ao sinistros ocorridos e notificados `a seguradora, por´em ainda ´e desconhecido o quanto dever´a ser desembolsado para liquid´a-lo completamente. Alguns autores desenvolveram modelos estat´ısticos que separam IBNER do IBNR, como o de Schnieper (1991), por´em aqui n˜ao haver´a esta distin¸c˜ao: tudo ser´a tratado como IBNR.

As referˆencias bibliogr´aficas que realizam uma excelente revis˜ao atrav´es de an´alises comparativas de uma grande variedade de modelos para previs˜ao de IBNR s˜ao Taylor (2000), England & Verrall (2002) e Taylor (2003). O primeiro ´e um livro em que a maioria dos m´etodos s˜ao descritos em detalhes e suas express˜oes deduzidas; o segundo, assim como o primeiro, realiza uma revis˜ao de v´arios m´etodos apresentando suas express˜oes matem´aticas (por´em, sem deduzi-las) e, aplicando a dados reais, compara seus resultados. Por fim, a terceira referˆencia ´e um artigo que apresenta uma nova1 forma de se classificar

os m´etodos de previs˜ao de reservas IBNR que aparecem na literatura, com o 1

(12)

Cap´ıtulo 1. Introdu¸c˜ao 11

objetivo de facilitar o estudo na ´area. Essa classifica¸c˜ao estabelece uma linha evolutiva, que tem origem nos modelos est´aticos e determin´ısticos at´e atingir os dinˆamicos e estoc´asticos.

´

E na categoria dos modelos dinˆamicos e estoc´asticos que se inserem as metodologias propostas no presente trabalho. Estas envolvem uma ordena¸c˜ao alternativa – por linhas – dos valores que comp˜oem o triˆangulo de runoff. Este “empilhamento” d´a origem a uma s´erie temporal univariada com valores faltantes, cuja soma destes ´ultimos ´e, justamente, a reserva IBNR procurada. Ser˜ao propostas duas abordagens distintas – baseadas na forma em Espa¸co de Estado – que envolvem o tratamento destes valores faltantes, de maneira que se possibilite, tamb´em, o c´alculo do erro m´edio quadr´atico da estima¸c˜ao desta soma.

A primeira abordagem, o m´etodo dos blocos, consiste em calcular cada bloco da matriz de covariˆancias dos valores faltantes. A estima¸c˜ao desta matriz permite obter os erros m´edios quadr´aticos de quaisquer combina¸c˜oes lineares dos valores em quest˜ao; em particular, a que gera a reserva IBNR. J´a a segunda abordagem, chamada de m´etodo do acumulador, acrescenta uma nova componente ao vetor de estado, a qual ´e respons´avel pela acumula¸c˜ao das estima¸c˜oes dos valores faltantes. Como a componente acumuladora integra o vetor de estado, seu erro m´edio quadr´atico ´e naturalmente obtido pelas recurs˜oes do filtro de Kalman.

A seguir, descreve-se a organiza¸c˜ao do trabalho. No cap´ıtulo 2, apresentam-se o triˆangulo de runoff, os detalhes sobre a nova ordena¸c˜ao pro-posta e a correspondente justificativa. O cap´ıtulo 3 mostra a metodologia con-solidada para a estima¸c˜ao de reservas IBNR. Nesse cap´ıtulo apresenta-se ini-cialmente a forma geral de espa¸co de estado, revisando-se a literatura sobre suas aplica¸c˜oes `a estima¸c˜ao de reserva IBNR e desenvolvendo-se resultados que constituir˜ao a base para obten¸c˜ao do erro m´edio quadr´atico da reserva estimada. Em seguida, as duas abordagens s˜ao descritas, com suas respec-tivas especificidades de estima¸c˜ao, tanto para dados do triˆangulo em escala original (distribui¸c˜ao normal) quanto para dados em escala logar´ıtmica (dis-tribui¸c˜ao log-normal). O cap´ıtulo 4 trata dos resultados emp´ıricos obtidos de cada modelo, comparando desempenho com outros modelos j´a consagrados na literatura, utilizando-se trˆes bases de dados distintas. Conclus˜oes e extens˜oes futuras do trabalho encontram-se no cap´ıtulo 5. No apˆendice A, exp˜oem-se as provas de lemas, teoremas e proposi¸c˜oes do cap´ıtulo 3.

(13)

2

Reordena¸c˜

ao do triˆ

angulo runoff

Para se prever o IBNR total, os dados de sinistros do tipo IBNR s˜ao dispostos em um formato particular, chamado triˆangulo runoff, representado graficamente pela Figura 2.1 (vide Hart et al., 2001 e suas diversas referˆencias). Cada linha do triˆangulo representa um “ano de acidente”1 ou “ano de origem”,

isto ´e, o ano em que o sinistro ocorreu. J´a as colunas referem-se aos “anos de desenvolvimento”, que expressam o atraso entre o pagamento e o ano de origem. Os “anos de calend´ario” (ou “anos de pagamento”) s˜ao as diagonais do triˆangulo. Ano de Origem Desenvolvimento d w 0 1 2 . . . J − 1 1 C10 C11 C12 . . . C1J−1 2 C20 C21 . . . C2J−2 3 C30 ... ... ... ... ... ... CJ−1 1 J CJ0

Figura 2.1: Triˆangulo de runoff.

O triˆangulo possui duas representa¸c˜oes b´asicas: incremental e acumulada. Na forma incremental, cada c´elula do triˆangulo ´e representada por Cwd, onde

0 < w ≤ J e 0 ≤ d < J. O valor Cwd ´e o montante agregado pago pela

seguradora referente a sinistros ocorridos no ano de origem w, e atrasados d anos (ou seja, pagos no ano de calend´ario w + d).

Na forma acumulada do triˆangulo, as c´elulas s˜ao calculadas da forma

Dwd= d X k=0 Cwk, 1

Conforme Hart et al. (2001), qualquer unidade de tempo pode ser utilizada. Para algumas classes de neg´ocios pode ser mais adequado utilizar meses, trimestres ou semestres.

(14)

Cap´ıtulo 2. Reordena¸c˜ao do triˆangulo runoff 13

isto ´e, h´a uma acumula¸c˜ao dos incrementos Cwd ao longo das linhas. Em geral,

a forma acumulada ´e utilizada em m´etodos baseados nas raz˜oes ou taxas entre anos de desenvolvimento consecutivos, como os modelos em Hertig (1985) e em de Jong (2004), e o pr´oprio m´etodo Chain Ladder (cf. Booth et al., 2004; England & Verrall, 2002; Taylor, 2000 entre outros) s´o para citar alguns.

O ponto comum a todos os m´etodos de previs˜ao de reservas – sobretudo aos aplicados em triˆangulos runoff – ´e a expectativa de que determinados “padr˜oes” de comportamento dos sinistros ocorridos no passado se repitam no futuro. O padr˜ao em quest˜ao ´e o de atraso entre o per´ıodo de origem e o de pagamento do sinistro, ou seja, ´e o padr˜ao apresentado ao longo das colunas. Os m´etodos estat´ısticos aplicados ao triˆangulo tentam modelar esta dependˆencia entre colunas de diversas formas, dentre as quais est´a a curva de Hoerl (cf. Wright, 1990). Em de Jong & Zehnwirth (1983) e Renshaw (1989) a curva ´e utilizada no contexto de s´eries temporais, enquanto England & Verrall (2002) o faz no contexto de Modelos Lineares Generalizados, atrav´es de uma regress˜ao de vari´aveis dependentes Poisson com sobredispers˜ao. O trabalho de de Jong (2006), que ´e uma extens˜ao do trabalho de Hertig (1985), verifica a existˆencia de correla¸c˜oes entre as colunas do triˆangulo – sobretudo entre as primeiras (atrasos menores) – e as tratam explicitamente, levando a melhoras significativas no ajuste do modelo e, conseq¨uentemente, no seu poder preditivo. Ainda existem outros trabalhos que incorporam como informa¸c˜ao adicional o n´umero de sinistros ocorridos em cada “c´elula” do triˆangulo. Vide, por exemplo, Ntzoufras & Dellaportas (2002), no qual ´e realizada uma compara¸c˜ao entre estima¸c˜oes de reserva levando-se em conta ou n˜ao o n´umero de sinistros. Os autores mostram que a inclus˜ao dessa informa¸c˜ao reduz o intervalo de confian¸ca da previs˜ao.

Na representa¸c˜ao de “´ındice duplo” – tanto no contexto de s´eries tem-porais quanto no de regress˜ao – ´e comum se parametrizar o triˆangulo atrav´es de fatores comuns `as colunas e outros comuns `as linhas. Por exemplo, na parametriza¸c˜ao mais tradicional, onde Cwd = αwβd, todas as observa¸c˜oes da

linha w compartilham do mesmo parˆametro αw. A grande desvantagem desta

abordagem ´e o grande n´umero de parˆametros a serem estimados com poucas observa¸c˜oes. Alguns trabalhos utilizam-se de reparametriza¸c˜oes no intuito de se reduzir o n´umero de parˆametros a ser estimado. Um exemplo disso ´e a curva de Hoerl, empregada em de Jong & Zehnwirth (1983), que reduz o n´umero de parˆametros que influenciam as colunas para apenas um.

(15)

Cap´ıtulo 2. Reordena¸c˜ao do triˆangulo runoff 14

2.1

O m´etodo Chain-Ladder

O m´etodo determin´ıstico Chain-Ladder para previs˜ao de reservas IBNR ´e, ainda hoje, um dos mais utilizados pelas empresas seguradoras. A principal raz˜ao disto, segundo Mack (1993), ´e sua simplicidade e por ser livre de dis-tribui¸c˜ao2. Muitos dos trabalhos citados anteriormente tentaram construir um

arcabou¸co estoc´astico para este m´etodo atrav´es da incorpora¸c˜ao de premis-sas b´asicas, como, por exemplo, assumir uma determinada distribui¸c˜ao para as observa¸c˜oes do triˆangulo. Assim, seria poss´ıvel obter uma medida de dis-pers˜ao para a reserva estimada. Por´em, a maioria dos trabalhos, na realidade, estava apenas desenvolvendo um novo m´etodo – diferente do Chain-Ladder – pois os valores estimados das reservas n˜ao coincidiam. Coube ao trabalho de Mack (1993) desenvolver o arcabou¸co estoc´astico do m´etodo Chain-Ladder – mantendo idˆentico o valor estimado da reserva –, e dessa forma obter a me-dida de dispers˜ao para tal reserva sem assumir qualquer distribui¸c˜ao para as observa¸c˜oes do triˆangulo, ou seja, preservou-se a caracter´ıstica principal do m´etodo Chain-Ladder : ser “livre de distribui¸c˜ao”.

2.1.1

Express˜oes b´asicas

O m´etodo Chain-Ladder b´asico assume a existˆencia de J − 1 fatores (“Development Factors”) f1, . . . , fJ−1 > 0 tais que

E(Dw,k|Dw1, . . . , Dw,k−1) = Dw,k−1fwk, 1 ≤ w ≤ J, 1 ≤ k ≤ J − 1. (2-1)

Os estimadores dos fatores fk s˜ao dados pela seguinte express˜ao

ˆ fk = PJ−k j=1 Dj,k PJ−k j=1 Dj,k−1 , 1 ≤ k ≤ J − 1. (2-2) Assim, a esperan¸ca do valor acumulado na ´ultima coluna da linha w ´e dada por

ˆ

Dw,J−1 = Dw,J−w· ˆfJ−w· . . . · ˆfJ−1 (2-3)

As parcelas da reserva referentes a cada linha w (ano de acidente w) s˜ao dadas pelo valor obtido na coluna J − 1, subtra´ıdo do valor da diagonal da linha correspondente.

2

Segundo a classifica¸c˜ao criado por Taylor (2003), o m´etodo Chain-Ladder ´e heur´ıstico e determin´ıstico.

(16)

Cap´ıtulo 2. Reordena¸c˜ao do triˆangulo runoff 15

ˆ

Rw = ˆDw,J−1− Dw,J−i

= Dw,J−w³ ˆfJ−w· . . . · ˆfJ−1

´

A reserva total ´e dada pela soma de cada uma destas parcelas ˆ R = J X i=2 Ri. (2-4) 2.1.2

Express˜oes do erro m´edio quadr´atico obtidas por Mack

A grande contribui¸c˜ao do trabalho de Mack foi a obten¸c˜ao de uma ex-press˜ao para o erro m´edio quadr´atico da reserva, sem assumir qualquer dis-tribui¸c˜ao subjacente. Para tal, alguns pressupostos tiveram que ser assumidos, como, por exemplo, a independˆencia entre linhas do triˆangulo. Desta maneira, a express˜ao para o erro m´edio quadr´atico da parcela da reserva correspondente `a linha w ´e dada por

\ EQM( ˆRw) = ˆDw,J−12 J−2 X k=J−w ˆ σ2 k ˆ f2 k à 1 ˆ Dw,k + PJ−k1 j=1 Dj,k ! com ˆσ2

k definido como o seguinte estimador n˜ao-viesado:

ˆ σk2 = 1 J − k − 1 J−k X i=1 Dik µ Dik Di,k−1 − ˆ fk ¶2 , 1 ≤ k ≤ J − 2.

A express˜ao para o erro m´edio quadr´atico da reserva total encontra-se a seguir. Ela ser´a utilizada no cap´ıtulo 4 para efeito de compara¸c˜ao com o modelo proposto no cap´ıtulo 3.

\ EQM( ˆR) = J X i=2 ( (e.p.( ˆRi))2+ ˆDi,J−1 Ã J X j=i+1 ˆ Dj,J−1 ! J−2 X k=J−i 2ˆσ2 k/ ˆfk2 PJ−k n=1Dnk ) (2-5) 2.2

Modelo em Espa¸co de Estado proposto

Este trabalho far´a uso da forma incremental do triˆangulo, por´em, como j´a citado, adotando-se uma nova ordena¸c˜ao: os ´ındices w e d cedem lugar para um ´unico ´ındice t, o qual define uma s´erie temporal univariada, cuja

(17)

Cap´ıtulo 2. Reordena¸c˜ao do triˆangulo runoff 16

ordena¸c˜ao est´a exemplificada na Figura 2.2. Com esta ordena¸c˜ao, e utilizando-se a formula¸c˜ao em Espa¸co de Estado (a utilizando-ser discutida na utilizando-se¸c˜ao 3.1), as estruturas de dependˆencia entre os valores do triˆangulo podem ser modeladas de forma natural. Cabe, aqui, ressaltar que este ´ındice t n˜ao representa a ordem cronol´ogica dos pagamentos, mas sim uma nova maneira de possibilitar a an´alise do triˆangulo atrav´es de modelos que admitam componentes peri´odicas, como ser´a visto no pr´oximo cap´ıtulo.

Ano de Origem Desenvolvimento d w 0 1 2 . . . J − 1 1 y1 y2 y3 . . . yJ 2 yJ+1 yJ+2 . . . y2J−1 y2J 3 y2J+1 y2J+2 . . . y3J−1 y3J ... ... ... J y(J−1)J+1 y(J−1)J+2 . . . yJ2−1 yJ2

Figura 2.2: Reparametriza¸c˜ao “por linhas” do triˆangulo.

Ano de Origem Desenvolvimento d w 0 1 2 . . . J − 1 1 y1 y2 y3 . . . yJ 2 yJ+1 yJ+2 . . . y2J−1 ... ... J y(J−1)J+1

Figura 2.3: Reparametriza¸c˜ao “por linhas” do triˆangulo com valores ausentes.

Perseguindo a mesma l´ogica apresentada na Figura 2.1, alguns elementos da Figura 2.2, na pr´atica, s˜ao faltantes, pois correspondem `as parcelas do IBNR (vide defini¸c˜ao mais adiante). Logo, a figura 2.3 ser´a o verdadeiro objeto de estudo. Prever a Reserva IBNR significa, em termos pr´aticos, completar os valores faltantes do triˆangulo inferior da figura 2.3. Na abordagem univariada em discuss˜ao, a Reserva IBNR propriamente dita consiste na soma n˜ao observada desses valores faltantes, ou seja,

IBNR ≡ R = X

t: yt´e ausente

yt. (2-6)

´

E no tratamento destes valores ausentes que a formula¸c˜ao em Espa¸co de Estado apresenta um de seus diferenciais: a estima¸c˜ao se torna natural mediante a utiliza¸c˜ao do filtro de Kalman. N˜ao s´o se obt´em a previs˜ao pontual de tais

(18)

Cap´ıtulo 2. Reordena¸c˜ao do triˆangulo runoff 17

valores, mas tamb´em sua medida de dispers˜ao (cf. Harvey, 1989; Durbin & Koopman, 2001; e Brockwell & Davis, 2002).

No entanto, enuncia-se um problema:

Supondo que os valores faltantes s˜ao vari´aveis aleat´orias de 2a

ordem e adotando-se como estimador pontual de R a sua esperan¸ca condicional dados todos os outros valores conhecidos do triˆangulo, calcular seu erro m´edio quadr´atico associado, o qual, sabe-se, ´e m´ınimo dentre todos os outros estimadores que s˜ao fun¸c˜oes dos valores conhecidos.

Neste trabalho, o problema delimitado acima ´e atacado mediante duas aborda-gens diferentes, mas que possuem como base a teoria dos modelos em Espa¸co de Estado e a mesma ordena¸c˜ao por linhas j´a proposta. Tais temas s˜ao explorados plenamente no pr´oximo cap´ıtulo.

(19)

3

Metodologia

3.1

Modelos em Espa¸co de Estado Lineares Gaussianos 3.1.1

Estrutura B´asica

A forma em Espa¸co de Estado Linear Gaussiana (forma em EE daqui por diante) consiste em duas equa¸c˜oes. A primeira delas ´e chamada equa¸c˜ao das observa¸c˜oes, que descreve a evolu¸c˜ao de um processo estoc´astico p-variado e observ´avel yt, t = 1, 2, . . . e a outra ´e chamada equa¸c˜ao do estado.

Especificamente:

yt= Ztαt+ dt+ εt, εt ∼ N(0, Ht)

αt+1= Ttαt+ Rtηt, ηt ∼ N(0, Qt) (3-1)

α1 ∼ N(a1, P1).

O processo m-variado αt´e chamado de estado e ´e considerado n˜ao-observ´avel.

Os erros εt e ηt s˜ao independentes no tempo, entre si e de α1. As matrizes do

sistema Zt, dt, Tt, Rt, Ht e Qt s˜ao determin´ısticas. Dada uma s´erie temporal

de tamanho n do processo yt, definam-se Yj ≡ ¡y01, . . . , y0j

¢0

, at|j ≡ E(αt|Yj) e

Pt|j ≡ Var(αt|Yj). As equa¸c˜oes de predi¸c˜ao e de suaviza¸c˜ao do filtro de Kalman

fornecem f´ormulas recursivas para o c´alculo dos momentos condicionais acima quando j = t − 1 e para j = n, respectivamente. Suas express˜oes anal´ıticas encontram-se em (3-2) e (3-3). Suas deriva¸c˜oes, sob os pressupostos da forma em EE aqui adotada, podem ser obtidas em Durbin & Koopman (2001) e em Harvey (1989).

υt = yt− Ztat|t−1− dt, Ft = ZtPt|t−1Zt0+ Ht,

Kt = TtPt|t−1Zt0Ft−1, Lt = Tt− KtZt, t = 1, . . . , n,

(3-2) at+1|t = Ttat|t−1+ Ktυt, Pt+1|t = TtPt|t−1L0t+ RtQtR0t,

(20)

Cap´ıtulo 3. Metodologia 19

rt−1= Zt0Ft−1υt+ L0trt, Nt−1= Zt0Ft−1Zt+ L0tNtLt,

at|n= at|t−1+ Pt|t−1rt−1, Pt|n= Pt|t−1− Pt|t−1Nt−1Pt|t−1, (3-3)

rn= 0, Nn= 0, t = 1, . . . , n.

H´a diversos artigos publicados na ´area de estima¸c˜ao de IBNR mediante o arcabou¸co da forma em EE. O primeiro deles, que pode ser destacado, ´e o trabalho de de Jong & Zehnwirth (1983), um precursor do uso do filtro de Kalman na literatura atuarial. Nele, o triˆangulo ´e organizado de tal forma que as diagonais formam os vetores das observa¸c˜oes. Uma variante deste m´etodo tamb´em ´e apresentada em Atherino & Fernandes (2007). Em de Jong (2006) ainda se prop˜oe a forma em EE para se estimar correla¸c˜oes entre valores do triˆangulo. Tamb´em cumpre citar o artigo Verrall (1989), que oferece uma metodologia de estima¸c˜ao dentro do enfoque Bayesiano. Outro trabalho de importˆancia ´e devido a Wright (1990). Greg Taylor tamb´em se utiliza da forma em EE para estimar seu modelo em Taylor (2003), ao qual se emprega o filtro EDF (Exponential Distribution Filter ). Al´em de artigos, cita-se tamb´em o livro de autoria do pr´oprio Taylor (cf. Taylor, 2000), no qual, em adi¸c˜ao a um apanhado de t´ecnicas previamente desenvolvidas na literatura, ´e oferecida uma abordagem em que cada linha do triˆangulo runoff ´e vista como um vetor aleat´orio.

3.1.2

Modelos Estruturais

Um modelo estrutural para s´eries temporais ´e aquele no qual as compo-nentes n˜ao observ´aveis de n´ıvel, inclina¸c˜ao, sazonalidade e ru´ıdo s˜ao modeladas explicitamente, cf. Harvey (1989). O modelo em (3-4) ´e o modelo estrutural com as componentes peri´odica e de n´ıvel estoc´asticas que ser´a considerado nas aplica¸c˜oes do presente trabalho.

yt = µt+ γt+ x0tβt+ εt, εt ∼ N(0, σε2), µt+1 = µt+ ζt, ζt ∼ N(0, σζ2), (3-4) γt+1 = − J−1 X j=1 γt+1−j+ ωt, ωt ∼ N(0, σω2). O termo de regress˜ao x0

tβt´e principalmente motivado pela necessidade de

interven¸c˜oes de outliers e de quebras (vide se¸c˜ao 3.1.3). A id´eia de se estimar tal modelo estrutural em particular ´e a de que suas componentes n˜ao observ´aveis

(21)

Cap´ıtulo 3. Metodologia 20

terem capacidade de explicar o comportamento dos sinistros IBNR de forma intuitiva. A componente de n´ıvel µtexplica as informa¸c˜oes referentes ao volume

de sinistros ocorridos em cada ano de acidente. Cabe `a componente peri´odica γtcaptar o padr˜ao da s´erie em cada linha do triˆangulo, isto ´e, ser´a respons´avel

por explicar o comportamento do atraso na liquida¸c˜ao dos sinistros. O modelo estrutural tem a seguinte forma em Espa¸co de Estado:

yt = ³ 1 1 0 · · · 0´          µt γt γt−1 ... γt−J+1          + x0tβt+ εt, t = 1, 2, . . . , n          µt+1 γt+1 γt ... γt−J          =          1 0 0 · · · 0 0 0 −1 −1 −1 −1 0 1 0 0 0 ... 0 0 0 1 0                   µt γt γt−1 ... γt−J+1          +          1 0 0 1 0 0 ... ... 0 0          Ã ξt ωt !

Nas subse¸c˜oes seguintes, ser˜ao apresentadas duas propostas que visam resolver o problema da estima¸c˜ao de IBNR sob a ordena¸c˜ao “por linhas” do triˆangulo de runoff proposta na se¸c˜ao 2, e do c´alculo do erro m´edio quadr´atico associado. Muito essencialmente e, em palavras, o primeiro deles parte para a dedu¸c˜ao, bloco a bloco, de uma express˜ao anal´ıtica fechada da matriz de covariˆancia condicional das parcelas do IBNR (cf. express˜ao (2-6)) empilhados; o segundo, por sua vez, ´e baseado no aumento do vetor de estado com um acumulador das parcelas do IBNR. Ou seja, um m´etodo tenta solucionar o problema “construindo blocos de covariˆancias”; e o outro, “acumulando a reserva”.

3.1.3

Incorpora¸c˜ao de sazonalidade entre o per´ıodo de origem dos sinistros (linhas do triˆangulo)

A metodologia descrita neste trabalho independe da unidade de tempo utilizada no triˆangulo, seja ela mensal, trimestral, semestral etc. Abarca, ainda, naturalmente, a poss´ıvel existˆencia de comportamentos peri´odicos entre as colunas do triˆangulo, ap´os a introdu¸c˜ao do modelo (3-4) como previamente comprovado. Entretanto, em determinadas unidades de tempo, pode haver, ao menos teoricamente, certa periodicidade entre as linhas, refletindo, assim, a

(22)

Cap´ıtulo 3. Metodologia 21

possibilidade de existˆencia de um padr˜ao sazonal nas ocorrˆencias de sinistros IBNR.

Na Figura 3.1 est´a representado um triˆangulo trimestral. Caso existam ind´ıcios emp´ıricos de que sinistros originados em um determinado trimestre de um ano em particular tenham aspectos em comum com os originados no mesmo trimestre de outros anos, esta sazonalidade pode estar incorporada diretamente no modelo. Uma forma de se acrescentar essa componente sazonal seria atrav´es de vari´aveis dummies, como no modelo abaixo:

yt= µt+ γt+ J X i=2 βt(i)d (i) t + εt, (3-5) no qual d(i)t =   

1 yt∈ {i-´esimo “per´ıodo”, . . . , S-´esimo “per´ıodo”}, i = 2, 3, . . . , J

0 caso contr´ario. Origem Desenvolvimento d w 0 1 2 . . . 11 2006Q1 C1,0 C1,1 C1,2 C1,11 2006Q2 C2,0 C2,1 C2,2 . . . 2006Q3 C3,0 C3,1 C3,2 . . . 2006Q4 C4,0 C4,1 C4,2 . . . 2007Q1 C5,0 C5,1 C5,2 2007Q2 C6,0 C6,1 C6,2 2007Q3 C7,0 C7,1 C7,2 2007Q4 C8,0 C8,1 C8,2 2008Q1 C9,0 C9,1 C9,2 2008Q2 C10,0 C10,1 C10,2 2008Q3 C11,0 C11,1 2008Q4 C12,0

Figura 3.1: Triˆangulo trimestral.

A inclus˜ao dos referidos parˆametros adicionais pode agravar ainda mais a quest˜ao da maximiza¸c˜ao da verossimilhan¸ca, j´a que a quantidade de valores faltantes sempre ser´a cerca de 50% do n´umero de observa¸c˜oes do triˆangulo. 3.2

Primeira Abordagem: o m´etodo dos blocos

Considere a forma em EE e toda a nota¸c˜ao correspondente a esta e ao filtro de Kalman da subse¸c˜ao 3.1.1. Adicionalmente, defina

(23)

Cap´ıtulo 3. Metodologia 22 I ≡ {t : yt ´e n˜ao-ausente}, ˜Y ≡ {yij : ij ∈ I, ∀j} 1, Y ≡ {y t: t = 1, . . . , n} e L∗t    Lt, se t ∈ I Tt, caso contr´ario Nt n X k=t+1 L∗0t+1. . . L∗0k−1Zk∗0Fk−1Zk∗L∗k−1. . . L∗t+1.

Observe que ˜Y, no contexto de c´alculo de IBNR, consiste na informa¸c˜ao proveniente do triˆangulo (cf. Figura 2.3).

O ponto de partida para tudo o que se desenvolver´a nesta subse¸c˜ao s˜ao express˜oes recursivas, deduzidas em Durbin & Koopman (2001, se¸c˜ao 4.5), para algumas matrizes de covariˆancias condicionais provenientes de manipula¸c˜oes com as equa¸c˜oes de suaviza¸c˜ao do filtro de Kalman. Estas s˜ao sumarizadas no seguinte Lema:

Lema 1 Sejam t, j = 1, . . . , n quaisquer. Ent˜ao,

1. Cov(αt, αj|Y) = Pt|t−1L0tLt+10 . . . L0j−1(Im− Nj−1Pj|j−1), j ≥ t sendo que L0 tL0t+1. . . L0j−1 = Im quando j = t. 2. Cov(εt, εj|Y) = HtKt0L0t+1. . . L0j−1Wj0, j > t sendo que Wj = Hj(Fj−1Zj − Kj0NjLj). 3. Cov(εt, αj|Y) = −HtKt0Lt+10 . . . L0j−1(Im− Nj−1Pj|j−1), j > t. 4. Cov(αt, εj|Y) = −Pt|t−1L0tL0t+1. . . L0j−1Wj0, j ≥ t

sendo que Wj = Hj(Fj−1Zj − Kj0NjLj) e L0tL0t+1. . . L0j−1 = Im quando

j = t.

Outro resultado importante ´e o Lema 2 dado na sequˆencia, o qual se relaciona com distribui¸c˜oes Gaussianas condicionais e, diferentemente de todos os resultados desta se¸c˜ao, n˜ao se restringe necessariamente ao contexto de modelos em Espa¸co de Estado. A prova deste Lema encontra-se no apˆendice A.1.

Lema 2 Sejam x, y e z vetores aleat´orios com distribui¸c˜ao conjunta Gaus-siana. Se Cov(y, z) = 0 e se Cov(x, z) = 0, ent˜ao

E(x|y, z) = E(x|y) (3-6) Var(x|y, z) = Var(x|y). (3-7) 1

Observe que ˜Y est´a sendo definido como um conjunto de vetores aleat´orios e n˜ao como um vetor aleat´orio empilhado. Mas, para o que segue, o mesmo pode ser visto como tal.

(24)

Cap´ıtulo 3. Metodologia 23

O pr´oximo resultado, de prova bem direta e apresentada no apˆendice A.2, revela uma esp´ecie de ortogonalidade entre a parte observada do triˆangulo e as parcelas n˜ao observadas do IBNR.

Lema 3 Para todo t /∈ I, εt ´e n˜ao-correlacionado com ˜Y.

A linha condutora do desenvolvimento do m´etodo dos blocos ´e a obten¸c˜ao de uma matriz de covariˆancia condicional de todos os yt, tais que t /∈ I,

empilhados dado ˜Y. O caminho para isso ´e estudar, para os mesmos ´ındices t, as covariˆancias condicionais dos vetores aleat´orios n˜ao-observ´aveis αt, εt e

ηt e explorar convenientemente a linearidade da rela¸c˜ao entre estes e os yt. O

pr´oximo resultado materializa esta ideia e tem como base de constru¸c˜ao os Lemas 1, 2 e 3. Sua prova encontra-se no apˆendice A.3.

Lema 4 Para t, j /∈ I arbitr´arios, tem-se que: 1. Cov(εt, εj| ˜Y) =

 

Ht, parat = j

0, caso contr´ario. 2. Cov(εt, αj| ˜Y) = 0 3. Cov(αt, αj| ˜Y) =    Pt|t−1L∗0t L∗0t+1. . . L∗0j−1¡I − Nj−1∗ Pj|j−1¢ , se t < j Pt|t−1− Pt|t−1Nt−1∗ Pt|t−1, set = j.

Estabelecidos os resultados de suporte, agora j´a existem plenas condi¸c˜oes para que se deduzam as express˜oes computacionais do m´etodo dos blocos. Essas se encontram no pr´oximo Teorema, cuja prova est´a no apˆendice A.4.

Teorema 1 Para t, j arbitr´arios, tem-se que

Cov(yt, yj| ˜Y) =          0 se t ∈ I ou j ∈ I Zt(Pt|t−1− Pt|t−1Nt−1∗ Pt|t−1)Zt0+ Ht se t = j e t, j /∈ I ZtPt|t−1L∗0t L∗0t+1. . . Lj−1∗0 ¡I − Nj−1∗ Pj|j−1¢ Zj0 se t < j e t, j /∈ I.

Ap´os ter-se chegado ao objetivo desejado, cabem aqui alguns coment´arios de ordem pr´atica. A implementa¸c˜ao computacional da express˜ao matricial, enunciada no Teorema 1, envolve o armazenamento de algumas matrizes advindas das recurs˜oes do filtro de Kalman: Pt|t−1 e Nt−1∗ para todo t /∈ I,

(25)

Cap´ıtulo 3. Metodologia 24

e ainda as matrizes L∗

τ, L∗τ +1, . . . , L∗τ0−1, 1 ≤ τ < τ0 ≤ n nas quais τ e τ0 s˜ao o primeiro e o ´ultimo instantes, respectivamente, em que existem valores faltantes. Tamb´em, ´e a mesma f´ormula que, quando calculada para todas as combina¸c˜oes poss´ıveis de ´ındices i e j, conduz ao insumo b´asico - que ´e a matriz de covariˆancias condicionais completa de Yn dado ˜Y - para que se calcule uma

medida de precis˜ao associada `a estima¸c˜ao de qualquer combina¸c˜ao linear dos valores faltantes.

3.2.1

Erro m´edio quadr´atico da Reserva IBNR estimada: casos total e por ano Para um vetor a = (a1, a2, . . . , an)0 qualquer, tem-se que E(a0Y| ˜Y) =

a0E(Y| ˜Y) e Cov(a0Y| ˜Y) = a0Cov(Y| ˜Y)a. A reserva IBNR ´e calculada

escolhendo-se um vetor a, aqui definido por a(T ), de forma que a(T )

i = 1 se

i /∈ I e a(T )i = 0 caso contr´ario. Para as parcelas do IBNR relativas a um espec´ıfico ano de acidente (linhas), utilize o mesmo vetor a com coordenadas nulas nos lugares apropriados - os que n˜ao correspondem ao ano. Esta an´alise por ano de acidente ´e interessante porque permite a identifica¸c˜ao de fontes de incertezas nas parcelas do IBNR.

Assim, as express˜oes do m´etodo dos blocos para a Reserva IBNR e seu correspondente erro padr˜ao s˜ao:

\ IBNR ≡ ˆR = a0E(Y| ˜Y) (3-8) \ ep(IBNR) ≡ \ep(R) = q a0Cov(Y| ˜Y)a (3-9) 3.2.2

Uso da distribui¸c˜ao log-normal para yt

Uma alternativa `a hip´otese de normalidade para yt do triˆangulo ´e a

distribui¸c˜ao log-normal, que induz, por primeiros princ´ıpios, `a modelagem de zt ≡ log yt. Essa distribui¸c˜ao foi extensamente explorada na literatura

atuarial (cf. Taylor, 2000, cap´ıtulo 9), tanto na ´area de Modelos Lineares Generalizados (MLG) quanto na ´area de S´eries Temporais. Em MLG, podem-se citar os trabalhos de Kremer (1982), Renshaw (1989), Christofides (1990), Verrall (1991) e Doray (1996); na ´area de S´eries Temporais, tˆem-se de Jong & Zehnwirth (1983), Verrall (1989), de Jong (2004) e de Jong (2006). Apesar de desenvolver seu modelo sem precisar admitir qualquer distribui¸c˜ao (cf. Mack, 1994a), Mack faz um exemplo utilizando log-normalidade para a constru¸c˜ao gr´afica da reserva (cf. Mack, 1994b).

(26)

Cap´ıtulo 3. Metodologia 25

Sob a ado¸c˜ao do m´etodo dos blocos, este pressuposto distribucional alternativo d´a origem ao seguinte algoritmo para o c´alculo da reserva IBNR estimada e seu correspondente erro m´edio quadr´atico:

1. Aplique o filtro de Kalman ao triˆangulo formado pelos zt, armazenando

todas as matrizes devidas (vide coment´arios finais da se¸c˜ao 3.2).

2. Utilize o m´etodo dos blocos para obter ˆzt ≡ E(zt|˜Z) = E(log yt| ˜Y),

σ2 ˆ zt ≡ Var(zt|˜Z) e σzˆt,ˆzj ≡ Cov(zt, zj|˜Z). 3. Calcule2: ˆ yt= exp ½ ˆ zt+ σ2 ˆ zt 2 ¾ (3-10) σy2ˆt = exp©2ˆzt+ σ2ˆzt ª³ eσ2ztˆ − 1 ´ (3-11) σyˆt,ˆyj = exp ( ˆ zt+ ˆzj + σ2 ˆ zt 2 + σ2 ˆ zj 2 ) (eσzt,ˆˆ zj − 1) (3-12)

4. Proceda com os c´alculos da subse¸c˜ao anterior.

Essa ´e uma clara vantagem deste m´etodo sobre o do acumulador, que n˜ao permite, por constru¸c˜ao, a modelagem do logaritmo dos valores do triˆangulo, como ser´a visto na sequˆencia.

3.3

Segunda Abordagem: o m´etodo do acumulador

Este m´etodo consiste em adicionar uma componente ao vetor de estado, denotada por δt, a qual ser´a respons´avel pela acumula¸c˜ao das previs˜oes dos

valores faltantes: yt= h Zt 0 i " αt δt # + dt+ εt " αt+1 δt+1 # = " Tt 0 Xt I # " αt δt # + " Rt 0 # ηt, (3-13)

na qual Xt= 0 quando t ∈ I e Xt= Zt quando t /∈ I (observa¸c˜ao faltante).

Denote por ψ e ψ† os vetores de parˆametros dos modelos (3-1) e (3-13)

respectivamente e denote por L e L† as correspondentes verossimilhan¸cas.

Apesar de ψ = ψ† – com efeito, o modelo em (3-13) ´e um simples aumento na

2

Estas express˜oes decorrem de direta aplica¸c˜ao de fun¸c˜ao geradora de momentos e/ou fun¸c˜ao caracter´ıstica.

(27)

Cap´ıtulo 3. Metodologia 26

equa¸c˜ao do estado do modelo em (3-1) cujas matrizes do sistema adicionais n˜ao compreendem novos parˆametros –, n˜ao ´e muito direto afirmar o mesmo, ou algo diferente, para os estimadores de m´axima verossimilhan¸ca provenientes de L e de L†. O pr´oximo resultado, cuja prova encontra-se no apˆendice A.5, esclarece

essa d´uvida e, mais `a frente, mostrar-se-´a fundamental para a implementa¸c˜ao computacional do m´etodo do acumulador.

Proposi¸c˜ao 1 ˆψ ≡ arg max L(ψ) = arg max L) ≡ ˆψ.

Interpreta¸c˜ao: Apesar de o modelo aumentado possuir uma componente a mais de “acumula¸c˜ao”, n˜ao h´a acr´escimo de informa¸c˜ao `a fun¸c˜ao de verossimilhan¸ca, pois, mesmo que a componente adicional seja, recursivamente, fun¸c˜ao de αt,

este ´ultimo depende, recursivamente, apenas de si mesmo.

A importˆancia pr´atica da Proposi¸c˜ao 1 adv´em de as implementa¸c˜oes se simplificarem muito – sobretudo com a extens˜ao adicional do vetor de estado a ser mostrado na pr´oxima subse¸c˜ao –, pois o vetor de parˆametros poder´a ser estimado atrav´es do modelo original (com matrizes menores) e, assim, as estimativas obtidas ser˜ao utilizadas no filtro de Kalman do modelo aumentado. 3.3.1

Extens˜ao adicional do acumulador: acumuladores parciais por ano de origem

Como j´a visto na se¸c˜ao 3.3, o m´etodo do acumulador consiste no acr´escimo do acumulador δt ao vetor de estado, e no redimensionamento das

matrizes do sistema. Entretanto, ´e conveniente incorporar n˜ao s´o o acumulador da reserva IBNR total, mas tamb´em acumuladores parciais para cada ano de origem w = 2, . . . , J, pela mesma motiva¸c˜ao apresentada no m´etodo dos blocos. Para tanto, seja δt um vetor de dimens˜ao J × 1 tal que δt =

t(2), δt(3), . . . , δt(J), δt(T ))0, cujo sobrescrito (i) representa a parcela referente a

linha i, com 2 ≤ i ≤ J, e o total i = T . O modelo em (3-13), ent˜ao, ´e expandido no modelo em (3-14)

(28)

Cap´ıtulo 3. Metodologia 27 yt = h Zt 0 . . . 0 i          αt δ(2)t ... δ(J)t δt(T )          + εt,          αt+1 δt+1(2) ... δt+1(J) δt+1(T )          = " Tt 0(m×pJ) ˜ Xt I(pJ×pJ) #          αt δt(2) ... δt(J) δt(T )          +       Rt 0 ... 0       ηt, (3-14) com ˜Xt = (Xt(1), X (2) t , . . . , X (J) t , X (T ) t )0.

As novas dimens˜oes dos vetores e matrizes deste modelo est˜ao expostas na tabela 3.1. Como visto na se¸c˜ao 3.3, a matriz de transi¸c˜ao em (3-14) ´e formada por trˆes blocos constantes e um variante no tempo, ˜Xt, cujos elementos seguem

a regra a seguir. Para i = 1, . . . , J Xt(i) =    h Zt 0 . . . 0 i t /∈ I e t ∈ linha i, 0 caso contr´ario. E tamb´em Xt(T ) =    h Zt 0 . . . 0 i t /∈ I, 0 caso contr´ario.

Por fim, existe uma extens˜ao direta da Proposi¸c˜ao 1 aplic´avel ao modelo (3-14), a qual, como anteriormente discutido na se¸c˜ao 3.3, facilita a estima¸c˜ao dos parˆametros do modelo em situa¸c˜oes pr´aticas.

3.3.2

Erro m´edio quadr´atico da Reserva IBNR estimada: casos total e por ano Como j´a mencionado na se¸c˜ao anterior, uma das vantagens do m´etodo do acumulador ´e obter-se o valor estimado da reserva IBNR e seu erro m´edio quadr´atico diretamente do vetor de estado suavizado e sua matriz de variˆancia-covariˆancia, respectivamente.

(29)

Cap´ıtulo 3. Metodologia 28 Vetor ou Matriz Dimens˜ao α†t (m + pJ) × 1 Zt† p × (m + pJ) Tt(m + pJ) × (m + pJ) R†t (m + pJ) × r

Tabela 3.1: Nova dimens˜ao dos vetores e matrizes para o m´etodo do acumul-dador.

A reserva estimada ser´a dada por ˆR = E(δn+1(T )| ˜Y) +P

t /∈Idt, exatamente

como na equa¸c˜ao (2-6). Seu erro m´edio quadr´atico ser´a dado pelo ´ultimo elemento da diagonal principal da matriz Var(α†n+1| ˜Y) = Pn+1|n† . Assim, a reserva e seu respectivo erro padr˜ao s˜ao dados por:

\ IBNR ≡ ˆR = E(δn+1(T )| ˜Y) +X t /∈I dt, (3-15) \ ep(IBNR) ≡ \ep(R) = s Var(δn+1(T )| ˜Y) +X t /∈I Ht. (3-16)

(30)

4

Aplica¸c˜

oes

A fim de se comparar o desempenho e a aderˆencia dos modelos apre-sentados no cap´ıtulo 3, trˆes bases de dados ser˜ao utilizadas. A primeira base, apresentada na tabela 4.1, foi amplamente estudada na literatura de Reservas IBNR (cf. Mack, 1993; England & Verrall, 2002; de Jong, 2006; entre outros), e, aqui, ser´a denotada pela forma abreviada AFG. A segunda, mostrada na tabela 4.2, tamb´em foi estudada em Taylor & Ashe (1983), Verrall (1991) e Mack (1993), e que ser´a chamada de MC1. Por fim, a terceira base, apresen-tada na tabela 4.3, foi utilizada no trabalho de de Jong & Zehwirth (1983). Esta base, aqui chamada por DJZ, refere-se aos montantes pagos, em milhar de libra, por um seguradora inglesa n˜ao identificada.

Tabela 4.1: D´ıvidas gerais facultativas (excluindo ambiental) do estudo da evolu¸c˜ao hist´orica de perdas (1991 - unidade milhar de d´olar)–AFG.

Ano de Origem Desenvolvimento d w 0 1 2 3 4 5 6 7 8 9 1 5012 3257 2638 898 1734 2642 1828 599 54 172 2 106 4179 1111 5270 3116 1817 -103 673 535 3 3410 5582 4881 2268 2594 3479 649 603 4 5655 5900 4211 5500 2159 2658 984 5 1092 8473 6271 6333 3786 225 6 1513 4932 5257 1233 2917 7 557 3463 6926 1368 8 1351 5596 6165 9 3133 2262 10 2063

As s´eries univariadas criadas a partir do “empilhamento” dos anos de acidente das bases AFG, MC1 e DJZ est˜ao representadas nas figuras 4.1(a), 4.1(b) e 4.1(c), respectivamente, em suas escalas originais, e nas figuras 4.2(a), 4.2(b) e 4.2(c) em escala logar´ıtmica. Em uma primeira an´alise gr´afica da s´erie DJZ, notam-se claros ind´ıcios de periodicidade: o padr˜ao de decaimento dos valores da s´erie parece repetir-se a cada ano de acidente. J´a nas s´eries AFG e

(31)

Cap´ıtulo 4. Aplica¸c˜oes 30

Tabela 4.2: Triˆangulo de runoff extra´ıdo de Mack (1993).

Ano de Origem Desenvolvimento d w 0 1 2 3 4 5 6 7 8 9 1 357848 766940 610542 482940 527326 574398 146342 139950 227229 67948 2 352118 884021 933894 1183289 445745 320996 527804 266172 425046 3 290507 1001799 926219 1016654 750816 146922 495992 280405 4 310608 1108250 776189 1562400 272482 352053 206286 5 443160 693190 991983 769488 504851 470639 6 396132 937085 847498 805037 705960 7 440832 847631 1131398 1063269 8 359480 1061648 1443370 9 376686 986608 10 344014

Tabela 4.3: Triˆangulo de runoff para uma seguradora inglesa (unidade milhar de libra)–DJZ. Ano de Desenvolvimento d Origem w 0 1 2 3 4 1 753.5 648.9 311.7 173.5 71.3 2 642.3 648.4 249.7 206.5 3 715.8 661.1 309.4 4 841.6 862.6 5 968.8

MC1 esse comportamento n˜ao fica t˜ao evidente: cada ano de acidente aparenta ter padr˜oes distintos um dos outros.

O n´umero significativo de valores faltantes do triˆangulo pode dificultar a estima¸c˜ao da fun¸c˜ao de verossimilhan¸ca, pois a informa¸c˜ao de Fisher correspon-dente, que ´e diretamente ligada `a curvatura (cf. Migon & Gamerman, 2001, cap.2), perde contribui¸c˜oes. Com o intuito de contornar parcialmente este pro-blema, decidiu-se pela combina¸c˜ao entre o algoritmo Expectation-Maximization (EM ) adaptado ao modelo em EE (cf. Durbin & Koopman, 2001; e Shumway & Stoffer, 2006) com o otimizador do tipo quasi-Newton BFGS para a maxi-miza¸c˜ao da verossimilhan¸ca.

O algoritmo EM ´e um procedimento iterativo composto por dois passos: o primeiro passo envolve a avalia¸c˜ao da esperan¸ca da densidade p(Y, α|Ψ) condi-cionada a p(α|Y, ˜Ψ), com Ψ = (σ2

ε, σµ2, σ2γ)0 e ˜Ψ sendo os hiperparˆametros da

itera¸c˜ao corrente; e a segunda etapa consiste na maximiza¸c˜ao desta esperan¸ca com rela¸c˜ao aos elementos de Ψ. As express˜oes dos valores de Ψ para cada itera¸c˜ao, no caso particular de um modelo estrutural de n´ıvel local com

(32)

peri-Cap´ıtulo 4. Aplica¸c˜oes 31

odicidade (sazonalidade), s˜ao dadas por: ¯ σε2 = 1 n n X t=1 © ˆε2 t − Var(εt|Y) ª ¯ σµ2 = 1 n − 1 n X t=2 © ˆµ2t−1− Var(µt−1|Y) ª ¯ σ2γ = 1 n − 1 n X t=2 ©ˆγ2 t−1− Var(γt−1|Y) ª

Na sequˆencia, ser˜ao apresentados os resultados das implementa¸c˜oes dos m´etodos aplicados nas trˆes bases de dados. A estima¸c˜ao dos modelos foi realizada utilizando-se a linguagem Ox com o pacote de Espa¸co de Estado SsfPack (cf. Doornik, 2001 e Koopman et al., 1999).

(33)

Cap´ıtulo 4. Aplica¸c˜oes 32 0 10 20 30 40 50 60 70 80 90 100 0 1000 2000 3000 4000 5000 6000 7000 8000 AFG

4.1(a): Dados AFG

0 10 20 30 40 50 60 70 80 90 100 250000 500000 750000 1e6 1.25e6 1.5e6 MC1 4.1(b): Dados MC1 0 5 10 15 20 25 100 200 300 400 500 600 700 800 900 DJZ 4.1(c): Dados DJZ

(34)

Cap´ıtulo 4. Aplica¸c˜oes 33 0 10 20 30 40 50 60 70 80 90 100 4 5 6 7 8 9 Data

4.2(a): Dados AFG

0 10 20 30 40 50 60 70 80 90 100 11.5 12.0 12.5 13.0 13.5 14.0 MC1 4.2(b): Dados MC1 0 5 10 15 20 25 4.5 5.0 5.5 6.0 6.5 Data 4.2(c): Dados DJZ

(35)

Cap´ıtulo 4. Aplica¸c˜oes 34

4.1

S´erie AFG: resultados

A estima¸c˜ao dos parˆametros do modelo para os dados AFG, na escala original, revelou n´ıvel e periodicidade estoc´asticos, enquanto que para a escala logar´ıtmica estas mesmas componentes mostraram-se determin´ısticas, de acordo com as desprez´ıveis rela¸c˜oes sinal/ru´ıdo mostradas na Tabela 4.4. Tal mudan¸ca de comportamento, no que diz respeito `as componentes de n´ıvel das escalas analisadas, pode ser justificado por causa de a raz˜ao sinal/ru´ıdo do dado AFG em escala original ter se mostrado n˜ao muito “alta”, facilitando assim a elimina¸c˜ao de variabilidade pela tranforma¸c˜ao logar´ıtimica, compressora natural de escala. Vale ainda dizer que este fenˆomeno n˜ao compromete e tampouco torna conflitantes as an´alises particulares para cada escala, pois o comportamento estoc´astico do n´ıvel da s´erie em escala original, no m´aximo, indicou um fraqu´ıssimo movimento n˜ao-constante entre os 1o e 5o anos de

acidente (cf. Figura 4.3). Quanto `a periodicidade, apenas confirma-se o mesmo padr˜ao de decaimento j´a esperado, assim, como antes, obtido em Atherino & Fernandes (2007), para cada ano de origem.

Tabela 4.4: Parˆametros estimados e rela¸c˜oes sinal/ru´ıdo para a base de dados AFG.

Escala Parˆametro (original) (log)

Log-ver. −407.41 -62.96 σ2 ε 2.15 ×106 6.59 ×10−1 σ2 ξ 1.64 ×104 1.82 ×10−13 σ2 ω 2.05 ×105 2.39 ×10−10 σ2 ξ/σε2 7.62 ×10−3 2.77 ×10−13 σ2 ω/σ2ε 9.55 ×10−2 3.63 ×10−10

As reservas IBNR estimadas est˜ao expostas na Tabela 4.7. Tabela 4.5: Compara¸c˜ao entre os modelos (dados AFG).

Escala

(original) (log) Chain Ladder

MAPE (%) 87.13 127.47 127.82

EQM 3.51 ×106 4.87 ×106 9.65 ×106

Pseudo R2 (%) 31.92 23.61 12.05

AIC 15.29 2.76 –

BIC 15.76 3.24 –

Quanto aos diagn´osticos, constata-se bom comportamento das inova¸c˜oes para o modelo na escala original, sem ind´ıcios de correla¸c˜ao serial, como est´a

(36)

Cap´ıtulo 4. Aplica¸c˜oes 35

0 10 20 30 40 50 60 70 80 90 100 0

2500 5000

7500 Série AFG Nível suavizado

0 10 20 30 40 50 60 70 80 90 100 0

2500 5000

7500 Série AFG Série suavizada

0 10 20 30 40 50 60 70 80 90 100 0

2500

Periodicidade suavizada

Figura 4.3: Resultados do modelo estrutural nos dados sem transforma¸c˜ao (dados AFG). 0 20 40 60 80 100 4 5 6 7 8 9 10

Série AFG (log) Nível suavizado

0 20 40 60 80 100 −1 0 1 Periodicidade suavizada 0 20 40 60 80 100 4 5 6 7 8 9 10

Série AFG (log) Série suavizada (log)

0 20 40 60 80 100 0 2500 5000 7500 10000

Série AFG Série suavizada

Figura 4.4: Resultados do modelo estrutural nos dados com transforma¸c˜ao (dados AFG).

(37)

Cap´ıtulo 4. Aplica¸c˜oes 36

Tabela 4.6: Compara¸c˜ao entre os modelos (dados AFG) – Out of Sample.

Escala

(original) (log) Chain Ladder

MAPE (%) 206.26 177.94 246.85

EQM 2.44 ×106 2.53 ×106 8.45 ×106

Pseudo R2 (%) 57.62 36.23 49.01

Tabela 4.7: Reservas AFG calculadas e CV em %. Ano de

Origem Chain Ladder Mod. Est. (original) Mod. Est. (log) 2 154 (134.0%) 733 (290.6%) 1966 (102.4%) 3 617 (101.0%) 2011 (171.6%) 611 (101.6%) 4 1636 (45.7%) 3584 (125.3%) 1579 (80.3%) 5 2747 (53.5%) 4378 (125.0%) 3213 (68.1%) 6 3649 (54.9%) 5201 (124.2%) 5565 (58.5%) 7 5435 (40.6%) 7867 (95.3%) 9433 (54.3%) 8 10907 (49.1%) 9961 (86.7%) 13093 (47.7%) 9 10650 (59.5%) 15472 (64.2%) 19076 (45.4%) 10 16339 (150.4%) 19447 (58.5%) 25624 (42.1%) Total 52135 (51.6%) 68654 (48.9%) 80159 (24.2%)

retratado em suas FAC e FACP (cf. Figura 4.5). O modelo em log tamb´em apresentou o mesmo comportamento (cf. Figura 4.6). Segundo a pr´opria Tabela 4.5, ambos os modelos superaram o m´etodo Chain-Ladder tanto em erro m´edio quadr´atico quanto em pseudo-R2. Entretanto, o comportamento dos res´ıduos auxiliares1 – um instrumento para detec¸c˜ao de observa¸c˜oes aberrantes

– apontou a presen¸ca de observa¸c˜oes outliers, tornando-se necess´aria uma nova an´alise introduzindo interven¸c˜oes ao modelo. Essa an´alise ser´a discutida em detalhes na pr´oxima subse¸c˜ao.

4.1.1

An´alise de interven¸c˜oes nos dados AFG

Para cada uma das escalas, original e em log, foram estimados dois modelos com interven¸c˜oes (totalizando assim, com os modelos previamente estimados, seis modelos): um com “menos interven¸c˜oes”; e o outro com “mais interven¸c˜oes”. Com o intuito de facilitar a an´alise, deste ponto em diante, cada modelo ser´a referenciado seguindo a nomenclatura abaixo:

– Modelo I-a — modelo em escala original sem interven¸c˜oes; – Modelo I-b — modelo em escala original com 5 interven¸c˜oes; 1

Foram considerados outliers todas as observa¸c˜oes cujos res´ıduos auxiliares superaram trˆes unidades em valor absoluto.

(38)

Cap´ıtulo 4. Aplica¸c˜oes 37 0 20 40 60 80 100 −2 0 2 Inovação padronizada 0 20 40 60 80 100 −2.5 0.0 2.5 5.0 Resíduo auxiliar 0 5 10 15 20 0 1 FAC−Inovação padronizada 0 5 10 15 20 0 1 FACP−Inovação padronizada −4 −3 −2 −1 0 1 2 3 0.2 0.4 N(s=0.999) −1 0 1 2 −2 0

2 Inovação padronizada × normal

Figura 4.5: Diagn´osticos – modelo estrutural nos dados AFG sem trans-forma¸c˜ao. 0 20 40 60 80 100 −2 0 2 Inovação padronizada 0 20 40 60 80 100 −10 −5 0 5 Resíduo auxiliar 0 5 10 15 20 0 1 FAC−Inovação padronizada 0 5 10 15 20 0 1 FACP−Inovação padronizada −4 −2 0 2 0.25 0.50 N(s=0.995) −1 0 1 2 −2.5 0.0 2.5

Inovação padronizada × normal

Figura 4.6: Diagn´osticos – modelo estrutural nos dados AFG com trans-forma¸c˜ao.

(39)

Cap´ıtulo 4. Aplica¸c˜oes 38

– Modelo I-c — modelo em escala original com 8 interven¸c˜oes; – Modelo II-a — modelo em escala log sem interven¸c˜oes; – Modelo II-b — modelo em escala log com 7 interven¸c˜oes; – Modelo II-c — modelo em escala log com 10 interven¸c˜oes.

A Tabela 4.8 mostra os instantes que sofreram interven¸c˜oes em cada um dos modelos.

Tabela 4.8: Interven¸c˜oes em cada modelo para os dados AFG. Modelo # Interv. Instantes

I-a 0 NA I-b 5 11,13,31,42 e 44 I-c 8 4,11,13,14,31,34,42 e 44 II-a 0 NA II-b 7 11,13,21,31,44,46 e 60 II-c 10 4,9,11,13,21,31,34,44,46 e 61

Primeiramente, ser˜ao analisados os parˆametros estimados de cada mo-delo. Segundo a Tabela 4.9, h´a ind´ıcios de que a componente de n´ıvel ´e de-term´ınistica para todos os modelos, j´a que foram estimados valores pr´oximos de zero para a variˆancia da componente de n´ıvel (σ2

ξ) (excetuando-se o modelo

I-a). Entretanto, apesar de o n´ıvel ter mostrado comportamento determin´ıstico, a componente peri´odica manteve-se com um padr˜ao estoc´astico, de acordo com as rela¸c˜oes sinal/ru´ıdo expressivamente n˜ao-nulas (0.24 para o modelo I-b e 1.23 para o I-c).

Tabela 4.9: Parˆametros estimados e rela¸c˜oes sinal/ru´ıdo para a base de dados AFG - modelos com interven¸c˜oes.

Escala

(normal) (log)

Parˆametro I-b I-c II-b II-c Log-ver. −392.66 -380.27 -39.89 -17.39 σ2 ε 9.89 ×105 3.00 ×105 1.99 ×10−1 9.06 ×10−187 σ2 ξ 1.03 ×10−4 0 9.89 ×10−13 1.64 ×10−4 σ2 ω 2.37 ×105 3.68 ×105 1.34 ×10−2 7.48 ×10−2 σ2 ξ/σ2ε 1.04 ×10−10 0 4.95 ×10−12 – σ2 ω/σε2 2.39 ×10−1 1.23 6.71 ×10−2 –

As estat´ısticas de compara¸c˜ao dentro da amostra entre os modelos encontram-se na Tabela 4.10, na qual se explicitam MAPE, EQM, Pseudo-R2, AIC, BIC e resultados dos testes de raz˜ao de verossimilhan¸ca para a relevˆancia

(40)

Cap´ıtulo 4. Aplica¸c˜oes 39

das interven¸c˜oes. Para o c´alculo do MAPE, do EQM e do Pseudo-R2, foram exclu´ıdas as observa¸c˜oes da primeira linha do triˆangulo – referente ao per´ıodo difuso do filtro de Kalman – e tamb´em as da primeira coluna – `a qual o m´etodo Chain-Ladder n˜ao se aplica por constru¸c˜ao. Comparando-se, com essas medidas, os modelos em EE e o m´etodo Chain-Ladder, os primeiros mostraram-se mais aderentes aos dados do que o ´ultimo. At´e mesmo os modelos I-a e II-a, que n˜ao possuem interven¸c˜oes, foram considerados mais adequados em rela¸c˜ao ao Chain-Ladder. Finalmente, cita-se que as interven¸c˜oes se mostraram estatisticamente significantes atrav´es de testes de raz˜ao de verossimilhan¸ca (RV) aplicados aos modelos I-a & I-b, I-a & I-c e I-b & I-c, com todos os testes tendo suas respectivas hip´oteses nulas2 sendo fortemente rejeitadas (todos os

p-valores inferiores a 10−4).

Tabela 4.10: Compara¸c˜ao entre os modelos com interven¸c˜oes (dados AFG).

I-b I-c II-b II-c CL

MAPE (%) 63.68 55.23 42.26 31.03 127.82 EQM 2.16 ×106 1.06 ×106 2.66 ×106 2.04 ×106 9.65 ×106 Pseudo R2 (%) 50.45 55.96 43.19 54.46 12.05 AIC 14.93 14.59 2.18 1.47 – BIC 15.59 15.36 2.91 2.31 – Teste RV (1) 29.5 54.28 46.14 91.14 – (0.000) (0.000) (0.000) (0.000) – Teste RV (2) – 24.78 – 45.00 – – (0.000) – (0.000) –

Tamb´em foi realizada uma valida¸c˜ao fora da amostra, em que cada modelo ´e estimado novamente sem levar em conta as observa¸c˜oes pertencentes `a diagonal; tais observa¸c˜oes ser˜ao utilizadas para a valida¸c˜ao do modelo. Assim como no procedimento dentro da amostra, para efeito de compara¸c˜ao entre os modelos e o m´etodo Chain-Ladder, n˜ao ser˜ao levadas em conta as observa¸c˜oes da primeira linha e a da primeira coluna. As estat´ısticas MAPE, EQM e Pseudo-R2 para o procedimento fora da amostra encontram-se na Tabela 4.11. Os resultados confirmam a inferioridade do m´etodo Chain-Ladder a todos os modelos em EE analisados, quanto ao poder preditivo. Os modelos em EE com melhor poder preditivo foram os que possu´ıam o maior n´umero de interven¸c˜oes: o modelo I-c obteve o menor EQM e o maior Pseudo-R2, enquanto que o modelo II-c obteve o menor MAPE; ressalte-se, por´em, que essas diferen¸cas n˜ao s˜ao expressivas ao ponto de se determinar qual modelo ´e superior.

2

Para o teste RV(1), a hip´otese nula H0 ´e “Os coeficientes associados `as interven¸c˜oes

s˜ao todos zero”, e os modelos reduzido e completo s˜ao, respectivamente, dados por I-a e I-b (ou I-c) para o caso da escala original, e por II-a e II-b (ou II-c) para a escala em log. Para o RV(2), os modelos comparados s˜ao os com “menos interven¸c˜oes” com os de “mais

(41)

Cap´ıtulo 4. Aplica¸c˜oes 40

Tabela 4.11: Compara¸c˜ao entre os modelos com interven¸c˜oes (dados AFG) – Fora da Amostra.

I-b I-c II-b II-c CL

MAPE (%) 161.64 149.12 161.56 142.76 246.85

EQM 1.44 ×106 1.27 ×106 1.47 ×106 1.33 ×106 2.75 ×106

Pseudo R2 (%) 70.49 73.55 69.00 72.98 27.23

Os diagn´osticos dos modelos em EE est˜ao representados na Tabela 4.12. Todos eles foram implementados sobre as inova¸c˜oes padronizadas, que s˜ao definidas, para cada t, por υtS = υt

Ft

(vide 3.1.1) e, sob as hip´oteses b´asicas do modelo linear Gaussiano univariado, devem se comportar como vari´aveis aleat´orias i.i.d. N (0, 1). Todos os modelos apresentaram inova¸c˜oes padronizadas n˜ao-correlacionadas segundo o teste de Ljung-Box. Os testes de heterocedasticidade tamb´em n˜ao evidenciaram viola¸c˜oes nesse quesito, com exce¸c˜ao do modelo II-b que apresentou certos problemas de inconstˆancia na variˆancia. As estat´ısticas de Durbin-Watson tamb´em foram pr´oximas de 2 (com exce¸c˜ao do modelo II-a), bem como o teste do sinal de Cox-Stuart, que tamb´em n˜ao acusou presen¸ca de quaisquer tendˆencias nas inova¸c˜oes. J´a o teste Jarque-Bera rejeitou a hip´otese de normalidade apenas no modelo II-a (o resultado desse crit´erio relativo ao modelo II-b, por causa de seu comportamento possivelmente heteroced´astico, deve ser visto com cautela).

Tabela 4.12: Testes & Diagn´osticos para os dados AFG.

I-a I-b I-c II-a II-b II-c Heterocedasticidade (20) 1.225 0.952 1.535 0.589 0.343 1.079

(0.655) (0.913) (0.346) (0.245) (0.021) (0.867) Ljung-Box (15 lags) 11.898 8.962 11.660 7.287 12.526 24.530 (inov. padr.) (0.999) (1.000) (0.999) (1.000) (0.998) (0.748) Ljung-Box (15 lags) 8.042 7.442 10.411 4.199 9.587 16.690 (quadrado inov. padr.) (1.000) (1.000) (1.000) (1.000) (1.000) (0.976) Jarque-Bera 0.733 1.700 0.486 23.070 13.981 1.569

(0.693) (0.427) (0.784) (0.000) (0.001) (0.456) Durbin-Watson 1.778 1.935 2.058 1.639 2.121 2.247

Cox-Stuart 7 6 8 8 7 14

(0.134) (0.052) (0.286) (0.286) (0.134) (0.134)

Na escala original, o melhor modelo, segundo qualquer um dos crit´erios da Tabela 4.10 (log-verossimilhan¸ca, AIC, BIC etc.), foi o I-c; enquanto que para a escala logar´ıtmica foi o modelo II-c. Graficamente, as componentes

(42)

Cap´ıtulo 4. Aplica¸c˜oes 41

estimadas e os diagn´osticos dos referidos modelos podem ser observados nas Figuras 4.7 e 4.9 (modelo I-c), e 4.8 e 4.10 (modelo II-c). A fim de se escolher qual o modelo mais adequado dentre estes dois, alguns cuidados precisam ser tomados: suas log-verossimilhan¸cas e seus crit´erios de informa¸c˜ao AIC e BIC n˜ao s˜ao compar´aveis devido `as observa¸c˜oes estarem em escalas diferentes. A medida MAPE tamb´em ´e fortemente influenciada pela escala dos dados: mesmo com as previs˜oes transformadas de volta para a escala original dos modelos em escala logar´ıtmica, o MAPE, por ser uma medida percentual, cria distor¸c˜oes nos erros absolutos.

Na literatura atuarial, existe a pr´atica de se utilizar o coeficiente de varia¸c˜ao (CV) te´orico para a reserva total como uma medida de compara¸c˜ao entre modelos, cf. Mack (1993), England & Verrall (2002), Taylor (2000), de Jong (2006), entre outros autores. O CV ´e uma medida percentual que ´e fun¸c˜ao do erro quadr´atico m´edio te´orico (cujo c´alculo torna-se vi´avel pelo m´etodo dos blocos ou, para modelos em escalas originais, pelo m´etodo de acumulador) e tamb´em do valor esperado da reserva. Logo, se dois modelos possu´ırem o mesmo erro m´edio quadr´atico previsto, por´em com um deles tendo estimado uma reserva mais alta, este ser´a considerado “melhor”, pois ter´a um CV menor. Al´em disso, cumpre observar que, se pressupostos b´asicos de um dado modelo s˜ao violados – o que se atestaria mediante pr´atica de diagn´osticos – e/ou o mesmo demonstrar pouca habilidade em reproduzir os dados – o que se refletiria em baixa performance sob crit´erios de poder preditivo –, poucos argumentos restariam a favor do uso de medidas te´oricas, como o CV, para compara¸c˜ao de modelos. A fim de se evitar tais distor¸c˜oes e poss´ıveis ambiguidades, sugere-se o uso de medidas como o CV, ou o erro m´edio quadr´atico te´orico (oriundo dos m´etodos discutidos nas se¸c˜oes metodol´ogicas dessa Tese – se¸c˜oes 3.2 e 3.3) apenas como medidas de precis˜ao nominal da estima¸c˜ao da reserva dos modelos, considerados como os “mais adequados’ de acordo com an´alises dentro da amostra, como as que se praticaram at´e ent˜ao. Para tais modelos, com os dados AFG, essas informa¸c˜oes, junto com as reservas estimadas (parciais e total) encontram-se na Tabela 4.13.

(43)

Cap´ıtulo 4. Aplica¸c˜oes 42

0 10 20 30 40 50 60 70 80 90 100 0

2500 5000

7500 Série AFG Nível suavizado

0 10 20 30 40 50 60 70 80 90 100 0

2500 5000

7500 Série AFG Série suavizada

0 10 20 30 40 50 60 70 80 90 100 0

2500 5000

Periodicidade suavizada

Figura 4.7: Resultados dados AFG – Modelo I-c (8 interven¸c˜oes).

0 20 40 60 80 100 4 5 6 7 8 9 10

Série AFG (log) Nível suavizado

0 20 40 60 80 100 −2 −1 0 1 2 Periodicidade suavizada 0 20 40 60 80 100 4 5 6 7 8 9 10

Série AFG (log) Série suavizada (log)

0 20 40 60 80 100 0

2500 5000 7500

10000 Série AFG Série suavizada

(44)

Cap´ıtulo 4. Aplica¸c˜oes 43 0 20 40 60 80 100 −2 −1 0 1 2 Inovação padronizada 0 20 40 60 80 100 −1 0 1 2 Resíduo auxiliar 0 5 10 15 20 0 1 FAC−Inovação padronizada 0 5 10 15 20 0 1 FACP−Inovação padronizada −3 −2 −1 0 1 2 3 0.2 0.4 N(s=0.999) −2 −1 0 1 2 −2 0 2

Inovação padronizada × normal

Figura 4.9: Diagn´osticos dados AFG – Modelo I-c (8 interven¸c˜oes).

0 20 40 60 80 100 0 2 Inovação padronizada 0 20 40 60 80 100 −0.000025 0.000000 0.000025 Resíduo auxiliar 0 5 10 15 20 0 1 FAC−Inovação padronizada 0 5 10 15 20 0 1 FACP−Inovação padronizada −2 −1 0 1 2 3 0.2 0.4 0.6 N(s=0.983) −2 −1 0 1 −2 0

2 Inovação padronizada × normal

Referências

Documentos relacionados

O Documento Orientador da CGEB de 2014 ressalta a importância do Professor Coordenador e sua atuação como forma- dor dos professores e que, para isso, o tempo e

Os principais objectivos definidos foram a observação e realização dos procedimentos nas diferentes vertentes de atividade do cirurgião, aplicação correta da terminologia cirúrgica,

psicológicos, sociais e ambientais. Assim podemos observar que é de extrema importância a QV e a PS andarem juntas, pois não adianta ter uma meta de promoção de saúde se

Os principais resultados obtidos pelo modelo numérico foram que a implementação da metodologia baseada no risco (Cenário C) resultou numa descida média por disjuntor, de 38% no

da cor da amostra (Figura 1.6b). [11] O CdSe macrocristalino apresenta uma cor castanha escura enquanto no CdSe nanocristalino a cor pode variar do amarelo ao vermelho, dependendo

O mecanismo de competição atribuído aos antagonistas como responsável pelo controle da doença faz com que meios que promovam restrições de elementos essenciais ao desenvolvimento

Este desafio nos exige uma nova postura frente às questões ambientais, significa tomar o meio ambiente como problema pedagógico, como práxis unificadora que favoreça