• Nenhum resultado encontrado

Modelagem adaptativa nebulosa possibilística : ensaios em finanças

N/A
N/A
Protected

Academic year: 2021

Share "Modelagem adaptativa nebulosa possibilística : ensaios em finanças"

Copied!
218
0
0

Texto

(1)

Leandro Dos Santos Maciel

Modelagem adaptativa nebulosa possibilística:

ensaios em finanças

Campinas

2015

(2)
(3)

UNIVERSIDADE ESTADUAL DE CAMPINAS

Faculdade de Engenharia Elétrica e de Computação

Leandro Dos Santos Maciel

Modelagem adaptativa nebulosa possibilística: ensaios em

finanças

Tese apresentada à Faculdade de Engenharia Elétrica e de Computação da Universidade Es-tadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Doutor em Engenharia Elétrica, na Área de Engenha-ria de Computação.

Orientador: Prof. Dr. Fernando Antonio Campos Gomide Coorientadora: Profa. Dra. Rosangela Ballini

Este exemplar corresponde à versão final da tese defendida pelo aluno Leandro Dos Santos Maciel, e orientada pelo Prof. Dr. Fernando Antonio Campos Gomide

Campinas

2015

(4)

Ficha catalográfica

Universidade Estadual de Campinas Biblioteca da Área de Engenharia e Arquitetura Elizangela Aparecida dos Santos Souza - CRB 8/8098

Maciel, Leandro dos Santos,

M187m MacModelagem adaptativa nebulosa possibilística : ensaios em finanças / Leandro dos Santos Maciel. – Campinas, SP : [s.n.], 2015.

MacOrientador: Fernando Antonio Campos Gomide.

MacCoorientador: Rosangela Ballini.

MacTese (doutorado) – Universidade Estadual de Campinas, Faculdade de

Engenharia Elétrica e de Computação.

Mac1. Sistemas nebulosos. 2. Previsão de séries temporais. 3. Finanças. 4.

Computação granular. I. Gomide, Fernando Antonio Campos,1951-. II. Ballini, Rosangela,1969-. III. Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação. IV. Título.

Informações para Biblioteca Digital

Título em outro idioma: Adaptive possibilistic fuzzy modeling : essays in finance Palavras-chave em inglês:

Fuzzy systems

Time-series forecasting Finance

Granular computing

Área de concentração: Engenharia de Computação Titulação: Doutor em Engenharia Elétrica

Banca examinadora:

André Paim Lemos Daniel Furtado Leite Fernando José Von Zuben Ivette Raymunda Luna Huamani

Data de defesa: 27-07-2015

Programa de Pós-Graduação: Engenharia Elétrica

Powered by TCPDF (www.tcpdf.org)

(5)
(6)
(7)

Resumo

Nos últimos anos, tem crescido o interesse na modelagem computacional de informações em fluxos de dados para problemas do mundo real. Este trabalho desenvolve novas abordagens para a construção de modelos nebulosos adaptativos, abordagens estas capazes de realizar tarefas tais como identificação de sistemas, controle, classificação de padrões e previsão de séries temporais, em um ambiente dinâmico não estacionário, ajustando seus parâmetros e estrutura a partir de um fluxo de dados. É proposta a modelagem nebulosa possibilís-tica adaptativa, caracterizada por tratar ruídos e outliers, uma vez que considera o conceito de graus de tipicalidade dos dados para a atualização de sua estrutura, baseada em regras nebulosas. Conjuntamente, inclui a ideia de graus de pertinência de sistemas nebulosos tra-dicionais, para adequada identificação do modelo no espaço dos dados. O aspecto adaptativo do modelo, i.e., criação, exclusão e atualização de regras, é construído com dois conceitos distintos: aprendizagem participativa e densidade de dados. A aprendizagem participativa é inspirada na forma de aprendizagem humana, em que o impacto de uma nova informação causa revisão dos conhecimentos já adquiridos. A densidade de dados considera as infor-mações por similaridade, em termos de distância no espaço dos dados. Duas técnicas são propostas para a modelagem nebulosa possibilística adaptativa. A primeira delas é baseada na representação das regras do sistema por meio de centróides, formados a partir dos dados. Por outro lado, é sugerida uma técnica em que funções afins caracterizam os grupos nebulo-sos, o que permite maior simplicidade e transparência da estrutura do sistema. Além disso, os modelos que utilizam centróides para a representação dos grupos são estendidos para o caso em que a informação pode ser representada em termos granulares, por meio de intervalos nu-méricos. O tratamento da informação granular permite o processamento de dados complexos de maneira mais natural. Os modelos nebulosos possibilísticos adaptativos são avaliados em problemas clássicos de identificação e séries temporais, considerando também uma série tem-poral sintética. Outra proposta desse trabalho consiste em aplicar a modelagem desenvolvida em diversos ensaios em finanças, como: previsão da estrutura a termo das taxas de juros; previsão da volatilidade realizada com saltos; composição e rebalanceamento de carteiras de investimento; precificação de opções; e mensuração da medida Valor-em-Risco tradicional e de acordo com uma abordagem granular. Nesses problemas, as variáveis fundamentais apre-sentam dinâmicas não lineares variantes no tempo, e sofrem a influência de dados com ruídos e outliers, que podem ser causados por notícias, mudanças de políticas, reversão de expec-tativas nos mercados financeiros, o que evidencia a adequação da abordagem possibilística proposta neste trabalho. Os resultados obtidos sugerem a modelagem nebulosa possibilística adaptativa como alternativa promissora e robusta para a utilização em ambientes em fluxos de dados não estacionários. Particularmente, a abordagem é útil nos problemas em economia

(8)

cados. Além disso, apresenta-se como uma alternativa computacionalmente eficiente quando comparada com modelos nebulosos evolutivos estado da arte na literatura.

Palavras-chaves: sistemas nebulosos; previsão de séries temporais; finanças; computação

granular.

(9)

Abstract

The interest in computational modeling of data streams has grown considerably in recent years. This work develops new approaches for adaptive fuzzy rule-based system modeling. The approaches comprise methods capable of performing system identification, control, pat-tern classification and time-series forecasting in non stationary dynamic environments by updating the model structure and its parameters using data streams. More precisely, this work suggests an adaptive possibilistic fuzzy modeling approach to deal with noisy data and outliers using the concept of data for fuzzy rule-based model structure updating. The mem-bership degree from traditional fuzzy systems is also incorporated for model identification in the data space. The adaptive aspect of the model concerns with the creation, exclusion and updating of fuzzy rules. Adaptation uses two distinct concepts: participatory learning and data density. Participatory learning is inspired by human learning, in the sense that the impact of a new information may cause revision of the previously acquired knowledge. Data density considers similarity information based on a distance measure in the data space. Two adaptive possibilistic fuzzy modeling techniques are addressed. The first uses centroids for rule representation, derived from data clusters. The second uses affine functions as cluster “centers”. The modeling approach that uses centroids for rule representation is extended to handle granular interval data. Granular data computation allows processing of complex data in a simplified manner. The adaptive possibilistic fuzzy modeling approaches are evaluated using benchmark identification and time series problems. Synthetic time series data model-ing is also pursued. The approaches suggested are explored in finance, which includes: term structure of interest rates forecasting; realized volatility forecasting with jumps; composition and rebalancing of investment portfolios; option pricing; and modeling the traditional risk measure Value-at-Risk, including the granular approach. In finance, dynamics are complex, nonlinear, time-varying, and suffer the influence of noise and outliers, which can be caused by news, policy changes, and reversal of expectations in financial markets. These highlight the adequacy of the possibilistic approach considered in this work. Computational experiments suggest that the adaptive possibilistic fuzzy modelling is a robust alternative for system modeling in non-stationary environments using data streams, particularly in economic and finance problems. Moreover, the approach is computationally efficient compared against to state of the art evolving fuzzy models.

Keywords: fuzzy systems; time-series forecasting; finance; granular computing.

(10)
(11)

Publicações

Periódicos

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Evolving possibilistic fuzzy modeling for realized volatility forecasting with jumps. IEEE Transactions on Fuzzy Systems. Artigo submetido para avaliação.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Evolving granular analytics for interval time series forecasting. Granular Computing. Artigo submetido para avaliação.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Evolving fuzzy-GARCH approach for finan-cial volatility modeling and forecasting. Computational Economics. Artigo submetido para avaliação.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. A differential evolution algorithm for yield curve estimation. Mathematics and Computers in Simulation. Artigo submetido para avaliação.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Minimum variance fuzzy possibilistic port-folio. Revista de Finanças Aplicadas, v. 4, p. 1–27, 2014.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Enhanced evolving participatory learning fuzzy modeling: An application for asset returns volatility forecasting. Evolving Systems, v. 5, p. 75–88, 2013.

∙ MACIEL, L.; LEMOS, A. P.; GOMIDE, F.; BALLINI, R. Evolving fuzzy systems for pricing fixed income options. Evolving Systems, v. 3, p. 5–18, 2012.

∙ MACIEL, L. A hybrid fuzzy GJR-GARCH modeling approach for stock market vola-tility forecasting. Revista Brasileira de Finanças, v. 10, p. 337–367, 2012.

(12)

∙ MACIEL, L. Pricing Brazilian fixed income options with feedforward and recurrent neural networks. In: Mantri, J. K. (Org.) Soft-Computing in Capital Markets. Florida, USA: BrownWalker Press, 2014, v. 1, p. 93–108.

∙ MACIEL, L. A hybrid fuzzy GJR-GARCH modeling approach for stock market volati-lity forecasting. In: J. A. Batten; P. Mackay; N. Wagner. (Orgs.) Advances in Financial

Risk Management: Corporates, Intermediaries and Portfolios. London: Palgrave

Mac-millan, 2013, v. 1, p. 253–283.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Evolving fuzzy modeling for stock market forecasting. In: S. Greco; B. Bouchon-Meunier; G. Coletti; M. Fedrizzi; B. Matarazzo; R. R. Yager. (Org.) Advances in Computational Intelligence: Communications in

Com-puter and Information Science. Berlin Heidelberg: Springer, 2012, v. 300, p. 20–29.

Conferências internacionais

∙ MACIEL, L.; GOMIDE, F.; LEMOS, A. P.; BALLINI, R. Adaptive fuzzy c-regression modeling for time series forecasting. In: 16th World Congress of the International Fuzzy Systems Association (IFSA) and the 9th Conference of the European Society for Fuzzy Logic and Technology (EUSFLAT), 2015, Gijón, Asturias, Spain.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Evolving possibilistic fuzzy modeling. In: IEEE International Conference on Fuzzy Systems (FUZZ-IEEE 2015), 2015, Istambul, Turkey.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Evolving possibilistic fuzzy modeling for fi-nancial interval time series forecasting. In: The Annual Conference of the North Ameri-can Fuzzy Information Processing Society (NAFIPS’2015), 2015, Redmond, WA, USA.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Recursive possibilistic fuzzy modeling. In: IEEE Symposium Series on Computational Intelligence (SSCI), 2014, Orlando, FL, USA.

(13)

∙ MACIEL, L.; GOMIDE, F.; SANTOS, D.; BALLINI, R. Exchange rate forecasting using echo state networks for trading strategies. In: Proceedings of the IEEE Compu-tational Intelligence for Financial Engineering & Economics (CIFEr), 2014, London, UK.

∙ ROSA, R.; MACIEL, L.; GOMIDE, F.; BALLINI, R. Evolving hybrid neural fuzzy network for realized volatility forecasting with jumps. In: Proceedings of the IEEE Com-putational Intelligence for Financial Engineering & Economics (CIFEr), 2014, London, UK.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R.; YAGER, R. Simplified evolving rule-based fuzzy modeling of realized volatility forecasting with jumps. In: Proceedings of the IEEE Workshop on Computational Intelligence for Financial Engineering and Econo-mics (CIFEr), 2013, Singapore.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Forecasting exchange rates with fuzzy gra-nular evolving modeling for trading strategies. In: Proceedings of the European Society for Fuzzy Logic and Technology Conference - EUSFLAT, 2013, Milan, Italy.

Conferências nacionais

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Stock market volatility prediction using pos-sibilistic fuzzy modeling. In: II Latin American Congress on Computational Intelligence (LA-CCI 2015), Curitiba, PR.

∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Risk management using evolving possibilistic fuzzy modeling. In: XV Encontro Brasileiro de Finanças (EBFin 2015), São Paulo, SP. ∙ MACIEL, L.; GOMIDE, F.; BALLINI, R. Minimum variance fuzzy possibilistic port-folio. In: Anais do XVII SemeAd - Seminários em Administração FEA-USP, 2014, São Paulo, Brasil.

(14)
(15)

Sumário

1 Introdução . . . . 1 1.1 Objetivos . . . 4 1.2 Contribuições . . . 6 1.3 Organização da tese . . . 9 2 Revisão bibliográfica . . . . 11

2.1 Modelagem nebulosa adaptativa . . . 11

2.2 Modelagem possibilística . . . 15

2.3 Computação granular . . . 18

2.4 Aplicações em séries temporais, economia e finanças . . . 20

2.5 Resumo . . . 24

3 Modelos nebulosos possibilísticos . . . . 25

3.1 Modelos Takagi-Sugeno . . . 25

3.2 Agrupamento nebuloso . . . 27

3.3 Agrupamento possibilístico . . . 32

3.4 Agrupamento com protótipos afins . . . 37

3.5 Estimação dos parâmetros dos consequentes . . . 39

3.6 Resumo . . . 40

4 Modelos nebulosos possibilísticos adaptativos . . . . 41

4.1 Modelo nebuloso possibilístico recursivo . . . 41

4.1.1 Matriz de dispersão nebulosa . . . 45

4.2 Mecanismos de adaptação . . . 47

4.2.1 Aprendizagem participativa . . . 47

4.2.2 Densidade de dados . . . 50

4.3 Agrupamento nebuloso possibilístico recursivo do tipo c-regressão e c-variedades 52 4.3.1 Atualização global dos consequentes . . . 52

4.3.2 Atualização local dos consequentes . . . 53

4.4 Avaliação da qualidade da base de regras . . . 54

4.5 Modelos nebulosos posibilísticos granulares . . . 56

4.6 Algoritmos dos modelos nebulosos possibilísticos adaptativos . . . 58

4.7 Resumo . . . 63

5 Experimentos computacionais . . . . 65

5.1 Introdução . . . 65

5.1.1 Avaliação de desempenho . . . 66 xv

(16)

5.2 Identificação de sistemas: Box & Jenkins . . . 67

5.3 Previsão de séries temporais . . . 77

5.3.1 Série temporal Mackey-Glass . . . 78

5.3.2 Série temporal sintética não linear variante no tempo . . . 88

5.4 Resumo . . . 98

6 Ensaios em finanças . . . . 101

6.1 Previsão da estrutura a termo das taxas de juros . . . 101

6.1.1 Introdução . . . 101

6.1.2 Metodologia . . . 106

6.1.3 Resultados e discussão . . . 109

6.2 Previsão de volatilidade realizada com saltos . . . 114

6.2.1 Introdução . . . 114 6.2.2 Metodologia . . . 116 6.2.3 Resultados e discussão . . . 120 6.3 Composição de carteiras . . . 137 6.3.1 Introdução . . . 137 6.3.2 Metodologia . . . 139 6.3.3 Resultados e discussão . . . 144 6.4 Precificação de opções . . . 149 6.4.1 Introdução . . . 149 6.4.2 Metodologia . . . 151 6.4.3 Resultados e discussão . . . 154

6.5 Estimação do Valor-em-Risco e Valor-em-Risco granular . . . 157

6.5.1 Introdução . . . 157 6.5.2 Metodologia . . . 161 6.5.3 Resultados e discussão . . . 163 6.6 Resumo . . . 169 7 Conclusão . . . . 171 Referências . . . . 173 xvi

(17)

À pessoa mais importante da minha vida, minha mãe, Ivete.

(18)
(19)

Agradecimentos

Agradeço,

aos meus pais, Ivete e Dirceu, o amor incondicional, essencial para a conclusão dessa jornada. Em especial à minha mãe, pelo carinho, dedicação, companhia, e por representar um dos principais motivos para nunca desistir.

ao meu irmão, Junior, minha cunhada, Juliana, minhas sobrinhas, Giovanna e Sarah, e meu mais novo sobrinho, e já muito amado, Gustavo, o carinho e apoio.

aos Professores Fernando Gomide e Rosangela Ballini a orientação, prestatividade, amizade, e dedicação em todas as etapas do desenvolvimento desse trabalho.

aos Professores André Paim Lemos, Daniel Leite, Fernando José Von Zuben e Ivette Luna as críticas, sugestões e contribuições, fundamentais para melhorar a qualidade e a redação final do manuscrito.

ao Professor Rodrigo Lanna o apoio, amizade e parceira em diversos trabalhos.

aos Professores Johan Hendrik Poker Jr., Marcos Barbieri, Marcelo Cunha e Eugenia Troncoso Leone pelo auxílio e oportunidade de experiência didática por meio do programa de estágio docente da UNICAMP.

aos meus grandes e queridos amigos Alexandre Martins, Lívia Rodrigues, Aline Galvão, Aqui-les Tescari Neto, e Adriana Canizelli, pela companhia, suporte e momentos de descontração. à Juliane Rosa (in memoriam), sempre presente nas melhores recordações.

à CAPES o apoio financeiro concedido durante todo o período de doutoramento. ao DCA a estrutura para o desenvolvimento de pesquisas científicas.

aos amigos de trabalho Raul Rosa, David Santos e Thomas Barlett a ajuda e compartilha-mento de seus conhecicompartilha-mentos.

aos Professores e Funcionários da FEEC/UNICAMP a ótima estrutura que oferecem aos estudantes e pesquisadores, profissionais que tornam a Faculdade excelência na qualidade de ensino e pesquisa em engenharia elétrica e computação.

a todos que de alguma forma contribuíram para este trabalho.

(20)
(21)

“Prediction is very difficult, especially if it’s about the future.” Nils Bohr

(22)
(23)

Lista de ilustrações

Figura 1 – Modelo Takagi-Sugeno para aproximação de funções. . . 26 Figura 2 – Conjunto de dados com dois grupos. . . 30 Figura 3 – Conjunto de dados com dois grupos sobrepostos. . . 31 Figura 4 – Conjunto de dados com dois grupos e outliers. . . . 31 Figura 5 – Aprendizagem participativa para adaptação em modelos nebulosos

Takagi-Sugeno. . . 49 Figura 6 – Desempenho do algoritmo aPFCM-PL quanto à variação nos parâmetros

P1 = 𝛾𝑣, P2 = 𝛾𝑐, P3 = 𝑎, P4 = 𝑏, P5 = 𝛽, P6 = 𝜂, P7 = 𝜗 e P8 = 𝜖. . 69

Figura 7 – Desempenho do algoritmo aPFCM-D quanto à variação nos parâmetros P1 = 𝛾𝑣, P2 = 𝛾𝑐, P3 = 𝑎, P4 = 𝑏 e P5 = 𝜖. . . . 70

Figura 8 – Desempenho do algoritmo aPFCR-PL quanto à variação nos parâmetros P1 = 𝑎, P2 = 𝑏, P3 = 𝛽, P4 = 𝜂, P5 = 𝜗 e P6 = 𝜖. . . . 70 Figura 9 – Desempenho do algoritmo aPFCR-D quanto à variação nos parâmetros P1

= 𝑎, P2 = 𝑏 e P3 = 𝜖. . . . 71 Figura 10 – Desempenho do algoritmo aPFCV-PL quanto à variação nos parâmetros

P1 = 𝑎, P2 = 𝑏, P3 = 𝛽, P4 = 𝜂, P5 = 𝜗 e P6 = 𝜖. . . . 71 Figura 11 – Desempenho do algoritmo aPFCV-D quanto à variação nos parâmetros P1

= 𝑎, P2 = 𝑏 e P3 = 𝜖. . . . 72 Figura 12 – Série de Box & Jenkins real e estimada pelo algoritmo aPFCM-D. . . 74 Figura 13 – Evolução do número de regras do algoritmo aPFCM-D para a série de Box

& Jenkins. . . 74 Figura 14 – Desempenho do algoritmo aPFCM-PL quanto à variação nos parâmetros

P1= 𝛾𝑣, P2 = 𝛾𝑐, P3 = 𝑎, P4 = 𝑏, P5 = 𝛽, P6 = 𝜂, P7 = 𝜗 e P8 = 𝜖. . . 79

Figura 15 – Desempenho do algoritmo aPFCM-D quanto à variação nos parâmetros P1 = 𝛾𝑣, P2 = 𝛾𝑐, P3 = 𝑎, P4 = 𝑏 e P5 = 𝜖. . . . 80

Figura 16 – Desempenho do algoritmo aPFCR-PL quanto à variação nos parâmetros P1 = 𝑎, P2 = 𝑏, P3 = 𝛽, P4 = 𝜂, P5 = 𝜗 e P6 = 𝜖. . . . 80 Figura 17 – Desempenho do algoritmo aPFCR-D quanto à variação nos parâmetros P1

= 𝑎, P2 = 𝑏 e P3 = 𝜖. . . . 81 Figura 18 – Desempenho do algoritmo aPFCV-PL quanto à variação nos parâmetros

P1 = 𝑎, P2 = 𝑏, P3 = 𝛽, P4 = 𝜂, P5 = 𝜗 e P6 = 𝜖. . . . 81 Figura 19 – Desempenho do algoritmo aPFCV-D quanto à variação nos parâmetros P1

= 𝑎, P2 = 𝑏 e P3 = 𝜖. . . . 82 xxiii

(24)

Figura 21 – Evolução do número de regras do algoritmo aPFCV-D para a série de Mackey-Glass. . . 84 Figura 22 – Desempenho do algoritmo aPFCM-PL quanto à variação nos parâmetros

P1 = 𝛾𝑣, P2 = 𝛾𝑐, P3 = 𝑎, P4 = 𝑏, P5 = 𝛽, P6 = 𝜂, P7 = 𝜗 e P8 = 𝜖. . 89

Figura 23 – Desempenho do algoritmo aPFCM-D quanto à variação nos parâmetros P1 = 𝛾𝑣, P2 = 𝛾𝑐, P3 = 𝑎, P4 = 𝑏 e P5 = 𝜖. . . . 90

Figura 24 – Desempenho do algoritmo aPFCR-PL quanto à variação nos parâmetros P1 = 𝑎, P2 = 𝑏, P3 = 𝛽, P4 = 𝜂, P5 = 𝜗 e P6 = 𝜖. . . . 90 Figura 25 – Desempenho do algoritmo aPFCR-D quanto à variação nos parâmetros P1

= 𝑎, P2 = 𝑏 e P3 = 𝜖. . . . 91 Figura 26 – Desempenho do algoritmo aPFCV-PL quanto à variação nos parâmetros

P1 = 𝑎, P2 = 𝑏, P3 = 𝛽, P4 = 𝜂, P5 = 𝜗 e P6 = 𝜖. . . . 91 Figura 27 – Desempenho do algoritmo aPFCV-D quanto à variação nos parâmetros P1

= 𝑎, P2 = 𝑏 e P3 = 𝜖. . . . 92 Figura 28 – Série temporal sintética real e estimada pelo algoritmo aPFCM-D. . . 94 Figura 29 – Evolução do número de regras do algoritmo aPFCV-D para a série

tem-poral sintética. . . 94 Figura 30 – Estrutura a Termo das Taxas de Juros no Brasil. . . 107 Figura 31 – Evolução do número de regras do algoritmo aPFCM-D para a predição da

ETTJ no Brasil. . . 113 Figura 32 – Séries dos retornos (painel superior), volatilidade realizada (painel central)

e saltos (painel inferior) para o índice S&P 500. . . 121 Figura 33 – Séries dos retornos (painel superior), volatilidade realizada (painel central)

e saltos (painel inferior) para o índice Nasdaq. . . 121 Figura 34 – Séries dos retornos (painel superior), volatilidade realizada (painel central)

e saltos (painel inferior) para o índice FTSE. . . 122 Figura 35 – Séries dos retornos (painel superior), volatilidade realizada (painel central)

e saltos (painel inferior) para o índice DAX. . . 122 Figura 36 – Séries dos retornos (painel superior), volatilidade realizada (painel central)

e saltos (painel inferior) para o índice IBEX. . . 123 Figura 37 – Séries dos retornos (painel superior), volatilidade realizada (painel central)

e saltos (painel inferior) para o índice IBOVESPA. . . 123 Figura 38 – Volatilidade real do índice S&P 500 e estimada pelo algoritmo aPFCM-D. 127 Figura 39 – Volatilidade real do índice Nasdaq e estimada pelo algoritmos aPFCV-D. 127 Figura 40 – Volatilidade real do índice FTSE e estimada pelo algoritmo aPFCV-D. . 128 Figura 41 – Volatilidade real do índice DAX e estimada pelo algoritmo aPFCM-D. . 128

(25)

Figura 42 – Volatilidade real do índice IBEX e estimada pelo algoritmo aPFCM-PL. 129 Figura 43 – Volatilidade real do índice IBOVESPA e estimada pelo algoritmos

aPFCM-D. . . 129 Figura 44 – Evolução do número de regras do algoritmo aPFCM-D para a predição da

volatilidade realizada do índice S&P 500. . . 134 Figura 45 – Evolução do número de regras do algoritmo aPFCV-D para a predição da

volatilidade realizada do índice Nasdaq. . . 134 Figura 46 – Evolução do número de regras do algoritmo aPFCV-D para a predição da

volatilidade realizada do índice FTSE. . . 135 Figura 47 – Evolução do número de regras do algoritmo aPFCM-D para a predição da

volatilidade realizada do índice DAX. . . 135 Figura 48 – Evolução do número de regras do algoritmo aPFCM-PL para a predição

da volatilidade realizada do índice IBEX. . . 136 Figura 49 – Evolução do número de regras do algoritmo aPFCM-D para a predição da

volatilidade realizada do índice IBOVESPA. . . 136 Figura 50 – Retornos do preço de fechamento (painel superior), mínimo (painel

cen-tral), e máximo (painel inferior) do IBOVESPA. . . 165 Figura 51 – Retornos do preço de fechamento do IBOVESPA (RetIBOV) e suas

predi-ções do VaR (VaRfech) e VaR (VaRmin e VaRmax) intervalar obtidas pelos

algoritmos aPFCM-D e aPFCM-D𝑑𝐻, respectivamente. . . 168

(26)
(27)

Lista de tabelas

Tabela 1 – Parâmetros dos algoritmos nebulosos possibilísticos para a modelagem da série de Box & Jenkins. . . 72 Tabela 2 – Desempenho dos algoritmos adaptativos para a série de Box & Jenkins. . 73 Tabela 3 – Desempenho dos algoritmos adaptativos para a série de Box & Jenkins

com ruídos aleatórios. . . 75 Tabela 4 – Estatísticas do teste de Diebold-Mariano para a série de Box & Jenkins. 76 Tabela 5 – Graus de pertinência e de tipicalidade dos outliers na série de Box & Jenkins. 77 Tabela 6 – Parâmetros dos algoritmos nebulosos possibilísticos para a série de

Mackey-Glass. . . 82 Tabela 7 – Desempenho dos algoritmos adaptativos para a série de Mackey-Glass. . 83 Tabela 8 – Estatísticas do teste de Diebold-Mariano para a série de Mackey-Glass. . 86 Tabela 9 – Desempenho dos algoritmos adaptativos para a série de Mackey-Glass com

ruídos aleatórios. . . 87 Tabela 10 – Graus de pertinência e de tipicalidade dos outliers na série de Mackey-Glass. 88 Tabela 11 – Parâmetros dos algoritmos nebulosos possibilísticos para a série temporal

sintética. . . 93 Tabela 12 – Desempenho dos algoritmos adaptativos para a série temporal sintética. 93 Tabela 13 – Estatísticas do teste de Diebold-Mariano para a série temporal sintética. 96 Tabela 14 – Desempenho dos algoritmos adaptativos para a série temporal sintética

com ruídos aleatórios. . . 97 Tabela 15 – Graus de pertinência e de tipicalidade dos outliers na série sintética. . . 98 Tabela 16 – Métodos de estimação da ETTJ para os bancos centrais que reportam suas

estimativas ao BIS. . . 102 Tabela 17 – Parâmetros dos algoritmos nebulosos possibilísticos para a ETTJ no Brasil.109 Tabela 18 – Desempenho dos algoritmos para predição da curva de juros no Brasil. . 111 Tabela 19 – Estatísticas do teste de Diebold-Mariano para previsão da ETTJ no Brasil. 112 Tabela 20 – Desempenho computacional para predição da ETTJ no Brasil. . . 113 Tabela 21 – Estatísticas descritivas das séries de retornos dos índices de bolsa de valores.120 Tabela 22 – Parâmetros dos algoritmos nebulosos possibilísticos para a previsão da

volatilidade realizada com saltos. . . 125 Tabela 23 – Desempenho dos algoritmos para previsão da volatilidade realizada. . . . 126 Tabela 24 – Estatísticas do teste de Diebold-Mariano para previsão da volatilidade

realizada. . . 130 xxvii

(28)

saltos. . . 132 Tabela 27 – Entradas dos algoritmos nebulosos possibilísticos e nebulosos evolutivos

para o problema de rebalanceamento de uma carteira de variância mínima. 146 Tabela 28 – Parâmetros dos algoritmos nebulosos possibilísticos para o problema de

rebalanceamento de uma carteira de variância mínima. . . 146 Tabela 29 – Desempenho das carteiras com rebalanceamento. . . 147 Tabela 30 – Número médio de ações das carteiras de investimento. . . 148 Tabela 31 – Parâmetros dos algoritmos nebulosos possibilísticos para determinação dos

preços das opções de compra (call) e venda (put) sobre as ações preferenci-ais da Petrobras, PETR4, com e sem utilização da fórmula de Black-Scholes.155 Tabela 32 – Desempenho dos algoritmos para determinação dos preços das opções de

compra (call) e venda (put) sobre as ações preferenciais da Petrobras, PETR4. . . 156 Tabela 33 – Tempo de processamento e número médio de regras dos algoritmos para

determinação dos preços das opções de compra (call) e venda (put) sobre as ações preferenciais da Petrobras, PETR4. . . 157 Tabela 34 – Estatísticas descritivas das séries de retornos dos preços de fechamento,

mínimo e máximo do índice IBOVESPA. . . 164 Tabela 35 – Parâmetros dos algoritmos nebulosos possibilísticos para a previsão do

VaR dos valores mínimo, máximo e de fechamento do índice IBOVESPA. 165 Tabela 36 – Desempenho dos algoritmos para previsão do VaR do preço de fechamento

do índice IBOVESPA. . . 166 Tabela 37 – Desempenho dos algoritmos para previsão do VaR intervalar a partir dos

preços mínimo e máximo do índice IBOVESPA. . . 167 Tabela 38 – Tempo total de processamento dos algoritmos para previsão do VaR

in-tervalar a partir dos preços mínimo e máximo do índice IBOVESPA. . . 168

(29)

Lista de Acrônimos e Notação

EIS evolving intelligent systems/sistemas evolutivos inteligentes

eFS evolving fuzzy systems/sistemas nebulosos evolutivos

FCM fuzzy c-means

PCM possibilistic c-means

PFCM possibilistic fuzzy c-means

DM Diebold-Mariano

𝑥 dado de entrada ℛ regra nebulosa

𝑦 dado de saída

𝜃 parâmetro da função linear dos consequentes

𝑚 dimensão dos dados de entrada

𝑐 número de regras/grupos 𝒜 conjunto nebuloso

𝑚 conjunto dos números reais 𝑚-dimensional

𝜏𝑁 grau de ativação normalizado

𝑥𝑒 dado de entrada expandido

𝑈 matrix de partição nebulosa

𝑢 grau de pertinência

𝑘 passo em processos construtivos/adaptativos

𝑋 matriz de dados

𝑉 matriz de centróides

𝑣 centróide

𝑀𝑝𝑐𝑛 conjunto de matrizes de partição possibilística

𝑀𝑓 𝑐𝑛 conjunto de matrizes de partição nebulosa

𝜂𝑓 fator de sobreposição nebuloso

𝜂𝑝 fator de sobreposição possibilístico

(30)

𝑡 grau de tipicalidade

𝑇 matriz de partição possibilística

𝛾 fator de dispersão possibilístico

𝑎 peso relativo dos graus de pertinência

𝑏 peso relativo dos graus de tipicalidade

𝜓 vetor de entrada expandido ponderado

Ψ matriz de vetores de entrada expandidos ponderados

𝛾𝑣 fator de esquecimento dos protótipos

𝐹 matriz de dispersão nebulosa

𝛾𝑐 fator de esquecimento das matrizes de dispersão nebulosa

𝜌 índice de compatilidade

𝛼 índice de alerta

𝛽 taxa de mudança no nível do alerta

𝜂 limiar do índice de alerta

𝜗 limiar do índice de compatibilidade 𝒟 densidade de dados 𝐶 matriz de dispersão 𝒰 utilidade 𝜖 limiar da utilidade ¯ 𝑥 dado intervalar 𝑥𝑖𝑛𝑓 limite inferior de ¯𝑥 𝑥𝑠𝑢𝑝 limite superior de ¯𝑥

𝑑𝐻 distância de Hausdorff para intervalos

𝑑𝐸 distância euclidiana para intervalos

(31)

1

1 Introdução

O desenvolvimento de sistemas automatizados, dispositivos computacionais de pe-quena escala, redes de sensores, e de tecnologias de obtenção de dados, resultou em um elevado crescimento da disponibilidade de informações, e a posterior necessidade de seu pro-cessamento eficiente para extração de conhecimento. Uma das especificidades desse fenômeno é que a informação não é apenas apresentada em grandes quantidades mas, principalmente, na forma de fluxos de dados (data streams) (ANGELOV, 2010). Essa característica implica em novos desafios para as abordagens tradicionais de processamento de dados, uma vez que, em geral, o processo tradicional para construir modelos de classificação, controle e inferên-cia é não adaptativo e necessita de elevada quantidade de dados. Em sistemas variantes no tempo, cada nova informação pode implicar em alteração na estrutura relacional de seus componentes, fenômeno não capturado por metodologias que consideram dados em batelada. Para superar essas limitações de abordagens tradicionais de processamento de dados e garantir a extração de informações com adequada interpretabilidade em fluxos de dados, técnicas em tempo real (on-line) adaptativas vêm sendo desenvolvidas em contraposição aos modelos convencionais da teoria de controle (ASTRÖM; WITTENMARK, 1989). Essas abor-dagens também diferem daquelas provenientes da teoria clássica de identificação de sistemas (LJUNG, 1988), dos métodos tradicionais de aprendizado de máquina (machine learning), e métodos estatísticos (HASTIE et al., 2001), em que o processo gerador dos dados é suposto ser de natureza aleatória e de operar de acordo com distribuições de probabilidades definidas

a priori.

Como fluxos de dados são irrestritos e podem ser produzidos em alta frequência, in-certezas são inerentes ao processo gerador. Resulta, então, uma demanda por métodos que sejam capazes de armazenar as informações essenciais, partindo de uma premissa em que é possível delinear um subconjunto de dados que represente o conhecimento relevante, funda-mental para o entendimento da natureza do sistema subjacente, evitando a necessidade de armazenamento (LUGHOFER; ANGELOV, 2011). É necessário, portanto, processar continu-amente os dados, de forma a detectar estruturas espaço-temporais para permitir a construção de relações que descrevam o fenômeno que governa os dados. Em última instância, obter uma representação abstrata, para melhor compreensão humana do fenômeno associado aos dados. Mecanismos capazes de extrair conhecimento em tempo real a partir de fluxos de dados compõem os Sistemas Inteligentes Evolutivos (Evolving Intelligent Systems - EIS). EIS consideram processos não estacionários utilizando métodos e algoritmos que evoluem

(32)

ou, gradualmente, modifiquem modelos locais para garantir a auto-organização da estrutura do sistema a cada nova informação ou, ainda, de acordo com perturbações ou inovações (choques), i.e., abordagens adaptativas. Técnicas nebulosas ou neuro-nebulosas permitem o desenvolvimento e adaptação estrutural e funcional de sistemas variantes no tempo de acordo com cada nova informação (dado), avaliando a necessidade de readequação.

No campo dos EIS, destacam-se os sistemas nebulosos evolutivos (evolving fuzzy

sys-tems - eFS), capazes de atualizar a estrutura e funcionalidade de modelos de acordo com

fluxos de dados. eFS podem ser vistos como uma sinergia entre sistemas nebulosos e meca-nismos adaptativos1 de processamento e representação de informação, que utilizam métodos recursivos de aprendizagem de máquina (LEMOS et al., 2011). Na literatura, em geral, eFS consideram um sistema funcional baseado em regras nebulosas, conhecidos também como sistemas nebulosos do tipo Takagi-Sugeno, cuja estrutura, número de regras e parâmetros dos antecedentes e consequentes das regras ajustam-se continuamente através da criação e exclusão recursiva de grupos de dados.

Os modelos adaptativos baseados em regras nebulosas funcionais se caracterizam pela sua estrutura e parâmetros das respectivas regras. A estrutura do modelo é formada por grupos de dados, representados através de centros ou centróides, traduzidos em antecedentes das regras. Esse procedimento é realizado por meio de algoritmos de agrupamento nebuloso, sendo o algoritmo Fuzzy C-means (FCM) (BEZDEK, 1981) e suas extensões, alguns dos algoritmos mais utilizados na literatura.

O FCM associa graus de pertinência aos dados proporcionalmente ao inverso da dis-tância dos mesmos aos centros dos grupos. Entretanto, uma das principais limitações do modelo FCM consiste na sua inadequação para tratar dados com ruídos e outliers. Por exem-plo, considere dois grupos. Além disso, suponha que um dado seja um outlier, equidistante dos centros dos dois grupos. De acordo com o FCM, o grau de pertinência desse dado aos dois grupos é o mesmo e igual a 0,5, dada a restrição associada ao modelo em que a soma dos graus de pertinências de um dado a todos os grupos deve ser igual à unidade. Neste caso, seria mais apropriado que o outlier tenha baixo grau de pertinência aos grupos, ou melhor ainda, grau de pertinência nulo.

Para superar essa limitação, Krishnapuram e Keller (1993) propuseram o modelo de agrupamento possibilístico PCM (Possibilistic c-Means), que se caracteriza pelo relaxamento da restrição do modelo FCM associada à soma unitária dos graus de pertinência de um dado aos grupos. Neste caso, os autores interpretam graus de pertinência como graus de

1 Os termos “evolutivo” e “adaptativo” serão utilizados como sinônimos ao longo deste trabalho, de forma

a indicar a característica de modelos em que sua estrutura e funcionalidade são atualizadas de acordo com cada nova informação, dinamicamente.

(33)

3

tipicalidade. Dada a sensibilidade à inicialização do modelo PCM, posteriormente, Pal et al. (2005) sugeriram o modelo de agrupamento possibilístico nebuloso PFCM (Possibilistic Fuzzy

c-Means), em que os dados são agrupados considerando, conjuntamente, graus de pertinência

e de tipicalidade. O modelo PFCM, dessa forma, supera as limitações dos modelos FCM e PCM, como também se destaca como uma abordagem alternativa para tratar dados com ruídos e outliers. Recentemente, a literatura tem explorado e proposto extensões para o agrupamento nebuloso de dados de acordo com abordagens possibilísticas, evidenciando seu bom desempenho quando comparadas com técnicas tradicionais de agrupamento nebuloso (YANG; WU, 2004; HAI-JUN et al., 2011; TREERATTANANAPITAK; JARUSKULCHAI, 2013).

Um dos objetos principais de pesquisa deste trabalho consiste na construção de um método de modelagem baseado em agrupamento possibilístico de fluxos de dados, de forma adaptativa/evolutiva. Introduz-se, portanto, um método capaz de processar informações em fluxos de dados originadas de fenômenos não lineares variantes no tempo sujeitos a ruídos e

outliers, de forma a obter adaptabilidade e robustez.

Embora os sistemas nebulosos evolutivos apresentem um elevado potencial ao consi-derar dados provenientes de fenômenos não estacionários por meio de algoritmos de agru-pamento recursivos e modelos locais adaptativos, eles tratam dados numéricos, não sendo ainda capazes de processar informações em uma perspectiva mais abstrata e conceitual. Em termos de cognição e comunicação humana, Zadeh (2005) destaca que as informações são processadas em termos de percepções. As percepções são expressas por grânulos de infor-mação, assim como na linguagem natural. A granularização da informação implica que, ao invés da representação por meio de dados numéricos, os dados estão dispostos de maneira abstrata. Um grânulo de informação é uma coleção de objetos caracterizados por serem in-distinguíveis, similares, próximos, ou por possuírem mesma funcionalidade (ZADEH, 1997). Exemplos de grânulos incluem intervalos, conjuntos nebulosos, densidade de probabilidades e rough sets. Um conjunto de grânulos pode constituir um vocabulário genérico de descrições (PEDRYCZ; KAWAK, 2007). Os grânulos de informação podem ter uma semântica associ-ada a regras. As regras conectam os elementos do vocabulário e, portanto, desempenham um papel fundamental na computação de informações descritas linguisticamente.

Teorias e metodologias que empregam a utilização de grânulos de informação na so-lução de problemas que tratam fluxos de dados e aprendizagem compõem uma nova área de estudo chamada de computação granular (PEDRYCZ, 2007; BARGIELA; PEDRYCZ, 2008; PEDRYCZ et al., 2012). Computação granular, como um paradigma de processamento de informação, evidencia múltiplos níveis de detalhamento de dados, de forma a promover uma visão abstrata com soluções aproximadas para problemas complexos (YAO, 2008). A noção

(34)

e a necessidade de tratar dados granulares emergem como uma solução para abstração e sumarização de informação, aplicadas como suportes em processos baseados na compreensão simplificada de sistemas, assim como em modelos de tomada de decisão (BARGIELA; PE-DRYCZ, 2002). Informações numéricas são integradas em grânulos de forma a transcrever problemas complexos em problemas locais simplificados, com o objetivo de extrair caracte-rísticas de interesse para a obtenção de soluções eficientes e uma melhor conformidade com a realidade.

A abordagem nebulosa possibilística adaptativa considerada no presente trabalho con-sidera o caso em que as informações podem também assumir a forma de grânulos de infor-mação, do tipo intervalo. Sistemas altamente complexos apresentam informações disponíveis com um grau maior de incertezas associadas, de forma que, em sua modelagem, requerem não apenas técnicas precisas mas também interpretáveis. Dessa forma, o aspecto granular inserido no modelo nebuloso possibilístico permite que a consideração de um determinado nível de incerteza às informações possa ser vantajosa, o que resulta em um equilíbrio entre precisão e interpretabilidade.

Por fim, outro objeto relevante de pesquisa desta tese compreende a aplicação da metodologia introduzida em problemas em finanças, mais especificamente, para a previsão da estrutura a termo das taxas de juros, volatilidade dos retornos de preços de ativos financeiros, composição de carteiras, precificação de opções, e estimação da medida de risco Valor-em-Risco em termos granulares. Fenômenos financeiros apresentam uma dinâmica altamente não linear e variante no tempo. Além disso, inovações (choques) ou mesmo outliers afetam, em geral, esses sistemas, pois podem representar tanto a resposta às variações sofridas por variáveis direta e indiretamente relacionadas, assim como resposta à reversão de expectativas dos agentes financeiros quanto ao futuro.

1.1

Objetivos

O objetivo desta tese é desenvolver uma metodologia de modelagem nebulosa pos-sibilística de sistemas não lineares variantes no tempo considerando fluxos de dados. Para isso, propõe-se um algoritmo recursivo de agrupamento nebuloso possibilístico como parte da identificação da estrutura de modelos nebulosos do tipo Takagi-Sugeno. A estrutura do modelo é determinada pelos grupos, em que a cada grupo corresponde a uma regra nebulosa. A recursividade do modelo permite sua adequação a mudanças ou variações no ambiente sem a necessidade de armazenar dados anteriores. A consideração de graus de pertinência e de tipicalidade possibilita identificar modelos locais no espaço dos dados e compor um método robusto a ruídos e outliers.

(35)

1.1. Objetivos 5

A metodologia da modelagem nebulosa possibilística é considerada em duas versões. A primeira delas utiliza uma representação tradicional para a estrutura da base de regras, onde os grupos são representados por pontos no espaço dos dados, chamados de centros de grupo ou centróides. A segunda delas considera grupos que são representados por variedades lineares, i.e., funções afins.

No algoritmo nebuloso possibilístico recursivo, o número de grupos, e então o número de regras nebulosas, não é fixo e fornecido pelo usuário. À medida que cada novo dado é apresentado, a estrutura do modelo é revista, traduzindo-se em uma abordagem adaptativa ou evolutiva de modelagem. Adaptar a estrutura do modelo significa criar e excluir grupos, assim como monitorar e ajustar grupos redundantes. Para isso, são utilizados dois conceitos distintos: aprendizagem participativa e densidade de dados. A aprendizagem participativa considera a informação como fator relevante para revisar o conhecimento do sistema por meio de medidas de compatibilidade entre o dado e a atual estrutura da base de regras. Por outro lado, o conceito de densidade de dados associa uma medida para cada grupo proporcional ao inverso da distância dos dados aos centros dos grupos.

O método de modelagem nebulosa possibilística adaptativa é estendido para o caso em que os dados de entrada são intervalos.

Elabora-se também uma aplicação e avaliação computacional da metodologia de mo-delagem nebulosa possibilística adaptativa para analisar seu desempenho e utilidade prática. As abordagens introduzidas são aplicadas em benchmarks na área de identificação e séries temporais: Box & Jenkins e Mackay-Glass, respectivamente. Além disso, considera-se uma série sintética gerada por um modelo não linear e variante no tempo, com o objetivo de avaliar a capacidade da modelagem em sistemas dinâmicos não lineares variantes no tempo. Neste caso, os experimentos computacionais objetivam constatar a capacidade de identificação dos modelos, assim como analisar os resultados para distintos conjuntos de parâmetros em uma análise de sensibilidade. Deve-se destacar, ainda, a introdução de dados sintéticos com o ob-jetivo de simular ruídos e outliers para avaliar o desempenho das abordagens possibilísticas. O trabalho também estuda a aplicação dos métodos de modelagem nebulosa pos-sibilística adaptativa em tradicionais, mas importantes problemas econômico-financeiros: i) previsão da estrutura a termo das taxas de juros; ii) previsão de volatilidade dos retornos de preços de ativos financeiros; iii) composição e rebalanceamento de carteiras; iv) precificação de opções de compra e venda sobre ações; v) estimação da medida de risco Valor-em-Risco em termos granulares. Tratam-se de problemas que são diariamente enfrentados por gesto-res, governos, instituições financeiras e investidores. As séries financeiras subjacentes dessas aplicações apresentam um comportamento dinâmico não linear variante no tempo, o que

(36)

evidencia a necessidade de técnicas adaptativas eficientes para uma modelagem apropriada. Além disso, são fenômenos altamente influenciados por incertezas (expectativa dos agentes, e.g. percepção), característica que confirma a utilização de abordagens que utilizam concei-tos de conjunconcei-tos nebulosos. Em todos os casos, os resultados são comparados com aqueles obtidos a partir de modelos econométricos tradicionais da literatura.

1.2

Contribuições

As contribuições desta tese podem ser divididas, essencialmente, em três grupos: con-ceitual, metodológica e computacional/empírica.

A contribuição conceitual se resume à introdução de uma metodologia para a cons-trução de sistemas nebulosos possibilísticos, i.e., estender essa modelagem para o caso de sistemas dinâmicos variantes no tempo em termos adaptativos/evolutivos. Além disso, essa abordagem é também formulada para a representação e processamento de fluxos de dados granulares, de forma a permitir que os dados de entrada e saída possam ser descritos por números reais ou intervalos. Elementos centrais à abordagem proposta, além da eficiência computacional, estão as questões de interpretabilidade e transparência do modelo.

As contribuições metodológicas compreendem as formulações distintas para construir o método de modelagem nebulosa possibilística adaptativa considerando dados numéricos e intervalares. As metodologias são orientadas a diferentes formas de representação dos mo-delos locais, levando em conta parcimônia e representatividade dos momo-delos. Em comum, os métodos desenvolvidos consideram os conceitos de graus de pertinência e de tipicalidade no agrupamento de dados.

Essencialmente, são dois métodos distintos. O primeiro deles constitui-se em um mo-delo nebuloso possibilístico adaptativo em que os grupos, ou momo-delos locais, serão formados por protótipos caraterizados por um centróide, representados a partir de um dado obtido do sistema a ser modelado, sendo atualizado de acordo com a mudança de dinâmica. O segundo consiste em construir modelos nebulosos possibilísticos em que os protótipos são variedades lineares, i.e., funções afins.

Adicionalmente, o componente adaptativo dessas abordagens é construído a partir de dois conceitos distintos, amplamente utilizados na literatura para a construção de modelos nebulosos adaptativos: aprendizagem participativa e densidade de dados. A ideia, neste caso, consiste em identificar a técnica mais apropriada para a representação da informação contida em fluxos de dados numéricos e granulares.

(37)

1.2. Contribuições 7

benchmarks tradicionais da literatura de identificação e séries temporais, como as séries Box

& Jenkins e Mackey-Glass, e considerando ainda uma série temporal sintética gerada a partir de um modelo não linear variante no tempo. Uma análise de sensibilidade dos resultados das metodologias possibilísticas quanto à parametrização também é incluída, de forma a verificar os parâmetros que resultam em maior variação de desempenho. Além disso, adicionou-se às séries dos benchmarks dados com características de ruídos e outliers com o intuito de avaliar a robustez das técnicas possibilísticas.

A terceira e importante contribuição desta tese corresponde às aplicações empíricas propostas para a modelagem nebulosa possibilística adaptativa. Um campo específico de aplicação de abordagens evolutivas consiste na modelagem de sistemas econômicos e finan-ceiros, dada a elevada presença de incertezas associadas, como o comportamento dinâmico, altamente não linear e variante no tempo de grande parte desses fenômenos. Em particular, os seguintes problemas são explorados: i) previsão da estrutura a termo das taxas de juros; ii) previsão de volatilidade dos retornos de preços de ativos financeiros; iii) composição e rebalanceamento de carteiras; iv) precificação de opções de compra e venda sobre ações; v) estimação da medida de risco Valor-em-Risco em termos granulares. Para todos os casos, um dos fatores principais que influenciam as taxas de juros e variabilidade dos ativos financeiros consiste na expectativa dos agentes quanto ao futuro dessas variáveis, ou seja, são ambientes com a presença de incertezas, o que evidencia a utilização de modelos capazes de tratar ade-quadamente esses tipos de informações, que também podem ser representadas por grânulos de informação.

A estrutura a termo das taxas de juros (ETTJ) é definida como a relação entre as taxas nominais de juros de títulos públicos que não pagam cupons (zero-cupom), ou taxas consideradas livres de riscos, e diferentes maturidades, i.e., descreve a evolução dinâmica das taxas de juros para distintos prazos em determinado dia. Como a evolução da estrutura a termo das taxas de juros apresenta um comportamento não linear e dinâmico, em decorrência da condição verificada nos mercados de taxas de juros, a abordagem proposta nesta tese apresenta um paradigma relevante a esse tipo de fenômeno.

É de extrema importância, principalmente nos mercados financeiros, a previsão da estrutura a termo das taxas de juros. Instituições financeiras, por exemplo, necessitam con-trolar a sua exposição ao risco de oscilação de taxas de juros por meio do balanceamento de suas posições em títulos de dívida pública ou em contratos futuros que possuem seu valor atrelado às taxas de juros. A ETTJ ainda é essencial na precificação de ativos financeiros como títulos públicos, contratos futuros, swaps, opções, assim como é uma variável chave na administração de riscos, em decisões corporativas de financiamento, e na composição de portfólios. A estrutura a termo também permite o monitoramento de variáveis econômicas

(38)

como o prêmio pelo risco, inflação e taxa real de atividade econômica.

Similarmente, a modelagem e previsão da volatilidade de ativos financeiros assume papel central na precificação de instrumentos de derivativos, composição de carteiras, gestão de riscos, análise de investimentos e operações de hedge. Como a volatilidade dos mercados financeiros influencia diretamente as decisões de políticas econômicas (policy making), sua previsão permite a mensuração da vulnerabilidade dos mercados e da economia de forma geral. Como a variabilidade dos preços dos ativos negociados nos mercados financeiros apre-senta um comportamento dinâmico e variante no tempo, modelos econométricos tradicionais não são capazes de capturar tal dinâmica adequadamente, dada sua formulação, em geral, linear, que necessita de elevada quantidade de dados para a estimação de seus parâmetros.

O problema de composição de carteiras é considerado diariamente por bancos, insti-tuições, governos e agentes de mercado em geral, uma vez que devem ajustar suas posições de acordo com a variação da dinâmica do mercado. Entretanto, as abordagens de formação de carteiras tradicionais necessitam da suposição de distribuições de probabilidade dos re-tornos e riscos das posições, assim como os modelos de predição para o rebalanceamento são representados por estruturas lineares, que não refletem adequadamente as flutuações dos pre-ços dos ativos. Nesse caso, a modelagem nebulosa possibilística se apresenta como potencial alternativa, uma vez que não requer suposições sobre os dados e pode processar as informa-ções em tempo real, fundamental para o rebalanceamento das posiinforma-ções, principalmente de carteiras em larga-escala.

Nos mercados de derivativos, os contratos de opções são instrumentos importantes como forma alternativa de investimento, especulação, e também como mecanismo de prote-ção contra variações inesperadas nos preços dos ativos subjacentes. São utilizados não apenas por investidores, como também por empresas e exportadores que desejam proteger suas ope-rações contra variações de taxas de juros, de câmbio, preços de ações, índices, dentre outros. As variáveis que determinam o preço de uma opção nos tradicionais modelos de precificação são: preço de exercício, maturidade, taxa de juros livre de riscos e volatilidade do ativo subja-cente. Esse último fator não é observado, portanto deve ser estimado. Dessa forma, conforme mencionado, essa variável pode ser estimada a partir da modelagem nebulosa possibilística adaptativa sugerida neste trabalho e inserida em modelos de precificação de opções. Como es-ses contratos oferecem um alto nível de retorno esperado, o risco associado também é elevado, o que demanda métodos de precificação cada vez mais precisos.

Por fim, a medida de risco Valor-em-Risco, ou VaR, mensura a perda máxima esperada de uma carteira ou ativo dado um horizonte de tempo, de acordo com um nível de significância pré-especificado. Uma das implicações da criação do comitê de supervisão bancária da Basiléia

(39)

1.3. Organização da tese 9

consiste na consideração do VaR como ferramenta padrão para estimar o risco de mercado, sendo a medida de risco mais utilizada desde 1996. Apesar do conceito simples do VaR, sua estimação é frequentemente negligenciada na prática, sendo os modelos da família GARCH os mais utilizados no mercado. Entretanto, esses modelos apresentam suposições restritivas sobre a distribuição dos retornos, que resultam em inadequação dos resultados, principalmente em casos de maior variabilidade. Além da aplicação da modelagem nebulosa possibilística para estimação do VaR, considera-se uma versão granular dessa medida de risco, de forma a estimá-la em termos de intervalos numéricos. Esse procedimento permite que limites para o VaR sejam construídos, e que possam direcionar mais adequadamente a revisão da exposição ao risco em investimentos, i.e., garante maior flexibilidade na tomada de decisões, sendo esses limites interpretados como níveis de alerta para o comportamento do VaR, por exemplo.

1.3

Organização da tese

Esta tese está estruturada em sete capítulos, sumarizados a seguir.

∙ Este capítulo tratou da motivação e do tema de pesquisa desta tese, assim como os respectivos objetivos e contribuições.

∙ A revisão da literatura sobre modelagem nebulosa evolutiva/adaptativa é apresentada no Capítulo 2. Incluem-se as abordagens que consideram agrupamentos nebulosos e nebulosos possibilísticos, assim como a utilização de grânulos para a representação da informação, e os trabalhos que tratam as aplicações dessas abordagens em séries temporais, sobretudo para problemas em economia e finanças.

∙ O Capítulo 3 estuda a estrutura dos sistemas nebulosos possibilísticos baseados em regras e os procedimentos utilizados para a sua identificação, considerando a represen-tação dos protótipos a partir de centróides e funções afins.

∙ No Capítulo 4, desenvolve-se o método de modelagem nebulosa possibilística adap-tativa. São considerados os conceitos de aprendizagem participativa e densidade dos dados para a atualização da estrutura dos modelos. Ainda, a modelagem é estendida para o tratamento de fluxos de dados granulares representados por intervalos.

∙ Experimentos computacionais são reportados no Capítulo 5, em que o método de mo-delagem proposto é avaliado utilizando benchmarks na área de identificação e séries temporais, assim como em uma série sintética. Uma análise de sensibilidade dos pa-râmetros dos modelos também é feita conjuntamente com a verificação da robustez dos mesmos quando na presença de ruídos e outliers. Adicionalmente, os experimentos

(40)

acompanham as respectivas discussões e comparações com métodos representativos do estado da arte na área de sistemas nebulosos evolutivos.

∙ O Capítulo 6 ilustra os ensaios em finanças, i.e., a previsão das taxas de juros, previsão da variabilidade do retorno dos preços de ativos financeiros, composição e balancea-mento de carteiras, precificação de opções sobre ações e estimação da medida de risco Valor-em-Risco em termos granulares. Os resultados são comparados com técnicas eco-nométricas tradicionais da literatura.

∙ Por fim, o Capítulo 7 apresenta as conclusões, sumarizando as principais contribuições, e sugere tópicos a serem estudados e desenvolvidos no futuro.

(41)

11

2 Revisão bibliográfica

Este capítulo compreende uma revisão bibliográfica da literatura sobre modelagem nebulosa evolutiva/adaptativa. São apresentados os principais modelos, considerados estado da arte na identificação de sistemas dinâmicos, em que as informações são observadas na forma de fluxos de dados. A abordagem nebulosa possibilística, como alternativa para problemas que têm suas dinâmicas afetadas pela presença de ruídos e outliers, também é destacada. Incluem-se os trabalhos que utilizam representação granular para as informações em sistemas nebulosos, formulados de forma a fornecer tratabilidade para dados em linguagem natural, garantindo maior grau de abstração para fenômenos reais complexos. Além disso, a literatura que confere aplicações dessas abordagens em problemas de séries temporais, sobretudo em economia e finanças, também é apresentada.

2.1

Modelagem nebulosa adaptativa

A emergência dos modelos nebulosos evolutivos/adaptativos decorreu da elevada ne-cessidade que surgiu nos últimos anos de processamento eficiente de informações, assim como da extração de conhecimento, elemento chave na modelagem e controle de sistemas comple-xos. Em sistemas complexos de grande porte, os dados são obtidos em quantidades elevadas, dinamicamente, na forma de fluxo de dados (ANGELOV, 2010). A análise de tais sistemas era anteriormente construída de acordo com o conhecimento do especialista (expert knowledge) (MAMDANI; ASSILIAN, 1975), mas a partir dos anos de 1990, passaram a ser desenvolvidas metodologias capazes de extrair conhecimento a partir de dados e em tempo real. Tais meto-dologias são conhecidas como online data-driven rule/knowledge systems (KASABOV, 1996), compreendendo as chamadas abordagens evolutivas ou adaptativas. Como inúmeros fenôme-nos no mundo real são caracterizados pela presença de incertezas, a modelagem nebulosa destaca-se no âmbito dos métodos adaptativos.

Os modelos nebulosos evolutivos se inserem na categoria de técnicas adaptativas, auto-desenvolvidas por meio da extração de conhecimento em fluxos de dados. De acordo com os dados que são apresentados ao modelo, caracterizando o estado atual do sistema, as técnicas nebulosas evolutivas permitem o aprendizado simultâneo de sua estrutura e funcionalidade. Esses modelos podem ser vistos, genericamente, como uma mistura de funções gaussianas, por exemplo, para aproximação da densidade da distribuição dos dados reais, em termos de lógica nebulosa (ANGELOV; ZHOU, 2008). Esse procedimento, por sua vez, pode ser

(42)

reali-zado em tempo real (online), sem a necessidade de um período considerável de treinamento (ANGELOV, 2010).

Os principais modelos nebulosos evolutivos reportados na literatura consideram mo-delos funcionais baseados em regras nebulosas do tipo Takagi-Sugeno, de forma que sua estrutura (número de regras e parâmetros) evolui continuamente por meio de algoritmos re-cursivos de agrupamento (LEMOS et al., 2011). São modelos funcionais baseados em regras nebulosas, ferramenta muito utilizada na modelagem e controle de sistemas complexos. Es-sencialmente, tal abordagem utiliza a ideia de linearização de espaço de estados em regiões nebulosas. De acordo com essas regiões, o sistema não linear associado é decomposto em uma estrutura de multi-modelos lineares. Dessa forma, essa característica permite que os modelos Takagi-Sugeno sejam capazes de aproximar sistemas não lineares com considerável precisão. O modelo Takagi-Sugeno evolutivo (eTS), proposto por Angelov e Filev (2004), con-siste em uma primeira abordagem para a identificação em tempo real de modelos de inferência nebulosa baseados em regras. A base de regras e parâmetros no modelo eTS continuamente evoluem por meio da adição de novas regras com maior poder de sumarização, e pela atua-lização de regras já existentes e parâmetros. A base de regras é construída por meio de uma versão estendida do algoritmo subtractive clustering (CHIU, 1994). A avaliação recursiva do potencial de informação, contido em cada novo dado apresentado ao sistema, permite a cria-ção de novas regras, ou ainda revisar as regras existentes. Os parâmetros do consequente são atualizados por meio do algoritmo de quadrados mínimos recursivos (Recursive Least Squares - RLS) (LJUNG, 1988).

Para reduzir a complexidade computacional no cálculo do potencial dos dados no eTS, o modelo Simpl eTS foi desenvolvido em Angelov e Filev (2005). Simpl eTS corresponde à uma versão simplificada do modelo eTS, que substitui a noção de potencial de informação pelo conceito de dispersão para gerar um algoritmo similar, porém, computacionalmente mais eficiente. Uma versão estendida do modelo eTS, xTS, foi desenvolvida por Angelov e Zhou (2008), introduzindo a ideia de adaptação do raio dos grupos (zona de influência) no modelo eTS. O parâmetro que define a dispersão dos subconjuntos é muito importante, pois é parte das funções de pertinência dos conjuntos nebulosos e, consequentemente, implica no nível de ativação das regras nebulosas. Recentemente, Angelov (2010) propôs o modelo eTS+, como uma extensão dos modelos eTS e xTS, caracterizado pela atualização da base de regras considerando critérios como idade, utilidade, densidade local e zona de influência.

Dovžan e Škrjanc (2011b) sugeriram uma versão recursiva para a identificação de modelos nebulosos do tipo Takagi-Sugeno de acordo com o algoritmo Fuzzy C-Means, rFCM, metodologia capaz de refletir adequadamente o comportamento de sistemas complexos e

(43)

2.1. Modelagem nebulosa adaptativa 13

variantes no tempo. Alternativamente, os autores incluíram no modelo recursivo o conceito de distância de Gustafson e Kessel (1979) para conjuntos nebulosos, com o objetivo de detectar diferentes formas geométricas associadas aos grupos (DOVŽAN; ŠKRJANC, 2011a).

Uma abordagem distinta, mas computacionalmente similar, para modelagem de sis-temas Takagi-Sugeno, é o modelo neuro-nebuloso dinâmico adaptativo (DENFIS - Dynamic

Evolving Neuro-Fuzzy Inference System), proposto por Kasabov e Song (2002). Utiliza-se

um método recursivo de agrupamento baseado no conceito de distância para adaptar a es-trutura da base de regras, enquanto os parâmetros dos consequentes são atualizados por meio de um algoritmo de quadrados mínimos ponderados com fator de esquecimento. Um algoritmo recursivo de agrupamento derivado de uma modificação de técnicas de quantiza-ção vetorial, conhecido como quantizaquantiza-ção vetorial evolutiva, é uma outra metodologia para construção do modelo flexível de inferência nebulosa (FLEXFIS - Flexible Fuzzy Inference

System) (LUGHOFER, 2008).

Outro modelo nebuloso evolutivo foi sugerido por Rubio (2009), em que se inseriu na classe dos modelos neuro-nebulosos de tipo-2 a modelagem nebulosa auto-organizada, com método de quadrados mínimos modificados para ajuste dos parâmetros (SOFMLS

-Self-Organizing Fuzzy Modified Least Squares). O modelo SOFMLS inclui um algoritmo de

agrupamento baseado no conceito de proximidade de vizinhança. Por outro lado, o modelo de inferência nebulosa sequencial adaptativo (SAFIS - Sequential Adaptive Fuzzy Inference

System), proposto por Rong et al. (2006), utiliza um critério de distância em conjunção com

uma medida de influência dos novos grupos criados. Além disso, a rede neural nebulosa auto-organizada (LENG et al., 2005), como um sistema evolutivo alternativo, adota um critério de erro como medida para avaliar a capacidade de generalização da rede.

A rede neural nebolosa baseada no conceito de auto-organização (SOFNN -

Self-Organizing Fuzzy Neural Network), proposta por Qiao e Wang (2008), considera a heurística

de máxima vizinhança para definir a dispersão das funções de pertinência gaussianas do modelo. Os centros dos grupos são obtidos de acordo com um algoritmo de penalização (XU

et al., 1993). A estrutura do modelo SOFNN inclui a adição, eliminação e combinação de

neurônios. Os novos neurônios são adicionados quando um determinado limiar para o critério de erro não é atingido, e a eliminação de um neurônio ocorre quando sua contribuição para a redução do erro de modelagem não é verificada. Por fim, neurônios são combinados quando suas respectivas funções de pertinências são muito similares.

Recentemente, Škrjanc et al. (2014) sugeriram um modelo nebuloso evolutivo para o tratamento de fluxo de dados em que a estrutura dos grupos é representada por protótipos de variedades lineares (i.e., funções afins), ao invés de centróides definidos por pontos no

(44)

espaço dos dados de entrada e saída. A vantagem associada consiste na maior simplicidade e transparência da estrutura. Para a obtenção dos modelos de protótipos lineares, os autores consideraram os métodos nebulosos c-regressão (fuzzy c-regression) (BEZDEK et al., 1981a; HATHAWAY; BEZDEK, 1993) e c-variedades (fuzzy c-varieties) (BEZDEK et al., 1981b), que utilizam como métricas de distância, respectivamente, o erro de estimação e a distância ortogonal.

Embora os sistemas adaptativos mencionados considerem modelos nebulosos funci-onais, a literatura também aborda modelos linguísticos no tratamento de fluxos de dados. Em Angelov e Zhou (2008), um classificador nebuloso adaptativo é construído com base no algoritmo de agrupamento utilizado pelo modelo eTS. Um modelo linguístico evolutivo para o problema de detecção de falhas também foi proposto por Filev e Angelov (2007). O método utiliza um algoritmo de agrupamento considerando conceitos da teoria de controle estatístico de processos (MONTGOMERY, 2001) para a aprendizagem dos parâmetros dos conjuntos nebulosos dos antecedentes e consequentes.

Conforme apontado por Lemos et al. (2011), uma séria limitação dos algoritmos recur-sivos de agrupamento adotados por grande parte dos modelos nebulosos evolutivos consiste na falta de robustez na presença de ruídos e/ou outliers. Nessas situações, tais algoritmos podem criar um novo grupo quando ruídos ou outliers são apresentados, ao invés de identificá-los e suavizar seus efeitos. Para melhorar a robustez da modelagem nebuidentificá-losa evolutiva, um novo método foi sugerido por Lima (2008), chamado modelagem nebulosa evolutiva com aprendizado participativo (ePL). Essa abordagem une os conceitos de aprendizagem partici-pativa (YAGER, 1990) com a ideia de sistemas nebulosos evolutivos (ANGELOV; FILEV, 2004; ANGELOV; ZHOU, 2008). Em sistemas nebulosos evolutivos, o conceito de aprendiza-gem participativa é implementado como um algoritmo não supervisionado de agrupamento (SILVA et al., 2005), e apresenta-se como um candidato natural para identificar estruturas em bases de regras para sistemas dinâmicos.

Posteriormente, com base no modelo ePL, Lemos et al. (2011) desenvolveram o modelo nebuloso evolutivo gaussiano multivariado (eMG). O eMG utiliza um algoritmo de agrupa-mento gaussiano baseado também no conceito de aprendizagem participativa, em que cada grupo é representado por uma função de pertinência gaussiana multivariada. A estrutura des-ses grupos (centro e dispersão) e seu número são recursivamente atualizados a cada iteração do algoritmo, enquanto os limiares dos parâmetros são determinados automaticamente. Como no modelo eTS, em suas variações e no modelo ePL, o consequente no eMG é identificado de acordo com o algoritmo de quadrados mínimos recursivos (RLS).

Referências

Documentos relacionados

O extrato aquoso de folhas de capim citronela apresentam potencial alelopático sobre o desenvolvimento de alface, com o aparecimento de plântulas anormais, redução da

2002 Liberalização Mercado Clientes MT/AT/MAT Rollout telecontagem MT/AT/MAT (~23.000 Clientes) 1992-1993 Inicio Telecontagem Central Pego + Autoeuropa Liberalização Mercado

Vicente Paulo Campos Universidade Federal de Lavras, Lavras Biological control

Apesar do alto valor diagnóstico atribuído à toracoscopia para DPM, torna-se menos efectiva no diagnóstico específico de doença pleural não maligna, sendo positiva em apenas

Para a concretização da resposta ao problema de pesquisa e para um melhor detalhamento do objetivo geral, delineou-se como objetivos específicos: a Conhecer e caracterizar a

The major goal of this research work was to use the dry extract of the fruits of Jussara palm tree (Euterpe edulis Martius) in the development of a tinting shampoo (0.3%

Esta categoria contempla o reporte das emissões relacionadas aos escopos 1 e 2 dos setores de energia estacionária e transportes e aos escopo 1 e 3 do setor de resíduos (designados na

A seção de trabalho está normalmente acima túnel tipo soprador, ou seja, com o propulsor no início do túnel ou abaixo da pressão atmosférica túnel tipo succionador, ou seja,