• Nenhum resultado encontrado

Combinação de projeções de volatilidade baseadas em medidas de risco para dados em...

N/A
N/A
Protected

Academic year: 2017

Share "Combinação de projeções de volatilidade baseadas em medidas de risco para dados em..."

Copied!
287
0
0

Texto

(1)

DEPARTAMENTO DE ADMINISTRA ¸C ˜AO

PROGRAMA DE P ´OS-GRADUA ¸C ˜AO EM ADMINISTRA ¸C ˜AO

COMBINA ¸C ˜AO DE PROJE ¸C ˜OES DE VOLATILIDADE BASEADAS EM

MEDIDAS DE RISCO PARA DADOS EM ALTA FREQUˆENCIA

Alcides Carlos de Ara´ujo

Orientadora: Profa. Dra. Alessandra de ´Avila Montini

(2)

Reitor da Universidade de S˜ao Paulo

Prof. Dr. Adalberto Am´erico Fischmann

Diretor da Faculdade de Economia, Administra¸c˜ao e Contabilidade

Prof. Dr. Roberto Sbragia

Chefe do Departamento de Administra¸c˜ao

Prof. Dr. Moacir de Miranda Oliveira J´unior

(3)

COMBINA ¸C ˜AO DE PROJE ¸C ˜OES DE VOLATILIDADE BASEADAS EM

MEDIDAS DE RISCO PARA DADOS EM ALTA FREQUˆENCIA

Tese apresentada ao Programa de P´os-gradua¸c˜ao em Administra¸c˜ao do Departamento de Adminis-tra¸c˜ao da Faculdade de Economia, AdminisAdminis-tra¸c˜ao e Contabilidade da Universidade de S˜ao Paulo, como requisito parcial para a obten¸c˜ao do t´ıtulo de Doutor em Ciˆencias.

Orientadora: Profa. Dra. Alessandra de ´Avila Montini

Vers˜ao Corrigida

(vers˜ao original dispon´ıvel na Faculdade de Economia, Administra¸c˜ao e Contabilidade)

(4)

Faculdade de Economia, Administra¸c˜ao e Contabilidade da Univer-sidade de S˜ao Paulo – Programa de P´os-gradua¸c˜ao em Administra-¸c˜ao, pela seguinte comiss˜ao examinadora:

Profa. Dra. Alessandra de ´Avila Montini (Presidente)

Prof. Dr. Adolpho Walter Pimazoni Canton – FEA/USP

Prof. Dr. Jos´e Roberto Ferreira Savoia – FEA/USP

Prof. Dr. Andr´e Luiz Oda – FIA

Prof. Dr. Junio Fuentes – FIA

FICHA CATALOGR ´AFICA

Elaborada pela Se¸c˜ao de Processamento T´ecnico do SBD/FEA/USP

Ara´ujo, Alcides Carlos de

Combina¸c˜ao de proje¸c˜oes de volatilidade baseadas em medidas de risco para dados em alta frequˆencia / Alcides Carlos de Ara´ujo – S˜ao Paulo, 2016.

287p.

Tese (Doutorado) – Universidade de S˜ao Paulo, 2016. Orientador: Alessandra de ´Avila Montini.

1. Finan¸cas 2. A¸c˜oes 3. Investimentos 4. Risco I. Universidade de S˜ao Paulo. Faculdade de Economia, Administra¸c˜ao e Contabilidade. II. T´ıtulo.

(5)
(6)
(7)

Agradecimentos

- `A Deus, por iluminar o meu caminho e pela for¸ca no desempenho de todas as minhas atividades;

- Ao meu pai, Jos´e Carlos e minha m˜ae, Sueli, pela for¸ca di´aria e apoio constante durante toda a minha vida;

- Aos meus familiares tia Maria C´ıcera (tia Liu), tia Nena e fam´ılia, tia Socorro (tia Cˆorre) e fam´ılia, Henrique, Fernando, Viviane, Fernanda, Fred, Fabiana, Louren¸co (Tio Nen) e fam´ılia pelo apoio constante durante o curso de doutorado;

- A Profa. Dra. Alessandra Montini que se dedicou muito no seu papel de orientadora, e a quem sou muito grato por todo o aprendizado obtido no curso de Doutorado;

- `A banca examinadora da Tese, ao Professor titular Adolpho Walter Pimazoni Canton, Prof. Dr. Andr´e Oda e Prof. Dr. Junio Fuentes, por todas as contribui¸c˜oes dadas e por todo o apoio durante a execu¸c˜ao do trabalho;

- Ao corpo docente da FEA/USP, em especial aos Profs. Drs. Daniel Cordeiro, Abraham Yu, Ronaldo Zwicker, C´esar Alexandre, Jos´e Roberto Securato, F´abio Lotti, Rosana Ta-vares, Eduardo Kayo, Jos´e Roberto Savoia e Bernadete Marinho, com quem tive oportu-nidade de fazer mat´erias e engrandecer meus conhecimentos nas diversas ´areas lecionadas; - `A Coordena¸c˜ao de Aperfei¸coamento de Pessoal de N´ıvel Superior - CAPES - pelo apoio financeiro que possibilitou a realiza¸c˜ao do curso;

- Aos meus amigos (Prof. Dr. A.C.S. Costa, Prof. Ms. Eduardo, Prof. Dra. Neila Cu-nha, J´ulio Barbosa, Raony Justo, Thales Nilton, Allana, Luiz B.O., Maxsuel (Macasuel), Henrique “Nˆego”, Madal, Allan, Igor, Erich e Calebe Feitosa, Bruno “Cachorr˜ao”, Nayron Almeida, S´avio Henrique, Bruna Silva, Luzi, Haila Chagas e Halex, Nayara Abreu, Kaio Sosa, Gabriel Verlangieri, Mabel, Jose, Jaqueline, Hugo, Luciano, Vera e Anna Chaves, Jacira e Igor Milhoran¸ca) que tiveram participa¸c˜ao importante em diversas fases da minha vida;

(8)
(9)
(10)
(11)

Combina¸c˜ao de proje¸c˜oes de volatilidade baseadas em medidas de risco para dados em alta frequˆencia

RESUMO

Opera¸c˜oes em alta frequˆencia demonstraram crescimento nos ´ultimos anos; em decorrˆen-cia disso, surgiu a necessidade de estudar o mercado de a¸c˜oes brasileiro no contexto dos dados em alta frequˆencia. Os estimadores da volatilidade dos pre¸cos de a¸c˜oes utilizando dados de negocia¸c˜oes em alta frequˆencia s˜ao os principais objetos de estudo. Conforme Aldridge (2010) e Vuorenmaa (2013), o HFT foi definido como a r´apida realoca¸c˜ao de capital feita de modo que as transa¸c˜oes possam ocorrer em mil´esimos de segundos por uso de algoritmos complexos que gerenciam envio de ordens, analisam dados e tomam as me-lhores decis˜oes. A principal fonte de informa¸c˜oes para an´alise do HFT s˜ao os dadostick by tick, conhecidos como dados em alta frequˆencia. Uma m´etrica oriunda da an´alise de dados em alta frequˆencia e utilizada para gest˜ao de riscos ´e a Volatilidade Percebida. Conforme Andersen et al. (2003), Pong et al. (2004), Koopman et al. (2005) e Corsi (2009) h´a um consenso na ´area de finan¸cas de que as proje¸c˜oes da volatilidade utilizando essa m´etrica de risco s˜ao mais eficientes de que a estimativa da volatilidade por meio de modelos GARCH. Na gest˜ao financeira, a proje¸c˜ao da volatilidade ´e uma ferramenta fundamental para pro-visionar reservas para poss´ıveis perdas; devido `a existˆencia de v´arios m´etodos de proje¸c˜ao da volatilidade e em decorrˆencia disto torna-se necess´ario selecionar um modelo ou combi-nar diversas proje¸c˜oes. O principal desafio para combicombi-nar proje¸c˜oes ´e a escolha dos pesos: as diversas pesquisas da ´area tˆem foco no desenvolvimento de m´etodos para escolhˆe-los visando minimizar os erros de previs˜ao. A literatura existente carece, no entanto, de uma proposi¸c˜ao de m´etodo que considere o problema de eventual proje¸c˜ao de volatilidade abaixo do esperado. Buscando preencher essa lacuna, o objetivo principal desta tese ´e propor uma combina¸c˜ao dos estimadores da volatilidade dos pre¸cos de a¸c˜oes utilizando dados de negocia¸c˜oes em alta frequˆencia para o mercado brasileiro. Como principal ponto de inova¸c˜ao, prop˜oe-se de forma in´edita a utiliza¸c˜ao da fun¸c˜ao baseada noLower Partial Moment (LPM) para estimativa dos pesos para combina¸c˜ao das proje¸c˜oes. Ainda que a m´etrica LPM seja bastante conhecida na literatura, sua utiliza¸c˜ao para combina¸c˜ao de proje¸c˜oes ainda n˜ao foi analisada. Este trabalho apresenta contribui¸c˜oes ao estudo de combina¸c˜oes de proje¸c˜oes realizadas pelos modelos HAR, MIDAS, ARFIMA, Nearest Neighbor, al´em de propor dois novos m´etodos de combina¸c˜ao – denominados por LPMFE (Lower Partial Moment Forecast Error) e DLPMFE (Discounted LPMFE). Os m´etodos demonstraram resultados promissores pretendem casos cuja pretens˜ao seja evitar perdas acima do esperado e evitar provisionamento excessivo do ponto de vista or¸cament´ario.

(12)
(13)

Volatility forecast combination using risk measures based on high frequency data

ABSTRACT

The High Frequency Trading (HFT) has grown significantly in the last years, in this way, this raises the need for research of the high frequency data on the Brazilian stock market. The volatility estimators of the asset prices using high frequency data are the main objects of study. According to Aldridge (2010) and Vuorenmaa (2013), the HFT was defined as the fast reallocation of trading capital that the negotiations may occur on milliseconds by complex algorithms scheduled for optimize the process of sending orders, data analysis and to make the best decisions of buy or sell. The principal information source for HFT analysis is the tick by tick data, called as high frequency data. The Realized Volati-lity is a risk measure from the high frequency data analysis, this metric is used for risk management. According to Andersen et al. (2003), Pong et al. (2004), Koopman et al.

(2005) and Corsi (2009) there is a consensus in the finance field that the volatility forecast using this risk measure produce better results than estimating the volatility by GARCH models. The volatility forecasting is a key issue in the financial management to provision capital resources to possible losses. However, because there are several volatility forecast methods, this raises the need to choice a specific model or combine the projections. The main challenge to combine forecasts is the choice of the weight, with the aim of minimi-zing the forecast errors, several research in the field have been focusing on development of methods to choice the weight. However, it is missing in the literature the proposition of a method which consider the minimization of the risk of an inefficient forecast for the losses protection. Aiming to fill the gap, the main goal of the thesis is to propose a combination of the asset prices volatility forecasts using high frequency data for Brazilian stock mar-ket. As the main focus of innovation, the thesis proposes, in an unprecedented way, the use of the function based on the Lower Partial Moment (LPM) to estimate the weights for the combination of volatility forecasts. Although the LPM measure is well known in the literature, the use of this metric for forecast combination has not been yet studied. The thesis contributes to the literature when studying the forecasts combination made by the models HAR, MIDAS, ARFIMA and Nearest Neighbor. The thesis also contributes when proposing two new methods of combinations, these methodologies are referred to as LPMFE (Lower Partial Moment Forecast Error) and DLPMFE (Discounted LPMFE). The methods have shown promising results when it is intended to avoid losses above the expected it is not intended to cause provisioning excess in the budget.

(14)
(15)

1 Introdu¸c˜ao 9

1.1 Problemas de pesquisa . . . 12

1.1.1 Problemas espec´ıficos . . . 16

1.2 Objetivos . . . 17

1.3 Justificativas da tese . . . 18

1.4 Contribui¸c˜oes . . . 22

2 Referencial Te´orico 24 2.1 Defini¸c˜oes sobre o Livro de Ofertas (LOB) . . . 24

2.1.1 Defini¸c˜ao do espa¸co probabil´ıstico . . . 27

2.1.2 Funcionamento do Livro de Ofertas . . . 29

2.2 Algoritmos para trades de alta frequˆencia . . . 32

2.2.1 Escolha do tempo e rotinas de entradas e sa´ıdas de negocia¸c˜ao . . . 34

2.2.2 Estrat´egias de negocia¸c˜ao . . . 37

2.2.3 Gerenciamento dos riscos e avalia¸c˜ao das rotinas . . . 39

2.3 Medidas de volatilidade para dados em alta frequˆencia . . . 40

2.3.1 Processo de difus˜ao dos pre¸cos negociados em alta frequˆencia . . . . 42

2.3.2 Saltos . . . 43

2.3.3 Ru´ıdos de microestrutura . . . 44

2.3.4 Evolu¸c˜ao dos estimadores da volatilidade para dados de HFT . . . . 45

2.4 Proje¸c˜ao da volatilidade . . . 53

2.4.1 Modelos GARCH e Volatilidade Condicional . . . 54

2.5 Proje¸c˜ao da volatilidade com dados em alta frequˆencia . . . 56

2.5.1 Modelo HAR-RV . . . 56

2.5.2 Modelo MIDAS-RV . . . 59

2.5.3 Modelo ARFIMA . . . 61

2.5.4 M´etodo Nearest Neighbor (NN) . . . 62

2.6 Combina¸c˜ao de proje¸c˜oes . . . 67

2.6.1 Combina¸c˜ao com Momento Parcial Inferior . . . 74

3 Metodologia 81 3.1 Obten¸c˜ao das s´eries de Volatilidade Percebida . . . 82

3.2 Estima¸c˜ao dos modelos . . . 88

3.3 Combina¸c˜ao das proje¸c˜oes . . . 92

3.4 Avalia¸c˜ao de Performance . . . 94

(16)

4.2 Estima¸c˜ao das s´eries de Volatilidade Percebida (RV) . . . 100

4.3 An´alise dos m´etodos de proje¸c˜ao . . . 106

4.3.1 An´alises modelo HAR . . . 106

4.3.2 An´alises modelo MIDAS . . . 108

4.3.3 An´alises modelo ARFIMA . . . 110

4.3.4 An´alises m´etodo Nearest Neighbor . . . 111

4.4 Combina¸c˜ao das proje¸c˜oes . . . 112

4.4.1 Pesos das combina¸c˜oes . . . 114

4.5 Avalia¸c˜ao de desempenho das proje¸c˜oes . . . 119

4.5.1 Desempenho para a medida rCov . . . 119

4.5.2 Desempenho para a medida rOWCov . . . 136

4.5.3 Desempenho para a medida medRV . . . 152

4.5.4 Desempenho para a medida minRV . . . 168

4.5.5 Desempenho para a medida rRTSCov . . . 184

4.6 S´ıntese dos principais resultados da tese . . . 200

5 Considera¸c˜oes Finais 205 5.1 Resultados finais . . . 208

5.2 Perspectivas para trabalhos futuros . . . 210

6 Referˆencias 215 Apˆendice A 227 Prova vi´es ru´ıdo de microestrutura . . . 227

Apˆendice B 228 Gr´aficos dos comportamentos dos pre¸cos . . . 228

(17)

Lista de Quadros

1 Exemplo de envio de ordem limitada . . . 30

2 Exemplo de envio de ordem limitada com altera¸c˜ao em b(i) . . . 30

3 Exemplo execu¸c˜ao de ordem a mercado em b(i) . . . 31

4 Exemplo execu¸c˜ao de ordem a mercado em a(i) . . . 31

5 Exemplo de algoritmos de negocia¸c˜ao . . . 36

6 Resumo dos estimadores . . . 52

7 Resumo dos modelos . . . 66

8 Estudos combina¸c˜ao de proje¸c˜oes . . . 73

9 Modelos e combina¸c˜oes . . . 93

(18)

Lista de Tabelas

1 Exemplo de s´erie de negocia¸c˜ao . . . 87

2 An´alises Descritivas . . . 102

3 Estima¸c˜oes modelo HAR . . . 107

4 Estima¸c˜oes modelo MIDAS . . . 109

5 Estima¸c˜oes modelo ARFIMA . . . 110

6 An´alises modelo Nearest Neighbor . . . 113

7 An´alise proje¸c˜oes m´etodos NN . . . 113

8 Pesos das combina¸c˜oes 2 a 2 - PETR4 . . . 116

9 Pesos das combina¸c˜oes 3 a 3 - PETR4 . . . 117

10 Pesos das combina¸c˜oes 4 a 4 - PETR4 . . . 118

11 RMSE rCov combina¸c˜oes 2 a 2 - PETR4 . . . 122

12 RMSE rCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 123

13 RMSE rCov combina¸c˜oes 2 a 2 - VALE5 . . . 124

14 RMSE rCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 125

15 RMSE rCov combina¸c˜oes 2 a 2 - ITUB4 . . . 126

16 RMSE rCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 127

17 LP M1 rCov combina¸c˜oes 2 a 2 - PETR4 . . . 130

18 LP M1 rCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 131

19 LP M1 rCov combina¸c˜oes 2 a 2 - VALE5 . . . 132

20 LP M1 rCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 133

21 LP M1 rCov combina¸c˜oes 2 a 2 - ITUB4 . . . 134

22 LP M1 rCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 135

23 RMSE rOWCov combina¸c˜oes 2 a 2 - PETR4 . . . 138

24 RMSE rOWCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 139

25 RMSE rOWCov combina¸c˜oes 2 a 2 - VALE5 . . . 140

26 RMSE rOWCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 141

27 RMSE rOWCov combina¸c˜oes 2 a 2 - ITUB4 . . . 142

28 RMSE rOWCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 143

29 LP M1 rOWCov combina¸c˜oes 2 a 2 - PETR4 . . . 146

30 LP M1 rOWCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 147

31 LP M1 rOWCov combina¸c˜oes 2 a 2 - VALE5 . . . 148

32 LP M1 rOWCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 149

33 LP M1 rOWCov combina¸c˜oes 2 a 2 - ITUB4 . . . 150

34 LP M1 rOWCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 151

35 RMSE medRV combina¸c˜oes 2 a 2 - PETR4 . . . 154

36 RMSE medRV combina¸c˜oes 3 a 3 e todas - PETR4 . . . 155

(19)

38 RMSE medRV combina¸c˜oes 3 a 3 e todas - VALE5 . . . 157

39 RMSE medRV combina¸c˜oes 2 a 2 - ITUB4 . . . 158

40 RMSE medRV combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 159

41 LP M1 medRV combina¸c˜oes 2 a 2 - PETR4 . . . 162

42 LP M1 medRV combina¸c˜oes 3 a 3 e todas - PETR4 . . . 163

43 LP M1 medRV combina¸c˜oes 2 a 2 - VALE5 . . . 164

44 LP M1 medRV combina¸c˜oes 3 a 3 e todas - VALE5 . . . 165

45 LP M1 medRV combina¸c˜oes 2 a 2 - ITUB4 . . . 166

46 LP M1 medRV combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 167

47 RMSE minRV combina¸c˜oes 2 a 2 - PETR4 . . . 170

48 RMSE minRV combina¸c˜oes 3 a 3 e todas - PETR4 . . . 171

49 RMSE minRV combina¸c˜oes 2 a 2 - VALE5 . . . 172

50 RMSE minRV combina¸c˜oes 3 a 3 e todas - VALE5 . . . 173

51 RMSE minRV combina¸c˜oes 2 a 2 - ITUB4 . . . 174

52 RMSE minRV combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 175

53 LP M1 minRV combina¸c˜oes 2 a 2 - PETR4 . . . 178

54 LP M1 minRV combina¸c˜oes 3 a 3 e todas - PETR4 . . . 179

55 LP M1 minRV combina¸c˜oes 2 a 2 - VALE5 . . . 180

56 LP M1 minRV combina¸c˜oes 3 a 3 e todas - VALE5 . . . 181

57 LP M1 minRV combina¸c˜oes 2 a 2 - ITUB4 . . . 182

58 LP M1 minRV combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 183

59 RMSE rRTSCov combina¸c˜oes 2 a 2 - PETR4 . . . 186

60 RMSE rRTSCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 187

61 RMSE rRTSCov combina¸c˜oes 2 a 2 - VALE5 . . . 188

62 RMSE rRTSCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 189

63 RMSE rRTSCov combina¸c˜oes 2 a 2 - ITUB4 . . . 190

64 RMSE rRTSCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 191

65 LP M1 rRTSCov combina¸c˜oes 2 a 2 - PETR4 . . . 194

66 LP M1 rRTSCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 195

67 LP M1 rRTSCov combina¸c˜oes 2 a 2 - VALE5 . . . 196

68 LP M1 rRTSCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 197

69 LP M1 rRTSCov combina¸c˜oes 2 a 2 - ITUB4 . . . 198

70 LP M1 rRTSCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 199

71 Pesos das combina¸c˜oes 2 a 2 medida rCov - PETR4 . . . 232

72 Pesos das combina¸c˜oes 2 a 2 medida rOWCov - PETR4 . . . 233

73 Pesos das combina¸c˜oes 2 a 2 medida medRV - PETR4 . . . 234

74 Pesos das combina¸c˜oes 2 a 2 medida minRV - PETR4 . . . 235

75 Pesos das combina¸c˜oes 3 a 3 medida rCov - PETR4 . . . 236

(20)

77 Pesos das combina¸c˜oes 3 a 3 medida medRV - PETR4 . . . 238

78 Pesos das combina¸c˜oes 3 a 3 medida minRV - PETR4 . . . 239

79 Pesos das combina¸c˜oes 4 a 4 medida rCov - PETR4 . . . 240

80 Pesos das combina¸c˜oes 4 a 4 medida rOWCov - PETR4 . . . 241

81 Pesos das combina¸c˜oes 4 a 4 medida medRV - PETR4 . . . 242

82 Pesos das combina¸c˜oes 4 a 4 medida minRV - PETR4 . . . 243

83 Pesos das combina¸c˜oes 2 a 2 medida rCov - VALE5 . . . 244

84 Pesos das combina¸c˜oes 2 a 2 medida rOWCov - VALE5 . . . 245

85 Pesos das combina¸c˜oes 2 a 2 medida medRV - VALE5 . . . 246

86 Pesos das combina¸c˜oes 2 a 2 medida minRV - VALE5 . . . 247

87 Pesos das combina¸c˜oes 2 a 2 medida rRTSCov - VALE5 . . . 248

88 Pesos das combina¸c˜oes 3 a 3 medida rCov - VALE5 . . . 249

89 Pesos das combina¸c˜oes 3 a 3 medida rOWCov - VALE5 . . . 250

90 Pesos das combina¸c˜oes 3 a 3 medida medRV - VALE5 . . . 251

91 Pesos das combina¸c˜oes 3 a 3 medida minRV - VALE5 . . . 252

92 Pesos das combina¸c˜oes 3 a 3 medida rRTSCov - VALE5 . . . 253

93 Pesos das combina¸c˜oes 4 a 4 medida rCov - VALE5 . . . 254

94 Pesos das combina¸c˜oes 4 a 4 medida rOWCov - VALE5 . . . 255

95 Pesos das combina¸c˜oes 4 a 4 medida medRV - VALE5 . . . 256

96 Pesos das combina¸c˜oes 4 a 4 medida minRV - VALE5 . . . 257

97 Pesos das combina¸c˜oes 4 a 4 medida rRTSCov - VALE5 . . . 258

98 Pesos das combina¸c˜oes 2 a 2 medida rCov - ITUB4 . . . 259

99 Pesos das combina¸c˜oes 2 a 2 medida rOWCov - ITUB4 . . . 260

100 Pesos das combina¸c˜oes 2 a 2 medida medRV - ITUB4 . . . 261

101 Pesos das combina¸c˜oes 2 a 2 medida minRV - ITUB4 . . . 262

102 Pesos das combina¸c˜oes 2 a 2 medida rRTSCov - ITUB4 . . . 263

103 Pesos das combina¸c˜oes 3 a 3 medida rCov - ITUB4 . . . 264

104 Pesos das combina¸c˜oes 3 a 3 medida rOWCov - ITUB4 . . . 265

105 Pesos das combina¸c˜oes 3 a 3 medida medRV - ITUB4 . . . 266

106 Pesos das combina¸c˜oes 3 a 3 medida minRV - ITUB4 . . . 267

107 Pesos das combina¸c˜oes 3 a 3 medida rRTSCov - ITUB4 . . . 268

108 Pesos das combina¸c˜oes 4 a 4 medida rCov - ITUB4 . . . 269

109 Pesos das combina¸c˜oes 4 a 4 medida rOWCov - ITUB4 . . . 270

110 Pesos das combina¸c˜oes 4 a 4 medida medRV - ITUB4 . . . 271

111 Pesos das combina¸c˜oes 4 a 4 medida minrv - ITUB4 . . . 272

(21)

Lista de Figuras

1 Exemplo Livro de Ofertas . . . 26

2 Gr´afico de profundidade do L(i) . . . 27

3 Estrutura de um sistema de negocia¸c˜ao . . . 33

4 Desenho da pesquisa . . . 82

5 Metodologia Hold-Out . . . 88

6 Metodologia kNN . . . 90

7 Combina¸c˜ao e avalia¸c˜ao das proje¸c˜oes . . . 92

8 Exemplo Diferen¸ca RMSE e LP M1. . . 95

9 Comportamento pre¸cos e quantidades: caso alta PETR4 . . . 98

10 Comportamento pre¸cos e quantidades: caso baixa PETR4 . . . 99

11 S´eries Volatilidade Percebida PETR4 . . . 103

12 S´eries Volatilidade Percebida VALE5 . . . 104

13 S´eries Volatilidade Percebida ITUB4 . . . 105

14 Proje¸c˜oes por meio das combina¸c˜oes para PETR4, VALE5 e ITUB4. . . 204

15 Comportamento pre¸cos e quantidades: caso alta VALE5 . . . 228

16 Comportamento pre¸cos e quantidades: caso baixa VALE5 . . . 229

17 Comportamento pre¸cos e quantidades: caso alta ITUB4 . . . 230

(22)
(23)

1

Introdu¸c˜

ao

Conforme Portnoy (2011), estrat´egias de High Frequency Trading (HFT) utilizam com-putadores para a aplica¸c˜ao de algoritmos complexos criados visando detectar diferentes oportunidades nas diversas bolsas de valores. Estes buscam antecipar a dire¸c˜ao seguinte na qual determinado ativo financeiro seguir´a em uma dada fra¸c˜ao de segundo em meio `as condi¸c˜oes de mercado e an´alises estat´ısticas do desempenho passado do ativo da empresa.

As opera¸c˜oes em alta frequˆencia cresceram significativamente nos E.U.A. Conforme Al-dridge (2013), estudos indicam que j´a representam em m´edia 25% de toda atividade de negocia¸c˜oes no mercado americanoe s˜ao transacionados, em sua maioria, por contratos derivativos de mini-futuros. Em exemplo apresentado por Aldridge (2013), em uma an´a-lise das negocia¸c˜oes de um ativo de alta liquidez da NYSE (New York Stock Exchange) os

high-frequency traderstiveram parcela de 20% em todas as negocia¸c˜oes di´arias deste ativo.

Quanto aos retornos, alguns fundos HFT como o Medallion Fund e o Renaissance apre-sentaram, por exemplo, rendimentos anuais m´edios de 35% (entre 2000 e 2010) para o primeiro e supera¸c˜ao do S&P500 em meio `a crise de 2008 com rendimentos em torno de 4% a 6% para o segundo.

Conforme apresenta Aldridge (2013), o HFT ´e uma das atividades de maior sucesso na ´area financeira, apresentando alta rentabilidade e alto grau de expans˜ao na ind´ustria. De acordo com Pereira (2014), as maiores empresas de HFT s˜ao Millennium, DE Shaw, Worldquant e Renaissance Technologies.

Quanto aos fundos, os principais s˜ao de investimentos propriet´arios como ATD, CISCO, Citadel, Getco, Madison Tyler, Tradebot, All Options, Flow Traders, IMC e Optiver. As mesas de negocia¸c˜oes dos principais bancos tamb´em utilizam HFT, como ´e o caso de JP Morgan, Goldman Sachs, Morgan Stanley, BNP Paribas e Soci´et´e Generale.

Aldridge (2010) ainda comenta que 50% das posi¸c˜oes abertas para emprego na ´area de finan¸cas envolviam conhecimento em HFT, com seu auge durante a crise de 2008. Com dados atualizados, Aldridge (2010) apresenta o exemplo do dia 27 de Novembro de 2012, em que a p´agina de classificados de emprego doWall Street Journal mostrava, em todos os an´uncios, vagas de emprego que pediam conhecimentos em HFT.

(24)

para realizar negocia¸c˜oes completamente automatizadas no mercado de a¸c˜oes americano.

Quanto ao Brasil, as opera¸c˜oes tornaram-se completamente automatizadas somente em 2005, quando o preg˜ao viva-voz foi encerrado; dessa forma, o volume de opera¸c˜oes em alta frequˆencia ainda ´e modesto. Segundo relat´orio da gestora Trapezus (2011), estima-se que as primeiras estrat´egias quantitativas no Brasil iniciaram entre 2005 e 2006; em 2011 o volume gerido representava somente 1% da ind´ustria de fundos brasileira.

Na busca pelo desenvolvimento mais ´agil desse mercado,a CVM (Comiss˜ao de Valores Mobili´arios) aprovou diversas medidas, conforme apresenta Portugal (2010). Como exem-plo, pode ser citada a aprova¸c˜ao do uso de quatro modalidades de acesso direto ao mercado no segmento Bovespa.

No caso acima, os investidores podem acessar o mercado da forma tradicional (rotea-mento de ofertas por meio da infraestrutura tecnol´ogica da corretora), via provedor (o cliente conecta-se diretamente `a empresa provedora de DMA), via conex˜ao direta (as ofertas s˜ao enviadas via interliga¸c˜ao direta do cliente com a Bolsa) e via co-location (as ordens s˜ao geradas por softwares Automated Trading System - ATS instalados em servi-dores hospedados no centro de processamento de dados da Bovespa).

Apesar do esfor¸co da regula¸c˜ao brasileira no incentivo `as opera¸c˜oes HFT , o ritmo ainda ´e lento em compara¸c˜ao ao dos E.U.A.. Kupfer (2011) observa que as opera¸c˜oes tˆem ganhado ritmo, sendo que no final de 2011 estimava-se um giro financeiro de cerca de 20%. Setti (2012) cita que naquele ano as opera¸c˜oes representavam 10% das movimenta¸c˜oes.

Yazbek (2012) tamb´em cita que as opera¸c˜oes de HFT no Brasil representavam 10%. Pereira (2014) discorre acerca de um crescimento alcan¸cando aproximadamente 13% no segmento de a¸c˜oes e 9% em derivativos. Em Yokoi (2014) demonstra-se que as opera¸c˜oes em alta frequˆencia correspondem a cerca de 15% do volume da BM&F.

Conforme Yazbek (2012), em outros pa´ıses como E.U.A. e Jap˜ao as opera¸c˜oes consis-tiam de uma fatia do mercado de 70% e 40%, respectivamente. Aldridge (2013) apresenta mais detalhes, demonstrando que as movimenta¸c˜oes por meio de HFT representavam em torno de 25%, com picos de entre 60% e 70% de negocia¸c˜oes no mercado americano. Os principais ativos negociados foram os mini-contratos de S&P 500.

(25)

maiores investimentos em infraestrutura tecnol´ogica e m˜ao de obra mais qualificada.

Segundo Mazzoni (2012) o momento ´e realmente prop´ıcio para o crescimento das opera-¸c˜oes de alta frequˆencia. Ao entrevistar um executivo da ´area, recebeu respostas altamente otimistas: “The Brazilian market is in excellent position for growth and our goal is to fo-cus on Brazil”. Os empreendedores percebem o Brasil em um est´agio semelhante ao dos E.U.A. antes do r´apido crescimento das opera¸c˜oes HFT.

S˜ao muitas as perguntas a responder acerca do HFT. O ´org˜ao regulador do mercado de capitais americano, a SEC (Securities and Exchange Commission), apresentou um do-cumento que levantou em torno de 215 quest˜oes a respeito do funcionamento e regula¸c˜ao da estrutura do mercado financeiro norte-americano na presen¸ca de opera¸c˜oes de alta frequˆencia (SEC, 2010). Algumas delas s˜ao apresentadas a seguir:

• Has the current market structure become so dispersed and complex that only the largest institutions can afford to deploy their own highly sophisticated trading tools?

• What are useful metrics for assessing the performance of the current market struc-ture?

• What are the most frequently used strategies?

• What are the key features of each strategy?

Mediante a importˆancia e o crescente avan¸co do tema, diversas quest˜oes s˜ao levantadas por operadores, analistas e gestores. Deste modo, Kupfer (2011) fomentou uma pergunta pertinente em rela¸c˜ao ao trabalho dos operadores de alta frequˆencia. Dado que muitos possuem opini˜oes sobre a fun¸c˜ao destes agentes, “quantos realmente entendem como eles trabalham?”.

Aldridge (2010) apresenta o processo de desenvolvimento de modelos para negocia¸c˜ao em alta frequˆencia, a principal fonte de informa¸c˜oes s˜ao dados hist´oricos (tick by tick, profundidade do mercado - (market depth) e dados em tempo real). Estes dados s˜ao vi-sualizados em ferramentas como times and trades e o livro de ofertas (Limit Order Book - LOB).

A ferramenta times and trades possibilita a observa¸c˜ao dos dados tick by tick, autores como Biaiset al. (1995) denominam essas informa¸c˜oes como order flow. O LOB possibi-lita que se observe a profundidade do mercado.

(26)

econom´etrica. Conforme apresentam Gould et al. (2013), n˜ao existe um consenso sobre a melhor maneira de fazˆe-lo; no caso da literatura econˆomica os modelos s˜ao focados na descri¸c˜ao do comportamento individual dos traders.

No caso da literatura da f´ısica, o fluxo de ordens s˜ao tratados como aleat´orios e os modelos descritos exclusivamente por estat´ıstica mecˆanica. O principal empecilho na cria¸c˜ao de um consenso torna-se portanto a necessidade de impor suposi¸c˜oes nos modelos propostos em ambas literaturas, sendo que nos estudos emp´ıricos as suposi¸c˜oes utilizadas foram tes-tadas, por´em n˜ao corroboradas.

Gould et al. (2013) tamb´em apresentam diversos problemas de pesquisa na ´area que ainda precisam de explora¸c˜ao. O primeiro deles ´e a compreens˜ao de poss´ıveis padr˜oes es-tat´ısticos a partir das observa¸c˜oes do LOB etimes and trades; conforme os autores, ainda n˜ao ´e claro o entendimento destes padr˜oes em diferentes mercados e como podem surgir levando em considera¸c˜ao as diversas a¸c˜oes e estrat´egias dos v´arios agentes heterogˆeneos.

Os problemas de pesquisa relacionados aos estudos a respeito da volatilidade passam pela compreens˜ao de como tais estimativas podem ser modeladas de forma a incorporar informa¸c˜oes de todo o estado do LOB. Compreender por que per´ıodos de alta atividade deveriam ser agrupados, analisar a influˆencia do tamanho das ordens na volatilidade, levando sempre em considera¸c˜ao que n˜ao h´a uma ´unica estimativa de volatilidade que considere todos os estados.

Outros problemas a serem explorados tratam de amostragem, dado que o comportamento da s´erie temporal (ticks) depende significativamente da forma como tal amostragem ´e realizada e como a s´erie ´e organizada. Aldridge (2010) e Gould et al. (2013) afirmam que as estimativas podem variar significativamente a partir de como a escala de tempo ´e organizada.

A ordena¸c˜ao pode ser por espa¸cos regulares (5 minutos ou 5 segundos, por exemplo) ou espa¸cos irregulares, como evento por evento (de acordo com as chegadas das ordens) ou trade by trade (cada negocia¸c˜ao realizada ´e observada e utilizada nas estimativas). Diante disso, tamb´em ´e necess´ario entender o comportamento de estimadores em rela¸c˜ao `a organiza¸c˜ao dosticks.

1.1

Problemas de pesquisa

(27)

decis˜oes. Estes conceitos s˜ao utilizados em an´alises de Big Data, nas quais a decis˜ao pre-cisa ser feita praticamente em tempo real ap´os a realiza¸c˜ao de milh˜oes de c´alculos para a obten¸c˜ao das estat´ısticas de an´alise.

Por meio da an´alise de Big Data, a ´area financeira pode utilizar ferramentas eficientes para planejamento, controle e realiza¸c˜ao de proje¸c˜oes. A gest˜ao dos riscos tornou-se mais eficiente e as decis˜oes est˜ao baseadas em an´alises mais precisas; uma das aplica¸c˜oes ´e a estima¸c˜ao de medidas de risco no ambiente de neg´ocios em alta frequˆencia.

Conforme apresenta Zivot (2005), o uso dos dados oriundos de negocia¸c˜oes em alta frequˆencia cresceu significativamente nas pesquisas da ´area financeira. Um dos moti-vos ´e o horizonte de decis˜ao dos algoritmos cada vez menor. Al´em disso, esses dados est˜ao relacionados `a maior precis˜ao das estimativas de volatilidades.

Apesar da crescente ado¸c˜ao da an´alise de dados em alta frequˆencia, Yan e Zivot (2003) e Boudt et al. (2013) demonstram uma s´erie de desafios para seu gerenciamento e proces-samento. Conforme os autores, parte dos problemas est´a relacionada `as pr´oprias caracte-r´ısticas das s´eries.

Boudt et al. (2013) citam, por exemplo, um eventual bottleneck computacional devido ´a grande quantidade de observa¸c˜oes a serem processadas e a demanda dos modelos pela estimativa de parˆametros em s´eries com espa¸co de tempo irregular, como os dadostick by tick.

Yan e Zivot (2003) apresentam uma lista de caracter´ısticas especiais relacionadas aos dados de negocia¸c˜oes em alta frequˆencia. A primeira delas ´e o n´umero de observa¸c˜oes que um banco de dados pode exibir; conforme o autor, o n´umero m´edio di´ario de negoci-a¸c˜oes na ´epoca da pesquisa excedia o valor de 20.000 no mercado `a vista de d´olar/euro (USD/EUR).

A segunda ´e a dificuldade para tratamento destes dados, procedimento necess´ario para corre¸c˜ao de pre¸cos e/ou quantidades gravados erroneamente, sequˆencias desordenadas dos tempos de negocia¸c˜ao e lacunas nos dados causadas por interrup¸c˜oes no sinal de internet. Uma vez que o n´umero de negocia¸c˜oes ´e muito alto, realizar esse tipo de procedimento torna-se um desafio relevante ao HFT.

(28)

conhecidos na literatura como modelos GARCH (Generalized Autoregressive Conditional Heteroskedasticity) e Volatilidade Estoc´astica que dados possuindo sempre o mesmo es-pa¸co de tempo entre as negocia¸c˜oes.

O quarto desafio apresentado por Yan e Zivot (2003) ´e o padr˜ao peri´odico de atividade no mercado, uma vez que em hor´arios como abertura e fechamento as atividades de ne-gocia¸c˜oes s˜ao maiores de que as realizadas, por exemplo, no hor´ario de almo¸co.

Estas caracter´ısticas produzem s´eries com movimentos de pre¸cos discretos, negocia¸c˜oes n˜ao sincronizadas e desequil´ıbrios entre pre¸cos de compra e venda. Diante disto, os pro-cedimentos de estima¸c˜ao dos parˆametros de modelos econom´etricos tornaram-se mais complicados devido aos resultados distorcidos provenientes das medidas estat´ısticas usu-almente utilizadas.

A partir desse contexto surge o desafio das capacidades computacionais terem agilizado o processo de tomada de decis˜oes e a necessidade das medidas estat´ısticas terem que acompanhar esta velocidade enquanto apresentam resultados confi´aveis diante das carac-ter´ısticas dos dados supracitados.

No que tange a atividade de negociar em alta frequˆencia, a gest˜ao dos riscos possui papel fundamental em rela¸c˜ao ao controle das perdas, dado que o algoritmo pode apresentar retornos excelentes em um dia e em seguida revertˆe-los em perdas em um ´unico momento.

As medidas para gerenciamento dos riscos tamb´em s˜ao variadas: Silaghi e Robu (2005) e Alvim (2009) utilizaram o desvio padr˜ao (D.P.) nas an´alises dos sistemas de negocia¸c˜ao propostos em seus trabalhos. Alvim (2013) utilizou as medidas Valor em Risco e Valor em Risco Condicional. Boyarshinov (2005) al´em de utilizar o desvio padr˜ao, utilizou tamb´em a m´etrica do Arrasto M´aximoMaximum Drawdown.

O problema para estimativa das medidas acima est´a relacionado aos modelos reconhecidos na academia (modelos de heteroscedasticidade condicional e volatilidade estoc´astica) n˜ao serem eficientes, conforme apresenta Andersen e Bollerslev (1998), Andersenet al.(2001), Andersen et al.(2003) e Bauwens et al.(2012).

(29)

Bauwens et al. (2012) e Wink-Junior e Pereira (2011) complementam o racioc´ınio acima por postularem que a estimativa da volatilidade por meio de dados di´arios ´e viesada. Conforme as caracter´ısticas das s´eries de pre¸cos demonstradas em Yan e Zivot (2003), os dados produzem diversos ru´ıdos nas estima¸c˜oes, uma vez que as medidas de volatilidade n˜ao s˜ao imunes a tais caracter´ısticas.

Diante dos problemas citados, pesquisadores buscaram estudar alternativas para esti-mativa da volatilidade para dados em alta frequˆencia. Conforme Bauwens et al. (2012) e Wink-Junior e Pereira (2011), o artigo de Andersen e Bollerslev (1998) foi o primeiro trabalho que apresentou um estimador que utilizasse dados passados intradi´arios, o que o tornava mais preciso de que os retornos quadr´aticos di´arios.

O estimador foi denominado de Variˆancia Percebida (RVt) – no caso de s´eries

multivari-adas, Covariˆancia Percebida. O presente trabalho trata das s´eries univariadas na maioria dos estimadores, entretanto, a nomenclatura contendo o sufixo “Cov” ser´a mantida para alinhar a abrevia¸c˜ao utilizada nos trabalhos internacionais.

O estimador RVt possui o objetivo de somar os retornos quadr´aticos intradi´arios para

apresentar a volatilidade di´aria; conforme demonstram Andersen e Bollerslev (1998), os dados intradi´arios fornecem estimativas mais precisas da volatilidade, sendo poss´ıvel ob-ter por meio deles medidas de risco di´arias “livres de erros” (error free). As propriedades deste estimador s˜ao apresentadas em Andersenet al. (2001). O estimador da Volatilidade Percebida e a evolu¸c˜ao de tais medidas focadas em dados em alta frequˆencia s˜ao pontos de discuss˜ao neste trabalho.

O gerenciamento das negocia¸c˜oes de alta frequˆencia e a gest˜ao dos riscos possui papel fundamental em rela¸c˜ao ao controle das perdas, sendo que o respectivo controle ´e reali-zado por regras de entrada e sa´ıda que os algoritmos precisam obedecer. Torna-se um problema selecionar qual o estimador a ser implementado no algoritmo para realizar as opera¸c˜oes, uma vez que existem muitos deles.

Al´em da existˆencia de diversos estimadores para a Volatilidade Percebida, um gestor tamb´em necessita projetar as poss´ıveis perdas diante de uma opera¸c˜ao. Para provisionar reservas para tais ocasi˜oes, o gestor precisa projetar a Volatilidade Percebida considerando os pr´oximoshdias. Diante disto, torna-se necess´ario a sele¸c˜ao de um m´etodo de proje¸c˜ao.

(30)

determin´ısticos n˜ao lineares.

Em rela¸c˜ao ao grupo de m´etodos baseados em pressupostos e suposi¸c˜oes da teoria econo-m´etrica, os modelosHeterogeneous Autoregressive Model of Realized Volatility (HAR-RV),

Mixed Data Sampling (MIDAS-RV) eAutoregressive Fractionally Integrated Moving Ave-rage (ARFIMA) s˜ao exemplos amplamente citados na literatura.

Em rela¸c˜ao ao segundo grupo, baseado em modelos determin´ısticos n˜ao lineares, um exemplo ´e o m´etodo Nearest Neighbor, focado em estudar s´eries que apresentam movi-mentos ca´oticos. No artigo de Andrada-Felix et al. (2013) h´a cita¸c˜ao e utiliza¸c˜ao deste m´etodo.

A partir do cen´ario acima descrito, realizam-se as perguntas que auxiliaram na formu-la¸c˜ao dos objetivos desta pesquisa.

• Quais estimadores de volatilidade deveriam ser utilizados para escrever as regras de entrada e sa´ıda dos algoritmos de negocia¸c˜ao em alta frequˆencia?

• Utilizar um ´unico estimador que apresente melhor performance resolveria o pro-blema?

• Poderia a combina¸c˜ao das previs˜oes dos v´arios estimadores em alta frequˆencia da volatilidade ser uma melhor escolha?

1.1.1 Problemas espec´ıficos

O artigo de Andrada-Felix et al. (2013) apresenta novos caminhos para resolu¸c˜ao de tais problemas, os autores compararam a utiliza¸c˜ao de uma ´unica estimativa e a combina¸c˜ao das estimativas. Conforme explicam os autores, poucos estudos foram realizados para investigar as vantagens da combina¸c˜ao de medidas nas s´eries de pre¸cos de negocia¸c˜oes em alta frequˆencia. Timmermann (2006) apresenta que a combina¸c˜ao de proje¸c˜oes demons-trou sucesso emp´ırico em diversas aplica¸c˜oes econˆomicas.

O problema geral para combina¸c˜ao de proje¸c˜oes ´e discutido em Timmermann (2006), os detalhes s˜ao apresentados na se¸c˜ao 2.6. O problema espec´ıfico para combina¸c˜ao de proje¸c˜oes de volatilidades ´e apresentado em Amendola e Storti (2008) e detalhado a se-guir.

SejaRVt, comt= 1, . . . , T, uma s´erie de volatilidades percebidas geradas por um processo

(31)

modelos paraRVt+h, a combina¸c˜ao das volatilidades projetadas ´e apresentada na

expres-s˜ao 1.1.1,

d

RVct+h =

K X

i=1

˜

wiRVdi,t+h, (1.1.1)

em que, ˜wi s˜ao os pesos para combina¸c˜ao, PKi=1w˜i = 1 e ˜wi ≥0.

Conforme Amendola e Storti (2008), a combina¸c˜ao produz uma proje¸c˜ao n˜ao viesada, mesmo existindo um ou mais modelos viesados. A suposi¸c˜ao de n˜ao negatividade dos pesos ´e utilizada para garantir que as volatilidades projetadas sejam sempre positivas.

Diante disto, o problema espec´ıfico ´e apresentado como:

• Quais s˜ao os pesos a serem adotados para projetar a volatilidade?

Na se¸c˜ao 2.6 s˜ao apresentados diversos m´etodos de obten¸c˜ao de pesos. Contudo, conforme Ghysels (2014) ainda n˜ao existe um consenso entre os pesquisadores sobre qual peso ´otimo deveria ser utilizado.

Al´em disto, do ponto de vista pr´atico, pouco foi discutido sobre a combina¸c˜ao de proje¸c˜oes de volatilidade que apresentem as menores chances de evidenciar riscos abaixo de algum n´ıvel esperado.

1.2

Objetivos

A partir do delineamento dos problemas e perguntas de pesquisa surge o objetivo geral deste trabalho, qual seja:

• Propor uma combina¸c˜ao dos estimadores da volatilidade dos pre¸cos de a¸c˜oes utili-zando dados de negocia¸c˜oes em alta frequˆencia.

Para possibilitar que o objetivo geral seja alcan¸cado, definiram-se os objetivos espec´ıficos descritos a seguir:

• Propor a constru¸c˜ao das s´eries de volatilidades percebidas por meio dos estimadores mais recentes.

(32)

• Propor a combina¸c˜ao das proje¸c˜oes de volatilidade por meio dos modelos Heteroge-neous Autorregressive Model of Realized Volatility (HAR-RV),Mixed Data Sampling

(MIDAS-RV),Autoregressive Fractionally Integrated Moving Average (ARFIMA) e

Nearest Neighbor (NN).

• Propor um m´etodo inovador para obten¸c˜ao dos pesos que considera a minimiza¸c˜ao do risco com foco numa melhor prote¸c˜ao as perdas.

1.3

Justificativas da tese

O estudo de mercados de alta frequˆencia e dos dados proporcionados pelas negocia¸c˜oes ´e tema relevante na literatura. Conforme Aldridge (2010) existe uma demanda significativa pela busca de informa¸c˜oes sobre o tema, por´em pouco material publicado para auxiliar o entendimento dos investidores.

O tema est´a internacionalmente em evidˆencia, como em pesquisas realizadas pela In-ternational Organization of Securities Commissions (IOSCO, 2012a; IOSCO, 2012b) nelas definiram-se os principais pontos de discuss˜ao que deveriam orientar a atua¸c˜ao do ´org˜ao em 2013. A IOSCO ´e a associa¸c˜ao mundial para regula¸c˜ao de valores mobili´arios. Entre os pontos a discutir estariam regula¸c˜ao dos neg´ocios de alta frequˆencia, o impacto da tecnologia e a an´alise das infraestruturas de mercado.

Seabra (2014) apresenta que a ´area de estudos concernente `as negocia¸c˜oes em alta frequˆen-cia ´e um tema polˆemico no exterior; contudo, ainda ´e pouco estudado no Brasil. Conforme o autor, apesar dos poucos estudos, espera-se um crescimento da produ¸c˜ao acadˆemica a respeito do tema.

Ara´ujo e Montini (2013) apresentam outros motivos para a expectativa de crescimento, como, por exemplo, a maior necessidade das corretoras em aumentar seus portf´olios de clientes, situa¸c˜ao que demandar´a maiores investimentos na ´area.

Em rela¸c˜ao aos dados, a disponibilidade pode n˜ao ser um problema, mas sua gest˜ao requer aten¸c˜ao. Conforme apresenta White (2012), o momento em que vivemos pode ser considerado como a “Era dos Dados”: o autor afirma que as quantidades de dados possuem uma magnitude de em torno de 1,8 zettabytes por pessoa no mundo.

(33)

alta frequˆencia, o controle destas informa¸c˜oes ´e crucial.

Diante disto, justifica-se o estudo de medidas de volatilidade para dados em alta frequˆen-cia, uma vez que a apresenta¸c˜ao de novas medidas ou metodologias de estima¸c˜ao pode melhorar o desempenho da gest˜ao dos riscos.

No caso da ´area de finan¸cas, Zivot (2005) apresenta que o uso dos dados oriundos de negocia¸c˜oes em alta frequˆencia nas pesquisas cresceu significativamente. A principal jus-tificativa est´a relacionada `a melhor precis˜ao das estimativas de volatilidades. Conforme Wink-Junior e Pereira (2011), modelos que estimam a volatilidade por meio de dados intradi´arios est˜ao mais frequentes na literatura.

Conforme afirmam Andersen e Bollerslev (1998) e Andersen et al. (2001), modelos da fam´ılia ARCH e Volatilidade Estoc´astica demonstram resultados inconsistentes para es-tima¸c˜ao da volatilidade com dados em alta frequˆencia, uma vez que possuem problemas como ru´ıdos de microestrutura, sincroniza¸c˜ao e saltos.

Diante destes problemas, alguns pesquisadores da ´area utilizam somente um ´unico dado di´ario – a ´ultima negocia¸c˜ao, em medida que descarta preciosos dados intradi´arios capazes de apresentar padr˜oes pouco estudados na literatura. Problemas como este justificam a necessidade de estudar medidas de volatilidade que fa¸cam uso de pre¸cos de negocia¸c˜oes em alta frequˆencia.

Segundo Cappa e Pereira (2010) e Wink-Junior e Pereira (2011), artigos brasileiros que fa¸cam uso de bases de dados de alta frequˆencia s˜ao raros devido a dificuldade de obten¸c˜ao de bases de dados. Diante disto, a realiza¸c˜ao do presente trabalho ´e justificada por intro-duzir mais informa¸c˜oes acadˆemicas `a literatura de finan¸cas, utilizando bases de dados em alta frequˆencia com ativos brasileiros.

Diversas medidas que estimam volatilidades por meio de dados em alta frequˆencia foram desenvolvidas com o tempo. Deste modo, torna-se dif´ıcil para o gestor dos algoritmos de negocia¸c˜ao selecionar uma medida de risco espec´ıfica para controlar as perdas de suas opera¸c˜oes.Assim, combinar os resultados dos estimadores pode ser uma alternativa para melhoria da capacidade de gest˜ao.

(34)

(Survey of Professional Forecasters - SPF) e com acertos significativos.

Intenciona-se neste trabalho, portanto, verificar a eficiˆencia ´otima na compara¸c˜ao entre a utiliza¸c˜ao de uma medida singular de risco ou a combina¸c˜ao de v´arias delas no ambiente de dados em alta frequˆencia.

Modelos de proje¸c˜ao da volatilidade utilizando dados em alta frequˆencia s˜ao amplamente aceitos na academia como melhores preditores da variˆancia futura, conforme apresentam Boudt et al. (2013). Entre os modelos, os dois mais conhecidos na literatura desta ´area s˜ao Heterogeneous Autoregressive Model of Realized Volatility (HAR-RV) e oMixed Data Sampling (MIDAS-RV). Deste modo, justifica-se a utiliza¸c˜ao de tais modelos nesta tese.

Outro modelo bastante conhecido na ´area de proje¸c˜ao e citado na revis˜ao de literatura apresentada em Hansen e Lunde (2012) e Andrada-Felix et al. (2013) ´e o modelo Au-toregressive Fractionally Integrated Moving Average (ARFIMA). Desta forma, torna-se necess´aria sua inclus˜ao neste trabalho.

O m´etodo Nearest Neighbor (NN) ´e pouco citado na literatura de proje¸c˜ao de dados em alta frequˆencia, por´em possui propriedades interessantes: al´em de n˜ao demandar que se assuma alguma fun¸c˜ao particular para os processos de m´edia, variˆancia condicional e inova¸c˜oes, tamb´em pode ser utilizado para s´eries com espa¸camento de tempo irregular, como ´e o caso da s´eries em alta frequˆencia.

Combinar as proje¸c˜oes dos modelos citados possui motiva¸c˜ao interessante, dado que os trˆes primeiros modelos s˜ao baseados em pressupostos e suposi¸c˜oes da teoria econˆomica, enquanto o ´ultimo est´a baseado em modelos advindos da f´ısica mecˆanica. Diante disto, combinar o conhecimento de duas ´areas relevantes da ciˆencia financeira pode melhorar o desempenho das proje¸c˜oes.

Quanto `as combina¸c˜oes, diversas pesquisas da ´area focaram no desenvolvimento de m´eto-dos diferenciam´eto-dos para escolher os pesos ´otimos para minimiza¸c˜ao m´eto-dos erros de previs˜ao. Conforme apresentam Elliott e Timmermann (2004) a maioria dos resultados te´oricos e emp´ıricos ´e baseada em m´etodos que assumem fun¸c˜ao de erro sim´etrica e quadr´atica, como por exemplo o Erro M´edio Quadr´atico (Mean Squared Error).

(35)

Mediante os resultados de Elliott e Timmermann (2004) e Patton e Timmermann (2007) para as proje¸c˜oes do PIB americano, caso essas condi¸c˜oes n˜ao sejam obedecidas, os m´e-todos baseados em fun¸c˜oes de erro sim´etricas e quadr´aticas n˜ao apresentaram resultados satisfat´orios. De acordo com os autores, fun¸c˜oes de erro assim´etricas que visem obten¸c˜ao de pesos para combina¸c˜ao demonstraram melhor efic´acia.

Do ponto de vista pr´atico, Elliott e Timmermann (2004) apresentam que diversas medidas de performance s˜ao baseadas em fun¸c˜oes de erro assim´etricas. ´E o caso das proje¸c˜oes de desempenhos financeiros que s˜ao geralmente analisadas pela raz˜ao de Sharpe (m´edia dos retornos dividida pelo desvio padr˜ao dos retornos).

Como exemplo para gest˜ao de riscos, gestores utilizam o Value at Risk (VaR) ma me-dida de risco assim´etrica (downside risk), conforme apresenta Alexander (2008).

No trabalho de Elliott et al. (2008) os autores afirmam que as combina¸c˜oes que utili-zaram fun¸c˜ao de pesos baseada em fun¸c˜oes de erro assim´etricas apresentaram melhores resultados para proje¸c˜oes de infla¸c˜ao, an´alises de decis˜oes pol´ıticas e comportamento es-trat´egico.

Mesmo diante disso, n˜ao foram desenvolvidos trabalhos que buscassem selecionar os pesos ´otimos para minimiza¸c˜ao do risco de uma previs˜ao ineficiente na prote¸c˜ao contra perdas. Pouco tamb´em foi discutido sobre m´etodos de combina¸c˜ao de proje¸c˜oes da Volatilidade Percebida com objetivo de minimizar o risco de projetar a volatilidade abaixo de deter-minado n´ıvel esperado.

Deste modo, a literatura vigente carece de proposi¸c˜ao de algum m´etodo que considere a minimiza¸c˜ao do risco de uma previs˜ao ineficiente para prote¸c˜ao contra perdas. Buscando-se alocar mais peso para as proje¸c˜oes que apreBuscando-sentem as menores chances de evidenciar riscos abaixo de algum n´ıvel esperado.

Para o caso do investidor que precisa se proteger do risco da opera¸c˜ao, deve-se esco-lher a melhor proje¸c˜ao que combine as tarefas de evitar perdas acima do esperado e n˜ao causar provisionamento em excesso no ponto de vista or¸cament´ario. Diante disto, torna-se necess´ario um m´etodo de pondera¸c˜ao que apresente proje¸c˜ao parcimoniosa com as contas do investidor e efic´acia na prote¸c˜ao contra riscos.

(36)

e preenchimento desta lacuna na literatura.

O caminho delineado para desenvolvimento de tais m´etodos de combina¸c˜ao foi a utili-za¸c˜ao de uma fun¸c˜ao baseada no Momento Parcial Inferior (Lower Partial Moment -LPM). Esta ´e uma medida de risco assim´etrica sugerida por Bawa e Lindenberg (1977).

Tal medida ´e baseada na perspectiva de que um investidor deve possuir preferˆencia por investimentos que apresentem as menores chances de evidenciar retornos abaixo de deter-minado n´ıvel esperado. Apesar de a medida LPM ser bastante conhecida na literatura, sua utiliza¸c˜ao como m´etrica para combina¸c˜ao de proje¸c˜ao ainda n˜ao foi estudada.

1.4

Contribui¸c˜

oes

A necessidade de estudar o mercado de a¸c˜oes brasileiro no contexto dos dados em alta frequˆencia direciona o presente trabalho, cujos principais objetos de estudo s˜ao os es-timadores da volatilidade dos pre¸cos de a¸c˜oes utilizando dados de negocia¸c˜oes em alta frequˆencia.

A contribui¸c˜ao deste trabalho incorpora tamb´em o levantamento de uma revis˜ao bibli-ogr´afica a respeito do funcionamento do livro de ofertas, principal ambiente de atua¸c˜ao dos algoritmos de negocia¸c˜ao, conforme apresenta Aldridge (2010).

Outra contribui¸c˜ao ´e a apresenta¸c˜ao dos estados e espa¸co probabil´ıstico do LOB pro-posta por Cont e Larrard (2013), exibindo exemplos de negocia¸c˜oes. Conforme citam Gould et al. (2013) ainda ´e necess´ario estudar modelos que possam incorporar informa-¸c˜oes de todo o estado do LOB.

O presente trabalho tamb´em apresenta como contribui¸c˜ao a evolu¸c˜ao dos estimadores da volatilidade para dados em alta frequˆencia. No artigo de McAleer e Medeiros (2008) os autores realizam um levantamento a respeito dos estimadores at´e o ano de 2006, atua-lizados neste texto at´e o ano de 2013.

Como contribui¸c˜ao e inova¸c˜ao deste trabalho, destaca-se tamb´em a continuidade pro-posta no artigo de Andrada-Felix et al. (2013). Os autores apresentam como poss´ıveis trabalhos futuros a estimativa e combina¸c˜ao de modelos de proje¸c˜ao de volatilidade uti-lizando medidas diferentes da utilizada no trabalho.

(37)

entre o modeloHeterogeneous Autoregressive Model of Realized Volatility (HAR-RV), pro-posto por Corsi (2009) e o modelo Mixed Data Sampling (MIDAS-RV), apresentado por Ghyselset al.(2004) no per´ıodo entre 01/11/2007 a 30/04/2010. Contudo, os autores n˜ao abordaram a alternativa de combina¸c˜ao das estimativas.

No caso do mercado americano, o trabalho de Andrada-Felixet al.(2013) simboliza avan¸co por apresentar e discutir as proje¸c˜oes da volatilidade pelos modelos Autoregressive Frac-tionally Integrated Moving Average (ARFIMA) e Nearest Neighbor (NN) no mercado americano.

Assim como Wink-Junior e Pereira (2011), os autores utilizaram a Variˆancia Percebida para estimar a volatilidade ex post, que faz o papel como dados de entrada para as esti-ma¸c˜oes das proje¸c˜oes.

Diante disso, a contribui¸c˜ao e a inova¸c˜ao em rela¸c˜ao ao artigo publicado por Andrada-Felix et al. (2013) ocorre pela possibilita¸c˜ao de abordagem das medidas analisadas em Wink-Junior e Pereira (2011) no contexto da combina¸c˜ao de proje¸c˜oes em um novo pe-r´ıodo de an´alise. Al´em disso, outras medidas para estimar a volatilidade ex post ser˜ao utilizadas para realizar as proje¸c˜oes. Diferentemente do trabalho de Andrada-Felix et al.

(2013), neste caso o mercado brasileiro ser´a o foco de an´alise.

A principal contribui¸c˜ao e inova¸c˜ao da presente tese ´e a proposi¸c˜ao, de forma in´edita, da fun¸c˜ao baseada no Momento Parcial Inferior (Lower Partial Moment - LPM) para estimativa dos pesos para combina¸c˜ao das proje¸c˜oes.

(38)

2

Referencial Te´

orico

Para entender os diversos conceitos para atingir os objetivos tra¸cados, torna-se necess´ario a apresenta¸c˜ao dos principais elementos a serem utilizados neste estudo. Diante disto, ser˜ao tratados assuntos relacionados aos seguintes t´opicos: Funcionamento do Livro de Ofertas, apresenta¸c˜ao do espa¸co probabil´ıstico do LOB seguindo as defini¸c˜oes de Cont e Larrard (2013) e Gould et al. (2013), modelo gen´erico para algoritmos de alta frequˆencia e apresenta¸c˜ao das medidas de volatilidade para dados em alta frequˆencia.

2.1

Defini¸c˜

oes sobre o Livro de Ofertas (LOB)

Conforme apresentou Aldridge (2010) a principal fonte de informa¸c˜oes para entendimento dos modelos de negocia¸c˜ao em alta frequˆencia s˜ao os dados hist´oricos, sendo que o livro de ofertas ´e o principal ambiente de atua¸c˜ao destes algoritmos. Diante disto, o ponto inicial para entendimento dos modelos de HFT ´e o estudo a respeito do LOB.

Como ferramenta para negocia¸c˜ao no mercado financeiro, Glosten (1994) apresenta que o livro de ofertas s˜ao formas efetivas para traders pacientes proverem liquidez paratraders

menos pacientes. Como defini¸c˜ao, Gould et al.(2013) apresenta que o LOB ´e composto por um grupo de formadores de mercado que centralizam suas ordens de compra e venda atrav´es da publica¸c˜ao dos pre¸cos aos quais est˜ao propensos a comprar ou vender pelo ativo transacionado.

Gould et al. (2013) e Cont e Larrard (2013) descrevem formalmente o funcionamento do livro de ofertas. Seja x uma ordem de negocia¸c˜ao enviada a uma plataforma eletrˆonica, suas caracter´ısticas s˜ao apresentadas na express˜ao 2.1.1:

x= (px, vx, ix), (2.1.1)

em que, ix ´e o hor´ario de envio da ordem x, px ´e o pre¸co e |vx| ´e o tamanho da ordem,

quando vx >0, significar´a uma ordem de venda, quando vx <0, indicar´a uma ordem de

compra. Neste caso, o sinal negativo ou positivo de vx tem fun¸c˜ao somente de indicar a

qualidade da ordem de negocia¸c˜ao (compra ou venda).

(39)

Nos sistemas eletrˆonicos, quando a ordem x ´e enviada o algoritmo realiza uma varre-dura nas ordens pendentes para verificar a possibilidade de neg´ocio. Caso o algoritmo encontre alguma correspondˆencia, o neg´ocio ocorre imediatamente. Neste caso, a ordem possui uma nomenclatura particular denominada “ordem a mercado”.

Caso o algoritmo n˜ao encontre ordens correspondentes, a ordem x enviada permanece ativa at´e a mesma ser cancelada ou executada. As ordens ativas possuem nomenclatura particular como “ordens penduradas” ou “ordens limitadas”. Na literatura internacional estas ordens s˜ao chamadas de limit orders, como ´e observado nos trabalhos de Biais et al.(1995), Aldridge (2010), Gould et al. (2013) e Cont e Larrard (2013). Conforme estes autores, o conjunto destas ordens ativas forma o LOB.

O livro de ofertas denominado comoL(i) ´e o conjunto de todas as ordens penduradas de um ativo no tempo intradi´ario i. Estas ordens s˜ao agrupadas em filas apresentando as ordens ativas de compra e venda em algum pre¸co espec´ıfico. As filas s˜ao ordenadas em 2 grupos formados pelas ordens de compra (bid) -B(i) e pelas ordens de venda (ask) -A(i).

A fila B(i) ´e ordenada do maior pre¸co das ordens de compras ativas at´e o menor pre¸co. O maior pre¸co de compra recebe uma nomenclatura especifica, chamado de bid price

-b(i). Formalmente, b(i) ´e definido na express˜ao 2.1.2,

b(i) = max

x∈B(i)px. (2.1.2)

A filaA(i) ´e ordenada do menor pre¸co das ordens de vendas ativas at´e o maior pre¸co. O menor pre¸co de venda recebe uma nomenclatura especifica, chamado de ask price - a(i). Formalmente,a(i) ´e definido na express˜ao 2.1.3,

a(i) = min

x∈A(i)px. (2.1.3)

Um ponto a ressaltar, principalmente, para iniciantes no entendimento do livro de ofertas ´e a possibilidade da venda a descoberto, venda de uma a¸c˜ao sem possu´ı-la. Conforme Minozzo (2010) esta pr´atica ´e possibilitada pelo aluguel de a¸c˜oes; em contratos deste tipo s˜ao acordados o prazo e a taxa de aluguel. Entretanto, para negocia¸c˜oes de alta frequˆencia estas restri¸c˜oes n˜ao s˜ao problemas devido `a r´apida negocia¸c˜ao.

Na figura 1 ´e apresentado um exemplo do livro de ofertas - L(i) - da a¸c˜ao PETR4. A express˜ao 2.1.1 pode ser formulada, por exemplo, ao analisar a linha 2. Seja a ordem

x= 2, a vari´avel p2 = R$39,81, w2 = 1000 a¸c˜oes e i2 = 12:29h. No mercado integral de

(40)

eA(i) a coluna “Venda”; dentro destes grupos pode-se observarb(i) como R$39,82 e a(i) como R$39,90.

Figura 1: Exemplo Livro de Ofertas

FONTE: Adaptado de Enfoque (2014).

Por meio do entendimento das vari´aveis que formam a estrutura do livro de ofertas, ressaltam-se algumas medidas importantes. Nas express˜oes 2.1.4 e 2.1.5 s˜ao vistas as me-didas de spread de compra e venda (bid-ask spread) - s(i) - e pre¸co m´edio (mid price)

-m(i) - respectivamente.

Estas medidas proporcionam o quanto o mercado valoriza a certeza e a imediatez as-sociadas `as ordens a mercado contra a incerteza e espera das ordens limitadas. Na Figura 1, por exemplo, observa-se um per´ıodo de desequil´ıbrio no livro de ofertas, dado que o

spread ´e maior que o tamanho do tick de R$0,01. Neste exemplo, o bid-ask spread pode ser medido como s(i) = R$0,08.

s(i) :=a(i)b(i), (2.1.4)

m(i) := a(i) +b(i)

2 . (2.1.5)

Outra medida importante para entendimento do LOB ´e a profundidade (market depth). A profundidade ´e o tamanho das filas B(i) ou A(i) para algum pre¸co espec´ıfico; a pro-fundidade tamb´em ´e dividida em duas formas: propro-fundidade da compra (express˜ao 2.1.6) e profundidade da venda (express˜ao 2.1.7).

A profundidade de compra (bid side depth) ´e a soma de todas as quantidades das or-dens ativas de compra a um pre¸co e tempo espec´ıfico; a profundidade de venda (ask side depth) ´e a soma das quantidades nas ordens limitadas de venda a um pre¸co e tempo espec´ıfico.

nb(p, i) = X

x∈B(i)|px=p

(41)

na(p, i) = X

x∈A(i)|px=p

vx. (2.1.7)

Na figura 2 ´e exibido o gr´afico de profundidade do livro de ofertas. Neste gr´afico, observam-se as express˜oes 2.1.6 e 2.1.7 observam-sendo utilizadas para cada pre¸co num tempo espec´ıfico. A partir deste gr´afico se observa as filas de inten¸c˜oes compradoras e vendedoras para a respectiva a¸c˜ao; no lado esquerdo ´e visto as profundidades de compra e no lado direito as profundidades de venda.

Figura 2: Gr´afico de profundidade do L(i) FONTE: Adaptado de Enfoque (2014).

Outra medida importante para entender o livro de ofertas e analisar os dados em alta frequˆencia ´e a estima¸c˜ao das taxas de retorno. Para estimar as medidas de volatilidade para dados em alta frequˆencia ´e, primeiramente, necess´ario obter os retornos dos ativos analisados. O retorno do pre¸co de compra ´e apresentado na express˜ao 2.1.8, o retorno do pre¸co de venda ´e apresentado na express˜ao 2.1.9 e o retorno do pre¸co m´edio ´e exibido na express˜ao 2.1.10,

Rb(i1, i2) := [b(i2)−b(i1)]

b(i1) , (2.1.8)

Ra(i1, i2) := [a(i2)−a(i1)]

a(i1) , (2.1.9)

Rm(i

1, i2) :=

Ra(i1, i2) +Rb(i1, i2)

2 . (2.1.10)

2.1.1 Defini¸c˜ao do espa¸co probabil´ıstico

A partir das defini¸c˜oes conceituais a respeito do livro de ofertas, apresenta-se a defini¸c˜ao do espa¸co probabil´ıstico. As vari´aveis e suposi¸c˜oes exibidas s˜ao apresentadas nos artigos de Gould et al. (2013) e Cont e Larrard (2013).

(42)

ale-at´oria Xi pela express˜ao 2.1.11,

Xi := b(i), nbi, nai

, (2.1.11)

em que,nb

i ´e a profundidade para o melhor pre¸co de compra (tamanho da fila dobid price)

ena

i ´e a profundidade para o melhor pre¸co de venda (tamanho da fila do ask price), estas

vari´aveis s˜ao vers˜oes simplificadas das express˜oes 2.1.6 e 2.1.7. Supondo que o valor de

b(i) ´e conhecido, a(i) ´e obtido por b(i) mais o tamanho do tick.

Define-se a express˜ao 2.1.11 como um processo de tempo cont´ınuo com valores no es-tado discreto no espa¸co❩×◆2. Ao observar a figura 1,X

i´e a primeira linha da coluna de

Compra. Cont e Larrard (2013) utilizam a express˜ao 2.1.11 para explicar as ocorrˆencias no livro de ofertas devido aos trabalhos de Biaiset al. (1995) demonstrarem que o principal componente no fluxo de ordens s˜ao os melhores pre¸cos de compra e venda, apresentados nas express˜oes 2.1.6 e 2.1.7.

O processoXi ´e influenciado pela dura¸c˜ao da chegada de ordens de compra, representada

por Ta

i , i ≥ 1 e da dura¸c˜ao da chegada de ordens de venda, representada por Tib, i ≥ 1.

Tamb´em ´e necess´ario observar a varia¸c˜ao associada ao tamanho da fila de vendedores na i,

representada por Va

i , i≥1 e a varia¸c˜ao associada ao tamanho da fila de compradores nbi,

representada por Vb

i , i≥1.

Segundo Cont e Larrard (2013), o espa¸co probabil´ıstico do L(i) possui as seguintes supo-si¸c˜oes:

Suposi¸c˜ao 1. N˜ao existˆencia de saltos (gaps).

Suposi¸c˜ao 2. O spread de compra e venda - s(i) retorna infinitamente r´apido a 1 tick. Suposi¸c˜ao 3. O tamanho da fila nbi ou nai depois de uma varia¸c˜ao no pre¸co (b(i)oua(i))

´e tratada como uma vari´avel advinda de uma distribui¸c˜ao f que pertence a ◆2.

Os Saltos (gaps) no livro de ofertas s˜ao varia¸c˜oes maiores que 1tick nospread de compra e venda. Por meio da Suposi¸c˜ao 1, caso o spread de compra e venda (bid-ask spread)

-s(i) aumente, o fluxo de ordens preenche rapidamente o gap e s(i) retorna a 1 tick.

Por exemplo, um salto ´e observado na Figura 1, em que o spread de compra e venda ´e de R$0,08. Pela suposi¸c˜ao 2, esta diferen¸ca voltar´a rapidamente ao tamanho de 1tick, isto ´e, para R$0,01 em instantes.

O comportamento def ´e exibido comof nb i, nai

que representa a probabilidade de obser-var nb

i, nai

depois de uma alta no pre¸co e como ˜f nb i, nai

(43)

de observar nb i, nai

depois de uma baixa no pre¸co. O hist´orico de eventos nos pre¸cos e quantidades no livro de ofertas ´e representado porFi.

Suposi¸c˜ao 4. o comportamento da express˜ao 2.1.11 ´e observado pelas proposi¸c˜oes a se-guir:

• Caso ocorra um cancelamento de ordem na fila de venda no per´ıodo intradi´ario

i=m, observa-se a express˜ao 2.1.12:

Xm= a(m), nbm, nam+Via

1{na

m+Via>0}+ b(m) +ι, R b i, Ria

1{na

m+Via>0}. (2.1.12)

Nesta proposi¸c˜ao apresentada, caso ocorra um cancelamento na fila de venda, observam-se incrementos de 1 tick no pre¸co de venda.

• Caso ocorra um cancelamento na fila de compra no per´ıodo intradi´ario i = m, observa-se a express˜ao 2.1.13.

Xm = b(m), nbm+Vib, nam

1{nb

m+Vib>0}+ (b(m

−ι,R˜bi,R˜ai1{nb

m−+Vib>0}. (2.1.13)

Nesta proposi¸c˜ao, caso ocorra um cancelamento na fila de compra, observa-se decr´escimo de 1 tick no pre¸co de compra.

Sendo que, Rb

i eRai s˜ao sequˆencias de vari´aveis aleat´orias independentes e identicamente

distribu´ıdas (i.i.d.) com distribui¸c˜ao f Rb i, Rai

; estas vari´aveis foram apresentadas nas express˜oes 2.1.8 e 2.1.9. As vari´aveis ˜Rb

i e ˜Rai tamb´em s˜ao sequˆencias de vari´aveis

ale-at´orias i.i.d. representadas nas express˜oes 2.1.8 e 2.1.9 com distribui¸c˜ao ˜fR˜b i,R˜ai

que representa a probabilidade depois de uma queda no pre¸cob(i).

2.1.2 Funcionamento do Livro de Ofertas

Cont e Larrard (2013) apresentam o livro de ofertas contendo funcionamento b´asico como um modelo markoviano. Uematsu (2012) apresentou que a propriedade fundamental des-tes modelos ´e a probabilidade da ocorrˆencia de um determinado evento depender somente da imediata ocorrˆencia anterior, n˜ao importando levantar todo o hist´orico da s´erie.

O trabalho de Uematsu (2012) demonstrou que os dados brasileiros n˜ao possuiram a propriedade markoviana. Como alternativa, citou sobre o processo ser considerado em instantes (ticks), caracterizando um tempo discreto. O trabalho de Cont e Larrard (2013) ´e importante por caracterizar o modelo como um processo de tempo cont´ınuo com valores no estado discreto no espa¸co❩×◆2.

Os eventos que podem ocorrer noL(i) s˜ao ilustrados nos Quadros 1, 2, 3 e 4.

(44)

a) Se px ≤ b(i): como exemplo, observa-se a Quadro 1. No Quadro 1a o valor de b(i)

´e 18,00; neste momento foi enviada uma ordem x com px = 17,99. Diante disto, na

ilustra¸c˜ao 1b, observa-se que a ordem de compra x= (17,99;200;ix) se torna ativa

e n˜ao causa mudan¸ca em b(i) ou a(i).

Quadro 1: Exemplo de envio de ordem limitada

B(i) A(i)

Quant. Compra Venda Quant.

200 18,00 18,01 200

200 17,98 18,02 200

200 17,97 18,03 200

(a) Estado atual.

B(i) A(i)

Quant. Compra Venda Quant.

200 18,00 18,01 200

200 17,99 18,02 200

200 17,98 18,03 200

(b) Envio de px= 17,99. FONTE:Elaborado pelo autor.

b) Se b(i) < px < a(i): como exemplo, se a Quadro 2. No Quadro 2a

observa-se um exemplo de estado atual com b(i) = 18 e a(i) = 18,02. Uma ordem x = (18,01;200;ix) foi enviada, tendo como resultado o Quadro 2b, em que a nova ordem

causou um aumento em b(i).

Quadro 2: Exemplo de envio de ordem limitada com altera¸c˜ao em b(i)

B(i) A(i)

Quant. Compra Venda Quant.

200 18,00 18,02 200

200 17,99 18,03 200

200 17,98 18,04 200

(a) Estado atual.

B(i) A(i)

Quant. Compra Venda Quant.

200 18,01 18,02 200

200 18,00 18,03 200

200 17,99 18,04 200

(b) Envio px= 18,01. FONTE:Elaborado pelo autor.

c) Se uma ordem de venda x ´e enviada a mercado: neste caso, a ordem ´e executada conforme o tamanho (vx) exigido pelo investidor.

Este exemplo ´e ilustrado no Quadro 3, sendo que em 3a ´e apresentado um estado atual do livro de ofertas. Uma ordem de venda a mercado com vx = 200 foi enviada; ordens de

venda a mercado s˜ao executadas nas ordens de compra limitadas (as ordens penduradas). Neste caso, otrader vendeu a descoberto 100 a¸c˜oes a 18,00 e 100 a¸c˜oes a 17,99. Portanto, o novo pre¸co de compra b(i) ficou em 17,99, como ´e apresentado no Quadro 3b.

d) Se uma ordem de compra x ´e enviada a mercado: neste caso, a ordem ´e executada conforme o tamanho (vx) exigido pelo investidor.

No Quadro 4 ´e ilustrado este exemplo; em 4a ´e apresentado um estado atual do livro de ofertas. Uma ordem de compra a mercado foi enviada comvx =−400; ordens de compra

(45)

Quadro 3: Exemplo execu¸c˜ao de ordem a mercado em b(i)

B(i) A(i)

Quant. Compra Venda Quant.

100 18,00 18,01 300

200 17,99 18,02 200

100 17,98 18,03 200

(a) Estado atual.

B(i) A(i)

Quant. Compra Venda Quant.

100 17,99 18,01 300

100 17,98 18,02 200

100 17,97 18,03 200

(b) Novo b(i)ap´os negocia¸c˜ao. FONTE:Elaborado pelo autor.

Quadro 4: Exemplo execu¸c˜ao de ordem a mercado em a(i)

B(i) A(i)

Quant. Compra Venda Quant.

100 18,00 18,01 300

200 17,99 18,02 200

100 17,98 18,03 200

(a) Estado atual.

B(i) A(i)

Quant. Compra Venda Quant.

100 18,00 18,02 100

200 17,99 18,03 200

100 17,98 18,04 200

(b) Novo at ap´os negocia¸c˜ao. FONTE:Elaborado pelo autor.

Ap´os apresentar o funcionamento do livro de ofertas, torna-se importante apresentar o processo de difus˜ao dos pre¸cos. Dado que os eventos no livro de ofertas ocorrem num ambiente de alta frequˆencia, Cont e Larrard (2013) definem o processo de difus˜ao dos pre¸cos no respectivo ambiente. Diante disto, os pre¸cos se comportam como um processo estoc´astico expresso em 2.1.14, comZ eNt expressos em 2.1.15 e 2.1.16 respectivamente:

pLi(i) =Z(Ni), (2.1.14)

Z(i) =

M X

i=1

Xi, (2.1.15)

Ni = max{i≥0;τ1+· · ·+τm ≤M}, (2.1.16)

em que,pLi(i) ´e o pre¸co observado no livro de ofertas, Z ´e o pre¸co depois quei mudan¸cas intradi´arias de pre¸cos ocorreram, Ni ´e o n´umero de mudan¸cas de pre¸cos durante o

inter-valo de tempo [0, M] eτ ´e a dura¸c˜ao entre as mudan¸cas de pre¸cos.

Referências

Documentos relacionados

Os dados de incidência foram obtidos do RCPB de Fortaleza a partir do sistema basepopWeb (INSTITUTO NACIONAL DE CÂNCER, 2010), sendo coletados: o número de casos novos

Mesmo com suas ativas participações na luta política, as mulheres militantes carregavam consigo o signo do preconceito existente para com elas por parte não somente dos militares,

O Conselho Federal de Psicologia (CFP) apresenta à categoria e à sociedade em geral o documento de Referências Técnicas para a Prática de Psicólogas(os) em Programas de atenção

Neste tipo de situações, os valores da propriedade cuisine da classe Restaurant deixam de ser apenas “valores” sem semântica a apresentar (possivelmente) numa caixa

A proporçáo de indivíduos que declaram considerar a hipótese de vir a trabalhar no estrangeiro no futuro é maior entle os jovens e jovens adultos do que

Após a capitulação jurídica e validação por parte do Delegado de Polícia responsável pelo atendimento virtual, o sistema pode viabilizar a inserção de informações

Como todos os outros seres humanos, o operador também é construtor da realidade e carrega consigo “experiências vividas, ideologias e valores que amoldam a sua

Our contributions are: a set of guidelines that provide meaning to the different modelling elements of SysML used during the design of systems; the individual formal semantics for