Combinação de projeções de volatilidade baseadas em medidas de risco para dados em...

(1)

DEPARTAMENTO DE ADMINISTRA ¸C ˜AO

PROGRAMA DE P ÓS-GRADUA ¸C ÃO EM ADMINISTRA ¸C ÃO

COMBINA ¸C ˜AO DE PROJE ¸C ˜OES DE VOLATILIDADE BASEADAS EM

MEDIDAS DE RISCO PARA DADOS EM ALTA FREQUˆENCIA

Alcides Carlos de Ara´ujo

Orientadora: Profa. Dra. Alessandra de ´Avila Montini

(2)

Reitor da Universidade de S˜ao Paulo

Prof. Dr. Adalberto Am´erico Fischmann

Diretor da Faculdade de Economia, Administra¸c˜ao e Contabilidade

Prof. Dr. Roberto Sbragia

Chefe do Departamento de Administra¸c˜ao

Prof. Dr. Moacir de Miranda Oliveira J´unior

(3)

COMBINA ¸C ˜AO DE PROJE ¸C ˜OES DE VOLATILIDADE BASEADAS EM

MEDIDAS DE RISCO PARA DADOS EM ALTA FREQUˆENCIA

Tese apresentada ao Programa de Pós-gradua¸cão em Administra¸cão do Departamento de Adminis-tra¸cão da Faculdade de Economia, AdminisAdminis-tra¸cão e Contabilidade da Universidade de São Paulo, como requisito parcial para a obten¸cão do t´ıtulo de Doutor em Ciências.

Orientadora: Profa. Dra. Alessandra de ´Avila Montini

Vers˜ao Corrigida

(vers˜ao original dispon´ıvel na Faculdade de Economia, Administra¸c˜ao e Contabilidade)

(4)

Faculdade de Economia, Administra¸cão e Contabilidade da Univer-sidade de São Paulo – Programa de Pós-gradua¸cão em Administra-¸cão, pela seguinte comissão examinadora:

Profa. Dra. Alessandra de ´Avila Montini (Presidente)

Prof. Dr. Adolpho Walter Pimazoni Canton – FEA/USP

Prof. Dr. Jos´e Roberto Ferreira Savoia – FEA/USP

Prof. Dr. Andr´e Luiz Oda – FIA

Prof. Dr. Junio Fuentes – FIA

FICHA CATALOGR ´AFICA

Elaborada pela Se¸c˜ao de Processamento T´ecnico do SBD/FEA/USP

Ara´ujo, Alcides Carlos de

Combina¸cão de proje¸cões de volatilidade baseadas em medidas de risco para dados em alta frequência / Alcides Carlos de Araújo – São Paulo, 2016.

287p.

Tese (Doutorado) – Universidade de S˜ao Paulo, 2016. Orientador: Alessandra de ´Avila Montini.

1. Finan¸cas 2. A¸cões 3. Investimentos 4. Risco I. Universidade de São Paulo. Faculdade de Economia, Administra¸cão e Contabilidade. II. T´ıtulo.

(5)

(6)

(7)

Agradecimentos

- `A Deus, por iluminar o meu caminho e pela for¸ca no desempenho de todas as minhas atividades;

- Ao meu pai, José Carlos e minha mãe, Sueli, pela for¸ca diária e apoio constante durante toda a minha vida;

- Aos meus familiares tia Maria C´ıcera (tia Liu), tia Nena e fam´ılia, tia Socorro (tia Cˆorre) e fam´ılia, Henrique, Fernando, Viviane, Fernanda, Fred, Fabiana, Louren¸co (Tio Nen) e fam´ılia pelo apoio constante durante o curso de doutorado;

- A Profa. Dra. Alessandra Montini que se dedicou muito no seu papel de orientadora, e a quem sou muito grato por todo o aprendizado obtido no curso de Doutorado;

- À banca examinadora da Tese, ao Professor titular Adolpho Walter Pimazoni Canton, Prof. Dr. André Oda e Prof. Dr. Junio Fuentes, por todas as contribui¸cões dadas e por todo o apoio durante a execu¸cão do trabalho;

- Ao corpo docente da FEA/USP, em especial aos Profs. Drs. Daniel Cordeiro, Abraham Yu, Ronaldo Zwicker, César Alexandre, José Roberto Securato, Fábio Lotti, Rosana Ta-vares, Eduardo Kayo, José Roberto Savoia e Bernadete Marinho, com quem tive oportu-nidade de fazer matérias e engrandecer meus conhecimentos nas diversas áreas lecionadas; - À Coordena¸cão de Aperfei¸coamento de Pessoal de N´ıvel Superior - CAPES - pelo apoio financeiro que possibilitou a realiza¸cão do curso;

- Aos meus amigos (Prof. Dr. A.C.S. Costa, Prof. Ms. Eduardo, Prof. Dra. Neila Cu-nha, Júlio Barbosa, Raony Justo, Thales Nilton, Allana, Luiz B.O., Maxsuel (Macasuel), Henrique “Nêgo”, Madal, Allan, Igor, Erich e Calebe Feitosa, Bruno “Cachorrão”, Nayron Almeida, Sávio Henrique, Bruna Silva, Luzi, Haila Chagas e Halex, Nayara Abreu, Kaio Sosa, Gabriel Verlangieri, Mabel, Jose, Jaqueline, Hugo, Luciano, Vera e Anna Chaves, Jacira e Igor Milhoran¸ca) que tiveram participa¸cão importante em diversas fases da minha vida;

(8)

(9)

(10)

(11)

Combina¸cão de proje¸cões de volatilidade baseadas em medidas de risco para dados em alta frequência

RESUMO

Opera¸cões em alta frequência demonstraram crescimento nos últimos anos; em decorrên-cia disso, surgiu a necessidade de estudar o mercado de a¸cões brasileiro no contexto dos dados em alta frequência. Os estimadores da volatilidade dos pre¸cos de a¸cões utilizando dados de negocia¸cões em alta frequência são os principais objetos de estudo. Conforme Aldridge (2010) e Vuorenmaa (2013), o HFT foi definido como a rápida realoca¸cão de capital feita de modo que as transa¸cões possam ocorrer em milésimos de segundos por uso de algoritmos complexos que gerenciam envio de ordens, analisam dados e tomam as me-lhores decisões. A principal fonte de informa¸cões para análise do HFT são os dadostick by tick, conhecidos como dados em alta frequência. Uma métrica oriunda da análise de dados em alta frequência e utilizada para gestão de riscos é a Volatilidade Percebida. Conforme Andersen et al. (2003), Pong et al. (2004), Koopman et al. (2005) e Corsi (2009) há um consenso na área de finan¸cas de que as proje¸cões da volatilidade utilizando essa métrica de risco são mais eficientes de que a estimativa da volatilidade por meio de modelos GARCH. Na gestão financeira, a proje¸cão da volatilidade é uma ferramenta fundamental para pro-visionar reservas para poss´ıveis perdas; devido à existência de vários métodos de proje¸cão da volatilidade e em decorrência disto torna-se necessário selecionar um modelo ou combi-nar diversas proje¸cões. O principal desafio para combicombi-nar proje¸cões é a escolha dos pesos: as diversas pesquisas da área têm foco no desenvolvimento de métodos para escolhê-los visando minimizar os erros de previsão. A literatura existente carece, no entanto, de uma proposi¸cão de método que considere o problema de eventual proje¸cão de volatilidade abaixo do esperado. Buscando preencher essa lacuna, o objetivo principal desta tese é propor uma combina¸cão dos estimadores da volatilidade dos pre¸cos de a¸cões utilizando dados de negocia¸cões em alta frequência para o mercado brasileiro. Como principal ponto de inova¸cão, propõe-se de forma inédita a utiliza¸cão da fun¸cão baseada noLower Partial Moment (LPM) para estimativa dos pesos para combina¸cão das proje¸cões. Ainda que a métrica LPM seja bastante conhecida na literatura, sua utiliza¸cão para combina¸cão de proje¸cões ainda não foi analisada. Este trabalho apresenta contribui¸cões ao estudo de combina¸cões de proje¸cões realizadas pelos modelos HAR, MIDAS, ARFIMA, Nearest Neighbor, além de propor dois novos métodos de combina¸cão – denominados por LPMFE (Lower Partial Moment Forecast Error) e DLPMFE (Discounted LPMFE). Os métodos demonstraram resultados promissores pretendem casos cuja pretensão seja evitar perdas acima do esperado e evitar provisionamento excessivo do ponto de vista or¸camentário.

(12)

(13)

Volatility forecast combination using risk measures based on high frequency data

ABSTRACT

The High Frequency Trading (HFT) has grown significantly in the last years, in this way, this raises the need for research of the high frequency data on the Brazilian stock market. The volatility estimators of the asset prices using high frequency data are the main objects of study. According to Aldridge (2010) and Vuorenmaa (2013), the HFT was defined as the fast reallocation of trading capital that the negotiations may occur on milliseconds by complex algorithms scheduled for optimize the process of sending orders, data analysis and to make the best decisions of buy or sell. The principal information source for HFT analysis is the tick by tick data, called as high frequency data. The Realized Volati-lity is a risk measure from the high frequency data analysis, this metric is used for risk management. According to Andersen et al. (2003), Pong et al. (2004), Koopman et al.

(2005) and Corsi (2009) there is a consensus in the finance field that the volatility forecast using this risk measure produce better results than estimating the volatility by GARCH models. The volatility forecasting is a key issue in the financial management to provision capital resources to possible losses. However, because there are several volatility forecast methods, this raises the need to choice a specific model or combine the projections. The main challenge to combine forecasts is the choice of the weight, with the aim of minimi-zing the forecast errors, several research in the field have been focusing on development of methods to choice the weight. However, it is missing in the literature the proposition of a method which consider the minimization of the risk of an inefficient forecast for the losses protection. Aiming to fill the gap, the main goal of the thesis is to propose a combination of the asset prices volatility forecasts using high frequency data for Brazilian stock mar-ket. As the main focus of innovation, the thesis proposes, in an unprecedented way, the use of the function based on the Lower Partial Moment (LPM) to estimate the weights for the combination of volatility forecasts. Although the LPM measure is well known in the literature, the use of this metric for forecast combination has not been yet studied. The thesis contributes to the literature when studying the forecasts combination made by the models HAR, MIDAS, ARFIMA and Nearest Neighbor. The thesis also contributes when proposing two new methods of combinations, these methodologies are referred to as LPMFE (Lower Partial Moment Forecast Error) and DLPMFE (Discounted LPMFE). The methods have shown promising results when it is intended to avoid losses above the expected it is not intended to cause provisioning excess in the budget.

(14)

(15)

1 Introdu¸c˜ao 9

1.1 Problemas de pesquisa . . . 12

1.1.1 Problemas espec´ıficos . . . 16

1.2 Objetivos . . . 17

1.3 Justificativas da tese . . . 18

1.4 Contribui¸c˜oes . . . 22

2 Referencial Te´orico 24 2.1 Defini¸c˜oes sobre o Livro de Ofertas (LOB) . . . 24

2.1.1 Defini¸c˜ao do espa¸co probabil´ıstico . . . 27

2.1.2 Funcionamento do Livro de Ofertas . . . 29

2.2 Algoritmos para trades de alta frequˆencia . . . 32

2.2.1 Escolha do tempo e rotinas de entradas e sa´ıdas de negocia¸c˜ao . . . 34

2.2.2 Estrat´egias de negocia¸c˜ao . . . 37

2.2.3 Gerenciamento dos riscos e avalia¸c˜ao das rotinas . . . 39

2.3 Medidas de volatilidade para dados em alta frequˆencia . . . 40

2.3.1 Processo de difus˜ao dos pre¸cos negociados em alta frequˆencia . . . . 42

2.3.2 Saltos . . . 43

2.3.3 Ru´ıdos de microestrutura . . . 44

2.3.4 Evolu¸c˜ao dos estimadores da volatilidade para dados de HFT . . . . 45

2.4 Proje¸c˜ao da volatilidade . . . 53

2.4.1 Modelos GARCH e Volatilidade Condicional . . . 54

2.5 Proje¸c˜ao da volatilidade com dados em alta frequˆencia . . . 56

2.5.1 Modelo HAR-RV . . . 56

2.5.2 Modelo MIDAS-RV . . . 59

2.5.3 Modelo ARFIMA . . . 61

2.5.4 M´etodo Nearest Neighbor (NN) . . . 62

2.6 Combina¸c˜ao de proje¸c˜oes . . . 67

2.6.1 Combina¸c˜ao com Momento Parcial Inferior . . . 74

3 Metodologia 81 3.1 Obten¸c˜ao das s´eries de Volatilidade Percebida . . . 82

3.2 Estima¸c˜ao dos modelos . . . 88

3.3 Combina¸c˜ao das proje¸c˜oes . . . 92

3.4 Avalia¸c˜ao de Performance . . . 94

(16)

4.2 Estima¸c˜ao das s´eries de Volatilidade Percebida (RV) . . . 100

4.3 Análise dos métodos de proje¸cão . . . 106

4.3.1 An´alises modelo HAR . . . 106

4.3.2 An´alises modelo MIDAS . . . 108

4.3.3 An´alises modelo ARFIMA . . . 110

4.3.4 An´alises m´etodo Nearest Neighbor . . . 111

4.4 Combina¸c˜ao das proje¸c˜oes . . . 112

4.4.1 Pesos das combina¸c˜oes . . . 114

4.5 Avalia¸c˜ao de desempenho das proje¸c˜oes . . . 119

4.5.1 Desempenho para a medida rCov . . . 119

4.5.2 Desempenho para a medida rOWCov . . . 136

4.5.3 Desempenho para a medida medRV . . . 152

4.5.4 Desempenho para a medida minRV . . . 168

4.5.5 Desempenho para a medida rRTSCov . . . 184

4.6 S´ıntese dos principais resultados da tese . . . 200

5 Considera¸c˜oes Finais 205 5.1 Resultados finais . . . 208

5.2 Perspectivas para trabalhos futuros . . . 210

6 Referências 215 Apêndice A 227 Prova viés ru´ıdo de microestrutura . . . 227

Apˆendice B 228 Gr´aficos dos comportamentos dos pre¸cos . . . 228

(17)

Lista de Quadros

1 Exemplo de envio de ordem limitada . . . 30

2 Exemplo de envio de ordem limitada com altera¸c˜ao em b(i) . . . 30

3 Exemplo execu¸c˜ao de ordem a mercado em b(i) . . . 31

4 Exemplo execu¸c˜ao de ordem a mercado em a(i) . . . 31

5 Exemplo de algoritmos de negocia¸c˜ao . . . 36

6 Resumo dos estimadores . . . 52

7 Resumo dos modelos . . . 66

8 Estudos combina¸c˜ao de proje¸c˜oes . . . 73

9 Modelos e combina¸c˜oes . . . 93

(18)

Lista de Tabelas

1 Exemplo de s´erie de negocia¸c˜ao . . . 87

2 An´alises Descritivas . . . 102

3 Estima¸c˜oes modelo HAR . . . 107

4 Estima¸c˜oes modelo MIDAS . . . 109

5 Estima¸c˜oes modelo ARFIMA . . . 110

6 An´alises modelo Nearest Neighbor . . . 113

7 Análise proje¸cões métodos NN . . . 113

8 Pesos das combina¸c˜oes 2 a 2 - PETR4 . . . 116

11 RMSE rCov combina¸c˜oes 2 a 2 - PETR4 . . . 122

12 RMSE rCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 123

13 RMSE rCov combina¸c˜oes 2 a 2 - VALE5 . . . 124

14 RMSE rCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 125

15 RMSE rCov combina¸c˜oes 2 a 2 - ITUB4 . . . 126

16 RMSE rCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 127

17 LP M1 rCov combina¸c˜oes 2 a 2 - PETR4 . . . 130

18 LP M1 rCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 131

19 LP M1 rCov combina¸c˜oes 2 a 2 - VALE5 . . . 132

20 LP M1 rCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 133

21 LP M1 rCov combina¸c˜oes 2 a 2 - ITUB4 . . . 134

22 LP M1 rCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 135

23 RMSE rOWCov combina¸c˜oes 2 a 2 - PETR4 . . . 138

24 RMSE rOWCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 139

25 RMSE rOWCov combina¸c˜oes 2 a 2 - VALE5 . . . 140

26 RMSE rOWCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 141

27 RMSE rOWCov combina¸c˜oes 2 a 2 - ITUB4 . . . 142

28 RMSE rOWCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 143

29 LP M1 rOWCov combina¸c˜oes 2 a 2 - PETR4 . . . 146

30 LP M1 rOWCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 147

31 LP M1 rOWCov combina¸c˜oes 2 a 2 - VALE5 . . . 148

32 LP M1 rOWCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 149

33 LP M1 rOWCov combina¸c˜oes 2 a 2 - ITUB4 . . . 150

34 LP M1 rOWCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 151

35 RMSE medRV combina¸c˜oes 2 a 2 - PETR4 . . . 154

36 RMSE medRV combina¸c˜oes 3 a 3 e todas - PETR4 . . . 155

(19)

38 RMSE medRV combina¸c˜oes 3 a 3 e todas - VALE5 . . . 157

39 RMSE medRV combina¸c˜oes 2 a 2 - ITUB4 . . . 158

40 RMSE medRV combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 159

41 LP M1 medRV combina¸c˜oes 2 a 2 - PETR4 . . . 162

42 LP M1 medRV combina¸c˜oes 3 a 3 e todas - PETR4 . . . 163

43 LP M1 medRV combina¸c˜oes 2 a 2 - VALE5 . . . 164

44 LP M1 medRV combina¸c˜oes 3 a 3 e todas - VALE5 . . . 165

45 LP M1 medRV combina¸c˜oes 2 a 2 - ITUB4 . . . 166

46 LP M1 medRV combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 167

47 RMSE minRV combina¸c˜oes 2 a 2 - PETR4 . . . 170

48 RMSE minRV combina¸c˜oes 3 a 3 e todas - PETR4 . . . 171

49 RMSE minRV combina¸c˜oes 2 a 2 - VALE5 . . . 172

50 RMSE minRV combina¸c˜oes 3 a 3 e todas - VALE5 . . . 173

51 RMSE minRV combina¸c˜oes 2 a 2 - ITUB4 . . . 174

52 RMSE minRV combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 175

53 LP M1 minRV combina¸c˜oes 2 a 2 - PETR4 . . . 178

54 LP M1 minRV combina¸c˜oes 3 a 3 e todas - PETR4 . . . 179

55 LP M1 minRV combina¸c˜oes 2 a 2 - VALE5 . . . 180

56 LP M1 minRV combina¸c˜oes 3 a 3 e todas - VALE5 . . . 181

57 LP M1 minRV combina¸c˜oes 2 a 2 - ITUB4 . . . 182

58 LP M1 minRV combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 183

59 RMSE rRTSCov combina¸c˜oes 2 a 2 - PETR4 . . . 186

60 RMSE rRTSCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 187

61 RMSE rRTSCov combina¸c˜oes 2 a 2 - VALE5 . . . 188

62 RMSE rRTSCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 189

63 RMSE rRTSCov combina¸c˜oes 2 a 2 - ITUB4 . . . 190

64 RMSE rRTSCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 191

65 LP M1 rRTSCov combina¸c˜oes 2 a 2 - PETR4 . . . 194

66 LP M1 rRTSCov combina¸c˜oes 3 a 3 e todas - PETR4 . . . 195

67 LP M1 rRTSCov combina¸c˜oes 2 a 2 - VALE5 . . . 196

68 LP M1 rRTSCov combina¸c˜oes 3 a 3 e todas - VALE5 . . . 197

69 LP M1 rRTSCov combina¸c˜oes 2 a 2 - ITUB4 . . . 198

70 LP M1 rRTSCov combina¸c˜oes 3 a 3 e todas - ITUB4 . . . 199

71 Pesos das combina¸c˜oes 2 a 2 medida rCov - PETR4 . . . 232

72 Pesos das combina¸c˜oes 2 a 2 medida rOWCov - PETR4 . . . 233

73 Pesos das combina¸c˜oes 2 a 2 medida medRV - PETR4 . . . 234

74 Pesos das combina¸c˜oes 2 a 2 medida minRV - PETR4 . . . 235

(20)

80 Pesos das combina¸c˜oes 4 a 4 medida rOWCov - PETR4 . . . 241

83 Pesos das combina¸c˜oes 2 a 2 medida rCov - VALE5 . . . 244

84 Pesos das combina¸c˜oes 2 a 2 medida rOWCov - VALE5 . . . 245

85 Pesos das combina¸c˜oes 2 a 2 medida medRV - VALE5 . . . 246

86 Pesos das combina¸c˜oes 2 a 2 medida minRV - VALE5 . . . 247

87 Pesos das combina¸c˜oes 2 a 2 medida rRTSCov - VALE5 . . . 248

98 Pesos das combina¸c˜oes 2 a 2 medida rCov - ITUB4 . . . 259

99 Pesos das combina¸c˜oes 2 a 2 medida rOWCov - ITUB4 . . . 260

100 Pesos das combina¸c˜oes 2 a 2 medida medRV - ITUB4 . . . 261

101 Pesos das combina¸c˜oes 2 a 2 medida minRV - ITUB4 . . . 262

102 Pesos das combina¸c˜oes 2 a 2 medida rRTSCov - ITUB4 . . . 263

106 Pesos das combina¸c˜oes 3 a 3 medida minRV - ITUB4 . . . 267

107 Pesos das combina¸c˜oes 3 a 3 medida rRTSCov - ITUB4 . . . 268

111 Pesos das combina¸c˜oes 4 a 4 medida minrv - ITUB4 . . . 272

(21)

Lista de Figuras

1 Exemplo Livro de Ofertas . . . 26

2 Gr´afico de profundidade do L(i) . . . 27

3 Estrutura de um sistema de negocia¸c˜ao . . . 33

4 Desenho da pesquisa . . . 82

5 Metodologia Hold-Out . . . 88

6 Metodologia kNN . . . 90

7 Combina¸cão e avalia¸cão das proje¸cões . . . 92

8 Exemplo Diferen¸ca RMSE e LP M1. . . 95

9 Comportamento pre¸cos e quantidades: caso alta PETR4 . . . 98

10 Comportamento pre¸cos e quantidades: caso baixa PETR4 . . . 99

11 S´eries Volatilidade Percebida PETR4 . . . 103

12 S´eries Volatilidade Percebida VALE5 . . . 104

13 S´eries Volatilidade Percebida ITUB4 . . . 105

14 Proje¸c˜oes por meio das combina¸c˜oes para PETR4, VALE5 e ITUB4. . . 204

15 Comportamento pre¸cos e quantidades: caso alta VALE5 . . . 228

16 Comportamento pre¸cos e quantidades: caso baixa VALE5 . . . 229

17 Comportamento pre¸cos e quantidades: caso alta ITUB4 . . . 230

(22)

(23)

1 Introdu¸c˜

ao

Conforme Portnoy (2011), estratégias de High Frequency Trading (HFT) utilizam com-putadores para a aplica¸cão de algoritmos complexos criados visando detectar diferentes oportunidades nas diversas bolsas de valores. Estes buscam antecipar a dire¸cão seguinte na qual determinado ativo financeiro seguirá em uma dada fra¸cão de segundo em meio às condi¸cões de mercado e análises estat´ısticas do desempenho passado do ativo da empresa.

As opera¸cões em alta frequência cresceram significativamente nos E.U.A. Conforme Al-dridge (2013), estudos indicam que já representam em média 25% de toda atividade de negocia¸cões no mercado americanoe são transacionados, em sua maioria, por contratos derivativos de mini-futuros. Em exemplo apresentado por Aldridge (2013), em uma aná-lise das negocia¸cões de um ativo de alta liquidez da NYSE (New York Stock Exchange) os

high-frequency traderstiveram parcela de 20% em todas as negocia¸c˜oes di´arias deste ativo.

Quanto aos retornos, alguns fundos HFT como o Medallion Fund e o Renaissance apre-sentaram, por exemplo, rendimentos anuais médios de 35% (entre 2000 e 2010) para o primeiro e supera¸cão do S&P500 em meio à crise de 2008 com rendimentos em torno de 4% a 6% para o segundo.

Conforme apresenta Aldridge (2013), o HFT é uma das atividades de maior sucesso na área financeira, apresentando alta rentabilidade e alto grau de expansão na indústria. De acordo com Pereira (2014), as maiores empresas de HFT são Millennium, DE Shaw, Worldquant e Renaissance Technologies.

Quanto aos fundos, os principais são de investimentos proprietários como ATD, CISCO, Citadel, Getco, Madison Tyler, Tradebot, All Options, Flow Traders, IMC e Optiver. As mesas de negocia¸cões dos principais bancos também utilizam HFT, como é o caso de JP Morgan, Goldman Sachs, Morgan Stanley, BNP Paribas e Société Generale.

Aldridge (2010) ainda comenta que 50% das posi¸cões abertas para emprego na área de finan¸cas envolviam conhecimento em HFT, com seu auge durante a crise de 2008. Com dados atualizados, Aldridge (2010) apresenta o exemplo do dia 27 de Novembro de 2012, em que a página de classificados de emprego doWall Street Journal mostrava, em todos os anúncios, vagas de emprego que pediam conhecimentos em HFT.

(24)

para realizar negocia¸c˜oes completamente automatizadas no mercado de a¸c˜oes americano.

Quanto ao Brasil, as opera¸cões tornaram-se completamente automatizadas somente em 2005, quando o pregão viva-voz foi encerrado; dessa forma, o volume de opera¸cões em alta frequência ainda é modesto. Segundo relatório da gestora Trapezus (2011), estima-se que as primeiras estratégias quantitativas no Brasil iniciaram entre 2005 e 2006; em 2011 o volume gerido representava somente 1% da indústria de fundos brasileira.

Na busca pelo desenvolvimento mais ágil desse mercado,a CVM (Comissão de Valores Mobiliários) aprovou diversas medidas, conforme apresenta Portugal (2010). Como exem-plo, pode ser citada a aprova¸cão do uso de quatro modalidades de acesso direto ao mercado no segmento Bovespa.

No caso acima, os investidores podem acessar o mercado da forma tradicional (rotea-mento de ofertas por meio da infraestrutura tecnológica da corretora), via provedor (o cliente conecta-se diretamente à empresa provedora de DMA), via conexão direta (as ofertas são enviadas via interliga¸cão direta do cliente com a Bolsa) e via co-location (as ordens são geradas por softwares Automated Trading System - ATS instalados em servi-dores hospedados no centro de processamento de dados da Bovespa).

Apesar do esfor¸co da regula¸cão brasileira no incentivo às opera¸cões HFT , o ritmo ainda é lento em compara¸cão ao dos E.U.A.. Kupfer (2011) observa que as opera¸cões têm ganhado ritmo, sendo que no final de 2011 estimava-se um giro financeiro de cerca de 20%. Setti (2012) cita que naquele ano as opera¸cões representavam 10% das movimenta¸cões.

Yazbek (2012) também cita que as opera¸cões de HFT no Brasil representavam 10%. Pereira (2014) discorre acerca de um crescimento alcan¸cando aproximadamente 13% no segmento de a¸cões e 9% em derivativos. Em Yokoi (2014) demonstra-se que as opera¸cões em alta frequência correspondem a cerca de 15% do volume da BM&F.

Conforme Yazbek (2012), em outros pa´ıses como E.U.A. e Japão as opera¸cões consis-tiam de uma fatia do mercado de 70% e 40%, respectivamente. Aldridge (2013) apresenta mais detalhes, demonstrando que as movimenta¸cões por meio de HFT representavam em torno de 25%, com picos de entre 60% e 70% de negocia¸cões no mercado americano. Os principais ativos negociados foram os mini-contratos de S&P 500.

(25)

maiores investimentos em infraestrutura tecnol´ogica e m˜ao de obra mais qualificada.

Segundo Mazzoni (2012) o momento é realmente prop´ıcio para o crescimento das opera-¸cões de alta frequência. Ao entrevistar um executivo da área, recebeu respostas altamente otimistas: “The Brazilian market is in excellent position for growth and our goal is to fo-cus on Brazil”. Os empreendedores percebem o Brasil em um estágio semelhante ao dos E.U.A. antes do rápido crescimento das opera¸cões HFT.

São muitas as perguntas a responder acerca do HFT. O órgão regulador do mercado de capitais americano, a SEC (Securities and Exchange Commission), apresentou um do-cumento que levantou em torno de 215 questões a respeito do funcionamento e regula¸cão da estrutura do mercado financeiro norte-americano na presen¸ca de opera¸cões de alta frequência (SEC, 2010). Algumas delas são apresentadas a seguir:

• Has the current market structure become so dispersed and complex that only the largest institutions can afford to deploy their own highly sophisticated trading tools?

• What are useful metrics for assessing the performance of the current market struc-ture?

• What are the most frequently used strategies?

• What are the key features of each strategy?

Mediante a importância e o crescente avan¸co do tema, diversas questões são levantadas por operadores, analistas e gestores. Deste modo, Kupfer (2011) fomentou uma pergunta pertinente em rela¸cão ao trabalho dos operadores de alta frequência. Dado que muitos possuem opiniões sobre a fun¸cão destes agentes, “quantos realmente entendem como eles trabalham?”.

Aldridge (2010) apresenta o processo de desenvolvimento de modelos para negocia¸cão em alta frequência, a principal fonte de informa¸cões são dados históricos (tick by tick, profundidade do mercado - (market depth) e dados em tempo real). Estes dados são vi-sualizados em ferramentas como times and trades e o livro de ofertas (Limit Order Book - LOB).

A ferramenta times and trades possibilita a observa¸c˜ao dos dados tick by tick, autores como Biaiset al. (1995) denominam essas informa¸c˜oes como order flow. O LOB possibi-lita que se observe a profundidade do mercado.

(26)

econométrica. Conforme apresentam Gould et al. (2013), não existe um consenso sobre a melhor maneira de fazê-lo; no caso da literatura econômica os modelos são focados na descri¸cão do comportamento individual dos traders.

No caso da literatura da f´ısica, o fluxo de ordens são tratados como aleatórios e os modelos descritos exclusivamente por estat´ıstica mecânica. O principal empecilho na cria¸cão de um consenso torna-se portanto a necessidade de impor suposi¸cões nos modelos propostos em ambas literaturas, sendo que nos estudos emp´ıricos as suposi¸cões utilizadas foram tes-tadas, porém não corroboradas.

Gould et al. (2013) também apresentam diversos problemas de pesquisa na área que ainda precisam de explora¸cão. O primeiro deles é a compreensão de poss´ıveis padrões es-tat´ısticos a partir das observa¸cões do LOB etimes and trades; conforme os autores, ainda não é claro o entendimento destes padrões em diferentes mercados e como podem surgir levando em considera¸cão as diversas a¸cões e estratégias dos vários agentes heterogêneos.

Os problemas de pesquisa relacionados aos estudos a respeito da volatilidade passam pela compreensão de como tais estimativas podem ser modeladas de forma a incorporar informa¸cões de todo o estado do LOB. Compreender por que per´ıodos de alta atividade deveriam ser agrupados, analisar a influência do tamanho das ordens na volatilidade, levando sempre em considera¸cão que não há uma única estimativa de volatilidade que considere todos os estados.

Outros problemas a serem explorados tratam de amostragem, dado que o comportamento da série temporal (ticks) depende significativamente da forma como tal amostragem é realizada e como a série é organizada. Aldridge (2010) e Gould et al. (2013) afirmam que as estimativas podem variar significativamente a partir de como a escala de tempo é organizada.

A ordena¸cão pode ser por espa¸cos regulares (5 minutos ou 5 segundos, por exemplo) ou espa¸cos irregulares, como evento por evento (de acordo com as chegadas das ordens) ou trade by trade (cada negocia¸cão realizada é observada e utilizada nas estimativas). Diante disso, também é necessário entender o comportamento de estimadores em rela¸cão à organiza¸cão dosticks.

1.1 Problemas de pesquisa

(27)

decisões. Estes conceitos são utilizados em análises de Big Data, nas quais a decisão pre-cisa ser feita praticamente em tempo real após a realiza¸cão de milhões de cálculos para a obten¸cão das estat´ısticas de análise.

Por meio da análise de Big Data, a área financeira pode utilizar ferramentas eficientes para planejamento, controle e realiza¸cão de proje¸cões. A gestão dos riscos tornou-se mais eficiente e as decisões estão baseadas em análises mais precisas; uma das aplica¸cões é a estima¸cão de medidas de risco no ambiente de negócios em alta frequência.

Conforme apresenta Zivot (2005), o uso dos dados oriundos de negocia¸cões em alta frequência cresceu significativamente nas pesquisas da área financeira. Um dos moti-vos é o horizonte de decisão dos algoritmos cada vez menor. Além disso, esses dados estão relacionados à maior precisão das estimativas de volatilidades.

Apesar da crescente ado¸cão da análise de dados em alta frequência, Yan e Zivot (2003) e Boudt et al. (2013) demonstram uma série de desafios para seu gerenciamento e proces-samento. Conforme os autores, parte dos problemas está relacionada às próprias caracte-r´ısticas das séries.

Boudt et al. (2013) citam, por exemplo, um eventual bottleneck computacional devido á grande quantidade de observa¸cões a serem processadas e a demanda dos modelos pela estimativa de parâmetros em séries com espa¸co de tempo irregular, como os dadostick by tick.

Yan e Zivot (2003) apresentam uma lista de caracter´ısticas especiais relacionadas aos dados de negocia¸cões em alta frequência. A primeira delas é o número de observa¸cões que um banco de dados pode exibir; conforme o autor, o número médio diário de negoci-a¸cões na época da pesquisa excedia o valor de 20.000 no mercado à vista de dólar/euro (USD/EUR).

A segunda é a dificuldade para tratamento destes dados, procedimento necessário para corre¸cão de pre¸cos e/ou quantidades gravados erroneamente, sequências desordenadas dos tempos de negocia¸cão e lacunas nos dados causadas por interrup¸cões no sinal de internet. Uma vez que o número de negocia¸cões é muito alto, realizar esse tipo de procedimento torna-se um desafio relevante ao HFT.

(28)

conhecidos na literatura como modelos GARCH (Generalized Autoregressive Conditional Heteroskedasticity) e Volatilidade Estoc´astica que dados possuindo sempre o mesmo es-pa¸co de tempo entre as negocia¸c˜oes.

O quarto desafio apresentado por Yan e Zivot (2003) é o padrão periódico de atividade no mercado, uma vez que em horários como abertura e fechamento as atividades de ne-gocia¸cões são maiores de que as realizadas, por exemplo, no horário de almo¸co.

Estas caracter´ısticas produzem séries com movimentos de pre¸cos discretos, negocia¸cões não sincronizadas e desequil´ıbrios entre pre¸cos de compra e venda. Diante disto, os pro-cedimentos de estima¸cão dos parâmetros de modelos econométricos tornaram-se mais complicados devido aos resultados distorcidos provenientes das medidas estat´ısticas usu-almente utilizadas.

A partir desse contexto surge o desafio das capacidades computacionais terem agilizado o processo de tomada de decis˜oes e a necessidade das medidas estat´ısticas terem que acompanhar esta velocidade enquanto apresentam resultados confi´aveis diante das carac-ter´ısticas dos dados supracitados.

No que tange a atividade de negociar em alta frequência, a gestão dos riscos possui papel fundamental em rela¸cão ao controle das perdas, dado que o algoritmo pode apresentar retornos excelentes em um dia e em seguida revertê-los em perdas em um único momento.

As medidas para gerenciamento dos riscos também são variadas: Silaghi e Robu (2005) e Alvim (2009) utilizaram o desvio padrão (D.P.) nas análises dos sistemas de negocia¸cão propostos em seus trabalhos. Alvim (2013) utilizou as medidas Valor em Risco e Valor em Risco Condicional. Boyarshinov (2005) além de utilizar o desvio padrão, utilizou também a métrica do Arrasto MáximoMaximum Drawdown.

O problema para estimativa das medidas acima está relacionado aos modelos reconhecidos na academia (modelos de heteroscedasticidade condicional e volatilidade estocástica) não serem eficientes, conforme apresenta Andersen e Bollerslev (1998), Andersenet al.(2001), Andersen et al.(2003) e Bauwens et al.(2012).

(29)

Bauwens et al. (2012) e Wink-Junior e Pereira (2011) complementam o racioc´ınio acima por postularem que a estimativa da volatilidade por meio de dados diários é viesada. Conforme as caracter´ısticas das séries de pre¸cos demonstradas em Yan e Zivot (2003), os dados produzem diversos ru´ıdos nas estima¸cões, uma vez que as medidas de volatilidade não são imunes a tais caracter´ısticas.

Diante dos problemas citados, pesquisadores buscaram estudar alternativas para esti-mativa da volatilidade para dados em alta frequência. Conforme Bauwens et al. (2012) e Wink-Junior e Pereira (2011), o artigo de Andersen e Bollerslev (1998) foi o primeiro trabalho que apresentou um estimador que utilizasse dados passados intradiários, o que o tornava mais preciso de que os retornos quadráticos diários.

O estimador foi denominado de Variˆancia Percebida (RVt) – no caso de s´eries

multivari-adas, Covariância Percebida. O presente trabalho trata das séries univariadas na maioria dos estimadores, entretanto, a nomenclatura contendo o sufixo “Cov” será mantida para alinhar a abrevia¸cão utilizada nos trabalhos internacionais.

O estimador RVt possui o objetivo de somar os retornos quadr´aticos intradi´arios para

apresentar a volatilidade diária; conforme demonstram Andersen e Bollerslev (1998), os dados intradiários fornecem estimativas mais precisas da volatilidade, sendo poss´ıvel ob-ter por meio deles medidas de risco diárias “livres de erros” (error free). As propriedades deste estimador são apresentadas em Andersenet al. (2001). O estimador da Volatilidade Percebida e a evolu¸cão de tais medidas focadas em dados em alta frequência são pontos de discussão neste trabalho.

O gerenciamento das negocia¸cões de alta frequência e a gestão dos riscos possui papel fundamental em rela¸cão ao controle das perdas, sendo que o respectivo controle é reali-zado por regras de entrada e sa´ıda que os algoritmos precisam obedecer. Torna-se um problema selecionar qual o estimador a ser implementado no algoritmo para realizar as opera¸cões, uma vez que existem muitos deles.

Além da existência de diversos estimadores para a Volatilidade Percebida, um gestor também necessita projetar as poss´ıveis perdas diante de uma opera¸cão. Para provisionar reservas para tais ocasiões, o gestor precisa projetar a Volatilidade Percebida considerando os próximoshdias. Diante disto, torna-se necessário a sele¸cão de um método de proje¸cão.

(30)

determin´ısticos n˜ao lineares.

Em rela¸cão ao grupo de métodos baseados em pressupostos e suposi¸cões da teoria econo-métrica, os modelosHeterogeneous Autoregressive Model of Realized Volatility (HAR-RV),

Mixed Data Sampling (MIDAS-RV) eAutoregressive Fractionally Integrated Moving Ave-rage (ARFIMA) s˜ao exemplos amplamente citados na literatura.

Em rela¸cão ao segundo grupo, baseado em modelos determin´ısticos não lineares, um exemplo é o método Nearest Neighbor, focado em estudar séries que apresentam movi-mentos caóticos. No artigo de Andrada-Felix et al. (2013) há cita¸cão e utiliza¸cão deste método.

A partir do cen´ario acima descrito, realizam-se as perguntas que auxiliaram na formu-la¸c˜ao dos objetivos desta pesquisa.

• Quais estimadores de volatilidade deveriam ser utilizados para escrever as regras de entrada e sa´ıda dos algoritmos de negocia¸c˜ao em alta frequˆencia?

• Utilizar um ´unico estimador que apresente melhor performance resolveria o pro-blema?

• Poderia a combina¸cão das previsões dos vários estimadores em alta frequência da volatilidade ser uma melhor escolha?

1.1.1 Problemas espec´ıficos

O artigo de Andrada-Felix et al. (2013) apresenta novos caminhos para resolu¸cão de tais problemas, os autores compararam a utiliza¸cão de uma única estimativa e a combina¸cão das estimativas. Conforme explicam os autores, poucos estudos foram realizados para investigar as vantagens da combina¸cão de medidas nas séries de pre¸cos de negocia¸cões em alta frequência. Timmermann (2006) apresenta que a combina¸cão de proje¸cões demons-trou sucesso emp´ırico em diversas aplica¸cões econômicas.

O problema geral para combina¸cão de proje¸cões é discutido em Timmermann (2006), os detalhes são apresentados na se¸cão 2.6. O problema espec´ıfico para combina¸cão de proje¸cões de volatilidades é apresentado em Amendola e Storti (2008) e detalhado a se-guir.

SejaRVt, comt= 1, . . . , T, uma s´erie de volatilidades percebidas geradas por um processo

(31)

modelos paraRVt+h, a combina¸c˜ao das volatilidades projetadas ´e apresentada na

expres-s˜ao 1.1.1,

d

RVc_t₊_h =

K X

i=1

˜

wiRVdi,t+h, (1.1.1)

em que, ˜wi s˜ao os pesos para combina¸c˜ao, PKi=1w˜i = 1 e ˜wi ≥0.

Conforme Amendola e Storti (2008), a combina¸cão produz uma proje¸cão não viesada, mesmo existindo um ou mais modelos viesados. A suposi¸cão de não negatividade dos pesos é utilizada para garantir que as volatilidades projetadas sejam sempre positivas.

Diante disto, o problema espec´ıfico ´e apresentado como:

• Quais s˜ao os pesos a serem adotados para projetar a volatilidade?

Na se¸cão 2.6 são apresentados diversos métodos de obten¸cão de pesos. Contudo, conforme Ghysels (2014) ainda não existe um consenso entre os pesquisadores sobre qual peso ótimo deveria ser utilizado.

Além disto, do ponto de vista prático, pouco foi discutido sobre a combina¸cão de proje¸cões de volatilidade que apresentem as menores chances de evidenciar riscos abaixo de algum n´ıvel esperado.

1.2 Objetivos

A partir do delineamento dos problemas e perguntas de pesquisa surge o objetivo geral deste trabalho, qual seja:

• Propor uma combina¸cão dos estimadores da volatilidade dos pre¸cos de a¸cões utili-zando dados de negocia¸cões em alta frequência.

Para possibilitar que o objetivo geral seja alcan¸cado, definiram-se os objetivos espec´ıficos descritos a seguir:

• Propor a constru¸c˜ao das s´eries de volatilidades percebidas por meio dos estimadores mais recentes.

(32)

• Propor a combina¸c˜ao das proje¸c˜oes de volatilidade por meio dos modelos Heteroge-neous Autorregressive Model of Realized Volatility (HAR-RV),Mixed Data Sampling

(MIDAS-RV),Autoregressive Fractionally Integrated Moving Average (ARFIMA) e

Nearest Neighbor (NN).

• Propor um método inovador para obten¸cão dos pesos que considera a minimiza¸cão do risco com foco numa melhor prote¸cão as perdas.

1.3 Justificativas da tese

O estudo de mercados de alta frequência e dos dados proporcionados pelas negocia¸cões é tema relevante na literatura. Conforme Aldridge (2010) existe uma demanda significativa pela busca de informa¸cões sobre o tema, porém pouco material publicado para auxiliar o entendimento dos investidores.

O tema está internacionalmente em evidência, como em pesquisas realizadas pela In-ternational Organization of Securities Commissions (IOSCO, 2012a; IOSCO, 2012b) nelas definiram-se os principais pontos de discussão que deveriam orientar a atua¸cão do órgão em 2013. A IOSCO é a associa¸cão mundial para regula¸cão de valores mobiliários. Entre os pontos a discutir estariam regula¸cão dos negócios de alta frequência, o impacto da tecnologia e a análise das infraestruturas de mercado.

Seabra (2014) apresenta que a área de estudos concernente às negocia¸cões em alta frequên-cia é um tema polêmico no exterior; contudo, ainda é pouco estudado no Brasil. Conforme o autor, apesar dos poucos estudos, espera-se um crescimento da produ¸cão acadêmica a respeito do tema.

Araújo e Montini (2013) apresentam outros motivos para a expectativa de crescimento, como, por exemplo, a maior necessidade das corretoras em aumentar seus portfólios de clientes, situa¸cão que demandará maiores investimentos na área.

Em rela¸cão aos dados, a disponibilidade pode não ser um problema, mas sua gestão requer aten¸cão. Conforme apresenta White (2012), o momento em que vivemos pode ser considerado como a “Era dos Dados”: o autor afirma que as quantidades de dados possuem uma magnitude de em torno de 1,8 zettabytes por pessoa no mundo.

(33)

alta frequência, o controle destas informa¸cões é crucial.

Diante disto, justifica-se o estudo de medidas de volatilidade para dados em alta frequên-cia, uma vez que a apresenta¸cão de novas medidas ou metodologias de estima¸cão pode melhorar o desempenho da gestão dos riscos.

No caso da área de finan¸cas, Zivot (2005) apresenta que o uso dos dados oriundos de negocia¸cões em alta frequência nas pesquisas cresceu significativamente. A principal jus-tificativa está relacionada à melhor precisão das estimativas de volatilidades. Conforme Wink-Junior e Pereira (2011), modelos que estimam a volatilidade por meio de dados intradiários estão mais frequentes na literatura.

Conforme afirmam Andersen e Bollerslev (1998) e Andersen et al. (2001), modelos da fam´ılia ARCH e Volatilidade Estocástica demonstram resultados inconsistentes para es-tima¸cão da volatilidade com dados em alta frequência, uma vez que possuem problemas como ru´ıdos de microestrutura, sincroniza¸cão e saltos.

Diante destes problemas, alguns pesquisadores da área utilizam somente um único dado diário – a última negocia¸cão, em medida que descarta preciosos dados intradiários capazes de apresentar padrões pouco estudados na literatura. Problemas como este justificam a necessidade de estudar medidas de volatilidade que fa¸cam uso de pre¸cos de negocia¸cões em alta frequência.

Segundo Cappa e Pereira (2010) e Wink-Junior e Pereira (2011), artigos brasileiros que fa¸cam uso de bases de dados de alta frequência são raros devido a dificuldade de obten¸cão de bases de dados. Diante disto, a realiza¸cão do presente trabalho é justificada por intro-duzir mais informa¸cões acadêmicas à literatura de finan¸cas, utilizando bases de dados em alta frequência com ativos brasileiros.

Diversas medidas que estimam volatilidades por meio de dados em alta frequência foram desenvolvidas com o tempo. Deste modo, torna-se dif´ıcil para o gestor dos algoritmos de negocia¸cão selecionar uma medida de risco espec´ıfica para controlar as perdas de suas opera¸cões.Assim, combinar os resultados dos estimadores pode ser uma alternativa para melhoria da capacidade de gestão.

(34)

(Survey of Professional Forecasters - SPF) e com acertos significativos.

Intenciona-se neste trabalho, portanto, verificar a eficiência ótima na compara¸cão entre a utiliza¸cão de uma medida singular de risco ou a combina¸cão de várias delas no ambiente de dados em alta frequência.

Modelos de proje¸cão da volatilidade utilizando dados em alta frequência são amplamente aceitos na academia como melhores preditores da variância futura, conforme apresentam Boudt et al. (2013). Entre os modelos, os dois mais conhecidos na literatura desta área são Heterogeneous Autoregressive Model of Realized Volatility (HAR-RV) e oMixed Data Sampling (MIDAS-RV). Deste modo, justifica-se a utiliza¸cão de tais modelos nesta tese.

Outro modelo bastante conhecido na área de proje¸cão e citado na revisão de literatura apresentada em Hansen e Lunde (2012) e Andrada-Felix et al. (2013) é o modelo Au-toregressive Fractionally Integrated Moving Average (ARFIMA). Desta forma, torna-se necessária sua inclusão neste trabalho.

O método Nearest Neighbor (NN) é pouco citado na literatura de proje¸cão de dados em alta frequência, porém possui propriedades interessantes: além de não demandar que se assuma alguma fun¸cão particular para os processos de média, variância condicional e inova¸cões, também pode ser utilizado para séries com espa¸camento de tempo irregular, como é o caso da séries em alta frequência.

Combinar as proje¸cões dos modelos citados possui motiva¸cão interessante, dado que os três primeiros modelos são baseados em pressupostos e suposi¸cões da teoria econômica, enquanto o último está baseado em modelos advindos da f´ısica mecânica. Diante disto, combinar o conhecimento de duas áreas relevantes da ciência financeira pode melhorar o desempenho das proje¸cões.

Quanto às combina¸cões, diversas pesquisas da área focaram no desenvolvimento de méto-dos diferenciaméto-dos para escolher os pesos ótimos para minimiza¸cão méto-dos erros de previsão. Conforme apresentam Elliott e Timmermann (2004) a maioria dos resultados teóricos e emp´ıricos é baseada em métodos que assumem fun¸cão de erro simétrica e quadrática, como por exemplo o Erro Médio Quadrático (Mean Squared Error).

(35)

Mediante os resultados de Elliott e Timmermann (2004) e Patton e Timmermann (2007) para as proje¸cões do PIB americano, caso essas condi¸cões não sejam obedecidas, os mé-todos baseados em fun¸cões de erro simétricas e quadráticas não apresentaram resultados satisfatórios. De acordo com os autores, fun¸cões de erro assimétricas que visem obten¸cão de pesos para combina¸cão demonstraram melhor eficácia.

Do ponto de vista prático, Elliott e Timmermann (2004) apresentam que diversas medidas de performance são baseadas em fun¸cões de erro assimétricas. É o caso das proje¸cões de desempenhos financeiros que são geralmente analisadas pela razão de Sharpe (média dos retornos dividida pelo desvio padrão dos retornos).

Como exemplo para gest˜ao de riscos, gestores utilizam o Value at Risk (VaR) ma me-dida de risco assim´etrica (downside risk), conforme apresenta Alexander (2008).

No trabalho de Elliott et al. (2008) os autores afirmam que as combina¸cões que utili-zaram fun¸cão de pesos baseada em fun¸cões de erro assimétricas apresentaram melhores resultados para proje¸cões de infla¸cão, análises de decisões pol´ıticas e comportamento es-tratégico.

Mesmo diante disso, não foram desenvolvidos trabalhos que buscassem selecionar os pesos ótimos para minimiza¸cão do risco de uma previsão ineficiente na prote¸cão contra perdas. Pouco também foi discutido sobre métodos de combina¸cão de proje¸cões da Volatilidade Percebida com objetivo de minimizar o risco de projetar a volatilidade abaixo de deter-minado n´ıvel esperado.

Deste modo, a literatura vigente carece de proposi¸cão de algum método que considere a minimiza¸cão do risco de uma previsão ineficiente para prote¸cão contra perdas. Buscando-se alocar mais peso para as proje¸cões que apreBuscando-sentem as menores chances de evidenciar riscos abaixo de algum n´ıvel esperado.

Para o caso do investidor que precisa se proteger do risco da opera¸cão, deve-se esco-lher a melhor proje¸cão que combine as tarefas de evitar perdas acima do esperado e não causar provisionamento em excesso no ponto de vista or¸camentário. Diante disto, torna-se necessário um método de pondera¸cão que apresente proje¸cão parcimoniosa com as contas do investidor e eficácia na prote¸cão contra riscos.

(36)

e preenchimento desta lacuna na literatura.

O caminho delineado para desenvolvimento de tais métodos de combina¸cão foi a utili-za¸cão de uma fun¸cão baseada no Momento Parcial Inferior (Lower Partial Moment -LPM). Esta é uma medida de risco assimétrica sugerida por Bawa e Lindenberg (1977).

Tal medida é baseada na perspectiva de que um investidor deve possuir preferência por investimentos que apresentem as menores chances de evidenciar retornos abaixo de deter-minado n´ıvel esperado. Apesar de a medida LPM ser bastante conhecida na literatura, sua utiliza¸cão como métrica para combina¸cão de proje¸cão ainda não foi estudada.

1.4 Contribui¸c˜

oes

A necessidade de estudar o mercado de a¸cões brasileiro no contexto dos dados em alta frequência direciona o presente trabalho, cujos principais objetos de estudo são os es-timadores da volatilidade dos pre¸cos de a¸cões utilizando dados de negocia¸cões em alta frequência.

A contribui¸cão deste trabalho incorpora também o levantamento de uma revisão bibli-ográfica a respeito do funcionamento do livro de ofertas, principal ambiente de atua¸cão dos algoritmos de negocia¸cão, conforme apresenta Aldridge (2010).

Outra contribui¸cão é a apresenta¸cão dos estados e espa¸co probabil´ıstico do LOB pro-posta por Cont e Larrard (2013), exibindo exemplos de negocia¸cões. Conforme citam Gould et al. (2013) ainda é necessário estudar modelos que possam incorporar informa-¸cões de todo o estado do LOB.

O presente trabalho também apresenta como contribui¸cão a evolu¸cão dos estimadores da volatilidade para dados em alta frequência. No artigo de McAleer e Medeiros (2008) os autores realizam um levantamento a respeito dos estimadores até o ano de 2006, atua-lizados neste texto até o ano de 2013.

Como contribui¸cão e inova¸cão deste trabalho, destaca-se também a continuidade pro-posta no artigo de Andrada-Felix et al. (2013). Os autores apresentam como poss´ıveis trabalhos futuros a estimativa e combina¸cão de modelos de proje¸cão de volatilidade uti-lizando medidas diferentes da utilizada no trabalho.

(37)

entre o modeloHeterogeneous Autoregressive Model of Realized Volatility (HAR-RV), pro-posto por Corsi (2009) e o modelo Mixed Data Sampling (MIDAS-RV), apresentado por Ghyselset al.(2004) no per´ıodo entre 01/11/2007 a 30/04/2010. Contudo, os autores n˜ao abordaram a alternativa de combina¸c˜ao das estimativas.

No caso do mercado americano, o trabalho de Andrada-Felixet al.(2013) simboliza avan¸co por apresentar e discutir as proje¸c˜oes da volatilidade pelos modelos Autoregressive Frac-tionally Integrated Moving Average (ARFIMA) e Nearest Neighbor (NN) no mercado americano.

Assim como Wink-Junior e Pereira (2011), os autores utilizaram a Variância Percebida para estimar a volatilidade ex post, que faz o papel como dados de entrada para as esti-ma¸cões das proje¸cões.

Diante disso, a contribui¸cão e a inova¸cão em rela¸cão ao artigo publicado por Andrada-Felix et al. (2013) ocorre pela possibilita¸cão de abordagem das medidas analisadas em Wink-Junior e Pereira (2011) no contexto da combina¸cão de proje¸cões em um novo pe-r´ıodo de análise. Além disso, outras medidas para estimar a volatilidade ex post serão utilizadas para realizar as proje¸cões. Diferentemente do trabalho de Andrada-Felix et al.

(2013), neste caso o mercado brasileiro ser´a o foco de an´alise.

A principal contribui¸cão e inova¸cão da presente tese é a proposi¸cão, de forma inédita, da fun¸cão baseada no Momento Parcial Inferior (Lower Partial Moment - LPM) para estimativa dos pesos para combina¸cão das proje¸cões.

(38)

2 Referencial Te´

orico

Para entender os diversos conceitos para atingir os objetivos tra¸cados, torna-se necessário a apresenta¸cão dos principais elementos a serem utilizados neste estudo. Diante disto, serão tratados assuntos relacionados aos seguintes tópicos: Funcionamento do Livro de Ofertas, apresenta¸cão do espa¸co probabil´ıstico do LOB seguindo as defini¸cões de Cont e Larrard (2013) e Gould et al. (2013), modelo genérico para algoritmos de alta frequência e apresenta¸cão das medidas de volatilidade para dados em alta frequência.

2.1 Defini¸c˜

oes sobre o Livro de Ofertas (LOB)

Conforme apresentou Aldridge (2010) a principal fonte de informa¸cões para entendimento dos modelos de negocia¸cão em alta frequência são os dados históricos, sendo que o livro de ofertas é o principal ambiente de atua¸cão destes algoritmos. Diante disto, o ponto inicial para entendimento dos modelos de HFT é o estudo a respeito do LOB.

Como ferramenta para negocia¸c˜ao no mercado financeiro, Glosten (1994) apresenta que o livro de ofertas s˜ao formas efetivas para traders pacientes proverem liquidez paratraders

menos pacientes. Como defini¸cão, Gould et al.(2013) apresenta que o LOB é composto por um grupo de formadores de mercado que centralizam suas ordens de compra e venda através da publica¸cão dos pre¸cos aos quais estão propensos a comprar ou vender pelo ativo transacionado.

Gould et al. (2013) e Cont e Larrard (2013) descrevem formalmente o funcionamento do livro de ofertas. Seja x uma ordem de negocia¸cão enviada a uma plataforma eletrônica, suas caracter´ısticas são apresentadas na expressão 2.1.1:

x= (px, vx, ix), (2.1.1)

em que, ix é o horário de envio da ordem x, px é o pre¸co e |vx| é o tamanho da ordem,

quando vx >0, significar´a uma ordem de venda, quando vx <0, indicar´a uma ordem de

compra. Neste caso, o sinal negativo ou positivo de vx tem fun¸c˜ao somente de indicar a

qualidade da ordem de negocia¸c˜ao (compra ou venda).

(39)

Nos sistemas eletrônicos, quando a ordem x é enviada o algoritmo realiza uma varre-dura nas ordens pendentes para verificar a possibilidade de negócio. Caso o algoritmo encontre alguma correspondência, o negócio ocorre imediatamente. Neste caso, a ordem possui uma nomenclatura particular denominada “ordem a mercado”.

Caso o algoritmo não encontre ordens correspondentes, a ordem x enviada permanece ativa até a mesma ser cancelada ou executada. As ordens ativas possuem nomenclatura particular como “ordens penduradas” ou “ordens limitadas”. Na literatura internacional estas ordens são chamadas de limit orders, como é observado nos trabalhos de Biais et al.(1995), Aldridge (2010), Gould et al. (2013) e Cont e Larrard (2013). Conforme estes autores, o conjunto destas ordens ativas forma o LOB.

O livro de ofertas denominado comoL(i) é o conjunto de todas as ordens penduradas de um ativo no tempo intradiário i. Estas ordens são agrupadas em filas apresentando as ordens ativas de compra e venda em algum pre¸co espec´ıfico. As filas são ordenadas em 2 grupos formados pelas ordens de compra (bid) -B(i) e pelas ordens de venda (ask) -A(i).

A fila B(i) ´e ordenada do maior pre¸co das ordens de compras ativas at´e o menor pre¸co. O maior pre¸co de compra recebe uma nomenclatura especifica, chamado de bid price

-b(i). Formalmente, b(i) ´e definido na express˜ao 2.1.2,

b(i) = max

x∈B(i)px. (2.1.2)

A filaA(i) é ordenada do menor pre¸co das ordens de vendas ativas até o maior pre¸co. O menor pre¸co de venda recebe uma nomenclatura especifica, chamado de ask price - a(i). Formalmente,a(i) é definido na expressão 2.1.3,

a(i) = min

x∈A(i)px. (2.1.3)

Um ponto a ressaltar, principalmente, para iniciantes no entendimento do livro de ofertas é a possibilidade da venda a descoberto, venda de uma a¸cão sem possu´ı-la. Conforme Minozzo (2010) esta prática é possibilitada pelo aluguel de a¸cões; em contratos deste tipo são acordados o prazo e a taxa de aluguel. Entretanto, para negocia¸cões de alta frequência estas restri¸cões não são problemas devido à rápida negocia¸cão.

Na figura 1 é apresentado um exemplo do livro de ofertas - L(i) - da a¸cão PETR4. A expressão 2.1.1 pode ser formulada, por exemplo, ao analisar a linha 2. Seja a ordem

x= 2, a vari´avel p2 = R$39,81, w2 = 1000 a¸c˜oes e i2 = 12:29h. No mercado integral de

(40)

eA(i) a coluna “Venda”; dentro destes grupos pode-se observarb(i) como R$39,82 e a(i) como R$39,90.

Figura 1: Exemplo Livro de Ofertas

FONTE: Adaptado de Enfoque (2014).

Por meio do entendimento das variáveis que formam a estrutura do livro de ofertas, ressaltam-se algumas medidas importantes. Nas expressões 2.1.4 e 2.1.5 são vistas as me-didas de spread de compra e venda (bid-ask spread) - s(i) - e pre¸co médio (mid price)

-m(i) - respectivamente.

Estas medidas proporcionam o quanto o mercado valoriza a certeza e a imediatez as-sociadas `as ordens a mercado contra a incerteza e espera das ordens limitadas. Na Figura 1, por exemplo, observa-se um per´ıodo de desequil´ıbrio no livro de ofertas, dado que o

spread ´e maior que o tamanho do tick de R$0,01. Neste exemplo, o bid-ask spread pode ser medido como s(i) = R$0,08.

s(i) :=a(i)₋b(i), (2.1.4)

m(i) := a(i) +b(i)

2 . (2.1.5)

Outra medida importante para entendimento do LOB é a profundidade (market depth). A profundidade é o tamanho das filas B(i) ou A(i) para algum pre¸co espec´ıfico; a pro-fundidade também é dividida em duas formas: propro-fundidade da compra (expressão 2.1.6) e profundidade da venda (expressão 2.1.7).

A profundidade de compra (bid side depth) ´e a soma de todas as quantidades das or-dens ativas de compra a um pre¸co e tempo espec´ıfico; a profundidade de venda (ask side depth) ´e a soma das quantidades nas ordens limitadas de venda a um pre¸co e tempo espec´ıfico.

nb(p, i) = X

x∈B(i)|px=p

(41)

na(p, i) = X

x∈A(i)|px=p

vx. (2.1.7)

Na figura 2 é exibido o gráfico de profundidade do livro de ofertas. Neste gráfico, observam-se as expressões 2.1.6 e 2.1.7 observam-sendo utilizadas para cada pre¸co num tempo espec´ıfico. A partir deste gráfico se observa as filas de inten¸cões compradoras e vendedoras para a respectiva a¸cão; no lado esquerdo é visto as profundidades de compra e no lado direito as profundidades de venda.

Figura 2: Gr´afico de profundidade do L(i) FONTE: Adaptado de Enfoque (2014).

Outra medida importante para entender o livro de ofertas e analisar os dados em alta frequência é a estima¸cão das taxas de retorno. Para estimar as medidas de volatilidade para dados em alta frequência é, primeiramente, necessário obter os retornos dos ativos analisados. O retorno do pre¸co de compra é apresentado na expressão 2.1.8, o retorno do pre¸co de venda é apresentado na expressão 2.1.9 e o retorno do pre¸co médio é exibido na expressão 2.1.10,

Rb(i1, i2) := [b(i2)−b(i1)]

b(i1) , (2.1.8)

Ra(i1, i2) := [a(i2)−a(i1)]

a(i1) , (2.1.9)

Rm₍_i

1, i2) :=

Ra₍_{i1, i2}_{) +}_Rb₍_{i1, i2}₎

2 . (2.1.10)

2.1.1 Defini¸c˜ao do espa¸co probabil´ıstico

A partir das defini¸cões conceituais a respeito do livro de ofertas, apresenta-se a defini¸cão do espa¸co probabil´ıstico. As variáveis e suposi¸cões exibidas são apresentadas nos artigos de Gould et al. (2013) e Cont e Larrard (2013).

(42)

ale-at´oria Xi pela express˜ao 2.1.11,

Xi := b(i), nbi, nai

, (2.1.11)

em que,nb

i ´e a profundidade para o melhor pre¸co de compra (tamanho da fila dobid price)

ena

i ´e a profundidade para o melhor pre¸co de venda (tamanho da fila do ask price), estas

variáveis são versões simplificadas das expressões 2.1.6 e 2.1.7. Supondo que o valor de

b(i) ´e conhecido, a(i) ´e obtido por b(i) mais o tamanho do tick.

Define-se a express˜ao 2.1.11 como um processo de tempo cont´ınuo com valores no es-tado discreto no espa¸co❩_×◆2_{. Ao observar a figura 1,}_X

i´e a primeira linha da coluna de

Compra. Cont e Larrard (2013) utilizam a expressão 2.1.11 para explicar as ocorrências no livro de ofertas devido aos trabalhos de Biaiset al. (1995) demonstrarem que o principal componente no fluxo de ordens são os melhores pre¸cos de compra e venda, apresentados nas expressões 2.1.6 e 2.1.7.

O processoXi ´e influenciado pela dura¸c˜ao da chegada de ordens de compra, representada

por Ta

i , i ≥ 1 e da dura¸c˜ao da chegada de ordens de venda, representada por Tib, i ≥ 1.

Também é necessário observar a varia¸cão associada ao tamanho da fila de vendedores na i,

representada por Va

i , i≥1 e a varia¸c˜ao associada ao tamanho da fila de compradores nbi,

representada por Vb

i , i≥1.

Segundo Cont e Larrard (2013), o espa¸co probabil´ıstico do L(i) possui as seguintes supo-si¸c˜oes:

Suposi¸cão 1. Não existência de saltos (gaps).

Suposi¸cão 2. O spread de compra e venda - s(i) retorna infinitamente rápido a 1 tick. Suposi¸cão 3. O tamanho da fila nbi ou nai depois de uma varia¸cão no pre¸co (b(i)oua(i))

é tratada como uma variável advinda de uma distribui¸cão f que pertence a ◆2_.

Os Saltos (gaps) no livro de ofertas são varia¸cões maiores que 1tick nospread de compra e venda. Por meio da Suposi¸cão 1, caso o spread de compra e venda (bid-ask spread)

-s(i) aumente, o fluxo de ordens preenche rapidamente o gap e s(i) retorna a 1 tick.

Por exemplo, um salto é observado na Figura 1, em que o spread de compra e venda é de R$0,08. Pela suposi¸cão 2, esta diferen¸ca voltará rapidamente ao tamanho de 1tick, isto é, para R$0,01 em instantes.

O comportamento def ´e exibido comof nb i, nai

que representa a probabilidade de obser-var nb

i, nai

depois de uma alta no pre¸co e como ˜f nb i, nai

(43)

de observar nb i, nai

depois de uma baixa no pre¸co. O hist´orico de eventos nos pre¸cos e quantidades no livro de ofertas ´e representado porFi.

Suposi¸cão 4. o comportamento da expressão 2.1.11 é observado pelas proposi¸cões a se-guir:

• Caso ocorra um cancelamento de ordem na fila de venda no per´ıodo intradi´ario

i=m, observa-se a express˜ao 2.1.12:

Xm= a(m), nbm, nam+Via

1_{_na

m+Via>0}+ b(m) +ι, R b i, Ria

1_{_na

m+Via>0}. (2.1.12)

Nesta proposi¸c˜ao apresentada, caso ocorra um cancelamento na fila de venda, observam-se incrementos de 1 tick no pre¸co de venda.

• Caso ocorra um cancelamento na fila de compra no per´ıodo intradi´ario i = m, observa-se a express˜ao 2.1.13.

Xm = b(m), nbm+Vib, nam

1_{_nb

m+Vib>0}+ (b(m

−ι,R˜b_i,R˜a_i1_{_nb

m−+Vib>0}. (2.1.13)

Nesta proposi¸c˜ao, caso ocorra um cancelamento na fila de compra, observa-se decr´escimo de 1 tick no pre¸co de compra.

Sendo que, Rb

i eRai são sequências de variáveis aleatórias independentes e identicamente

distribu´ıdas (i.i.d.) com distribui¸c˜ao f Rb i, Rai

; estas variáveis foram apresentadas nas expressões 2.1.8 e 2.1.9. As variáveis ˜Rb

i e ˜Rai também são sequências de variáveis

ale-atórias i.i.d. representadas nas expressões 2.1.8 e 2.1.9 com distribui¸cão ˜fR˜b i,Rãi

que representa a probabilidade depois de uma queda no pre¸cob(i).

2.1.2 Funcionamento do Livro de Ofertas

Cont e Larrard (2013) apresentam o livro de ofertas contendo funcionamento básico como um modelo markoviano. Uematsu (2012) apresentou que a propriedade fundamental des-tes modelos é a probabilidade da ocorrência de um determinado evento depender somente da imediata ocorrência anterior, não importando levantar todo o histórico da série.

O trabalho de Uematsu (2012) demonstrou que os dados brasileiros n˜ao possuiram a propriedade markoviana. Como alternativa, citou sobre o processo ser considerado em instantes (ticks), caracterizando um tempo discreto. O trabalho de Cont e Larrard (2013) ´e importante por caracterizar o modelo como um processo de tempo cont´ınuo com valores no estado discreto no espa¸co❩_×◆2_.

Os eventos que podem ocorrer noL(i) s˜ao ilustrados nos Quadros 1, 2, 3 e 4.

(44)

a) Se px ≤ b(i): como exemplo, observa-se a Quadro 1. No Quadro 1a o valor de b(i)

´e 18,00; neste momento foi enviada uma ordem x com px = 17,99. Diante disto, na

ilustra¸c˜ao 1b, observa-se que a ordem de compra x= (17,99;₋200;ix) se torna ativa

e n˜ao causa mudan¸ca em b(i) ou a(i).

Quadro 1: Exemplo de envio de ordem limitada

B(i) A(i)

Quant. Compra Venda Quant.

200 18,00 18,01 200

200 17,98 18,02 200

200 17,97 18,03 200

(a) Estado atual.

B(i) A(i)

200 18,00 18,01 200

200 17,99 18,02 200

200 17,98 18,03 200

(b) Envio de px= 17,99. FONTE:Elaborado pelo autor.

b) Se b(i) < px < a(i): como exemplo, se a Quadro 2. No Quadro 2a

observa-se um exemplo de estado atual com b(i) = 18 e a(i) = 18,02. Uma ordem x = (18,01;₋200;ix) foi enviada, tendo como resultado o Quadro 2b, em que a nova ordem

causou um aumento em b(i).

Quadro 2: Exemplo de envio de ordem limitada com altera¸c˜ao em b(i)

B(i) A(i)

200 18,00 18,02 200

200 17,99 18,03 200

200 17,98 18,04 200

(a) Estado atual.

B(i) A(i)

200 18,01 18,02 200

200 18,00 18,03 200

200 17,99 18,04 200

(b) Envio px= 18,01. FONTE:Elaborado pelo autor.

c) Se uma ordem de venda x ´e enviada a mercado: neste caso, a ordem ´e executada conforme o tamanho (vx) exigido pelo investidor.

Este exemplo ´e ilustrado no Quadro 3, sendo que em 3a ´e apresentado um estado atual do livro de ofertas. Uma ordem de venda a mercado com vx = 200 foi enviada; ordens de

venda a mercado são executadas nas ordens de compra limitadas (as ordens penduradas). Neste caso, otrader vendeu a descoberto 100 a¸cões a 18,00 e 100 a¸cões a 17,99. Portanto, o novo pre¸co de compra b(i) ficou em 17,99, como é apresentado no Quadro 3b.

d) Se uma ordem de compra x ´e enviada a mercado: neste caso, a ordem ´e executada conforme o tamanho (vx) exigido pelo investidor.

No Quadro 4 ´e ilustrado este exemplo; em 4a ´e apresentado um estado atual do livro de ofertas. Uma ordem de compra a mercado foi enviada comvx =−400; ordens de compra

(45)

Quadro 3: Exemplo execu¸c˜ao de ordem a mercado em b(i)

B(i) A(i)

100 18,00 18,01 300

200 17,99 18,02 200

100 17,98 18,03 200

(a) Estado atual.

B(i) A(i)

100 17,99 18,01 300

100 17,98 18,02 200

100 17,97 18,03 200

(b) Novo b(i)ap´os negocia¸c˜ao. FONTE:Elaborado pelo autor.

Quadro 4: Exemplo execu¸c˜ao de ordem a mercado em a(i)

B(i) A(i)

100 18,00 18,01 300

200 17,99 18,02 200

100 17,98 18,03 200

(a) Estado atual.

B(i) A(i)

100 18,00 18,02 100

200 17,99 18,03 200

100 17,98 18,04 200

(b) Novo at ap´os negocia¸c˜ao. FONTE:Elaborado pelo autor.

Após apresentar o funcionamento do livro de ofertas, torna-se importante apresentar o processo de difusão dos pre¸cos. Dado que os eventos no livro de ofertas ocorrem num ambiente de alta frequência, Cont e Larrard (2013) definem o processo de difusão dos pre¸cos no respectivo ambiente. Diante disto, os pre¸cos se comportam como um processo estocástico expresso em 2.1.14, comZ eNt expressos em 2.1.15 e 2.1.16 respectivamente:

pL_i(i) =Z(Ni), (2.1.14)

Z(i) =

M X

i=1

Xi, (2.1.15)

Ni = max{i≥0;τ1+· · ·+τm ≤M}, (2.1.16)

em que,pL_i(i) é o pre¸co observado no livro de ofertas, Z é o pre¸co depois quei mudan¸cas intradiárias de pre¸cos ocorreram, Ni é o número de mudan¸cas de pre¸cos durante o

inter-valo de tempo [0, M] eτ ´e a dura¸c˜ao entre as mudan¸cas de pre¸cos.