Trading por arbitragem estatística

(1)

FUNDAÇÃO GETULIO VARGAS

ESCOLA DE ECONOMIA DE SÃO PAULO

ANDRÉ PANARIELLO

TRADING POR ARBITRAGEM ESTATÍSTICA

SÃO PAULO

2016

(2)

ANDRÉ PANARIELLO

TRADING POR ARBITRAGEM ESTATÍSTICA

Dissertação apresentada ao Programa de Mestrado Profissional da Escola de Eco-nomia de São Paulo da Fundação Getulio Vargas, como requisito para a obtenção do título de Mestre em Economia.

Área de concentração: Finanças Quantitativas.

Orientador:

Prof. Dr. Juan Carlos Ruilova Terán

SÃO PAULO

2016

(3)

Panariello, André.

Trading por Arbitragem Estatística / André Panariello – 2016.

45f.

Orientador:Juan Carlos Ruilova Terán.

Dissertação (MPFE) – Escola de Economia de São Paulo.

1. Ações (Finanças). 2. Mercado de opções. 3. Modelos econométricos. 4. Operções com pares (Finanças). 5. Preços. 6. Análise de séries temporais. I. Ruilova Terán, Juan Carlos. II. Dissertação (MPFE) – Escola de Economia de São Paulo. III. Título.

(4)

ANDRÉ PANARIELLO

TRADING POR ARBITRAGEM ESTATÍSTICA

Dissertação apresentada ao Programa de Mestrado Profissional da Escola de Eco-nomia de São Paulo da Fundação Getulio Vargas, como requisito para a obtenção do título de Mestre em Economia.

Área de concentração: Finanças Quantitativas.

Data da Aprovação: 12/08/2016

Banca Examinadora:

Prof. Dr. Juan Carlos Ruilova Terán

(Orientador) FGV - EESP

Prof. Dr. Marcos Antonio Botelho

FGV - EESP

Prof. Dr. Rodrigo Arnaldo Scarpel

(5)

(6)

Agradecimentos

Ao Prof. Dr. Marcos Botelho pela indicação do tema, conhecimento, genialidade e principalmente pelo apoio nos momentos difíceis encontrados durante essa jornada. Ao Prof. Dr. Juan Carlos Ruilova Terán pela contribuição com a sua experiência no tema e pelo voto de confiança dado ao longo do curso. Ao Prof. Dr. Rodrigo Arnaldo Scarpel pelas sugestões e conhecimento na área. À minha mãe pelo apoio contínuo ao longo dos meus estudos e crença mesmo nos momentos mais difíceis. À Maria Clara pela paciência, companheirismo e compreensão nos momentos em que me fiz ausente. Aos amigos que fiz durante o curso pelos grandes momentos em que passamos juntos estudando. À Risk Oﬃce por acreditar e investir em meu desenvolvimento.

(7)

“Alguém está sentado na sombra hoje porque alguém plantou uma árvore há muito tempo.” (Warren Buﬀett)

(8)

RESUMO

Este trabalho propõe uma ferramenta para detectar oportunidades de arbitragem esta-tística (AE) em um par específico de ações no mercado brasileiro. A técnica baseia-se na construção de um ativo sintético que apresente característica de reversão à média. Os

forecasts serão realizados em forma de densidade de probabilidade condicional, elaborada

com base em técnicas econométricas como processos autoregressivos (AR) e variância con-dicional dos resíduos (GARCH). Será criado um sistema de trading capaz de se aproveitar das discrepâncias de preços observadas através da dinâmica do ativo sintético. A abor-dagem considerará preços em intervalos de um minuto e posições tomadas com ordens limitadas e a mercado. Ainda serão considerados custos de transação e análise do P&L para os casos abordados.

Palavras-chave: Arbitragem Estatística. Pairs trading. Ativo Sintético. Sistema de

(9)

ABSTRACT

This paper proposes a tool to detect statistical arbitrage opportunities in a particular pair of stocks in the Brazilian market. The technique is based on the construction of a synthetic asset that presents mean reversion process. The forecasts will be realized in the form of conditional probability density, which is based on econometric techniques such as autoregressive process (AR) and conditional variance of the residuals (GARCH). A trading system able to take advantage of mispricing observed by the synthetic asset dynamic is created. The approach will consider prices in one minute intervals and positions with limit orders and to market. Still be considered transaction costs and analysis of P&L for the cases addressed.

Keywords: Statistical Arbitrage. Pairs trading. Synthetic asset. Trading system. AR.

(10)

Lista de ilustrações

Figura 1 – Evolução dos preços de PETR3 e PETR4 - 04/01/2016 até 23/02/2016 27

Figura 2 – Log-Retornos Acumulados dos preços de PETR3 e PETR4 - 04/01/2016

até 23/02/2016 . . . 27

Figura 3 – Evolução do coeficiente βt - 04/01/2016 até 08/01/2016 . . . 28

Figura 4 – Evolução do Ativo Sintético Zt - 04/01/2016 até 08/01/2016 . . . 29

Figura 5 – Função Autocorrelação Amostral . . . 30

Figura 6 – Função Autocorrelação Amostral da Variância de Zt . . . 31

Figura 7 – Evolução ativo sintético e previsão . . . 33

Figura 8 – Evolução ativo sintético e bandas . . . 33

Figura 9 – Evolução ativo sintético realizado e previsão AR(2)- 04/01/2016 até 23/02/2016 . . . 34

Figura 10 – Variância realizada e GARCH(1,1) - 04/01/2016 até 23/02/2016 . . . . 35

Figura 11 – Realizacão do ativo sintético e bandas de probabilidade condicional b Z_t+hL,α eZb_t+hH,α - 04/01/2016 até 23/02/2016 . . . 35

Figura 12 – Preços por fechamento de minuto Bid and Ask - 04/01/2016 até 23/02/2016 36 Figura 13 – Log-Retornos Acumulados dos preços Bid and Ask de PETR3 e PETR4 - 04/01/2016 até 23/02/2016 . . . 36

Figura 14 – Sistema de Trading formado pelo ativo sintético e pelas bandas de trading - 04/01/2016 até 11/01/2016 . . . 37

Figura 15 – P&L Acum. do Sistema de Trading - 08/01/2016 até 23/02/2016 . . . 37

Figura 16 – Histograma e Boxplot do P&L por trade - 08/01/2016 até 23/02/2016. 39 Figura 17 – P&L Acum. com custos de transação do Sistema de Trading - 08/01/2016 até 23/02/2016 . . . 40

Figura 18 – Histograma e Boxplot do P&L por trade sem e com custos de transação - 08/01/2016 até 23/02/2016 . . . 40

Figura 19 – P&L Acum. do Sistema de Trading com ordens a mercado - 08/01/2016 até 23/02/2016 . . . 41

(11)

Lista de tabelas

Tabela 1 – Teste de Phillips-Perron . . . 29

Tabela 2 – Estimação processo AR . . . 30

Tabela 3 – Critérios de informação . . . 31

Tabela 4 – Estimação GARCH . . . 31

Tabela 5 – Critérios de informação variância . . . 32

(12)

Sumário

1 Introdução. . . 12

2 Preliminares teóricas . . . 15

2.1 Estimação dos Parâmetros . . . 15

2.2 Critérios de Informação. . . 15 2.3 Séries Temporais . . . 16 2.3.1 Estacionariedade . . . 16 2.3.2 Ruído Branco . . . 17 2.4 Processo Autorregressivo . . . 17 2.4.1 Previsão em um Processo AR . . . 18 2.4.2 Variância da previsão . . . 18

2.4.3 Intervalo de Confiança da previsão . . . 18

2.5 GARCH . . . 19

3 Identificação de discrepâncias na precificação de ativos . . . 20

3.1 Colocação do problema . . . 20

3.2 Dinâmica de ativos sintéticos bidimensionais . . . 21

3.2.1 Especificação do modelo . . . 22

3.2.2 Estimação dos parâmetros . . . 24

3.3 Sistema de trading . . . 24

4 Resultados. . . 26

4.1 Construção do modelo avaliado . . . 27

4.2 Operações com ordens limitadas . . . 35

4.2.1 Operações sem custos de transação . . . 36

4.2.2 Operações com custos de transação . . . 39

4.3 Operações com ordens a mercado . . . 40

5 Considerações finais . . . 42

(13)

12

1 Introdução

Desde a década de 1980, com o que pode ter sido o surgimento da arbitragem estatística, muitos traders tentam até os dias de hoje encontrar um modelo que possa lucrar com as chamadas distorções de preços no mercado financeiro. Em sua definição, a arbitragem estatística (AE) é a existência de uma discrepância estatística no valor esperado de um ou mais ativos. (AE) também pode ser classificada como uma estratégia que busca se aproveitar das anomalias momentâneas nos preços dos ativos financeiros. Uma maneira de se aplicar a arbitragem estatística é buscar distorções de preços entre pares de ações, onde os pares podem ser formados por ações da mesma companhia (ON versus PN), ações do mesmo setor (intra-setorial), ações de setores distintos (inter-setorial) ou até mesmo ações versus índices. A esse tipo de estratégia foi atribuído o nome de pairs

trading. Atualmente, o método de pairs trading é muito utilizado por investidores, bancos

e fundos quantitativos no Brasil e principalmente no exterior.

Conforme (VIDYAMURTHY,2004), a história mais citadada sobre o que poderia ter sido a primeira abordagem estatística de pairs trading nasceu em Wall Street e foi introduzida por um trader chamado Nunzio Tartaglia, que trabalhava no banco Morgan Stanley em meados da década de 1980. Tartaglia formou um grupo de matemáticos, físi-cos e cientistas da computação com o objetivo de desenvolver estratégias de arbitragem estatística usando modelos que conseguissem prever a dinâmica das anomalias de preços. As estratégias desenvolvidas pelo grupo foram automatizadas ao nível que poderiam gerar operações de forma mecanizada e serem executadas perfeitamente através de sistemas de negociação automatizados. Uma das técnicas de negociação empregadas envolvia tradings com pares de ações, conforme mencionado. O processo envolvia identificar pares de ações em que os preços apresentavam movimentos similares. Quando era identificada uma ano-malia nessa relação, montava-se uma posição com a ideia de que a anoano-malia se corrigiria. Tartaglia e seu grupo empregaram a estratégia de pairs trading com grande sucesso ao longo de 1987. Apesar do grupo ter se desmontado em 1989, a estratégia de pairs trading se tornou cada vez mais popular entre traders individuais, investidores institucionais e

hedge-funds.

As metodologias de análise em pairs trading mais usuais são a correlação e cointe-gração, que buscam identificar e testar relações de curto e longo prazo, respectivamente. O início dos estudos sobre a correlação entre séries temporais foi introduzido por (YULE,

1926), que atacou o problema entre duas simples variáveis harmônicas em função do tempo. Mais tarde, em 1987, Robert F. Engle e C. W. J. Granger formalizaram a abordagem de cointegração vetorial em (ENGLE; GRANGER, 1987). O trabalho baseou-se na conexão de um processo média-móvel, autoregressivo e representação de correção de erros para

(14)

Capítulo 1. Introdução 13

sistemas cointegrados com o intuito de desenvolver e analisar testes para séries cointegra-das. Essas pesquisas foram primordiais para o desenvolvimento de técnicas baseadas em cointegração para arbitragem estatística em pairs trading, evidenciado por (BOSSAERTS,

1988).

No mercado brasileiro, (CALDEIRA,2011) utilizou a abordagem de cointegração em diversos pares de ações. O estudo objetivou primeiramente identificar quais pares de ações poderiam ser alvos de uma estratégia de pairs trading. Após isso, o alvo foi replicar o modelo de Ornstein-Uhlembeck e calcular o spread para realizar as simulações dos

tradings. O estudo mostrou rentabilidade expressiva ao longo de três anos, volatilidade

e correlação baixa em comparação ao mercado. (PUCCIARELLI, 2014) utilizou uma abordagem de cointegração dinâmica no tempo também em alguns pares de ações baseado no artigo (TRIANTAFYLLOPOULOS; MONTANA, 2011) que, diferentemente, utilizou uma equação de observação com parâmetros α e β constantes no tempo.

(KABASHIMA, 2005) buscou pré-selecionar os pares de ações no mercado brasi-leiro por meio da correlação, após isso, foi utilizado o teste de Dickey-Fuller aumentado (ADF) para verificar a existência de raiz unitária da série de resíduo da combinação

li-near do logaritmo dos preços. Em linha, (LONGO,2008) utilizou o teste Johansen para a formação dos pares a serem testados e construiu um ativo sintético para assegurar a esta-cionariedade dos preços. Por sua vez, (BRITO,2011) seguiu os mesmo passos, entretanto, aplicou a estratégia de cointegração em dados intradiários com frequência de 15 em 15 minutos em pares de ações negociadas no mercado brasileiro e comparou sua performance em relação ao ativo livre de risco (CDI).

Outra modelagem bastante difundida na arbitragem estatística é a análise de com-ponentes principais (PCA), que busca fazer uma transformação ortogonal de variáveis correlacionadas em valores linearmente independentes. (AVELLANEDA; LEE,2010) apli-cam a metodologia em ETFs negociados no mercado americano e analisam o sharpe-ratio da estratégia em diferentes períodos, incluindo a crise de liquidez em 2007. A análise com-parou um portfólio formado por 15 ETFs para representar as flutuações de mercado. Em média, 40% a 60% da variância nos retornos das ações são explicadas pelas componentes geradas. Com o mesmo intuito, (FERREIRA; VIEIRA,2011) aplicou o PCA e modelou a reversão à média como um processo de Ornstein-Uhlenbeck para maximizar uma função utilidade de um dado agente e, com isso, montar uma estratégia de pairs trading que considere uma maior aversão à risco dado um aumento na variância do ativo sintético modelado.

Com a evolução dos estudos na arbitragem estatística, a aplicação de redes neurais nos modelos lineares têm sido batante frequente e, é o que propõe (MEDEIROS; VEIGA; PEDREIRA, 2001) em sua modelagem sobre as taxas de juros. O objetivo foi testar e modelar a não-linearidade nas séries temporais de taxas de juros em alguns meses. A ideia

(15)

Capítulo 1. Introdução 14

foi aplicar duas alternativas não-lineares, uma rede neural estimada com regularização Bayesiana e a outra com o chamado coeficiente neural autoregressivo de transição suave. Sua conclusão tenta explicar qual é o tamanho da relevância da não-linearidade nas séries temporais que, resumidamente têm sua importância em alguns períodos específicos, tais como no início e fim da amostra.

Nessa linha, uma outra possível técnica seria obter a discrepância de preços entre os pares de ações e modelá-la como um ativo sintético, que tenha a característica de reversão à média e usar modelos de séries temporais para tentar descrever sua dinâmica. Em 2006, (THOMAIDIS; KONDAKIS; DOUNIAS, 2006) publicaram um artigo que propõe uma ferramenta inteligente combinada a métodos estatísticos para detectar possíveis distorções nos preços de pares de ações. A modelagem preliminar trata da obten-ção de um ativo sintético por meio de algumas formulações, que tenha a característica de reversão à média. Após isso, foi construído um modelo para descrever a sua dinâmica com base em inteligência artificial e um processo que descreva a variância do seu ruído. Com a obtenção dessa dinâmica, são construídos intervalos de confiança para a montagem das posições no ativo sintético.

O objetivo deste trabalho é propor uma ferramenta para detectar oportunidades de arbitragem estatística (AE) em um par específico de ações no mercado brasileiro. A técnica baseia-se em construir um ativo sintético no mesmo molde proposto por (THOMAIDIS; KONDAKIS; DOUNIAS,2006) e modelá-lo com os mesmos mecanismos estatísticos com exceção da rede neural, nele formulada, e aplicá-lo a um par de ações no mercado brasileiro em high frequence. O trabalho ainda contemplará a inserção de custos de transação de forma a tentar deixá-lo mais próximo da realidade.

Este trabalho está organizado conforme descrito a seguir. Primeiramente, no ca-pítulo 2, apresentam-se brevemente os conceitos teóricos utilizados para a elaboração do modelo. No capítulo 3, descreve-se a metodologia adotada para a construção do ativo sintético, estimação, especificação do modelo e desenvolvimento do sistema de trading. Já no capítulo 4, discutem-se os resultados de toda metodologia proposta no capítulo ante-rior, assim como a performance do algoritmo e P&L da estratégia ao longo do intervalo proposto. Por fim, no capítulo 5, apresentam-se as conclusões acerca dos resultados e indicações de possíveis extensões do trabalho.

(16)

15

2 Preliminares teóricas

Neste capítulo serão apresentadas brevemente as teorias que constituem a formula-ção do modelo. Informações adicionais podem ser extraídas de suas respectivas referências.

2.1 Estimação dos Parâmetros

Seja um conjunto de n observações {y1, y2, . . . yn} consideradas como resultados

de variáveis aleatórias com distribuição de probabilidade conjunta fθ(y1, y2, . . . yn) cuja

forma geral é conhecida a menos de um conjunto θ formado por um ou mais parâmetros desconhecidos. Chama-se de um modelo para as observações ao conjunto de distribuições

{fθ ; θ∈ Θ}. Embora os valores dos elementos de θ sejam desconhecidos, eles podem ser estimados a partir dos dados observados e o conjunto dos valores estimados destes elemen-tos é denotado por ˆθ. Um estimador é qualquer expressão numérica ou método que seja

usado para obter estimativas para um parâmetro desconhecido. Três métodos bastante conhecidos são o dos Momentos, o dos Mínimos Quadrados e o da Máxima Verossimi-lhança. Para o caso proposto, será utilizada a abordagem da Máxima Verossimilhança, apresentada aqui brevemente (v. (HEIJ et al., 2004)):

Máxima Verossimilhança: Define-se a Função de Verossimilhança, denotada L(θ),

como sendo fθ(y1, . . . , yn) entendida como função de θ, ou seja,

L(θ) = fθ(y1, . . . , yn), θ∈ Θ.

Para distribuições discretas, o valor de L(θ) é igual ao da probabilidade (com respeito à distribuição fθ) do resultado observado, de maneira que a estimativa por máxima

verossi-milhança é o valor de θ para o qual esta probabilidade é o maior dentre todos os valores possíveis de θ ∈ Θ. Analogamente, para distribuições contínuas a estimativa por máxima verossimilhança é obtida maximizando-se L(θ) sobre θ.

2.2 Critérios de Informação

Os critérios de infomação são métodos para decidir sobre a inclusão ou não de uma variável a mais em um modelo. Essa técnica consiste em avaliar qual o poder explicativo da nova variável a ser incluída e, em contrapartida, o critério também impõe um fator de penalização pela complexidade de utilizar um modelo com uma variável a mais. O Akaike

(17)

Capítulo 2. Preliminares teóricas 16

AIC = 2k

n − ln(L)

onde k é o número de parâmetros no modelo, L é o ponto máximo da função de verossi-milhança e 2k_n é chamado de penalty factor. Conforme a sua formulação, o critério AIC impõe uma maior penalização por conta da adição de um regressor a mais no modelo. Quando comparados 2 ou mais modelos, o com menor valor é preferível.

Similarmente, o Bayesian Information Criterion (BIC) é definido como:

BIC =−2 ln L + k ln(n)

Aqui, L é o ponto máximo da função de verossimilhança, k é o número de parâmetros inclusos no modelo e n é o número de observações, ou de forma equivalente, o tamanho da amostra. Da mesma forma, o BIC penaliza o modelo com maior número de regressores, no caso proposto, maior número de lags. Também é preferível o modelo com o menor resultado.

2.3 Séries Temporais

Conforme (HEIJ et al.,2004), uma variável observada sequencialmente ao decorrer do tempo t = {1, 2, . . . , n} é dita uma série temporal. Essas variáveis são valores reali-zados ao longo do tempo por processos econômicos ou financeiros, que possuem como característica forte correlação com as observações mais recentes.

2.3.1 Estacionariedade

Uma série temporal é estacionária se algumas de suas propriedades estatísticas se mantiverem constantes ao longo do tempo. Ou seja, se a série for cortada em dois intervalos, tanto a média quanto a covariância dos dois intervalos serão praticamente iguais. Mais precisamente, uma série temporal Zt é dita estritamente estacionária (forte)

se a função de distribuição conjunta de {Zt, . . . , Ztm} e {Zt1+k, . . . , Ztm+k} são iguais para

m inteiro positivo, ou seja, iguais para qualquer período no tempo de duração igual.

Uma série é dita estacionária de segunda ordem (fraca), se:

E [Zt] = µ E[(Zt− µ)2] <∞

E[(Zt− µ)(γt−k − µ)] = γk, a depender do tamanho de k.

De acordo com a formulação acima, pode-se trabalhar com a estacionariedade de segunda ordem, já que a estacionariedade estrita é muito complexa de ser verificada

(18)

empiricamente. Para o caso proposto neste trabalho, será utilizada a hipótese de estacio-nariedade de segunda ordem.

2.3.2 Ruído Branco

Segundo (HEIJ et al.,2004), a notação para o passado de um processo estacionário

Zt pode ser escrita como zt−1 = {Zt−1, Zt−2, . . . , Zt−n}. Neste caso, zt−1 é chamado de

informação disponível até (t − 1). A predição para um passo a frente pode ser descrita como E[Zt|zt₋₁]. De uma outra forma:

ϵt= Zt− E[Zt|zt−1] (2.1)

ϵt é chamado de Innovation Process, pois corresponde aos choques na série

tempo-ral Zt. Se as observações forem normalmente distribuídas. A média condicional à

informa-ção até (t− 1) é: E[Zt|zt₋₁] = ϕo+ p ∑ i=1 ϕ′Zt−i (2.2) ϕo e ∑p

i=1ϕ′ são parâmetros a serem estimados. Este processo é considerado

esta-cionário, assim como ϵt também o é. Abaixo, algumas propriedades:

E[ϵt] = 0 para todo t,

E[ϵ2_t] = σ2 para todo t,

E[ϵs, ϵt] = 0 para todo s̸= t,

Com variância constante e autocorrelação igual a zero, ϵt é chamado de ruído

branco.

2.4 Processo Autorregressivo

A equação 2.2 pode ser escrita como:

Zt= ϕo+ p

∑

i=1

ϕ′Zt−i+ ϵt (2.3)

conforme (HEIJ et al., 2004), 2.3 pode ser interpretada como um modelo de re-gressão linear. As variáveis explicativas da rere-gressão consistem nos lags imediatamente

(19)

anteriores da série temporal somada a um termo de perturbação. A equação 2.3 é conhe-cida como modelo autoregressivo de ordem p, AR(p).

2.4.1 Previsão em um Processo AR

Considerando a equação2.3, a condição de estacionariedade implica que Zt é uma

função dos erros passados (ϵt−k, k ⩾ 0). Sendo assim, para Zt+1 significa que ϵt+1 é não

correlacionado com todas as observações de Zt, a previsão um passo a frente é dado por:

b Zt+h = ϕo+ p ∑ i=1 ϕ′Zt+1−p (2.4)

O erro na previsão é dado por Zt+1− Zbt+h= ϵt+1e a variância do erro na previsão

é σ2_{. Lembramos que h representa uma escolha de quantos passos à frente desejamos}

prever.

2.4.2 Variância da previsão

Generalizando o tamanho da previsão para h passos a frente, com a predição do erro (Zt+h− Zbt+h), se tem a variância de uma previsão na forma:

M SE(h) = E[(Zt+h−Zbt+h)2] (2.5)

Chamado de erro quadrático médio, para um passo a frente, se tem o erro da pre-visão igual à inovação ϵn+1. Da mesma forma, o processo de inovação também é chamado

de processo de predição dos erros. A variância da previsão cresce conforme o tamanho de

h aumenta, o que é natural dado que as observações passadas contém mais informações

para um futuro imediato do que para um futuro muito distante. Para um h tendendo a infinito, a variância da previsão converge para a variância do processo do próprio Zt, ou

seja, no longo prazo toda informação sobre o passado, eventualmente, desaparece. Isto porque a correlação de um processo estacionário converge para zero quando k tende a in-finito, então, a informação do passado é não-correlacionada para um futuro infinitamente longe.

2.4.3 Intervalo de Confiança da previsão

Conforme (HEIJ et al.,2004), intervalos de confiança podem ser construídos assumindo-se uma distribuição de probabilidade, neste caso, uma distribuição normal. Para a

(20)

instân-Capítulo 2. Preliminares teóricas 19

cia (1− α), ou para uma melhor ilustração, 95% em um intervalo de previsão para Zt+h é dado por: b Zt+h− 1, 64 √ M SE(h)≤ Zt+h ≤Zbt+h+ 1, 64 √ M SE(h) (2.6)

O intervalo da previsão é mais largo para horizontes de h maiores. Dessa forma, a variância M SE(h) aumenta para valores maiores de h.

2.5 GARCH

Até o momento, o processo de inovação ϵt foi considerado como se tivesse uma

variância constante σ2. Essa hipótese não é tão realística, dado que pode existir efeito dos lags na variância condicional σ2 _{= V ar(Z}_t|zt

−1) para as séries temporais. Como o

conceito de variância é uma medida de risco ou incerteza nos valores futuros de uma variável, esta torna-se uma ferramenta de suma importância para as decisões econômicas ou financeiras. Ao se trabalhar com uma variância dependente do tempo σ2

t, um dos

modelos que exemplifica a diferença entre variância condicional e não-condicional é o chamado de ARCH (Autoregressive Conditional Heteroskedasticity) que considera, apenas, o efeito dos lags dos termos de erros anteriores. Conforme (STATISTICS, 1992), uma generalização do modelo ARCH pode ser chamada de GARCH (Generalized Autoregressive

Conditional Heteroskedasticity), que em sua forma geral, GARCH(p, q) pode ser escrito,

conforme abaixo: ϵt|It₋₁ ∼ N(0, σ_t2) σ2_t = αo+ p ∑ i=1 αiσ2t−i+ q ∑ i=1 βiϵ2t−i (2.7)

O termo de erro condicionado ao nível de informação adquirido até o instante imediatamente anterior segue uma distribuição normal de média zero e variância σ2

t. Para p = 0, o processo se reduz a um ARCH(q), e para p = q = 0, ϵté um simples ruído branco.

(21)

20

3 Identificação de discrepâncias na

precifica-ção de ativos

Arbitragem Estatística (AE) em pairs trading é uma metodologia de trading alta-mente quantitativa que visa identificar discrepâncias na precificação de um conjunto de ativos financeiros negociados no mercado, cuja combinação dos preços apresentem sinais claros de reversão à média. Algumas destas técnicas faz uso intensivo de modelos compu-tacionais no âmbito da Inteligência Artificial de forma a explorar a dinâmica dos mercados financeiros para efeito da previsão de séries temporais. No que diz respeito a esta previ-são, estudos anteriores (cf. (ZHANG; PATUWO; HU, 1998)) indicam que a predição de séries temporais tem melhor precisão quando é feita sobre a série de uma combinação de diferentes ativos, em vez de se utilizar a série de um único ativo.

3.1 Colocação do problema

Sendo assim, dado um conjunto de preços de ativos{X1, X2, . . . , Xn}, enunciamos:

Nosso Problema Fundamental de Arbitragem Estatística:

Identificar por um sistema automático de decisões de trading (negociação) as discrepâncias de precificações no portfólio variante no tempo {X1t, X2t, . . . , Xnt}, o que, por definição,

significa identificar em tempo real uma (n + 1)-upla

ωt= (ωot, ω1t, . . . , ωnt)∈ Rn+1 tal que a combinação de ativos

Zt= ωot+ n

∑

i=1

ωitXit,

que chamaremos aqui de ativo sintético, apresente reversão à média com distribuição N (0, σ2

t), com variância σt2 finita e dependente do tempo.

A exigência pela reversão à média se impõe para garantir que as discrepâncias even-tualmente tendam para zero e não cresçam indefinidamente pois, caso contrário, ficaria impossível controlar a exposição ao risco do portfólio em negociação. Podemos interpretar

(22)

Capítulo 3. Identificação de discrepâncias na precificação de ativos 21

com

ωi negativo indicando a ação de vender |ωi|Xi, ωi positivo indicando a ação de comprar |ωi|Xi.

3.2 Dinâmica de ativos sintéticos bidimensionais

A proposta deste trabalho é desenvolver um algoritmo para obter as bandas de

trading para um portfólio composto por apenas dois ativos X1 e X2. A generalização

para n > 2 ativos será um projeto a ser desenvolvido em pesquisas futuras depois que o algoritmo para o caso de ativos sintéticos bidimensionais atingir um nível adequado de aperfeiçoamento, robustez e amadurecimento.

O modelo padrão de abordagem para identificar uma discrepância de preços é regredir os valores de um ativo contra o outro. Na literatura econométrica, vários testes foram desenvolvidos para este propósito, tais como o de Dickey-Fuller e o de Phillips-Perron. Ambos são testes de raiz unitária, que em particular, prestam-se para distinguir uma tendência determinística de uma tendência estocástica. A tendência determinística se caracteriza pela reversão à média e pelos choques na série serem dissipados ao longo do tempo. Por outro lado, a tendência estocástica não apresenta reversão à média e os choques na série temporal têm efeito de longo prazo. Na prática, as séries temporais também são caracterizadas pelas flutuações de curto prazo e podem impactar em autocorrelação serial1, ou seja, os resíduos podem estar autocorrelacionados e, com isso, os valores críticos apresentados no teste não seriam válidos. Conforme (HEIJ et al., 2004), com base no Dickey–Fuller t-test, pode-se aplicar a correção de Newey–West que lida com o tratamento da correlação serial e considera os erros-padrões para estimar o parâmetro ρ. O t-test baseado na correção de Newey–West para os erros-padrões de ρ é chamado de teste de Perron. Para o caso proposto neste trabalho, será utilizado o teste de Phillips-Perron para a identifcação de reversão à média no ativo sintético.

O próximo passo é criar um modelo que descreva a dinâmica da discrepância de preços, isto é, como os erros em suas diferentes magnitudes e sinais (positivo/ negativo) são corrigidos ao longo do tempo. Como forma de tirar vantagem da previsibilidade, a previsão dos preços necessita ser incorporado à dinâmica da estratégia de trading. Um sistema de

trading baseado em arbitragem identifica os "turning points"da discrepância de preços

de sua série temporal e toma posição nos ativos correspondentes quando a discrepância for excepcionalmente alta (isto é, ω para positiva e −ω para discrepância negativa). A 1 _{Para uma relação entre a variável dependente y e a independente x, especificada da forma:}

yi = x,iβ + εi, i = 1, . . . , n

As distorções são ditas autocorrelacionadas se existem observações i̸= j para εie εjque apresentem

(23)

estratégia de arbitragem descrita acima não é livre de risco; embora lucrativa no longo prazo, o lucro imediato depende fortemente do preço de mercado retornar para os seus "padrões normais ou históricos"em um prazo curto de tempo. Geralmente, uma reversão à média fraca tem maior probabilidade de ser observada em momentos adversos do ativo sintético.

O problema com tudo isto é que uma regressão simples de um ativo em função do outro não apresenta reversão à média, como mostra (THOMAIDIS; KONDAKIS; DOU-NIAS, 2006). Numa abordagem alternativa proposta também em (THOMAIDIS; KON-DAKIS; DOUNIAS,2006), vamos procurar controlar a não-estacionariedade do ativo sin-tético adotando um esquema adaptativo no qual os coeficientes da combinação que define

Zt são periodicamente recalculados. Nesta abordagem, vamos considerar a discrepância

de preços (ativo sintético) como sendo dada por:

Zt= X2t− βt−1X1t , (3.1)

onde βt é estimado com base numa janela de comprimento W , i.e., {X1j, X2j , para

j = t− W + 1, . . . , t}.

Para calcular o parâmetro βt , definimos β como sendo a razão média dos preços

entre as duas ações ao longo da janela especificada. Mais precisamente:

βt = mean { X2j X1j , para j = t− W + 1, . . . , t } , (3.2)

A partir daqui, a construção do modelo segue as seguintes etapas:

1. Especificação do modelo. 2. Estimação dos parâmetros.

3. Avaliação do input–of-sample e do output-of-sample.

3.2.1 Especificação do modelo

Com base nas séries de discrepância de preços Zt1, Zt2, . . . , Ztn estima-se um modelo linear

simples, neste caso, um AR(p), conforme equação abaixo:

Zt = ϕo+ p

∑

i=1

ϕ′Zt−i+ εt (3.3)

onde ϕo ∈ R, Zt = (Zt−1, Zt−2, . . . , Zt−n) ∈ Rn×1, εt é o resíduo ou o choque aleatório e ϕ ∈ Rn×1_{. Conforme (}_GUJARATI_, ₂₀₀₉_{) um AR(p) é um modelo linear para séries}

tem-porais que inclui não só os valores atuais, mas também os passados (lags) como variáveis explicativas.

(24)

Entretanto, para a utilização do modelo autoregressivo é necessário inferir quantos

lags são necessários para replicar com maior precisão a dinâmica do ativo sintético. Sendo

assim, para a decisão de incluir um lag a mais na equação linear serão utilizados os critérios de informação AIC e BIC.

AIC = 2k

n − ln(L) BIC =−2 ln L + k ln(n)

No entanto, é comum encontrar a presença de heteroscedasticidade2 _{nos resíduos}

de um processo linear. Concomitantemente, uma outra proposta deste trabalho é modelar a variância do resíduo do processo autorregressivo. Nessas condições, o modelo proposto é a inclusão do componente de volatilidade GARCH(p, q), conforme abaixo:

εt|It−1 ∼ N(0, σ2t) σ_t2 = αo+ p ∑ i=1 αiσt2−i+ q ∑ i=1 βiε2t−i

O resíduo condicionado ao nível de informação adquirido até o instante imediata-mente anterior segue uma distribuição normal de média zero e variância σ_t2. Neste caso, o trabalho propõe uma forma de modelagem para a variância condicional do resíduo ε no instante de tempo t que depende não somente do próprio resíduo ao quadrado nos instantes de tempo anteriores ε2

t−1, ε2t−2, . . . , ε2t−q, mas também da própria variância ao

quadrado nos instantes t anteriores σ2

t−1, σ2t−2, . . . , σ2t−q. Ou seja, um GARCH(p, q) é

intro-duzido como uma forma de extensão de um processo ARCH (Autoregressive Conditional

Heteroskedasticity), que considera apenas o efeito dos lags dos resíduos anteriores. Para

a inferência do GARCH(p, q) também será feita a análise com os critérios de informação para a condução do número ótimo de lags da variância e dos resíduos.

2 _{Lembramos que, num modelo de regressão linear com múltiplas variáveis explicativas e termo residual}

εt, Yt= β1+ n ∑ i=2 βiXit+ εt,

dizemos que temos heterocedasticidade, ou dispersão ou variância desigual, quando a variância do resíduo εtpara cada Xi (a variância condicional de εt) varia com o tempo, i.e.,

(25)

3.2.2 Estimação dos parâmetros

Com o intuito de encontrar estimadores para o modelo AR(p), optou-se por utilizar a abordagem de Máxima Verossimilhança, simplesmente por ser um estimador não-linear mais eficiente. Sob hipótese de ocorrerem altas perturbações em ϵt, essas observações

po-dem causar um impacto relativamente alto nos estimadores. Há muitas formas de reduzir esse impacto, uma delas é trocar a distribuição utilizada. Entretanto, se ϵt não for

nor-malmente distribuído, a hipótese de normalidade não é satisfeita. Concomitantemente, o estimador de Máxima Verossimilhança lida melhor com essas perturbações, já que uti-liza a distribuição de probabilidade conjunta das observações fθ(Z1, . . . , Zn) da descrição

presente no método de Máxima Verossimilhança apresentado anteriormente.

Da mesma forma, a estimação dos parâmetros desconhecidos do modelo de variân-cia condicional GARCH(p, q) também será feita pela função de Máxima Verossimilhança.

3.3 Sistema de trading

Nessa fase, será formulado o modelo com o intuito de obter a previsão de 1-h passos a frente do valor futuro do ativo sintético. As previsões são dadas na forma de

função densidade de probabilidade condicional, ou seja, obtido uma previsão Zbt+h será

utilizada como base a formulação 2.6que nos conta como podemos formular intervalos de confiança com base na variância da previsão M SE(h). Entretanto, aqui uma modificação importante; como uma proposta do trabalho é modelar a variância condiconal do resíduo

ϵt, será substituída a função M SE(h) pela variância σ2t modelada com GARCH(p, q),

conforme as equações abaixo, utilizadas em (OPSCHOOR; DIJK; WEL, 2014):

b

Z_t+hL,α =Zbt+h− (1 − α)σbt+h (3.4)

b

Z_t+hH,α =Zbt+h+ (1− α)σbt+h (3.5)

Em que (1−α) é um determinado intervalo de confiança de uma normal N(0, σ2

t) e

b

σ2

n+h é a previsão da variância condiconal modelada pelo GARCH(p, q). Essa formulação

é importante, pois o objetivo do modelo é construir bandas de entrada e saída baseadas nos intervalos de confiança Zb_t+hL,α (low) eZb_t+hH,α (high).

Após a construção das bandas no espaço de tempo 1-h passos a frente, o modelo receberá os valores atuais, em t, das ações X1t e X2t, de modo a construir os valores do

ativo sintético Zt. Neste espaço de tempo 1-h passos a frente, o modelo é capaz de enviar

(26)

• Se Zt<Zb_t+hL,α, monta-se uma posição comprada no ativo sintético3_;

• Se Zt>Zb_t+hH,α, monta-se uma posição vendida no ativo sintético4_;

O algoritmo para identificação de um sistema de decisões automáticas desenvol-vido até aqui pode ser incrementado capacitando-o a lidar com as seguintes situações específicas:

(i) Não há nenhuma posição montada e o sistema de decisões indica que é hora de

montar posição;

(ii) Há posição montada e o sistema de decisões indica que é hora de desmontar a posição e

auferir o lucro ou prejuízo. Como não há posição montada, procede-se como descrito em (i).

3 _{Longing no ativo sintético significa comprar 1 unidade de X}

2 e vender βtações de X1. 4 _{Shorting no ativo sintético significa vender 1 unidade de X}

(27)

26

4 Resultados

Os cálculos, testes e todas as análises apresentadas neste trabalho foram feitas utilizando-se o software MATLAB. As cotações dos preços das ações foram obtidas pela estação BLOOMBERG e tratadas no Microsoft Excel e portadas ao MATLAB. Pela facilidade em obter gráficos de maior qualidade e performar testes e parametrizações, também optou-se por utilizar o MATLAB.

Para a aplicação proposta neste trabalho, será utilizado o par de ações PETR3 e PETR4 (negociadas no pregão da bolsa de valores de São Paulo, Bovespa) que são repre-sentadas por X1 e X2, respectivamente. Essa escolha tem por finalidade uma aplicação

do modelo no mercado brasileiro e pelo fato de serem ações da mesma companhia, nor-malmente, resultam em um melhor comportamento de reversão à média. Os horários de cotação ao longo dos dias respeitará o intervalo das 11h00min até 15h00min, utilizando preços de fechamento de trade no intraday de minuto a minuto. Esse intervalo de tempo foi escolhido por conta do mercado operar em maior liquidez dentro dessa faixa. Todas as séries de preços são ajustadas a eventos, tal como splits e pagamento de dividendos. A amostra inicial de preços utilizada para a construção do ativo sintético e para a especifi-cação e estimação do modelo será referente ao dia 04/01/2016 até 08/01/2016.

Após esta fase, o modelo performará a previsão e será construído um sistema de trading capaz de identificar as distorções geradas no ativo sintético. Para isso, serão utilizados os preços no intervalo de 08/01/2016 a 23/02/2016 para validação do modelo

out-of-sample.

Conforme a Figura1, pode-se observar a evolução dos preços das ações X1(PETR3)

e X2 (PETR4) ao longo de todo o período t proposto. Pela evolução dos preços, observa-se

que, em nível de tendência, os ativos tendem a seguir a mesma direção.

Na Figura 1, a rigor, o tempo t = 1, 2, 3...n na abscissa representa a sequência de tomadas de preço sucessivas e não propriamente em minutos. Para uma melhor visuali-zação, a arbitragem estatística em pairs trading procura aproveitar-se das oportunidades geradas conforme a Figura 2.

Obviamente, difentemente dos log-retornos acumulados, o sistema aqui proposto tentará identificar apenas os pontos de cruzamento das linhas, sem carregar ambos os ativos em uma estratégia buy and hold.

(28)

Capítulo 4. Resultados 27

Figura 1 – Evolução dos preços de PETR3 e PETR4 - 04/01/2016 até 23/02/2016

Figura 2 – Log-Retornos Acumulados dos preços de PETR3 e PETR4 - 04/01/2016 até 23/02/2016

4.1 Construção do modelo avaliado

Na fase input-of-sample será utilizada a amostra incial de preços dentro do intervalo de 04/01/2016 até 08/01/2016 (1000 minutos). Com base nessas séries de preços, pode-se aplicar a formulação 3.2 com o intuito de construir um ativo sintético nos moldes de 3.1. A primeira variável a se obter é βt, entretanto, antes é preciso definir o parâmentro W ,

que representa o comprimento da janela a serem efetuados os cálculos. Dessa forma, por utilizarmos dados de minuto a minuto, parece razoável determinarmos três tamanhos de

(29)

W em 10, 30 e 60. Assim, a construção do ativo sintético será feita com base nos preços

do par de ações de 10, 30 e 60 minutos.

Com o tamanho de W definido, inicia-se o cálculo do coenficiente βt, conforme a

Figura 3, que corresponde a uma média do quociente entre X2,j

X1,j, onde j = t−W +1, . . . , t.

Figura 3 – Evolução do coeficiente βt - 04/01/2016 até 08/01/2016

A Figura 3 mostra a evolução do coeficiente βt ao longo do tempo j para o

parâ-metro W = 10, 30 e 60, respectivamente. Pode-se observar que a razão das duas ações apresentou tendência de alta durante o período observado. A Figura também mostra que utilizar a média do quociente entre as ações X2,j

X1,j para o cálculo de βt tem como objetivo

suavizar as oscilações sem influênciar sua trajetória. Ao utilizar um W maior, aumenta-se a suavização dessa trajetória. A Figura 3 mostra βt calculado com W = 10, a trajetória

do coeficiente apresenta quinas e ruídos obtidos pala variação dos preços. Para W = 30, observa-se uma tendência mais suavizada e com menos quinas. Já para W = 60, é possível ver o coeficiente βt descrito praticamente em uma curva totalmente suavizada.

Com βt calculado, pode-se construir por fim o valor do ativo sintético, conforme a

expressão 3.1:

A construção do ativo sintético, conforme a Figura 4, tem o objetivo de analisar uma discrepância de preços que atenda o principal fator, neste caso, a reversão à média. Pode-se observar que para as diferentes janelas, o W crescente continua com o intuito de suavizar os ruídos presentes na discrepância de preços. Com essa suavização é possível ver que para um W maior, os ruídos mais fortes demoram mais para serem dissipados, isto porque, como a forma de trabalhar com o ativo sintético e seus coeficientes é o calculo de

(30)

Figura 4 – Evolução do Ativo Sintético Zt - 04/01/2016 até 08/01/2016

Zt Estatística do Teste Valor Crítico 5% p-valor

W = 10 −19, 23 −1, 9416 0, 001

W = 30 −13, 09 −1, 9416 0, 001

W = 60 −10, 34 −1, 9415 0, 001

Tabela 1 – Teste de Phillips-Perron

suas médias, o efeito de um ruído mais forte no preço do ativo sintético permanece por mais tempo ao longo de sua evolução.

Com o ativo sintético construído, é preciso verificar sua reversão à média antes de sua modelagem. Para isso, utilizaremos o teste de Phillips-Perron.

Conforme a Tabela 1, todas as estatísticas do teste rejeitam para valores altos o valor crítico de 5%, ou seja, rejeitando a hipótese nula de unicidade da raiz. Sendo assim, pode-se trabalhar com a hipótese de que o ativo sintético possui reversão à média. Para fins de simplificação, o ativo sintético que considera a janela W = 10 obteve o valor mais alto de rejeição da hipótese nula, ou seja, apresenta um índice maior de reversão à média. O ativo sintético calculado com a janela W = 10 apresenta um tempo médio de 3 minutos para reverter à sua média. Neste caso, a partir desse ponto, todos os cálculos e análises serão feitos com o ativo sintético construído com a janela de comprimento W = 10.

Com a hipótese formulada anteriormente, podemos dar início a modelagem do ativo sintético, conforme descrito no capítulo 3 que descreve a especificação e estimação do modelo. A principio, foram estimados os modelos autoregressivos com três lags, AR(1), AR(2) e AR(3). Nessa fase, o intuito é definir qual é o número ótimo de lags para a

(31)

Parâmetros AR(1) AR(2) AR(3)

Constante (ϕo) 3, 408e− 04 3, 011e − 04 2, 943e − 04 Lag1 (ϕ1) 0, 4202 0, 3482 0, 3438

Lag2 (ϕ2) — 0, 1650 0, 1558

Lag3 (ϕ3) — — 0, 0261

Variância (β2) 8, 465e− 05 8, 228e − 05 8, 230e − 05

LogVerossimilhança ( ln(L)) 3, 049e + 04 3, 065e + 04 3, 067e + 04 Tabela 2 – Estimação processo AR

descrição do ativo sintético, para isso, utilizaremos os critérios de informação. A Tabela

2 mostra os respectivos resultados.

Com os resultados da Tabela 2, pode-se estimar os critérios de informação AIC e BIC. Mas, antes, vale a tentativa de olhar o gráfico de autocorrelação para ver qual o número ideal de lags:

Figura 5 – Função Autocorrelação Amostral

O gráfico de autocorrelação amostral sugere um comprimento de 2 lags para o mo-delo. Para a decisão, também serão levados em conta os critérios de informação, conforme Tabela3:

Conforme os resultados do AIC e BIC, em conjunto com a análise gráfica da função autocorrelação amostral, sugere-se a utilização de um AR(2), já que deve-se utilizar os menores níveis para ambos os critétrios.

Seguindo a mesma linha para a modelagem da variância condicional, será utilizado também os critérios de informação AIC e BIC para definir qual o número ideal de lags a

(32)

Modelo AIC BIC

AR(1) −6, 532e + 03 −6, 517e + 03 AR(2) −6, 559e + 03 −6, 538e + 03 AR(3) −6, 557e + 03 −6, 532e + 03

Tabela 3 – Critérios de informação

Parâmetros ARCH(1) GARCH(1,1) GARCH(1,2)

Constante (α0) 7, 406e− 05 4, 853e− 05 5, 564e− 05

Lag1 (α1) — 0, 265 0, 167

Lag1 (β1) 0, 240 0, 237 0, 237

Lag2 (β2) — — 0, 025

LogVerossimilhança ( ln(L)) 3, 191e + 03 3, 195e + 03 3, 195e + 03 Tabela 4 – Estimação GARCH

serem incluídos no modelo GARCH(p, q). Para isso, definimos um conjunto de modelos para serem comparados entre si, dentre estes, ARCH(1), GARCH(1,1) e GARCH(1,2):

Com os modelos especificados, conforme Tabela 4, e antes de performar a análise dos critérios de informação, é interessante olhar o gráfico de autocorrelação da variância do ativo sintético Zt, conforme a Figura 6.

Figura 6 – Função Autocorrelação Amostral da Variância de Zt

O gráfico de autocorrelação amostral da variância de Zt sugere a presença de até

dois lags. Analisado em conjunto com os valores dos critérios de informação performados para os modelos contidos na Tabela 5.

(33)

Modelo AIC BIC

ARCH(1) −6, 378e + 03 −6, 368e + 03 GARCH(1,1) −6, 383e + 03 −6, 368e + 03 GARCH(1,2) −6, 381e + 03 −6, 361e + 03

Tabela 5 – Critérios de informação variância

O critério AIC sugere a inclusão de um GARCH(1,1) por conta de obter o me-nor valor entre os três modelos comparados. Já o critério BIC propõe marginalmente a modelagem por um ARCH(1). Entretanto, pela diferença ser quase nula entre o valor do critério BIC para modelagem de um ARCH(1) no lugar do GARCH(1,1), pelo critério AIC apontar um valor maior para o prórpio GARCH(1,1) e pela análise gráfica da auto-correlação apontar até dois lags na variância de Zt, optou-se pela modelagem de variância

condicional pelo modelo GARCH(1,1).

Com o modelo já especificado e estimado, pode-se iniciar a construção das bandas com base em uma previsão h passos a frente, conforme roteiro descrito no capítulo 3.

Para a avaliação, recalibragem e simulação de negócios serão utilizados os preços de trade à partir do dia 08/01/2016 às 11h40min até o dia 23/02/2016 (respeitando a faixa de tempo das 11h00min até às 15h00min, conforme descrito anteriormente). Sendo assim, foram estabelcidas algumas premissas para o sistema de trading:

• O sistema utilizará uma janela móvel de 1000 minutos de preços das ações para a

calibragem do modelo;

• O intervalo para recalibragem será de h (tamanho da previsão), que para o caso

aqui proposto será h = 10;

• As bandas de probabilidade condicional adotadas serão calculadas com um intervalo

de confiança fixo de (1− α)% = 95%;

• A partir da reestimação com a janela móvel, o modelo utilizará a mesma

espe-cificação encontrada anteriormente, ou seja, será mantido constante o AR(2) e GARCH(1,1);

Com base nas premissas descritas, o sistema de trading trabalhará conforme a Figura 7.

Na parte superior, pode-se observar a evolução do ativo sintético ao longo dos 1000 minutos contruídos. Com base nessa amostra, o modelo estima o AR(2) e o GARCH(1,1) para efetuar a previsão na forma de distribuição de probabilidade condicional, conforme a parte inferior da Figura 7.

(34)

Figura 7 – Evolução ativo sintético e previsão

Após essa construção, a ideia do sistema de trading é receber os 10 novos valores do ativo sintético Zte comprá-lo ou vende-lo com base nas premissas contruídas, conforme

a Figura 8.

Figura 8 – Evolução ativo sintético e bandas

A partir desse momento, criou-se um sistema de trading, que efetua a previsão na forma de probabilidade condicional para h minutos a frente e os utiliza para montagem de posição, caso as realizações de Zt ultrapassem qualquer banda. Com essa construção, é

possíveal analisar as previsão realizadas para todo intervalo proposto, conforme a Figura

(35)

Figura 9 – Evolução ativo sintético realizado e previsão AR(2)- 04/01/2016 até 23/02/2016

Na parte superior da Figura9, observa-se a realização do ativo sintético em função do tempo. Para a parte inferior, apresenta-se a realização dos primeiros 1000 minutos do ativo sintético Zt utilizados para a estimação do modelo e a realização da previsão Zbt.

É possível analisar que apesar da previsão ser linear, descrito por um processo AR(2), as recalibragens em intervalos de h = 10 fazem com que a previsão apresente um ruído próximo ao observado na realização do ativo sintético.

A mesma análise é feita para a variância do ativo sintético ao longo de toda a sua realização, conforme a Figura 10.

Da mesma forma que Ztb , a previsão √

c

σ2

t+h também captura, em certo nível, os

ruídos formados pela realização natural da variância de Zt por conta da recalibragem

feita em intervalos de h = 10. Utilizar um tamanho de 1000 minutos também ajudou na performance do algoritmo. O intervalo total contou com 7950 realizações do ativo sintético, sendo que o sistema foi reestimado 690 vezes ao longo do período completo.

Seguindo o objetivo proposto, a Figura11mostra a evolução do ativo sintético Zt

e logo abaixo, o mesmo Zt com as bandas Zbt+hL,α (low) e Zb H,α

t+h (high) projetadas.

Com a previsão gerada em forma de probabilidade condicional nos moldes de

3.4 e 3.5, percebe-se que o componente GARCH ajusta dinamicamente os intervalos de confiança, conforme as discrepâncias de preços do ativo sintético se tornam mais voláteis. Dessa forma, consegue-se previnir trades em perídos de alta volatilidade e se reduz o risco das operações. Pode-se observar a evolução do ativo sintético nos primeiros 1000 minutos (estimação do modelo) e a partir desse ponto a construção da bandas baseadas em uma previsão de 10 minutos a frente, e a evolução do próprio ativo sintético dentro das bandas.

(36)

Figura 10 – Variância realizada e GARCH(1,1) - 04/01/2016 até 23/02/2016

Figura 11 – Realizacão do ativo sintético e bandas de probabilidade condicional Zb_t+hL,α e b

Z_t+hH,α - 04/01/2016 até 23/02/2016

4.2 Operações com ordens limitadas

O trabalho propõe um sistema em (AE) com abordagem em alta-frequência. Para o modelo ser aplicável ao mercado, tomou-se algumas premissas:

• As quantidades de compra e venda de X1 e X2 serão multiplicadas por 5.000 e

arredondadas para o inteiro mais próximo;

• Portfólio inicial de R$ 100.000,00;

(37)

vendas pelo Ask, conforme a Figura 12:

Figura 12 – Preços por fechamento de minuto Bid and Ask - 04/01/2016 até 23/02/2016

Figura 13 – LogRetornos Acumulados dos preços Bid and Ask de PETR3 e PETR4 -04/01/2016 até 23/02/2016

4.2.1 Operações sem custos de transação

Na Figura14é possível visualizar, em maior detalhe, como o sistema se comportou com a evolução do ativo sintético Zt já envelopado pelas bandas de trading. Os pontos

verdes representam as operações de compra de Zt e os vermelhos de venda.

Analisando os resultados da Tabela6, pode-se observar que, em todas as operações o sistema obteve resultado positivo. O método proposto mostrou boa performance ao de-tectar distorções, por menor que fossem no par de ações analisado. Entretanto, o trabalho

(38)

Figura 14 – Sistema de Trading formado pelo ativo sintético e pelas bandas de trading -04/01/2016 até 11/01/2016

utilizou a premissa de que todas as ordens seriam executas assim que as fossem enviadas. Um dos princiapis problemas ao trabalhar com dados em alta-frequência é justamente efetivar ambas as ordens instantaneamente. Outro problema é o volume a ser operado, já que se este for muito grande, pode-se afetar o preço dos papéis aumentando a proba-blidade de não ter a ordem efetivada. Pelo lado oposto, trabalhar com um volume muito pequeno faria com que o lucro apresenta-se queda, o que não compensaria a depender dos custos de transação.

Considerando o período inteiro em que o sistema operou de 08/01/2016 às 11h40min até o dia 23/02/2016 às 15h, foram montadas 476 posições sendo de compra ou venda do ativo sintético. Foram contabilizados 238 trades concluídos. Desses 238, apenas, 21 auferiram prejuízo, ou seja, 9% da amostra de trades. Em linha, pode-se analisar a Figura

15 que mostra o P&L do sistema no período completo.

(39)

Posição Preço Preço Qtd Qtd

Data Zt βt Zt X1 X2 X1 X2 P&L 8/1/16 12:20 Compra 0, 8022 −0, 0104 8, 00 6, 4 −4011 5000 -8/1/16 12:48 Venda 0, 8022 0, 0260 7, 86 6, 32 4011 −5000 161,54 8/1/16 12:48 Venda 0, 8002 0, 0260 7, 86 6, 32 4001 5000 -8/1/16 12:52 Compra 0, 8002 −0, 0138 7, 83 6, 25 −4001 5000 229,97 8/1/16 12:52 Compra 0, 8010 −0, 0138 7, 83 6, 25 −4005 5000 -8/1/16 14:59 Venda 0, 8010 0, 0013 7, 8 6, 23 4005 −5000 20,15 11/1/16 10:55 Venda 0, 7979 0, 0358 7, 77 6, 25 3990 −5000 -11/1/16 13:01 Compra 0, 7979 −0, 0183 7, 7 6, 19 −3990 5000 20,7 11/1/16 13:01 Compra 0, 8059 −0, 0183 7, 7 6, 19 −4030 5000 -11/1/16 13:09 Venda 0, 8059 0, 0171 7, 68 6, 2 4030 −5000 130,6 11/1/16 13:09 Venda 0, 8053 0, 0171 7, 68 6, 2 4027 −5000 -11/1/16 13:33 Compra 0, 8053 −0, 0139 7, 69 6, 17 −4027 5000 190,97 11/1/16 13:33 Compra 0, 8051 −0, 0139 7, 69 6, 17 −4026 5000 -11/1/16 13:50 Venda 0, 8051 0, 0199 7, 65 6, 17 4026 −5000 161,04 11/1/16 13:50 Venda 0, 8042 0, 0199 7, 65 6, 17 4021 −5000 -11/1/16 13:52 Compra 0, 8042 −0, 0118 7, 66 6, 15 −4021 5000 140,21 11/1/16 13:52 Compra 0, 8043 −0, 0118 7, 66 6, 15 −4021 5000 -11/1/16 14:06 Venda 0, 8043 0, 0173 7, 62 6, 13 4021 −5000 60,84 11/1/16 14:06 Venda 0, 8025 0, 0173 7, 62 6, 13 4012 −5000 -11/1/16 14:32 Compra 0, 8025 −0, 0180 7, 69 6, 15 −4012 5000 180,84 11/1/16 14:32 Compra 0, 8029 −0, 0180 7, 69 6, 15 −4015 5000 -11/1/16 15:00 Venda 0, 8029 −0, 0034 7, 67 6, 16 4015 −5000 130,3

Tabela 6 – Primeiros 2 dias de negócios

O sistema obteve lucro de R$ 35.177,15 considerando o portfólio incial composto por R$ 100.000,00. O lucro dentro do intervalo de 30 dias úteis representou 35,18% do patrimônio da carteira. Dos 10 trades que trouxeram prejuízo ao portfólio, o menor destes foi de R$ 380,65, o que representou -0,38% do patrimônio da carteira.

Conforme a Figura 16, é possível visualizar como estão distribuídos os lucros por

trade.

Pelo boxplot, pode-se analisar que a mediana está localizada no ponto 0,16%, enquanto o primeiro e terceiro quartil estão em 0,1% e 0,22%, respectivamente. Agora, visualizando o histograma (primeira figura), a média de lucro por trade é de 0,16%. O máximo e mínimo da amostra estão posicionados em 0,4% e -0,38%, respectivamente.

(40)

Figura 16 – Histograma e Boxplot do P&L por trade - 08/01/2016 até 23/02/2016

4.2.2 Operações com custos de transação

Para as simulações de negócios considerando os custos foram utilizados os mesmos critérios e período do sistema de trading exposto anteriormente. Para a adição dos custos, foram consideradas as seguintes premissas:

• 0% de rebate;

• Custos de 0,1% com corretagem por ordem executada;

• 0,0250% por volume negociado de emolumentos em operações day trade;

• 0% de aluguel. Todas as posições são encerradas no fim de cada dia pelo último

preço disponível.

Pela Figura17, pode-se observar o P&L acumulado por trade efetuado. Neste caso, o sistema identificou as mesmas discrepâncias e efetuou as mesmas operações do modelo anterior. Entretanto, o P&L com a inserção dos custos caiu drasticamente para 6,6%, uma queda de aproximadamente 81% em comparação com o modelo sem a incorporação dos custos. Em algumas ocasiões, principalmente ao efetuar os primeiros trades, o P&L acumulado ficou negativo e só a partir do 35o _{trade que voltou a gerar lucro.}

Na Figura 18, tem-se o boxplot e histograma com a abordagem sem e com cus-tos de transação. A análise mostra que a distribuição que considera os cuscus-tos teve um deslocamento de 0,1% para a esquerda. Como em alguns trades o lucro era quase nulo, a inserção dos custos fez com que 72 resultassem em prejuízo, representando 30,3% da amostra. Operar em alta-frequência exige um dispêndio financeiro alto com os custos, principalmente quando considerado um nível alto de corretagem.

(41)

Figura 17 – P&L Acum. com custos de transação do Sistema de Trading - 08/01/2016 até 23/02/2016

Figura 18 – Histograma e Boxplot do P&L por trade sem e com custos de transação -08/01/2016 até 23/02/2016

4.3 Operações com ordens a mercado

Até o momento, foi considerada a hipótese de que todas as ordens enviadas ao book eram em formatos limitados. Entretanto, na prática, as ordens podem não ser executadas durante o período de um minuto. Essa situação poderia desencadear uma falha sistêmica do modelo. Uma alternativa, seria considerar a compra no melhor ask e a venda no melhor

bid. Para isso, foram consideradas as mesmas premissas descritas nas seções anteriores.

Na Figura19, pode-se observar que o P&L acumulado apresenta queda relevante para os trades efetuados. O prejuízo acumulado foi de aproximadamente 15% nos 30 dias úteis analisados. Dos 238 trades, 70% resultaram em prejuízo. O método em (AE) proposto,

(42)

Figura 19 – P&L Acum. do Sistema de Trading com ordens a mercado - 08/01/2016 até 23/02/2016

se aproveita das discrepâncias de preços entre o par de ações por menor que sejam, neste caso, efetuar as ordens a mercado torna o modelo inutilizável. Naturalmente, visto que nesses casos, não há oportunidades de arbitragem. Essa é uma decisão importante para o sistema automático de identificações de oportunidades de arbitragem.

(43)

42

5 Considerações finais

Este trabalho teve como objetivo construir uma ferramenta para identificação de oportunidades de arbitragem estatística (AE) em pairs trading e aplicá-la ao mercado brasileiro. Essa abordagem baseou-se na construção de um ativo sintético que tivesse a natureza de reversão à média. Após isso, foram conduzidas previsões na forma de den-sidade de probabilidade condicional, formando intervalos de confiança. Ainda houve a inclusão de custos de transação para deixar o modelo mais próximo da realidade.

Os resultados da aplicação com ordens limitadas mostraram-se satisfatórios para a detecção de possíveis oportunidades de arbitragem, e mesmo após a inclusão dos custos, o modelo obteve um bom retorno acumulado. Entretanto, sua aplicabilidade ao mundo real ainda é altamente questionável principalmente pelos níveis de custos e discrepâncias vistas no mercado. Os resultados com custos de transação mostraram queda no P&L de mais de 80% quando comparado ao modelo sem custos. Para o segundo caso, o modelo tem a característica de se aproveitar de pequenas discrepâncias entre os preços das ações. Neste caso, o volume a ser operado é extremamente relevante, já que um volume muito expressivo em relação ao operado por minuto poderia tornar o modelo um market maker, o que iria totalmente contra a abordagem proposta. Apesar dos testes considerarem o

Bid and Ask spread, outro possível impacto realizado pelo volume seria a não efetivação

das posições dentro da frequência estipulada, o que seria equivalente ao desajuste do

β calculado e poderia desencadear em uma pane no sistema de trading. Por sua vez,

considerar o envio das ordens a mercado como candidato à solução para o problema de falha sistêmica implica em tornar o modelo inutilizável.

Quanto ao back-testing realizado, apesar de ter-se utilizado quase 8000 sequências de preços, o intervalo de tempo coberto foram apenas 30 dias úteis. Dessa forma, a apli-cabilidade ainda é questionável já que pode não ter-se capturado momentos em que o par de ativos não reverte à média. O problema de se realizar back-testings em janelas temporais maiores é que o algoritmo requer um tempo considerável para a estimação a cada previsão realizada. O modelo ainda trabalha com um erro de especificação ao longo de todo o seu teste, já que foi especificado com base em uma amostra de 1000 preços iniciais e considerado constante ao longo de todo o back-testing.

Como sugestão de trabalhos futuros, o modelo poderia não desmontar as posições que acarretassem em prejuízo gerados pela inclusão dos custos ou pela abordagem de ordens a mercado. Essa modificação poderia apresentar resultados mais interessantes em termos de performance, já que reduziria a quantidade de trades realizados ao longo do tempo. Outra possível solução para o critério dos custos e pela efetividade das posições

(44)

Capítulo 5. Considerações finais 43

seria uma abordagem em baixa-frequência, diferentemente do proposto neste trabalho. Em termos de sofisticação para o modelo, poderia-se utilizar uma rede neural para ajustar o

fitting das previsões realizadas. E por fim, a inclusão de uma banda de stop-loss poderia

minimizar o risco de perdas relevantes em momentos que o ativo sintetico não reverta à média.