• Nenhum resultado encontrado

2.6 Combina¸c˜ao de proje¸c˜oes

2.6.1 Combina¸c˜ao com Momento Parcial Inferior

em que, K ´e o n´umero de modelos a serem combinados.

No m´etodo shrinkage, os pesos s˜ao calculados utilizando o estimador de regress˜oes de m´ınimos quadrados entre os valores projetados dos modelos ˆyt+h,t e os valores da amostra

hold-out yt+h,t. Conforme Granger e Ramanathan (1984), as regress˜oes s˜ao estimados de

forma recursiva e sem intercepto e os pesos s˜ao calculados por meio da express˜ao 2.6.11,

ωshrinkagei,t = λ ˆβit+ (1 − λ) (1/n) , (2.6.11)

em que, ˆβit´e o estimador da regress˜ao, λ = max {0, 1 − κ [n/ (t − h − T0− n)]} e κ ´e uma

constante que controla a combina¸c˜ao, quanto maior o κ, menor o valor de λ o que faz o valor de ωi,t estabilizar muito pr´oxima da pondera¸c˜ao com pesos iguais.

Conforme observa-se no Quadro 8, em todos os estudos o uso da combina¸c˜ao melhorou significativamente a performance das proje¸c˜oes. Os trabalhos de Cavaleri (2008), Huang e Lee (2013) e Baumeister et al. (2014) s˜ao relevantes por estarem associados aos objetivos do presente projeto.

Em Cavaleri (2008), as proje¸c˜oes por meio de modelos de estima¸c˜ao de volatilidade foram combinadas, sendo que as combina¸c˜oes demonstraram melhores resultados em rela¸c˜ao as proje¸c˜oes individuais.

em alta frequˆencia para as estima¸c˜oes dos modelos, o uso das combina¸c˜oes tamb´em me- lhoraram os resultados das proje¸c˜oes.

Foram propostos diversos m´etodos para escolha dos pesos e ainda n˜ao existe um con- senso entre os pesquisadores sobre qual peso ´otimo deveria ser utilizado. Al´em disto, do ponto de vista pr´atico, pouco foi discutido sobre a combina¸c˜ao de proje¸c˜oes que apresen- tem as menores chances de evidenciar riscos abaixo de algum n´ıvel esperado.

Neste caso, as diversas pesquisas da ´area focaram em desenvolver m´etodos diferencia- dos para escolher os pesos ´otimos para minimizar os erros de previs˜ao. Entretanto, n˜ao foram desenvolvidos trabalhos que busquem selecionar os pesos ´otimos que minimizem o risco de uma previs˜ao ineficiente para prote¸c˜ao das perdas.

Para o caso do investidor que precisa se proteger do risco da opera¸c˜ao, deve-se esco- lher a melhor proje¸c˜ao que combine a tarefa de evitar perdas acima do esperado e n˜ao cause provisionamento em excesso no ponto de vista or¸cament´ario. Diante disto, torna-se necess´ario um m´etodo de pondera¸c˜ao que apresente uma proje¸c˜ao parcimoniosa com as contas do investidor e eficiente para prote¸c˜ao de riscos.

No pr´oximo t´opico, prop˜oe-se um m´etodo inovador que considera a minimiza¸c˜ao do risco de para prote¸c˜ao das perdas. Busca-se posicionar mais pesos para as proje¸c˜oes que apre- sentem as menores chances de evidenciar riscos abaixo de algum n´ıvel esperado.

73

Newbold e Granger (1974) 80 s´eries mensais

Box-Jenkins, Suavizamento exponencial, autoregress˜ao

Pondera¸c˜ao pelo MSFE Combina¸c˜ao melhor performance

Winkler e Makridakis (1983) S´eries macro e micro econˆomicas

10 m´etodos de proje¸c˜oes

Pondera¸c˜ao pelo MSFE e pesos iguais

Combina¸c˜ao pesos iguais melhor performance Makridakis e Hibon (2000) Proje¸c˜oes dos participantes

da M3-Competition

24 m´etodos de

proje¸c˜oes Pesos iguais

Combina¸c˜ao melhor performance Stock e Watson (2004) 73 proje¸c˜oes de dados econˆomicos

de 7 pa´ıses da OECD∗

M´etodos lineares e n˜ao lineares

Pondera¸c˜ao pelo MSFE, shrinkage, pesos iguais, PCA, Filtro de Kalman

Combina¸c˜ao pesos iguais melhor performance Marcellino (2004) 500 s´eries macroeconomicas

de pa´ıses da EMU∗∗

M´etodos lineares e n˜ao lineares

Pesos iguais, mediana das proje¸c˜oes, shrinkage

Combina¸c˜ao pesos iguais melhor performance Aiolfi e Timmermann (2006) 43 s´eries de dados econˆomicos

de 7 pa´ıses da OECD

M´etodos lineares e n˜ao lineares

Pondera¸c˜ao pelo MSFE, shrinkage, pesos iguais

Combina¸c˜ao pesos iguais melhor performance Cavaleri (2008) Ibovespa, Dow Jones e IGP-M∗∗∗

M´etodos para estima¸c˜ao de volatilidade

Pesos iguais, shrinkage e Filtro de Kalman

Combina¸c˜ao por shrinkage melhor performance Rapach e Zhou (2013) 14 s´eries mensais de equity

premium dos EUA

M´ınimos quadrados ordin´arios

Pondera¸c˜ao pelo MSFE, shrinkage, pesos iguais, PCA

Combina¸c˜ao melhor performance Huang e Lee (2013) S´erie em alta frequˆenciado ´ındice S&P500 Regress˜oes quant´ılicas Pesos iguais, mediana dasproje¸c˜oes e PCA Combina¸c˜performanceao melhor Baumeister et al. (2014) S´erie de pre¸co de petr´oleo Modelo MIDAS Pesos iguais Combina¸c˜ao melhor

performance

Organisation for Economic Co-operation and Development,∗∗European Monetary Union,∗∗∗´Indice Geral de Pre¸cos - Mercado.

2.6.1 Combina¸c˜ao com Momento Parcial Inferior

As formas mais conhecidas de pondera¸c˜ao foram apresentadas na se¸c˜ao anterior. No pre- sente t´opico ´e proposta, de forma in´edita, a utiliza¸c˜ao do Momento Parcial Inferior (Lower Partial Moment - LPM ) para obter as combina¸c˜oes de proje¸c˜oes para volatilidade perce- bida.

A variˆancia ´e uma medida de risco muito utilizada para a obten¸c˜ao da variˆancia de um portf´olio. Entretanto outras medidas de risco s˜ao utilizadas al´em da variˆancia. Roy (1952) e Markowitz (1959) sugerem respectivamente as medidas Safety First e Semivariance. Foo e Eng (2000) e Nawrocki (1999) mostram que estas medidas podem ser representadas por meio de um modelo generalizado denominado Lower Partial Moment (LPM).

O LPM foi primeiramente apresentado em Bawa e Lindenberg (1977). O LPM ´e uma medida de risco baseada na perspectiva que um investidor possua preferˆencia por investi- mentos que apresentem as menores chances de evidenciar retornos abaixo de algum n´ıvel esperado. O LPM de ordem k ´e dado pela express˜ao 2.6.12,

LP Mk,τ(X) ≡ E



[min (X − τ, 0)]k, (2.6.12) em que, X ´e a taxa de retorno, E [·] ´e o valor esperado da vari´avel aleat´oria [min (X − τ, 0)]k, τ ´e uma constante relacionada ao retorno desejado e k ´e a ordem.

A presente tese tem como objetivo propor uma metodologia para a obten¸c˜ao dos pesos para a combina¸c˜ao de volatilidades percebidas projetadas. A combina¸c˜ao de volatilidade percebida estimada ( ˆRVct+h) para o instante t + h com duas proje¸c˜oes ´e dada por,

ˆ

RVct+h= ω1RVˆ 1,t+h+ ω2RVˆ 2,t+h, (2.6.13)

em que, ˆRV1,t+h´e a volatilidade percebida projetada pelo modelo 1 para o instante t + h

, ˆRV2,t+h ´e a volatilidade percebida projetada pelo modelo 2 para o instante t + h, ω1 ´e

o peso associado a volatilidade percebida projetada pelo modelo 1 para o instante t + h, ω2´e o peso associado a volatilidade percebida projetada pelo modelo 2 para o instante t+h.

Conforme Timmermann (2006), os valores ω1 e ω2 s˜ao obtidos pela minimiza¸c˜ao do erro

de previs˜ao. Deste modo, ser´a dado mais peso a proje¸c˜ao que apresentou menor erro de previs˜ao. Para obter o erro de previs˜ao minimizado, deve-se utilizar as express˜oes 2.6.14 e 2.6.15,

σc2 = ω2σ12+ (1 − ω)2σ22+ 2ω (1 − ω) σ1,2, (2.6.15)

em que, ei,t+h= ˆRVi,t+h− RVi,t+h, σ12 e σ22 s˜ao as variˆancias dos erros das proje¸c˜oes 1 e 2

e σ1,2 ´e a covariˆancia entre os erros e1,t+h e e2,t+h.

Pode-se obter os pesos que minimizam o erro de previs˜ao, conforme express˜ao 2.6.16,

ω = σ 2 2− σ1,2 σ2 1 + σ22− σ1,2 . (2.6.16)

Conforme o resultado, Bates e Granger (1969) e Newbold e Granger (1974) apresentam que o valor de ω pode ser obtido como na express˜ao 2.6.17 para o caso de duas proje¸c˜oes e express˜ao 2.6.18 para o caso de n proje¸c˜oes,

ω = e 2 2,t+h− e1,2 −1 e2 1,t+h+ e22,t+h− e1,2 −1, (2.6.17) ωi = Σ−1ι ι′Σ−1ι , (2.6.18)

em que, ι′ = (1, 1, . . . , 1) e Σ ´e apresentado em 2.6.19,

Σ =      

var(e1) cov(e1, e2) · · · cov(e1, en)

cov(e2, e1) var(e2) · · · cov(e2, en)

... ... . .. ...

cov(en, e1) cov(en, e2) · · · var(en)

     . (2.6.19)

Por meio de resultados emp´ıricos, Newbold e Granger (1974) e Timmermann (2006) apre- sentam que a obten¸c˜ao dos pesos conforme a express˜ao 2.6.20 apresentou melhor perfor- mance para o caso de duas proje¸c˜oes.

ω = e 2 2,t+h −1 e2 1,t+h+ e22,t+h −1, (2.6.20)

Para o caso de K proje¸c˜oes a express˜ao 2.6.20 foi proposta como na express˜ao 2.6.21,

ωi =  PT t=1  ˆ RVi,t+h− RVi,t+h 2−1  PK i=1 PT t=1  ˆ RVi,t+h− RVi,t+h 2−1. (2.6.21)

A obten¸c˜ao dos pesos por meio da express˜ao 2.6.21 ´e equivalente a obten¸c˜ao dos pesos pelo m´etodo MSFE (express˜ao 2.6.7 quando δ = 1). Assim como ocorre quando utiliza-se

a variˆancia como medida de risco, este m´etodo de pondera¸c˜ao n˜ao considera a perspectiva de que um investidor possua preferˆencia por uma proje¸c˜ao que apresente a menor chance de evitar perdas acima do esperado quando o mesmo busca prote¸c˜ao de riscos.

Diante disto, assumindo que RVt+h´e a verdadeira volatilidade percebida observada, para

o investidor que precisa se proteger do risco da opera¸c˜ao, a rela¸c˜ao ˆRVi,t+h ≥ RVt+h seria

o melhor cen´ario para evitar perdas acima do esperado.

Deste modo, a rela¸c˜ao ˆRVi,t+h − RVt+h ≥ 0 seria observada como uma proje¸c˜ao par-

cimoniosa e ˆRVi,t+h− RVt+h < 0 como uma proje¸c˜ao ineficiente para prote¸c˜ao de riscos.

Desta forma, este risco de obter uma proje¸c˜ao ineficiente precisa ser minimizado.

Na presente tese prop˜oe-se a fun¸c˜ao minRVˆ i,t+h− RVt+h, 0



como o erro de previs˜ao ei,t+h. Desta forma, o novo erro de proje¸c˜ao (ec2t+h) combinando os modelos 1 e 2 ´e obser-

vado na express˜ao em 2.6.22, ec2t+h = ωhminRVˆ 1,t+h− RVt+h, 0 i + (1 − ω)hminRVˆ 2,t+h− RVt+h, 0 i . (2.6.22) A variabilidade do erro de proje¸c˜ao ec2

t+h ´e obtida pela express˜ao 2.6.23,

LP Mc = ω2E  A21+ (1 − ω)2EA22+ 2ω (1 − ω) E [A1A2] , (2.6.23) em que, A1 = min  ˆ RV1,t+h− RVt+h, 0  e A2 = min  ˆ RV2,t+h− RVt+h, 0  .

Como pode ser observado, os valores de A1 e A2 s˜ao equivalentes ao LPM de ordem

2, como ´e expresso em 2.6.24,

LP Mi,2 ≡ E

h

minRVˆ i,t+h− RVt+h, 0

i2

, (2.6.24)

em que, ˆRVi,t+h− RVt+h´e o erro de previs˜ao.

A rela¸c˜ao E [A1A2] ´e definida como cosemivariˆancia, conforme apresentam Nawrocki e

Cumova (2011). A obten¸c˜ao da cosemivariˆancia n˜ao ´e trivial, uma vez que E [A1A2] e

E [A2A1] n˜ao s˜ao iguais, conforme foi demonstrado em Hogan e Warren (1972), Hogan

e Warren (1974), Nawrocki e Cumova (2011) nas express˜oes 2.6.25 e 2.6.26 quando ´e considerado o caso da cosemivariˆancia (CSi,j) entre ativos financeiros,

CSi,j = 1 T T X t=1 (Xi,t − τ) [min (Xj,t− τ, 0)] , (2.6.25)

CSj,i= 1 T T X t=1 (Xj,t− τ) [min (Xi,t − τ, 0)] . (2.6.26)

Diante deste problema, Nawrocki e Cumova (2011) prop˜oem a utiliza¸c˜ao da rela¸c˜ao 1/2 (CSi,j + CSj,i) para que a cosemivariˆancia i, j e j, i sejam iguais.

Por meio destes resultados, pode-se obter os pesos do novo erro de previs˜ao por meio da condi¸c˜ao de primeira ordem ∂LP Mc

∂ω , considerando

Pn

i=1ωi = 1. Para o caso de duas

proje¸c˜oes, o novo peso ωlpmf e ´e proposto como 2.6.27,

ωlpmf e = (LP M2,t+h− 1/2 (CLP M1,2+ CLP M2,1))

−1

(LP M1,t+h+ LP M2,t+h− 1/2 (CLP M1,2+ CLP M2,1))−1

, (2.6.27)

em que, CLP Mi,j e CLP Mj,i s˜ao apresentados nas express˜oes 2.6.28 e 2.6.29,

CLP Mi,j = 1 T T X t=1  ˆ RVi,t+h− RVt+h  h minRVˆ j,t+h− RVt+h, 0 i , (2.6.28) CLP Mj,i= 1 T T X t=1  ˆ RVj,t+h− RVt+h  h minRVˆ i,t+h− RVt+h, 0 i . (2.6.29) Para o caso de K proje¸c˜oes, os pesos propostos s˜ao obtidos como 2.6.31,

ωilpmf e= LP M + LP M ′ /2−1ι ι′(LP M + LP M′/2)−1ι , (2.6.30) em que, ι′ = (1, 1, . . . , 1) e LP M ´e apresentado em 2.6.31, LP M =       LP M1 CLP M1,2 · · · CLP M1,n CLP M2,1 LP M2 · · · CLP M2,n ... ... . .. ... CLP Mn,1 CLP Mn,2 · · · LP Mn      . (2.6.31)

Por meio dos resultados emp´ıricos em Newbold e Granger (1974) e Timmermann (2006), pode-se adaptar a obten¸c˜ao dos pesos apresentada em 2.6.20 por uma express˜ao baseada na fun¸c˜ao LPM 2.6.32 para o caso de duas proje¸c˜oes,

ωlpmf e′ = (LP M2,t+h)

−1

(LP M1,t+h+ LP M2,t+h)−1

Para o caso de K proje¸c˜oes a express˜ao 2.6.32 ´e proposta como na express˜ao 2.6.33, ωlpmf ei = P T t=1min  ˆ RVi,t+h− RVi,t+h, 0 2−1 P K i=1 PT t=1min  ˆ RVi,t+h− RVi,t+h, 0 2−1. (2.6.33)

O m´etodo de combina¸c˜ao sugerido ´e denominado Lower Partial Moment Forecast Er- ror – LPMFE. Um m´etodo similar ao LPMFE ´e o m´etodo Mean Squared Forecast Error (MSFE), apresentado nas express˜oes 2.6.7 e 2.6.8. Por´em, no m´etodo LPMFE o objetivo ´e atribuir mais peso as combina¸c˜oes que demonstraram menores valores na medida LPM.

Deste modo, as proje¸c˜oes que apresentaram volatilidade abaixo do que realmente foi observado devem receber menos peso durante o processo de combina¸c˜ao. Uma vez que projetar uma volatilidade abaixo do que realmente ocorre no mercado conduzir´a perdas acima do esperado pelo gestor, o que causar´a problemas financeiros ao investidor.

No m´etodo LPMFE ´e assumido que o Momento parcial inferior ´e fixo no tempo. Desta forma, as proje¸c˜oes que demonstrarem menor LPM, em todo o per´ıodo analisado, recebe- r˜ao maior peso. Contudo, conforme apresentam Diebold e Pauly (1987), alguns modelos podem demonstrar melhor desempenho conforme a varia¸c˜ao do tempo.

Diante disto, uma melhor forma de combina¸c˜ao seria dar mais peso as proje¸c˜oes que demonstrassem melhor desempenho conforme a janela de tempo observada. Deste modo, tamb´em de forma in´edita, prop˜oe-se o m´etodo denominado Discounted Lower Partial Moment Forecast Error - DLPME apresentado na express˜ao 2.6.34 para o caso de duas proje¸c˜oes e na express˜ao 2.6.35 para o caso de K proje¸c˜oes.

ωdlpmf e = PT t=1δT −tLP M2,t+h −1 PT t=1δT −tLP M1,t+h −1 +PTt=1δT −tLP M 2,t+h −1, (2.6.34) ωdlpmf ei = P T t=1δT −tmin  ˆ RVi,t+h− RVi,t+h, 0 2−1 P K i=1 PT t=1δT −tmin  ˆ RVi,t+h− RVi,t+h, 0 2−1. (2.6.35)

Um m´etodo similar ao DLPMFE ´e o m´etodo Discounted Mean Squared Forecast Error (DMSFE) proposto em Diebold e Pauly (1987), apresentado nas express˜oes 2.6.7 e 2.6.8 e assumindo que δ = 0, 9.

nor erro m´edio quadr´atico considerando os per´ıodos mais recentes. Por´em, no m´etodo DLPME, as proje¸c˜oes que demonstrarem menor LPM, na performance mais recente ob- servada, receber˜ao maior peso.

O valor de δ significa o grau de desconto para os dados mais recentes. Neste artigo foi utilizado o valor de δ = 0, 9, comumente utilizado na literatura conforme apresentam Stock e Watson (2004).

3

Metodologia

A presente tese trata-se de um estudo quantitativo de car´ater descritivo com o objetivo de estudar os estimadores da volatilidade dos pre¸cos de a¸c˜oes utilizando dados de negocia¸c˜oes em alta frequˆencia. O objetivo principal ´e apresentar uma teoria inovadora para obter a volatilidade futura a partir da combina¸c˜ao de volatilidades projetadas.

Como principal ponto de inova¸c˜ao, a tese prop˜oe, de forma in´edita, a utiliza¸c˜ao da fun¸c˜ao baseada no Momento Parcial Inferior (Lower Partial Moment - LPM) para estima¸c˜ao dos pesos para combina¸c˜ao das proje¸c˜oes de volatilidade. Os novos m´etodos de combina¸c˜ao de volatilidade s˜ao denominados de LPMFE (Lower Partial Moment Forecast Error), ex- posto na express˜ao 2.6.33 e DLPMFE (Discounted LPMFE) exposto na express˜ao 2.6.35.

Nesta tese s˜ao utilizados dados de negocia¸c˜oes tick by tick de a¸c˜oes cotadas na BO- VESPA. Estes dados foram obtidos na BMF&BOVESPA (ftp.bmf.com.br). Por meio da base de dados da BMF&BOVESPA pode-se analisar s´eries de tempo evento a evento de todas as a¸c˜oes e os contratos de op¸c˜oes e derivativos negociados (pre¸co, volume, cor- retora), tamb´em pode-se analisar as s´eries de ofertas de compras e vendas.

Foram selecionadas as 3 a¸c˜oes mais negociadas no per´ıodo entre os anos de 2012 a 2014. As a¸c˜oes foram: Petrobr´as-PN (PETR4), Vale do Rio Doce-PNA (VALE5), Itau-Unibanco- PN (ITUB4).

Na Figura 4 s˜ao detalhados os procedimentos para atingir os objetivos da pesquisa. Seja rt,i, o retorno intradi´ario, com t = 1, . . . , T per´ıodos di´arios e i = 1, . . . , M per´ıodos in-

tradi´arios, na primeira etapa as s´eries de Variˆancia Percebida (RV) s˜ao obtidas por meio dos K estimadores estudados.

Ap´os a obten¸c˜ao das s´eries di´arias RV, para cada uma, os modelos HAR-RV, MIDAS-RV, ARFIMA-RV e NN foram estimados e as proje¸c˜oes dos modelos individuais e respectivas combina¸c˜oes foram realizadas. Ap´os estas etapas, foram avaliadas as performances das proje¸c˜oes. Para a primeira etapa foram utilizados os softwares Hive e Python com o pa- cote Pandas, nas demais etapas foi utilizado o software R com os pacotes highfrequency, midasr e FNN.

Os resultados s˜ao apresentados em 4 etapas: obten¸c˜ao das s´eries de Variˆancia Percebida (RV), estima¸c˜ao dos modelos HAR-RV, MIDAS-RV, ARFIMA-RV e NN, combina¸c˜ao das proje¸c˜oes e avalia¸c˜ao de performance. Os procedimentos para cada etapa s˜ao apresentados nos t´opicos seguintes.

t=1

r

1,1

r

1,2

...

r

1,M

t=2

r

2,1

r

2,2

...

r

2,M

t=3

r

3,1

r

3,2

...

r

3,M

...

...

...

...

...

t=T

r

T,1

r

T,2

...

r

T,M

Combinação

HAR

MIDAS

ARFIMA

NN

RV1,1 RV1,2 RV1,3 ... RV1,T RVK,1 RVK,2 RVK,3 ... RVK,T

Projeção

...

...

...

...

...

Figura 4: Desenho da pesquisa FONTE: Elaborado pelo autor.

3.1

Obten¸c˜ao das s´eries de Volatilidade Percebida

Nesta etapa foram realizadas as seguintes tarefas de tratamento dos dados e estima¸c˜ao das medidas de volatilidade percebida. Como primeiro passo para tratamento dos dados foi realizada a verifica¸c˜ao dos dias sem negocia¸c˜ao/feriados e verifica¸c˜ao se houve mudan¸ca de per´ıodo de negocia¸c˜ao durante o hor´ario de ver˜ao, assim como ´e apresentado em Pontes (2014).

Em rela¸c˜ao a verifica¸c˜ao do per´ıodo de negocia¸c˜ao durante o hor´ario de ver˜ao, alguns fatos puderam ser observados. Durante o per´ıodo de hor´ario de ver˜ao entre 21 de outubro de 2012 `a 17 de fevereiro de 2013 n˜ao houve altera¸c˜ao do preg˜ao regular no mercado Bovespa, permanecendo a sess˜ao cont´ınua das 10h `as 17h.

Nos per´ıodos de hor´ario de ver˜ao entre 20 de outubro de 2013 `a 16 de fevereiro de 2014 e 19 de outubro de 2014 `a 22 de fevereiro de 2015 tamb´em n˜ao houve altera¸c˜ao do preg˜ao regular no mercado Bovespa. Deste modo, as negocia¸c˜oes permaneceram no hor´ario entre 10h `as 17h.

No Brasil existem os preg˜oes de abertura e fechamento, o leil˜ao de abertura ocorre 15 minutos antes do in´ıcio das negocia¸c˜oes e o lei˜ao de fechamento ocorre 5 minutos antes do fim das opera¸c˜oes. Dado a alta volatilidade antes, durante e ap´os estes per´ıdos, n˜ao foram considerados os pre¸cos negociados nos primeiros e nos ´ultimos 15 minutos.

Existe uma vasta literatura a respeito do comportamento intradi´ario de retornos de ativos no come¸co e fim de preg˜ao. Os principais resultados foram apresentados em Wood et al. (1985), Harris (1986) e McInish e Wood (1990). Conforme os autores, estes per´ıodos s˜ao caracterizados por alto n´umero de negocia¸c˜oes e alta volatilidade.

Diante disto, pesquisadores como Rydberg e Shephard (2003) n˜ao consideraram as ne- gocia¸c˜oes nos primeiros 15 minutos para evitar os efeitos do leil˜ao de abertura. Tamb´em foram desconsiderados os pre¸cos negociados no after-market (preg˜ao com dura¸c˜ao de 30 minutos que inicia 30 minutos ap´os o fim do hor´ario normal de negocia¸c˜ao). Isto tamb´em ocorreu devido que os pre¸cos s˜ao negociados fora do padr˜ao normal neste per´ıodo.

Ap´os o primeiro passo de tratamento dos dados, foi necess´ario um segundo passo, neste passo foi aplicado o procedimento de filtragem. Neste processo foram seguidos os proce- dimentos apresentados em Falkenberry (2001), Hansen e Lunde (2006), Brownless e Gallo (2006) e Barndorff-Nielsen et al. (2009).

Conforme Falkenberry (2001) a importˆancia da filtragem de dados cresceu significati- vamente mediante o crescimento da utiliza¸c˜ao s´eries financeiras em alta frequˆencia. Este crescimento ´e explicado em parte pelo aumento da capacidade de processamento dos com- putadores, custo de armazenagem de dados reduzido e computa¸c˜ao em paralelo que agiliza a tomada de decis˜ao.

Este maior poder computacional tornou vi´avel a utiliza¸c˜ao de grandes bancos de da- dos contendo dados em alta frequˆencia. Falkenberry (2001) apresenta que s´eries de dados em alta frequˆencia possuem diversas realiza¸c˜oes completamente fora de padr˜oes que n˜ao representam os pre¸cos que realmente est˜ao sendo negociados no mercado.

Diante disto, al´em do tratamento dos dados em rela¸c˜ao ao processo de ordena¸c˜ao dos hor´arios, verifica¸c˜ao dos dias sem negocia¸c˜ao/feriados e corre¸c˜ao para hor´ario de ver˜ao ´e necess´ario o procedimento de filtragem dos dados. Neste procedimento se busca equilibrar a forma de tratar os pontos aberrantes, de forma a retirar os pontos que n˜ao representam a s´erie de dados sem modificar as propriedades estat´ısticas.

filtragem de s´eries de dados em alta frequˆencia. Conforme o autor, o objetivo prim´ario ´e a remo¸c˜ao de outliers, por´em mantendo as propriedades de s´eries que s˜ao observadas em tempo real.

Por exemplo, existem saltos nas s´eries de dados observados em tempo real que n˜ao podem ser classificados como outlier, mas como um comportamento normal de mercado quando ocorre chegada de novas not´ıcias ou quando alto volume financeiro ´e transacionado.

Falkenberry (2001) demonstra duas abordagens gerais. A primeira ´e a “Busca e Reposi- ¸c˜ao/Retirada” (Search and Replace/Delete) de pre¸cos fora do padr˜ao; nesta abordagem busca-se encontrar pre¸cos fora do padr˜ao e verificar se o mesmo deve ser retirado ou tro- cado por algum valor pr´oximo ou alguma m´edia dos valores mais pr´oximos.

A segunda abordagem ´e gerar uma s´erie sint´etica por meio da s´erie original; neste caso, busca-se construir uma s´erie de dados que represente o comportamento b´asico de uma s´e- rie de pre¸cos. Um procedimento utilizado ´e gerar a s´erie sint´etica por meio de um ajuste de m´edias m´oveis, como pode ser observado em Wink-Junior e Pereira (2011) e Val et al. (2014).

Falkenberry (2001) defende a utiliza¸c˜ao da primeira abordagem, conforme o autor, o procedimento de encontrar pre¸cos fora do padr˜ao e repor/retirar possui melhor conex˜ao com as s´eries observadas em tempo real. Sendo que os filtros utilizados nesta abordagem podem ser aplicados na pr´atica e em tempo real facilmente.

O artigo de Hansen e Lunde (2006) apresenta um procedimento de filtragem para esti- ma¸c˜ao de medidas de Variˆancia Percebida (RV). Os autores filtraram dados considerados outliers, descartaram observa¸c˜oes fora do hor´ario de negocia¸c˜ao e removeram negocia¸c˜oes de dias que tiveram menos de 5 horas de preg˜ao.

Ainda como procedimento de filtragem foram retirados pre¸cos armazenados com valor igual a zero e pre¸cos com valor fora do spread de compra e venda.

Documentos relacionados