• Nenhum resultado encontrado

Mediante que as s´eries de Volatilidade Percebida foram constru´ıdas, buscou-se dividir os per´ıodos para realizar a estima¸c˜ao e a avalia¸c˜ao dos modelos de proje¸c˜ao e das combina- ¸c˜oes. Para divis˜ao das bases Kohavi (1995) apresenta dois m´etodos: Hold-Out e Valida¸c˜ao Cruzada (Cross-Validation).

No m´etodo de Valida¸c˜ao Cruzada um banco de dados ´e dividido em subgrupos mutu- amente excludentes de tamanho aproximadamente igual com dados selecionados aleatori- amente. No m´etodo Hold-Out o banco de dados ´e particionado em subgrupos denominados grupo de treinamento (estima¸c˜ao) e grupo de teste (hold-out set).

O m´etodo para divis˜ao dos per´ıodos, na presente tese, foi o Hold-Out. Adotou-se a pro- por¸c˜ao de 70% da s´erie para estima¸c˜ao e 30% para combina¸c˜ao e avalia¸c˜ao (detalhes sobre as combina¸c˜oes no t´opico 3.3), conforme ´e apresentado na Figura 5. De acordo com Alvim (2013) o m´etodo de Valida¸c˜ao Cruzada n˜ao ´e aplic´avel para estudos de s´eries temporais, pois datas passadas e futuras estariam conjuntamente presentes nos subgrupos.

01/06/2012 29/07/2014 30/06/2015

Estimação - 70% da série Avaliação - 30% da série

Figura 5: Metodologia Hold-Out FONTE: elaborado pelo autor.

O per´ıodo de obten¸c˜ao das s´eries foi entre 01/06/2012 a 30/06/2015, compreendendo um per´ıodo de 3 anos. Este per´ıodo forneceu o total de 759 observa¸c˜oes para as an´alises da presente tese.

Dado a propor¸c˜ao de 70% da s´erie para estima¸c˜ao e 30% para combina¸c˜ao e avalia¸c˜ao, as observa¸c˜oes foram divididas em 531 observa¸c˜oes (01/06/2012 a 29/07/2014) para estima- ¸c˜ao dos modelos e 228 observa¸c˜oes (30/07/2014 a 30/06/2015) para combina¸c˜ao e teste (avalia¸c˜ao das proje¸c˜oes).

Por meio das s´eries de Volatilidades Percebidas selecionadas para estima¸c˜ao, os modelos Heterogeneous Autoregressive Model of Realized Volatility (HAR), Mixed Data Sampling (MIDAS), Autoregressive Fractionally Integrated Moving Average (ARFIMA) e Nearest Neighbor (NN) foram ajustados.

No artigo de Ghysels et al. (2013) s˜ao apresentados exemplos de estima¸c˜oes utilizando uma s´erie de Volatilidade Percebida do ´ındice S&P500, no respectivo trabalho, os autores

anualizaram a s´erie. Diante disto, na presente tese, as estima¸c˜oes e proje¸c˜oes foram rea- lizadas em s´eries anualizadas (RVdan = RVd· 252).

Os modelos Heterogeneous Autoregressive Model of Realized Volatility (HAR) foram ajus- tados conforme a express˜ao 2.5.2, as RV agregadas para os horizontes de tempo di´arios, semanais e mensais foram obtidas conforme express˜ao 2.5.1. Os parˆametros β0, β(d), β(w)

e β(m) foram obtidos por M´ınimos Quadrados Ordin´arios.

As estima¸c˜oes realizadas por meio do modelo Mixed Data Sampling (MIDAS) seguiram conforme Wink-Junior e Pereira (2011) e Ghysels et al. (2013), o modelo ajustado foi expresso na equa¸c˜ao 2.5.3. Foram ajustados modelos variando o tamanho das defasagens, desde k = 1 at´e kmax= 50.

Os m´etodos de otimiza¸c˜ao Nelder-Mead e “nls” foram utilizados para melhorar a con- vergˆencia das estima¸c˜oes. O m´etodo Nelder-Mead apresenta bons resultados para fun¸c˜oes n˜ao diferenci´aveis.

O m´etodo “nls” ´e recomendado para refinar as estima¸c˜oes por meio de m´ınimos qua- drados n˜ao lineares. Entre os v´arios modelos ajustados, aquele que apresentou o melhor valor de BIC (express˜ao 2.6.9) foi selecionado para realizar as proje¸c˜oes.

As estima¸c˜oes obtidas por meio do modelo Autoregressive Fractionally Integrated Moving Average (ARFIMA) seguiram conforme os trabalhos de Pong et al. (2004), Koopman et al. (2005) e Andrada-Felix et al. (2013). Conforme os autores, os parˆametros do modelo ARFIMA(p, d, q), express˜ao 2.5.7, podem ser estimados de forma eficiente pela m´etodo da M´axima Verossimilhan¸ca (M.V.).

No artigo de Andersen et al. (2003) os autores estimaram os parˆametros utilizando o m´e- todo de Geweke e Porter-Hudak (1983) formalizado por Robinson (1995) (log-periodogram regression estimator - GPH). Por´em, no trabalho de Smith et al. (1997) ´e apresentado que o M.V. demonstrou melhores resultados em termos de erro quadr´atico m´edio.

Diante disto, estimaram-se modelos ARFIMA(p, d, q) nas formas (0, d, 0), (1, d, 0), (1, d, 1) e (2, 0, 1), depois selecionou-se o que apresentou menor valor de BIC. As formas (0, d, 0), (1, d, 0), (1, d, 1) foram testadas para verificar a existˆencia de efeitos passados, al´em do grau de integra¸c˜ao fracion´aria.

A forma (2, 0, 1) foi testada devido Pong et al. (2004) apresentar que no artigo de Gal- lant et al. (1999) a soma de dois processos AR(1) foi capaz de capturar a persistˆencia da

volatilidade nos pre¸cos dos ativos. Sendo que a soma de dois processos AR(1) s˜ao repre- sentados por um modelo ARMA(2, 1), conforme apresentam Granger e Newbold (1976) equivalente ao modelo ARFIMA(2, 0, 1).

O ´ultimo m´etodo de proje¸c˜ao a ser apresentado ´e o Nearest Neighbor (NN), conforme Arroyo e Mat´e (2009) o objetivo de utilizar a t´ecnica NN para s´eries de tempo ´e buscar o passado mais similar a situa¸c˜ao presente. Por meio deste passado observado, pode-se uti- lizar uma fun¸c˜ao para projetar o valor futuro, na Figura 6 ´e apresentado o procedimento para s´eries de tempo.

Os procedimentos para proje¸c˜oes do m´etodo NN ocorreram conforme as recomenda¸c˜oes de Hardle (1990), Rodriguez et al. (1997), Hastie et al. (2009) e Andrada-Felix et al. (2013). Conforme metodologia apresentada na Figura 6 deve-se, confrontando a amostra de treino com a amostra de teste, obter os valores de m (o n´umero de padr˜oes contidos na s´erie) e k (os vizinhos mais pr´oximos).

�� ��− ��− ��− 1 - - - ⋯ - 2 - - - ⋯ - 3 - - - ⋯ - 4 - - - ⋯ - 5 - - - ⋯ - 6 - - - ⋯ - 7 - - - ⋯ - 8 - - - ⋯ - 9 - - - ⋯ - 10 - - - ⋯ - 11 - - ⋯ - Treino Teste � � � � ∙ - Projeção Média Mediana ���− �� � = 4, 6, 8 �� = 3 � Figura 6: Metodologia kNN FONTE: elaborado pelo autor.

Para obter estes parˆametros, definiu-se a medida de similaridade kyti − yTk como a Dis-

tˆancia Euclidiana, express˜ao 2.5.10. Nos trabalhos de Hardle (1990) e Hastie et al. (2009) s˜ao apresentadas diversas medidas, no artigo de Rodriguez et al. (1997) ´e utilizado o coe- ficiente de correla¸c˜ao de Pearson e no trabalho de Andrada-Felix et al. (2013) os autores utilizaram a medida de Distˆancia Euclidiana.

Para definir os parˆametros m e k foi utilizado o procedimento apresentado em Rodri- guez et al. (1997) e Andrada-Felix et al. (2013) ajustado pelas recomenda¸c˜oes de Hardle (1990) e Hastie et al. (2009).

Nos artigos de Rodriguez et al. (1997) e Andrada-Felix et al. (2013) buscou-se, na amostra de treino, encontrar os valores de m e k que minimizem Erro M´edio Quadr´atico. Por´em, conforme apresenta Hastie et al. (2009) utilizar soma de erros quadr´aticos na amostra de treino sempre conduzir´a para a escolha do parˆametro k = 1.

Este resultado ´e tratado em Hardle (1990) e Hastie et al. (2009) como a existˆencia de um trade-off entre vi´es e variˆancia do erro, em que menor vi´es ´e atribu´ıdo quando k = 1, por´em as menores variˆancias dos erros s˜ao obtidas quando o tamanho de k ´e aumentado.

Diante disto, na presente tese buscou-se, encontrar os valores de m e k que minimi- zem o coeficiente de varia¸c˜ao (CV), obtido pela raz˜ao entre desvio-padr˜ao e m´edia dos erros. Por meio do CV buscou-se encontrar valores de m e k que equilibrassem o trade-off apresentado por Hardle (1990) e Hastie et al. (2009).

Nos artigos de Rodriguez et al. (1997) e Arroyo e Mat´e (2009) foram testados tamanhos de m = 2 . . . 7 e m = 1 . . . 10 respectivamente e tamanhos de k = 90 . . . 140 e k = 1 . . . 9 respectivamente.

Na presente tese foram testados os tamanhos de m = 3 . . . 20 buscando fazer uma procura similar ao dos autores citados e avaliando a possibilidade de outras poss´ıveis janelas para m. Para k, definiu-se um busca entre k = 1 . . . 30, realizou-se uma busca similar ao traba- lho de Arroyo e Mat´e (2009), que utilizou dados em alta frequˆencia, analisando tamb´em a possibilidade de mais algumas janelas.

Ap´os a obten¸c˜ao dos parˆametros m e k busca-se ajustar uma fun¸c˜ao F (·) para obter as proje¸c˜oes. Na Figura 6 s˜ao apresentadas as fun¸c˜oes de ajuste utilizadas na presente tese: M´edia e Mediana. No trabalho de Andrada-Felix et al. (2013) os autores citam as fun¸c˜oes de M´edia, Mediana, Kernel ou Autoregress˜ao.

No artigo de Rodriguez et al. (1997), os autores ajustam o k vizinhos mais pr´oximos por autoregress˜ao, em Andrada-Felix et al. (2013) os autores atribuem preferˆencia a Me- diana, dado que apresenta maior robustez a outliers de que a M´edia e menor incerteza quanto a multicolinearidade quando ´e utilizada a Autoregress˜ao. Na presente tese, a M´e- dia foi selecionada por ser a medida mais simples e utilizada na literatura e a Mediana por apresentar a robustez citada em Andrada-Felix et al. (2013).

As fun¸c˜oes de M´edia e Mediana s˜ao avaliadas na amostra de teste, a fun¸c˜ao que apre- sentou melhor ajuste foi utilizada na etapa de combina¸c˜ao de proje¸c˜oes. Deste modo, o procedimento demonstrado na Figura 6 pode ser resumido em definir os valores de m e k, no caso k = 3; sendo os vizinhos mais pr´oximos os valores de Yt dos per´ıodos 4, 6 e

8. Os valores destes per´ıodos s˜ao ajustados por Media (Y4, Y6, Y8) ou por Med (Y4, Y6, Y8)

produzindo a proje¸c˜ao para o per´ıodo desconhecido t = 11.

Documentos relacionados