• Nenhum resultado encontrado

4 REDES NEURAIS ARTIFICIAIS

4.4 Conjuntos de Treinamento, Validação e Teste

4.5.1 Aplicação em séries temporais

Para a aplicação de séries temporais em redes neurais artificiais, dado que a rede neural precisa de amostras para ser devidamente treinada, uma série temporal pode ser dividida em conjuntos de treinamento, validação e testes. Com isto, uma ideia apresentada por Lang e Hilton (1988) sobre entradas atrasadas no tempo, cita que um instante t da série temporal, é calculado em função de seus n valores anteriores, como apresentado na Equação 4.3.

𝑆𝑡= 𝑓 (𝑆𝑡−1, 𝑆𝑡−2, 𝑆𝑡−3, ..., 𝑆𝑡−𝑛) (4.3)

Na Equação 4.3, 𝑛 é dado como a ordem do preditor, ou seja, a quantidade de valores atrasados que são necessários para a estimação do valor do instante 𝑡. Em estudos de séries tem- porais, isto é semelhante ao modelo Auto-Regressivo (AR), porém a função 𝑓 (), é implementada pelo modelo matemático da própria rede neural (da Silva, 2010).

Com um número de ordem para predição definido, torna-se possível a geração de amostras para aplicação em uma rede neural. Cada amostra irá conter o número de ordem de valores da série que serão utilizados como entrada para a rede neural, e o instante posterior a estes valores será tido como a saída desejada da rede neural. Neste trabalho, a ordem do preditor será chamada de atrasos (ou do inglês lags). Este tipo de amostragem dada sobre séries temporais é chamada de janela de predição (do inglês Forecasting Window) (Shynkevich et al., 2014).

A Figura 4.6 ilustra um exemplo de como uma amostra com três atrasos é feita para uma série temporal (cotações diárias das ações da Petrobras no mês de setembro de 2015), destacando em vermelho as entradas e em verde a saída ideal para uma amostra. Sendo assim, a janela de prediçãose move ao longo de toda série, de modo que os próximos instantes da série componham novas amostras para a geração de conjuntos a serem aplicados em uma rede neural artificial.

Dada a janela de predição apresentada na Figura 4.6, a Tabela 4.1 apresenta como os dados de uma série temporal são utilizados para a definição de amostras para serem apresentadas a uma rede neural com 3 entradas considerando a previsão de um passo adiante (𝑡 + 1).

Note pela Tabela 4.1 que a janela de predição se desloca fornecendo sempre a previsão de um passo adiante. Com isto, a Figura 4.7 apresenta como uma amostra com 3 atrasos é aplicada em uma rede neural, para um instante t.

O tipo de predição apresentado na Figura 4.7, é conhecido como predição iterativa (do inglês Iteractive Forecasting), pois é composta de apenas uma saída, ou seja, a predição trabalha sobre um passo adiante. Existe também a predição direta (do inglês Direct Forecasting), em que a saída da rede neural tenta predizer mais que um passo adiante (Adhikari e Agrawal, 2013; Hamzaçebi et al., 2009). Neste trabalho, as implementações realizadas até o momento

6,00 6,50 7,00 7,50 8,00 8,50 9,00 1 2 3 4 7 8 9 10 11 14 15 16 17 18 21 22 23 24 25 28 29 30 Cot aç ão (R $) Dias (setembro/2015) Petrobras - PETR4 - Setembro/2015

Figura 4.6: Representação de uma amostra para ser aplicada à uma rede neural artificial. Em vermelho a janela de entrada dos dados na ordem de três atrasos e em verde a janela de saída dos dados com um passo adiante.

# Entrada 1 Entrada 2 Entrada 3 Saída Esperada

1 𝑡 − 11 𝑡 − 10 𝑡 − 9 𝑡 − 8 2 𝑡 − 10 𝑡 − 9 𝑡 − 8 𝑡 − 7 3 𝑡 − 9 𝑡 − 8 𝑡 − 7 𝑡 − 6 4 𝑡 − 8 𝑡 − 7 𝑡 − 6 𝑡 − 5 5 𝑡 − 7 𝑡 − 6 𝑡 − 5 𝑡 − 4 6 𝑡 − 6 𝑡 − 5 𝑡 − 4 𝑡 − 3 7 𝑡 − 5 𝑡 − 4 𝑡 − 3 𝑡 − 2 8 𝑡 − 4 𝑡 − 3 𝑡 − 2 𝑡 − 1 9 𝑡 − 3 𝑡 − 2 𝑡 − 1 𝑡 10 𝑡 − 2 𝑡 − 1 𝑡 𝑡 + 1

Tabela 4.1: Exemplo de amostras a serem aplicadas em uma rede neural artificial.

apresentam redes neurais iterativas, onde apenas um passo adiante é trabalhado.

Ngaopitakkul e Pothisarn (2009) apresentaram uma rede neural MLP treinada com o al- goritmo Back Propagation para a predição de valores futuros do índice financeiro da Standard and Poor’s(da sigla S&P500) (Standard & Poors, 2015). Junto a isto, aplicaram a transformada waveletsobre a série temporal e compararam os resultados de predição com e sem a transfor- mação. Por fim, os autores compararam o impacto que este modelo de predição tem sobre o índice NASDAQ 100 (NASDAQ Stock Market, 2015), onde foi constatado uma forte correlação entre os índices. Como sugestão de trabalhos futuros, os autores indicaram a utilização deste sistema em cotações de ações, permitindo a implementação de um sistema online (que funciona durante o horário de negociações, também conhecido como pregão).

Em outra pesquisa (Monica et al., 2012), foi implementado um sistema multi-agentes para processamento de séries temporais financeiras, baseado em redes neurais do tipo MLP. Cada agente deste sistema incorpora séries temporais diferentes, como da análise fundamenta- lista (balanço contábil da empresa) e indicadores técnicos (médias móveis), além dos valores

Figura 4.7: Representação de uma rede neural do tipo MLP com três entradas atrasadas no tempo e uma saída.

das cotações. Um agente extra ficou encarregado de verificar a quantidade de neurônios para cada rede neural. Por fim, a pesquisa constatou que um sistema que permite uma dinâmica na quantidade de neurônios apresenta melhor desempenho que um número fixo de neurônios.

Wang et al. (2011) realizaram predições de séries temporais não-estacionárias de índices financeiros com uma abordagem denominada como Wavelet De-noising-based Back Propaga-

tion Neural Network (da sigla WDBP), que consiste em transformar a série do domínio do

tempo para o domínio da frequência e realizar a predição utilizando uma rede neural do tipo MLP, treinada com o Back Propagation. Os experimentos utilizaram a série temporal de fecha- mento mensal do índice da bolsa de Shangai. Os resultados indicaram uma melhora na predição quando comparado o método proposto a uma rede neural do tipo MLP treinada com Back Pro- pagationsem a transformação na série temporal.

Hsu (2011) realizou o estudo de um modelo híbrido utilizando redes neurais artificiais do tipo Mapa Auto-Organizável (do inglês Self-Organizing Map - SOM) e programação genética para desenvolver um processo integrado chamado de SOM-GP, para a resolução de problemas de predição de valores de ações. A rede neural SOM foi utilizada para agrupar as amostras colhidas das séries temporais para que a programação genética pudesse aplicar um modelo de predição matemático que explicasse a relação entre indicadores técnicos e preços de fechamen- tos das ações para cada grupo formado pelo SOM. Esta pesquisa aplicou este modelo sobre o índice da bolsa de valores de Taiwan TAIEX-FISI (Taiwan stock exchange) (Taiwan Stock Ex- change Corp., 2015). Os experimentos apresentaram um bom resultado no modelo de predição proposto, sendo que o erro médio de porcentagem absoluta entre o preço real e o resultado dos experimentos foi de 1,44% na série temporal testada.

Oliveira e Almeida (2007) obtiveram êxito em uma pesquisa que fez uma análise de séries temporais utilizando modelos de predição como o ARIMA, GARCH, redes neurais do tipo MLP treinadas com filtro de Kalman estendido (do inglês Extended Kalman Filter - EFK) e MLPs treinadas com Filtro de Kalman unscented (do inglês Unscented Kalman Filter - UKF). Estes

métodos de predição foram aplicados a séries temporais financeiras de ações listadas em bolsa de valores de diversos setores, e os experimentos indicaram que o modelo de MLP treinada com filtro de Kalman unscented (UKF) apresentou-se superior aos demais modelos.

No trabalho realizado por Khashei e Bijari (2010) foi construído um modelo híbrido de predição baseado em redes neurais do tipo MLP e o modelo ARIMA para séries temporais não li- neares. Parte da construção de um modelo ARIMA é dado pelo modelo Auto Regressivo (AR) que considera valores passados como explicações para um ponto da série temporal. Sendo assim, o modelo ARIMA é utilizado para gerar estes argumentos que são utilizados como multiplicadores nos pesos de uma rede neural que contém uma função de ativação linear em sua saída. Os expe- rimentos apresentaram uma melhora na predição desta abordagem híbrida quando comparada a uma rede neural artificial simples.

Pelos trabalhos apresentados, é notável a capacidade das redes neurais artificiais, especi- almente as redes do tipo MLP, de resolver problemas de regressão, como é o caso de previsão de séries temporais.

4.6 Síntese do capítulo e motivação para a aplicação

Neste capítulo foram introduzidos os principais conceitos sobre redes neurais artificiais e suas aplicações. Junto a isto, foram discutidos também arquiteturas de redes neurais, métodos de treinamento supervisionado, organização dos dados em conjuntos de treinamento, validação e testes e aplicações a problemas de regressão.

Além disso, foram revisados alguns trabalhos da literatura onde redes neurais artificiais foram aplicadas a problemas de séries temporais apresentando resultados promissores.

Dada a capacidade de redes neurais para trabalharem com problemas de regressão, como é o caso de previsão de séries temporais, a Figura 1.1 que ilustra a arquitetura geral desta pesquisa contém um módulo específico para Preditores onde os tipos de redes neurais apresentadas neste capítulo foram utilizadas como preditores para as séries temporais.

Documentos relacionados