5.3 Modelo Híbrido ARIMA-RNA
5.3.1 Ajuste Linear (ARIMA)
O ajuste da modelagem ARIMA foi realizado seguindo a estratégia usual oriunda da teoria de séries temporais: basicamente, a análise do comportamento das funções de autocorrelação (ACF) e autocorrelação parcial (PACF) da série original, ou transformada (de acordo com o que prega a teoria de séries temporais nesse quesito), como em [28]. Im- portante destacar que, neste ajuste, a variável usual “tempo” é substituída pela variável
“altura em relação ao solo (metros)”, caracterizando assim o caminho vertical conside- rado. Em outras palavras, assume-se que o valor de intensidade de campo elétrico em um determinado andar é função dos valores identificados em andares abaixo. A quantidade de andares depende da ordem do modelo ARIMA. O referencial usual cartesiano para o eixo 𝑌 foi adotado, isto é, zero para o térreo e crescendo à medida que os andares aumentam.
A concepção e a análise futura dos resultados nesta aplicação se dividem em duas etapas: 1) Dados originais; 2) Dados interpolados. Como sugerem os nomes, o grupo 1 considera as amostras na sua forma original. Sem qualquer tipo de manipulação visando facilitar o ajuste pelo modelo ARIMA. Já o grupo 2 indica que a série original foi in- terpolada para acréscimo de quantidade de amostras. Optou-se pela inclusão do cenário interpolado de modo a refinar o ajuste pelo modelo ARIMA. Por exemplo, os conjun- tos de dados originais, com 25 (conjuntos “data1” e “data3”), ou 31 amostras (conjunto
“data2”) passaram a ter 200 amostras, após a interpolação. Deste modo, o conjunto de treino passa a ter um número de amostras que permite um resultado mais preciso do ajuste pelo modelo ARIMA. Além disso, os cenários interpolados simulam um cenário de medições contínuo, sem interrupções. Na metodologia de medição adotada, deslocava-se para um ponto, media-se, deslocava-se para o próximo, media-se novamente e assim su- cessivamente. Parava-se de medir entre um ponto e outro. Isto acabou resultando em uma amostra por andar, representada pelo valor médio de cada série medida. Em uma medição
“contínua”, seriam coletadas amostras ininterruptamente. Uma forma de se realizar isso seria, por exemplo, conectar o receptor a um drone e movê-lo paralelamente ao edifício em velocidade constante gerando uma única série para o edifício com uma quantidade muito maior de amostras. Os conjuntos interpolados emulam uma situação onde tal me- todologia de medição foi aplicada. Nesta tese, usou-se uma interpolação do tipo SPPCI
Capítulo 5. METODOLOGIA PARA ESCOLHA DE PONTOS ÓTIMOS E MODELAGEM HÍBRIDA32
(shape-preserving piecewise cubic interpolation – interpolação cúbica por partes), através da rotina pchip do 𝑀 𝐴𝑇 𝐿𝐴𝐵○c. Neste texto, ao se falar em interpolação, refere-se ao tipo de interpolação supracitado.
No ajuste de um modelo ARIMA, alguns passos precisam ser executados. Primei- ramente, é necessário determinar se uma transformação na série original (logarítmica, por exemplo) é necessária para estabilização da variância. Em seguida, a tendência da série original deve ser calculada e, dependendo do caso, retirada da série a ser ajustada. No caso de se optar por retirar a tendência, o ajuste prossegue na série sem a informação da tendência (como nesta tese). Em terceiro lugar, com base nos gráficos das funções ACF e PACF, decidir por efetuar, ou não, diferenças na série. Finalmente, pode-se, com base no comportamento das funções ACF e PACF, obter a ordem do modelo ARIMA que melhor ajusta o determinado conjunto. Todos esses passos são os usuais para o ajuste deste tipo de modelo (BOX; REINSEL, 2015) e visam transformar a série original em estacionária.
Só assim um ajuste adequado de modelos ARIMA pode ser realizado. As Fig. 12a, 12c e 12e mostram os gráficos das séries originais, enquanto os gráficos das séries interpoladas são mostrados nas Fig. 12b, 12d e 12f.
Na procura pelo melhor resultado para a modelagem ARIMA neste problema, diversos testes foram executados. O diagrama na Fig. 11 mostra todos os passos do pro- cedimento de teste adotado. Etapas opcionais são a transformação não-linear da série e o cálculo das diferenças. Estes são indicados por linhas tracejadas no diagrama.
Figura 11 – Etapas do processo de ajuste.
Capítulo 5. METODOLOGIA PARA ESCOLHA DE PONTOS ÓTIMOS E MODELAGEM HÍBRIDA33
(a) (b)
(c) (d)
(e) (f)
Figura 12 – (a) Gráfico do conjunto original “data3”; (b) Gráfico do conjunto original
“data2”; (c) Gráfico do conjunto original “data1”; (d) Gráfico do conjunto interpolado
“data3”; (e) Gráfico do conjunto interpolado “data2”; (f) Gráfico do conjunto interpolado
“data1”.
Optou-se por isolar as tendências dos conjuntos de treino e de comparação no ajuste do modelo ARIMA. Ao observar o diagrama, nota-se que os testes com o método MQ também foram executados com os dados das séries sem tendência. Procedeu-se desta forma visando manter uma comparação justa entre o ajuste ARIMA e o ajuste por MQ
Capítulo 5. METODOLOGIA PARA ESCOLHA DE PONTOS ÓTIMOS E MODELAGEM HÍBRIDA34
adotado. Em seguida, analisou-se a necessidade de transformações não lineares nas séries consideradas. Finalmente, analisou-se as funções ACF e PACF para avaliação da neces- sidade de diferenças nas séries e posterior definição da ordem do modelo ARIMA. Com os resíduos da modelagem ARIMA, partiu-se para o ajuste pela RNA e obtiveram-se os resultados do modelo híbrido.
As etapas opcionais foram testadas e os melhores resultados foram encontrados quando o conjunto “data3”, sem tendência, sem diferenças e sem transformação não linear foi utilizado para treinar o modelo. Os conjuntos “data1” e “data2” foram utilizados para comparações.
Na subseção “Ajustes por MQ” os ajustes pelo método MQ realizados neste traba- lho são explicados. Executou-se o ajuste por MQ de modo a comparar com os resultados obtidos pelo modelo ARIMA, visto que, para problemas deste tipo, onde as relações entre variáveis e informações é linear, é um método bastante utilizado. Comparações do modelo ARIMA com as estimativas via MQ e a recomendação ITU-R P. 1546-5 (INTERNA- TIONAL, 2013) são realizadas. Neste trabalho ao se citar estimativas da recomendação (INTERNATIONAL, 2013), considera-se (5.6):
𝐸 =𝐸𝑖𝑛𝑓 +(𝐸𝑠𝑢𝑝−𝐸𝑖𝑛𝑓)𝑙𝑜𝑔(𝑑𝑑
𝑖𝑛𝑓) 𝑙𝑜𝑔(𝑑𝑑𝑠𝑢𝑝
𝑖𝑛𝑓) (5.6)
Com: 𝑑: distância para qual se deseja estimar 𝐸; 𝑑𝑖𝑛𝑓: distância inferior tabelada mais próxima;𝑑𝑠𝑢𝑝: distância superior tabelada mais próxima;𝐸𝑖𝑛𝑓: intensidade de campo elétrico em 𝑑𝑖𝑛𝑓; 𝐸𝑠𝑢𝑝: intensidade de campo elétrico em 𝑑𝑠𝑢𝑝. Considerou-se a frequência de 600 MHz para as estimativas desta recomendação. Esta é uma das frequências tabe- ladas. Portanto, tem-se 600 MHz, 𝑑𝑖𝑛𝑓 e 𝑑𝑠𝑢𝑝 tabelados, bem como seus valores de 𝐸𝑖𝑛𝑓 e 𝐸𝑠𝑢𝑝. Dado o ambiente considerado neste estudo, adotou-se para fins de estimativas da recomendação, os valores tabelados para “caminhos terrestres em 50% do tempo a 600 MHz”. A distância d dos valores considerados neste trabalho foi a única variável sujeita a mudanças nestas estimativas. Tem-se então, a partir de (5.6), uma curva de tendência para o comportamento do campo elétrico. A equação (5.6) corresponde, no referencial de equações do texto da recomendação (INTERNATIONAL, 2013), à equação (13).