CAPÍTULO 4 ANÁLISE DE SÉRIES TEMPORAIS FUZZY PARA PREVISÃO DE
4.2 Modelos de previsão
4.2.1 Previsões em STF baseadas no intervalo temporal das amostras
A primeira abordagem de previsão utiliza como técnica de pré-processamento o modelo apresentado na Seção 4.1.2. A abordagem desenvolvida nesta seção tem como principal característica classificar o conhecimento extraído da ST em diferentes grupos temporais (SANTOS; CAMARGO, 2014b). O objetivo é dar maior influência no cálculo do valor previsto ao conhecimento pertencente ao grupo temporal com o co- nhecimento mais recente da série. Para isso, é realizada a classificação temporal das relações lógicas fuzzy.
A base de conhecimento do sistema é composta por RLF de segunda ordem, ou seja, com dois antecedentes na relação de implicação, como apresentado na Ex- pressão 4.5.
𝐿𝑖, 𝐿𝑖+1 → 𝐿𝑖+2 , 𝑖 = 1, 2, 3, … 𝑛 − 2 (4.5) onde 𝑛 é o número de amostras da ST e 𝐿𝑖 é o termo linguístico que representa o valor observado no instante 𝑖. Considerando as RLF de segunda ordem como apresentado na Expressão 4.5, ou seja, com dois antecedentes, as duas últimas amostras da ST indicarão quais RLF serão utilizadas no cálculo do valor a ser previsto. Assim, serão consideradas todas as implicações das RLF na base de conhecimento que tiverem os antecedentes 𝐿𝑖 = 𝐿𝑛−1 e 𝐿𝑖+1= 𝐿𝑛.
A escolha por RLF de segunda ordem deve-se ao fato de que o uso das rela- ções de primeira ordem para a representação do conhecimento implica em uma quan- tidade excessiva de RLF no cálculo do valor previsto, o que acaba ocasionando um desvio significativo nas previsões quando comparadas com os valores reais. Esse desvio também ocorre ao utilizarmos RLF de terceira ordem ou superior pois, ao con- trário do que ocorre quando são utilizadas RLF de primeira ordem, o número de termos linguísticos utilizados no cálculo é insuficiente para a identificação da tendência da série temporal.
A abordagem apresentada nesta seção considera a existência de três grupos temporais de RLF (𝐺1, 𝐺2 e 𝐺3), definidos a partir das 𝑛 amostras da série conforme descrito na sequência:
Passo 1. A partir da ST fuzzificada, construa uma base de RLF de 2ª ordem como apresentado na Expressão 4.5, com um total de relações 𝑟 igual a 𝑛 − 2.
Passo 2. Considere as relações 𝑟𝑗, onde 𝑗 = 1, 2, … , 𝑛 − 2, definidas no passo anterior. Se 𝑗 ≤ (𝑛 − 2)/3, então 𝑟𝑗 ∈ 𝐺1. Se (𝑛 − 2)/3 < 𝑗 ≤ (𝑛 − 2)/3 × 2, então 𝑟𝑗 ∈ 𝐺2. Se 𝑗 > (𝑛 − 2)/3 × 2, então 𝑟𝑗 ∈ 𝐺3.
O grau de influência, ou o peso 𝑝𝐺𝑖, do grupo de RLF 𝐺𝑖, onde, 𝑖 = 1, 2 e 3, é definido empiricamente respeitando a restrição 𝑝𝐺1 < 𝑝𝐺2 < 𝑝𝐺3. Assim, o valor previsto é calculado pela Equação 4.6.
𝑉𝑝 = ∑ 𝑉𝐺𝑖 × 𝑝𝐺𝑖 3
𝑖=1
(4.6)
onde 𝑉𝑝 é o valor previsto e 𝑉𝐺𝑖 é o valor calculado a partir das RLF presentes no Grupo 𝑖, conforme Equação 4.7, que considerada o número de ocorrências de cada RLF dentro do grupo.
𝑉𝐺𝑖 =
∑𝑙𝑗=1𝐷𝑒𝑓(𝐿𝑗) × 𝑓𝐿𝑗
∑𝑙𝑗=1𝑓𝐿𝑗 (4.7)
onde 𝑖 = 1, 2 𝑒 3, 𝑙 indica o número de diferentes RLF presentes no Grupo 𝑖, 𝑓𝐿𝑗 é o número de ocorrências de RLFs com 𝐿𝑗 no consequente dentro do Grupo 𝑖, ou seja, quantas vezes a relação 𝐿𝑛−1, 𝐿𝑛 → 𝐿𝑗 ocorre dentro do grupo e, 𝐷𝑒𝑓(𝐿𝑗) é o parâme- tro central do conjunto triangular que representa o termo linguístico 𝐿𝑗.
Para ilustrar como o cálculo do valor previsto é realizado nesta abordagem de previsão, considere a série temporal com os índices Taiwan Stock Exchange Capita-
lization Weighted Stock Index (TAIEX) da bolsa de valores de Taiwan para o ano de
2001, utilizada nos experimentos apresentados no Capítulo 6. Os índices entre janeiro e outubro de 2001 foram utilizados para treinamento do modelo e os testes foram realizados utilizando os índices de novembro e dezembro do mesmo ano. Após o pré- processamento nos dados de treinamento, os valores crisp obtidos para cada cluster e, consequentemente, para a representação dos termos linguísticos na série temporal fuzzificada, são apresentados na Tabela 4.1.
Tabela 4.1 – Valores crisp de representação para cada termo linguístico do índice TAIEX 2001
Cluster Valor Cluster Valor Cluster Valor Cluster Valor
0 3488,58 13 3915,35 26 4410,30 39 4837,79 1 3525,41 14 3952,83 27 4453,63 40 4895,68 2 3567,26 15 3987,10 28 4473,64 41 4979,42 3 3588,63 16 4012,67 29 4489,39 42 5033,78 4 3622,13 17 4042,43 30 4509,75 43 5084,22 5 3637,01 18 4065,64 31 4528,65 44 5150,37 6 3706,00 19 4145,09 32 4552,98 45 5175,34 7 3778,23 20 4184,87 33 4591,49 46 5227,90 8 3791,01 21 4220,44 34 4629,14 47 5309,69 9 3800,05 22 4301,64 35 4659,84 48 5406,05 10 3814,66 23 4335,51 36 4706,31 49 5481,84 11 3848,60 24 4354,66 37 4741,69 50 5588,32 12 3900,91 25 4373,35 38 4780,37 51 5801,55
Após a fuzzificação da ST, 199 relações lógicas fuzzy, como a apresentada na Expressão 4.5, foram identificadas e divididas em 3 grupos (𝐺1, 𝐺2 e 𝐺3) que compõem a base de conhecimento, sendo os Grupos 1 e 2 com 66 RLF cada um e o Grupo 3 com 67 relações. As mais antigas, pertencentes ao 𝐺𝑟𝑢𝑝𝑜 1, são apresentadas na Tabela 4.2. As RLF do 𝐺𝑟𝑢𝑝𝑜 2, são apresentadas na Tabela 4.3, e as RLF do 𝐺𝑟𝑢𝑝𝑜 3, que representam o comportamento mais recente da ST, são apresentadas na Tabela 4.4.
Tabela 4.2 – RLF de 2ª ordem pertencentes ao 𝑮𝒓𝒖𝒑𝒐 𝟏 da série temporal TAIEX 2001 RLF do 𝑮𝒓𝒖𝒑𝒐 𝟏 𝐿40, 𝐿40→ 𝐿44 𝐿51, 𝐿51→ 𝐿51 𝐿51, 𝐿51→ 𝐿51 𝐿50, 𝐿49→ 𝐿49 𝐿51, 𝐿51→ 𝐿50 𝐿40, 𝐿44→ 𝐿47 𝐿51, 𝐿51→ 𝐿51 𝐿51, 𝐿51→ 𝐿51 𝐿50, 𝐿50→ 𝐿50 𝐿51, 𝐿50→ 𝐿49 𝐿44, 𝐿47→ 𝐿45 𝐿51, 𝐿51→ 𝐿51 𝐿51, 𝐿51→ 𝐿51 𝐿50, 𝐿50→ 𝐿51 𝐿50, 𝐿49→ 𝐿48 𝐿47, 𝐿45→ 𝐿48 𝐿51, 𝐿51→ 𝐿51 𝐿51, 𝐿51→ 𝐿51 𝐿50, 𝐿51→ 𝐿51 𝐿49, 𝐿48→ 𝐿49 𝐿45, 𝐿48→ 𝐿48 𝐿51, 𝐿51→ 𝐿50 𝐿51, 𝐿51→ 𝐿50 𝐿51, 𝐿51→ 𝐿50 𝐿48, 𝐿49→ 𝐿48 𝐿48, 𝐿48→ 𝐿48 𝐿51, 𝐿50→ 𝐿51 𝐿51, 𝐿50→ 𝐿49 𝐿51, 𝐿50→ 𝐿50 𝐿49, 𝐿48→ 𝐿47 𝐿48, 𝐿48→ 𝐿47 𝐿50, 𝐿51→ 𝐿51 𝐿50, 𝐿49→ 𝐿49 𝐿50, 𝐿50→ 𝐿50 𝐿48, 𝐿47→ 𝐿49 𝐿48, 𝐿47→ 𝐿48 𝐿51, 𝐿51→ 𝐿51 𝐿49, 𝐿49→ 𝐿50 𝐿50, 𝐿50→ 𝐿51 𝐿47, 𝐿49→ 𝐿49 𝐿47, 𝐿48→ 𝐿50 𝐿51, 𝐿51→ 𝐿51 𝐿49, 𝐿50→ 𝐿50 𝐿50, 𝐿51→ 𝐿51 𝐿49, 𝐿49→ 𝐿49 𝐿48, 𝐿50→ 𝐿51 𝐿51, 𝐿51→ 𝐿51 𝐿50, 𝐿50→ 𝐿51 𝐿51, 𝐿51→ 𝐿51 𝐿49, 𝐿49→ 𝐿48 𝐿50, 𝐿51→ 𝐿51 𝐿51, 𝐿51→ 𝐿51 𝐿50, 𝐿51→ 𝐿51 𝐿51, 𝐿51→ 𝐿51 - 𝐿51, 𝐿51→ 𝐿50 𝐿51, 𝐿51→ 𝐿51 𝐿51, 𝐿51→ 𝐿50 𝐿51, 𝐿51→ 𝐿51 - 𝐿51, 𝐿50→ 𝐿51 𝐿51, 𝐿51→ 𝐿51 𝐿51, 𝐿50→ 𝐿50 𝐿51, 𝐿51→ 𝐿51 - 𝐿50, 𝐿51→ 𝐿51 𝐿51, 𝐿51→ 𝐿51 𝐿50, 𝐿50→ 𝐿50 𝐿51, 𝐿51→ 𝐿51 -
Tabela 4.3 – RLF de 2ª ordem pertencentes ao 𝑮𝒓𝒖𝒑𝒐 𝟐 da série temporal TAIEX 2001 RLF do 𝑮𝒓𝒖𝒑𝒐 𝟐 𝐿48, 𝐿48→ 𝐿49 𝐿46, 𝐿45→ 𝐿46 𝐿45, 𝐿43→ 𝐿43 𝐿46, 𝐿44→ 𝐿44 𝐿37, 𝐿36→ 𝐿36 𝐿48, 𝐿49→ 𝐿50 𝐿45, 𝐿46→ 𝐿44 𝐿43, 𝐿43→ 𝐿42 𝐿44, 𝐿44→ 𝐿43 𝐿36, 𝐿36→ 𝐿35 𝐿49, 𝐿50→ 𝐿50 𝐿46, 𝐿44→ 𝐿46 𝐿43, 𝐿42→ 𝐿42 𝐿44, 𝐿43→ 𝐿42 𝐿36, 𝐿35→ 𝐿34 𝐿50, 𝐿50→ 𝐿50 𝐿44, 𝐿46→ 𝐿45 𝐿42, 𝐿42→ 𝐿42 𝐿43, 𝐿42→ 𝐿42 𝐿35, 𝐿34→ 𝐿32 𝐿50, 𝐿50→ 𝐿50 𝐿46, 𝐿45→ 𝐿44 𝐿42, 𝐿42→ 𝐿41 𝐿42, 𝐿42→ 𝐿41 𝐿34, 𝐿32→ 𝐿34 𝐿50, 𝐿50→ 𝐿49 𝐿45, 𝐿44→ 𝐿43 𝐿42, 𝐿41→ 𝐿43 𝐿42, 𝐿41→ 𝐿40 𝐿32, 𝐿34→ 𝐿29 𝐿50, 𝐿49→ 𝐿49 𝐿44, 𝐿43→ 𝐿44 𝐿50, 𝐿49→ 𝐿49 𝐿41, 𝐿40→ 𝐿38 𝐿34, 𝐿29→ 𝐿25 𝐿49, 𝐿49→ 𝐿48 𝐿43, 𝐿44→ 𝐿43 𝐿41, 𝐿43→ 𝐿46 𝐿40, 𝐿38→ 𝐿39 𝐿29, 𝐿25→ 𝐿25 𝐿49, 𝐿48→ 𝐿48 𝐿44, 𝐿43→ 𝐿41 𝐿43, 𝐿46→ 𝐿44 𝐿38, 𝐿39→ 𝐿38 𝐿25, 𝐿25→ 𝐿21 𝐿48, 𝐿48→ 𝐿47 𝐿43, 𝐿41→ 𝐿41 𝐿46, 𝐿44→ 𝐿46 𝐿39, 𝐿38→ 𝐿40 𝐿49, 𝐿48→ 𝐿48 𝐿48, 𝐿47→ 𝐿48 𝐿41, 𝐿41→ 𝐿46 𝐿44, 𝐿46→ 𝐿47 𝐿38, 𝐿40→ 𝐿40 - 𝐿47, 𝐿48→ 𝐿46 𝐿41, 𝐿46→ 𝐿46 𝐿46, 𝐿47→ 𝐿46 𝐿40, 𝐿40→ 𝐿39 - 𝐿48, 𝐿46→ 𝐿46 𝐿46, 𝐿46→ 𝐿45 𝐿47, 𝐿46→ 𝐿46 𝐿40, 𝐿39→ 𝐿37 - 𝐿46, 𝐿46→ 𝐿45 𝐿46, 𝐿45→ 𝐿43 𝐿46, 𝐿46→ 𝐿44 𝐿39, 𝐿37→ 𝐿36 -
Tabela 4.4 – RLF de 2ª ordem pertencentes ao 𝑮𝒓𝒖𝒑𝒐 𝟑 da série temporal TAIEX 2001 RLF do 𝑮𝒓𝒖𝒑𝒐 𝟑 𝐿20, 𝐿21→ 𝐿19 𝐿27, 𝐿28→ 𝐿31 𝐿30, 𝐿30→ 𝐿27 𝐿3, 𝐿1→ 𝐿0 𝐿6, 𝐿8→ 𝐿10 𝐿21, 𝐿19→ 𝐿17 𝐿28, 𝐿31→ 𝐿33 𝐿30, 𝐿27→ 𝐿29 𝐿1, 𝐿0→ 𝐿4 𝐿8, 𝐿10→ 𝐿10 𝐿19, 𝐿17→ 𝐿19 𝐿31, 𝐿33→ 𝐿34 𝐿27, 𝐿29→ 𝐿26 𝐿0, 𝐿4→ 𝐿2 𝐿10, 𝐿10→ 𝐿11 𝐿17, 𝐿19→ 𝐿22 𝐿33, 𝐿34→ 𝐿36 𝐿29, 𝐿26→ 𝐿23 𝐿4, 𝐿2→ 𝐿5 𝐿10, 𝐿11→ 𝐿12 𝐿19, 𝐿22→ 𝐿23 𝐿34, 𝐿36→ 𝐿34 𝐿26, 𝐿23→ 𝐿22 𝐿2, 𝐿5→ 𝐿0 𝐿11, 𝐿12→ 𝐿11 𝐿22, 𝐿23→ 𝐿24 𝐿36, 𝐿34→ 𝐿32 𝐿23, 𝐿22→ 𝐿22 𝐿5, 𝐿0→ 𝐿0 𝐿12, 𝐿11→ 𝐿15 𝐿23, 𝐿24→ 𝐿24 𝐿34, 𝐿32→ 𝐿32 𝐿22, 𝐿22→ 𝐿20 𝐿0, 𝐿0→ 𝐿0 𝐿11, 𝐿15→ 𝐿16 𝐿24, 𝐿24→ 𝐿29 𝐿32, 𝐿32→ 𝐿29 𝐿22, 𝐿20→ 𝐿14 𝐿0, 𝐿0→ 𝐿3 𝐿15, 𝐿16→ 𝐿17 𝐿24, 𝐿29→ 𝐿31 𝐿32, 𝐿29→ 𝐿27 𝐿20, 𝐿14 → 𝐿7 𝐿0, 𝐿3→ 𝐿1 𝐿16, 𝐿17→ 𝐿18 𝐿29, 𝐿31→ 𝐿28 𝐿29, 𝐿27→ 𝐿22 𝐿14, 𝐿7→ 𝐿7 𝐿3, 𝐿1→ 𝐿4 𝐿25, 𝐿21 → 𝐿20 𝐿31, 𝐿28→ 𝐿26 𝐿27, 𝐿22→ 𝐿25 𝐿7, 𝐿7→ 𝐿6 𝐿3, 𝐿1→ 𝐿4 𝐿21, 𝐿20 → 𝐿21 𝐿28, 𝐿26→ 𝐿30 𝐿22, 𝐿25→ 𝐿25 𝐿7, 𝐿6→ 𝐿3 𝐿4, 𝐿8→ 𝐿9 - 𝐿26, 𝐿30→ 𝐿27 𝐿25, 𝐿25→ 𝐿30 𝐿23, 𝐿22→ 𝐿22 𝐿8, 𝐿9→ 𝐿6 - 𝐿30, 𝐿27→ 𝐿28 𝐿30, 𝐿30→ 𝐿30 𝐿6, 𝐿3→ 𝐿1 𝐿9, 𝐿6→ 𝐿8 -
Ao ser considerada, por exemplo, a previsão para o dia 28 de dezembro de 2001, de acordo com a Tabela 4.1, os índices 5392,43 e 5332,98 dos dias 26 e 27 de dezembro são representados, respectivamente, pelos termos linguísticos 𝐿48 e 𝐿47. Assim, ao ser realizada a busca por RLF com os mesmos antecedentes, encontramos no 𝐺𝑟𝑢𝑝𝑜 1 uma ocorrência da RLF 𝐿48, 𝐿47→ 𝐿48 e uma ocorrência da RLF 𝐿48, 𝐿47→
𝐿49. No 𝐺𝑟𝑢𝑝𝑜 2, há apenas a RLF 𝐿48, 𝐿47→ 𝐿48 com os antecedentes indicados. No 𝐺𝑟𝑢𝑝𝑜 3, não há ocorrência de RLF com os antecedentes 𝐿48 e 𝐿47.
Considerando as Equações 4.6 e 4.7, os valores crisp que representam os ter- mos linguísticos nas implicações e os pesos 𝑝𝐺1 = 0,22, 𝑝𝐺2 = 0,33 𝑒 𝑝𝐺3 = 0,44, de- finidos empiricamente para cada grupo, o valor 5421,21 foi previsto.
Em situações onde não há RLF com os antecedentes 𝐿𝑖 = 𝐿𝑛−1 e 𝐿𝑖+1= 𝐿𝑛, o valor previsto é o parâmetro central do conjunto triangular que representa o termo linguístico 𝐿𝑛.
Após algumas análises da abordagem apresentada nesta seção, dois questio- namentos foram levantados. O primeiro é em relação ao número ideal de grupos de RLF. O segundo questionamento é como os graus de influência dos grupos são defi- nidos. A partir de uma análise do modelo de previsão com foco nestes questionamen- tos, foi possível identificar a possibilidade de combinar o alisamento exponencial sim- ples a uma extensão do modelo de previsão já definido. Esta nova abordagem é apre- sentada na Seção 4.2.2.
4.2.2 Previsão em STF por meio de uma extensão do alisamento exponen-