Correlação ponderada - Escolha dos autotriples

Singular Spectrum Analysis

3.3 Informações adicionais

3.3.3 Escolha dos autotriples

3.3.3.2 Correlação ponderada

● ● ● ● ● ● _● ● ● ● ● _● ● ● ● ● ● ● ● ● ● ● ●

Figura 3.2: Autovalores resultantes da decomposição da série em 24 componentes

com os resultados teóricos disponíveis na literatura.

3.3.3.2 Correlação ponderada

Assim como apresentado na Seção3.3.1, uma condição necessária para a separabilidade (aproximada) de duas séries é a existência de correlação ponderada nula (ou próxima de zero) dos componentes reconstruídos. Em outras palavras, os componentes altamente correlacionados se tornam pertencentes a um mesmo grupo de autotriples.

Uma ferramenta complementar utilizada para o processo de agrupamento é conhecida como “matriz w-correlação”. Tal ferramenta consiste na análise gráfica da matriz das correlações ponderadas (Seção 3.3.1), que indica as correlações entre as componentes da SVD através de uma escala de cores variando do branco ao preto, correspondendo aos valores absolutos das correlações (0 a 1).

A forma da matriz w-correlação fornece um indicativo de como realizar um agrupa-mento adequado, a saber: espera-se uma divisão clara dos componentes em duas partes. A primeira parte é constituída por componentes altamente correlacionados (tonalidade mais escura), o que caracteriza o grupo de autotriples relacionado ao sinal da série. Por

outro lado, a segunda parte retrata o ruído, exibindo muitos componentes com correlações baixas (tonalidades claras).

A Figura 3.3 mostra a aplicação da ferramenta “matriz w-correlação” para a série exemplificada na subseção anterior.

Componentes C o mp o n e n te s F1 F3 F5 F7 F9 F11 F13 F15 F17 F19 F21 F23 F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 F13 F14 F15 F16 F17 F18 F19 F20 F21 F22 F23 F24

Figura 3.3: Matriz w-correlação (correlações ponderadas)

Nota-se, através da Figura 3.3, que o sinal da série pode ser formado pelos doze autotriples principais, indicando que os doze primeiros componentes são suficientes para reconstruir a série original. Por outro lado, os demais componentes formam o ruído, ou seja, a partir do décimo terceiro componente observa-se a existência de mais componentes com correlações maiores, representadas através das tonalidades mais fortes.

3.4 Previsão via SSA

De acordo com os aspectos metodológicos da previsão SSA, pode-se obter predições em série temporal que satisfazem (aproximadamente) as fórmulas recorrentes linear (LRFs, do inglês linear recurrent formulae). Diz-se que uma série Y_tsatisfaz uma LRF de ordem ou dimensão L − 1 se existirem coeficientes a1, ..., a_L−1 , tal que

Y_{N −j} = L−1 X p=1 apY_{N −j−p}; (3.12) em que 0 ≤ j ≤ N − L .

Conforme apresentado por Hassani (2007), os coeficientes a1, ..., a_L−1podem ser encon-trados através dos autovetores obtidos a partir do passo SVD. Para maiores informações pode-se consultar Golyandina, Nekrutkin e Zhigljavsky (2001); capítulos 2 e 5.

A classe de séries temporais regidas por LRFs é bastante ampla, tal classe inclui polinômios, termos harmônicos e exponenciais. Uma série que satisfaz alguma LRF pode ser representada como uma soma de produtos de polinômios, exponenciais e harmônicos; assim como segue:

Yt=

p=1

ap(t)e^tµpsin(2πtωp+ ϕp); (3.13)

onde ap(t) representam polinômios; µp, ωp e ϕp são constantes arbitrárias. E q denota o número de termos linearmente independentes.

Golyandina, Nekrutkin e Zhigljavsky (2001) apresentam a ideia das fórmulas recor-rentes linear expressando séries governadas por uma LRF de ordem mínima, cuja dimensão é representada por d. Segundo características da decomposição da SSA (Subseção3.2.1.2), existem no máximo d valores singulares não nulos na SVD da matriz S; e portanto, mesmo que o L e K sejam maiores do que d, precisa-se de no máximo d matrizes elementares Ei

para reconstruir a série.

Contudo, na prática, dificilmente espera-se ter uma série que seja regida por uma LRF de dimensão pequena. Diante de uma série governada por uma LRF (3.12), pode-se dar continuidade para um número arbitrário de passos à frente, ao usar a mesma LRF. Na verdade, não é necessário buscar uma dimensão mínima da LRF, pois qualquer LRF que governe uma determinada série temporal produz a mesma “continuação” da série original Yt. Esta “continuação” é obtida ao aplicar uma LRF nos termos passados da série Yt .

A previsão SSA recebeu uma contribuição importante do Danilov (1997a, 1997b). Este autor obteve o seguinte resultado: se o espaço linear £r, também conhecido como espaço trajetória, gerado pelas colunas da matriz trajetória tem dimensão (r) menor do que L e este espaço é um espaço “não-vertical”, então a série satisfaz, naturalmente, uma LRF de dimensão L − 1. Em linhas gerais, diz-se que £r é um espaço “não-vertical” se a base

eL6∈ £r, em que eL= (0, 0, · · · , 0, 1)^T ∈ RL.

Diante da suposição de espaço “não-vertical”, o espaço trajetória £r produz LRFs adequadas. Tais LRFs podem ser usadas para a previsão dos componentes da série, correspondendo às matrizes de posto unitário selecionadas no terceiro passo da técnica SSA; o que representa a seleção de um espaço r − dimensional (£r ∈ RL) gerado pelos correspondentes left singular vector. Este processo de previsão é conhecido como recurrent forecasting algorithm.

Para o presente trabalho foi utilizado o algoritmo recorrente de previsão baseado no SSA básico, que encontra-se descrito na próxima subseção, isto é, Seção 3.4.1.

Assim como no SSA básico, a característica da separabilidade ajuda na seleção do espaço trajetória. Segundo Golyandina, Nekrutkin e Zhigljavsky (2001), a separabilidade relaciona-se diretamente com as LRFs, ou seja, caso duas séries sejam separáveis (conforme apresentado na Subseção 3.3.1); estas certamente serão regidas por certas LRFs.

Geralmente, objetiva-se realizar a previsão do sinal na presença do ruído. Isto é, supõe-se que a série original Yté formada pelo sinal Y_t⁽¹⁾ e pelo ruído Y_t⁽²⁾; componentes aditivos e separáveis entre si

Yt = Y_t⁽¹⁾+ Y_t⁽²⁾

. Em outras palavras, o interesse concentra-se em dar continuidade ao componente Y_t⁽¹⁾ da série temporal Y_t; sendo assim, assume-se que Y_t⁽¹⁾ satisfaz alguma LRF e é separável da série residual h

Y_t⁽²⁾ = Yt− Yt⁽¹⁾

para o valor selecionado de L (discutido na Subseção3.3.2). Como mencionado anteriormente, se duas séries são fortemente separáveis, então cada uma delas deve satisfazer alguma LRF .

A teoria utilizada na previsão SSA pode ser encontrada no capítulo 5 da obra da Golyandina, Nekrutkin e Zhigljavsky (2001). E maiores detalhes sobre as LRFs podem ser encontrados na seção 5.2 da obra ora citada.

No documento Análise Espectral Singular: Modelagem de séries temporais através de estudos comparativos usando diferentes estratégias de previsão. (páginas 68-71)