• Nenhum resultado encontrado

3.2 Decomposição de séries temporais para alimentação de modelos de previsão

3.2.2 Decomposição por modos empíricos (EMD)

A decomposição por modos empíricos (ou empirical mode decomposition – EMD) é uma técnica de decomposição de séries em tempo-frequência, cuja proposta inicial é lidar com sinais

regidos por processos não-lineares e não-estacionários, utilizando a transformada de Hilbert- Huang. Desenvolvida por Huang et al. (1998), a EMD decompõe a série em um número geralmente pequeno de funções com base ortogonal, denominadas “funções de modo intrínseco” (ou intrinsic mode functions – IMF).

As principais inovações conceituais dessa abordagem são a introdução das IMF, baseadas nas propriedades locais do sinal, o que ressalta a frequência instantânea em função do tempo; e a introdução da ideia de frequências instantâneas para um conjunto de dados complexo, o que elimina a necessidade de harmônicos espúrios para representar relações não-lineares e não- estacionárias. Por essa última razão, principalmente, a EMD parece apropriada para abordar fenômenos naturais, como as séries temporais hidrológicas, que comumente apresentam sobreposição de componentes periódicos em diversas escalas.

Ao contrário da TWD, a função base da EMD não é fixa a priori, e seu fundamento não é matemático, mas empírico. De forma geral, a EMD difere da transformada wavelet discreta por se basear em um método adaptativo de decomposição relacionado às propriedades de cada sinal, sem impor características matemáticas pré-definidas à série temporal (NAPOLITANO et al., 2011; NEVES et al., 2012; HUANG et al., 2014).

Huang et al. (2009) explicam que, pela abordagem da EMD, a escala característica é definida como a distância entre dois pontos máximos (ou mínimos) sucessivos, o que confere à técnica a possibilidade de lidar com escalas explicitamente locais. Como mencionado, a decomposição empírica da EMD supõe que qualquer conjunto de dados possa ser separado em um conjunto finito de funções de modo intrínseco. Com efeito, cada IMF é uma série temporal que satisfaz duas propriedades:

• Em todo o conjunto de dados, o número de extremos (máximos e mínimos) e o número de cruzamentos na abcissa zero devem ser iguais, ou diferentes no máximo por uma unidade; e

• Em qualquer ponto da série, os valores médios das envoltórias definidas pelas curvas interpoladas que passam por todos os máximos locais e todos os mínimos locais são iguais a zero.

A primeira condição se mostra evidente e semelhante aos requisitos tradicionais de banda estreita para um processo com comportamento Gaussiano estacionário, ao passo que a segunda condição incorpora uma novidade, visto que modifica as exigências clássicas de tratamento global dos dados com base em uma caracterização local. Ela é necessária para que a frequência instantânea não adquira as flutuações indesejadas, induzidas por oscilações assimétricas. Idealmente, a segunda condição deveria ser “a média local dos dados igual a zero”. No entanto, para processos não-estacionários, a média local envolve uma escala de tempo local, o que é impossível de se obter. Como alternativa, Huang et al. (2009) sugerem utilizar a média local das envoltórias definidas pelos máximos e mínimos locais com o fim de forçar a simetria local. O algoritmo da EMD decompõe uma série temporal x(t) no conjunto de funções IMF, ci(t), i =

1, ... , L e uma parte restante r(t) denominada “resíduo”, o qual representa um padrão

monotônico e pode ser considerado como a tendência geral da série original. A soma de todos os IMF com o resíduo recompõe a série original, conforme a equação a seguir:

𝑥(𝑡) = ∑ 𝑐𝑖(𝑡)

𝐿

𝑖=1

+ 𝑟(𝑡) (3.23)

Dessa expressão, Napolitano et al. (2011) pontuam que há alguns erros numéricos inevitáveis, geralmente insignificantes. Uma característica importante das IMF é que sua transformação de Hilbert é consistente com definições que fornecem descrição de tempo-frequência-energia de uma série temporal. Com efeito, a propriedade de adaptabilidade se torna relevante na análise de processos não-lineares e não-estacionários, visto que essa adaptação às variações pontuais dos dados pode explicar alguns processos físicos associados. Huang et al. (1998) acrescentam que o objetivo da EMD não é fornecer uma expressão linear fisicamente significativa da série temporal, mas prover componentes individuais no sistema linear que podem ter um significado físico relacionado ao sistema não-linear, quando assumida a série completa.

As IMF são definidas por um processo iterativo denominado sifting, ou peneiramento, que é a base do algoritmo da EMD. Sua função é eliminar gradualmente as oscilações, suavizando os perfis das séries. A Figura 3.7 permite melhor visualização do processo de decomposição por modos empíricos, utilizando a transformada de Hilbert-Huang. Por ela, a série de dados “h1(t)”,

é envolvida pela interpolação dos extremos máximos e mínimos, respectivamente “u1(t)” e

Figura 3.7: Processo de decomposição por modos empíricos para obter a IMF m1(t) Fonte: Criado por Geir Kulia, modificado por Matt Hall (Creative Commons).

O procedimento da decomposição por modos empíricos pode ser resumidamente encontrado pelos seguintes passos (NEVES et al., 2012):

1. Identificar todos os pontos extremos de máximos e mínimos locais da série de dados

x(t);

2. Determinar a envoltória superior emax e a envoltória inferior emin, a partir, por exemplo,

da interpolação via spline cúbica. Para outras interpolações, consultar Huang & Wu (2008); 3. Encontrar a média “m(t)”, com m = [emax(t) + emin(t)]/2, ponto a ponto, entre as duas

envoltórias;

4. Extrair o detalhe h1(t) = x(t) – m(t);

5. Se m(t) = 0 ou menor que um limiar fixo, o detalhe “h1” é armazenado como a primeira

IMF, que passa a ser nomeada “c1”, ver Eq. (3.23);

6. Caso contrário, as etapas 1 a 3 são repetidas, agora tratando “h1(t)” como um dado da

série, e assim por diante, até que h1(t) preencha as propriedades de uma IMF (número de

cruzamentos igual a zero e média zero); e

7. Obter a diferença r1(t) = x(t) – c1(t). Uma sugestão para o término do procedimento é

fazê-lo quando o número de extremos de r1(t) for menor ou igual que dois; caso contrário,

r1(t) deve ser tratado como uma nova série de dados x(t) e repetir os passos 1 a 4 para definir

Segundo Neves et al. (2012), a iteração que consta no passo 4 é a responsável pelo peneiramento da técnica. Atendido o critério de convergência, conforme sugerido no passo 5, o cálculo é interrompido e o resultado é um conjunto de IMF somado ao resíduo. Essa abordagem permite a modulação de frequência e de amplitude simultaneamente.

Ao trabalhar com o pré-processamento de séries de vazão para modelar uma rede neural artificial, Napolitano et al. (2011) mencionam que a natureza orientada por dados da EMD é sobretudo compatível com a natureza não paramétrica das RNAs. Com efeito, essa combinação fornece uma estratégia de modelagem muito flexível, a qual, dependendo das particularidades da série histórica, como trechos com maior quantidade de energia, é capaz de apresentar resultados competitivos em relação à transformada wavelet.

3.3 Modelos de aprendizado de máquina para previsão de séries