• Nenhum resultado encontrado

de estabilidade no atendimento ao programa de produção, adotando o melhor consumo horário médio de combustível como referência.

O dados brutos são os dados oriundos do processo de pelotização e que serão usados para treino, teste e validação. A base de dados é composta por dados reais, obtidos dos sensores da planta de produção. Uma sequência de 551 leituras que foram coletadas do processo de pelotização, em intervalos de 4 horas. Cada leitura contém 35 variáveis do processo que, de acordo com o praticado pelos especialistas da empresa, têm influência no consumo de gás. A quantidade de leituras equivale a 90 dias de operação da planta de pelotização, de 22 de setembro de 2018 a 01 de janeiro de 2019. São 35 variáveis:

• 7 variáveis referente às granulometrias das pelotas que compõem o leito;

• 6 variáveis de pressão fornecida ao processo por 6 ventiladores;

• 2 variáveis temperatura do fluxo de 2 ventiladores;

• 16 variáveis, 1 variável de rotação e 1 variável da posição das válvulas de saída (dampers) dos 8 ventiladores

• 1 variável referente ao percentual de carbono fixo das pelotas queimadas;

• 1 variável da altura do leito;

• 1 variável da velocidade de rotação do leito de pelotas e;

• 1 variável da produção horária.

Informações descritivas sobre média, variância, valores mínimos, valores máximos e quartis, se encontram no Apêndice A.

Figura 9 – Fluxo entre o conjunto de dados “bruto” e o “tratado”.

Conjunto de dados

“bruto”

(36 características)

Limpeza dos dados

Análise de sazonalidade

Conversão para forma tabular (janela

de tamanho N = 6) Tamanho da

janela (N = 6)

Conjunto de dados

“tratado” (na forma tabular; janela de

tamanho N = 6;

216 características)

Fonte: Elaborado pelo autor (2022).

Uma série temporal y(t) pode ser decomposta como (MORETTIN; TOLOI, 2018, Cap. 3):

y(t) =T(t) +S(t) +R(t) (2)

onde T(t) é um componente chamado de tendência,S(t) é um componente chamado de sazonalidade e R(t) é um componente chamado de resíduo, que geralmente é um sinal de série temporal estocástico. A sazonalidade em uma série temporal capta os padrões regulares da série tais como oscilações de subida e de queda que sempre ocorrem em um determinado período do ano, do mês, da semana ou do dia.

A Equação 2 define um modelo aditivo para a série temporal. Um modelo aditivo é linear, i.e., as mudanças ao longo do tempo são feitas consistentemente pela mesma quantidade.

Uma sazonalidade linear tem a mesma frequência (largura dos ciclos) e amplitude (altura dos ciclos). Também existe um modelo multiplicativo, não linear, para representação de tendência, sazonalidade e ruído de séries temporais, mas este modelo não será abordado neste trabalho.

A decomposição sazonal de uma série temporal é usada principalmente para análise de séries temporais. Ele fornece uma maneira estruturada de pensar sobre um problema de previsão de séries temporais, geralmente em termos de complexidade de modelagem e especificamente em termos de como capturar melhor cada um desses componentes em um determinado modelo.

O primeiro passo em uma decomposição clássica é usar um método de média móvel para estimar o ciclo de tendência. Uma média móvel de ordem m é definida como:

Tˆ(t) = 1 m

k

X

j=−k

y(t) +j (3)

onde m = 2k+ 1. Ou seja, a estimativa do ciclo de tendência no tempo t é obtida pela média dos valores da série temporal dentro de k períodos det. Chamamos isso dem-MA, significando uma média móvel de ordem m.

O método de decomposição clássico é um procedimento relativamente simples e constitui o ponto de partida para a maioria dos outros métodos de decomposição de séries temporais.

Ele é descrito abaixo para uma série temporal com período sazonal m.

1. Se m for um número par, calcule o componente do ciclo de tendência ˆT(t) usando 2×m-MA. Se m for um número ímpar, calcule o componente do ciclo de tendência Tˆ(t) usando um m-MA.

2. Calcule a série sem tendência y(t) = y(t)−Tˆ(t).

3. Para estimar o componente sazonal para cada “estação”, basta calcular a média de y(t) para aquela estação. Por exemplo, com dados mensais, o componente sazonal de março é a média de todos os valores y(t) de março. Esses valores de componentes sazonais são então ajustados para garantir que somam zero. O componente sazonal é obtido juntando esses valores mensais e, em seguida, replicando a sequência para cada ano de dados. Isso dá ˆS(t).

4. O componente residual é calculado subtraindo os componentes sazonais e de tendência estimados: ˆR(t) = y(t)−Tˆ(t)−Sˆ(t).

Existem métodos para decompor automaticamente uma série temporal. A biblioteca stats-models do Python fornece uma implementação do método de decomposição clássico em uma função chamadaseasonal_decompose. Esta função requer que se especifique se o mo-delo é aditivo ou multiplicativo. Neste trabalho utilizamos a função seasonal_decompose especificando o modelo aditivo para realizar a decomposição sazonal da série temporal correspondente à variável alvo, i.e., ao consumo específico de gás.

A Figura 10 apresenta os gráficos da decomposição sazonal da série temporal referente ao consumo efetivo de gás. A série temporal em si é mostrada no gráfico mais acima. O gráfico identificado como “Trend” representa os valores da componente de tendência, o gráfico identificado como “Seasonal” apresenta os valores da componente de sazonalidade, e o gráfico mais abaixo, identificado como “Resid”, apresenta os valores da componente de

Figura 10 – Decomposição sazonal da variável alvo (consumo específico de gás).

Fonte: Elaborado pelo autor (2022).

resíduo. Como se pode ver, a componente de sazonalidade é muito bem definida com um período constante. A componente de tendência, entretanto, oscila entre 6 e 7 no início do período, em que podemos ver um pico de aproximadamente 9,5 no dia 2018-10-25, e em seguida oscilando em torno do intervalo de 7 a 8. Essa oscilação da componente de tendência poderia sugerir que a série temporal não é estacionária, por isso foi utilizado o Advanced Dickey-Fuller Test (MORETTIN; TOLOI, 2018, Apêndice A) para determinar o grau de estacionariedade da série temporal. O resultado obtido foi um p-value de 4,099×10−7, o que indica um alto grau de estacionariedade da série.

Uma estratégia bem estabelecida para aplicar modelos de aprendizado de máquina supervi-sionados à predição de séries temporais, uni ou multivariadas, é converter a série temporal em um conjunto de dados tabular. Aplicam-se janelas deslizantes de N observações contínuas sobre a série temporal e “lineariza-se” estas observações como uma linha de um conjunto de dados (GONZALEZ-VIDAL; JIMENEZ; GOMEZ-SKARMETA, 2019). O resultado da aplicação desta estratégia é altamente dependente do hiperparâmetro N, que foi definida pela análise de sazonalidade. Baseado na análise de sazonalidade, calculando

os valores médios sem tendência para cada período sazonal, no caso deste trabalho 4h, o tamanho definido foi de 6 períodos, equivalente a aproximadamente 24h. O processo de “linearização” da janela deslizante concatena em uma única linha as observações dos N = 6 instantes de tempo da janela, com o passo temporal em 1, o que faz com que o número total de variáveis, no conjunto de dados tabular gerado por este processo seja de 6×36 = 216.

Documentos relacionados