Figura 20 – Rede neural com 2 camadas BiLSTM com 1.024 neurônios.

Fonte: Elaborado pelo autor.

Figura 21 – Rede neural com 2 camadas LSTM com 2.048 neurônios.

Fonte: Elaborado pelo autor.

Figura 22 – Rede neural com 1 camada LSTM com 4 neurônios.

Fonte: Elaborado pelo autor.

complexidade de um alto-forno, para apoiar esta interpretação qualitativa é avaliada a métrica MdRAE que permite a comparação ponto a ponto entre as predições realizadas por um modelo e um modelo referência, permitindo desta forma uma comparação de desempenho entre dois modelos. Com essa comparação adicional, observou-se que os modelos LSTM obtiveram melhores desempenhos frente aos demais modelos avaliados, exceto quando comparado com o modelo LSTM (Ablação). Nessa comparação com o modelo LSTM (Ablação) o melhor resultado obtido foi um desempenho quase equivalente do modelo LSTM que obteve melhor métrica RMSE (LSTM 1 Camada com 2.048 neurônios), a comparação de desempenho entre eles apresentou MdRAE de 1,03, apontando um desempenho próximo entre eles.

Considerando os componentes existentes no modelo LSTM, apresentados na Seção, eles permitem que o modelo retenha informações importantes sobre conjunto de dados e descarte informações menos importantes. Assim, o modelo LSTM é capaz de lidar com dependências de longo prazo, uma vez que as informações podem permanecer em sua memória por muitas etapas. Essa estratégia permite transpor limitações de técnicas tradicionais de previsão em séries temporais, adaptando-se ao comportamento não linear do processo de operação de um alto-forno. Dessa forma, dos modelos avaliados neste trabalho, esse foi o modelo que mais se adaptou ao cenário complexo, não linear e com dependências de longo prazo de um alto-forno.


Esse trabalho avaliou a utilização de redes neurais baseadas em LSTM no problema de predição da temperatura de ferro-gusa produzido por um alto-forno. Uma base de dados foi construída, pré-processada e utilizada para treinar e avaliar os modelos. Inicialmente, a base possuía mais de 430 variáveis de processo e após entrevistas com especialistas e engenheiros de processo, foram selecionadas 92 características.

Experimentos compararam a performance das redes neurais com baselines que prediziam a temperatura como sendo igual à anterior e usando a média móvel das temperaturas anteriores. Também foi realizado um estudo de ablação em que as redes não receberam dados das variáveis do processo, mas apenas as temperaturas anteriores. Além disso foi avaliado o uso do algoritmo Random Forest bem como o método estatístico VAR.

A utilização da rede neural LSTM se confirmou como melhor alternativa frente aos baselines considerando as avaliações quantitativas e qualitativas. A LSTM que recebe somente a temperatura como entrada e o modelo Random Forest (que recebeu todas as características selecionadas) apresentaram os menores RMSE e MAPE, porém elas apresentam comportamento similar a repetição de temperaturas anteriores; entende-se que não é um comportamento esperado para a tarefa objetivo, levando-se em conta o número de variáveis envolvidas e a complexa interação entre elas. As predições realizadas pela LSTM que recebe todas as características selecionadas apresentaram um comportamento mais próximo do esperado, sendo que o melhor resultado obtido utilizando a rede neural LSTM com 1 camada com 2.048 neurônios: RMSE de 11,75C, MAPE de 0,58% e R2 de 0,75; somado a isso esta LSTM apresentou também melhor performance, medida através da métrica MdRAE, quando comparada a maioria dos métodos avaliados.

Trabalhos futuros poderão incluir a aplicação dos modelos em dados de outros altos-fornos, para verificar se os modelos não aprenderam características específicas e únicas do alto-forno utilizado no projeto. Também é possível a aplicação de técnicas de seleção de características adicionais ao processo de seleção utilizada neste trabalho, o qual se baseou na experiência de especialistas e engenheiros de processo. Adicionalmente, ainda cabe nesse trabalho o uso de técnicas de calibração de hiperparâmetros, para melhor desempenho do modelo proposto.

A continuação desse trabalho se dará na investigação para identificar quais são as características que mais influenciam na variação da temperatura. O objetivo dessa identificação é principalmente orientar o operador qual a atuação necessária para modificação da temperatura de forma conveniente.


