Construção e avaliação dos meta-modelos - Otimização do processo de produção de etanol de segun

Nesta seção detalha-se a metodologia para a construção e avaliação dos meta- modelos escolhidos (PL, NN e KR). O objetivo dessa avaliação foi acrescentar a informação obtida na revisão bibliográca, mediante a utilização prática dos diferentes meta-modelos como substitutos de modelos rigorosos. A informação obtida nessa avaliação contribuiu para a escolha do tipo de meta-modelo que foi utilizado posteriormente na continuação do trabalho de pesquisa. O software Matlab foi utilizado para a construção e avaliação dos meta-modelos.

3.3.1 Construção dos meta-modelos

Foram utilizadas três funções teste de duas dimensões (Six-hump camel-back, Griewank e Bird), uma função teste de dez dimensões (Rosenbrock), assim como a simulação da biorrenaria como modelos rigorosos a ser substituídos pelos diferentes meta-modelos. As equações das funções teste utilizadas e suas respectivas referências de origem encontram-se no Apêndice E. No caso das três funções teste de duas dimensões, além da avaliação quantitativa foi realizada uma avaliação qualitativa mediante a comparação dos grácos de superfície e contorno produzidos pelos meta- modelos com os grácos reais correspondentes às funções teste. A função teste de dez dimensões permitiu avaliar o comportamento dos meta-modelos substituindo

modelos rigorosos de grande dimensão, e a utilização da simulação da biorrenaria possibilitou testar o desempenho dos meta-modelos como substitutos em uma aplicação prática da engenharia química.

Para a construção dos meta-modelos tomaram-se três conjuntos de pontos de projeto de diferentes tamanhos para poder avaliar a inuência desse parâmetro na qualidade do meta-modelo obtido. A quantidade de pontos de projeto do menor conjunto de dados foi de apenas 15 vezes a dimensão da função teste. Já a quantidade de pontos de projetos dos conjuntos médio e grande foi o dobro e o triplo, respectivamente, do menor conjunto. A Tabela 3.19 apresenta os conjuntos de dados utilizados para a construção dos meta-modelos avaliados.

Tabela 3.19: Dados de projeto utilizados para a construção dos meta-modelos. Modelo Pontos de

Identicação rigoroso projeto S-30 Six-hump camel-back 30 S-60 Six-hump camel-back 60 S-90 Six-hump camel-back 90 G-30 Griewank 30 G-60 Griewank 60 G-90 Griewank 90 B-30 Bird 30 B-60 Bird 60 B-90 Bird 90 R-150 Rosenbrock 150 R-300 Rosenbrock 300 R-450 Rosenbrock 450 Bio-30 Biorrenaria 30 Bio-60 Biorrenaria 60 Bio-90 Biorrenaria 90

A seleção dos pontos de projeto foi feita utilizando um planejamento experimental do tipo LHS (JOHNSON et al., 1990). A aplicação desse tipo de planejamento experimental é recomendado por vários autores (FORRESTER e KEANE, 2009; JONES et al., 1998; KLEIJNEN et al., 2012; PALMER e REALFF, 2002a; REGIS, 2016; SÓBESTER et al., 2005). O código para gerar o planejamento experimental do tipo LHS é mostrado no Apêndice C.1.

Utilizando cada conjunto de dados de projeto foram construídos os 42 meta- modelos apresentados na Tabela 3.20. Não foram construídos meta-modelos polinomiais para a função teste de dez dimensões considerando que esse tipo de meta-modelo apresentou os piores resultados como substituto das funções teste de duas dimensões.

Tabela 3.20: Meta-modelos construídos.

Modelos rigorosos Polinômio Rede neuronal Kriging Six-hump camel-back S-30-PLS-60-PL S-30-NNS-60-NN S-30-KRS-60-KR S-90-PL S-90-NN S-90-KR Griewank G-30-PLG-60-PL G-30-NNG-60-NN G-30-KRG-60-KR G-90-PL G-90-NN G-90-KR Bird B-30-PLB-60-PL B-30-NNB-60-NN B-30-KRB-60-KR B-90-PL B-90-NN B-90-KR Rosenbrock -- R-150-NNR-300-NN R-150-KRR-300-KR - R-450-NN R-450-KR

Biorrenaria Bio-30-PLBio-60-PL Bio-30-NNBio-60-NN Bio-30-KRBio-60-KR Bio-90-PL Bio-90-NN Bio-90-KR

\ A primeira letra representa o modelo que está sendo substituído pelo meta-

modelo: S - Six-hump camel-back, G - Griewank, B - Bird, R - Rosenbrock e Bio - Biorrenaria;

\ Os números representam a quantidade de pontos de projetos utilizados para a

construção do meta-modelo;

\ As duas letras nais representam o tipo de meta-modelo: PL - Polinômio, NN

- Rede neuronal e KR - Kriging.

Para a construção dos meta-modelos do tipo polinomial foi utilizado o toolbox Curve Fitting do Matlab. Foram ajustados polinômios de quinta ordem, que é a maior ordem disponível no referido toolbox. Não foi desconsiderado a priori nenhum termo do polinômio, pelo que o número de parâmetros a estimar foi 21 para as funções teste de duas dimensões. No Apêndice C.2 apresenta-se o código para a construção do meta-modelo polinomial.

No ajuste das redes neuronais utilizou-se a ferramenta Neural Net Fitting do toolbox de redes neuronais de Matlab. A estrutura utilizada para as diferentes redes neuronais construídas está ilustrada na Figura 3.12, sendo compostas de três camadas: entrada, intermediária oculta e saída. Para as funções de duas dimensões foram utilizados 5 neurônios na camada oculta, totalizando 21 parâmetros a estimar, coincidente com o número de parâmetros dos polinômios. Já para a função de dez dimensões foram 10 os neurônios utilizados, levando a 121 o número de parâmetros a serem estimados. Não foi recomendado aumentar mais o número de neurônios devido a que no menor conjunto de dados de projeto há apenas 30 pontos para

as funções de duas dimensões e 150 pontos para a função de dez dimensões, do contrário seria maior o risco de over-tting fazendo que a rede perca a capacidade de predição.

A função de ativação da camada de saída foi denida como linear, já para a camada intermediária oculta foi utilizada a função logarítmica-sigmoidal, e o algoritmo Levenberg-Marquardt Backpropagation foi utilizado para o ajuste, tudo isso em concordância com as recomendações de GOMES (2007). Como o problema de otimização resultante para estimar os parâmetros da rede neuronal não é convexo, o ajuste foi repetido três vezes. Em cada tentativa tomou-se diferentes estimativas iniciais para os parâmetros, de modo que diferentes redes neuronais foram obtidas. Foi escolhida a rede neuronal de melhor desempenho tomando como indicador o valor do erro quadrático médio (MSE). No Apêndice C.3 é apresentado o código utilizado para o ajuste das redes neuronais.

Figura 3.12: Estrutura utilizada para as redes neuronais.

Fonte: Matlab.

Por último, para construir o meta-modelo do tipo Kriging foi utilizado o toolbox DACE (LOPHAVEN et al., 2002), também implementado em Matlab. Essa ferramenta permite calcular além da predição da variável resposta para determinada condição de entrada, uma estimativa do erro de predição, assim como o valor das derivadas parciais da variável resposta em relação às variáveis de entrada. O modelo de regressão escolhido foi um polinômio de segundo grau e o modelo de correlação foi baseado na função de correlação de Gauss. No caso das funções teste de duas dimensões, o número de parâmetros a serem estimados foi de apenas 8, sendo 6 correspondentes ao polinômio de segunda ordem e mais 2 parâmetros da função de correlação. Já para a função de dez dimensões foram necessários 66 parâmetros correspondentes ao polinômio de segunda ordem e 10 parâmetros da função de correlação, totalizando 76 parâmetros. Nota-se que o número de parâmetros que é necessário estimar para construir os meta-modelos Kriging é bem menor que para os polinômios e as redes neuronais. O código empregado para a construção dos meta-modelos Kriging está apresentado no Apêndice C.4.

3.3.2 Avaliação dos meta-modelos

Para avaliar a capacidade de predição dos diferentes meta-modelos foi utilizada a técnica de separação dos dados. Essa técnica consiste em utilizar um conjunto de dados para avaliação diferente daquele utilizado para a construção do meta- modelo (QUEIPO et al., 2005). Isso é imprescindível para o caso do meta-modelo do tipo Kriging. Esse meta-modelo tem a característica de ser interpolador, de modo que a sua predição sempre coincide com o modelo rigoroso quando a condição de entrada é um ponto de projeto. Cada um dos meta-modelos construídos foi utilizado para predizer o modelo rigoroso em um conjunto de pontos diferentes aos utilizados para a sua construção. Para as funções teste de duas dimensões o conjunto de dados de validação foi de 500 pontos, e para a função teste de dez dimensões foram utilizados 1000 pontos. Os dados de validação foram gerados utilizando também um planejamento do tipo LHS. Os parâmetros utilizados para a avaliação foram os seguintes:

\ Adequação qualitativa da predição do meta-modelo com o modelo rigoroso:

comparação visual de grácos de contorno e de superfície (só aplicável para as funções teste de duas dimensões) e grácos de comparação das respostas;

\ Adequação quantitativa da predição do meta-modelo com o modelo rigoroso:

coeciente de correlação (r), índice de concordância (d), e índice global de desempenho (c);

\ Concordância do ótimo do meta-modelo com o ótimo do modelo rigoroso; \ Tempo computacional necessário para a construção e otimização dos meta-

modelos.

As denições dos parâmetros quantitativos utilizados na avaliação são:

r = Pn i=1(ybi−by)(yi− y) q Pn i=1(ybi−by) 2Pn i=1(yi− y)2 (3.5) d = 1 − Pn i=1(yi−byi) 2 Pn i=1(|byi− y| + |yi− y|) 2 (3.6) c = rd (3.7)

em que r é o coeciente de correlação linear de Pearson; byi e yi são os valores da predição do meta-modelo e a resposta do modelo rigoroso, respetivamente;ybe y são os respectivos valores médios; d é o índice de concordância e c é o índice global de desempenho.

Esses tês indicadores estão restritos a valores entre 0 e 1, sendo que quanto mais próximos a 1, melhores são as características do meta-modelo como substituto do modelo rigoroso. O coeciente de correlação quantica a capacidade do meta- modelo de acompanhar a tendência do modelo rigoroso e o índice de concordância está relacionado com a sua exatidão (WILLMOTT, 1981). O índice global de desempenho é calculado pelo produto do coeciente de correlação (r) e do índice de concordância (d), e permite avaliar conjuntamente a precisão e a exatidão dos resultados obtidos.

3.4 Algoritmo de otimização global assistida por

No documento Otimização do processo de produção de etanol de segunda geração em um sistema integrado à primeira geração (páginas 101-106)