• Nenhum resultado encontrado

Aplicabilidade do método MMC-bagging hibridizado Os resultados apresentados ao longo deste capítulo indicaram a

4. INCERTEZA DA INFERÊNCIA EM MODELOS NEURAIS 1 INTRODUÇÃO

5.6. PROPOSTA DE FERRAMENTAS NEURAIS APLICÁVEIS A dependência linear identificada entre as variáveis observadas,

5.6.2. Aplicabilidade do método MMC-bagging hibridizado Os resultados apresentados ao longo deste capítulo indicaram a

existência de relações funcionais capazes de descrever COP, consumo e MTP a partir de domínio derivado das variáveis Col e Cel, que são características de testes dos painéis MFC. Na seção 3.4, discorreu-se sobre a capacidade do perceptron multicamadas (MLP) em aproximar qualquer função contínua desconhecida. De modo geral, a aproximação de uma função é viabilizada a partir de um conjunto de exemplos rotulados, ou padrões de treinamento, {(xi, di)}, onde i = {1, 2, ..., N},

que represente o conhecimento sobre a função desconhecida. No âmbito deste trabalho, considerando os resultados de 5.5, as componentes do vetor x são valores das variáveis continuas Col e Cel e representações numéricas de variável qualitativa, relacionada ao modelo do compressor,

e d pode assumir o valor do parâmetro de interesse a ser inferido, COP, consumo ou MTP.

Em 4.5, apresentaram-se as características do método MMC- bagging hibridizado, estabelecido com o intuito de melhorar a confiabilidade metrológica de inferências realizadas por meio de redes neurais, aí incluídas as MLP, que é um aspecto imprescindível em aplicações em sistemas industriais.

Em síntese, a amostragem com reposição do bagging permite considerar os erros devidos à incompletude do conjunto de treinamento e ao processo de otimização. Complementarmente, as simulações de Monte Carlo (SMC) envolvidas propagam as PDF do conjunto de treinamento (SMCt), levando em conta os erros aleatórios e sistemáticos não compensados dos seus dados, e permitem considerar tais erros de medição durante a aplicação das redes (SMCu).

Apesar de o método ter se mostrado útil em aplicações afins (CORAL, 2014; CORAL et al, 2015), identificaram-se limitações ao seu uso no contexto deste trabalho de tese, as quais são discutidas na sequência. Para apresentá-las, simulou-se o problema do COP, colocando-o em domínio definido pelas variáveis a ele correlacionadas, Col e Cel, observando intervalos de valores e relações típicas de determinados modelos de compressores, conforme ilustrado na figura 38.

Figura 38 ‒ Simulação com dados hipotéticos e modelo irreal altamente linearizado do COP. Fonte: Autor.

C

O

P

Cel [m

bar/s]

Col [W]

De uma das retas do plano onde se situavam os valores simulados de COP (figura 38), retiraram-se amostras para compor conjunto de treinamento (pontos coloridos em preto) e teste (pontos em vermelho). O conjunto de treinamento consistia de 20 pontos igualmente espaçados. Para o conjunto de teste, selecionaram-se os 19 pontos médios associados a cada par consecutivo do conjunto de treinamento.

O objetivo da atividade consistia em treinar redes MLP, capacitando-as a generalizar a partir da região amostrada para o treinamento, seu domínio de definição. Tais redes seriam empregadas em ensemble baseado em método MMC-bagging, para avaliar a capacidade do mesmo em gerar inferências e respectivas incertezas para o conjunto de teste, originário dessa mesma região.

A opção pelo mapeamento de função linear conhecida, a ausência de ruídos nos dados simulados, a uniformidade da distribuição dos pontos amostrados e a densidade do conjunto de treinamento, foram critérios considerados para minimizar a parcela de erro decorrente do processo de treinamento das mil redes MLP envolvidas.

Para a atividade, empregaram-se todos os recursos intrínsecos ao método MMC-bagging, levando-se em conta os valores e características das incertezas de medição (IM) das grandezas envolvidas, relacionadas na tabela 15 (da página 130). Durante o uso, cada uma das redes processava mil SMCu.

As simulações ocorreram em duas etapas distintas, onde se avaliou o desempenho da ferramenta neural frente a diferentes níveis de IM das variáveis de linha, observando os erros das inferências e a qualidade das incertezas estimadas. Em ambos os casos, levou-se em conta o valor nominal da IM do COP, que é 3,2%.

Na primeira simulação, tanto para o treinamento quanto no uso das redes, considerou-se apenas 1% dos valores nominais das IM de Col e Cel, o que correspondia a 0,06 W e 1,5 mbar, respectivamente. Os resultados obtidos nessas condições estão ilustrados na figura 39. Na imagem, cada símbolo colorido em vermelho representa um valor de COP do conjunto de teste, e a barra representa a sua IM. O símbolo subsequente, na cor azul, relaciona-se ao valor da inferência, para o dado representado pelo símbolo anterior (cor vermelha), e a barra azul à incerteza da inferência estimada correspondente. Como se pode intuir da figura, a ferramenta neural mostrou boa capacidade de generalização para toda a região considerada, entretanto, o método subjacente não assegurou a propagação razoável das IM envolvidas. Nas condições simuladas, esperava-se que as incertezas das inferências fossem no mínimo iguais à IM do COP.

Figura 39 ‒ Inferências de COP considerando 100% da IM de laboratório e 1% das IM das variáveis de linha.

Fonte: Autor.

Para o segundo caso, considerou-se o valor nominal das incertezas de Col e Cel, 6 W e 150 mbar, respectivamente, com distribuições retangulares. As respostas obtidas com a aplicação do método estão ilustradas na figura 40, que possui os mesmos recursos gráficos da figura 39. Apesar de terem sido considerados níveis bem maiores de incerteza no treinamento e uso, em relação à primeira simulação, ainda assim não se obtiveram resultados sequer iguais à IM do COP. Para esse caso, adicionalmente, observou-se significativa queda na capacidade de generalização das redes envolvidas.

Parcela do efeito observado pode ser atribuída à interação entre as SMC dos vários pontos de treinamento, especialmente pela relação entre o intervalo de confiança das variáveis de linha e o tamanho do intervalo do domínio de definição da função modelada, o que justifica a ocorrência com maior intensidade na segunda simulação36.

36 Os dois efeitos observados nas simulações foram constatados posteriormente para parcela expressiva dos casos de COP, o que era esperado, pois as simulações reproduziram bem as características reais do problema.

Figura 40 ‒ Inferência de COP considerando 100% da IM de laboratório e 100% das IM das variáveis de linha.

Fonte: Autor.

O efeito de tal interação pode ser mais bem compreendido a partir da figura 41, onde os pontos em preto são projeções dos valores simulados de COP (figura 38) no plano dado por Col e Cel, e R é a região da incerteza do ponto (2100, 105).

Figura 41 – Região R decorrente da SMCt para o ponto (2100, 105) do domínio da função modelada.

Propagar a IM das variáveis associadas ao ponto (2100, 105) da figura 41, por exemplo, significa considerar que ele possa estar em qualquer lugar da região R. Nesse caso, ele influenciaria diretamente o cômputo de qualquer outro ponto. De modo geral, esse processo pode colocar como equivalentes todos os pontos do conjunto de treinamento. Como a região central estaria sujeita a certa “simetria” desse efeito, então a inferência a partir daquela região seria pouco afetada, o que não aconteceria com pontos dos extremos do intervalo do domínio de definição, onde tal interação ocorreria apenas de maneira parcial.

Função dos efeitos observados nas simulações considerou-se necessário empregar ferramentas neurais distintas para realização de inferências e para obtenção das incertezas associadas. A caracterização de tais ferramentas será apresentada na sequência.