• Nenhum resultado encontrado

Desenvolvimento de ferramentas baseadas em redes neurais artificiais para inferência de parâmetros de desempenho de compressores herméticos por meio de ensaios de capacidade de elevação de pressão

N/A
N/A
Protected

Academic year: 2021

Share "Desenvolvimento de ferramentas baseadas em redes neurais artificiais para inferência de parâmetros de desempenho de compressores herméticos por meio de ensaios de capacidade de elevação de pressão"

Copied!
125
0
0

Texto

(1)
(2)
(3)

Vinicius Trombin Barros

DESENVOLVIMENTO DE FERRAMENTAS BASEADAS EM REDES NEURAIS ARTIFICIAIS PARA INFERÊNCIA DE PARÂMETROS DE DESEMPENHO DE COMPRESSORES HERMÉTICOS POR MEIO DE ENSAIOS DE CAPACIDADE DE

ELEVAÇÃO DE PRESSÃO

Dissertação submetida ao Programa de Pós-Graduação em Engenharia Mecânica da Universidade Federal de Santa Catarina para a obtenção do Grau de Mestre em Engenharia Mecânica.

Orientador: Prof. Carlos Alberto Flesch, Dr. Eng.

Coorientadores: Ahryman Seixas Busse de Siqueira Nascimento, M. Eng. e Prof. Rodrigo Coral, Dr. Eng.

Florianópolis 2019

(4)
(5)

Vinicius Trombin Barros

DESENVOLVIMENTO DE FERRAMENTAS BASEADAS EM REDES NEURAIS ARTIFICIAIS PARA INFERÊNCIA DE PARÂMETROS DE DESEMPENHO DE COMPRESSORES HERMÉTICOS POR MEIO DE ENSAIOS DE CAPACIDADE DE

ELEVAÇÃO DE PRESSÃO

O presente trabalho em nível de mestrado foi avaliado por banca examinadora composta pelos seguintes membros:

Prof. Carlos Alberto Flesch, Dr. Eng. – Orientador Universidade Federal de Santa Catarina

Prof. Tiago Loureiro Figaro da Costa Pinto, Dr. Eng. Universidade Federal de Santa Catarina

Prof. Mauro Roisenberg, Dr. Eng. Universidade Federal de Santa Catarina

Certificamos que esta é a versão original e final do trabalho de conclusão que foi julgado adequado para obtenção do título de mestre pelo Programa de

Pós-Graduação em Engenharia Mecânica Florianópolis, 27 de Junho de 2019.

Prof. Jonny Carlos da Silva, Dr. Eng. Coordenador do Curso

Prof. Carlos Alberto Flesch, Dr. Eng. – Orientador Universidade Federal de Santa Catarina

Florianópolis, 17 de setembro de 2019

Assinado de forma digital por Carlos Alberto Flesch:43243118972 Dados: 2019.10.21 16:14:58 -03'00'

Assinado de forma digital por Jonny Carlos da Silva:51451506449

(6)
(7)

Dedicado a Olavo Bergamaschi Barros Jr. Cláudia Cristina Trombin Barros

(8)
(9)

AGRADECIMENTOS

Aos meus pais, Olavo Bergamaschi Barros Jr. e Cláudia Cristina Trombin Barros, pelo apoio e incentivo.

A minha irmã Giovana Trombin Barros, por todas as visitas que alegraram nos tempos difíceis.

Ao professor Carlos Alberto Flesch, Rodrigo Coral, e ao Ahryman Seixas Busse de Siqueira Nascimento pela orientação durante este trabalho.

À equipe do Laboratório de Metrologia e Automatização da Universidade Federal de Santa Catarina, pelo espaço e recursos cedidos durante o trabalho realizado.

Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPQ), pela concessão da bolsa de estudos durante o mestrado.

(10)
(11)

Experiência não é o que acontece ao homem, é o que o homem faz com o que lhe acontece.

(12)
(13)

RESUMO

Capacidade de refrigeração e consumo elétrico estão entre os principais parâmetros de desempenho de compressores de refrigeração. Tais parâmetros são usualmente determinados em ensaios que demandam longos períodos de tempo, tipicamente de 2 a 5 horas, realizados em bancadas laboratoriais. Devido ao elevado tempo, poucas amostras são testadas dentro de um lote de compressores produzidos. Com intuito de possibilitar uma avaliação mais rápida de tais parâmetros e expandir a quantidade de compressores testados por lote, trabalhos anteriores modelaram, com o uso de redes neurais artificiais, a correlação entre parâmetros obtidos em um teste rápido na linha de produção e os parâmetros de desempenho obtidos em laboratório. Apesar dos excelentes resultados obtidos, tais trabalhos esbarraram em restrições relacionadas ao tempo de ciclo de produção e variabilidades encontradas no teste em linha. No presente trabalho foram desenvolvidas ferramentas baseadas em redes neurais artificiais para, com uso de uma concepção aprimorada do teste de linha de produção, se conseguir estimativas melhores de capacidade de refrigeração e de consumo elétrico em laboratório, em poucos minutos. Essa nova situação permitiu boa repetibilidade e reprodutibilidade dos ensaios, possibilitando-se alcançar diferenças tipicamente menores que 1% entre ensaios rápidos e ensaios tradicionais de laboratório.

Palavras-chave: Ensaio de desempenho; compressores herméticos; redes neurais artificiais; capacidade de elevação de pressão; avaliação de incertezas em inferências.

(14)
(15)

ABSTRACT

Refrigeration capacity and electrical consumption are among the main performance parameters of refrigeration compressors. Such parameters are usually determined in tests that require long periods of time, typically from 2 to 5 hours, performed on laboratory benches. Due to the high time, few samples are tested within a batch of produced compressors. In order to allow a faster evaluation of such parameters and expand the number of compressors tested per batch, previous works have established, using artificial neural networks, the correlation between parameters obtained in a quick test in the production line and the parameters of performance obtained in the laboratory. Despite the excellent results obtained, such works bumped into restrictions related to the production cycle time and variability found in the inline test. In the present work, tools based on artificial neural networks were developed to, using an improved design of the production line test, to obtain better estimates of cooling capacity and electrical consumption in the laboratory in a few minutes. This new situation allowed good repeatability and reproducibility of assays, allowing to reach differences typically less than 1% between rapid assays and traditional laboratory assays.

Keywords: Performance test; airtight compressors; artificial neural networks; pressure lifting capacity; evaluation of uncertainties in inferences.

(16)
(17)

LISTA DE FIGURAS

Figura 2.1: Diagrama do circuito do calorímetro de fluido secundário [12]. ... 34

Figura 2.2: Medição do fluxo de massa na linha de sucção [12]. ... 35

Figura 2.3: Comportamento inicial da capacidade de refrigeração nas bancadas de desempenho para quatro compressores [12]. ... 36

Figura 3.1: Gráfico ilustrativo da relação entre CEP e capacidade de refrigeração [12]. ... 39

Figura 3.2: Relação entre o consumo obtido em linha com consumo de ensaios de laboratório [14]. ... 40

Figura 3.3: Teste de capacidade de elevação na linha de produção [12]... 41

Figura 3.4: Curvas de pressão e potência elétrica de um compressor ensaiado na bancada de elevação de linha [12]. ... 42

Figura 3.5: Circuito pneumático da BCE [15]. ... 44

Figura 3.6: Curvas de pressão de sucção e descarga durante o ensaio de elevação de pressão laboratorial. ... 45

Figura 4.1: Perceptron de Rosenblatt [31]. ... 48

Figura 4.2: Exemplo de uma MLP feedfoward [34]. ... 51

Figura 4.3: Diagrama de blocos do aprendizado supervisionado [14]. ... 53

Figura 4.4: Representação da função erro, mínimos locais, mínimo global e passo [34]. ... 55

Figura 4.5: Processo de busca do algoritmo EBP pelo mínimo global, com passos constantes [44]. ... 56

Figura 4.6: Método de média aritmética para cálculo da saída do comitê [12]. ... 57

Figura 4.7: Evolução da diferença em relação ao número de redes inseridas no comitê [12]. ... 58

Figura 5.1: RNA utilizada para exemplificar o uso do método do GUM [55]... 63

Figura 5.2: Método bootstrap no treinamento supervisionado [14]. ... 66

Figura 5.3: Método MMC aplicado a uma RNA [12]. ... 67

Figura 5.4: Uso do MMC durante a fase de treinamento da RNA [12]. ... 69

Figura 5.5: Método para reduzir o tempo de processamento do MMC em RNA [12]. ... 71

Figura 5.6: Ilustração da etapa de aprendizagem de RNA no método MMC-bagging hibridizado [14]. ... 73

(18)

Figura 6.1: Ensaios de CEP antes e depois do amaciamento... 78

Figura 6.3: Coeficiente de correlação de Pearson entre CEP e CAP depois do amaciamento. ... 79

Figura 6.2: Coeficiente de correlação de Pearson entre CEP e CAP antes do amaciamento. ... 79

Figura 6.4: Resultado encontrado nas medições de A) CEP e; B) consumo elétrico. ... 81

Figura 6.5: Resultado encontrado nas medições de A) CEP e; B) consumo elétrico. ... 82

Figura 7.1: Variação do CEP em relação à pressão de sucção [15]. ... 86

Figura 7.2: Pressão de sucção no ensaio de elevação de pressão. ... 87

Figura 7.3: Capacidade de elevação de pressão em relação à temperatura da carcaça do compressor [54]. ... 89

Figura 7.4: Gráfico de Pareto mostrando a influência das variáveis na obtenção da CEP [15]. ... 90

Figura 7.5: Relação CEP x CAP para compressores de diferentes materiais da bobina... 91

Figura 7.6: Correlações do consumo e da taxa do consumo. ... 92

Figura 7.7: Representação da RNA usada para inferência dos parâmetros de desempenho. ... 94

Figura 7.8: Diferença entre saída da RNA e resultado do calorímetro em relação ao número de neurônios na camada escondida e variabilidade entre redes... 94

Figura 7.9: Fluxograma do algoritmo de inferência da CAP. ... 98

Figura 7.10: Resultado individual da CAP do comitê. ... 99

Figura 7.11: Histograma da inferência de CAP. ... 102

Figura 7.12: Intervalo de confiança calorímetro e RNA para medição de CAP. ... 103

Figura 7.13: Resultado individual da inferência de consumo. ... 105

Figura 7.14: Histograma de consumo elétrico para o compressor 7. ... 106

Figura 7.15: Intervalo de confiança calorímetro e RNA para medição de consumo elétrico. ... 108

(19)

LISTA DE TABELAS

Tabela 5.1: Fontes de erros que podem ser significativos no uso de RNA [12]. ... 62

Tabela 5.2: Erros considerados pelo método MMC-bagging hibridizado [12]. ... 73

Tabela 6.1: Sequência dos ensaios para investigar o efeito do amaciamento. ... 77

Tabela 6.2: Sequência de eventos para ensaios do compressor. ... 81

Tabela 6.3: Temperaturas de início de ensaio das primeiras medições. ... 82

Tabela 6.4: Temperaturas de início de ensaio das segundas medições. ... 82

Tabela 6.5: Categoria dos compressores por capacidade de refrigeração. ... 84

Tabela 7.1: Influência da variação da temperatura de sucção para o fluido R-134a [5]. ... 88

Tabela 7.2: Variáveis de entrada usadas na RNA. ... 93

Tabela 7.3: Configuração da RNA usada para inferência dos parâmetros de desempenho. ... 93

Tabela 7.4: Valores para os critérios de parada. ... 96

Tabela 7.5: Característica das amostras do conjunto de teste. ... 96

Tabela 7.6: Compressores do conjunto teste. ... 97

Tabela 7.7: Resultado da inferência de CAP para o conjunto de teste. ... 100

Tabela 7.8: Função densidade de probabilidade das variáveis de entrada. ... 101

Tabela 7.9: Resultado da inferência de CAP com seus intervalos de confiança. .... 103

Tabela 7.10: Resultado final da inferência de consumo elétrico para o conjunto de teste... 105

Tabela 7.11: Resultado da inferência de consumo elétrico com seus intervalos de confiança. ... 107

Tabela 7.12: Resultado do cálculo de COP baseado nas inferências da CAP e consumo elétrico. ... 109

(20)
(21)

LISTA DE ABREVIATURAS E SÍMBOLOS ANSI - American National Standards Institute

ASHRAE - American Society of Heating, Refrigerating, and Air Conditioning Engineers BCE - Bancada de capacidade de elevação de pressão

CAP - Capacidade de refrigeração

CEP - Capacidade de elevação de pressão COP - Coeficiente de performance

DIN - Deutsches Institut für Normung EBP - Error backpropagation

GN - Gauss-Newton

GUM - Guia para a expressão da incerteza de medição

IC - Intervalo de confiança I-If - Incerteza da inferência IM - Incerteza de medição

ISO - International organization for standardization LM - Levemberg-Marquardt

MLP - Multilayer Perceptron MMC - Método de Monte Carlo P - Potência elétrica consumida

PDF - Função densidade de probabilidade P&D - Pesquisa e desenvolvimento

RNA - Rede neural artificial

VIM - Vocabulário internacional de termos fundamentais e gerais de metrologia

ℎ 1 - Entalpia no ponto de líquido saturado

ℎ 2 - Entalpia do líquido sub resfriado entrando no processo de expansão ℎ 1 - Entalpia do vapor superaquecido entrando no processo de compressão ℎ 2 - Entalpia no ponto de vapor saturado

qmf - Vazão mássica do fluido refrigerante ∅i - Calor cedido pela fonte externa

Fl - Fator de perdas do calorímetro

∅o - Capacidade de refrigeração do compressor Ta - Temperatura ambiente

(22)

Tg - Temperatura interna do calorímetro

� - Volume específico do vapor superaquecido entrando no compressor � � - Volume específico no ponto de vapor saturado

(23)

SUMÁRIO

1 INTRODUÇÃO ... 25 1.1 CONTEXTUALIZAÇÃO ... 25 1.2 OBJETIVOS ... 29 1.3 ESTRUTURA DO TRABALHO ... 29 2 ENSAIOS DE DESEMPENHO DE COMPRESSORES HERMÉTICOS ... 31 2.1 DEFINIÇÃO DOS PARÂMETROS DE DESEMPENHO ... 32 2.1.1 Método A: Calorímetro de fluido secundário ... 33 2.1.2 Método D1: Medição do fluxo de massa de vapor de refrigerante ... 35 2.1.3 Limitação dos ensaios regidos por norma ... 35 3 ENSAIO DE CAPACIDADE DE ELEVAÇÃO DE PRESSÃO ... 39 3.1 ENSAIO DE CAPACIDADE DE ELEVAÇÃO NA LINHA DE PRODUÇÃO . 40 3.2 BANCADA LABORATORIAL DE CAPACIDADE DE ELEVAÇÃO DE

PRESSÃO ... 43 4 REDES NEURAIS ARTIFICIAIS ... 47 4.1 MODELO GERAL DO NEURÔNIO ... 48 4.2 ARQUITETURA DE REDES NEURAIS ARTIFICIAIS ... 50 4.3 APRENDIZADO DE REDES NEURAIS ARTIFICIAIS ... 52 4.3.1 Algoritmo retropropagação (backpropagation) ... 54 4.3.2 Algoritmo Levemberg-Marquardt de retropropagação ... 56 4.4 MÁQUINAS DE COMITÊ ... 56 5 MÉTODOS PARA ESTIMAR A INCERTEZA EM MODELOS NEURAIS .. 61 5.1 AVALIAÇÃO DAS INCERTEZAS DA RNA PELO MÉTODO GUM ... 63 5.2 APLICAÇÃO DO MÉTODO BOOTSTRAP NO TREINAMENTO DE RNA .. 65 5.3 AVALIAÇÃO DAS INCERTEZAS DA RNA PELO MÉTODO DE MONTE CARLO 66

5.4 MÉTODO MMC-BAGGING HIBRIDIZADO ... 72 6 ENSAIOS REALIZADOS NA BCE ... 75 6.1 CONSIDERAÇÕES INICIAIS ... 75 6.2 ANÁLISE DOS DADOS OBTIDOS... 75 6.2.1 Efeito do amaciamento ... 76 6.2.2 Variabilidade da BCE ... 80 6.3 BANCO DE DADOS DE ENSAIOS ... 83

(24)

7 MODELO NEURAL PARA INFERÊNCIA DOS PARÂMETROS DE

DESEMPENHO ... 85 7.1 VARIÁVEIS DE ENTRADA do modelo neural ... 85 7.2 ARQUITETURA DA REDE E ALGORITMO DE TREINAMENTO ... 93 7.3 FORMAÇÃO DOS CONJUNTOS DE TREINAMENTO, VALIDAÇÃO E TESTE 96

7.4 COMITÊ PARA INFERÊNCIA DA CAPACIDADE DE REFRIGERAÇÃO ... 97 7.5 COMITÊ PARA A INFERÊNCIA DO CONSUMO ELÉTRICO ... 104 8 ANÁLISE DOS RESULTADOS ... 111 8.1 MODULO NEURAL DA CAPACIDADE DE REFRIGERAÇÃO ... 111 8.2 MÓDULO NEURAL DO CONSUMO ELÉTRICO ... 112 8.3 DISCUSSÃO DOS RESULTADOS ... 113 9 CONSIDERAÇÕES FINAIS ... 115 9.1 CONCLUSÕES ... 115 9.2 SUGESTÕES PARA TRABALHOS FUTUROS ... 117 REFERÊNCIAS ... 119

(25)

25

1 INTRODUÇÃO

1.1 CONTEXTUALIZAÇÃO

Na busca pelo aperfeiçoamento do processo produtivo, da qualidade do produto e ganho do mercado, fabricantes de compressores herméticos precisam cada dia mais investir em pesquisa e desenvolvimento (P&D) de forma a se manterem competitivos. Isso pode ser verificado pelo fato de que os compressores produzidos por um dos líderes de mercado global neste setor consomem hoje metade da energia se comparados àqueles produzidas há duas décadas [1]. Pata tal, esse fabricante conta com o suporte de diversos laboratórios próprios de P&D e parcerias com centros avançados de tecnologia situados em universidades no Brasil e no exterior.

Dentre as diferentes pesquisas envolvendo compressores herméticos, a busca pelo aperfeiçoamento de ensaios para verificar a qualidade dos produtos é um ponto de grande importância. Em meio a esses ensaios, destacam-se os de desempenho energético, que tem por objetivo medir parâmetros padronizados utilizados para comparação entre fabricantes, tais como capacidade de refrigeração, potência elétrica consumida e coeficiente de performance. Tal ensaio é utilizado nas etapas de desenvolvimento de novos produtos, determinação de dados de catálogo e também para controle da qualidade do processo produtivo [2].

O ensaio de desempenho energético segue normas internacionais específicas que estabelecem as diretrizes para garantir a confiabilidade dos resultados [3]. O tempo total de ensaio depende do nível de automatização da bancada de teste. Em bancadas pouco automatizadas, o tempo médio de ensaio ultrapassa 4 horas [3]. Com intuito de minimizar esse elevado tempo para determinação dos parâmetros necessários, pesquisas foram desenvolvidas em diversos centros tecnológicos. Destacam-se aqui os seguintes trabalhos desenvolvidos:

 Polleto [5] deu início ao aprimoramento da bancada de ensaios, aumentando o nível de automação e propondo mecanismos para redução das incertezas, destacando a incerteza para medição de vazão mássica que foi reduzida de ±1,9% para ±0,9%;

 Barbosa [6] desenvolveu sistema de medição de grandezas elétricas – tensão, corrente e potência – visando redução de incertezas associadas, ressaltando a

(26)

26

redução da incerteza para a medição de potência que caiu de ±0,41% para ±0,11%;

 Flesch [7] desenvolveu técnicas de controle e automação para aumento da confiabilidade e redução do tempo de ensaio;

 Henklein [8] propôs o uso de ferramentas de inteligência artificial para realizar prognóstico1 sobre os parâmetros de desempenho a partir de dados do regime transiente durante o ensaio de compressores, conseguindo uma grande redução do tempo para obtenção dos parâmetros de desempenho;

 Steinbach [9] deu continuidade ao trabalho de Henklein [8] reduzindo os erros de prognóstico em regime transiente, e iniciou uma vertente inédita para identificar o instante em que o ensaio de calorímetro atinge o regime permanente conseguindo assim diminuir o tempo de ensaio, dado que tal instante era de difícil identificação, e por norma, é necessário monitorar as variáveis por uma hora após a passagem para regime permanente;

 Casella [10] fez uso de um sistema especialista probabilístico utilizando redes

fuzzy bayesianas também para determinar o instante de entrada em regime

permanente no tocante à capacidade de refrigeração medida durante o ensaio de desempenho;

 Lima [11] contribuiu para a validação de trabalhos anteriores que utilizam ferramentas de inteligência artificial para determinar o instante de entrada em regime permanente, implantando uma versão de ferramentas de inteligência artificial para prognóstico dos parâmetros de desempenho nas bancadas de ensaio;

 Penz [2] propôs procedimentos para garantia da confiabilidade na aplicação de ferramentas de inteligência artificial nos ensaios de compressores herméticos;  Coral [12] afastou-se dos meios tradicionais de medição e correlacionou a

capacidade de refrigeração com um parâmetro obtido em um ensaio de fim de linha de produção, o qual consiste na capacidade do compressor em elevar a pressão de ar em um volume fixo. O mesmo utilizou ferramentas de inteligência artificial para obter uma estimativa da capacidade de refrigeração e

1 Assim como Penz [2], Coral [12] e Pacheco [14], o presente trabalho entende os termos inferência e

prognósticos como os definidos por Houaiss [13]: prognóstico – suposição baseada em dados da realidade, sobre o que deve acontecer no futuro; inferência – operação intelectual por meio da qual se afirma a verdade de uma proposição em decorrência de sua ligação com outras já reconhecidas como verdadeiras.

(27)

27

desenvolveu uma técnica para medir intervalos de confiança dos resultados das redes neurais;

 Pacheco [14] complementou o trabalho de Coral [12] e correlacionou a capacidade de elevação de pressão com potência elétrica ativa consumida, coeficiente de performance e mínima tensão de partida em compressores;  Nascimento [3] ampliou o universo de análise das ferramentas de inteligência

artificial para inferências e prognósticos em ensaios de desempenho de compressores. Com acesso a uma quantidade de ensaios muito maior do que os trabalhos anteriores, foi possível o desenvolvimento de ferramentas capazes de estimar os valores finais dos parâmetros de desempenho em média 50% mais rápido do que o ensaio tradicional, com uma diferença de ±2% entre o valor estimado e o valor final real para 95% dos ensaios;

 Schaefer [15] desenvolveu uma bancada baseada no ensaio de fim de linha utilizado por Coral [12] e Pacheco [14]. Tal bancada tinha como objetivo criar um ensaio capaz de retornar parâmetros correlacionáveis com os parâmetros obtidos no ensaio de desempenho em um tempo extremamente reduzido. O autor realizou estudos de sensibilidade das grandezas avaliadas e identificou condições de ensaio capazes de favorecer a correlação entre as grandezas medidas na bancada protótipo e os parâmetros de desempenho. O trabalho focou principalmente na identificação da configuração ideal de medição da capacidade do compressor de elevar a pressão em um vaso de volume conhecido de forma que a mesma apresente forte correlação com a capacidade de refrigeração do compressor obtida pelo ensaio de desempenho.

 Belman-Flores et al. [16] compararam dois métodos para modelagem de um compressor. Um método físico e um método analítico através da aplicação de redes neurais artificiais. Ambos modelos foram validados com dados experimentais mostrando erros relativos médios abaixo de ±10% para o modelo físico e abaixo de ±1% para o modelo analítico.

 Tian et al. [17] realizaram uma previsão de desempenho termodinâmico de compressores de rolagem utilizando redes neurais por mínimos quadrados parciais. As diferenças entre as previsões e os dados experimentais tiveram erros médios relativos entre 0,34% e 1,96%.

(28)

28

 Fei et al. [18] compararam diferentes ferramentas de inteligência artificial para prever o mapa de desempenho de compressores. Os resultados indicaram que as redes neurais com funções de kernel tiveram os melhores resultados principalmente para extrapolação de dados.

 Zhe et al. [19] investigaram um método para medir a rotação de compressores baseado na flutuação da corrente elétrica. Utilizando algoritmos baseados na transformação de Hilbert foi possível alcançar erros máximos menores que ±1 rotação por minuto.

 Samuel et al. [20] analisaram a influência no desempenho de compressores herméticos em relação a alguns parâmetros como refluxo, comportamento dinâmico de válvula e área de fluxo. O estudo revelou que esses parâmetros representam um papel vital no desempenho de sistemas de refrigeração.

Os resultados dos trabalhos anteriores contribuíram para o melhoramento das bancadas de ensaio de desempenho, tanto no quesito de tempo de ensaio quanto na redução da incerteza de medição. Adicionalmente, os trabalhos focados no desenvolvimento de ferramentas baseadas em redes neurais mostraram a viabilidade do uso de tais ferramentas para realizar inferências dos parâmetros de desempenho em um tempo reduzido [14].

Os resultados obtidos por Coral [12] e Pacheco [14] mostram ser possível estabelecer bons níveis de correlação entre parâmetros do ensaio de elevação de pressão, realizado na linha de montagem dos compressores, e os ensaios de desempenho, realizados em laboratório. Tal concepção, integrada à linha de produção, indica a possibilidade de inspeção em 100% dos compressores produzidos. A bancada desenvolvida por Schaefer [15] permitiu o estudo da melhor configuração de ensaio para obter boa correlação entre os parâmetros do ensaio de elevação de pressão e os parâmetros de desempenho.

Face aos bons resultados encontrados por Coral [12] e Pacheco [14], que utilizaram dados do teste de linha e tendo em vista a disponibilidade da bancada desenvolvida por Schaefer [15], identificou-se a oportunidade de desenvolver ferramentas de inteligência artificial para estimar os parâmetros de desempenho por meio dos resultados obtidos nesse novo hardware. A vantagem da utilização dele consiste no maior número de grandezas controladas, reduzindo a variabilidade dos parâmetros obtidos, situação que não foi possível em Coral [12] e Pacheco [14]. Dessa

(29)

29

forma sendo possível melhorar a confiabilidade dos resultados encontrados para os parâmetros de desempenho inferidos.

1.2 OBJETIVOS

Este trabalho tem como objetivo geral propor uma metodologia para o desenvolvimento de ferramentas baseadas em redes neurais artificias para inferência dos parâmetros de desempenho dos compressores em poucos minutos garantindo a confiabilidade dos resultados.

Como objetivos específicos, pode-se citar:

 Estudar as ferramentas já desenvolvidas e o funcionamento e implementação de redes neurais;

 Desenvolver os modelos empíricos baseados em redes neurais artificiais utilizando a bancada protótipo de capacidade de elevação de pressão com objetivo de realizar a inferência dos parâmetros de desempenho;

 Investigar os métodos para determinar intervalos de confiança na aplicação de redes neurais artificiais e avaliar a viabilidade de aplicar às ferramentas desenvolvidas nesta dissertação;

 Avaliar o desempenho de sistemas desenvolvidos frente ao seu potencial para substituir ensaios convencionais realizados em laboratório.

1.3 ESTRUTURA DO TRABALHO

O capítulo 2 aborda os métodos utilizados na indústria para obter os parâmetros de desempenho de compressores e os principais requisitos exigidos pelas normas que regem esses procedimentos. O capítulo 3 trata de um conceito diferente dos métodos tradicionalmente utilizados para obter os parâmetros de desempenho de compressores. No capítulo 4 é apresentado um resumo sobre as redes neurais artificiais e suas estruturas. No capítulo 5 é exposto alguns métodos utilizados para estimar os intervalos de confiança da inferência gerada a partir da saída dos modelos neurais. No capítulo 6 mostra os ensaios realizados na bancada de ensaio de compressores desenvolvida pelo grupo de estudo do Labmetro no intuito de conhecer melhor o comportamento metrológico da mesma. No capítulo 7 mostra as variáveis de entrada, a arquitetura e o modelo neural criado para inferência dos parâmetros de desempenho e o resultado obtido a partir desses. O capítulo 8 aborda a análise dos

(30)

30

resultados a partir das ferramentas neurais. O capítulo 9 são apresentadas as conclusões e sugestões para trabalhos futuro

(31)

31

2 ENSAIOS DE DESEMPENHO DE COMPRESSORES HERMÉTICOS

Tendo em vista que os resultados dos ensaios tradicionais de desempenho foram utilizados para o desenvolvimento e validação dos modelos neurais artificiais nesta dissertação, torna-se importante o conhecimento das características das bancadas utilizadas e possíveis fontes de variabilidade entre resultados obtidos em diferentes bancadas.

Os ensaios de desempenho dos compressores herméticos têm como objetivo determinar os valores da capacidade de refrigeração (CAP), consumo elétrico, e como consequência, o coeficiente de performance (COP), sendo ele a razão do primeiro pelo segundo [12]. Os métodos para realizar tais ensaios são regulamentados por normas. Destacam-se entre elas, ISO 917 [21], ANSI/ASHRAE 23 [22] e DIN EN 13771 [23]. Tais normas buscam padronizar os diferentes métodos, de modo que os resultados possam ser reproduzidos, comparados e aceitos [2].

Os ensaios abordados a seguir são baseados na norma ISO 917 – Testing of

Refrigerant Compressors (1989), sendo essa a mais largamente empregada no setor

industrial [24]. Importante destacar que, apesar de a mesma ter sido removida como padrão pelo ISO em 2015, e tendo em vista que uma nova versão ainda não foi anunciada, a norma continua servindo de referência para alguns fabricantes. Esse documento busca estabelecer procedimentos padronizados para avaliação e determinação de características de desempenho do compressor, apresentando resultados com confiabilidade e uma avaliação sobre a adequação do compressor em qualquer conjunto de condições básicas de teste necessárias para uma determinada instalação de refrigeração [21]. Com isso é possível então a reprodução dos ensaios possibilitando assim a comparação entre diferentes modelos e fabricantes [2].

Esse capítulo apresenta os parâmetros de desempenho e os métodos estabelecidos por normas usados na empresa parceira para realizar o ensaio de desempenho de compressores. Também serão apresentados os motivos do alto tempo de ensaio, e as dificuldades contidas nesses ensaios que incentivam pesquisas para aperfeiçoamento dos mesmos.

(32)

32

2.1 DEFINIÇÃO DOS PARÂMETROS DE DESEMPENHO

Potência elétrica consumida: é a potência nos terminais do compressor, sendo composta pelo consumo do motor e de elementos auxiliares necessários para manter o compressor em operação. Essa característica é expressa em watt [21].

Capacidade de refrigeração (0): é o produto do fluxo de fluido

refrigerante, que flui através do compressor, pela diferença entre a entalpia específica do refrigerante, medida na entrada (sucção) do compressor, e a entalpia específica de líquido saturado, correspondente à pressão de descarga na saída do compressor [21], equação (2.1).

Ø� = � �� � ℎ 1 − ℎ 1 (2.1)

Onde:

∅o capacidade de refrigeração do compressor qmf fluxo de massa de fluido refrigerante

Vga volume específico do fluido refrigerante (vapor) entrando

no compressor, durante o ensaio

Vgl volume específico do refrigerante entrando no compressor

estabelecido anteriormente ao ensaio

hg1 entalpia específica do refrigerante entrando no compressor

nas condições básicas específicas de ensaio

hf1 entalpia específica do refrigerante líquido na pressão

correspondente à descarga do compressor

Coeficiente de performance (COP): é a razão da capacidade de refrigeração pela potência consumida pelo compressor. É uma grandeza adimensional [21].

[W] [kg/s] [m3/kg] [m3/kg] [kJ/kg] [kJ/kg]

(33)

33

� =Ø (2.2)

Onde:

COP coeficiente de performance

Ø capacidade de refrigeração do compressor [W]

P potência consumida [W]

A norma ISO 917 [21] estabelece nove métodos de ensaio para medir a vazão mássica do fluido refrigerante e, por meio dessa, a capacidade de refrigeração. Ela define que dois métodos devem ser utilizados simultaneamente para que a medição possa ser validada, definindo também quais combinações podem ser utilizadas para garantir a independência das medições. Adicionalmente, a norma estabelece que a diferença entre os dois métodos não deve passar de ±4% [21].

Na sequência, são apresentados os dois métodos normatizados para medição da vazão mássica, que foram utilizados no trabalho para determinar a capacidade de refrigeração dos compressores.

2.1.1 Método A: Calorímetro de fluido secundário

Consiste em um ciclo de compressão de vapor de fluido refrigerante (fluido primário), onde o evaporador encontra-se suspenso na parte mais alta de um vaso de pressão hermético e termicamente isolado. Uma resistência localizada na base do vaso aquece um fluido volátil (fluido secundário) que, por sua vez, troca calor com o fluido refrigerante através da serpentina do evaporador.

A troca de calor entre os fluidos, ocasionará a mudança de fase do fluido primário, onde o fluxo deste deverá ser controlado por uma válvula de expansão localizada próxima ao calorímetro. O circuito é representado na Figura 2.1.

(34)
(35)
(36)
(37)

37

Mesmo com a evolução das bancadas convencionais e o aumento de seu grau de confiança, seriam necessárias inúmeras bancadas para suprir a demanda por resultados devido a limitações de tempo dos ensaios de desempenho [15]. Por limitações de custo e mão de obra necessária para operar as mesmas, torna-se inviável solucionar o problema da demanda de ensaios apenas pelo aumento da quantidade de bancadas [12]. Nesse contexto, uma alternativa capaz de retornar estimativas dos parâmetros de desempenho por meio de um ensaio muito rápido torna-se base para uma solução inovadora [15].

(38)
(39)
(40)
(41)
(42)
(43)

43

Apesar das conquistas obtidas por Coral [12] e Pacheco [14] com o uso do ensaio de linha, este apresenta algumas limitações associadas a seu funcionamento. Variações na temperatura de corpo do compressor, geradas pelas condições ambientes e por eventuais paradas na linha acabam por gerar alta variabilidade nos parâmetros medidos no ensaio. Adicionalmente, o tempo disponível para ensaio de cada amostra é limitado em 7 segundos de forma a não afetar a velocidade do processo produtivo. Tais limitações foram preponderantes para a criação da bancada laboratorial na busca por resultados mais confiáveis.

3.2 BANCADA LABORATORIAL DE CAPACIDADE DE ELEVAÇÃO DE PRESSÃO Para contornar as limitações das bancadas de capacidade de elevação presentes nas linhas de produção Schaefer [15] desenvolveu uma bancada laboratorial capaz de controlar diversos parâmetros não contemplados na bancada de linha. Tal bancada permite uma operação com condições de contorno necessárias para obtenção de resultados confiáveis, repetitivos e reprodutíveis [15]. Um destaque do teste de capacidade de elevação de pressão, é que ela não simula um circuito de refrigeração, pois nessa não é quantificado as trocas de calor e o fluido do processo passa uma única vez pelo compressor [15].

Em comparação à bancada de elevação de pressão de linha de produção, a bancada de capacidade de elevação de pressão laboratorial (BCE) possui maior número de variáveis, sendo elas: temperatura de corpo do compressor, temperatura de sucção, temperatura do vaso de volume fixo, temperatura do box da bancada, resistência ôhmica da bobina auxiliar, potência elétrica consumida, pressão de sucção e descarga e frequência de rotação do compressor.

A BCE conta com um sistema eletromecânico baseado no controle da pressão de sucção e descarga do compressor em teste. O circuito pneumático foi projetado para manter as pressões constantes durante a medição de consumo. O mesmo mantém a pressão de sucção constante no valor de 1 bar enquanto o compressor eleva a pressão de descarga de 2 para 16 bar. A automatização completa do sistema permite a eliminação da intervenção do operador, contribuindo para a melhoria da repetibilidade e reprodutibilidade dos ensaios e para o aumento da confiabilidade metrológica dos mesmos [5]. O circuito pneumático usado na bancada está representado na Figura 3.5.

(44)
(45)
(46)

46

Tabela 3.1: Principais variáveis monitoradas no ensaio da BCE. Principais variáveis monitoradas

Temperatura de corpo do compressor Temperatura de sucção do compressor Temperatura do vaso de pressurização

Temperatura do box de ensaio

Resistência ôhmica inicial da bobina auxiliar Resistência ôhmica final da bobina auxiliar

Tensão de alimentação Corrente de alimentação Potência elétrica consumida

Pressão de sucção Pressão de descarga Vazão mássica do ar

Frequência de rotação do compressor Tempo de ensaio

(47)

47

4 REDES NEURAIS ARTIFICIAIS

As redes neurais artificiais (RNA) são ferramentas de modelagem computacional utilizadas em várias disciplinas para modelagem complexa de problemas de mundo real [27][28]. Essas ferramentas são principalmente recomendadas para problemas com soluções analíticas demasiadamente complexas para serem encontradas [29]. Uma RNA pode ser definida como um sistema de processamento de dados composto por elementos de tratamento adaptativos, densamente interconectados capazes de executar grande carga de processamento paralelo [30][31].

Pode-se dizer que os trabalhos em redes neurais artificiais tiveram como motivo inicial as características de processamento de informações do cérebro humano, não presentes na forma de processamento de computadores convencionais [31]. Apesar das RNA serem abstrações do cérebro humano, a ideia da RNA não é de replicar o sistema biológico, mas fazer uso do que é conhecido sobre o funcionamento das redes neurais biológicas no âmbito da resolução de problemas complexos [27].

Visto que as RNA foram propostas como modelos computacionais capazes de capturar e reproduzir o comportamento e as atividades do cérebro humano [32], as redes foram concebidas de forma a conter certas características das redes biológicas, são elas [14][12][27][31]:

 aprendizagem – capacidade de aprender o mapeamento desejado entre sinais de entradas e saídas apresentadas, por meio de um processo iterativo de ajuste em seus pesos sinápticos;

 não linearidade – uma RNA constituída por neurônios não lineares é uma rede não linear, sendo uma propriedade necessária para a modelagem de problemas do mundo real, que, em sua maioria, são não lineares;

 adaptabilidade – retreinamento para adequação de novos exemplos;

 generalização – capacidade da RNA apresentar saídas coerentes para entradas que não foram apresentadas durante o processo de treinamento;  paralelismo – alto paralelismo das RNA implica em rápido processamento e

tolerância a falhas;

 insensibilidade a ruído – capaz de fornecer previsão precisa mesmo na presença de dados incertos.

(48)
(49)

49

A equação 4.1 expressa o resultado produzido pelo neurônio artificial representado pela Figura 4.1.

Onde:

 sinais de entrada {x1, x2, ..., xm} são provenientes do meio externo.

Usualmente representam valores de medições de uma variável para uma aplicação específica;

 pesos sinápticos {wk1, wk2, ..., wkm} são valores para ponderar as

entradas, permitindo quantificar a sua relevância em relação à funcionalidade do fenômeno em questão;

 bias {bk} entrada adicional com peso sináptico unitário, possui o efeito de

aumentar ou diminuir a entrada da função de ativação;

 somador {Σ} soma os diferentes sinais de entrada já quantificados pelos

pesos sinápticos e o bias a fim de produzir um valor de potencial de ativação;

 resultado das somas ponderadas das entrada {vk} resultado da

combinação linear das ponderações dos sinais de entrada;

 função de ativação {f(.)} restringe a amplitude de saída do neurônio a um valor finito;

 sinal de saída {yk} valor final produzido pelo neurônio.

Existem diversas funções de ativação, escolhidas para que exista melhor adaptabilidade ao problema em questão [34]. Tais funções podem ser divididas em dois grupos principais: funções parcialmente diferenciáveis e funções totalmente diferenciáveis [14]. Estas últimas têm maior uso nas ferramentas de interesse. Alguns exemplos são relacionados no Quadro 4.1.

= = ∑ +

=

(50)

50

Quadro 4.1: Funções de ativação totalmente diferenciáveis [14]. Funções totalmente diferenciáveis

Função linear g(u) = u

Função logística g(u)=1/(1+e-ζvk)

Função tangente hiperbólica g(u)=(1-e-ζu)/(1+e-ζu) onde:ζ é um parâmetro real associado ao nível de inclinação

das funções logística e tangente hiperbólica

O processamento das informações dentro de um neurônio se dá por meio das operações matemáticas aplicadas aos sinais de entrada, que geram um único sinal de saída. Por sua vez, o armazenamento de informações se dá pela modificação dos pesos sinápticos durante a fase de treinamento da rede neural artificial [31][35]. 4.2 ARQUITETURA DE REDES NEURAIS ARTIFICIAIS

Qualquer disposição organizada de neurônios conectados entre si pode ser considerada uma arquitetura de RNA [31]. Contudo, algumas características podem ser utilizadas para classificar as arquiteturas das redes [3]. As mais comuns são: número de camadas de rede; número de neurônios nas camadas; tipo de conexões entre os neurônios; grau de conectividade entre os neurônios [3].

O número de neurônios por camada, bem como o número de camadas de uma rede, depende muito da aplicação [2]. Não existem regras claras para a escolha desses parâmetros, sendo na maioria das vezes um processo interativo usando os dados de entrada e saída [3]. Tais parâmetros delimitam algumas características da rede como a capacidade de generalização, o armazenamento do conhecimento e o esforço computacional [2].

No que tange a conexão entre neurônios, as redes se dividem em alimentadas adiante e recorrente [2][3]. Em redes alimentadas adiante (feedfoward) as conexões entre os neurônios são sempre da camada anterior para a seguinte, fazendo com que o fluxo dos dados siga um caminho unidirecional dentro da rede [2][3][31]. Nessas redes, as saídas podem ser expressas como funções determinísticas em função das

(51)
(52)

52

Os neurônios que recebem os sinais externos de excitação integram a camada de entrada, neurônios que tem a sua saída como saída final da rede pertencem à camada de saída, já os demais neurônios fazem parte das camadas intermediarias, ou camada escondida, responsáveis pelo processamento e armazenamento de informações durante a etapa de treinamento da rede [2][12]. 4.3 APRENDIZADO DE REDES NEURAIS ARTIFICIAIS

A capacidade de aprender é uma característica peculiar pertencente a sistemas inteligentes, biológicos ou de outras estruturas [27]. Em sistemas neurais artificiais, a aprendizagem é alcançada ajustando-se os parâmetros livres (pesos sinápticos e bias) da rede em resposta a estímulos externos, até que sua performance de processamento seja considerado aceitável para que possa executar uma tarefa específica [27][40][41]. O tipo de treinamento determina a forma como os parâmetros livres são alterados [3].

O aprendizado de uma RNA é realizado interativamente quando a rede é exposta a exemplos de treinamentos, ou conjunto de treinamento, juntamente com um algoritmo de aprendizagem. Tal ato se assemelha a maneira que humanos aprendem com experiências passadas [27]. O conjunto de treinamento deve ser tão representativo quando possível em relação à tarefa a ser realizada pela rede [3][14][31].

Dependendo do conjunto de treinamento disponível, o treinamento pode ser supervisionado ou não supervisionado [3]. O treinamento supervisionado, representado na Figura 4.3, é realizado a partir de pares de vetores preestabelecidos, relacionando-se variáveis de entradas com respectivas saídas [2][14][31][42]. As RNA treinadas dessa forma são capazes de mapear relações desconhecidas entre dados de entrada e saída sem conhecimento prévio do processo investigado [11]. Os dados de entrada de cada amostra do conjunto de treinamento é exposto para a rede e um sistema comparador indica se houve um comportamento bom ou ruim, que depende da diferença entre a reposta adquirida na rede e os dados de saída da amostra [14][31]. A medida mais comum utilizada para o cálculo dessa diferença é baseado no conceito de distância euclidiana [14]. O erro é então retropropagado através da rede e os parâmetros livre são ajustados [14][31]. Por outro lado, o treinamento não supervisionado tenta encontrar semelhanças entre os dados do conjunto de entrada,

(53)
(54)

54

É esperado de um modelo de RNA treinado que seja capaz de realizar predições para dados não vistos por meio de uma relação inerente entre os dados de entrada e saída desenvolvida durante o treinamento [43]. É possível afirmar que uma RNA aprendeu se essa é capaz de: lidar com imprecisão, ruído e informação incerta sem efeito adverso perceptível na qualidade da resposta; fornecer respostas coerentes de novos conjuntos de entradas [27]. Existem diversos tipos de algoritmos de aprendizagem. A seguir serão apresentados os principais, permitindo ao leitor melhor compreensão de como as RNA adquirem conhecimento.

4.3.1 Algoritmo retropropagação (backpropagation)

Dentre os principais algoritmos de treinamento, destaca-se o algoritmo de retropropagação do erro (EBP, Error Backpropagation) [3][34]. Tal algoritmo pode ser considerado como um dos avanços mais significativos por ter resgatado o interesse geral pelas redes neurais na década de 1980 [44]. Trata-se de um algoritmo de treinamento supervisionado utilizados em MLP feedfoward [3]. Antes de iniciar o treinamento, os pesos sinápticos são inicializados com valores aleatórios. O algoritmo de treinamento consiste então de duas fases [31][34]:

 propagação – fase na qual o vetor de entrada é apresentado aos neurônios da camada de entrada. O efeito do valor de entrada é propagado por toda a rede, camada a camada, gerando um vetor de saída. Durante essa etapa os parâmetros livres permanecem fixos.  retropropagação – fase na qual os pesos sinápticos são atualizados. A

saída da rede é subtraída do valor desejado, e um sinal de erro é criado. Esse sinal é retropropagado pela rede na direção dos pesos sinápticos. Esses pesos são atualizados para que a resposta da rede seja mais próxima ao valor desejado.

Durante a fase de retropropagação ocorre a busca pelos valores mínimos de erros entre a saída da rede e os valores desejados. Essa busca ocorre em um espaço multidimensional, ilustrada na Figura 4.4, onde existem diversas soluções, mas apenas uma é ideal [34]. Idealmente o algoritmo deve ignorar mínimos locais dentro deste espaço, até encontrar o mínimo global [34]. O resultado de treinamento, no

(55)
(56)
(57)
(58)
(59)

59

pouco ganho em relação a diminuição de erros aleatórios, e não recompensam o esforço para criação de comitês com maior número de redes. Visto que o número de redes necessárias para estabilizar a saída do comitê pode variar dependendo de seu propósito, é recomendado o uso de um método iterativo como usado por Coral [12] para definir o número de redes a serem usadas.

(60)
(61)

61

5 MÉTODOS PARA ESTIMAR A INCERTEZA EM MODELOS NEURAIS

Mesmo que um modelo neural tenha convergido de modo correto e esteja apresentando valores com diferenças mínima, na prática fica impossível conhecer o erro final apresentado pelo modelo neural [12]. Geralmente, o erro médio obtido a partir da aplicação do modelo treinado no conjunto de teste é a medida utilizada para avaliar a capacidade de generalização da Multilayer perceptron (MLP), provendo um parâmetro de desempenho [14]. Entretanto, tal análise, não permite exprimir diretamente o grau de confiabilidade dos resultados [43].

Esse fato desencadeou o desenvolvimento de uma série trabalhos visando estimar o intervalo de confiança desses modelos como Leonard [50], Chryssolouris [51], Hwang [52], Veaux [53], que ainda hoje são referências citadas por apresentarem métodos utilizados para estimar intervalos de confiança [54]. Entretanto, muitas dessas técnicas citadas foram desenvolvidas especificamente para as redes utilizadas em seus respectivos trabalhos, não sendo diretamente aplicáveis aos diversos tipos de modelos neurais [14].

Para uma análise do intervalo de confiança (IC) dos modelos neurais, é necessário considerar quatro pontos principais: incompletude dos dados de treinamento; imprecisões dos dados de treinamento; limitações intrínsecas à ferramenta neural; processo de otimização [14].

Em relação aos quatro pontos anteriores pode se destacar que:

a) de modo geral, não é possível obter amostras suficientes para representar de maneira completa o sistema físico e a maneira como o modelo neural responderá a tal incompletude é incerta [14];

b) o conjunto de treinamento é tipicamente impreciso, os erros provem normalmente das medições dos dados, os quais são extraídos dos sistemas físicos, podendo conter parcelas sistemáticas e aleatórias de erros que devem ser considerados através da incerteza de medição [31] [46][49];

c) a maneira aleatória com que os parâmetros livres da rede são iniciados conduz a diferentes resultados para um mesmo conjunto de treinamento;

d) mesmo que considerado um caso ideal, onde os dados de treinamento são isentos de erros, não se pode garantir que o algoritmo de treinamento convirja para um mínimo global da função de erro [14][31].

(62)

62

Visto que para aplicabilidade de uma rede neural é necessário expor os dados durante o treinamento e durante o uso, é importante considerar os erros proveniente dos dados em ambas etapas. Para o processo de aprendizagem, o algoritmo inicia os parâmetros livres da rede em valores aleatórios, gerando assim, diferentes respostas para um mesmo conjunto de treinamento. Espera-se que essas respostas fiquem muito próximas ocasionando um erro aleatório em torno do mínimo erro. Já a incompletude do conjunto de treinamento leva a uma interpolação errônea durante a etapa de aprendizagem. Esse fato acarreta um erro sistemático, já que ocorrerá da mesma forma para redes formadas a partir de um mesmo conjunto. A Tabela 5.1 resume as fontes de erros que podem ser significativas em um projeto metrológico quando aplicadas as RNA.

Tabela 5.1: Fontes de erros que podem ser significativos no uso de RNA [12]. erro aleatório erro sistemático não

compensado dados de medição

treinamento da RNA

exemplos de entrada sim sim

exemplos de saída sim sim

uso da RNA

dados de entrada sim sim

aprendizagem processo de

otimização sim não

incompletude do

conjunto de treinamento não sim

Os itens a seguir apresentam as diferentes ferramentas comumente utilizadas na análise da incerteza de inferência (I-If) dos resultados obtidos pelas RNA, bem como suas limitações. Também é apresentado o método desenvolvido e utilizado por Coral [12], que apresenta uma alternativa viável para considerar a incerteza dos dados de medição utilizados em redes neurais artificiais, tanto no treinamento quanto no uso.

(63)
(64)

64

Onde:

y saída da RNA; xi entrada da RNA;

φ função de transferência de cada neurônio;

wij pesos associados a cada entrada dos neurônios da camada intermediária;

wk pesos associados a cada entrada dos neurônios da camada de saída;

bi bias de cada neurônio.

Gusman [55] mostra que utilizando o modelo matemático dado pela equação 5.1, onde xi representa os valores das medições das grandezas de entrada e y representa a grandeza de saída, para determinar a IM de y, basta aplicar a lei de propagação das incertezas na função f(x1,x2), como expresso nas equação (5.2), (5.3) e (5.4). = √� , . � +� , . � (5.2) Onde: � , � = �′ . [ .�′ . + . �′ . ] (5.3) � , � = �′ . [ .�′ . + . �′ . ] (5.4)

Ocorre que os coeficientes resultantes das derivadas parciais da grandeza de saída em relação a cada variável de entrada podem resultar em expressões muito longas, mesmo para uma estrutura simples como a MLP apresentada por Gusman [55]. Na prática, devido ao fato das RNA geralmente apresentarem modelos matemáticos mais complexos, o uso do método da propagação das incertezas analíticas pode se tornar inviável [55].

(65)

65

Apesar de ser possível obter um resultado quantitativo da incerteza proveniente das medições nos dados de entrada da RNA treinada, tal método não é completo para uso em RNA. A simples aplicação desse método não considera os erros provenientes do conjunto de treinamento, e nem do processo de aprendizagem da RNA [12].

5.2 AVALIAÇÃO DAS INCERTEZAS DA RNA PELO MÉTODO BOOTSTRAP Dos métodos tradicionais para estimar intervalos de confiança em redes neurais, será destacado aqui o método bootstrap, desenvolvido por Efron [56], por ser uma técnica bastante popular na estimativa de intervalos de confiança em RNA [57]. O mesmo faz uso de comitês de redes, o que minimiza os erros devido ao processo de treinamento aumentando a robustez do modelo neural [47].

Ele consiste em, a partir de uma amostra original, que seja representativa em relação à uma população, se obtenham novas amostras, selecionando aleatoriamente os exemplos de treinamento da amostra original. Tais amostras resultantes são denominadas réplicas bootstrap e, na prática, representam diferentes situações experimentais [14][12]. O método foi implementado em redes neurais pela primeira vez por Zhang [58], ilustrado na Figura 5.2. No caso, como a reamostragem é feita aleatoriamente com reposição, certamente dentro de um conjunto de n exemplos existirão alguns dados repetidos e outros que não aparecerão, formando assim os diferentes conjuntos de treinamento. Espera-se, então, que essa escolha aleatória imprima no comitê a variabilidade dos dados contidos dentro da amostra original [12]. Utiliza-se a variabilidade dos resultados para estabelecer o IC. Este método é capaz de considerar os erros aleatórios dos dados de treinamento, erros devido ao processo de otimização e aqueles provenientes da incompletude dos dados [12][46].

Entretanto, como esse método não faz qualquer análise em relação aos dados que serão utilizados após o treinamento das RNA, ele não é capaz de considerar os erros dos dados durante o uso da ferramenta neural. Erros sistemáticos não compensados durante a medição das grandezas também passam despercebidos pelo presente método. Sendo assim, em termos metrológicos, o método bootstrap se torna incompleto em relação às fontes de erros que devem ser consideradas expostas na Tabela 5.1 [12].

(66)
(67)
(68)

68

Para usar o MMC em RNA e considerar todas as IM dos dados, tanto no treinamento quando no uso, é necessário a aplicação desse método em duas etapas, como destacado por Coral [12]. Na primeira etapa, ilustrada na Figura 5.4, durante a fase de aprendizagem do modelo neural, n conjuntos de treinamento são formados a partir de valores simulados utilizando o MMC para os exemplos de entrada e saída, sempre respeitando as PDF de cada IM. Após obtidos os valores simulados das medições originais, é realizado o processo de treinamento normalmente a cada iteração. Esse processo deve ser repetido inúmeras vezes para que haja uma abrangência grande das RNA treinadas em relação às IM presente nos dados do conjunto de treinamento, formando assim um modelo neural artificial constituído por n redes neurais artificiais diferentes a partir de uma mesma base de treinamento. Na segunda etapa, o MMC deve ser aplicado durante o uso do modelo neural, assim para cada dado na entrada desse modelo são geradas k simulações pelo MMC, também respeitando as PDF de cada IM. Para cada uma das k simulações durante o uso são geradas n resultados na saída do modelo neural artificial, como mostrada na Figura 5.5. Assim todas essas saídas geradas devem ser agrupadas formando um modelo de PDF que, descreve em si, a incerteza devido as IM dos dados durante o treinamento e uso do modelo neural artificial [12].

Por se tratar de um modelo numérico, o MMC dispensa o uso de derivadas parciais em relação às medidas das grandezas do modelo [12], o que representa uma vantagem quando utilizado em RNA com elevados números de neurônios na camada de entrada e na camada intermediaria [12].

(69)
(70)

70

Da forma como foi descrita, essa proposta é capaz de considerar todos os erros não compensados provenientes das medições e que sejam considerados na IM, sejam eles do conjunto de treinamento ou durante o uso das RNA. Também considera o erro do processo de aprendizagem do modelo neural, pelo fato do método utilizar várias iterações formando um comitê. Porém, somente o uso do MMC no treinamento e uso das RNA não é capaz de considerar os erros provenientes da incompletude dos dados [12]. Uma das desvantagens da utilização do MMC é a necessidade do elevado número de simulações para se propagar as PDF e manter o erro amostral baixo. Segundo o suplemento 1 do GUM [59], boas aproximações são geralmente obtidas a partir de um milhão de simulações, o que pode significar um elevado esforço computacional [14][12]. Para contornar parte desse último contratempo, Coral [12] ao invés de treinar 106 RNA e usar uma única simulação MMC em todas as redes obtendo assim 106 resultados, optou por treinar um comitê de 1000 redes, e na fase de uso da RNA, simulou 1000 entradas, e aplicando todas elas em cada uma das redes do comitê, obtendo assim os mesmo 106 resultados, reduzindo significativamente o tempo do processamento computacional. A Figura 5.5 também exemplifica o conceito descrito.

(71)
(72)

72

5.4 AVALIAÇÃO DAS INCERTEZAS DA RNA PELO MÉTODO MMC-BAGGING HIBRIDIZADO

Devido às limitações dos métodos apresentados anteriormente, que não são capazes de levar em consideração todas as fontes de erros expressos na Tabela 5.1, Coral [12] propôs o uso da reamostragem bootstrap em conjunto com o MMC, chamado de MMC-bagging hibridizado por Pacheco [14]. Por meio desse método pode-se considerar a incompletude do conjunto de treinamento, erros de medições presentes nos dados do conjunto de treinamento e nos ensaios de teste [14]. Pelo fato das redes usadas nas simulações do MMC formarem um comitê, o método leva em conta ainda, os efeitos aleatórios derivados do processo de aprendizagem [14].

A diferença entre o MMC apresentado na seção 5.3 e o presente método, consiste em utilizar a reamostragem bootstrap no conjunto de treinamento, gerando as réplicas bootstrap, e obtendo um novo conjunto de dados para a etapa de aprendizagem de rede, como ilustrado na Figura 5.6. A partir do conjunto formado, inicia-se a primeira etapa do MMC em RNA, da mesma forma como relatado na seção 5.3. Cada exemplo pertencente aos conjuntos tem suas grandezas de entrada e saída simuladas, sempre respeitando a PDF referente às IM dos parâmetros. Assim, ao final desse processo, haverá uma réplica bootstrap, onde os elementos pertencentes a esse conjunto possuem suas grandezas simuladas de acordo com o MMC. É então, realizado o treinamento da uma RNA. O uso da amostragem bootstrap, permite considerar o erro devido à incompletude dos dados do conjunto de treinamento, complementando o MMC, dado que a partir de um conjunto de dados original são formados outros novos conjuntos. Esse processo deve ser feito n vezes e cada RNA deve ser concatenada para formar um comitê, permitindo assim, considerar os erros devido ao processo de otimização, incluindo aqueles provenientes da incompletude dos dados. Após o treinamento do comitê, inicia-se a segunda etapa do uso de MMC em RNA, da mesma forma como apresentado na seção 5.3 e exemplificado na Figura 5.5. Na fase de uso, os dados de entrada das novas amostras devem ter seus parâmetros simulados de acordo com suas PDF, possibilitando considerar as fontes de erro presente nos dados durante o uso da RNA [12].

Dessa forma, o método apresentado consegue suprir todas as fontes de incertezas previamente citadas na Tabela 5.1, se tornando assim, um método mais confiável que os anteriormente apresentados e de grande robustez metrológica para

(73)
(74)

74

Tabela 5.2: Erros considerados pelo método MMC-bagging hibridizado [12]. erro aleatório erro sistemático não

compensado dados de medição

treinamento da RNA

exemplos de entrada considera considera

exemplos de saída considera considera

uso da RNA

dados de entrada considera considera

aprendizagem processo de

otimização considera não se aplica

incompletude do

conjunto de treinamento não se aplica considera

Em Coral [12] são expostos vários experimentos mostrando a limitação dos métodos bootstrap e MMC quando utilizados separadamente, e sua eficácia quando utilizados simultaneamente.

O presente capitulo decorreu sobre os métodos metrologicamente embasados para estimar a I-If de RNA, requisito necessário para uso das RNA em processos metrológicos. A viabilidade dos métodos apontados nesse capitulo depende do conhecimento da IM dos dados utilizados, bem como suas respectivas PDF.

O capítulo seguinte decorre sobre o método utilizado para os ensaios na bancada de capacidade de elevação de pressão, e da coleta dos dados provenientes desses ensaios realizados para formar o banco de dados necessário para treinamento do módulo neural.

(75)

75

6 ENSAIOS REALIZADOS NA BCE

A inferência dos parâmetros de desempenho passa por duas etapas quando utilizado o método de elevação de pressão. A primeira consiste no ensaio rápido de aproximadamente 2 minutos, onde o compressor sob análise comprime ar para dentro de um vaso de volume fixo, durante o qual, são monitoradas e controladas algumas grandezas físicas que serão abordadas neste capítulo. A segunda etapa, principal foco deste trabalho, consiste em utilizar um modelo neural artificial capaz de correlacionar o resultado obtido nos ensaios de elevação de pressão com os tradicionais ensaios de calorímetro e será abordado no capítulo 7.

6.1 CONSIDERAÇÕES INICIAIS

A bancada utilizada para os ensaios dos compressores foi a bancada de capacidade de elevação (BCE) já apresentada na seção 3.2. Tal bancada, após construída e validada, foi transportada para o laboratório de avaliação da empresa parceira, onde compressores foram avaliados na mesma e, em seguida, nas bancadas de desempenho (calorímetro). Dessa forma, um banco de dados contendo resultados de compressores para ambas as bancadas pôde ser criado.

Para tal, os ensaios realizados em calorímetro devem estar dentro das condições chamadas de checkpoint, definidas como -23,3°C e +54,4°C para as temperaturas de evaporação e condensação, respectivamente. Para essas medições em calorímetro o compressor é ensaiado uma única vez. O tempo médio de ensaio foi de aproximadamente 2,5 horas por compressor.

6.2 ANÁLISE DOS DADOS OBTIDOS

Na seção a seguir serão exibidos alguns estudos efetuados com objetivo de garantir que o método utilizado para realizar o ensaio dos compressores na BCE é o melhor modo de colecionar os dados desse ensaio, bem como a melhor forma de melhorar a correlação com os parâmetros de desempenho obtidos no calorímetro. Os principais pontos avaliados foram o efeito do amaciamento no ensaio de elevação de pressão e a variabilidade dos resultados obtidos na BCE.

Para tais estudos os compressores seguiram a seguinte sequência de ensaios.

(76)

76

1. Após passar pelo processo de fabricação na linha de produção, as amostras selecionadas aleatoriamente para o processo de avaliação dos parâmetros de desempenho eram encaminhadas para uma estufa, onde permaneciam por cerca de 12 horas, assegurando uma equalização térmica das diferentes partes internas e da carcaça do compressor; 2. Garantida a homogeneidade da temperatura os exemplares eram então

ensaiados na BCE;

3. Concluído o ensaio de elevação de pressão os compressores passavam pelo amaciamento por cerca de 8 horas;

4. Por fim, eram ensaiados nos calorímetros tradicionais.

Vale ressaltar que a estufa supracitada não é um ambiente com controle de malha fechada de temperatura, é apenas um local ventilado, com medição de temperatura em diversos pontos, onde os compressores ficam para que suas peças entrem em estabilidade térmica entre si. Tal estabilidade é alcançada em temperatura ambiente, gerando certa variação de temperatura para compressores retirados em horários diferentes ou dias diferentes.

6.2.1 Efeito do amaciamento

Dado que a sistemática para ensaio de desempenho dos compressores em calorímetro estabelece uma etapa anterior, na qual ocorre o amaciamento das amostras para acomodação das partes mecânicas, e que o estudo na BCE também ocorre antes desse ensaio, torna-se necessário verificar os efeitos desse amaciamento nas grandezas de interesse. A partir dessa análise é então possível verificar qual o melhor momento para se realizar o ensaio de elevação de pressão.

Para verificar essa influência, um lote de cinco amostras do mesmo modelo foi ensaiado na BCE antes e após o amaciamento dos compressores. Cada amostra foi ensaiada três vezes antes e três vezes depois do amaciamento. De forma a amenizar o efeito da temperatura, os compressores foram submetidos à equalização na estufa antes do início de cada ensaio. A Tabela 6.1 mostra como seguiu a sequência de ensaios.

(77)

77

Tabela 6.1: Sequência dos ensaios para investigar o efeito do amaciamento.

Baseado nos dados obtidos nesses ensaios, foram construídos gráficos para análise dos resultados e para mostrar a diferença do resultado de CEP antes e depois do amaciamento. O gráfico da Figura 6.1 apresenta os resultados obtidos para esses. Os resultados estão agrupados por amostra, sendo que cada amostra possui três ensaios antes e três ensaios depois do amaciamento.

Método dos ensaios antes/depois amaciamento

Antes do amaciamento

Estufa 2 h

Medição de 5 amostras 20 min

Estufa 2 h

Medição de 5 amostras 20 min

Estufa 2 h

Medição de 5 amostras 20 min

Amaciamento 8 h

Depois do amaciamento

Estufa 2 h

Medição de 5 amostras 20 min

Estufa 2 h

Medição de 5 amostras 20 min

Estufa 2 h

Medição de 5 amostras 20 min Medição em calorímetro

(78)
(79)

Referências

Documentos relacionados

OBS2 : Propostas que não cumpriram os itens descritos no edital e na ficha de inscrição, faltando algum documento ou que não reconheceram firma da assinatura, não foram

todas as doenças dos centros nervosos: as myélites chronicas, as paralysias, certas doenças cancerosas, etc.; vendo os hospitaes, as casas de saúde cada vez mais repletas

The strict partition problem is relaxed into a bi-objective set covering problem with k-cliques which allows over-covered and uncovered nodes.. The information extracted

Este artigo de revisão bibliográfica objetivou discutir o percurso histórico da loucura e do crime para entender como se deu o processo de constituição da unidade de saúde

Dessa maneira, os resultados desta tese são uma síntese que propõe o uso de índices não convencionais de conforto térmico, utilizando o Índice de Temperatura de Globo Negro e

A partir da análise das Figuras 5.20, 5.21, 5.22 e 5.23 pode-se afirmar que a variação do início da altura de queda do bloco não alterou os resultados da energia cinética e alturas

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição