Júlia Kobylanski Ambrosio
Comitê de Máquinas para Previsão de Demanda de
Água
Limeira
2019
Comitê de Máquinas para Previsão de Demanda de Água
Dissertação apresentada à Faculdade de Tecnologia da Universidade Estadual de Campinas como parte dos requisitos para a obtenção do título de Mestra em Tecnologia, na área de Ambiente.
Orientadora: Prof.a Dr.a Lubienska Cristina Lucas Jaquiê Ribeiro Coorientador: Dr. Bruno Melo Brentan
Este exemplar corresponde à versão final da Dissertação defendida por Júlia Kobylanski Ambrosio e orientada pela Prof.a Dr.a
Lubienska Cristina Lucas Jaquiê Ribeiro.
Limeira
2019
Biblioteca da Faculdade de Tecnologia Felipe de Souza Bueno - CRB 8/8577
Ambrosio, Julia Kobylanski,
Am18c AmbComitê de máquinas para previsão de demanda de água / Julia Kobylanski Ambrosio. – Limeira, SP : [s.n.], 2019.
AmbOrientador: Lubienska Cristina Lucas Jaquiê Ribeiro. AmbCoorientador: Bruno Melo Brentan.
AmbDissertação (mestrado) – Universidade Estadual de Campinas, Faculdade de Tecnologia.
Amb1. Abastecimento de água. 2. Previsão de demanda. 3. Aprendizado de máquina. 4. Redes neurais (Computação). I. Ribeiro, Lubienska Cristina Lucas Jaquiê, 1977-. II. Brentan, Bruno Melo, 1990-. III. Universidade Estadual de Campinas. Faculdade de Tecnologia. IV. Título.
Informações para Biblioteca Digital
Título em outro idioma: Water demand forecasting machines committee Palavras-chave em inglês:
Water-supply
Demand forecasting Machine leaning
Neural networks (Computer science)
Área de concentração: Ambiente Titulação: Mestra em Tecnologia Banca examinadora:
Lubienska Cristina Lucas Jaquiê Ribeiro [Orientador] Daniel Manzi
Gustavo Meirelles Lima
Data de defesa: 22-11-2019
Programa de Pós-Graduação: Tecnologia Identificação e informações acadêmicas do(a) aluno(a)
- ORCID do autor: https://orcid.org/0000-0002-5802-8378 - Currículo Lattes do autor: http://lattes.cnpq.br/5828506430409930
Júlia Kobylanski Ambrosio
Comitê de Máquinas para Previsão de Demanda de Água
Banca Examinadora:
• Prof.a Dr.a Lubienska Cristina Lucas Jaquiê Ribeiro
FT/UNICAMP
• Prof. Dr. Daniel Manzi EEP/ ARES-PCJ
• Dr. Gustavo Meirelles Lima EHR/UFMG
A ata da defesa com as respectivas assinaturas dos membros da banca encontra-se no processo de vida acadêmica do aluno.
Primeiramente agradeço aos meus pais, Luiz e Rose, que me apoiaram e me deram suporte durante toda a trajetória do mestrado. As minhas irmãs que sempre estiveram ao meu lado me dando todo o apoio necessário. Agradeço ao Rafael, por sempre estar ao meu lado e me apoiar durante todo o processo de realização deste trabalho.
À Prof. Dra. Lubienska por toda a orientação durante o mestrado e confiança. Ao Bruno por todo o acompanhamento desde o início, todos os conselhos e conhe-cimentos que me passou e confiança para realizar o trabalho.
À UNICAMP, em especial a Faculdade de Tecnologia e todos os professores que fizeram parte da trajetória e que de alguma forma contribuíram para a realização deste trabalho.
A necessidade do planejamento em setores de serviços públicos, como o abastecimento de água, é iminente, principalmente frente ao constante crescimento populacional das cida-des. Para tal planejamento, o estudo da previsão de demanda de água torna-se indispen-sável, uma vez que auxilia na tomada de decisão frente a possíveis problemas. O presente trabalho apresenta a criação de um comitê de máquinas para previsão de demanda de água através de dois métodos principais, método ensemble e híbrido, utilizando a combinação de aprendizado de máquinas, tais como Redes Perceptron Multi-Camadas (MLP), Máquinas de Vetor de Suporte (SVM), Máquinas de Aprendizado Extremo (ELM), Florestas Alea-tórias (RF), Group Method for Data Handling (GMDH) e Redes do tipo Neuro-Nebulosas para Sistemas de Inferência (ANFIS), com objetivo de obter um modelo de previsão de demanda com um menor erro possível e assim, criar um comitê robusto como alternativa de método para previsão de demanda de água. Também como parte desse trabalho, foi realizada a análise das relações existentes entre as variáveis climáticas e sociais e a de-manda de água, por meio do uso de mapas auto organizáveis (SOM) e também por meio da análise do componente principal (PCA). Tanto para o estudo da análise correlacional entre a demanda de água e as variáveis como para a criação do comitê de máquinas, foram utilizados dados históricos da demanda de água de setores da cidade de Franca, localizada no interior de São Paulo - Brasil, bem como, temperatura, velocidade do vento, umidade do ar, pluviosidade e dia do mês, dia da semana, hora, ano e feriados. Os resultados obtidos mostram que a criação do comitê de máquinas pode trazer resultados positivos quando comparados a modelos individuais de previsão de demanda. Dentre os dois comi-tês de máquinas criados, em paralelo e em série, o comitê em série foi o que obteve um melhor desempenho.
Palavras-chave: Sistemas de abastecimento de água, Previsão de demanda, Apren-dizado estatístico, Comitê de Máquinas.
The need for planning in sectors of public services, such as water supply, is imminent, especially in the face of the constant population growth of cities. For such planning, the study of water demand forecasting becomes indispensable, since it aids decision making in the face of possible problems. The present work presents the creation of a committee of machines for predicting water demand through two main methods, ensemble and hy-brid method, using the combination of machine learning, such as Multi-Layer Perceptron Networks (MLP) (SVM), Extreme Learning (ELM), Fandom Forest (RF), Group Method for Data Handling (GMDH), and Adaptive neuro fuzzy inference system (ANFIS), with the aim of obtaining a forecast model of demand with the smallest possible error and thus, to create a robust committee as an alternative method for forecasting water de-mand. Also, as part of this work, the analysis of existing relationships between climatic and social variables and water demand was carried out through the use of self organizing maps (SOM) and also through analysis of the main component (PCA). In order to study the correlation between water demand and variables, as well as the creation of the ma-chinery committee, historical data on the water demand of sectors of the city of Franca, located in the interior of São Paulo - Brazil, were used. , temperature, wind speed, air humidity, rainfall and day of the month, day of the week, time, year and holidays. The results show that the creation of the machinery committee can bring positive results when compared to individual models of demand forecasting. Among the two machine commit-tees created, in parallel and in series, the series committee was the one that performed better.
Keywords: Water supply systems, Demand forecasting, Statistical learning, Machine Committee.
3.1 Métodos quantitativos e qualitativos para previsão. . . 22
3.2 Aplicação do método ensemble. . . 33
3.3 Aplicação do método em série. . . 34
3.4 Arquitetura da Rede MLP. . . 36
3.5 (a) Conjunto de dados linearmente separável.(b) Hiperplano de separação de dados . . . 42
3.6 (a)Conjunto de dados não linearmente separável. (b) Dados separados em uma dimensão maior . . . 42
3.7 Representação esquemática de árvore de decisão onde Xi são as variáveis. Os limites da regra de decisão são representados por a, b, c, d, e. A, B e C correspondem as classes. . . 46
3.8 Arquitetura da rede ANFIS . . . 48
4.1 Representação da topologia hexagonal da rede SOM . . . 52
4.2 Representação do método ensemble aplicado para o comitê de máquinas . . 55
4.3 Representação do método híbrido aplicado para o comitê de máquinas . . . 56
5.1 Localização da cidade de Franca dentro do estado de São Paulo (a) e sua área (b) . . . 59
5.2 Variação da demanda dos setores estudados durante todo o período de coleta de dados. . . 60
5.3 Variação da demanda dos setores estudados durante todo um mês. . . 60
5.4 Variação das variáveis climáticas durante um mês. . . 62
5.5 Planos de entrada após o ajuste de pesos do mapa para o setor Aeroporto ZA . . . 63
5.6 Planos de entrada após o ajuste de pesos do mapa para o setor Azevedo. . 64
5.7 Planos de entrada após o ajuste de pesos do mapa para o setor Leporace. . 65
5.8 Planos de entrada após o ajuste de pesos do mapa para o setor Aeroporto 3. 66 5.9 Gráfico de loadings para o setor Aeroporto 3. . . 67
5.10 Gráfico de loadings para o setor Aeroporto ZA. . . 67
5.11 Gráfico de loadings para o setor Leporace. . . 67
5.12 Gráfico de loadings para o setor Azevedo. . . 68
5.13 Estimativa de demanda para as três combinações do comitê de máquinas para o setor Leporace . . . 74
5.14 Estimativa de demanda para as três combinações do comitê de máquinas para o setor Aeroporto ZA . . . 75
5.15 Estimativa de demanda para as três combinações do comitê de máquinas para o setor Azevedo . . . 76
5.17 Estimativa de demanda do teste 5 do comitê de máquinas para o setor Azevedo . . . 79 5.18 Estimativa de demanda do teste 6 do comitê de máquinas para o setor
Azevedo . . . 79 5.19 Estimativa de demanda do teste 9 do comitê de máquinas para o setor
Azevedo . . . 80 5.20 Estimativa de demanda do teste 11 do comitê de máquinas para o setor
Azevedo . . . 80 5.21 Estimativa de demanda do teste 5 do comitê de máquinas para o setor
Aeroporto ZA . . . 81 5.22 Estimativa de demanda do teste 6 do comitê de máquinas para o setor
Aeroporto ZA . . . 82 5.23 Estimativa de demanda do teste 9 do comitê de máquinas para o setor
Aeroporto ZA . . . 82 5.24 Estimativa de demanda do teste 11 do comitê de máquinas para o setor
Aeroporto ZA . . . 83 5.25 Estimativa de demanda do teste 5 do comitê de máquinas para o setor
Aeroporto 3 . . . 84 5.26 Estimativa de demanda do teste 6 do comitê de máquinas para o setor
Aeroporto 3 . . . 84 5.27 Estimativa de demanda do teste 9 do comitê de máquinas para o setor
Aeroporto 3 . . . 85 5.28 Estimativa de demanda do teste 11 do comitê de máquinas para o setor
Aeroporto 3 . . . 85 A.1 Estimativa de demanda do teste 1 do comitê de máquinas para o setor
Leporace . . . 101 A.2 Estimativa de demanda do teste 2 do comitê de máquinas para o setor
Leporace . . . 101 A.3 Estimativa de demanda do teste 3 do comitê de máquinas para o setor
Leporace . . . 102 A.4 Estimativa de demanda do teste 3 do comitê de máquinas para o setor
Leporace . . . 102 A.5 Estimativa de demanda do teste 5 do comitê de máquinas para o setor
Leporace . . . 103 A.6 Estimativa de demanda do teste 6 do comitê de máquinas para o setor
Leporace . . . 103 A.7 Estimativa de demanda do teste 7 do comitê de máquinas para o setor
Leporace . . . 104 A.8 Estimativa de demanda do teste 8 do comitê de máquinas para o setor
Leporace . . . 104 A.9 Estimativa de demanda do teste 9 do comitê de máquinas para o setor
Leporace . . . 105 A.10 Estimativa de demanda do teste 10 do comitê de máquinas para o setor
A.12 Estimativa de demanda do teste 12 do comitê de máquinas para o setor Leporace . . . 106 A.13 Estimativa de demanda do teste 13 do comitê de máquinas para o setor
4.1 Caracteristicas definidas para os mapas . . . 51
4.2 Cenários Usados . . . 53
4.3 Testes 1 ao 6 . . . 57
4.4 Testes 7 a 9 . . . 57
4.5 Testes 10 a 13 . . . 57
5.1 Parâmetros estatísticos para as séries temporais . . . 61
5.2 RMSE (l/s) para validação das redes MLP e ELM do setor Leporace . . . 69
5.3 MAE(%) para validação das redes MLP e ELM do setor Leporace . . . 69
5.4 RMSE (l/s) para validação das redes MLP e ELM do setor Aeroporto ZA . 70 5.5 MAE(%) para validação das redes MLP e ELM do setor Aeroporto ZA . . 70
5.6 RMSE (l/s) para validação das redes MLP e ELM do setor Aeroporto 3 . . 71
5.7 MAE(%) para validação das redes MLP e ELM do setor Aeroporto 3 . . . 71
5.8 RMSE (l/s) para validação das redes MLP e ELM do setor Azevedo . . . . 71
5.9 MAE(%) para validação das redes MLP e ELM do setor Azevedo . . . 71
5.10 Coeficientes Lineares para cada setor . . . 73
5.11 Erros do setor Leporace . . . 73
5.12 Erros do setor Aeroporto ZA . . . 74
5.13 Erros do setor Azevedo . . . 75
5.14 Erros do setor Aeroporto 3 . . . 76
5.15 Erros dos testes iniciais para o setor Leporace . . . 78
5.16 Testes com o melhor desempenho para o método híbrido . . . 78
5.17 Erros do setor Azevedo . . . 78
5.18 Erros do setor Aeroporto ZA . . . 81
5.19 Erros do setor Aeroporto 3 . . . 83
5.20 Comparação dos Erros MAE(%) dos comitês de máquinas criados . . . 86
5.21 Comparação dos Erros RMSE(l/s) dos comitês de máquinas criados . . . . 86
• ANFIS - neuro fuzzy inference system (Redes do tipo neuro-nebulosas para sistemas de inferência)
• ELM - Extreme Learning Machine (Máquinas de Aprendizado Extremo) • GMDH - Group Method for Data Handling
• IA - Inteligência Artificial
• IBGE - Instituto Brasileiro de Geografia e Estatística • MAE - Erro Médio Absoluto
• MLP - Redes Perceptron Multi-Camadas • ONU - Organização das Nações Unidas
• PCA - Principal Component Analysis (Análise da componente principal) • RMSE - Raiz Quadrada do Erro Médio
• SABESP - Companhia de Saneamento Básico do Estado de São Paulo • SOM - Mapas Auto-Organizáveis
• SVM - Máquina de Vetor de Suporte • RF - Random Forest (Florestas aleatórias) • RMSE - Raiz do Erro Quadrático Médio • RN - Redes Neurais
1 Introdução 15 1.1 Estrutura da Dissertação . . . 17 2 Objetivos 19 2.1 Objetivos Específicos . . . 19 3 Fundamentação Teórica 21 3.1 Previsão de Demanda . . . 21 3.1.1 Métodos Quantitativos . . . 22 3.1.2 Métodos Qualitativos . . . 23
3.2 Previsão de Demanda de Água . . . 24
3.3 Análise Correlacional . . . 27
3.3.1 Mapas Auto-Organizáveis (Rede SOM) . . . 27
3.3.2 Análise de Componentes Principais (Principal Component Analysis - PCA) . . . 30
3.4 Comitê de Máquinas . . . 32
3.4.1 Perceptron de Múltiplas Camadas (MLP) . . . 35
3.4.2 Máquina de Aprendizado Extremo (ELM) . . . 39
3.4.3 Máquinas de Vetor de Suporte (SVM) . . . 41
3.4.4 Group Method for Data Handling (GMDH) . . . 44
3.4.5 Florestas Aleátorias (RF) . . . 45
3.4.6 Redes do tipo neuro-nebulosas para sistemas de inferência (ANFIS) 47 4 Metodologia 50 4.1 Aprendizado de Máquinas . . . 50
4.2 Análise Correlacional das Variáveis e Demanda de Água . . . 51
4.3 Análise individual de redes ELM e MLP em comparação com a rede SOM e o PCA. . . 52
4.4 Previsão de Demanda de Água e Comitê de Máquinas . . . 53
4.4.1 Método em Paralelo . . . 54
4.4.2 Método em Série . . . 55
5 Resultados e Discussões 58 5.1 Estudo de Caso . . . 58
5.2 Avaliação da Correlação entre as variáveis e a demanda de água . . . 62
5.2.1 Avaliação da Rede SOM na correlação entre as variáveis e a demanda de água . . . 62
5.2.2 Avaliação da correlação entre as variáveis e a demanda de água por meio do PCA . . . 66
5.3 Comitê de Máquinas . . . 72
5.3.1 Método Ensemble . . . 72
5.3.2 Método em Série . . . 77
5.3.3 Comparação entre os comitês em série e em paralelo . . . 86
6 Conclusões 88
Referências bibliográficas 91
Capítulo 1
Introdução
O constante crescimento populacional na maioria das cidades do mundo amplia a necessidade de um planejamento em todos os setores de serviços públicos, principalmente no abastecimento de água, sobretudo em países em desenvolvimento, no qual existe um déficit no planejamento integrado da cidade. A Organização das Nações Unidas (ONU) (ONU, 2015) estima que até 2050 o mundo irá precisar de 55% a mais de água para suprir as novas necessidades, e, uma vez que o cenário de escassez hídrica é iminente para parte da população mundial, a necessidade de uma melhor gestão do recurso torna-se assunto prioritário a fim de evitar que o abastecimento seja prejudicado.
Visando as possíveis consequências desse inchaço populacional que muitos lugares vivem, as cidades vêm desenvolvendo sistemas urbanos integrados, com intuito de prever e solucionar problemas em todo o sistema de serviços. Com isso, as cidades caminham em direção à soluções tecnológicas e sustentáveis além de possibilitar monitorar e solucionar problemas existentes. Este modelo de sistema é chamado de cidades inteligentes, Smart Cities (CHOURABI H., 2012). Um dos desafios das cidades inteligentes é obter o controle da expansão desordenada, fazendo-se necessário o monitoramento direto dos meios de serviços, como exemplo o abastecimento de água.
Macan (2014) corrobora a ideia do controle dos sistemas de abastecimentos como um todo, não apenas o monitoramento dos reservatórios e estações elevatórias para enten-dimento dos sistemas da distribuição de água, mas também estudos sobre previsão de demanda de água, para melhorar a gestão dos recursos (MOREIRA, 2011). Com isso, estudos direcionados à demanda e a possíveis problemas que podem ocorrer no
abaste-cimento de uma cidade, tais como rupturas, vazamentos e consumos não faturados se tornam vitais para uma boa gestão.
Para a previsão de demanda podem ser usadas técnicas qualitativas e quantitativas ou uma combinação de ambas (PELLEGRINI, 2000). Os métodos qualitativos são aqueles que se utilizam de opinião de um especialista ou um grupo de especialistas sobre a previsão final, como pesquisa de mercado e projeção de demanda a longo prazo (GOODWIN, 2000). Por outro lado, os métodos quantitativos se utilizam da observação de uma sequência ou padrão histórico de demanda, e por meio de modelos matemáticos, se torna possível a previsão de valores futuros (ELSAYED, 1994).
Os métodos quantitativos podem ser desenvolvidos a partir de diversas técnicas ma-temáticas, como os modelos causais, usando regressão linear ou múltipla, séries tempo-rais, usando média móvel, suavização exponencial e box-jenkins e aprendizado estatístico, usando redes neurais (RN) (BOUGADIS; K. ADAMOWSKI; DIDUCH, 2003), lógica fuzzy (JANG, 1993) ou métodos baseados nas funções Kernel.
Os métodos baseados na teoria de redes neurais têm sido empregados como uma abor-dagem para o estudo de previsão de demanda (LINGIREDDY, 1998). As RNs são al-goritmos construídos seguindo os padrões de estrutura de funcionamento de um cérebro humano e são aplicadas para a resolução de complexos problemas em diversas áreas, tais como, nos estudos de previsão de demanda, estudos de classificação e estudos de corre-lação de variáveis (OLESKOVICZ; COURY; AGGARWAL, 2003). Os métodos de RN vêm demonstrando resultados positivos e superando métodos de regressão linear e série temporal (BOUGADIS; K. ADAMOWSKI; DIDUCH, 2003), além de já terem sido apli-cadas para a previsão de demanda de água tendo resultados satisfatórios (PROTOPAPAS; KATCHAMART; PLATONOVAS, 2000; ZHOU; MCMAHON; Q. WANG, 2001; K.; F.; Z., 2015).
Apesar do estudo de previsão de demanda de água estar em constante crescimento, é possível notar que cada trabalho apresenta apenas um tipo de máquina de aprendizado estatístico, podendo obter resultados não tão robustos, devido às limitações associadas a cada máquina específica. Assim, o presente trabalho tem como objetivo a criação de modelo de previsão de demanda de água baseado na combinação de resultados de diferen-tes métodos de aprendizado estatístico, conhecido como comitê de máquinas, que busca
a extração dos pontos positivos de cada máquina usada em sua combinação (OLIVEIRA et al., 2010; MARTINS, 2014).
O comitê de máquinas, tem como objetivo suprir os erros existentes nas técnicas clássicas, uma vez que a combinação de técnicas pode melhorar o desempenho ao final do processo. Para definir as variáveis de entrada do comitê, também é feito um estudo da correlação existente entre a demanda de água e as variáveis climáticas e sociais, com objetivo de compreender melhor quais variáveis influenciam mais na demanda.
O estudo da análise correlacional qualitativa de variáveis climáticas e sociais com a demanda de água se dá a partir da interpretação dos planos de entrada de mapas auto organizáveis (SOM) e da análise dos componentes principais (PCA). Já a criação do comitê de máquinas irá combinar diferentes técnicas com o objetivo de obter um modelo mais robusto e confiável para previsão. Tendo em vista a necessidade de estudos mais detalhados sobre previsão de demanda de água, a construção de um comitê de máquinas se dá tanto pelo método ensemble quanto pelo método híbrido.
Para a construção do comitê de máquinas do presente estudo, serão utilizadas, a rede perceptron multicamadas (MLP) (MINSKY; PAPERT, 1969; RUMELHART; HINTON; R. J. WILLIAMS, 1986), máquina de vetor de suporte (SVM) (V. N. VAPNIK; CHER-VONENSKI, 1971), extreme learning machines (ELM) (G. HUANG; ZHU; SIEW, 2004), random forests (RF) (BREIMAN, 2001), adaptive neural fuzzy inference systems (AN-FIS) (JANG, 1993), e o group method for data handling (GMDH) (A. IVAKHNENKO, 1971). A combinação das redes é feita por meio de dois métodos: associação em paralelo e em série formando diferentes comitês. Para a avaliação do desempenho de cada rede individualmente e posteriormente cada comitê, serão calculadas a raiz do erro quadrático médio (RMSE) e do erro médio absoluto (MAE).
1.1
Estrutura da Dissertação
O primeiro capítulo é composto pela introdução e estrutura da tese. O segundo apre-senta o objetivo geral e os específicos. O terceiro capítulo é composto pelas bases teóricas, dividido em quatro seções. A primeira seção: "Previsão de Demanda", apresenta os con-ceitos gerais sobre previsão de demanda e como a mesma pode ser aplicada. A segunda seção: "Previsão de Demanda de Água", apresenta como os estudos de previsão de
de-manda de água foram aplicados por meio de métodos quantitativos, usando redes neurais. A terceira seção: "Análise Correlacional", apresenta os métodos que foram utilizados para a realização das análises de correlação entre a demanda de água e as variáveis sociais e climáticas. A última seção: "Comitê de Máquinas", apresenta os conceitos sobre o que é um comitê de máquinas e quais máquinas e combinações foram utilizadas no trabalho.
O quarto capítulo apresenta as metodologias utilizadas para a criação do comitê de máquinas, principal objetivo do trabalho. Neste capítulo, são mostradas as principais configurações das redes, tanto para a previsão de demanda, quanto para a análise corre-lacional. No capítulo cinco, são apresentados os resultados finais para cada análise feita no trabalho, sendo este dividido em duas seções principais: análise da correlação entre as variáveis e a demanda de água e a criação e análise do comitê de máquinas. Por fim, no capítulo seis são feitas as considerações finais do trabalho com base nos resultados obtidos.
Capítulo 2
Objetivos
O presente trabalho tem como objetivo obter um previsor de demanda horária versá-til e robusto, criando uma ferramenta de planejamento para os sistemas de abastecimento de água, utilizando comitê de máquinas. Tal comitê é criado a partir de técnicas de apren-dizado estatísticos, como, Redes Perceptron Multi-Camadas (MLP), Randon Forest (RF), Máquinas de Aprendizado Extremo (ELM), Group Method for Data Handling (GMDH), Redes do tipo neuro-nebulosas para sistemas de inferência (ANFIS) e Máquinas de Vetor de Suporte (SVM), cuja finalidade é ter uma previsão com um menor erro possível e que possa ter maior estabilidade na previsão, evitando problemas de generalização.
2.1
Objetivos Específicos
I Levantar as variáveis envolvidas no processo de demanda de água de múltiplos se-tores de uma cidade para posterior identificação das relações entre cada uma delas com a demanda horária de água. Para tanto, foram levantadas variáveis climáticas (temperatura, umidade relativa do ar, velocidade do vento e precipitação) e soci-ais (dia da semana, mês do ano, ocorrência de feriados, dia do mês, hora do dia e estação do ano).
II Avaliar as relações entre variáveis e a demanda de água. Para essa etapa é proposto o uso de mapas auto organizáveis e da análise da componente principal. Além disso será feita uma comparação entre o uso de duas redes individuais, redes MLP e ELM, com os resultados obtidos pela rede SOM e o PCA.
III Desenvolver o comitê de máquinas: 1. Realizar treinamento de máquinas de apren-dizado (Regressão via vetores suporte, Redes MLP, ELM, GMDH, RF e ANFIS) 2. Construir comitê de máquinas por meio dos métodos, em paralelo e em série. 3. Obter os resultados do comitê e comparar com as abordagens clássicas.
Capítulo 3
Fundamentação Teórica
Este capítulo é composto por quatro seções principais, nos quais são apresentadas as fundamentações teóricas para cada método de aprendizado que será utilizada na com-posição do comitê de máquinas, além da apresentação do estudo da análise correlacional entre a demanda de água e as variáveis climáticas e sociais.
3.1
Previsão de Demanda
Pode-se compreender por demanda, a quantidade de um bem ou serviço que o consu-midor adquire por determinado preço, durante um dado período de tempo (IUNES, 1995). Por outro lado, previsão é a estimativa de uma grandeza em um tempo futuro utilizando dados históricos, tendo a previsão de demanda fundamental importância no estudo da determinação dos recursos necessários (MAKRIDAKIS; WHEELWRIGHT; HYNDMAN, 1998), no caso o recurso dessa pesquisa é a água. Os métodos de previsão de demanda podem ser baseados em métodos qualitativos e quantitativos. A Figura 3.1 representa a taxonomia dos métodos qualitativos e quantitativos, com os seus respectivos modelos. No presente estudo, serão utilizados métodos quantitativos para a previsão de demanda de água, por meio das técnicas de inteligência artificial (IA).
Figura 3.1: Métodos quantitativos e qualitativos para previsão.
Fonte: Adaptado de (SILVA, 2003)
3.1.1
Métodos Quantitativos
Os métodos quantitativos são aqueles que utilizam uma série histórica de dados sobre uma determinada variável, com o objetivo de identificar padrões de comportamento que possam ser reproduzidos para o futuro (CORRÊA, 2009). Os métodos quantitativos só podem ser usados sob a condição de disponibilidade de tais informações históricas (MAKRIDAKIS; WHEELWRIGHT; HYNDMAN, 1998).
As técnicas que englobam os métodos quantitativos são modelos causais, séries tempo-rais e inteligência artificial (MAKRIDAKIS; WHEELWRIGHT; HYNDMAN, 1998). Os modelos causais estudam a previsão de demanda estabelecendo uma relação de causa e efeito entre a variável de demanda e parâmetros que possam afetá-la, por exemplo, tem-peratura, no caso da demanda de água (MENTZER; GOMES, 1989). A estes modelos compreendem técnicas de regressão linear e múltipla para se obter os resultados desejados, assim como feito por Guidi (2016) em que o autor propõe o estudo e a determinação dos coeficientes de miníma vazão horária e do dia de maior consumo utilizando como base dados históricos do município de Franca, no interior do estado de São Paulo. Para tal o
autor aplica regressão linear e após obter os dados propõem um método de previsão de demanda de água por meio do uso de redes neurais. Já as séries temporais, por sua vez, se utilizam de dados históricos de demanda para previsão, considerando os padrões de dados passados, como tendência e sazonalidade. Dentre as técnicas utilizadas para este método estão Média Móvel, BoxJenkins e Suavização Exponencial (CALSING, 2015). Já a metodologia de inteligência artificial, que é estudada no presente trabalho, se utiliza, também, de séries temporais para previsão de demanda, em que os sinais de entrada são processados resultando em sinais de saída obtidos através das técnicas de redes neurais artificiais, lógica fuzzy ou aprendizado estatístico. A principal diferença entre os dois úl-timos métodos, séries temporais e técnicas de inteligência artificial, é que as técnicas de IA permitem o uso de outras variáveis, além dos dados da série principal para processar uma série prevista.
Estudos mostram a aplicação dos métodos quantitativos para previsão de demanda de água. Os estudos tendem a utilizar variáveis climáticas e sociais, uma vez que essas tendem a influenciar a demanda de água (MAIDMENTE; MIAOU; CRAWFORD, 1985; MAIDMENT; MIAOU, 1986).
3.1.2
Métodos Qualitativos
Os métodos qualitativos são definidos por serem métodos que não possuem tantas in-formações quantitativas disponíveis, mas possuindo conhecimentos qualitativos suficientes (MAKRIDAKIS; WHEELWRIGHT; HYNDMAN, 1998). Estes métodos são caracteri-zados por incluir em suas análises variáveis como julgamento, opiniões, experiências e intuição, todos subjetivos, podendo ocorrer incertezas em seus resultados finais.
Com isso, a utilização dos métodos qualitativos pode se resumir a formulação de estratégias, desenvolvimento de novos produtos e tecnologias com taxa de penetração e aceitação de mercado incertas e, até mesmo em certos casos, previsões de médio e longo prazo, quando se possui dados limitados e nenhum precedente histórico (MAKRIDAKIS; WHEELWRIGHT; HYNDMAN, 1998). Entre os métodos qualitativos usados, destacam-se, pesquisa de mercado, grupos focados, analogia e delphi, assim como apresentado na Figura 3.1.
3.2
Previsão de Demanda de Água
A previsão de demanda de água pode ser feita a longo ou curto prazo. A escolha de tal horizonte depende da aplicação da série prevista (SANTOS, 2011). Tal previsão possui grande importância para o abastecimento, uma vez que a mesma auxilia no serviço de fornecimento com eficiência, se tornando o mais sustentável possível, orientando também a ampliação dos sistemas e na definição de custos reais de operação e tarifas justas.
A previsão a longo prazo associa-se a parâmetros que colaboram para auxiliar no planejamento de projetos para novos sistemas ou para ampliação de sistemas já existentes, possibilitando a tomada de decisão estratégica no planejamento. Os estudos de previsão a curto prazo estão associados às operações em tempo real (SANTOS, 2011), sendo aqueles que preveem as próximas horas ou dias. Neste tipo de método é possível obter informações para uma resposta mais rápida do sistema e ter uma tomada de decisões operacionais mais rápidas otimizando a distribuição (R. T. SILVA; ROCHA, 1999).
Tsutiya (2006) aponta alguns fatores que influenciam na demanda de água, tais como, localidade, condições climáticas, hábitos e padrão de vida, natureza da cidade, sistema de fornecimento e cobrança, a qualidade da água fornecida, a tarifa cobrada, pressão na rede, o tipo de estabelecimento, residencial, comercial, industrial e público e as perdas que ocorrem no sistema.
Maidmente, Miaou e Crawford (1985) propuseram um modelo de série temporal ba-seado em precipitação e temperatura, incluindo também, a função de transferência de Box-Jenkins. No estudo de Maidment e Miaou (1986), os autores usaram uma função de transferência para modelar a demanda de água diária em curto prazo em nove cidades dos Estados Unidos: Austin, College Station, e Dallas (Texas); Boca Raton, Deerfield Beach, e Gainesville (Flórida); Allentown (Philadelphia) e Pittsburg (Pennsylvania). No estudo foram utilizados fatores como chuva e temperatura do ar como parâmetros. O estudo mostrou que em todas as cidades, quando a temperatura do ar variou entre 21oC até
27oC, o uso sazonal de água aumentava lentamente e quando a temperatura aumentava mais, chegando a 32oC o uso de água aumentava mais rapidamente.
M. F. Williams e Coulbeck (1987) descrevem um modelo de previsão utilizado na cidade de Wolverhampton, Inglaterra, no qual a demanda é ajustada por uma série de Fourier com seis harmônicos, considerando-se alguns perfis de consumo típicos para de-terminados dias da semana.
No estudo de Stark, Stanley e Buchanan (2000), os autores propuseram utilizar a RN para previsão de consumo do dia seguinte e dez dias a frente, com base no consumo médio diário de um período de 27 meses. No estudo foram utilizadas variáveis climáticas e sociais, tais como, temperatura média diária, precipitação pluviométrica, dias úteis e finais de semana, estação do ano e histórico de consumo horário.
Zhou, Mcmahon e Q. Wang (2000) desenvolveram um modelo para a previsão do consumo diário de água, tendo como base um conjunto de equações que se espelham nos efeitos de quatro fatores, a tendência, a sazonalidade, a correlação e autocorrelação climática. Para a composição do banco de dados os autores utilizaram os meses de menor consumo como estimadores para o uso básico da água. Foi usada uma função polinomial dependente do tempo, para relacionar a tendência do consumo básico a longo prazo, estudado de ano para ano. Já o uso sazonal foi formado pela componente climática junto de componentes de permanência, sendo considerados seis meses de verão e seis de inverno. Os autores testaram o modelo usando um procedimento de validação cruzada, além de uma série independente de dados durante o período do verão. A eficiência e erro padrão foram considerados aceitáveis, sendo de, R2=89,6% e erro=+-8 litros por ligação, por habitante.
Lockwood H. (2003) utilizou técnicas de IA, para a previsão de demanda de água. O modelo de RN empregado ao trabalho proposto, obteve resultados baseados na entrada de dados históricos da demanda de água e variáveis, climáticas e sociais, que influenciam no consumo. Estas técnicas proporcionam recursos para automatizar etapas para interação dos dados, auxiliando o estudo das relações entre demanda de água e variáveis climáticas e sociais.
No estudo realizado por Balling Jr. (2007), foi observado o consumo de água anual durante o período de 1980 e 2004 na cidade de Phoenix, Arizona, Estados Unidos, no qual foi verificado que as variáveis climáticas influenciam no consumo de água. Os parâmetros climáticos usados no estudo foram, temperatura média anual, precipitação total anual e valores do índice médio anual de seca hidrológica de Palmer. Foi observado que o consumo anual aumenta com a temperatura alta, com baixa precipitação e tempo seco.
Em Herrera et al. (2010), foi utilizada a regressão não-linear na previsão horária da demanda, sendo utilizados dados de séries temporais não lineares. Para a previsão de demanda foram consideradas RNs, regressão por prospecção de projeções, splines de
re-gressão adaptativa multivariada, florestas aleatórias e rere-gressão vetorial de suporte. O estudo teve como objetivo realizar uma comparação dos modelos preditivos, avaliando-os a partir de uma metodologia experimental para dados de séries temporais que trabalha-vam com a demanda de água em um setor hidráulico de uma rede de abastecimento de água em uma cidade no sudeste da Espanha. A partir dos dados e das comparações feitas, o estudo mostrou que as máquinas de regressão vetorial possuem um ótimo desempenho para tal estudo de previsão.
B. Brentan, Luvizotto Jr et al. (2015), trabalharam a correlação de dados temporais a partir da Série de Fourier, empregando na previsão de demanda em tempo real. No estudo os autores apontam para uma ferramenta simples, mas de grande eficiência para a previsão de demanda.
Machado et al. (2016) investigaram o desempenho de modelos clássicos e técnicas de combinação de séries temporais com objetivo de modelar e prever o volume de água cap-tado por uma empresa de saneamento básico no Sul do Brasil. Para o estudo os autores utilizaram uma base de dados mensais com uma série de 11 anos, de 2000 a 2011, sendo que o ano de 2011 foi reservado apenas para a validação dos dados. O estudo foi di-vidido em quatro etapas, a caracterização da série temporal, os ajustes e comparações dos modelos de suavização exponencial aditivo e multiplicativo de Holt-Winters (HW), com destaque para o modelo multiplicativo, o ajuste e comparação dos modelos SARIMA e a aplicação de seis tipos de combinações dos melhores modelos HW e SARIMA. Os modelos que apresentaram resultados mais acurados foram os preditores individuais e na utilização do método Sarim sem aproximação foi o modelo que se revelou mais acurado, comparando com o aproximação. Porém, o estudo mostrou que os modelos avaliados obti-veram resultados promissores, com erros absolutos médios percentuais (MAPE) inferiores a 3%.
Luiz, Schroder e J. Silva (2019) utilizaram técnicas preditivas em modelos auto-regressivos para a observação dos níveis freáticos em um poço tubular localizado em aquífero livre no Estado do Rio Grande do Sul, Brasil, além de realizar a comparação entre as técnicas. Para tal foram utilizados métodos Autorregressivos e de Médias Móveis (ARMA), Máquinas de Vetores de Suporte (MVS) e Redes Neurais Artificiais (RNA), tipo feed-forward. As simulações foram feitas em escalas horárias e diárias. No estudo as RNAs apresentaram uma melhor performance dentre as demais, podendo perceber por
meio do Coeficiente de Nash-Sutcliffe (CNS) na ordem de 0,99 na escala horária e, na ordem de 0,84 para a escala diária.
3.3
Análise Correlacional
Ainda que os trabalhos da literatura busquem análises estatísticas para o reconhe-cimento das relações entre a demanda de água e as variáveis preditoras possíveis, o uso de ferramentas de pressuposta relação linear entre as variáveis pode prejudicar o desco-brimento de tais relações. Com isso se faz necessário o uso de ferramentas que consigam correlacionar a demanda de água com as variáveis climáticas e sociais, tais como como os mapas auto organizáveis (SOM), mapas de Kohonen, e a análise de componentes principais (PCA, do inglês Principal Component Analysis).
O SOM foi utilizado por Kalteh, Hjorth e Berndtsson (2008) com objetivo de solucionar um problema específico, com ênfase em problemas de recursos hídricos, constatando que a rede é adequada para investigar, modelar e controlar alguns processos e sistemas de recursos hídricos. Já Haque et al. (2013), utilizaram de um modelo de combinação de regressão linear múltipla, analisando os principais componentes para se conseguir prever a demanda futura do sistema de abastecimento de água, com o intuito de analisar os principais componentes que influenciam na demanda de água. B. M. Brentan (2017) analisou as correlações existentes entre variáveis climáticas e sociais e a demanda de água. No estudo foi utilizado o PCA e a rede SOM para a anális. O estudo mostrou que as variáveis climáticas possuem uma influência na demanda de água e que o SOM pode apresentar uma vantagem em comparação ao PCA, uma vez que os SOMs se baseiam no comportamento cerebral, sendo assim ativam diferentes parte quando expostos a diferentes estímulos (variáveis).
3.3.1
Mapas Auto-Organizáveis (Rede SOM)
Os mapas auto-organizáveis (da sigla SOM, Self-organized map, em inglês) ou mapas de Kohonen, são utilizados com foco na análise da correlação entre as variáveis, sendo uma RN de aprendizado não-supervisionado (KOHONEN, 1982). A rede tem sido utilizada em estudos amplos para correlação entre múltiplas variáveis envolvidas em certos fenômenos, não limitando o número de variáveis a serem analisadas nos mapas criados.
A rede faz o mapeamento de cada variável estudada em um espaço finito de neurônios. Com isso, a partir da similaridade entre os dados de entrada e os neurônios, é possível que a rede molde uma malha no espaço topológico original dos dados, garantindo a má-xima similaridade quando projetada no espaço bi-dimensional. Tal projeção permite a visualização das variáveis em seu espaço topológico, o que conduz então a prospecções de correlações entre as variáveis. A partir desse agrupamento feito pela rede SOM, pode-se estudar as correlações existentes entre variáveis que possam influenciar na demanda de água.
Os dados na rede SOM são processados de modo que a cada neurônio são concedidos pesos aleatórios. Tais pesos representam a posição do neurônio no espaço topológico dos dados. Tendo os pesos inicializados, ocorrem três processos essenciais no ajuste ou treinamento dos SOMs: competição, cooperação e adaptação sináptica.
Na etapa de competição são calculados os valores de uma função discriminante para cada padrão de entrada. Esta função fornece a base para a competição entre os neurônios. Normalmente, tal função é tomada como a distância euclidiana entre um dado de entrada e cada um dos neurônios. O neurônio vencedor é aquele que possui a menor distância Euclidiana, e é considerado então como o neurônio mais ativado por um determinado padrão de entrada. A Equação 3.1 resume a essência do processo competitivo entre os neurônios,
i(x) = argmin(||xi− wj||) (3.1)
no qual se obtêm um espaço de entrada contínuo com padrões de ativação onde ocorre o mapeamento em um espaço de saída discreto de neurônios, sendo i(x) o neurônio vencedor, wj vetor de pesos sinápticos e xi o vetor de entrada.
Na etapa de cooperação, ao neurônio vencedor atribui-se uma determinada região no espaço que também é ativada pelo padrão de entrada em questão, região essa conhecida como vizinhança. A determinação desta vizinhança topológica baseia-se no indício neu-robiológico de que existe interação lateral entre os neurônios excitados. Para que ocorra a cooperação entre os neurônios vizinhos, é necessária a ativação do neurônio vencedor, definindo assim uma topologia, a qual será excitada de maneira proporcional ao neurônio vencedor, por meio do sinal de entrada. Este processo está descrito por meio da Equação 3.2,
hi,j(xi)= exp(−(d2 i,j)) 2σ2 n , j = 1, 2, ..., n (3.2)
no qual, hi,j(xi) representa a vizinhança topológica, centrada no neurônio vencedor i(xi),
tendo j o grupo de neurônios excitados pelo vencedor, σn o tamanho da vizinhança. Já a
distância di,j pode ser descrita a partir da equação 3.3,
di,j = ||rj − ri||2 (3.3)
em que ocorre a diferença entre a posição de um neurônio excitado, rj, e a posição do
neurônio vencedor, ri.
O último processo para a ajuste dos SOMs é o processo de adaptação sináptica. Nesta fase é possível que os neurônios excitados se aproximem do neurônio vencedor e toda a vizinhança se aproxima do padrão de entrada em questão, de modo que se reduza a distância entre o neurônio vencedor e o padrão de entrada. Estes ajustes realizados são tais que a resposta do neurônio vencedor à aplicação seguinte de um padrão de entrada similar é melhorada também. O processo de ajuste é então reiniciado para o padrão de entrada seguinte. Os vetores de entrada são apresentados aos SOMs diversas vezes, num processo iterativo de ajuste, de tal forma que ao final de um ciclo de iterações, a malha de neurônios seja capaz de representar o espaço topológico dos dados sem grandes perdas de informação (HAYKIN, 2001).
Sperandio, Coelho e Queiroz (2003) tiveram como objetivo identificar uma metodolo-gia para o reconhecimento de agrupamentos de um conjunto de consumidores de enermetodolo-gia elétrica. Para alcançar o objetivo inicial do trabalho, foi utilizado um banco de dados contendo 260 municípios e as seguintes variáveis: número de consumidores e o consumo, que são divididos em cinco classes (residencial, industrial, comercial, rural e público), o número de subestações e de alimentadores, a distância da subestação a sede do município, capacidade de manobra e os atuais índices de DEC (Duração Equivalente de Interrupção por Unidade Consumidora) e FEC (Freqüência Equivalente de Interrupção por Unidade Consumidora). Para verificar as correlações entre as variáveis estudadas, além do uso da rede SOM, foi realizado o teste de correlação de Pearson com os pares de variáveis, observando uma tendência entre as classes de consumidores residencial, comercial e pú-blica, podendo perceber essa tendência nos mapas também. A partir do agrupamento dos
consumidores, feito pelos autores, os mesmos puderam propor novas metas dos índices de qualidade de fornecimento.
Os SOMs também podem ser utilizados para identificar áreas prioritárias para recu-peração florestal, assim como feito por Arcoverde et al. (2011). O processo se deu em duas escalas, escala regional e sub-regional. Neste caso o SOM mostrou-se eficiente para a identificação do comportamento das variáveis adotadas e na definição de áreas prioritárias para a recuperação florestal, pois a partir do estudo, observou-se a necessidade de recu-peração da vegetação florestal de áreas de preservação permanentes (APPs) hidrográficas para conter o assoreamento dos cursos d’água e manter a qualidade da água da represa do Jaguari.
Iwashita et al. (2012) propõem a utilização do SOM junto com imagens aéreas. Neste caso, foram feitos estudos para estimar os processos de intemperismo do solo, utilizando as relações entre o solo, o relevo e a hidrologia. Essas relações entram como variáveis nos mapas auto-organizáveis de Kohonen, no qual é calculado um coeficiente de correlação entre elas. A partir desse coeficiente é gerado um mapa de condutividade hidráulica e textura do solo.
Além de estudos de agrupamento de dados, classificação e correlação, a rede SOM pos-sibilita o trabalho do agrupamento de imagens, baseando-se em características similares encontradas, podendo identificar falhas nos sistemas (FELIZARDO et al., 2013; MOTA, 2014).
3.3.2
Análise de Componentes Principais (Principal Component
Analysis
- PCA)
O PCA foi descrito inicialmente por Pearson (1901), mas Hotelling (1933) foi quem descreveu os métodos computacionais práticos, usando-os com objetivo de analisar as es-truturas de correlação. O PCA tem como objetivo realizar uma análise dos dados usados focando na redução de variáveis envolvidas no processo. Para tal redução e consequente-mente criação dos loadings, o PCA faz uma transformação linear nos dados de entrada de modo que no plano criado, os loadings, consiga-se observar a correlação entre as variáveis.
X = x1,1 x1,2 ... x1,m x2,1 x2,2 ... x2,m xp,1 xp,2 ... xp,m
A partir da matriz X é possível determinar a matriz de covariância entre cada uma das m variáveis usadas, dessa forma se obtém a matriz P
. X = σ2 1,1 σ21,2 ... σ1,m2 σ2 2,1 σ22,2 ... σ2,m2 σ2 p,1 σ2p,2 ... σp,m2
neste caso, a diagonal dessa matriz que possui tamanho m x m é representada pela variância σi2 representando a variável i, já os demais elementos são descritos como σi,j,
nos termos da covariância, representando as variáveis i e j.
A partir da matriz de covariância, é possível encontrar os autovalores e autovetores que são associados a cada direção. Para cada autovalor se tem um autovetor, tomando em consideração que os autovalores [λ1, λ2, ..., λm] estão dispostos em uma ordem decrescente,
terá um autovetor associado:
ei = [ei,1, ei,2, ...ei,m](3.4)
Com isso, é possível descrever as variáveis da componente principal (P Ci):
P Ci = ei.x (3.5)
No PCA o principal objetivo é rotacionar os eixos de coordenadas tomando sempre as direções de maior variância dos dados.
A comparação entre as componentes principais geradas pelo PCA, é feita através da análise dos loadings, que são traçados num plano determinado pelas duas primeiras componentes. Para a comparação das variáveis e análise de suas correlações é preciso verificar as direções dos autovetores. A similaridade na direção entre eles indica uma maior similaridade entre as variáveis e consequentemente maior correlação.
O PCA vem sendo utilizado em estudos no abastecimento de água, assim como feito por Bengraine (2003), no qual o PCA foi utilizado com dois objetivos, analisar e extrair
os fatores associados à variabilidade hidro-química e identificar as mudanças espaciais e temporais da qualidade da água. Para isso, foram analisados dados químicos, físicos e biológicos de 12 pontos ao longo do Rio Passaic, em Nova Jersey.
Finkler et al. (2015), usaram o PCA, em estudo com objetivo identificar e analisar parâmetros principais de qualidade dos corpos hídricos no município de Caxias do Sul, localizado no estado do Rio Grande do Sul. No trabalho, os autores monitoraram 30 pontos e analisaram 21 parâmetros físicos, químicos e biológicos. A partir do PCA, foi possível verificar qual ou quais os motivos de um declínio na qualidade da água nos pontos estudados.
Com o intuito de melhorar o conhecimento de inter relação entre a demanda de água e as variáveis, B. Brentan, Meirelles et al. (2017) realizaram um estudo aplicando três algoritmos, o PCA, os SOMs e as Florestas Aleatórias (RF) para analisar esta relação. A partir do estudo, os autores perceberam que o SOM e a RF corroboram com os resultados obtidos pelo PCA e que conseguem observar recursos ocultos pelo PCA, devido as suas capacidade de processamento com não-linearidades. No estudo foram usados três setores da cidade de Franca, São Paulo. A partir dos resultados observou-se que temperatura, umidade relativa e hora do dia possuem uma maior influência na demanda de água, sendo mais importantes para se construir um modelo de regressão preciso.
3.4
Comitê de Máquinas
O comitê de máquinas para previsão de demanda de água em tempo real é um mé-todo usado para se combinar diversas técnicas de aprendizado estatístico, ao invés de usar apenas um método de aprendizado de máquina, derivando o resultado das técnicas separadamente e tendo como objetivo aumentar a capacidade de generalização dos es-timadores. Segundo Clemen (1989), a combinação é uma abordagem interessante para realizar previsões, visto que, ao invés de tentar escolher a melhor técnica, formula-se o problema perguntando que técnicas poderiam ajudar na melhoria da exatidão. Como as previsões podem ser afetadas por diversos fatores, muitas vezes desconhecidos, cada téc-nica pode contribuir capturando algum tipo de influência desses fatores. Com isso, cada técnica pode influenciar de forma positiva no resultado final da previsão.
Para a criação do comitê de máquinas, existem dois métodos mais usuais, a combinação em série (híbrida) e a combinação em paralelo (ensemble). A combinação em paralelo constitui da combinação das saídas individuais, com o objetivo de se obter uma única solução. A combinação no método ensemble pode ser feita por meio do cálculo da média dos resultados obtidos separadamente, no caso do estudo de regressão, e voto majoritário no caso de estudo de classificação. A Figura 3.2 demonstra a aplicação do método ensemble para a combinação de três componentes produzindo soluções diferentes para a mesma tarefa.
Figura 3.2: Aplicação do método ensemble.
Fonte: Adaptado de (HAYKIN, 2001)
O método ensemble tem sido amplamente utilizado nas últimas duas décadas, tanto para problemas de regressão quanto para problemas de classificação de padrões, uma vez que são capazes de aumentar o desempenho geral do sistema (HANSEN, 1990). Werner (2015) discorre sobre a combinação em paralelo ser um método bastante utilizado para a previsão em séries temporais, com o objetivo de minimizar seus erros.
Já a combinação em série, também conhecida como método híbrido, constitui na com-binação de duas, ou mais, técnicas diferentes em sequência (TSAI, 2010; SELAU, 2012),e tem como principal objetivo minimizar os erros das técnicas de inteligência artificial in-dividualmente, melhorando seu desempenho, previsão e classificação. O modelo híbrido é desenvolvido a partir da premissa que a primeira técnica é utilizada para guiar o proces-samento da segunda (GHODSELAHI, 2011).
A combinação em série pode ser dividida em duas fases distintas, a redução das classes e a reavaliação. Na primeira, a cada etapa do sistema os números de classes candidatas são reduzidos. Já na reavaliação, os padrões retirados em níveis anteriores são reavaliados.
Com isso, se o nível de confiança do classificador é baixo, o padrão deverá ser avaliado na próxima etapa. A Figura 3.3 exemplifica a combinação em série, mostrando a etapa de reavaliação, neste arranjo. Em cada etapa do do processamento, existirá somente uma rede atuando (HENRIQUES, 2008).
Figura 3.3: Aplicação do método em série.
Fonte: Adaptado de (HENRIQUES, 2008)
Os métodos de combinação podem ser utilizados em diversos campos de pesquisa, assim como apresentado por Castro, Braga e Andrade (2005), no qual os autores propuse-ram o uso do método ensemble para obter um modelo de previsão com grande capacidade de generalização. O comitê de máquinas neste caso, foi criado a partir da combinação de três redes MLP distintas, para a previsão da série de índices de fechamento diário da bolsa de valores de São Paulo (Ibovespa). Neste caso, o comitê de máquinas desenvolvido pelos autores, obteve melhores resultados do que os resultados das redes individualmente. Oliveira et al. (2010) tiveram como objetivo da pesquisa a criação de um comitê de máquinas para melhorar os resultados obtidos a partir das redes neurais especialistas. Para isso, os autores criaram um comitê de máquinas formado por dez RNs especialistas do tipo MLP com arquitetura e parâmetros de treinamento distintos, e compartilhando as mesmas entradas. Ao final, os resultados obtidos a partir do comitê de máquinas
foram comparados aos obtidos pelas redes neurais individualmente, percebendo que o desempenho do comitê de máquinas foi superior na solução do problema mostrado.
Grebin (2013), propuseram comparar as duas formas de combinação, em série e em paralelo, para solucionar um problema real de venda cruzada (cross-selling) de uma insti-tuição financeira brasileira. O estudo verificou que a combinação em paralelo, neste caso, obteve melhores resultados que a combinação em série, possibilitando um melhor ajuste aos dados.
No estudo de Martins (2014), o autor teve como objetivo a verificação das diferenças em resultados entre previsões individuais e suas combinações, através da modelagem de séries reais. Para as previsões individuais, os autores utilizaram a metodologia de Box-Jenkins e modelagem RN. Por outro lado, para os modelos de combinação, foram utilizados dois métodos, a média aritmética e a variância mínima simplificada. Os autores obtiveram resultados positivos no agrupamento das técnicas, verificando que as previsões obtidas pelo método da variância mínima tiveram um melhor desempenho do que as demais previsões.
Prasad, Deo e Maraseni (2018) propuseram o uso de um comitê de máquinas com objetivo de desenvolver um modelo de previsão de umidade do solo. Para isso utilizaram as máquinas Volterra de segunda ordem não ajustados, árvore M5, floresta aleatória e modelos de máquina de aprendizagem extrema (ELM). Para tal estudo foram usados ín-dices climáticos, parâmetros atmosféricos e parâmetros hidrometeorológicos para compor os dados de entrada do modelo.
Os comitês de máquinas apresentam resultados significativos, na maioria dos casos, quando comparados a resultados de máquinas individuais. A partir disso, a criação do comitê de máquinas se mostra importante no estudo de previsão de demanda de água, uma vez que com o comitê a gestão dos recursos poderá ser melhorada, dando suporte a novas pesquisas para que o sistema de abastecimento de água seja ele automatizado ou não, existindo um controle e monitoramento do recurso, localizando falhas, perdas e rupturas em tempo real sem atingir negativamente a população.
3.4.1
Perceptron
de Múltiplas Camadas (MLP)
O modelo de rede do tipo Perceptron foi desenvolvido por Frank Rosenblatt, este modelo de rede basea-se em um modelo matemático no qual a rede recebe várias
entra-das x1, x2, ..., xn e produz uma única saída binária, está saída é determinada pela soma
ponderada das saídas das camadas anteriores.
A rede Perceptron de Múltiplas Camadas (do inglês Multilayer Perceptron, MLP) é uma rede do tipo perceptron, caracterizando um modelo de rede é caracterizado por possuir pelo menos uma camada intermediária, sendo uma rede progressiva (feedforward), isso é, as saídas dos neurônios em qualquer camada se conectam unicamente às entradas dos neurônios da camada seguinte. Com isso o sinal de entrada se propaga através da rede em um sentido progressivo.
Sua arquitetura pode ser descrita em três camadas principais, a camada de entrada (input layer), camadas intermediárias ou ocultas (hidden layers) e camada de saída (output layer), assim como representado na Figura 3.4.
Figura 3.4: Arquitetura da Rede MLP.
n
Fonte: Adaptado de (HAYKIN, 2001).
Na camada de entrada da rede, os dados são apresentados a um ou vários neurônios e modificados pelos pesos de entrada. Na camada intermediária ocorre o processamento dos dados de entrada através dos neurônios. Este processamento ocorre através de uma função de ativação f (.) , que se inspira na ativação neural biológica e é aplicada ao produto do
vetor de entrada (xn) e do vetor peso (w) de cada neurônio. A camada de saída representa
o resultado dessa função de ativação que ocorre nas camadas ocultas.
O processamento da rede MLP pode ser descrito pela Equação 3.6, no qual o vetor de entrada xi possui uma saída yi,
f (xi) = f ( Q X q=1 wq.f ( P X p=1 wp.xi)) = yi (3.6)
no qual, xi é o vetor dos dados de entrada i, wq representa o vetor peso referente ao
neurônio q e wp é o vetor relativo ao neurônio p.
O processamento das informações na rede MLP ocorre em duas fases, de propagação e de adaptação. A primeira etapa de propagação é responsável por propagar os dados de entrada pela rede camada por camada, até produzir uma saída. Nesta etapa os pesos sinápticos da rede permanecem fixos. Já na segunda etapa de adaptação, ocorrem os ajustes dos pesos da rede. Para a correção dos pesos é utilizado o algoritmo backpropaga-tion. No processo do treinamento com o algoritmo backpropagation, a rede opera em uma sequência de dois passos. No primeiro, um padrão é apresentado à camada de entrada da rede, no qual o sinal resultante flui através da rede, camada por camada, até que se obtenha uma resposta na camada de saída. No segundo passo, a saída obtida e a saída desejada são comparadas e a saída obtida não estiver correta, o erro é calculado. Este erro é propagado a partir da camada de saída até a camada de entrada, e os pesos das conexões das unidades das camadas internas vão sendo modificados à medida que o erro é retropropagado.
A rede MLP já foi utilizada em diversos casos de previsão de demanda assim como em Sjobom Jr. (2004), em que os autores realizaram o estudo de previsão de nível de reservatórios de água utilizando a rede MLP, treinadas por meio de algoritmo de retro propagação, tendo como objetivo captarem a dinâmica de funcionamento do sistema de abastecimento de água, através dos dados históricos operacionais e dados climáticos. No estudo, os autores obtiveram resultados favoráveis para a previsão por meio da rede MLP, considerando que a média dos erros apresentam valores razoáveis, para as dimensões dos reservatórios estudados. Já nos estudos de Bilobrovec M. (2004), foi demonstrada a aplicabilidade das redes MLP para simulações, tendo o mesmo nível de precisão que os modelos estatísticos clássicos. As redes MLP já foram utilizadas em conjunto com a rede
NARX (redes recorrentes), como feito por Oliveira et al. (2010), que buscava simular a densidade de raios cósmicos no meio interplanetário.
As redes MLP foram utilizadas por Medeiros et al. (2016) com o objetivo de desenvol-ver uma ferramenta de previsão de demanda de médio prazo para auxiliar especialistas no planejamento de distribuição de energia elétrica. Os autores avaliaram, também, o desempenho da Lógica Fuzzy no trabalho. Na avaliação com a rede neural, os autores uti-lizaram 312 valores de demanda semanal, onde 80% foi utilizado para treinamento e 20% para validação, sendo que o teste final para o estudo foi feito para o ano de 2014. Como resultado, foi constatado que ambas as técnicas alcançaram resultados significativos, com valores de erro percentual absoluto médio abaixo de 4%, permitindo que especialistas consigam realizar com precisão tomadas de decisões estratégicas no setor.
Em Santos et al. (2016), a utilização da rede MLP teve como objetivo realizar uma comparação entre a rede MLP e a rede Elman, que constituiu uma rede com realimentação, para a análise de previsão de vazões sazonais na bacia do Rio Tijuco, localizada na cidade de Ituiutaba, Minas Gerais, por meio da relação chuva-vazão. A partir do estudo, os autores puderam constatar que para este caso, a rede Elman teve um maior sucesso do que a rede MLP.
Ghorbani et al. (2018) utilizaram um modelo híbrido integrando o Firefly Algorithm (FFA), como uma ferramenta de otimização heurística com o algoritmo Multilayer Per-ceptron (MLP-FFA) com objetivo de prever o nível de água no Lago Egirdir, na Turquia. No estudo é feita a comparação do modelo híbrido MLP-FFA com o modelo MLP com processo de aprendizagem baseado em retropropagação. Para o estudo foram utilizados dados mensais do nível de água em um período de 56 anos, entre os anos de 1961 a 2016. No estudo, foram feitas combinações de entrada dos modelos. Para avaliar o modelo MLP-FFA são usadas métricas de escores estatísticos, como eficiência de Nash-Sutcliffe, raiz quadrada do erro médio e erro absoluto médio, índice de Wilmott e diagrama de Taylor desenvolvidos na fase de testes. Os resultados mostraram que o modelo MLP-FFA4, no qual foram utilizados 4 meses de combinações, obteve uma maior precisão do que o modelo MLP4 autônomo. O modelo MLP-FFA4 obteve um índice de Willmott de aproximadamente 0,999 em relação a 0,988 da MLP4 e o erro médio quadrático foi de aproximadamente 0,029m comparado a 0,102m. Com isso, o estudo observou que o modelo MLP-FFA4 possui uma maior robustez para o problema de previsão de demanda.
Perea et al. (2019) utilizou as redes MLP com objetivo de utilizar a RN para realizar a previsão de demanda de água de irrigação diária. O estudo foi aplicado no distrito de irrigação de Bembézar (sul da Espanha). O modelo utilizado apresentou uma Predição de Erro Padrão (SEP) de 8,7% e um coeficiente de determinação (R2) de 96%. O estudo permitiu a melhoria no gerenciamento diário dos distritos de irrigação.
3.4.2
Máquina de Aprendizado Extremo (ELM)
A Máquina de Aprendizado Extremo (ELM, do inglês Extreme Learning Machine) baseia-se em uma rede feedforward com uma única camada oculta e foi proposta por G. Huang, Zhu e Siew (2006). Nesta rede apenas os pesos dos neurônios ocultos para a saída são determinados analiticamente calculados por meio de uma solução de mínimos quadrados, os dos neurônios ocultos são, por sua vez, determinados aleatoriamente (G. B. HUANG; D. WANG; LAN, 2011). Com isso, a rede ELM proporciona vantagens, tais como velocidade mais rápida de aprendizagem, implementação mais fácil e uma menor interferência humana, quando comparadas a redes tradicionais, como a rede MLP. G. Huang, Zhu e Siew (2006), colocam que a principal vantagem das ELMs é a criação de uma ponte entre a teoria de aproximação universal da RN e o processo de sintonia de uma SVM, podendo ser uma rede mais completa.
A partir dessa abordagem aleatória que ocorre no processamento da rede, se tem a Equação 3.7, que representa a combinação linear dos dados de entrada, se assemelhando de um problema de mínimos quadrados, no qual os parâmetros a serem ajustados são os pesos da camada de saída.
f (xi) = m
X
q=1
wq.L(xi, p) = yi (3.7)
no qual, L(xi) é uma função não linear, processada na camada de entrada e nas camadas
ocultas e w representam os pesos sinápticos.
A rede ELM vêm sendo aplicada em estudos de previsão de demanda, assim como proposto por Mouatadid e J. Adamowski (2016), no qual foi proposto um estudo da capacidade de alguns métodos de aprendizado de máquinas, com objetivo de melhorar a precisão da previsão de demanda de água urbana da cidade de Montreal (Canadá). O estudo utilizou três modelos de RNs, as ELM, as support vector machine (SVR) e as de
regressão linear múltipla (MLR), para prever a demanda de água em 1 e 3 dias. Os autores desenvolveram os modelos baseados em diferentes combinações das principais variáveis de entrada, como temperatura máxima diária, precipitação total diária e demanda diária de água, no período de 1999 e 2010. Para determinar qual modelo obteve melhor desempenho, foram analisados o coeficiente de determinação ao quadrado, erro quadrático médio e um exame dos resíduos. Dentre os modelos testados, a rede ELM obteve uma maior precisão, comparada aos demais modelos, na previsão de demanda de água urbana de Montreal por 1 dia e 3 dias à frente.
Tiwari, J. Adamowski e K. Adamowski (2016), estudaram a capacidade de modelagem das ELMs para a previsão de demanda diária de água urbana a partir de dados limitados, testando as redes sozinhas ou em conjunto com a análise wavelet (W) ou métodos bootstrap (B) (ELM, ELMW, ELMB), avaliando e comparando com RNs tradicionais equivalentes (ANN, ANNW, ANNB). Foram utilizados dados de demanda de água de três anos e dados climáticos da cidade de Calgary, Alberta, no Canadá. Os modelos híbridos ELMB e ANNB forneceram previsões satisfatórias de 1 dia de prazo de precisão similar. O modelo ELMW apresentou um melhor desempenho, quando comparado aos modelos ANNW e ANNB, mostrando que a transformação wavelet auxilia na melhoria do desempenho geral do modelo para a previsão de demanda de água urbana.
A rede ELM foi utilizada, também, no campo energético, assim como feito por Ma-jumder, Behera e Nayak (2014), no qual foi estudada a previsão de energia solar, através de uma decomposição em modo empírico híbrido e ELM. Ertugrul (2016), propôs o uso da ELM para a previsão da carga de eletricidade. No estudo, o autor utilizou uma abordagem da rede ELM adaptada para treinar uma única camada oculta de rede neural recorrente, transformando em uma máquina de aprendizagem extrema recorrente (RELM). No es-tudo, foram utilizados dados de 2001 a 2014 para avaliar e validar a abordagem. Os resultados obtidos pela RELM foram comparados com uma rede ELM tradicional de re-gressão linear, rede neural de rere-gressão generalizada e alguns outros métodos populares de aprendizado de máquina. Os erros quadráticos médios (RMSE) da RELM foram quase duas vezes menores que os resultados obtidos pelos demais métodos utilizados.
Mouatadid, J. Adamowski et al. (2019) exploraram o uso de uma rede ELM, junto com uma RN, uma regressão vetorial de suporte de mínimos quadrados (LSSVR) e uma regressão multi-linear (MLR), com intuito de prever o fluxo de irrigação em Palos de la
Frontera, um distrito de irrigação localizado em Huelva (sul da Espanha). Os modelos ANN wavelet-LSTM e wavelet bootstrap obtiveram previsões mais precisas, medidas por métricas estatísticas, incluindo o erro médio quadrático (RMSE), erro absoluto médio (MAE), coeficiente de determinação (r2), erro relativo médio (MRE), erro relativo abso-luto médio (MARE), índice de Willmott e índice de eficiência Nash-Sutcliffe (NASH).
3.4.3
Máquinas de Vetor de Suporte (SVM)
No aprendizado estatístico são estabelecidas condições matemáticas que auxiliam na escolha de um classificador particular, a partir de um conjunto de dados de treinamento. Máquinas de vetores de suporte (do inglês Support Vector Machine) foram desenvolvidas com objetivo de realizar uma classificação binária entre conjuntos de dados não linear-mente separável (HAYKIN, 2008). As SVMs são fundamentadas pela teoria do aprendi-zado estatístico desenvolvida por V. Vapnik (1995), com estudos iniciais em V. N. Vapnik e Chervonenski (1971). As máquinas SVM se caracterizam por serem um método com treinamento supervisionado, usado tanto para regressão quanto classificação. A SVM ofe-rece uma alternativa para o reconhecimento de padrões, tendo o objetivo de encontrar um hiperplano que possa separar um conjunto de dados em classes discretas, onde ocorre a maximização da distância entre as classes (BURGES, 1998). Para obtenção do hiper-plano, V. Vapnik (1995) apresentou um conceito de dimensão Vapnik-Chervonenkis (VC), baseada na amplitude da máquina de aprendizagem em relação ao conjunto de dados de treinamento apresentados. Sendo assim, o hiper-plano ótimo ocorre a partir da separação entre os dados. Nesta separação os dados de entrada são projetados no espaço de outra dimensão.
As SVMs têm a capacidade de separar conjuntos de dados linearmente separáveis (Figura 3.5) e não linearmente separáveis (Figura 3.6). Na Figura 3.5, os dados podem ser linearmente separáveis, como representados na Figura 3.5(b), uma vez que existe uma linha capaz de realizar essa separação. Nesta figura pode-se verificar que existe apenas uma linha capaz de dividir essas classes, de modo a fazer com que as margens entre as duas classes seja a maior possível.
Figura 3.5: (a) Conjunto de dados linearmente separável.(b) Hiperplano de separação de dados
Fonte: Arquivo pessoal.
A Figura 3.6(a), por sua vez, representa um conjunto de dados não linearmente separá-veis. Com isso, esses dados devem ser mapeados em uma dimensão maior, como mostrado na Figura 3.6(b). Após mapear os dados originais em uma dimensão maior (kernelling), a separação entre as classes se torna possível através de um hiperplano.
Figura 3.6: (a)Conjunto de dados não linearmente separável. (b) Dados separados em uma dimensão maior
Fonte: Arquivo pessoal.
Em ambos os casos, o hiperplano ótimo é encontrado ao maximizar as bordas entre as duas classes. Os dados mais próximos ao hiperplano são chamados de vetores de suporte, aqueles que se apresentam mais próximos do limite da curva de separação, com tamanho . Para se encontrar este hiperplano ótimo se faz necessário o uso da função kernel, K , na qual é obtido o produto de,φ(x), φ(x0), entre os dados de entrada.