• Nenhum resultado encontrado

Modelagem em casas de vegetação : aplicação de técnicas de aprendizado de máquina para capturar a variabilidade espacial e temporal de variáveis ambientais

N/A
N/A
Protected

Academic year: 2021

Share "Modelagem em casas de vegetação : aplicação de técnicas de aprendizado de máquina para capturar a variabilidade espacial e temporal de variáveis ambientais"

Copied!
73
0
0

Texto

(1)

VINÍCIUS ANDRÉ VELOZO LOPES

MODELAGEM EM CASAS DE VEGETAÇÃO:

APLICAÇÃO DE TÉCNICAS DE APRENDIZADO DE

MÁQUINA PARA CAPTURAR A VARIABILIDADE

ESPACIAL E TEMPORAL DE VARIÁVEIS AMBIENTAIS

CAMPINAS 2019

(2)

MODELAGEM EM CASAS DE VEGETAÇÃO: APLICAÇÃO

DE TÉCNICAS DE APRENDIZADO DE MÁQUINA PARA

CAPTURAR A VARIABILIDADE ESPACIAL E TEMPORAL

DE VARIÁVEIS AMBIENTAIS

Dissertação apresentada à Faculdade de Engenharia Agrícola da Universidade Estadual de Campinas, como parte dos requisitos exigidos para obtenção do título de Mestre em Engenharia Agrícola na área de concentração: Gestão de sistemas na agricultura e desenvolvimento rural.

Orientador: Prof. Dr. Luiz Henrique Antunes Rodrigues

ESTE TRABALHO CORRESPONDE À VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO ALUNO VINÍCIUS ANDRÉ VELOZO LOPES, E ORIENTADO PELO PROF. DR. LUIZ HENRIQUE ANTUNES RODRIGUES.

CAMPINAS 2019

(3)

Rose Meire da Silva - CRB 8/5974

Lopes, Vinícius André Velozo,

L881m LopModelagem em casas de vegetação : aplicação de técnicas de aprendizado de máquina para capturar a variabilidade espacial e temporal de variáveis ambientais / Vinícius André Velozo Lopes. – Campinas, SP : [s.n.], 2019.

LopOrientador: Luiz Henrique Antunes Rodrigues.

LopDissertação (mestrado) – Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola.

Lop1. Estufas. 2. Mineração de dados. 3. Predição (Lógica). 4. Variabilidade. 5. Aprendizado de máquina. I. Rodrigues, Luiz Henrique Antunes, 1959-. II. Universidade Estadual de Campinas. Faculdade de Engenharia Agrícola. III. Título.

Informações para Biblioteca Digital

Título em outro idioma: Greenhouse modeling : application of machine learning techniques

to capture spatial and temporal variability of environmental variables

Palavras-chave em inglês: Greenhouse Data mining Prediction Variability Machine learning

Área de concentração: Gestão de Sistemas na Agricultura e Desenvolvimento Rural Titulação: Mestre em Engenharia Agrícola

Banca examinadora:

Luiz Henrique Antunes Rodrigues [Orientador] Romis Ribeiro de Faissol Attux

Paulo César Sentelhas

Data de defesa: 11-09-2019

Programa de Pós-Graduação: Engenharia Agrícola Identificação e informações acadêmicas do(a) aluno(a)

- ORCID do autor: https://orcid.org/0000-0002-5801-6553 - Currículo Lattes do autor: http://lattes.cnpq.br/7400325972290477

(4)

________________________________________________________________ Prof. Dr. Luiz Henrique Antunes Rodrigues – Presidente e Orientador(a)

FEAGRI/UNICAMP

_________________________________________________________________ Prof. Dr. Romis Ribeiro de Faissol Attux – Membro Titular

FEEC/UNICAMP

_________________________________________________________________ Prof. Dr. Paulo César Sentelhas – Membro Titular

ESALQ/USP

A Ata da defesa com as respectivas assinaturas dos membros encontra-se no processo de vida acadêmica do discente.

(5)

measure. It is our light, not our darkness that most frightens us.

We ask ourselves Who am I to be brilliant, gorgeous, talented, fabulous? Actually, who are you not to be?

Our Deepest Fear (Poema de Marianne Williamson) Há alguns anos, desenvolver um projeto de pesquisa e participar de um programa de pós-graduação me parecia algo totalmente diferente do que eu almejava para minha vida e carreira. No fim, a decisão de sair do emprego e seguir esse novo caminho se tornou a mais assertiva que tomei até hoje. Ciência é fonte de inspiração e desenvolvimento em qualquer cultura ou país, e deve ser levada a sério como qualquer outra atividade profissional. Neste trabalho não foi diferente.

Agradeço a Deus, pois a fé inabalável Nele, me faz crer que um futuro brilhante está desenhado nos mais desafiadores caminhos que eu possa ou venha a escolher.

Lique, muito obrigado pela completa orientação. O aprendizado foi muito além da ciência. A ética e a integridade são valores que você fez questão de mostrar que são a raiz para tudo, inclusive para a prática científica.

Aos meus pais o meu mais profundo agradecimento, por me apoiarem na decisão de mudar de carreira e iniciar essa jornada. O fato de vocês sempre acreditarem em mim e nas minhas decisões me dá mais segurança dia após dia.

Felipe, sou grato a você pela paciência para me ensinar do zero, junto com o Lique, aquilo que hoje se tornou a minha profissão.

Matheus, me sinto lisonjeado por ter a sua amizade e agradecido pelas infindáveis conversas e sonhos construídos. Sua irreverência e sabedoria são coisas que pretendo carregar comigo para o resto da vida.

Monique, obrigado pelos ensinamentos e detalhadas revisões feitas ao longo desse período. Agradeço à Feagri por ser a instituição que me abriga desde 2009. Muito do que sou hoje nasceu e se desenvolveu dento da Unicamp e da Feagri. Foram diversos os momentos de aprendizado e de construção de amizades.

Agradeço à professora Thais pela troca de conhecimento ao longo do processo de pesquisa. Adicionalmente, agradeço à professora e à Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) pela concessão dos dados (processon° 2013/11953-9) .

Àquela que começou essa jornada sendo minha namorada e hoje é minha esposa, meu muito obrigado. Que entendeu que teria menos tempo comigo em alguns momentos, que me deu suporte e carinho quando eu mais precisava e que me ajudou na decisão inicial de começar um mestrado. Tata seu amor é parte fundamental da minha vida. Espero poder estar do seu lado assim como você esteve e está sempre ao meu.

(6)

população diverge da escassez, cada vez maior, de recursos naturais. As técnicas e sistemas de cultivo protegido podem ser uma alternativa vantajosa para aumentar a produtividade de culturas variadas, de forma sustentável, além de propiciar o desenvolvimento dessas fora das épocas normais de cultivo. A variabilidade de variáveis ambientais no interior de casas de vegetação ocorre tanto horizontalmente quanto verticalmente e, em alguns casos, o gradiente interno das variáveis meteorológicas pode ser similar à diferença encontrada entre os ambientes interno e externo. A ocorrência de gradientes microclimáticos no interior das casas de vegetação pode causar diferenças na produtividade e nas características das plantas dentro de um mesmo ambiente de cultivo protegido, assim como pode promover o desenvolvimento de doenças. Apesar disso, a maioria dos trabalhos envolvendo modelagem e predição da temperatura e da umidade relativa do ar no interior da casa de vegetação, as considera espacialmente homogêneas. Há uma lacuna, portanto, na modelagem das variáveis meteorológicas no interior desses ambientes, levando em conta a variabilidade espacial existente. O uso de técnicas de aprendizado de máquina propicia a criação de modelos mesmo quando as interações das variáveis envolvidas nos processos são desconhecidas. Estas técnicas possibilitam, ainda, resolver problemas lineares ou não lineares com múltiplas variáveis e podem ser utilizadas no processamento de pequenas ou grandes amostras de dados. Sua aplicação torna-se plausível, portanto, para resolução de problemas que envolvam dados meteorológicos, coletados de forma espacializada, para modelagem do microclima interno de casas de vegetação. Nesta perspectiva, o objetivo principal deste estudo é o desenvolvimento de modelos, utilizando técnicas de aprendizado de máquina, capazes de capturar a variabilidade espacial da temperatura e umidade relativa do ar no interior de uma casa de vegetação. Dente outras fontes de dados, dados de temperatura e umidade relativa do ar, coletados de forma especializada por 45 sensores no interior da casa de vegetação, foram utilizados na modelagem. Desenvolveram-se modelos com o uso de técnicas de aprendizado de máquinas como máquinas de vetores-suporte, florestas aleatórias, boosted regression trees e redes neurais recorrentes. Os resultados encontrados mostram boa capacidade dos modelos em prever ou modelar temperatura e umidade relativa do ar no interior da casa de vegetação considerando a variabilidade interna existente.

Palavras-chave: Casas de vegetação; Modelagem; Predição; Variabilidade espacial; Aprendizado de máquina

(7)

from the increasing scarcity of natural resources. Protected cultivation techniques and systems may be an advantageous alternative for sustainably increasing yields of a variety of crops, in addition to promoting the development of crops out of the regular seasons of cultivation. The variability of environmental variables inside greenhouse occurs both horizontally and vertically and, in some cases, the internal gradient of microclimate variables may be similar to the difference found between indoor and outdoor environments. The occurrence of microclimatic gradients can cause differences in plant’s yield and characteristics within the same protected environment, as well as may promote the development of diseases. Despite this, most of the researches involving modeling and prediction of internal air temperature and relative humidity consider them to be spatially homogeneous. There is a gap, therefore, in the modeling of microclimatic variables within these environments considering the spatial variability that occurs. The use of machine learning techniques allows the creation of models even when the interactions of all variables involved in the processes are unknown. These techniques also make it possible to solve linear or non-linear problems with multiple variables and can be used in the processing of small or large data samples. Its application becomes feasible, therefore, for solving problems involving meteorological data, collected in a spatial way, for modeling the internal microclimate of greenhouse. In this perspective, the main objective of this study is the development of models, using machine learning techniques, capable of capturing the spatial variability of air temperature and relative humidity inside a greenhouse. Among other data sources, air temperature and relative humidity data, collected from 45 sensors inside the greenhouse, were used for modeling. Models were developed using machine learning techniques such as support vector machines, random forests, boosted regression trees and recurrent neural networks. The results show good models’ ability to predict or model air temperature and relative humidity inside the greenhouse considering the existing internal variability.

(8)

classificação. 22 Figura 2. Ilustração de uma Floresta Aleatória construída com três árvores de decisão (M1, M2 e M3). Em cada uma das árvores são destacadas, em negrito, as “rotas” de decisão para o

registro exemplificado. 27

Figura 3. Rede neural do tipo feed-forward multilayer totalmente conectada. 28 Figura 4. Rede neural com conexões recorrentes entre unidades ocultas. a) Visão compactada e simplificada das conexões recorrentes. b) Visão das camadas “desenroladas” ao longo do tempo

e gerando uma única saída. 33

Figura 5. Esquema de posicionamento dos sensores. 35

Figura 6. Composição do conjunto de atributos preditores para a primeira estratégia de análise. 37 Figura 7. Framework para criação de modelo na implementação da primeira estratégia de

análise. 38

Figura 8. Composição do conjunto de atributos preditores para a segunda estratégia de análise. 39 Figura 9. Procedimento de montagem das configurações de atributos preditores. 40 Figura 10. Framework para criação de modelo na implementação da segunda estratégia de

análise. 41

Figura 11. Temperatura do ar no interior da casa de vegetação, considerando dados reais e preditos dos quatro cenários compostos, para os modelos implementados com uso de Boosted

Regression Trees. 47

Figura 12. Temperatura do ar no interior da casa de vegetação, considerando dados reais e preditos dos quatro cenários compostos, para os modelos implementados com uso de Florestas

Aleatórias. 47

Figura 13. Temperatura do ar no interior da casa de vegetação, considerando dados reais e preditos dos quatro cenários compostos, para os modelos implementados com uso de Máquinas

de Vetores-Suporte. 48

Figura 14. Variação do coeficiente de variação da temperatura do ar no interior da casa de vegetação ao longo do tempo para os quatro cenários compostos. 50 Figura 15. Curvas REC dos modelos obtidos a partir das técnicas implementadas para os 4 cenários compostos, quando a variável meta era a temperatura do ar interno à casa de vegetação. a) Cenário 1c. b) Cenário 2c. c) Cenário 3c. d) Cenário 4c. 52 Figura 16. Umidade relativa do ar no interior da casa de vegetação, considerando dados reais e preditos dos quatro cenários compostos, para os modelos implementados com uso de Boosted

Regression Trees. 53

Figura 17. Umidade relativa do ar no interior da casa de vegetação, considerando dados reais e preditos dos quatro cenários compostos, para os modelos implementados com uso de Florestas

Aleatórias. 54

Figura 18. Umidade relativa do ar no interior da casa de vegetação, considerando dados reais e preditos dos quatro cenários compostos, para os modelos implementados com uso de Máquinas

(9)

Figura 20. Curvas REC dos modelos obtidos a partir das técnicas implementadas para os 4 cenários compostos, quando a variável meta era a umidade relativa do ar interno à casa de vegetação. a) Cenário 1c. b) Cenário 2c. c) Cenário 3c. d) Cenário 4c. 57 Figura 21. MAE (°C) em função do intervalo de tempo entre os dados reais e o momento predito para os modelos obtidos com o emprego das três técnicas utilizadas. 61 Figura 22. MAE (%) em função do intervalo de tempo entre os dados reais e o momento predito para os modelos obtidos com o emprego das três técnicas utilizadas. 64

(10)

de dados. 36 Tabela 2. Composição dos conjuntos de treino e teste para execução da descrição do microclima

a partir de diferentes configurações estruturais. 37

Tabela 3. Datas de coletas dos dados que compõem os conjuntos de treino e teste para predição do microclima a partir das condições internas anteriores. 41 Tabela 4. Intervalo de valores para os parâmetros (destaque para a nomenclatura nos pacotes e softwares utilizados) de cada uma das técnicas implementadas para caracterização do microclima interno das casas de vegetação (primeira estratégia de análise). 42 Tabela 5. Intervalo de valores para os parâmetros (destaque para a nomenclatura nos pacotes e softwares utilizados) de cada uma das técnicas implementadas para predição do microclima das

casas de vegetação (segunda estratégia de análise). 44

Tabela 6. Erro absoluto médio (mean absolute error, MAE) e desvio padrão (σ) dos erros absolutos para os modelos obtidos com as técnicas empregadas e os dados dos 4 cenários compostos, considerando-se a temperatura interna do ar como atributo meta. 51 Tabela 7. Erro absoluto médio (mean absolute error, MAE) e desvio padrão (σ) dos erros absolutos para os modelos obtidos com as técnicas empregadas e os dados dos 4 cenários compostos, considerando-se a umidade relativa interna do ar como atributo meta. 56 Tabela 8. Erro absoluto médio (°C) dos modelos obtidos com as técnicas empregadas para predição da temperatura interna do ar, nos intervalos de tempo estudados, considerando dados

dos 4 cenários de análise. 59

Tabela 9. Erro absoluto médio (%) dos modelos obtidos com as técnicas empregadas para predição da umidade relativa interna do ar, nos intervalos de tempo estudados, considerando

dados dos 4 cenários de análise. 62

Tabela 10. Hiperparâmetros ótimos, determinados na busca aleatória, para cada uma das técnicas empregadas e todos os cenários compostos de análise, estruturados na primeira

estratégia de análise. 71

Tabela 11. Hiperparâmetros ótimos, determinados na busca aleatória, para cada uma das técnicas empregadas e todos os cenários de análise, estruturados na segunda estratégia de análise, considerando como atributo meta a temperatura interna do ar (°C). 72 Tabela 12. Hiperparâmetros ótimos, determinados na busca aleatória, para cada uma das técnicas empregadas e todos os cenários de análise, estruturados na segunda estratégia de análise, considerando como atributo meta a umidade relativa interna do ar (%). 73

(11)

2 Revisão bibliográfica 15 2.1 Temperatura e umidade relativa, por que as modelamos? 15

2.2 Aspectos inerentes aos atributos estruturais 16

2.2.1 Sistema de ventilação 16

2.2.2 Sistema de ventilação mecânica 17

2.2.3 Telas antiafídeos 17

2.2.4 Material de cobertura 17

2.2.5 Sistema de resfriamento evaporativo 18

2.3 Modelagem do microclima interno de casas de vegetação 18

2.4 Técnicas de aprendizado de máquina 20

2.4.1 Máquinas de Vetores-Suporte 21

2.4.2 Árvores de decisão 23

2.4.3 Melhora na performance de modelos – métodos ensemble 24

2.4.3.1 Boosting 25

2.4.3.2 Florestas Aleatórias 26

2.4.4 Redes Neurais Artificiais 28

2.4.4.1 Redes Neurais Recorrentes 31

3 Material e métodos 34

3.1 Características dos dados utilizados 34

3.2 Estratégias de modelagem 36

3.2.1 Descrição do microclima interno a partir de diferentes configurações de elementos

estruturais 36

3.2.2 Predição do microclima a partir das condições climáticas anteriores 38

3.3 Modelagem e ajuste de parâmetros 41

3.3.1 Descrição do microclima interno a partir de diferentes configurações de elementos

estruturais 41

3.3.2 Predição do microclima a partir das condições climáticas anteriores 43

3.4 Métricas de avaliação dos modelos 45

4 Resultados e discussão 46

4.1 Descrição do microclima interno a partir de diferentes configurações estruturais 46

4.1.1 Caracterização da temperatura 46

4.1.2 Caracterização da umidade relativa 53

4.2 Predição do microclima a partir das condições ambientais anteriores 58

4.2.1 Predição da temperatura 59

4.2.2 Predição da UR 62

5 Conclusão 65

6 Considerações adicionais 66

7 Referências bibliográficas 67

(12)

1 INTRODUÇÃO

A demanda por alimentos, fibras e energia é crescente em um cenário em que o crescimento da população diverge da escassez, cada vez maior, de recursos naturais. As técnicas e sistemas de cultivo protegido, aliados a tecnologias que priorizam o uso de recursos de acordo com as necessidades das plantas, tais como redes de sensores associadas a sistemas de controle, podem ser uma alternativa vantajosa para aumentar a produtividade de forma sustentável, além de propiciar o desenvolvimento das culturas fora das épocas normais de cultivo. Estas vantagens estão relacionadas, em sua maioria, ao possível controle das variáveis ambientais, particularmente ao se considerar a proteção provida pelas casas de vegetação, por exemplo, quando da ocorrência de mudanças climáticas, à melhor regulação de fatores de cultivo, como o suprimento de água, e à proteção provida contra pragas (GRUDA, 2005).

O uso de sensores nas casas de vegetação traz vantagens, segundo Balendonck et al. (2014), já que ambientes melhor monitorados propiciam um mapeamento efetivo da distribuição espacial de variáveis meteorológicas. Estas informações podem ser úteis para ajustes no funcionamento de sistemas de controle e, como consequência, possibilitam potencial economia de energia e obtenção de culturas mais homogêneas no interior do ambiente de cultivo.

A análise da distribuição espacial de variáveis meteorológicas no interior de casas de vegetação já foi alvo de diversas pesquisas (BOJACÁ; GIL; COOMAN, 2009; BALENDONCK et al., 2014; LÓPEZ-MARTÍNEZ et al., 2018). Como resultado encontraram-se variações instantâneas no interior da estrutura de até 5°C para temperatura e 20% para umidade relativa (UR) (BALENDONCK et al., 2014). Pôde-se observar, em alguns casos, que o gradiente horizontal de temperatura dentro da casa de vegetação pode ser tão alto quanto as diferenças de temperatura encontradas entre os ambientes interno e externo (BOJACÁ; GIL; COOMAN, 2009). Ademais, planos verticais também apresentam variação e os perfis de variação horizontal são diferentes, quando comparados planos a diferentes alturas (LÓPEZ-MARTÍNEZ et al., 2018).

A ocorrência de gradientes meteorológicos pode causar diferenças de produtividade e nas características das plantas dentro de um mesmo ambiente de cultivo protegido, assim como pode promover o desenvolvimento de doenças (FERENTINOS et al., 2017). Essa consequência está atrelada à influência direta de variáveis como UR e temperatura na produtividade dos vegetais (ADAMS; COCKSHULL; CAVE, 2001) e, como estas apresentam diferentes valores ao longo da extensão da casa de vegetação, isso acarreta diferentes valores

(13)

de produtividade; no âmbito do desenvolvimento de doenças, Jewett e Jarvis (2001) destacam, por exemplo, o efeito de altas e baixas temperaturas no desenvolvimento de doenças e na criação de um ambiente propício para o aparecimento de pragas.

Apesar da variabilidade no microclima e de seus efeitos, a maioria dos estudos que dizem respeito ao ambiente interno de casas de vegetação, os considera uniforme (FRAUSTO; PIETERS; DELTOUR, 2003; DARIOUCHY et al., 2009; VANTHOOR et al., 2011; YU et al., 2016). A coleta de dados para realização dos estudos em casas de vegetação, segue, em geral, a mesma linha e não leva em conta a variabilidade interna. Os atributos são medidos por um ou poucos sensores, alocados no centro geométrico do ambiente (DARIOUCHY et al., 2009; YU et al., 2016). Em trabalhos nos quais o objetivo é modelar o comportamento das variáveis climáticas no interior destes ambientes, geralmente não efetuam-se predições dos parâmetros ambientais, UR e temperatura, levando em conta sua distribuição espacial (FRAUSTO; PIETERS; DELTOUR, 2003; DARIOUCHY et al., 2009; VANTHOOR et al., 2011; YU et al., 2016; SINGH; TIWARI, 2017).

Percebe-se, portanto, que existe variabilidade das condições meteorológicas no interior da casa de vegetação e esta deve ser considerada na modelagem do ambiente. Complementarmente, entendendo que as condições internas são função, dentre outros fatores, do ambiente externo e da configuração de elementos estruturais da casa de vegetação, é razoável considerarmos estas variáveis para modelar a heterogeneidade interna destes sistemas de cultivo.

A modelagem e/ou predição das variáveis ambientais internas à casa de vegetação já foi alvo de estudos que utilizaram diferentes estratégias metodológicas. Tanto modelos físicos, estruturados a partir de equações diferenciais e diagramas de blocos (VANTHOOR et al., 2011), quanto modelos obtidos com técnicas de aprendizado de máquina (DARIOUCHY et al., 2009; YU et al., 2016; SINGH; TIWARI, 2017) foram utilizados para esta tarefa. A performance nestes estudos, quando considerados cenários uniformes para modelagem, ou seja, cenários nos quais a UR e temperatura internas foram consideradas semelhantes em toda a extensão da casa de vegetação, foi satisfatória e os valores reais e preditos apresentaram-se comparativamente próximos.

O uso de técnicas de aprendizado de máquinas propicia a criação de modelos mesmo quando as interações físicas das variáveis envolvidas nos processos são desconhecidas. Estas técnicas possibilitam, ainda, resolver problemas lineares ou não lineares com múltiplas variáveis e podem ser utilizadas no processamento de pequenas ou grandes amostras de dados

(14)

(YU et al., 2016). Torna-se, nesse sentido, plausível sua aplicação para resolução de problemas que envolvam dados coletados de forma espacializada dentro das casas de vegetação.

Sendo assim, este projeto busca responder à seguinte pergunta: é possível utilizar técnicas de aprendizado de máquinas para modelar o ambiente interno das casas de vegetação, levando em consideração a variabilidade espacial dos fatores ambientais ?

O objetivo principal neste trabalho é, buscando a resposta para este problema, desenvolver modelos, utilizando técnicas de aprendizado de máquina, que contemplem a variabilidade espacial dos parâmetros ambientais nas casas de vegetação e sejam capazes de:

1) Descrever o microclima interno (temperatura e umidade relativa do ar) de casas de vegetação com base em dados constitutivos e dos ambientes interno e externo, obtidos para diferentes configurações estruturais de casas de vegetação, instaladas em diferentes períodos do ano;

2) Predizer o microclima de casas de vegetação utilizando como atributos preditores as condições ambientais internas e externas anteriores ao momento de predição.

Na busca por elucidar todo o caminho percorrido para atingir os objetivos definidos, na próxima seção será apresentada uma visão geral sobre o microclima das casas de vegetação - desde a importância da modelagem, a interferência dos aspectos estruturais e a variabilidade climática -, e uma perspectiva geral das técnicas de aprendizado de máquina utilizadas. Espera-se justificar de forma clara a escolha do tema e criar baEspera-ses para entendimento dos aspectos metodológicos, assim como dos resultados e discussões que são, respectivamente, a terceira e quarta seções desta dissertação.

Apesar do conhecimento da existência do termo micrometeorologia, optou-se, nesse trabalho, pelo uso recorrente e geral do termo microclima como forma a referir-se ao conjunto local de condições atmosféricas no interior de casas de vegetação, mesmo que em um período curto de tempo, como tradução direta do termo em inglês microclimate e em alinhamento ao uso em outros trabalhos da bibliografia nacional (SCARANARI; LEAL; PELLEGRINO, 2008; ARAQUAM, 2013; FERRARI, 2013).

(15)

2 REVISÃO BIBLIOGRÁFICA

2.1 Temperatura e umidade relativa, por que as modelamos?

A temperatura e a UR do ar estão entre as variáveis mais importantes para formação do microclima interno das casas de vegetação. Microclima este que é o resultado de um mecanismo complexo envolvendo processos de troca de calor e massa (BAPTISTA, 2007).

A temperatura afeta as reações químicas e propriedades físicas dos vegetais. É uma variável afetada pela intensidade luminosa e, em menor magnitude, pela concentração de CO2

(GRUDA, 2005). Dentro da casa de vegetação, os fatores que mais influenciam a temperatura incluem a temperatura exterior, umidade do ar, radiação solar, temperatura do solo, velocidade do vento e umidade do solo (YU et al., 2016). Adicionalmente a esses fatores Katsoulas e Kittas (2008) destacam que a transmissão de luz pelo material de cobertura também afeta a temperatura e umidade relativa do ar e a temperatura nas folhas das plantas.

A temperatura tem relação direta com a taxa de crescimento e a produtividade de cultivares. No caso do tomate, por exemplo, confome apontado por Adams, Cockshull e Cave (2001) quando aumentada a temperatura de 14°C para 22°C há um aumento na taxa de crescimento absoluta. Esta tendência de aumento, entretanto, não ocorre quando a temperatura atinge 26°C. Segundo os mesmos autores, a produtividade para o tomate segue tendência parecida, sendo maior quando a temperatura do ambiente é de 18°C e 22°C e menor quando o ambiente apresenta 14°C e 26°C de temperatura.

A umidade relativa é outra variável ambiental de extrema importância para as culturas. Ela influencia o status hídrico das culturas dentro de uma casa de vegetação e afeta todos os processos associados à transpiração. A UR está relacionada majoritariamente à qualidade dos vegetais e tem pouca influencia direta sob a produtividade (HAND, 1988; GRUDA, 2005; DORAIS; PAPADOPOULOS; GOSSELIN, 2010). Indiretamente, entretanto, a produtividade é afetada pelo desenvolvimento de doenças em ambientes com altos valores de umidade. Ambientes com esta característica acarretam condensação na superfície das plantas e, consequentemente, aumentam o desenvolvimento e proliferação de fungos patogênicos (KITTAS; BARTZANAS, 2007). Do ponto de vista econômico, a UR é a variável ambiental mais difícil de controlar, especialmente em locais onde os custos com aquecimento são altos (GRUDA, 2005).

Entendendo a influência destas variáveis no desenvolvimento das culturas é que conseguimos justificar o interesse pela modelagem dessas variáveis. Há interesse de muitos agricultores na predição de produtividade, na melhoria de qualidade e na possibilidade de

(16)

compatibilizar os períodos de colheita às demandas dos consumidores (ADAMS; COCKSHULL; CAVE, 2001). Entender e predizer as variáveis independentes neste processo (temperatura e umidade relativa) é passo substancial para indiretamente entendermos as variáveis dependentes (qualidade e produtividade).

2.2 Aspectos inerentes aos atributos estruturais

Casas de vegetação têm diferentes dimensões, são constituídas por materiais diversos e podem estar instaladas em locais com características variadas. As diferenças estruturais encontradas nestas instalações são devidas, principalmente, a condições locais, como clima, aspectos sociais, além de legislação e disponibilidade de recursos (VANTHOOR et al., 2011). Estas estruturas são usualmente cobertas por materiais (por exemplo, vidro ou plástico) que têm a habilidade de transmitir luz, que por sua vez fornece a energia essencial para o crescimento e produção das plantas (AL-HELAL; ALHAMDAN, 2009). Além de transmissão de energia, os materiais de revestimento podem ter outras finalidades, como sombreamento ou exclusão de insetos do ambiente. Sistemas de ventilação e resfriamento evaporativo são também elementos constitutivos frequentemente encontrados na estruturação de casas de vegetação.

Nos próximos parágrafos desta subseção, o objetivo é elucidar os papéis de alguns dos principais elementos constitutivos das casas de vegetação, assim como, mostrar os efeitos destes componentes no microclima interno destas estruturas.

2.2.1 Sistema de ventilação

A ventilação em uma casa de vegetação provê a troca de ar entre o interior e o exterior para: (1) dissipar o excesso de calor; (2) aumentar a troca de dióxido de carbono e oxigênio; e (3) manter níveis de umidade aceitáveis (BARTZANAS; BOULARD; KITTAS, 2004).

A infraestrutura de ventilação é, portanto, aspecto estrutural que afeta diretamente as variáveis meteorológicas no interior das casas de vegetação. O dimensionamento desses sistemas depende, dentre outras variáveis, da distribuição de calor no interior do ambiente (SONI; SALOKHE; TANTAU, 2005). Kittas e Bartzanas (2007) afirmam que na região Mediterrânea, por exemplo, o sistema de ventilação natural é o mais utilizado para controle do microclima interno das casas de vegetação. Os autores ressaltam que durante o verão a ventilação é utilizada para aumento da UR do ar, enquanto no inverno, o efeito é contrário e a ventilação propicia redução nos valores desta variável microclimática.

(17)

2.2.2 Sistema de ventilação mecânica

A mistura perfeita de ar na casa de vegetação é uma excelente ferramenta para reduzir a heterogeneidade do microclima interno. Ventiladores de mistura de ar e tubos perfurados são utilizados principalmente com este propósito (BARTZANAS et al., 2012).

Segundo Bartzanas et al. (2012), em casas de vegetação com sistema de aquecimento, o uso de sistema de ventilação mecânica propicia homogeneização na distribuição de temperatura e UR do ar. Além de melhorar a distribuição horizontal de temperatura e UR do ar, o sistema de ventilação mecânica tende a aproximar a temperatura e a umidade relativa do ar interno com o externo , mas com maior gradiente vertical de distribuição desses elementos (ZORZETO, 2015).

A associação da janela zenital ao conjunto de ventilação mecânica eleva as diferenças entre os ambientes interno e externo, pela possibilidade de movimentação do ar contrária à ventilação natural. Com isso, as distribuições horizontais homogêneas dos elementos nas alturas mais baixas se mantêm. A entrada do ar quente externo pela janela zenital torna heterogênea a distribuição horizontal na altura próxima à cobertura, mas reduz os gradientes verticais de temperatura e umidade relativa do ar (ZORZETO, 2015).

2.2.3 Telas antiafídeos

Outro elemento estrutural que afeta as características meteorológicas no interior da casa de vegetação são as telas antiafídeos. Quando instaladas nas aberturas laterais da casa de vegetação, estas telas atuam como barreira mecânica à entrada de insetos, implicando também em alterações na velocidade do vento, temperatura e UR do ar no interior das casas de vegetação (TEITEL, 2007).

2.2.4 Material de cobertura

A cobertura plástica afeta as variáveis meteorológicas das casas de vegetação de diferentes formas, dependendo da sua composição. No caso de Alsadon et al. (2016), a instalação de cobertura plástica com característica refletiva na casa de vegetação manteve a temperatura interna média menor do que a temperatura externa média, durante os períodos vegetativo, de florescimento e de frutificação do pepino. De forma contrária, Al-Helal e Alhamdan (2009) observaram que o recobrimento plástico de polietileno fez com que a temperatura interna fosse maior que a externa durante todo o período diurno observado. Isso ocorreu devido à conversão de radiação solar em energia térmica no interior da estrutura.

(18)

2.2.5 Sistema de resfriamento evaporativo

O sistema de resfriamento evaporativo é um sistema que, quando instalado nas casas de vegetação, pode ser utilizado para controle de temperatura e UR em níveis desejados mesmo para regiões onde os verões apresentam temperaturas bastante elevadas. Uma situação que emerge do uso deste tipo de sistema é a ocorrência de gradientes de temperatura no interior do ambiente de cultivo. Neste caso, à medida que nos afastamos do meio poroso, os valores de temperatura tendem a aumentar (OZ et al., 2009). Em estudo com utilização de rede de sensores, Oz et al. (2009) observaram que em determinado momento do dia, quando a temperatura externa medida era de 35 °C, a temperatura em frente aos exaustores era de 27°C, indicando uma variação de 8°C. Já no centro do ambiente a temperatura era de 28° C e em frente ao meio poroso era de 22°C.

2.3 Modelagem do microclima interno de casas de vegetação

Os modelos criados para descrição das variáveis microclimáticas das casas de vegetação são obtidos por meio da aplicação de diversas técnicas de modelagem. Vanthoor et al. (2011) destacam que modelos para caracterização microclimática de casas de vegetação receberam grande atenção nas últimas décadas e muitos trabalhos foram dirigidos à obtenção destes modelos. Os autores ressaltam, porém, que estes trabalhos focaram suas análises em uma única localização para a casa de vegetação, assim como em um conjunto específico de elementos constitutivos.

De maneira geral, os modelos para predição de temperatura e umidade relativa, orientados ao controle do ambiente das casas de vegetação, podem ser divididos em dois grupos: o primeiro constituído por modelos físicos e o segundo composto por modelos do tipo “caixa preta”, baseados em tecnologia computacional moderna (HE; MA, 2010; YU et al., 2016). Os modelos físicos surgem como representação de um fenômeno físico e, geralmente, têm alto grau de complexidade com muitos parâmetros que precisam ser determinados. Muitas vezes, é uma tarefa difícil medir ou obter os parâmetros dos submodelos. Ao contrário dos modelos físicos, os modelos do tipo “caixa preta” não precisam determinar todos os valores de parâmetros do sistema estudado, nem é preciso, necessariamente, ter conhecimento prévio das interação físicas e químicas no ambiente de estudo (HE; MA, 2010; YU et al., 2016). Nestes últimos busca-se extrair inteligência a partir da interação das variáveis disponíveis ou escolhidas.

(19)

Como exemplo de aplicação de modelo físico podemos citar o trabalho de Vanthoor et al. (2011). Neste trabalho, os autores estruturaram um modelo, capaz de predizer o microclima interno da casa de vegetação para uma variedade de configurações de elementos constitutivos, expostos a variadas condições meteorológicas com base em equações diferenciais e modelagem por blocos. O modelo desenvolvido foi validado em quatro casas de vegetação localizadas em três regiões climáticas: clima marinho temperado, noroeste da Holanda; clima mediterrâneo, Sicília, Itália; e clima semiárido, Texas e Arizona, EUA. Os resultados encontrados, segundo os autores, possibilitam o auxílio nos projetos de casas de vegetação em escala global.

No trabalho de Frausto, Pieters e Deltour (2003) foi utilizada outra vertente de métodos, e modelos autoregressivos foram construídos para descrever a temperatura interna da casa de vegetação. Na análise destes autores, apenas variáveis meteorológicas externas à casa de vegetação (temperatura do ar, umidade relativa, radiação solar global e nebulosidade, que corresponde à fração do céu obscurecida por nuvens) foram tidas como atributos preditores. O resultado deste trabalho foi a criação de modelos sazonais, que levavam em conta diferentes períodos do ano como base para construção e ajuste dos modelos. De maneira geral, as estruturas dos modelos individuais não diferiram entre si, e os valores de erro encontrados possibilitaram assegurar a capacidade de cada modelo de descrever a variação do microclima no interior da casa de vegetação no período de análise. Nenhum dos modelos, entretanto, poderia ser utilizado para modelar a temperatura no interior da casa de vegetação ao longo do ano todo. Outro aspecto deficitário no tipo de modelo implementado é a falta de ajuste durante a utilização de sistemas de ventilação. Segundo os autores, esta característica está atrelada ao comportamento das variáveis modeladas, que durante a utilização de sistemas de controle, passa a ser não linear.

No trabalho de Yu et al. (2016), a abordagem foi com base em métodos caixa-preta. Os autores implementaram a técnica Least Square Support Vector Machine para predizer a temperatura interna de uma casa de vegetação para diferentes intervalos de tempo. Os atributos preditores considerados foram: umidade do ar, radiação solar, temperatura do solo, umidade do solo e velocidade do vento, assim como as temperaturas do ar anteriores ao momento de predição, coletadas no interior do ambiente, e a temperatura externa. A aplicação resultou em modelos de predição capazes de prever a temperatura interna com um intervalo de tempo de até 6 horas. A técnica mostrou resultados melhores do que as técnicas clássicas Máquina de

(20)

vetores-suporte (Support Vector Machine, SVM) e Redes Neurais Artificiais (Artificial Neural Networks, ANN), para este tipo de aplicação.

As ANNs também foram aplicadas para predição da temperatura interna na casa de vegetação. Dariouchy et al. (2009) utilizaram como atributos preditores variáveis meteorológicas externas à casa de vegetação (temperatura e umidade do ar, velocidade e direção do vento, radiação solar total e temperatura do solo) medidas durante aproximadamente 30 dias. Deste período, os dados referentes às coletas nas três primeiras semanas foram utilizados para treino do modelo. Os dados da última semana compuseram a fase de validação. Os autores encontraram alta correlação tanto para temperatura quanto para umidade quando comparadas as predições para estes atributos e os dados reais.

Um aspecto interessante de notar na perspectiva de previsão e descrição da variação microclimática no interior das casas de vegetação é a necessidade de se aproximar os objetivos de trabalhos científicos às aplicações e/ou necessidades de produtores. O trabalho desenvolvido por Yu et al. (2016) é exemplo claro de uma pesquisa que elencou benefícios práticos a partir do uso de modelos desenvolvidos. Os autores enfatizam, por exemplo, que no período de 6 horas, que obtiveram como intervalo máximo de predição, o agricultor é capaz de tomar uma ação suficientemente rápida para manutenção ou alteração de alguma variável meteorológica, tal como temperatura ou UR do ar, no interior da casa de vegetação.

2.4 Técnicas de aprendizado de máquina

As técnicas de aprendizado de máquina são divididas em técnicas de aprendizado supervisionado e técnicas de aprendizado não supervisionado. As técnicas de aprendizado supervisionado envolvem a construção de modelos para predizer ou estimar uma resposta ou atributo meta, com base em um ou mais atributos preditores. Nestes casos, para cada observação do espaço de atributos preditores xi, i = 1, ... , n há uma resposta associada yi. Muitas das técnicas

clássicas de aprendizado estatístico como a regressão linear e a regressão logística, assim como técnicas mais modernas como Boosting, Florestas Aleatórias (Random Forests, RF) e SVM operam no domínio do aprendizado supervisionado (JAMES et al., 2013).

Na aplicação de técnicas de aprendizado não supervisionado, por sua vez, utilizam-se inputs, mas não utilizam-se espera um output específico. Ou utilizam-seja, para cada obutilizam-servação i = 1, . . . , n, têm-se um vetor de medidas xi mas nenhum vetor yi, de respostas associado. Nestes casos,

(21)

Comumente, as técnicas de aprendizado supervisionado são aplicadas para resolução de tarefas de classificação ou regressão. A distinção entre estas tarefas está no fato de que para classificação as respostas ou alvos são qualitativos, enquanto para regressão as respostas são quantitativas e contínuas.

Neste trabalho, o enfoque de aplicação foram as técnicas de aprendizado supervisionado. Esta subseção tem, como consequência, enfoque em técnicas aplicadas para solução de problemas que recaem no campo do aprendizado supervisionado.

2.4.1 Máquinas de Vetores-Suporte

As SVM são classificadores que utilizam hiperplanos para separar observações de diferentes classes. A delimitação dos hiperplanos de classificação é dada pelos vetores suporte, “posicionados” no espaço amostral de tal forma que a margem de decisão (distância entre os vetores de suporte) seja máxima e não “invada” o espaço das classes de observação (margens rígidas).

Na Figura 1, ilustra-se uma SVM com margens rígidas, com destaque para dois pontos, 𝑥1 e 𝑥2, que estão sobre os vetores suporte. Dado que 𝑥1 é um ponto sobre 𝑤. 𝑥 + 𝑏 = +1, 𝑥2 um ponto sobre 𝑤. 𝑥 + 𝑏 = −1 e que, 𝑥1 intercepta a reta perpendicular a 𝑥2, tem-se que a distância entre os vetores suporte é igual a ‖𝑤‖2 , conforme elucidado na nota da Figura 1.

(22)

Figura 1. Máquina de Vetores-Suporte e seus hiperplanos de separação em um problema de classificação.

Fonte: Adaptado de Hearst et al. (1998) e Lorena e Carvalho (2003).

Uma melhora na estruturação das SVM é a implementação das margens suaves, que permitem a “invasão” dos vetores no espaço de classificação, atribuindo um custo para este tipo de ocorrência (erro de classificação). Neste caso o que se busca é a maximização das margens, com minimização dos erros, mesmo que restrições sejam ultrapassadas.

As SVM podem ser representadas pela Equação 1, na qual S são os índices dos pontos que são os vetores suporte (JAMES et al., 2013).

𝑓(𝑥) = 𝛽0+ ∑ 𝛼𝑖⟨𝑥, 𝑥𝑖⟩ 𝑖𝜖𝑆

Equação 1

O termo ⟨𝑥, 𝑥𝑖⟩, denota o produto interno entre dois vetores e pode ser apresentado de forma generalizada como sendo 𝐾(𝑥𝑖, 𝑥𝑖′𝑗). 𝐾 é denominada como função kernel. Esta função quantifica a similaridade de duas observações e, em problemas com fronteira linear de separação para as classes de observações, a função 𝐾 assume a forma da Equação 2 (JAMES et al., 2013).

(23)

𝐾(𝑥𝑖, 𝑥𝑖′𝑗) = ∑ 𝑥𝑖𝑗𝑥𝑖′𝑗 𝑝

𝑗=1

Equação 2

As SVM também podem ser aplicadas para classificação em casos de fronteiras não lineares de separação. Nestes casos são utilizadas outras formas de kernel, não lineares. Uma forma comum assumida por kernels não lineares é a representada na Equação 3 (JAMES et al., 2013). Este tipo de kernel é denominado kernel radial ou gaussiano.

𝐾(𝑥𝑖, 𝑥𝑖′𝑗) = exp (−𝛾 ∑(𝑥𝑖𝑗− 𝑥𝑖𝑗)

2 𝑝

𝑗=1

) Equação 3

De forma resumida, o que a utilização de kernels não lineares propicia é o mapeamento do espaço amostral original em um outro espaço amostral ampliado, com mais dimensões, no qual haja uma fronteira de decisão linear para as classes, com máxima distância entre margens.

As SVM também podem ser aplicadas em tarefas de regressão e, neste caso são chamadas de Support Vector Regression (SVR). O princípio é similar ao utilizado nas SVM, ou seja, dada a distância entre os dois vetores suporte como sendo ‖𝑤‖2 o objetivo principal é minimizar ‖𝑤‖. O conjunto de restrições para as SVR, entretanto, é diferente do utilizado em tarefas de classificação, e está exposto na Equação 4.

{𝑦𝑖 − 〈𝑤, 𝑥𝑖〉 + 𝑏 ≤ ɛ

〈𝑤, 𝑥𝑖〉 + 𝑏 − 𝑦𝑖 ≤ ɛ Equação 4

De forma resumida, na aplicação de SVR busca-se por uma função 𝑓(𝑥) tal que o desvio máximo dos valores reais 𝑦𝑖 não exceda ɛ para os dados de treino (SMOLA; SCHÖLKOPF, 2004).

2.4.2 Árvores de decisão

As árvores de decisão constituem outra técnica de aprendizado de máquina que pode ser aplicada tanto para resolução de tarefas de classificação, quanto para regressão. Quando aplicadas para classificação são comumente denominadas árvores de classificação;

(24)

possuem primariamente três tipos de nós que a compõem: nó raiz, nós internos e nós-folha ou terminais.

Segundo Loh (2011), o primeiro algoritmo para indução de árvores de decisão foi o THAID. Neste algoritmo, dados os valores observados para as Y classes do conjunto de treino e os p atributos preditores, X1, . . . , Xp e, empregando uma medida de impureza do nó com base

na distribuição dos valores de Y observados no nó, divide-se um nó de forma exaustiva procurando todos os X e S para a divisão {X ∈ S} que minimiza a impureza total de seus dois nós filho. O pseudocódigo para execução dos passos básicos na construção de árvores por busca exaustiva é apresentado no Quadro 1.

Uma árvore de regressão é semelhante a uma árvore de classificação, exceto que para este tipo de árvore o atributo meta Y possui valores contínuos e os valores preditos ŷ para cada nó correspondem a 1

𝑐∑ 𝑦𝑖

𝑐

𝑖=1 (o valor médio das variáveis dependentes para o nó-folha)

(LOH, 2011)

1. Comece no nó da raiz;

2. Para cada X, encontre o conjunto S que minimiza a soma das impurezas do nó nos dois nós filhos e escolha a divisão {X * ∈ S *} que proporciona os menores X e S;

3. Se um critério de parada for atingido, pare as iterações. Do contrário, aplique o passo 2 para cada nó filho na iteração;

Quadro 1. Pseudocódigo para construção de árvore por busca exaustiva. Fonte: Adaptado de Loh (2011).

2.4.3 Melhora na performance de modelos – métodos ensemble

Umas das maneiras de melhorar a performance de modelos obtidos a partir de técnicas de aprendizado de máquinas é a aplicação dos chamados métodos ensemble. Resumidamente, neste tipo de método, realiza-se a combinação de uma série de modelos aprendidos com o objetivo de criar um modelo composto, com melhor performance. Bagging,

(25)

2.4.3.1 Boosting

Boosting é um procedimento iterativo utilizado para alternar a distribuição de

registros de treinamento. Este método pode ser utilizado junto de variadas técnicas de aprendizado de máquina, como por exemplo as árvores de regressão, constituindo, neste caso, as denominadas Boosted Regression Trees (BRT).

De maneira geral, neste método, todos os 𝑁 registros de uma base de dados 𝐷 recebem inicialmente um peso semelhante 1/𝑁, de modo que tenham a mesma probabilidade de serem escolhidos para treinamento. A seguir, um classificador ou um modelo de regressão é induzido para realização da tarefa alvo. Os pesos dos registros são atualizados ao final de cada rodada de Boosting. Registros ou exemplos que tenham sido classificados erroneamente ou, no caso de regressão, que tenham apresentado um valor de erro maior que um determinado critério, receberão pesos maiores. Caso contrário, os pesos serão menores. Com isto força-se o enfoque, na próxima rodada de Boosting, nos exemplos com maior peso e que, por consequência, os modelos base tiveram mais dificuldade para acertar (TAN; STEINBACH; KUMAR, 2009).

Um dos algoritmos mais conhecidos para implementação do método Boosting é o AdaBoost, inicialmente proposto para resolução de tarefas de classificação. Há, entretanto, novas adaptações do algoritmo para emprego em tarefas de regressão, conforme ilustrado no pseudocódigo do Quadro 2.

(26)

1. Entradas:

• Sequência de m registros (x1, y1), . . . , (xm, ym) em que 𝑥 e y ∈ R;

• Modelo M;

• Número de iterações T (número inteiro);

• Valor meta ∅ para demarcar as predições corretas e incorretas;

2. Inicialize:

• Iteração 𝑡 = 1;

• Distribuição 𝐷𝑡(𝑖) = 1/𝑚 para todos as instâncias 𝑖; • Erro ɛt;

3. Itere:

• Enquanto t ≤ T;

• Chamar o modelo de aprendizagem M, atribuindo a distribuição 𝐷𝑡; • Construir o modelo de regressão: ft(x) → y;

• Calcular o erro para ft(x):

ɛt = ∑ 𝐷𝑡(𝑖), em que 𝑖: |𝑓𝑡(𝑥𝑖)−𝑦𝑖𝑦𝑖 | > ∅; • Estabelecer βt = ɛ𝑡2; • Atualizar a distribuição Dt: Dt+1(𝑖) = 𝐷𝑡(𝑖) 𝑍𝑡 × { 𝛽𝑡 𝑠𝑒 |𝑓𝑡(𝑥𝑖)−𝑦𝑖 𝑦𝑖 | <= ∅; 1 caso contrário

em que Zt é um fator de normalização escolhido de tal forma que Dt+1 seja uma distribuição 4. Gere a função final

ffin (𝑥) = ∑ 𝑙𝑜𝑔 (1 𝛽𝑡) 𝑓𝑡(𝑥)/ ∑ 𝑙𝑜𝑔 ( 1 𝛽𝑡) 𝑡 𝑡

Quadro 2. Pseudocódigo do algoritmo AdaBoost.RT.

Fonte: Adaptado de Solomatine e Shrestha (2004).

2.4.3.2 Florestas Aleatórias

No procedimento de construção das RF, um determinado número (k) de árvores de decisão é induzido. De maneira geral, cada uma dessas árvores é gerada utilizando uma seleção aleatória tanto dos registros utilizados para treinamento, quanto dos atributos que participarão da divisão em cada um dos nós.

Em uma tarefa de classificação, um determinado registro é classificado pela RF como sendo da classe majoritária “votada” pelas árvores induzidas no processo de construção do modelo. Já para resolução de tarefas de regressão, ao invés de votar pela classe mais popular,

(27)

o valor predito para um dado registro é comumente considerado como sendo o valor médio das predições realizadas para este registro pelas k árvores induzidas. Diferentemente do que ocorre no processo de Boosting, as árvores da floresta aleatória são modelos independentes e não consideram o resultado das outras árvores no processo de indução.

Na Figura 2, ilustra-se uma RF construída a partir de três árvores de decisão (M1, M2 e M3). Na ilustração, exemplifica-se a aplicação de uma RF tanto em uma tarefa de classificação, quanto em uma tarefa de regressão. O registro no topo da figura é classificado como sendo da classe B, já que essa foi a classe majoritária designada pelas árvores. No caso da tarefa de regressão, o valor predito para o registro genérico é igual a 8, representando a média das predições de cada árvore componente da floresta.

Figura 2. Ilustração de uma Floresta Aleatória construída com três árvores de decisão (M1, M2 e M3). Em cada uma das árvores são destacadas, em negrito, as “rotas” de decisão para o registro exemplificado.

De maneira detalhada, a indução de uma RF com 𝑘 árvores de decisão, construída com base em um conjunto de treinamento 𝐷 com 𝑑 registros, é iniciada estruturando para cada iteração 𝑖 (𝑖 = 1, 2, . . . , 𝑘) novos conjuntos de treinamentos 𝐷𝑖, com 𝑑𝑖 registros, amostrados com reposição de 𝐷. Ou seja, cada conjunto 𝐷𝑖 é uma amostra de 𝐷, na qual um determinado registro do conjunto original pode aparecer mais de uma vez, enquanto outros podem não estar contidos nesse novo conjunto. 𝐹 é o número de atributos utilizados para divisão em cada um dos nós das árvores, em que 𝐹 é um subconjunto de 𝑓, e 𝑓 é o conjunto de atributos disponível. Para construir uma árvore de decisão, 𝑀𝑖, são selecionados aleatoriamente, para cada nó, 𝐹

(28)

atributos como candidatos para a divisão. O desenvolvimento completo de cada uma das árvores é feito utilizando algoritmo semelhante ao apresentado no Quadro 1.

2.4.4 Redes Neurais Artificiais

As ANNs são uma classe de modelos de aprendizado de máquina comumente compostas por uma camada com nós de entrada, uma camada com nó(s) de saída e uma ou mais camadas de nós entre as duas camadas anteriores, denominadas camadas ocultas. Nas redes neurais, os nós supracitados são denominados neurônios.

A arquitetura de redes neurais mais conhecida e fácil de entender é a feed-forward

multilayer, também conhecida como multilayer perceptron (MLP) (PATTERSON; GIBSON,

2017). Neste tipo de rede o termo forward denota o sentido único do fluxo de informação, que se origina nas variáveis de entrada (𝑋), passa por cálculos intermediários e termina nas saídas (Y). Em geral, para esta arquitetura, há apenas uma camada de entrada, uma ou mais camadas intermediárias (ocultas) e uma camada de saída. Cada camada pode ter um número diferente de neurônios e cada uma delas é completamente conectada com a camada adjacente. Na Figura 3, ilustra-se uma rede neural do tipo feed-forward multilayer com uma camada de entrada, duas camadas ocultas e uma camada de saída, totalmente conectadas.

Figura 3. Rede neural do tipo feed-forward multilayer totalmente conectada. Fonte: Adaptado de Patterson e Gibson (2017).

(29)

Resumidamente, as redes neurais procuram atingir uma predição com boa exatidão através da execução de três mecanismos: forward propagation, backpropagation e otimização das matrizes de pesos e vieses. No primeiro deles, os valores de entrada são multiplicados por uma matriz de pesos e transferidos para a camada oculta onde cada neurônio recebe informação de todos os nós de entrada. A soma da informação que chega a cada nó da camada oculta é, agora, entrada para a próxima camada de neurônios. Esse processo é representado na Equação 5, na qual a entrada da camada oculta (𝛼𝑖) é resultado da multiplicação matricial entre a matriz

de pesos transposta (𝑊𝑖𝑇 ) e o vetor com as variáveis de entrada (𝑋

𝑖), somado a um componente

𝑏 (viés) (PATTERSON; GIBSON, 2017). O vetor com os valores dos neurônios da camada oculta (𝛼𝑖) é, agora, entrada para a próxima camada da rede (𝛼𝑖+1), conforme representado na

Equação 6.

Comumente são aplicadas funções de ativação (𝑔) nos nós das camadas, acarretando uma transformação não linear às saídas de cada camada da rede neural e, como consequência, “moldando” o espaço amostral de saída, de acordo com a tarefa executada.

𝛼𝑖= 𝑔(𝑊𝑖𝑇· 𝑋𝑖+ 𝑏𝑖) Equação 5

𝛼𝑖+1= 𝑔(𝑊𝑖+1𝑇 · 𝛼𝑖+ 𝑏𝑖+1) Equação 6

Algumas das funções bastante utilizadas como funções de ativação são a função sigmoidal (Equação 7) ou as Rectified linear units (Equação 8).

𝑔(𝑧) = 1 1 + 𝑒−𝑧

Equação 7

𝑔(𝑧) = max {0, 𝑧} Equação 8

Intrinsicamente, as ANN buscam encontrar um conjunto de pesos para o qual cada vetor de entrada produza um vetor de saída que seja o mesmo que (ou suficientemente semelhante) ao vetor de saída real (RUMELHART; HINTON; WILLIAMS, 1986). Esse processo pode ser transcrito como sendo a minimização de uma função custo 𝐶(𝑦, 𝑦̂), computada a partir da diferença entre os valores preditos para a variável meta (𝑦̂) e os valores reais (𝑦) desta variável. Para que essa função de custo seja minimizada são executados os dois

(30)

demais mecanismos supracitados: backpropagation e otimização das matrizes de pesos e vieses.

O mecanismo denominado backpropagation tem como objetivo principal o cálculo das derivadas parciais 𝜕𝐶

𝜕𝑤 e

𝜕𝐶

𝜕𝑏 da função custo 𝐶 com relação a qualquer peso (𝑤) ou viés (𝑏)

na rede (NIELSEN, 2015). Chama-se backpropagation porque calculam-se as derivadas iniciando o processo pela camada final da rede. Esse movimento “para trás” é uma consequência do fato de que a função custo é uma função dos resultados/predições da rede, calculados durante o forward propagration. Inicia-se, portanto, o cálculo das derivadas a partir da camada mais próxima da camada de saída.

Na prática, é comum combinar o mecanismo de backpropagation a um algoritmo de aprendizado / otimização, visando a otimização recorrente das matrizes de pesos e vieses (NIELSEN, 2015). Um método de otimização bastante conhecido e utilizado é o gradiente descendente, representado na Equação 9, onde 𝜖 representa a taxa de aprendizado com a qual o peso vai ser atualizado, e 𝜕𝐶

𝜕𝑤 é o termo que representa a derivada parcial da função custo 𝐶(𝑦, 𝑦̂)

em função do peso que está sendo atualizado (gradiente). O viés é parâmetro também otimizado e a equação toma forma semelhante à da Equação 9, substitui-se, entretanto, 𝜕𝐶

𝜕𝑤 por 𝜕𝐶 𝜕𝑏 e W por 𝑏. 𝑊′= 𝑊 − 𝜖𝜕𝐶 𝜕𝑤 Equação 9

Cabe lembrar que é justamente a otimização das matrizes de pesos (𝑊) e vieses (𝑏) que faz com que a função custo calculada para a rede neural tenda a assumir valores progressivamente menores.

O processo de otimização em algoritmos de rede neural pode levar em consideração diferentes frações do conjunto de dados para contabilização da função de custo e, consequentemente, para posterior atualização da matriz de pesos. São denominados métodos

“batch”, algoritmos com processo de otimização que utilizam todo o conjunto de treino para

cálculo da função custo. Já os algoritmos de otimização que usam apenas um único exemplo por vez são exemplos de métodos estocásticos. A maioria dos algoritmos utilizados em deep

learning, entretanto, faz uso de uma quantidade intermediária, com mais de um, mas menos que

todos os registros do conjunto de treinamento. Estes, são tradicionalmente chamados de métodos “mini-batch” (GOODFELLOW; BENGIO; COURVILLE, 2016).

(31)

Ressalta-se que durante o processo de treinamento das redes neurais, execuções completas dos três mecanismos supracitados são realizadas no conjunto de treinamento. Cada ciclo no qual o conjunto de treinamento é completamente “percorrido” é comumente denominado de época.

Outro aspecto bastante importante em uma rede neural é a sua arquitetura. A performance de uma rede neural pode ser otimizada através da estruturação de diferentes arquiteturas, utilizando um variado número de camadas ocultas, assim como neurônios em cada uma dessas camadas. A arquitetura ideal para uma tarefa deve ser encontrada pela experimentação guiada pelo monitoramento do erro no conjunto de validação (GOODFELLOW; BENGIO; COURVILLE, 2016).

2.4.4.1 Redes Neurais Recorrentes

Redes Neurais Recorrentes (Recurrent Neural Networks, RNN) são um conjunto de redes neurais que adicionam o conceito de conexões recorrentes e são comumente utilizadas para processamento de dados sequenciais (GOODFELLOW; BENGIO; COURVILLE, 2016). Os dados nesses domínios apresentam ordenamento inerente e os valores posteriores dependem dos anteriores. Encontram-se dados sequenciais em muitas aplicações industriais, tais como processamento de linguagem natural, predição de séries temporais e sintetização de discursos (PATTERSON; GIBSON, 2017).

Diferente das MLPs convencionais, neste tipo de rede a informação pode trafegar no sentido contrário, estabelecendo relações de feedback. As RNNs têm aplicação justificável em casos de modelagem para os quais a entrada e / ou a saída é composta de vetores que envolvem uma dependência de tempo entre os valores. As redes neurais recorrentes modelam o aspecto temporal dos dados criando ciclos na rede (daí a parte "recorrente" do nome) (PATTERSON; GIBSON, 2017).

Nas RNNs, as conexões contemplam etapas de tempo adjacentes (por exemplo, um período anterior), dando ao modelo características temporais. As conexões convencionais em ANN não contêm ciclos; em redes neurais recorrentes, no entanto, conexões recorrentes podem formar ciclos, incluindo conexões de volta aos próprios neurônios originais em etapas de tempo futuras, conforme ilustrado na Figura 4a. Resumidamente, as redes neurais recorrentes utilizam cada vetor de uma sequência de vetores de entrada e, os modelam um de cada vez. Isso permite que a rede retenha o estado, ou seja, preserve a informação, ao modelar cada vetor de entrada na janela de vetores de entrada (PATTERSON; GIBSON, 2017).

(32)

Um tipo de arquitetura bastante comum de RNN recebe uma janela temporal de vetores e retorna uma única saída. Conforme ilustrado na Figura 4b, este tipo de arquitetura contempla conexões recorrentes entre unidades das camadas ocultas (ℎ), que executam uma sequência temporal inteira (𝑡 − 1, 𝑡, … , 𝜏) e, em seguida, produzem um único resultado (𝑜𝜏)

para o qual é calculado o valor da função perda (𝐿𝜏), comparando-o ao valor real (𝑦𝜏)

(GOODFELLOW; BENGIO; COURVILLE, 2016).

O uso de conexões recorrentes pode, no entanto, ocasionar problemas durante o processo de otimização. As RNN, em geral, sofrem com dois problemas típicos na contabilização do gradiente da Equação 9, ou eles assumem valores muito grandes ou desaparecerem, durante a fase de treinamento (SALEHINEJAD et al., 2017). Esses fenômenos fazem com que a memória da rede ignore as dependências de longo prazo e dificilmente aprenda a correlação entre eventos temporalmente distantes. Há duas razões para isso: 1) Funções não-lineares de ativação, como a função sigmoide, têm um gradiente cujo cálculo está quase sempre próximo de zero; 2) A magnitude do gradiente é multiplicada repetidamente pela matriz recorrente à medida em que o mecanismo de back propagation é realizado ao longo do tempo (SALEHINEJAD et al., 2017).

Algumas arquiteturas de RNN foram propostas, entretanto, de maneira a tornar mais consistente o aprendizado nesse tipo de contexto. Uma delas, denominada Long-Short Term

Memory (LSTM), propaga informações através do tempo por meio de somatória - um tipo

específico de ativação linear. Essa abordagem altera a estrutura das unidades ocultas de sigmóide ou tangente hiperbólica para células de memória, nas quais suas entradas e saídas são controladas por portas. Essas portas controlam o fluxo de informações para os neurônios ocultos e preservam os recursos extraídos dos momentos anteriores (SALEHINEJAD et al., 2017).

(33)

Figura 4. Rede neural com conexões recorrentes entre unidades ocultas. a) Visão compactada e simplificada das conexões recorrentes. b) Visão das camadas “desenroladas” ao longo do tempo e gerando uma única saída.

(34)

3 MATERIAL E MÉTODOS

3.1 Características dos dados utilizados

Os dados utilizados foram coletados entre junho de 2014 e fevereiro de 2015, em uma casa de vegetação instalada no campo experimental da Faculdade de Engenharia Agrícola da Universidade Estadual de Campinas, Campinas/SP (22° 49’ 06’’ S, 47° 03’ 40’’ O e 635 m acima do nível do mar) (ZORZETO, 2015). A casa de vegetação tinha uma área de 117 m², largura de 6,4 m, comprimento de 18,3 m, 4,0 m de pé direito e 1,5 m de altura do pé direito à cumeeira. O teto em arco era coberto por polietileno de baixa densidade (difusor de luz, 150 µm e tratamento anti-UV).

Uma rede de sensores sem fio, composta por 45 nós de sensores, foi instalada no interior da casa de vegetação, coletando dados de temperatura e umidade relativa. Cada um dos 45 pontos de medição teve os sensores (SHT75) protegidos por cápsulas porosas e dispostos no interior de um tubo de PVC revestido com uma folha de alumínio para proteção contra radiação, além de aspirados com um micro-ventilador de 3,0 m.s-1 para circulação do ar no interior do

tubo. Além dos sensores de temperatura e UR do ar, um sensor de velocidade e direção do vento, instalado no interior da casa de vegetação, foi utilizado para registro/monitoramento dessas variáveis. Adicionalmente, uma estação meteorológica, instalada a 2,0 m do vértice da casa de vegetação e a 7,0 m de altura, coletou dados de precipitação, temperatura e umidade relativa e velocidade e direção do vento. Dados de radiação foram coletados por dois sensores posicionados no centro da casa de vegetação (ZORZETO, 2015). Na Figura 5 é ilustrado o posicionamento dos sensores utilizados para coleta de informações da casa de vegetação.

(35)

Figura 5. Esquema de posicionamento dos sensores. Fonte: (ZORZETO, 2015)

Os elementos estruturais foram variados ao longo do período de coleta de dados. O tipo de cobertura lateral, a abertura ou não da janela zenital e o funcionamento ou não dos exaustores são exemplos de elementos controlados durante o período experimental.

Na Tabela 1, são apresentadas as nove configurações de elementos estruturais consideradas para o presente projeto. Na última coluna da tabela estão identificados os períodos de coleta dos dados, durante os quais cada configuração estava ativa e os dados climáticos internos e externos foram coletados.

Nas próximas seções e subseções, sempre que a expressão “cenários experimentais” for utilizada, ela se refere à ocorrência conjunta de:

• Condições meteorológicas externas à casa de vegetação em um dado período; • Condições meteorológicas no interior da casa de vegetação neste mesmo período; • Configuração de elementos estruturais da casa de vegetação utilizada no período

(36)

Tabela 1. Configurações de elementos estruturais da casa de vegetação e período de aquisição de dados.

Configuração Cobertura lateral Janela zenital Exaustor superior Exaustor inferior termorrefletora Tela poroso Meio Períodos de coleta

1 Plástico Fechada Desligado Desligado -- Desligado 15/06/2014 – 24/06/2014

2 Plástico Fechada Ligado Ligado -- Desligado 26/06/2014 - 05/07/2014

3 Plástico Fechada Ligado Ligado Esticada Desligado 07/07/2014 – 16/07/2014

4 Plástico Aberta Desligado Ligado -- Desligado 18/07/2014 - 27/07/2014

5 Plástico Aberta Ligado Ligado -- Desligado 29/07/2014 - 07/08/2014

6 Plástico Fechada Ligado Ligado -- Ligado 26/08/2014 - 04/09/2014

7 Plástico Fechada Ligado Ligado Esticada Ligado 06/09/2014 - 15/09/2014

8 Tela anti-afídeos Aberta Desligado Desligado -- Desligado

14/10/2014 - 18/10/2014; 21/10/2014 - 22/10/2014; 25/10/2014; 15/11/2014 - 16/11/2014

9 Tela anti-afídeos Aberta Desligado Desligado Esticada Desligado 04/11/2014 - 13/11/2014 Fonte: Adaptado de Zorzeto (2015).

3.2 Estratégias de modelagem

De modo a atingir os objetivos estabelecidos, foram propostas duas estratégias distintas, das quais decorrem duas abordagens para engenharia de atributos e modelagem.

3.2.1 Descrição do microclima interno a partir de diferentes configurações de elementos estruturais

O que se deseja, nesta primeira estratégia, é predizer uma condição interna utilizando como atributos preditores características climáticas externas, dados de velocidade e direção do vento no interior da casa de vegetação, dados de radiação, coordenadas dos nós de sensores posicionados no interior da estrutura e dados das configurações de elementos estruturais da casa de vegetação. O modelo é construído com base em dados de diferentes cenários (Figura 6). Perspectiva de análise bastante semelhante à adotada no trabalho de Vanthoor et al. (2011).

Referências

Documentos relacionados

Tendo este trabalho como objectivo, ilustrar os vários aspectos da relação de Simone de Beauvoir com o nosso país, abordámos, com esse intuito, as visitas efectuadas por esta

A direção dos Serviços Farmacêuticos Hospitalares (SFH) fica sempre a cargo de um farmacêutico. São várias as funções desempenhadas pelo FH no decorrer da sua atividade

Na Farmácia São Gonçalo estes produtos são muitas vezes solicitados, sendo que existe uma grande variedade dos mesmos, como material de penso, produtos para controlo da

Purpose: This thesis aims to describe dietary salt intake and to examine potential factors that could help to reduce salt intake. Thus aims to contribute to

8 — Os efeitos processuais e penais dêsses dois tipos de pena são diferentes (13). Da mesma forma, a sua execução peniten­ ciária. O sistema progressivo brasileiro apenas tem em

In order to obtain such better approximations, we adapt the origi- nal prepivoting method of Beran to this context of tail estimation.... To illustrate the validity of this

Em relação aos conhecimentos de saúde oral constatou-se que pais/encarregados de educação e crianças estão informados sobre a presença, ou não, de dentes cariados, bem como,

Even for the usual Becker-D¨ oring equations with input of monomers, the long time behaviour of solutions is not completely understood, [12], and so it seemed advisable to start with