• Nenhum resultado encontrado

Predição de Diâmetros e Cálculo de Volume de Clones de Eucalipto

N/A
N/A
Protected

Academic year: 2021

Share "Predição de Diâmetros e Cálculo de Volume de Clones de Eucalipto"

Copied!
95
0
0

Texto

(1)

U

NIVERSIDADE

F

EDERAL DE

G

OIÁS

I

NSTITUTO DE

I

NFORMÁTICA

W

ELINGTON

G

ALVÃO

R

ODRIGUES

Predição de Diâmetros e Cálculo de

Volume de Clones de Eucalipto

Uma abordagem com redes Multi Layer Perceptron e

Long-Short Term Memory

Goiânia 2019

(2)
(3)

W

ELINGTON

G

ALVÃO

R

ODRIGUES

Predição de Diâmetros e Cálculo de

Volume de Clones de Eucalipto

Uma abordagem com redes Multi Layer Perceptron e

Long-Short Term Memory

Dissertação apresentada ao Programa de Pós–Graduação do Instituto de Informática da Universidade Federal de Goiás, como requisito parcial para obtenção do título de Mestre em Ciência da Computação.

Área de concentração: Ciência da Computação.

Orientador: Prof. Dr. Fabrizzio Alphonsus Alves de Melo Nunes Soares

Goiânia 2019

(4)

Ficha de identificação da obra elaborada pelo autor, através do Programa de Geração Automática do Sistema de Bibliotecas da UFG.

CDU 004 Rodrigues, Welington Galvão

Predição de Diâmetros e Cálculo de Volume de Clones de Eucalipto [manuscrito] : Uma abordagem com redes Multi Layer Perceptron e Long-Short Term Memory / Welington Galvão Rodrigues. - 2019. XCIII, 93 f.: il.

Orientador: Prof. Dr. Fabrizzio Alphonsus Alves de Melo Nunes Soares.

Dissertação (Mestrado) - Universidade Federal de Goiás, Instituto de Informática (INF), Programa de Pós-Graduação em Ciência da Computação, Goiânia, 2019.

Bibliografia.

Inclui siglas, lista de figuras, lista de tabelas.

1. Redes Neurais. 2. LSTM. 3. Inventário Florestal. 4. Eucalipto. I. Soares, Fabrizzio Alphonsus Alves de Melo Nunes , orient. II. Título.

(5)

UNIVERSIDADE FEDERAL DE GOIÁS

INSTITUTO DE INFORMÁTICA

ATA DE DEFESA DE DISSERTAÇÃO

Ata nº 11/2019 da sessão de Defesa de Dissertação de Welington Galvão Rodrigues, que confere o título de Mestre em Ciência da Computação, na área de concentração em Ciência da Computação.

Aos quinze dias do mês de agosto de dois mil e dezenove, a partir das quatorze horas, na sala 150 do Insituto de Informática, realizou-se a sessão pública de Defesa de Dissertação intitulada “Predição de Diâmetros e

Cálculo de Volume de Clones de Eucalipto: Uma abordagem com redes Multi Layer Perceptron e Long-Short Term Memory”. Os trabalhos

foram instalados pelo Orientador, Professor Doutor Fabrizzio Alphonsus Alves de Melo Nunes Soares (INF/UFG) com a participação dos demais membros da Banca Examinadora: Professor Doutor Christian Dias Cabacinha (ICA/UFMG), membro titular externo, cuja participação ocorreu através de videoconferência; Professora Doutora Deborah Silva Alves Fernandes (INF/UFG), membro suplente externa. Durante a arguição os membros da banca não fizeram sugestão de alteração do título do trabalho. A Banca Examinadora reuniu-se em sessão secreta a fim de concluir o julgamento da Dissertação, tendo sido o candidato aprovado pelos seus membros. Proclamados os resultados pelo Professor Doutor Fabrizzio Alphonsus Alves de Melo Nunes Soares, Presidente da Banca Examinadora, foram encerrados os trabalhos e, para constar, lavrou-se a presente ata que é assinada pelos Membros da Banca Examinadora, aos quinze dias do mês de agosto de dois mil e dezenove.

TÍTULO SUGERIDO PELA BANCA

Documento assinado eletronicamente por Deborah Silva Alves

Fernandes, Professor do Magistério Superior, em 19/08/2019, às

14:20, conforme horário oficial de Brasília, com fundamento no art. 6º, § 1º, do Decreto nº 8.539, de 8 de outubro de 2015.

Documento assinado eletronicamente por Fabrízzio Alphonsus Alves

De Melo Nunes Soares, Professor do Magistério Superior, em

19/08/2019, às 18:51, conforme horário oficial de Brasília, com fundamento no art. 6º, § 1º, do Decreto nº 8.539, de 8 de outubro de

SEI/UFG - 0835204 - Ata de Defesa de Dissertação https://sei.ufg.br/sei/controlador.php?acao=do...

(6)

2015.

Documento assinado eletronicamente por Christian Dias Cabacinha,

Usuário Externo, em 20/08/2019, às 19:32, conforme horário oficial

de Brasília, com fundamento no art. 6º, § 1º, do Decreto nº 8.539, de 8 de outubro de 2015.

A autenticidade deste documento pode ser conferida no site https://sei.ufg.br

/sei/controlador_externo.php?acao=documento_conferir&

id_orgao_acesso_externo=0, informando o código verificador 0835204 e o código CRC 93BF2D6A.

Referência: Processo nº 23070.025379/2019-51 SEI nº 0835204

SEI/UFG - 0835204 - Ata de Defesa de Dissertação https://sei.ufg.br/sei/controlador.php?acao=do...

(7)

Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, do autor e do orientador(a).

Welington Galvão Rodrigues

Graduou-se em Sistemas de Informação pela FACIMP - Faculdade de Im-peratriz, com ênfase em desenvolvimento mobile. Atualmente é técnico em informática no Instituto Federal do Maranhão - IFMA, Campus Açailândia.

(8)

Dedico este trabalho à minha mãe Maria Galvão e ao meu pai Raimundo Carlos por todo o empenho dedicado a minha educação.

(9)

Agradecimentos

Primeiramente, agradeço a Deus pela vida, por ter me proporcionado saúde, sa-bedoria, pela proteção em meio a tantas viagens ao longo dessa jornada e pela oportuni-dade de realizar este trabalho.

Agradeço aos meus pais por todo amor, carinho e apoio que deram para continuar estudando, do qual sem eles isso não seria possível.

Aos amigos que estiveram ao meu lado neste percurso, que me auxiliaram de inúmeras maneiras a qual serei sempre grato.

Ao meu querido orientador Prof. Dr. Fabrízzio A. A. M. N. Soares, por sua importantíssima contribuição para a realização deste trabalho, por todos os conselhos concedidos e pela confiança em mim depositada.

(10)

“Computer science is no more about computers than astronomy is about telescopes, biology is about microscopes or chemistry is about beakers and test tubes. Science is not about tools, it is about how we use them and what we find out when we do.”

(11)

Resumo

Rodrigues, Welington G.. Predição de Diâmetros e Cálculo de Volume de Clones de Eucalipto. Goiânia, 2019. 94p. Dissertação de Mestrado. Instituto de Informática, Universidade Federal de Goiás.

O gerenciamento efetivo dos recursos florestais é de grande importância para o sucesso de um empreendimento florestal. Obter informações precisas de florestas plantadas é essen-cial para o planejamento eficaz da atividade florestal. Neste sentido, o inventário florestal é o procedimento utilizado para obter as informações qualitativas e quantitativas de uma determinada região. Através dele é possível, por exemplo, quantificar árvores, identificar as espécies de um povoamento e obter o volume total a ser explorado. O volume cons-titui um dos elementos mais importantes para a exploração de uma determinada área. Empresas usam informações obtidas através do inventário para o manejo florestal esta-belecendo a quantidade de árvores a serem retiradas sem interromper o ciclo natural das florestas. Para o empreendimento florestal é desejável obter as informações necessárias de um povoamento sem elevar os custos. Assim, os métodos estatísticos apresentam um caminho para explorar essas informações sem elevar o custo entregando um resultado próximo ao real. Vários trabalhos presentes na literatura aplicam redes neurais artificias em diversas áreas do setor florestal, os resultados obtidos por elas mostraram-se bastan-tes promissores para problemas de classificação e predição de recursos florestais. Neste contexto, o presente trabalho apresenta um estudo no desenvolvimento de modelos cons-truídos através de redes neurais de diferentes arquiteturas, em especial as redes Multi layer Perceptrone Long-Short Term Memory, além da análise estatística dos modelos para pre-dição de diâmetros e cálculo de volume de clones de eucalipto. Os resultados alcançados pelos modelos foram comparados com os valores obtidos através de cubagem rigorosa e pelo modelo de Schumacher e Hall (log). Os modelos construídos pelas redes do tipo Long-Short Term Memoryapresentaram boa capacidade de generalização e mostraram-se superiores para estimar diâmetros e calcular volume de eucaliptos em demais sítios não disponíveis durante a fase de treinamento. Além de apresentar resultados bastantes próxi-mos aos obtidos através da cubagem rigorosa. De modo geral os resultados próxi-mostraram-se bastante satisfatórios em relação aos métodos estatísticos e presentes na literatura. Palavras–chave

(12)

Abstract

Rodrigues, Welington G.. Prediction of Diameters and Volume Calculation of Eucalyptus Clones. Goiânia, 2019. 94p. MSc. Dissertation. Instituto de Informática, Universidade Federal de Goiás.

Effective management of forest resources is of great importance to the success of a forest enterprise. Obtaining accurate information on planted forests is essential for effective forest activity planning. In this sense, the forest inventory is the procedure used to obtain qualitative and quantitative information from a given region. Through inventory it, is possible, for example, to quantify trees, identify species of a settlement and obtain the total volume to be explored. The total volume is one of the most important elements for the exploration of a given area. Companies use information obtained from forest management inventory to establish the number of trees to be removed without disrupting the natural cycle of forests. For the forest enterprise, it is desirable to obtain the necessary information from a stand without raising costs. Thus, statistical methods provide a way to exploit this information without raising the cost by delivering a near-real result. Several works in the literature apply artificial neural networks in several areas of the forest sector, the results obtained by them have been quite promising for problems of classification and prediction of forest resources. In this context, the present work presents a study on the development of models built through neural networks of different architectures, especially the textit Multi layer Perceptron and textit Long-Short Term Memory networks, besides the statistical analysis of the models. For diameter prediction and volume calculation of eucalyptus clones. The results achieved by the models were compared with the values obtained by rigorous cubing and by the Schumacher and Hall model (log). The models built by Long-Short Term Memory networks showed good generalization capacity and were superior for estimating diameters and calculating eucalyptus volume in other sites not available during the training phase. In addition to presenting results quite close to those obtained through rigorous cubing. In general, the results were quite satisfactory concerning the statistical methods present in the literature.

Keywords

(13)

Sumário

Lista de Figuras 14 Lista de Tabelas 15 1 Introdução 17 1.1 Motivação . . . 17 1.2 Objetivos . . . 19 1.2.1 Objetivo geral . . . 19 1.2.2 Objetivos específicos . . . 19 1.3 Organização do trabalho. . . 19

2 Inventário Florestal em Florestas Plantadas 21 2.1 Dendrometria . . . 22

2.2 Eucalipto . . . 23

2.3 A Forma da Árvore . . . 25

2.4 Cubagem Rigorosa . . . 26

2.5 Estimativa de Volumes . . . 28

3 Redes Neurais Artificiais 31 3.1 Introdução . . . 31

3.2 Um breve histórico sobre redes neurais . . . 32

3.3 Perceptron de Múltiplas Camadas . . . 34

3.4 Algoritmo de Retropropagação - Backpropagation . . . 36

3.5 Funções de Ativação . . . 40

3.6 Taxa de Aprendizagem . . . 41

3.7 Limited-Memory L-BFGS . . . 42

3.8 Redes Neurais Recorrentes . . . 42

3.8.1 Treinamento de Redes Recorrentes . . . 45

3.8.2 Redes Long-Short Term Memory - LSTMs . . . 47

4 Aplicação de Redes Neurais na área Florestal 50 4.1 Predição de diâmetros, Altura e Volume em Árvores . . . 50

4.2 Demais aplicações florestais . . . 51

5 Metodologia Proposta para Estimativa de Diâmetros 54 5.1 Predição de Diâmetros como uma série temporal . . . 54

5.2 Metodologia utilizada . . . 55

5.3 Materiais e Métodos . . . 56

(14)

5.3.2 Estatísticas . . . 57

5.3.3 Normalização . . . 58

5.3.4 Data Augmentation . . . 58

5.3.5 Modelagem e treinamento das redes neurais . . . 59

5.4 Métricas de Avaliação . . . 63

5.4.1 Cálculo dos erros dos diâmetros . . . 63

5.4.2 Cálculo do volume das árvores . . . 64

5.4.3 Cálculo de estimativa de erros para volume . . . 64

5.4.4 Cálculo da diferença de volume percentual entre os modelos . . . 65

5.4.5 Testes estatísticos . . . 65

6 Resultados 66 6.1 Predição de diâmetros . . . 66

6.2 Comparação entre o volume calculado a partir dos diâmetros reais, diâmetros estimados pelos modelos e o volume calculado através de Schumacher e Hall (log) 69 6.3 Análise residual de volume . . . 74

6.4 Comparação com os demais sítios . . . 76

6.4.1 Predição de diâmetros Sítio I . . . 77

6.4.2 Predição de diâmetros Sítio II . . . 78

6.4.3 Comparação e análise estatística do cálculo de volume para os sítios I e II . . 79

6.5 Considerações finais do capítulo . . . 82

7 Conclusões e Trabalhos Futuros 83 7.1 Trabalhos futuros . . . 84

(15)

Lista de Figuras

2.1 Áreas de árvores plantadas no Brasil por gênero (Ibá, 2017). . . 24

2.2 Áreas de árvores plantadas no Brasil por estado e por gênero (Ibá, 2017).. 25

2.3 Sólidos de revolução de maior importância na cubagem de uma árvore (Netto, 2004). . . 26

2.4 Exemplo da cubagem rigorosa em uma árvore.. . . 27

2.5 Ilustração da seção de uma árvore e suas dimensões.. . . 28

3.1 Modelo de um neurônio biológico (Silva et al. , 2010). . . 32

3.2 Processo de transmissão de impulsos nervosos por meio da fenda sináp-tica (Canto, 2004). . . 33

3.3 Perceptron de Múlti-Camadas (Silva et al. , 2010).. . . 35

3.4 Rectified Linear Activation(Goodfellow et al. , 2016).. . . 41

3.5 Processo de realimentação de um neurônio recorrente (Goodfellow et al. , 2016) . . . 43

3.6 Ilustração do processo de “desenrolar” em uma rede recorrente. (Good-fellow et al. , 2016) . . . 44

3.7 Comparação entre a célula de uma rede recorrente comum e uma célula do tipo LSTM (Donahue et al. , 2015). . . 48

5.1 Altura das medidas. . . 57

5.2 Relação entre os dez primeiros diâmetros de uma árvore. . . 58

5.3 Curvas de treinamento do modelo LSTM-VA. . . 61

5.4 Curvas de treinamento do modelo LSTM-DA. . . 62

5.5 Curvas de treinamento do modelo MLP-PR. . . 62

5.6 Curvas de treinamento do modelo MLP-PD. . . 62

5.7 Curvas de treinamento do modelo MLP-DAPHT. . . 63

6.1 Predição de diâmetros da LSTM-VA (melhor e pior caso). . . 68

6.2 Predição de diâmetros da LSTM-DA (melhor e pior caso). . . 68

6.3 Predição de diâmetros da MLP-PR (melhor e pior caso). . . 68

6.4 Gráfico de dispersão de volume para LSTM-VA e LSTM-DA. . . 72

6.5 Gráfico de dispersão de volume para MLP-PR e MLP-PD. . . 72

6.6 Gráfico de dispersão de volume para MLP-DAPHT e Schumacher e Hall (log).. . . 73

6.7 Distribuição gráfica de resíduos para o modelo LSTM-VA. . . 74

6.8 Distribuição gráfica de resíduos para o modelo LSTM-DA. . . 75

6.9 Distribuição gráfica de resíduos para o modelo MLP-PR. . . 75

6.10 Distribuição gráfica de resíduos para o modelo MLP-PD. . . 76

(16)

Lista de Tabelas

2.1 Modelos volumétricos de simples entrada. . . 29

2.2 Modelos volumétricos de dupla entrada. . . 30

5.1 Distribuição das árvores. . . 56

5.2 Estatísticas do conjunto de dados. . . 57

5.3 Estrutura dos modelos construídos. . . 60

5.4 Análise das métricas R2e MAPE. . . 61

5.5 Recursos utilizados. . . 63

6.1 Erro de predição de diâmetros por classe. . . 66

6.2 Comparação entre o volume total calculado a partir dos diâmetros reais, diâmetros estimados pelos modelos e Schumacher e Hall (log). . . 70

6.3 Estatísticas realizada entre os volumes reais, os modelos treinados e Schumacher e Hall (log). . . 71

6.4 Avaliação dos modelos para estimação de diâmetros do sítio I. . . 77

6.5 Avaliação dos modelos para estimação de diâmetros do sítio II. . . 78

6.6 Comparação entre os volumes totais calculados para o síto I. . . 79

6.7 Comparação entre os volumes totais calculados para o síto II. . . 80

6.8 Estatística de erros de estimativa de volume entre o volume cubado e estimado pelos modelos para os sítios I e II. . . 81

(17)

Lista de Abreviaturas e Siglas

ANOVA Análise de Variância

BPT T Backpropagation Through Time DAP Diâmetro na Altura do Peito LST M Long-Short Term Memory

LST M− DA Long-Short Term Memory com Data Augmentation LST M−VA Vanilla Long-Short Term Memory

MAE Desvio Médio Percentual

MAPE Mean Absolute Percentage Error MLP Multilayer Perceptron

MLP− DAPHT Multilayer Perceptron com DAP e Altura Total MLP− PD Multilayer Perceptron com Predição Direta

MLP− PR Multilayer Perceptron com Predição Recursiva R Correlação Linear

R2 Coeficiente de determinação RMSE Root Mean Square Error SGD Stochastic Gradient Descendent

(18)

CAPÍTULO

1

Introdução

1.1

Motivação

O setor florestal brasileiro é mundialmente reconhecido pela sua produtividade. O tempo entre o plantio e a colheita representa a menor rotatividade conhecida. A área total de árvores plantadas no Brasil totalizou 7,84 milhões de hectares em 2017, resultando em um crescimento de 0,5% em relação a 2015, devido exclusivamente ao aumento das áreas com eucalipto. Dados mostram que os plantios de eucalipto ocupam 5,7 milhões de hectares da área de árvores plantadas do país (Ibá, 2017). Esse crescimento deve-se principalmente ao investimento de indústrias que utilizam cada vez mais o eucalipto como matéria-prima para sua produção.

No ano de 2018, o setor florestal recebeu R$ 6,7 bilhões em investimentos e gerou uma receita bruta de R$ 74,8 bilhões, representando 1.1% do Produto Interno Bruto (PIB) nacional e 6,1% do PIB industrial. Os investimentos geraram 3,7 milhões de empregos direto e indireto (Ibá,2018).

O inventário florestal é um recurso utilizado para quantificar o volume de um determinado povoamento, visando planejar operações florestais através de estimativas de quantidade e distribuição da madeira (Leite & Andrade, 2002). Vibrans et al. (2010) definem o inventário como o processo de obtenção de dados qualitativos e quantitativos dos recursos florestais.

Dentre os diversos parâmetros que podem ser obtidos de um inventário florestal, o volume de madeira plantado é uma informação essencial no direcionamento racional e sustentável dos recursos disponíveis nas florestas. Assim, é muito importante quantificá-lo de maneira mais precisa possível. Para isto, são necessárias diversas medições em amostras representativas das florestas a fim de conhecer a dinâmica dos povoamentos (Soares,2012).

Durante o processo de realização de um inventário florestal os erros de cálculo volumétricos podem comprometer o volume total de uma árvore.Couto & Bastos(1987) mostraram que o erro de 1 metro na medição da altura total da árvore corresponde a aproximadamente 14% do volume cilíndrico das árvores. Enquanto o erro de 1 cm no

(19)

1.1 Motivação 18

Diâmetro na Altura do Peito (DAP) corresponde a um erro de aproximadamente 19% do volume total da árvore. O DAP é o diâmetro na altura de 1,3 metros do solo.

O volume total de madeira plantada de um determinado povoamento é crucial para a gestão correta dos recursos florestais. Assim, quantificá-lo de maneira mais precisa possível é de grande importância.

A cubagem rigorosa é método mais simples e utilizado para a mensuração de maneira mais precisa. No entanto uma desvantagem consiste na necessidade de abate de árvores selecionadas. Além de ser um processo lento e implica a comercialização imediata para evitar perder o produto (Cabacinha,2003).

De maneira restrita, o tronco de uma árvore assemelha-se a alguns sólidos geo-métricos de revolução. A base da árvore assemelha-se a um neilóide, a parte intermediá-ria é semelhante um parabolóide e a extremidade final assemelha-se a um cone (Gomes,

1957;Scolforo et al. , 1997). Assim, as equações volumétricas (Schumacher, 1933) po-dem empregadas para estimar o volume através de suposições feitas sobre a forma da árvore previamente cubada.

Considerando a disposição de diferentes formas para uma única árvore, a relação entre os seus diâmetros possui características não lineares. Dada essa característica o uso de redes neurais foram aplicados para predição de diâmetros, calcular volume e demais parâmetros florestais visto sua capacidade de lidar com problemas que se relacionam de maneira não linear.

Muitos trabalhos empregam redes neurais para realizar a predição de diversos parâmetros utilizados no inventário florestal. Embora as redes neurais tenham apresentado bons resultados, por outro lado, a escolha de parâmetros utilizados para treiná-las e a forma de obtê-los pode comprometer o desempenho da rede.

Medições realizadas de maneira imprecisa devido a erros humanos ou problemas nos equipamentos podem classificar uma árvore em uma classe diamétrica diferente, fazendo com que a rede neural estime erroneamente os diâmetros de uma árvore e consequentemente o cálculo de volume da mesma. Outra característica bastante utilizada é a altura total da árvore, que se apresenta como uma medida complicada de se obter em campo, mas fundamental em diversos modelos de equações volumétricas.

Neste trabalho são utilizadas abordagens com redes neurais multicamadas do tipo feedforward, que possuem diversas aplicações no setor florestal presentes na literatura, e redes neurais recorrentes, em especial, as redes Long-Short Term Memory que mostraram-se eficientes em diversos trabalhos que abordam problemas de modelagem mostraram-sequencial.

(20)

1.2 Objetivos 19

1.2

Objetivos

1.2.1

Objetivo geral

Conforme o cenário apresentado, o objetivo deste trabalho busca elaborar um estudo com modelos de redes neurias para estimar diâmetros e realizar o cálculo de volume de clones de eucalipto através de diferentes arquiteturas de redes neurais, em especial as redes Multilayer Perceptron - MLP e Long-Short Term Memory - LSTM utilizando diferentes variáveis obtidas em um inventário florestal.

1.2.2

Objetivos específicos

Como objetivos específicos, têm-se:

• Minimizar a necessidade da altura total da árvore.

• Verificar os parâmetros do inventário que possam simplificar a entrada de variáveis para a rede neural.

• Criar modelos que tenham capacidade de estimar árvores em diferentes sítios de eucalipto.

• Verificar a influência do erro em cada estimativa de diâmetro e volume.

• Analisar o desempenho dos modelos em relação à cubagem rigorosa e o modelo volumétrico de Schumacher e Hall (log).

1.3

Organização do trabalho

A estrutura deste trabalho foi organizada da seguinte forma:

No capítulo 1 são apresentados na introdução a contextualização, descrição geral dos problemas, os objetivos gerais e específicos.

O capítulo 2 aborda aspectos sobre mensuração florestal, eucaliptocultura e as técnicas de estimativa de volume.

O capítulo 3 abordará sobre as redes neurais artificiais apresentando um breve histórico, uma descrição sobre o Perceptron multicamadas, o Backpropagation, funções de ativação, uma descrição sobre redes neurais recorrentes, seu funcionamento e a topologia Long-Short Term Memory.

No capítulo 4 são apresentados alguns trabalhos que utilizam redes neurais no setor florestal.

No capítulo 5 são apresentados as arquiteturas utilizadas, os materiais e métodos utilizados para avaliar os resultados obtidos neste trabalho.

O capítulo 6 apresentará os resultados alcançados e as comparações com os modelos existentes na literatura.

(21)

1.3 Organização do trabalho 20

Por fim, o capítulo 7 apresentará a conclusão do trabalho, contribuições e os trabalhos futuros, considerações finais e as referências bibliográficas utilizadas.

(22)

CAPÍTULO

2

Inventário Florestal em Florestas Plantadas

O inventário pode ser entendido como a base para o planejar e gerir recursos florestais, onde, através dele é possível quantificar e qualificar uma região analisando as espécies que compõe essa determinada área. Esta prática faz usos da teoria da amostragem para estimar ou determinar uma dada característica, seja qualitativa ou quantitativa de uma amostra (Brena & Péllico Neto,1997).

Um dos principais objetivos do inventário florestal em relação às florestas plantadas, consiste em avaliar e aplicar métodos de amostragem que possam obter informações precisas de biomassa, área basal, volume, qualidade do fuste, classe de copa e qualidade de crescimento. Além disso, o desejável para o empreendimento é obter estas informações sem elevar o custo da produção florestal. Os métodos estatísticos mostram um caminho para explorar as relações entre as amostras e entregar um resultado próximo do real e com baixo custo (Mello,2004).

A sua importância consiste como a base do plano de manejo e da produção de uma empresa madeireira. O inventário deve fornecer, além do volume total explorável, a distribuição do número de árvores por hectare e por outras características, tais como, classe de diâmetro, área basal por hectare, por grupo de espécies e para cada espécie individualmente o que torna possível prever gastos e lucros para a indústria madeireira (Silva,2001)

Já em relação a floresta nativa, através do inventário, planos de exploração podem ser traçados de modo a contemplar a subdivisão da área a ser explorada em lotes (talhões) que serão explorados em sequência. Quando o ciclo de exploração estiver completo, a extração de madeira deverá ocorrer novamente no primeiro lote explorado, o qual já deve ter se regenerado parcialmente. O manejo florestal pode ser acompanhado de enriquecimento da floresta, ou seja, de plantio de espécies desejadas. Em geral, os planos de manejo de florestas nativas em execução no Brasil envolvem ciclos de exploração de 30 anos (Juvenal & Mattos,2002).

(23)

2.1 Dendrometria 22

2.1

Dendrometria

Durante a elaboração de um inventário florestal é importante mensurar com pre-cisão as variáveis que serão utilizadas pra quantificação e avaliação dos produtos flores-tais. Estas variáveis dendrométricas constituem a base técnica que auxilia no processo de manejo florestal.

A palavra Dendrometria tem origem grega (DENDRO = árvore; e METRIA = medida), significando a medida da árvore. Em outras palavras este ramo das Ciências Florestais que tem por objetivos principais determinar ou estimar os recursos florestais, seja da própria árvore ou mesmo de um povoamento, predizer o volume, o incremento ou a produção de recursos florestais. Ela surgiu da necessidade dos homens estimarem quantitativamente o que possuíam em recursos florestais (Silva & Neto,1979).

Dentre outros termos a Dendrometria também é conhecida como Dasometria, Silvimensuração, Mesnuração Florestal e Silvimetria. Assim, ela é empregada para aten-der objetivos específicos, tais como, comercial, ordenação florestal e de pesquisas.

Quando aplicada ao âmbito comercial a Dendrometria visa estimar com precisão o que é retirado da floresta para fins de compra e venda de produtos e subprodutos flo-restais. Quanto ao manejo florestal, a dendrometria pode ser utilizada, por exemplo, para saber se quantidade de produtos restirados de uma determinada área seja compatível ao quanto essa área possa crescer novamente de modo a elaborar planejamento florestal de longo prazo. Outra aplicação se dá na área de pesquisas com o objetivo de novos conhe-cimento, tabelas, técnicas, entre outros. Que podem ser realizados durante a pesquisa em campo.

A Dendrometria faz uso de diversas variáveis para realizar estimativas, as prin-cipais consistem na altura total e nos diâmetros das árvores, medidos no tronco em várias alturas em relação ao solo. Algumas medidas podem ser obtidas diretamente através de uma suta ou outro instrumento semelhante, já outras medidas como altura total de uma árvore necessitam de instrumentos para que possa ser conhecida ou também por utilização de princípios trigonométricos e geométricos.

As medições de diâmetros que vão do tronco da árvore até medidas próximas à altura do DAP podem ser obtidas diretamente com a árvore em pé, já para medidas além do DAP é necessário, escadas ou andaimes em alturas que ainda possam ser acessíveis.

Mesmo que inúmeras variáveis possam existir durante os procedimentos den-drométricos, os erros devem ser minimizados para que o inventário florestal possa ser realizado com o menor erro possível, garantindo assim, uma estimação mais precisa com menos danos florestais.

(24)

2.2 Eucalipto 23

2.2

Eucalipto

A palavra eucalipto (do grego, eu , verdadeira; e kalúptw , cobertura) é a designação popular das várias espécies vegetais do gênero Eucalyptus. Este nome é usado também para outros gêneros da família Myrtaceae, nomeadamente dos gêneros Corymbia e Angophora (Soares et al.,2010).

O eucalipto possui uma característica marcante de sua espécie quanto a diver-sidade do uso de sua madeira. Ele pode ser utilizado pela indústria para a produção de papel e celulose, carvão, lenha, postes; na construção civil o mesmo pode ser utilizado para produção de chapas laminados, etc. Outra característica desta espécie é seu rápido crescimento e adaptabilidade a diversas regiões. (Pavan,2009).

Estas características fazem do eucalipto um dos gêneros mais plantados no mundo por diversos países das Américas, Europa, África, Ásia, além de alguns países do mediterrâneo e algumas ilhas da Oceania (Flynn & Shield,1999).

A produtividade do eucalipto nestes demais países pode variar bastante devido as características edafoclimáticas presentes no território, da origem do propágulo vegetal e o grau de melhoramento, além das práticas de manejo e silvicultura adotados nos países (Scarpinati,2007).

O eucalipto foi introduzido no Brasil na segunda metade do século XIX com o objetivo de ajudar na produção de dormentes para as linhas férreas que se instalavam no país (Lutinski et al.,2006).

Durante a década de 50, passou a ser usado como matéria-prima no abasteci-mento das fábricas de papel e celulose. É um vegetal de rápido cresciabasteci-mento e adaptado para as situações edafo-bioclimáticas brasileira. Durante as décadas de 60 e 70, o euca-lipto teve um crescimento expressivo devido aos incentivos fiscais e perdurou até meados dos anos 80 e ficou conhecido como um marco na silvicultura brasileira dado os efei-tos positivos que gerou no setor. Com o fim dos incentivos fiscais houve uma queda no plantio de eucaliptos. Exceção disso ocorreu naqueles feitos, independentes dos investi-mentos, nas indústrias de papel e celulose e de siderúrgicas a carvão vegetal (Dossa et al.

,2002).

O eucalipto é uma planta que ao longo da sua evolução natural desenvolveu mecanismos adaptativos eficientes para crescer rapidamente sob condições favoráveis e também suportar estresse hídrico, de temperatura, nutricional, entre outros, o que explica o grande número de espécies na natureza e sua ampla dispersão nas regiões de origem (Paludzyszyn Filho et al.,2006).

O setor florestal brasileiro é mundialmente reconhecida pela alta produtividade de suas áreas plantadas. A produtividade florestal é medida em volume de madeira produzida por unidade de área no decorrer de um ano. Também possui a menor rotação

(25)

2.2 Eucalipto 24

do mundo, que equivale ao tempo decorrido entre o plantio e a colheita das árvores.

Figura 2.1: Áreas de árvores plantadas no Brasil por gênero (Ibá,2017).

As áreas plantadas de eucalipto ocupam 5,7 milhões de hectares e estão distri-buídos principalmente entre os estados de Minas Gerais (24%), São Paulo (17%) e Mato Grosso do Sul (15%). Nos últimos cinco anos, o crescimento da área de eucalipto foi de 2,4% a.a.. O estado Mato Grosso do Sul registrou aumento de 400 mil hectares em 2017, com uma taxa média de crescimento de 13% a.a. conforme pode ser observado na Figura

2.1.

Os plantios da espécie pinus ocupam 1,6 milhão de hectares e distribuem-se principalmente entre os estados do Paraná (42%) e em Santa Catarina (34%). A região Sul brasileira oferece as melhores condições de solo e clima para essa espécie.

As empresas de papel e celulose detêm 34% dos 7,84 milhões de hectares de árvores plantadas nos Brasil em 2016. Os pequenos e médios produtores que atuam em plantio para a comercialização de madeira in natura representam 29%. Adiante estão o segmento de siderurgia e carvão vegetal (14%), segmentos de painéis de madeira e pisos laminados (6%), de produtos sólidos de madeira (4%) e outros (3%) completam o quadro de distribuição de áreas de árvores plantadas no Brasil conforme a Figura2.2.

O tipo clonal é a principal prática de silvicultura do eucalipto atualmente. Ela compreende todo o processo de formação de uma floresta clonal, incluindo a seleção da árvore superior, a multiplicação vegetativa, a avaliação das árvores selecionadas em teste clonal, a produção de mudas e o estabelecimento da floresta clonal (Xavier,2002).

O clone é definido como uma população de células ou indivíduos originados por divisão assexuada a partir de uma célula, ou indivíduo. A propagação vegetativa, assexuada, não consiste em recombinação genética, o que viabiliza a cópia fiel do genótipo de um indivíduo vegetal. As plantações de espécies originadas de propagação vegetativa não possuem variabilidade genética, constituindo assim as populações mais homogêneas do que as formadas por sementes, mas tornam-se mais vulneráveis aos fatores edáficos (Raven et al.,1978).

(26)

2.3 A Forma da Árvore 25

Figura 2.2: Áreas de árvores plantadas no Brasil por estado e por gênero (Ibá,2017).

2.3

A Forma da Árvore

Dentro de uma floresta seja ela plantada ou nativa, pode-se observar a variação da forma das árvores. Esta variação ocorre de individuo para indivíduo e isso se deve a vários fatores, tais como, as condições edafoclimáticas, aos métodos de silvicultura, idade da árvore e a condição de crescimento da árvore dentro de uma determinada região (SILVA & NETO,1979).

O fuste de uma árvore é a medida que vai do toco até um determinado diâmetro limite (diâmetro comercial) ou um defeito no fuste. A forma deste fuste pode ser associada ao termo “afilamento”, ou seja, o diâmetro tende a diminuir a mediada que a altura aumenta, que é uma tendência natural que ocorre na maioria das espécies e pode ser expressa por uma função matemática que descreve a tendência dessa variação. (Machado & Calegario,2007).

Segundo Borges (1981), do ponto de vista dendrométrico a forma do fuste de árvores genericamente não se identifica com uma única configuração geométrica, mas sim com várias, de acordo com a parte do tronco analisada.

ParaLoetsch et al. (1973), o fuste das árvores coníferas e folhosas apresentam variações de formas geométricas ao longo dos seus fustes. A base do tronco é convexa e possui um ponto de inflexão variável em função da espécie e se assemelha a um sólido de revolução do tipo neilóide; a partir neilóide até a base da copa o traçado apresenta-se côncavo ao referido eixo. Em coníferas essa porção do tronco poderia ser descrita por um

(27)

2.4 Cubagem Rigorosa 26

parabolóide, enquanto que nas folhosas (das quais o eucalipto faz parte), uma parte dessa seção seria parabolóide e a parte terminal até a base da copa assemelha-se ao tronco de um cone. Esta relação pode ser observada na Figura2.3.

Figura 2.3: Sólidos de revolução de maior importância na cubagem de uma árvore (Netto,

2004).

Segundo Husch et al. (1972), os troncos das árvores podem assumir sólidos geométricos do tipo neilóide, parabolóide ou cone. Quando considerado o fuste como um único elemento, dificilmente assumirá quaisquer um destes sólidos. Portanto, o mais sensato é supor que o tronco é composto por vários destes sólidos.

Identificar pontos de transição ou limites desses sólidos, apresenta uma tarefa de difícil delimitação nos troncos. Segundo Gomes (1957), se fosse possível identificar essas limites bastaria aplicar as fórmulas geométricas e o problema na obtenção dos volumes seria resolvido. Porém, visto a impossibilidade deste processo, faz-se necessária a definição de expressões matemáticas que descrevem a forma do fuste (Figueiredo Filho et al.,1996).

2.4

Cubagem Rigorosa

A cubagem rigorosa é o método direto bastante utilizado nos inventários flores-tais para a estimação do volume de árvores. A cubagem consiste na medição sucessiva de diâmetros ao longo do fuste, dividindo-o em seções. Através dela é possível o desen-volvimento de funções matemáticas para estimar o volume de árvores em pé (Belchior,

1996).

SegundoFigueiredo Filho et al. (1996), as medições sugeridas ao longo do fuste para espécies de Eucalyptus e Pinus são: 0,05; 0,07; 1,30; 2,30 e os comprimentos das

(28)

2.4 Cubagem Rigorosa 27

seções devem ser de 1 ou 2 metros para que se possa controlar ao máximo o efeito de conicidade e que as seções sejam regulares. Scolforo et al. (1994) estabelecem as medições nos diâmetros: 0,30; 0,70; 1,30, 2,00; 3,00 e sucessivamente de 1 em 1 metro até que a altura desejada para a cubagem seja alcançada.

A Figura2.4representa o método de cubagem rigorosa em uma árvore. Onde di

indica os diâmetros medidos e hirepresenta as alturas dos respectivos diâmetros.

h

2

h

3

h

1

h

n-1

d

1

d

2

d

3

d

4

d

n-1

d

n

Figura 2.4: Exemplo da cubagem rigorosa em uma árvore.

A cubagem pode ser realizada através de métodos absolutos e relativos. Nos métodos absolutos não há relação entre o comprimento da seção e o comprimento da árvore. Já nos métodos relativos o comprimento da seção representa um percentual do comprimento da árvore, o que permite uma comparação dos volumes individuais da árvore com a mesma forma (Machado et al.,2006).

Existem diferentes métodos de cubagem rigorosa, tais como, o método de Hu-ber, Newton e Smalian. Segundo Gomes (1957), todos os métodos calculam o volume com valores divergentes, no entanto, não existem diferenças significativas entre os vo-lumes calculados. Portanto, a escolha do método a ser utilizado fica a cargo apenas do mensurador.

No Brasil, os métodos absolutos são os mais utilizados pelas empresas florestais. O método de Smalian se destaca como o mais frequente devido sua praticidade, mesmo que isso implique no abate de árvores para realizar a mensuração (Silva & Neto,1979).

De maneira restrita, o fuste de uma árvore apresenta semelhança com diferentes sólidos de revolução, entre eles: o neilóide, o parabolóide, o cilindro e o cone. Dada estas características, o fuste é dividido em seções (toras) e são aplicadas fórmulas aproximadas para obter o volume de cada seção e por fim, o volume total da árvore (Campos,1983).

Considerando o método de Smalian, o volume de cada seção pode ser obtido através da Equação2-1.

(29)

2.5 Estimativa de Volumes 28

vi= gi+ gs 2



L, (2-1)

onde vi é o volume da i-ésima seção em m3 com ou sem casca, gi é a área seccional da

seção i, gs é a área seccional da seção i + 1 e L é o comprimento da seção.

Realizado o cálculo do volume de cada seção, é efetuado o somatório de cada seção para obter o volume total da árvore conforme a Equação2-2.

v= n−1

i=1 gi+ gi+1 2 li ! +gnln 3 , (2-2) gi= (di/2) 2 π 10.000 , (2-3)

onde v é o volume total da árvore, gié a área basal na i-ésima posição, lié o comprimento

da seção na i-ésima posição, gné a área basal do cone, lné o comprimento do cone e dié

o diâmetro na i-ésima posição.

Para converter de cm2para m2a área de cada gié dividida por 10.000 conforme

a Equação5-10.

A seção de uma árvore e suas respectivas dimensões podem ser observadas na Figura2.5.

L

Figura 2.5: Ilustração da seção de uma árvore e suas dimensões.

2.5

Estimativa de Volumes

A expressão quantitativa mais usada em florestas é o volume de madeira, o qual se constitui em informação imprescindível no inventário e em planos de manejo florestal. A maneira mais precisa de determinar o volume é pelo método do deslocamento de água seguindo o Princípio de Arquimedes, ou seja, as toras são colocadas em tanques cheios de água e, a partir do deslocamento da água, obtém-se o volume delas. No entanto, essa forma de obtenção do volume é de difícil aplicação em inventários florestais devido ao tempo gasto nesse processo, tornando uma prática inviável economicamente e tecnicamente (Machado et al.,2006;Soares et al.,2011).

(30)

2.5 Estimativa de Volumes 29

Entre as diversas metodologias utilizadas para a estimação de volume. A equação de volume para as árvores individuais é a mais utilizada (Couto & Bastos,1987). Outras metodologias podem ser empregadas para se obter o volume do fuste como, por exemplo, o fator de forma, o método dos dois diâmetros e o uso das relações hipsométricas juntamente com uma equação de volume.

O volume de árvores individuais pode ser obtido a partir de medidas do diâmetro da altura do tronco da árvore (Batista, 1998). O conhecimento do volume de uma determinada área é obtido por meio do inventário quantitativo. Essa operação consiste na mensuração de amostras representativas da população, nomeadas de parcelas (Binoti et al.,2012).

Dessa forma, o volume de madeira em cada parcela advém da aplicação de modelos volumétricos que, em sua maioria, possuem dependência de árvores cubadas previamente. Atividade essa bastante onerosa e morosa no setor florestal. Portanto, foram desenvolvidos meios para realizar estimativas de modo que não seja necessário a derrubada da árvore.

Quando deseja-se obter estimativas mais precisas do estoque florestal, pode-se usar modelos matemáticos que estimam o volume para as árvores individuais e gerar tabelas de volume ou modelos que estimam o volume por unidade de área (Cabacinha,

2003).

O emprego de equações volumétricas constitui uma das principais ferramentas para quantificação da produção de povoamentos, sendo base para o manejo sustentável de plantações florestais (Leite & Andrade,2002).

De acordo comScolforo et al. (1997) os modelos volumétricos ou equações de volume podem ser divididos em três grupos: Equações de simples, dupla e tripla entrada. No modelo de simples entrada as equações devem ser utilizadas quando existe uma correlação forte entre o volume e a altura, assim pode-se afirmar que as variações na altura são bem explicadas pelo diâmetro, no caso diâmetro na altura do peito (DAP). A Tabela2.1apresenta as equações de simples entrada.

Tabela 2.1: Modelos volumétricos de simples entrada.

Autor Modelo

Kopezky-Gehrhardt V = β0+ β1DAP2+ ε

Dissescu-Meyer V = β1DAP+ β2DAP2+ ε

Hohenadl-Krenm V = β0+ β1DAP+ β2DAP2+ ε

Berkhout V = β0DAPβ1+ ε

Husch lnV = β0+ β1ln DAP + ε

Brenac lnV = β0+ β1ln DAP + β2+DAP1 + ε

(31)

homogenei-2.5 Estimativa de Volumes 30

dade entre altura e diâmetro dentro do povoamento. Nestas equações o volume é calculado em função do diâmetro e da altura sendo que existe uma forte correlação entre a altura e o diâmetro. A Tabela2.2 apresenta algumas equações de dupla entrada comumente utili-zadas.

Tabela 2.2: Modelos volumétricos de dupla entrada.

Autor Modelo

Spurr V = β0+ β1DAP2Ht+ ε

Spurr (log) lnV = β0+ β1ln(DAP2Ht) + ε

Schumacher-Hall V = β0DAPβ1Htβ2+ ε

Schumacher-Hall (log) lnV = β0+ β1ln DAP + β2ln Ht+ ε

Honner V = DAP2

β0+β1Ht1 + ε

Ogaya V = DAP2(β0+ β1Ht)

Stoate V = β0+ β1DAP2+ β2DAP2Ht+ β3Ht+ ε

Naslund V = β1DAP2+ β2DAP2Ht+ β3DAPH2t + β4H2t + ε

Takata V = DAP2Ht

β0+β1DAP+ ε

Meyer V = β0+ β1DAP+ β2DAP2+ β3DAPHt+ β4DAP2Ht+ β5Ht+ ε

Por último, no modelo de tripla entrada o volume é estimado em função do DAP, da altura total e de uma medida que expressa a forma da árvore. Este tipo de modelo não é recomendável, pois, a forma da árvore é uma variável difícil de ser quantificada, e quando é realizada a cubagem rigorosa, esta já é controlada.

Entre os vários modelos existentes, observado na tabela anterior, para expressar o volume de madeira em função dos diâmetros da altura, o modelo proposto por Schu-macher e Hall é um dos mais difundidos na área florestal, devido às suas propriedades estatísticas, uma vez que resulta em estimativas quase sempre não tendenciosas (Leite & Andrade,2002);

Outro modelo bastante difundido é variação de Schumacher e Hall em sua forma linearizada, logarítmica, conhecido também como Schumacher e Hall logarítmico ou simplesmente, Schumacher e Hall (log) (Cabacinha, 2003). O modelo de Schumacher e Hall (log) é uma equação volumétrica de dupla entrada que estima o volume das árvores a partir do diâmetro na altura do peito DAP , ou dbh, e da altura total (Ht) (Soares,2012).

(32)

CAPÍTULO

3

Redes Neurais Artificiais

As redes neurais são uma estrutura maciçamente paralela com a habilidade de generalização, ou seja, podem produzir saídas adequadas para entradas que não estavam presentes durante a fase de treinamento. A capacidade de generalização é o que diferencia a rede neural dos demais algoritmos de aprendizagem que processam apenas os dados que lhe foram apresentados (MONTGOMERY & JUNIOR,2007).

Segundo Silva et al. (2010) as redes neurais são modelos computacionais inspirados no sistema nervoso dos seres vivos. Possuem a capacidade de aquisição e manutenção do conhecimento e podem ser definidas como um conjunto de unidades de processamento, caracterizadas por neurônios artificiais, que são interligados por um grande número de interconexões (sinapses artificiais).

Neste capítulo será abordado um breve estudo sobre redes neurais, partindo do histórico, suas principais arquiteturas, funções de ativação e algoritmos de treinamento.

3.1

Introdução

As redes neurais buscam alcançar bons resultados baseados na densa intercone-xão de elementos computacionais simples. A estrutura de uma rede neural é baseada no conhecimento que temos do funcionamento do nosso sistema nervoso biológico ( Lipp-mann,1987).

Elas podem ser resumidas como um sistema computacional feito por uma série de elementos de processamentos simples, altamente conectados, cuja informação é processada a partir de entradas de informação externas. (Hecht-Nielsen,1992).

De modo geral, uma rede neural é uma máquina projetada para modelar a maneira como o cérebro realiza uma tarefa em particular ou uma função de interesse. Para alcançarem bom desempenho, as redes neurais empregam uma interligação maciça de células computacionais denominadas neurônios ou unidades de processamento (Haykin,

2001).

O funcionamento do cérebro humano é regido por processadores biológicos in-terligados operando em paralelo produzindo diferentes ações que regem o comportamento

(33)

3.2 Um breve histórico sobre redes neurais 32

humano, como pensar e memorizar. O neurônio é a principal célula responsável por con-duzir estímulos elétricos produzidos por reações físico-químicas. Basicamente o neurônio pode ser divido em três partes:

• Dendritos: são responsáveis por captar continuamente estímulos vindos de outros neurônios ou do próprio meio.

• Corpo celular ou soma: estrutura onde são processadas as informações obtidas através dos dendritos que indicará se o neurônio poderá disparar o impulso elétrico para o axônio.

• Axônio: constituído por um único filamento é responsável por propagar os impulsos elétricos para outros neurônios ou diretamente para o tecido muscular.

Os sinais são recebidos pelos dendritos, processados pelo corpo celular e caso ativado pelo neurônio são passados adiante através do axônio e suas ramificações. A Figura3.1apresenta o modelo de neurônio biológico.

Figura 3.1: Modelo de um neurônio biológico (Silva et al.,2010).

O processo de comunicação entre os dendritos e o axônio é dado através de li-gações sinápticas. As sinapses são locais onde ocorre a passagem de informação dessas células. Essas passagens são realizadas por de uma substância química, um neurotrans-missor, eles podem excitar novos impulsos nervosos ou inibir a passagem de novos im-pulsos. As sinapes tem possuem importância fundamental no processo de aprendizagem (Cosenza & Guerra,2009). A Figura3.2ilustra o processo de conexão sináptica.

3.2

Um breve histórico sobre redes neurais

As pesquisas sobre redes neurais artificiais tiveram início por volta da década de 40 quando McCulloch & Pitts (1943) publicaram o primeiro artigo relacionado

(34)

3.2 Um breve histórico sobre redes neurais 33

Figura 3.2: Processo de transmissão de impulsos nervosos por meio da fenda sináptica (Canto,2004).

a neurocomputação. Nesta publicação os autores desenvolveram o primeiro modelo matemático de um neurônio biológico, lançando a primeira ideia de um neurônio artificial. Neste modelo inicial, um neurônio era capaz de executar uma função lógica e os nós produziam resultados binários que eram transmitidos. Este processo era é alusão ao neurônio biológico onde os disparos para um próximo neurônio podem ser transmitidos ou não pelos neurotransmissores. No modelo artificial, esse neurotransmissor era definido por um limiar (treshold).

No ano de 1949, o neurofisiologista Donald Hebb publicou o livro denominado The Organization of Behavior(Hebb, 1949). Neste livro Hebb apresentou uma formula-ção explícita sobre a regra de aprendizagem, deixando em evidência que o processo de aprendizagem ocorria por meio de modificações sinápticas (Haykin,2001).

O trabalho de Hebb serviu de inspiração para o desenvolvimento de diversos modelos matemáticos fundamentados no princípio biológico e na regra de aprendizagem. Durante a década de 50, Frank Rosenblatt desenvolveu o primeiro neurocomputador, denominado Mark I - Perceptron, onde fora idealizado o modelo inicial de Perceptron (Rosenblatt,1958).

Os perceptrons tornaram-se famosos por serem capazes de reconhecer padrões linearmente separáveis, mas foram suficientes para despertar o interesse de muitos pes-quisadores. Nos anos 60,Widrow & Hoff(1994) desenvolveram a rede denominada Ada-line (Adaptive Linear Element). Posteriormente, em 1962, os pesquisadores propuseram a Adaline múltipo, chamada Madaline. Nesta nova abordagem, foi introduzido um novo algoritmo de aprendizagem que ficou conhecido como LMS (Leat Mean Square).

No ano de 1969, após alguns anos de pesquisas relacionadas a neurocomputação, a publicação do trabalho deMinski & Papert(1969) provaram matematicamente de forma enfática as limitações das redes neurais de uma única camada, tal como, Perceptrons

(35)

3.3 Perceptron de Múltiplas Camadas 34

e Adaline. As redes até então difundidas não eram capazes de resolver problemas de classificação de padrões que não são linearmente separáveis.

Após a publicação deMinski & Papert(1969) muitos pesquisadores desistiram de trabalhar com redes neurais, além disso, a limitação tecnológica pela falta de com-putadores pessoais ou estações de trabalho para realizar os experimentos. Para alguns pesquisadores, a década de 70 pode ser considerada como a década do adormecimento das redes neurais (Haykin,2001).

No entanto, ainda na década de 70 alguns trabalhos buscaram resolver as limi-tações das redes neurais. No fim dos anos 60, Grossberg (1968) propôs um modelo de adição de um neurônio por meio de equações diferenciais. Amari (1972) propôs usar o modelo aditivo de um neurônio para estudar o comportamento dinâmico de neurônios conectados de forma aleatória. Em 1974, Werbos (1974) propôs resolver problemas de regressão utilizando gradiente reverso.Little & Shaw(1975), desenvolveram um modelo probabilístico de neurônio que pode disparar ou não um potencial de ação, assim, de-senvolveram um modelo de teoria de memória de curto prazo. Anderson et al. (1977) propuseram um modelo do estado cerebral em uma caixa, uma rede associativa simples utilizando uma dinâmica não linar.Kohonen(1982) propôs a formulação de mapas auto-organizáveis. Somente em 1982, com a publicação de Neural networks and physical sys-tems with emergent collective computational abilities, de Hoppefield, que as pesquisas sobre redes neurais foram retomadas. Ele propôs redes neurais recorrentes baseadas em função de energia, mostrando que a memória da rede neural estaria entre as conexões sinápticas (Hopfield,1982).

No final dos anos 80, a evolução dos computadores, criação de novos algoritmos de optimização e novas descobertas sobre o sistema nervoso biológico, foram alguns dos fatores que retomaram as pesquisas em redes neurais. Em 1986, com o trabalho de Ru-melhart et al. (1986) que apresentou o algoritmo de retropropagação (backpropagation) e a publicação do livro Parallel distributed processing, (Rumelhart & McClelland,1986) tornou-se possível treinar de perceptrons de múltiplas camadas.

O algoritmo de retropropagação passou a ser a principal técnica para treinamento de redes neurais de múltiplas camadas. Este marco motivou de forma definitiva a retomada de pesquisas sobre as redes neurais.

3.3

Perceptron de Múltiplas Camadas

A dificuldade das redes neurais em resolver problemas linearmente não sepa-ráveis, por exemplo, o XOR, apresentou como a principal limitação dos perceptrons. O avanço nos estudos na área criou novas estratégias para contornar e resolver esse pro-blema. Posteriormente, surgiram estratégias de adicionar camadas intermediárias entre

(36)

3.3 Perceptron de Múltiplas Camadas 35

a camada de entrada e saída. Essa estratégia ficou conhecida pelo nome de Multilayer Perceptron - MLP.

As redes perceptron de múltiplas camadas consistem essencialmente de uma camada de entrada, uma ou mais camadas intermediárias, ou “ocultas” e uma camada de saída. Nesta arquitetura, os estímulos ou dados são apresentados a rede pela camada de entrada, estes sinais são propagados para frente sem nenhuma alteração (feedforward) para as camadas intermediárias, denominadas camadas ocultas, elas são capazes de extrair informações e representá-las através do ambiente em que estão inseridas. Por fim, essas informações são propagadas para os neurônios da camada de saída, produzindo as respostas referentes aos dados de entrada.

O fluxo de transmissão da informação inicia-se na camada de entrada, atravessam a camada intermediária e é finalizado na camada de saída. A Figura 3.3 apresenta a arquitetura básica de uma MLP clássica.

Figura 3.3: Perceptron de Múlti-Camadas (Silva et al.,2010).

Diferentemente do perceptron simples, onde um único neurônio é responsável por todo mapeamento de um processo, as MLPs podem ser configuradas para conectar to-dos os neurônios de uma camada para a camada seguinte e então realizar o processamento que irá definir o comportamento do conjunto entrada/saída de um treinamento.

Os neurônios são arranjados em camadas (layers), a camada de entrada passará as informações para as camadas intermediárias. A quantidade de camadas intermediárias é estabelecida conforme o problema a ser tratado, elas levarão a informação para a próxima camada, da esquerda para a direta. A saída de uma MLP é, portanto o resultado do ajuste dos pesos nas camadas intermediárias. Os neurônios de uma camada podem se conectar com outras camadas, mas, não com os neurônios da própria camada (Gibson et al.,1989).

(37)

3.4 Algoritmo de Retropropagação - Backpropagation 36

Nas camadas ocultas de uma MLP, o ajuste dos pesos é realizado através de aprendizado supervisionado, onde, para um conjunto de amostra de entrada espera-se a respectiva saída. Cada neurônio de uma camada oculta ou de saída é projetado para calcular a saída de um sinal por meio de uma função não linear e calcular o valor do gradiente para minimizar o erro. O cálculo do valor do gradiente é realizado através do algoritmo de retropropagação (backpropagation), sendo o principal algoritmo utilizado para o treinamento das redes de múltiplas camadas.

3.4

Algoritmo de Retropropagação - Backpropagation

O algoritmo de retropropagação é um dos principais algoritmos utilizados para o treinar redes neurais. Ele busca se aproximar do mínimo global através da descida do gradiente. O algoritmo pode ser entendido como uma generalização do least mean square - (LMS) (Leung & Haykin,1991).

A retropropagação é baseada na regra de aprendizagem de correção de erro. O algoritmo aplica dois passos fundamentais durante o processo de aprendizagem: um passo para frente (feedforward), denominado propagação e um passo para trás (backward), no sentido inverso da rede, denominado retropropagação.

Dado um conjunto de dados de entrada da rede, os mesmos são passados camada a camada até gerarem um padrão de saída correspondente a resposta da rede. No passo seguinte, durante a retropropagação, os pesos dos neurônios de cada camada são reajustados consoante a regra de correção de erro. O cálculo do erro ocorre quando o resultado de resposta produzido na saída da rede é subtraído da resposta alvo. Por fim, o erro é propagado no sentido inverso das conexões sinápticas. (Haykin,2001).

A regra da cadeia de cálculo é utilizada para calcular as derivadas de funções formadas pela composição de outras funções onde os valores derivados já são conhecidos. O backpropagation calcula a regra da cadeia com uma ordem específica e de maneira eficiente (Goodfellow et al.,2016).

O sinal de erro na saída de um neurônio j, é calculada através da diferença entre a saída desejada ydj(n) e a resposta da rede yj(n). O cálculo do erro ej(n) é obtido através

da Equação3-1.

ej(n) = ydj(n) − yj(n) (3-1) O valor da energia do erro quadrático para o neurônio j é definido por 12(ej(n))2. Somando-se os termos de todos os neurônios da camada de saída, obtém-se o valor instantâneo da energia total do erro. A Equação3-2apresenta a equação deste processo.

(38)

3.4 Algoritmo de Retropropagação - Backpropagation 37

ε(n) =1

2

j (ej(n))

2 (3-2)

Considerando que N seja o número total do conjunto de treinamento. A energia do erro quadrático médio é obtido pela soma do erro ε(n) para todos os n e então, normalizado em relação ao tamanho do conjunto N, conforme a Equação3-3.

E = 1 N N

n=1 ε(n) (3-3)

O processo de treinamento têm por objetivo, ajustar os pesos da rede para minimizar a função de custo. Considerando um nerônio j, vj(n), que possui como entrada

um conjunto de sinais oriundos de uma camada anterior, a ativação interna deste neurônio é dada pela função de ativação da saída dos neurônios que estão conectados ao neurônio jpor meios dos pesos w[ ji] conforme a Equação3-4, onde p é o número de neurônios da

camada anterior ao neurônio j.

vj(n) =

p

i=0

wji(n)yi(n) (3-4)

Posteriormente, a saída do neurônio j é um valor real produzido através de uma função não linear, como mostrado na Equação3-5.

yj(n) = fj(vj(n)) (3-5) Para realizar o reajuste do peso wi j(n) e minimizar e função de custo, o

backpro-pagationaplica o método do gradiente descendente. O ajuste a ser realizado é proporcio-nal a derivada parcial ∂ε(n)

∂wi j(n) em relação a cada peso da rede. De acordo com da regra da

cadeia de cálculo, o gradiente pode ser obtido através da seguinte Equação3-6. ∂ε(n) ∂wi j(n) = ∂ε(n) ∂ej(n) ∂ej(n) ∂yj(n) ∂yj(n) ∂vj(n) ∂vj(n) ∂wj(n) (3-6) Aplicando a diferenciação da Equação3-1em relação a yj(n), (3-2) em relação

a ej(n),3-4em relação a wji(n), (3-5) em relação a vj(n) e substituindo na Equação3-6,

obtém-se como resultando a Equação3-7. ∂ε(n) ∂wi j(n)

= −e j(n) f0j(vj(n))yi(n) (3-7)

Os ajustes nos pesos de ∆wi j é realizado em direção oposta ao gradiente através

da Regra Delta. A constante η na Equação3-8representa a taxa de aprendizagem, o sinal de negativo indica a descida do gradiente em relação ao espaço de pesos.

(39)

3.4 Algoritmo de Retropropagação - Backpropagation 38

∆wji(n) = −η

∂ε(n) ∂wi j(n)

(3-8) A aplicação da Equação3-7na Equação3-8gera a Equação3-9.

∆wji(n) = ηδ(n)yi(n) (3-9)

Onde o gradiente local δj(n) é definido pela Equação3-10

δj(n) = − ∂ε(n) ∂ej(n) ∂ej(n) ∂yj(n) ∂yj(n) ∂vj(n) = ej(n) f 0 j(vj(n)) (3-10)

Conforme mostrado nas equações 3-9 e 3-10 a atualização dos pesos depende sinal de erro ej(n) para o gradiente local. Para tal, é necessário saber a localização do

neurônio j, sendo que o mesmo pode estar na camada de saída ou na camada oculta. Caso o neurônio j esteja localizado na camada de saída, o erro pode ser calculado através da Equação3-1. Portanto, o δj(n), é igual ao produto da derivada da função de ativação e o

erro ej(n), como pode ser observado na Equação3-11.

δj(n) = ej(n) f

0

j(vj(n)) (3-11)

No entanto, caso o neurônio j esteja localizado na camada intermediária, o sinal de erro e j(n) pode ser calculado em termos dos neurônios em que j esteja conectado. Dessa maneira, para calcular o gradiente local δj(n), a Equação 3-10pode ser reescrita

da seguinte forma. δj(n) = − ∂ε(n) ∂yj(n) ∂yj(n) ∂vj(n) = −∂ε(n) ∂yj(n) f0j(vj(n)) (3-12)

A Equação3-13é utilizada para calcular a derivada parcial ∂ε(n)/∂yj(n) e obter

o erro quadrático do neurônio k.

ε(n) =1

2

k (ek(n))

2

(3-13)

Diferenciando a Equação 3-13 em relação ao sinal yj(n), obtêm-se a Equação

3-14. ∂ε(n) ∂yj(n) =

k ek(n) ∂ek(n) ∂yj(n) (3-14)

Utilizando a regra da cadeia para a derivada parcial ∂ek(n)/∂yj(n), a Equação

(40)

3.4 Algoritmo de Retropropagação - Backpropagation 39 ∂ε(n) ∂yj(n) =

k ek(n)∂ek(n) ∂vk(n) ∂vk(n) ∂yj(n) (3-15)

O sinal de erro do ek(n), onde k é o neurônio de saída, pode ser obtido pela

Equação3-16.

ek(n) = ydk(n)yk(n) = ydk(n) fk(vk(n)) (3-16) Já o nível de ativação do neurônio k é calculado através da Equação3-17, onde q, representa o número de entradas conectadas ao neurônio k.

vk(n) =

q

j=0

wk j(n)yj(n) (3-17)

Realizando a diferenciação da Equação3-16em relação a yj(n) e substituindo na

Equação3-14, obtém-se a Equação3-18, onde δj(n), representa o campo local induzido

do neurônio k. ∂ε(n) ∂yj(n) = −

k ek(n) fk0(vk(n))wk j(n) = −

k δk(n)wk j(n) (3-18)

Por fim, substituindo a Equação3-18na Equação3-13, obtemos o gradiente local δj(n) para o neurônio intermediário j, que pode ser calculado através da Equação3-19.

δj(n) = f

0

j(vj(n))

k

δk(n)wk j(n) (3-19)

Como pode ser observado na Equação3-19, caso o neurônio j esteja localizado na camada intermediária, o gradiente local δj(n) será obtido pelo produto da derivada

da função de ativação com a soma ponderada dos gradientes locais calculados para os neurônios conectados ao neurônio j.

Resumidamente, durante a primeira fase, o backpropagation realiza o processo forward sem alterar os pesos das camadas da rede neural. A fase forward inicia com a entrada das informações através da camada de entrada e encerra com o cálculo de erro na camada de saída.

A segunda fase backward inicia através da camada de saída e propaga por todas as camadas da rede até a camada de entrada. Os pesos são ajustados inicialmente na camada de saída, e propagados recursivamente ajustando os pesos de todas as camadas intermediárias até a camada de entrada.

(41)

3.5 Funções de Ativação 40

3.5

Funções de Ativação

As funções de ativação são elementos essenciais para a ativação dos neurônios de uma MLP, através delas é possível calcular o gradiente local de um neurônio. Seu principal objetivo é a introdução da não linearidade. Para tal, é necessário que a função de ativação seja diferenciável, caso contrário, a rede neural não passaria de um modelo de regressão linear.

Em outras palavras, as funções de ativação limitam a amplitude da saída de um neurônio (Karlik & Olgac, 2011). Existem diversas funções de ativação, umas das mais utilizadas é a função logística, ela é diferenciável e mapeia os valores de 0 a 1 conforme a Equação3-20.

yi(n) = fj(vj(n)) = 1

1 + exp−vj(n) (3-20)

Onde vj(n) é a ativação do neurônio j no instante n. Dada a não linearidade, a

saída do neurônio j está no intervalo de 0 ≤ yj≤ 1. Diferenciando a Equação 3-20 em

relação a vj(n), obtemos a Equação3-21.

f0(vj(n)) =

exp(−vj(n))

[1 + exp(−vj(n)))]2 = yj(n)[1 − yj(n)] (3-21)

A função tangente hiperbólica assemelha-se a função logística mantendo o formato de S., no entanto, essa função é capaz de mapear valores no intervalo de −1 ≤ yj≤ 1. A tangente hiperbólica possui a seguinte forma.

yi(n) = fj(vj(n)) = a tanh (bvj(n)) (3-22)

Diferenciando a Equação3-22em função de vj(n), obtemos a Equação3-23.

f0(vj(n)) =

b

a[a − yj(n)][a + yj(n)] (3-23) A Rectified Linear Units - ReLU, é uma função de ativação amplamente utilizada ao projetar redes neurais nos trabalhos recentes. Assim como as demais funções, a ReLU é diferenciável, o que permite o ajuste dos pesos.

Contudo, a principal vantagem de usar a função ReLU sobre outras funções de ativação é que ela não ativa todos os neurônios ao mesmo tempo. Caso a entrada seja negativa, ela será convertida em zero e o neurônio não será ativado. Isso significa que, ao mesmo tempo, apenas alguns neurônios são ativados, tornado a rede mais eficiente e facilitando a computação (Nair & Hinton, 2010). A Figura3.4 apresenta o gráfico da função ReLU.

(42)

3.6 Taxa de Aprendizagem 41

Figura 3.4: Rectified Linear Activation (Goodfellow et al.,2016).

3.6

Taxa de Aprendizagem

Durante o processo de treinamento, o ajuste dos pesos é realizado através da descida do gradiente. A direção é dada pelo gradiente da superfície de erro no ponto atual no espaço. A magnitude da modificação é uma proporção constante da magnitude do gradiente. Especificamente, cada peso é ajustado por uma proporção constante η da derivada parcial do erro em relação ao peso. Essa proporção é comumente referida como taxa de aprendizado ou tamanho do passo (Jacobs,1988).

Em outras palavras, a taxa de aprendizagem η é uma constante de proporciona-lidade que varia de 0 a 1. Este ajuste é o que indicará o passo da descida do gradiente em direção ao mínimo global.

A escolha da taxa de aprendizagem deve considerar o problema a ser resolvido. A aplicação de uma taxa de aprendizagem muito alta pode provocar instabilidade na rede visto que os saltos do gradiente serão altos e podem provocar a saturação dos neurônios.

Por outro lado, o uso de uma taxa de aprendizagem com um valor muito pequeno, irá provocar poucas mudanças na descida do gradiente. Isso provoca o aumento do custo de computação, elevando o tempo de processamento visto que muitas iterações serão necessárias até que a rede alcance a convergência.

Rumelhart et al. (1986) apresentam uma alternativa para aumentar a taxa de aprendizagem contornando o problema de instabilidade. O método consiste em modificar a regra delta introduzindo o momentum. A Equação3-24apresenta a Regra Delta Gene-ralizada, onde η é a constante momentum que varia no intervalo de [0,1).

∆wji(n) = αji(n − 1) + ηδj(n)yi(n) (3-24)

Referências

Documentos relacionados

A par disso, analisa-se o papel da tecnologia dentro da escola, o potencial dos recursos tecnológicos como instrumento de trabalho articulado ao desenvolvimento do currículo, e

nesta nossa modesta obra O sonho e os sonhos analisa- mos o sono e sua importância para o corpo e sobretudo para a alma que, nas horas de repouso da matéria, liberta-se parcialmente

No entanto, maiores lucros com publicidade e um crescimento no uso da plataforma em smartphones e tablets não serão suficientes para o mercado se a maior rede social do mundo

3.3 o Município tem caminhão da coleta seletiva, sendo orientado a providenciar a contratação direta da associação para o recolhimento dos resíduos recicláveis,

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam

(2019) Pretendemos continuar a estudar esses dados com a coordenação de área de matemática da Secretaria Municipal de Educação e, estender a pesquisa aos estudantes do Ensino Médio

Quando contratados, conforme valores dispostos no Anexo I, converter dados para uso pelos aplicativos, instalar os aplicativos objeto deste contrato, treinar os servidores

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e