Fases de desenvolvimento de uma RNA - Redes Neuronais Artificiais

3. ESTADO DO CONHECIMENTO

3.3. Redes Neuronais Artificiais

3.3.5. Fases de desenvolvimento de uma RNA

Para trabalhar com uma RNA são necessárias estágios até ela estar apta a ser usada, sendo a preparação de dados, o treino, o teste e a previsão da rede as quatro fases que a constituem o seu desenvolvimento (Palisade, 2013). De seguida, prossegue-se à sua descrição e explicação.

1º Estágio - Preparação dos dados

O grande objetivo desta fase é a preparação dos dados de input, definir qual o conjunto de dados a utilizar, optando por quais as variáveis de entrada que realmente interessam no processo e identificar quais as variáveis de saída, por outras palavras, aquelas com as quais se pretende fazer a previsão (Lingireddy e Brion, 2005). Uma boa compreensão do processo a modelar é o primeiro passo para que a preparação dos dados seja positiva para a implementação da RNA. Estes dois passos são fundamentais para evitar erros ou a utilização de dados menos fiáveis, que poderão resultar como um mau treino da rede.

Segundo Lingireddy e Brion (2005), esta é a etapa mais longa, devido à recolha extensa de dados e às decisões a tomar sobre as variáveis a escolher ou dados a rejeitar, tendo um grande peso na continuação do processo.

Existem dois fatores que são muito importantes no que diz respeito à base de dados, a quantidade e a qualidade. O primeiro fator, facilita a compreensão por parte da rede das relações existentes entre dados, pelo que um maior número de casos é favorável para o trabalho com as RNA, não só melhora o desempenho da rede como a capacidade de generalização

aumenta. Relativamente ao segundo fator, é importante que se assegure qualidade nos dados para que os resultados obtidos sejam credíveis, aumentando a fiabilidade dos dados escolhidos. Quando a base de dados está definida, esta vai dividir-se em três conjuntos: conjunto de treino, conjunto de teste e conjunto de validação. O conjunto de treino é aquele que alberga a maior quantidade de casos, casos esses que são conhecidos e que serão utilizados no processo de aprendizagem da rede. O conjunto de teste é utilizado para avaliar a capacidade de generalização da rede, isto é, o valor que se pretende prever é conhecido e será comparado com aquele que é obtido. E por último, mas não sendo de carácter “obrigatório”, existe o conjunto de validação, que serve para confirmar resultados considerados aceitáveis na fase de teste, certificando a capacidade de generalização da rede.

2º Estágio: Treino da RNA

Como já foi referido, nesta etapa todos os valores do conjunto de dados escolhidos para o treino são conhecidos e pretende-se que através dos dados de entrada, sejam obtidos resultados de output o mais próximo possível dos valores reais. É nesta fase que é feito o processo de aprendizagem de forma a ajustar os parâmetros de computação da rede (Palisade, 2013).

O processo é orientado pelos dados utilizados para o treino e pelo algoritmo de treino (Silva, 2014). O algoritmo de treino seleciona vários conjuntos de parâmetros e avalia-os aplicando a RNA a cada caso de treino, fazendo uma comparação com os valores de output reais conhecidos através das resposta que a rede fornece. Este algoritmo tem a capacidade de escolher novos conjuntos de parâmetros tendo em conta os resultados que foram obtidos nas tentativas anteriores.

Cada conjunto de parâmetros designa-se por trial, ou tentativa, e um caso de treino corresponde a uma linha de informação do conjunto de dados (Silva, 2014).

O treino de uma rede MLF consiste em encontrar um conjunto de pesos de conexão e de termos constantes que façam com que a rede forneça respostas corretas face a novos casos. Inicialmente o treino começa com a atribuição aleatória de um conjunto de conexões, o que pode diferir do valor real, existindo um valor de erro para cada caso. Assim, continua-se a fase de treino, em que as atribuições dos pesos das conexões deixam de ser aleatórias, sendo decididas pelo algoritmo de treino, baseando-se nas tentativas já feitas. O objetivo é minimizar esse valor de erro através dessas mudanças para que a diferença média quadrática entre a

resposta correta e a resposta dada pela rede seja mínima – minimização do erro médio quadrático (Palisade, 2014). Já o treino de uma rede GRNN consiste em otimizar os fatores de suavização para minimizar o erro do conjunto de treino.

3º Estágio: Teste da RNA

É nesta fase do processo que se verifica o desempenho da rede treinada. Por outras palavras, verifica-se a capacidade de prever valores de output conhecidos mas que não faziam parte do conjunto de treino (Palisade, 2013). É um processo mais rápido do que o treino da RNA e informa a qualidade da previsão de respostas conhecidas nos dados de teste, ajudando assim a saber se a rede fará boas previsões na fase seguinte. Para tal, a RNA é avaliada estatisticamente, oferecendo informação acerca das respostas que foram previstas incorretamente (percentagem) e calcula também o seu erro médio quadrático. Assim, a rede que tiver menor erro médio quadrático na fase de teste, bem como uma menor percentagem de previsões erradas, é considerada uma melhor rede para a previsão de valores de output novos, pois oferece maiores garantias de sucesso (Silva, 2014).

4º Estágio: Previsão

O objetivo principal da utilização de redes neuronais artificiais é fazer previsões (Palisade, 2013). Aqui é utilizada a rede que já foi treinada e testada para que agora possa ser utilizada com valores de output desconhecidos.

O processo de treino e teste é interativo e longo, comparativamente à previsão. O treino pode ser feito várias vezes, com configurações de rede diferentes, até ser apresentada uma rede que na fase de teste mostre melhores resultados. Para tal as redes têm de adquirir capacidade de generalização necessária para que seja assim possível escolher a melhor e efetuar previsões com um certo grau de confiança.

No documento Utilização de redes neuronais artificiais na gestão do processo de digestão anaeróbia (páginas 79-81)