Inteligência Artificial - MATERIAL E MÉTODOS

3. MATERIAL E MÉTODOS

3.3. Inteligência Artificial

A técnica de Rede Neural Artificial (RNA) faz parte da chamada inteligência artificial computacional que se caracteriza por ser um ramo de pesquisa da Ciência da Computação. As RNAs foram apresentadas pela primeira vez em 1943, pelo neurofisiologista McCulloch, e matemático Walter Pitts (MCCULLOCH e PITTS, 1943). O modelo de McCulloch e Pitts era constituído de apenas uma saída e uma função de entrada, calculada através da soma ponderada de diversos valores. Esse modelo assemelha-se com o neurônio humano, em que sinais são recebidos pelo mesmo com intensidades diferentes, provocando uma determinada reação por parte da célula nervosa. Embora, biologicamente, inspiradas no neurônio humano, a RNA encontra aplicações em diferentes áreas científicas.

A RNA pode representar poderoso método de previsão que se baseia em modelo matemático simples do cérebro humano. Uma RNA permite relações complexas não-lineares entre a variável de resposta e seus preditores. O procedimento usual na solução de problemas com RNA, inicialmente, trata-se da fase de “aprendizagem”, em que um conjunto de exemplos é apresentado à rede considerada que, por sua vez, extrai automaticamente as características necessárias para representar a informação fornecida. Essas características são utilizadas para gerar as respostas do problema e desta maneira, capacidade de “aprender” através de exemplos e de generalizar a informação aprendida é, sem dúvida, o atrativo principal da solução de problemas via RNA (DE GENNARO et al., 2013). Essa capacidade de aprendizado por parte da RNA vem sendo muito útil para previsão de séries temporais, em especial por sua capacidade de conseguir representar características (não-linear) da série em estudo (ZHANG, 2003; LIU,TIAN e LI, 2012; WANG et al., 2013).

Uma RNA pode ser pensada como uma rede de “neurônios” organizados em camadas. Os preditores (ou entradas xt-i) formam a camada inferior, e as previsões (ou saídas yt+h)

formam a camada superior. Pode haver camadas intermediárias que contenham “neurônios ocultos”. Na Figura 7 apresentar-se um exemplo para a estrutura de uma RNA com cinco entradas e com uma camada oculta. No caso da adição de uma camada intermediária com neurônios ocultos, conforme apresentado, a rede neural torna-se nonlinear, conhecida como uma MultiLayer Feed-Forward Neural Networks (MLFNN), termo do inglês muito usado em RNA cuja tradução para o português é Rede Neural Multicamadas Alimentação Direta ou Avante), em que cada camada recebe entradas das camadas anteriores. Os coeficientes ligados aos preditores são chamados de "pesos" e comumente representado por wi, Os pesos são

selecionados através de um "algoritmo de aprendizagem", como é o caso da backpropagation (que surge do fato que o algoritmo se baseia na retropropagação dos erros para realizar os ajustes de pesos das camadas intermediárias), que minimiza o erro entre as séries temporais previstas e observadas (DE GENNARO et al., 2013). Em resumo a entrada 1

x de cada neurônio recebe um peso inicial

1 i

w , ou seja, é multiplicada por uma conexão ajustável, geralmente, denominado peso sináptico. Para cada neurônio, os pesos devidos aos estímulos de entrada são somados e um valor de “bias”

b (que significa erro de tendência) é adicionado. Essa combinação de entradas (termo traduzido do inglês - summing junction, muito usado em RNA) σj passa através de uma função de ativação não-linear, representada em termos de uma

função sigmóide para em seguida gerar a saída Y, ou seja, a série temporal prevista propriamente dita. É importante ressaltar que a saída de um neurônio vem ser posteriormente a entrada dos neurônios das camadas seguintes.

Figura 7 - Representação de estrutura de Redes Neurais Artificiais.

Fonte: Elaborada pelo autor.

Na estrutura da RNA, as saídas de nós em uma camada são entradas para a próxima camada. O resultado é, em seguida, modificado por uma função não linear antes da saída. Por exemplo, as entradas em neurônios j em camadas ocultas podem ser linearmente combinadas a partir da Equação (9):

𝜎 = 𝑏 + ∑ 𝑤, 𝑥 , (9)

em que bj, e wi,j são parâmetros descobertos na etapa de “aprendizagem” a partir dos dados

observados da série temporal em questão. Vale ressaltar que os pesos, inicialmente, podem assumir valores aleatórios, por sua vez, serão atualizados usando os dados observados. Na camada oculta, a Equação (9) é modificada utilizando uma função não linear, tal como um sigmóide dada pela Equação 10:

𝑠(𝜎𝑗) = (10)

A Equação (10), por sua vez, serve de entrada para a camada seguinte, uma vez que essa estratégia tende a reduzir o efeito de valores extremos de entrada, proporcionando um melhor funcionamento da RNA. Maiores detalhes sobre a utilização de RNA para previsão de séries temporais podem ser obtidos em Zhang, Patuwo e Hu (1998). Na literatura é possível destacar trabalhos sobre a utilização de RNA para previsão de série temporal da velocidade do vento, por exemplo, em Flores, Tapia e Tapia (2005). Os autores realizaram previsões das velocidades dos ventos em uma fazenda eólica, usaram Redes Neurais Artificiais. A RNA baseou-se no algoritmo de aprendizagem backpropagation, cuja avaliação foi realizada com medição de dados reais de duas diferentes localizações. Li e Shi (2010) utilizaram três diferentes formas de RNA para previsão de velocidade do vento horária a partir de dados observados em duas localidades de Dakota do Norte dos EUA. Os três tipos de RNA utilizados são Adaptive Linear Element (Adaline) (cuja tradução em português é Elemento Adaptativo Linear), backpropagation e Radial Basis Function (RBF) (cuja tradução para o português é Função de Base Radial).

De acordo com Zhang, Patuwo e Hu (1998), uma das técnicas de inteligência computacional, comumente usada na tentativa de prever séries temporais é o treinamento de RNA. Essas são baseadas na arquitetura e aprendizagem do cérebro humano. As RNAs funcionam conceitualmente de forma similar ao cérebro humano, ou seja, tentam reconhecer regularidades e padrões de dados, capazes de aprender com a experiência e fazer generalizações baseadas no seu conhecimento previamente acumulado. As RNAs em sua estrutura podem possuir ambos modelos não-linear e linear e assim obter melhores resultados quando comparados com outros modelos de previsão (ZHANG, 2003). A utilidade das RNAs, nesta Tese de Doutorado, reside no fato de que as mesmas serão importantes para simular a parte não-linear das séries temporais das velocidades dos ventos das regiões de estudo, uma vez que, os modelos lineares ARIMA e HW não são capazes de tal feito.

No documento Modelos híbridos estocástico - matemático para previsão de velocidade do vento (páginas 56-59)