O hist´orico - Redes Neurais (NN) - Uma comparação de métodos de classificação aplicados à dete

4.2 Redes Neurais (NN)

4.2.2 O hist´orico

Agora que temos uma pequena idéia do funcionamento do neurônio, podemos introduzir a evolu¸cão do estudo em redes neurais (ou redes neuronais).

Primeiro apresentamos uma seqüência de artigos publicados que mostram bem a evolu¸cão da pesquisa nessa área, e principalmente os principais colaboradores dessa evolu¸cão.

1943: McCulloch e Pitts, sugeriam pela primeira vez a constru¸cão de uma máquina inspirada no funcionamento do cérebro humano.

Figura 4.2: Neurônio artificial projetado por McCulloch. Retirado de [TK00] O fisiologista Warrem McCulloch interpretou o funcionamento do neurônio biológico como sendo um circuito de entradas binárias combinadas por uma soma ponderada (com pesos) produzindo uma entrada efetiva. No modelo geral de neurônio (figura 4.2) as entradas ponderadas WiXi

são combinadas usando uma fun¸cão F, para produzir um estado de ativa¸cão do neurônio (correspondente à freqüência de descarga de pul- sos do neurônio biológico). As entradas (Xj) chegam através dos den-

dritos, tem um peso (Wi) atribu´ıdo pela sinapse e, ap´os sua adi¸c˜ao, um

unico valor de sa´ıda é retornado. Esse valor de sa´ıda pode ser copiado para vários outros neurônios, mas todos os modelos neurais artificiais desde o princ´ıpio até hoje somente produzem um único valor de sa´ıda. 1949: Donald Hebb escreveu o livro intitulado “The Organization of

Behavior” (A Organiza¸cão do Comportamento). Neste livro, o autor apresenta a idéia que o condicionamento psicológico clássico está pre- sente em qualquer espécie animal; isso se dá devido ao fato de que esta é uma propriedade de neurônios individuais. Hebb traduziu matemati- camente a sinapse dos neurônios biológicos.

Regra de Hebb - Declara¸cão de Hebb: “Quando um axônio de uma célula A está eminente de excitar a célula B e recorrentemente ou contumazmente participa da ativa¸cão desta, um processo de cresci- mento ou mudan¸ca metabólica ocorre em uma ou ambas as células, de forma a aumentar eficiência de A ativar B.”

Uma leitura prática dessa regra é: Se dois neurônios, um de cada lado de uma sinapse, são ativados sincronamente, então a “for¸ca” daquela sinapse deve ser aumentada. Em contra partida, se dois neurônios, um de cada lado de uma sinapse, são ativados assincronamente, então aquela sinapse dever ser enfraquecida.

1951: Mavin Minsky criou o primeiro neuro computador conhecido como Snark. Apesar de um sucesso técnico, esta máquina nunca chegou a executar qualquer processamento de fun¸cões interessantes na prática. 1956: em “Darthmouth College” nasceram dois paradigmas da In- teligência Artificial. A Inteligência Artificial Simbólica estuda a manipula¸cão de s´ımbolos, essa manipula¸cão simbólica pretende simular conhecimento (e inferir conclusões) empregando sistemas baseados em regras. Por outro lado, a Lógica Conexionista pretende estudar e simular o funcionamento do cérebro humano. Os conexionistas acreditam que se formos capazes de criar um sistema que simule o funcionamento do cérebro humano, seremos capazes de aprender, assimilar, errar e aprender com seus erros.

1957: ROSENBLATT concebeu o perceptron, neurˆonio usado no reconhecimento de caracteres.

A figura 4.3 mostra a rede proposta em 1957 por Rosenblatt composta por neurˆonios do tipo perceptron, que no ano seguinte ficou disposta no livro Principles of Neurodynamics. Rosenblatt, pela primeira vez,

Figura 4.3: Rede de perceptrons proposta por Rosemblatt. Retirado de [TK00]

mostrou uma estrutura neural em forma de camadas, uma camada de entrada em outra de sa´ıda

1958: Frank Rosenblatt, Charles Wightman et al. criaram o primeiro neuro computador a obter sucesso, batizado de Mark I Perceptron. Seu interesse principal era reconhecimento de padr˜oes.

1960: Widrow e Hoff apresentaram uma estrutura com uma pequena modifica¸c˜ao na topologia apresentada por Rosemblatt criando o que

viria a ser chamado de camadas intermedi´arias. A rede ADALINE(ADAptative LINear Element) e o MADALINE(Many ADALINE) perceptron utili-

zou sa´ıdas anal´ogicas em uma arquitetura de trˆes camadas.

A figura 4.4 mostra a topologia multicamada ADALINE e MADA- LINE.

1962: WIDROW desenvolveu um processador para redes neurais e fundou a primeira empresa de circuitos neurais digitais, a Memistor

Figura 4.4: Redes ADALINE e MADALINE. Retirado de [TK00] Corporation.

1969: Redu¸cão significativa das verbas destinadas à pesquisa de redes neurais. Causada principalmente pelo não cumprimento de etapas ambiciosas de projetos com alto n´ıvel de financiamento. Esses fatores desmotivaram tanto os governos quanto a iniciativa privada ao investi- mento na pesquisa.

1974: Werbos lan¸cou as bases para o algoritmo de retropropaga¸c˜ao (backpropagation).

1982: Terminaram os anos negros para toda a área de sistemas conexionistas. Foi então que em 1983 Ira Skurnick, um administrador de programas da DARPA (Defense Advanced Research Projects Agency), decidiu ouvir os argumentos da neurocomputa¸cão e seus projetistas e, divergindo dos caminhos tradicionais dos conhecimentos convencionais, iniciou pesquisas nesta área. Outro influente cientista que emergiu nessa área foi o renomado f´ısico John Hopfield, que persuadiu, através

de seus resultados e sua importante reputa¸c˜ao, diversos de seus pares a unirem-se nesta ´area emergente de pesquisa.

1986: David Rumelhart e James McClelland publicaram o livro “Paral- lel Distributed Processing” (Processamento Distribu´ıdo Paralelo) que impulsionou explosivamente a pesquisa. Neste mesmo ano, Rumelhart, Hinton e Williams introduziram o poderoso m´etodo Backpropagation.

Figura 4.5: Estrutura do método Backpropagation. Retirado de [TK00] A figura 4.5 mostra um exemplo da topologia multicamada, cujas conexões sinápticas têm seus pesos ajustados pelo algoritmo de Back- propagation (RHW86), é importante observar que essa topologia pode ser desenhada com mais que uma camada escondida (Hidden Layer). O advento dessa camada intermediária se deveu, principalmente, à in- capacidade de uma rede só com camadas de entrada e sa´ıda resolver problemas linearmente não separáveis.

A figura 4.6 mostra uma fun¸c˜ao simples que n˜ao pode ser separada linearmente.

1987: Ocorreu em S˜ao Francisco a primeira conferˆencia de redes neurais em tempos modernos, a IEEE International Conference on Neural Networks.

Figura 4.6: Exemplo de fun¸cão não linearmente separável - Adaptado da Aula 7 - Inteligência Computacional - Prof. A. C. G. Thomé - UFRJ - 2003/2

1990: Cria¸cão do Neural Computation e do IEEE Transactions on Neu- ral Networks. Neste ponto, uma observa¸cão importante que deve ser feita é sobre topologia cujas camadas de um n´ıvel superior podem ser usadas como entrada para uma camada de n´ıvel inferior. Essa topologia é dita, recorrente, cria-se a possibilidade de atividades na rede sem que haja est´ımulo exterior.

No documento Uma comparação de métodos de classificação aplicados à detecção de fraude em cartões... (páginas 53-58)