• Nenhum resultado encontrado

F.4 Matriz de Covariância de todos os sensores para a Classe 4

1.9 Organização Geral da Dissertação

No Capítulo 2 é feita uma introdução sobre as redes neurais utilizadas neste trabalho, em que, na Seção 2.2 estão os detalhes sobre a arquitetura e aprendizagem da rede perceptron. A Seção 2.3 descreve a rede perceptron multicamadas, a Seção 2.4 estão os detalhes sobre a arquitetura e algoritmo de aprendizagem da mistura de especialistas e por fim, na Seção 2.5, é descrita a rede recorrente de Elman.

1.9 Organização Geral da Dissertação 18

O Capítulo 3 inicia-se com o detalhamento da plataforma robótica utilizada para a coleta dos dados e testes de desempenho das redes neurais utilizadas. Nas Seções 3.3 e 3.4 é detalhado o programa baseado em heurística, que permitiu a geração dos dados estudados; a maneira como é realizada a coleta destes e a descrição do ambiente de testes.

No Capítulo 4 estão os resultados dos testes realizados com as redes neurais estáticas, ou seja, que não fazem uso de memória de curto prazo. Este capítulo inicia-se com uma introdu- ção sobre a unidade robótica utilizada neste projeto, na Seção 3.2, seguida pela descrição do programa baseado em heurísticas, na Seção 3.3, e a metodologia de coleta dos dados para o treinamento das redes, na Seção 3.4. A Seção 4.2 é divida em três subseções: 4.2.1, 4.2.2 e 4.2.3, nas quais estão descritos os detalhes dos resultados com as redes perceptron logístico, mistura de especialistas e perceptron multicamadas, respectivamente.

No Capítulo 5 estão os resultados dos testes com as redes dinâmicas. Nas Subseções 5.3.1, 5.3.2 e 5.3.3 são mostrados os resultados encontrados com as redes perceptron logístico di- nâmico, mistura de especialistas dinâmicos e rede recorrente de Elman, respectivamente. Na Seção 5.4 se encontra uma pequena discussão sobre as redes que foram bem sucedidas e seus custos computacionais.

No Capítulo 6, se encontram as conclusões do trabalho.

No Apêndice A são dados os detalhes de como foram geradas as imagens das trajetórias e percepção do ambiente, utilizadas para ilustrar o comportamento do robô nos diversos testes realizados.

No Apêndice B estão os resultados dos testes com a rede MLP que não foram explorados no Capítulo 5. Nesse apêndice, estão os resultados dos testes com diferentes camadas ocultas e outras entradas.

No Apêndice C encontram-se os resultados da rede de Elman com diferentes camadas ocul- tas, como também diferentes quantidades de unidades de entrada.

No Apêndice D estão os resultados da rede perceptron logístico com e sem memória para os casos com 24 e 4 unidades de entrada.

No Apêndice E, estão resultados semelhantes ao anterior, mas relacionados à arquitetura de mistura de especialistas.

Por fim, no Apêndice F, estão as matrizes de covariância e os histogramas das quantidades de amostras de cada sensor de ultra-som com relação às distâncias medidas pelos mesmos.

19

2

R

EDES

N

EURAIS

ARTIFICIAIS

2.1

Introdução

Neste capítulo, são discutidos alguns dos principais conceitos, modelos e propriedades de arquiteturas clássicas de redes neurais artificiais (RNA), tais como Perceptron e Perceptron Multicamadas; além da arquitetura de Mistura de Especialistas e da rede de Elman.

RNAs são modelos matemáticos inspirados nos mecanismos de processamento da infor- mação dos neurônios biológicos, estes constituídos basicamente de dendritos, axônios e corpo celular. Ao se organizarem em redes, os neurônios podem formar diversas topologias capa- zes de criar um intrincado sistema paralelo dotado da capacidade de aprendizagem interativa e adaptação. Uma arquitetura de RNA pode ser entendida como um processador maciçamente paralelo e distribuído, constituído de unidades de processamento simples1, e que têm a habili- dade intrínseca para armazenar informação e torná-la disponível para o uso, assemelhando-se ao cérebro em dois aspectos (HAYKIN, 1994):

1. o conhecimento é adquirido pela rede por meio de dados coletados do ambiente, num pro- cesso de aprendizagem. Processo de treinamento envolve um Algoritmo de Aprendiza- gem, que tem como finalidade ajustar os pesos sinápticos da rede de uma forma ordenada para alcançar um objetivo desejado.

2. as conexões entre os neurônios, denotadas por analogia de pesos sinápticos, são utilizadas para armazenar o conhecimento adquirido.

Em suma, RNAs são capazes de aprender padrões através de exemplos que lhe são apre- sentados, e reconhecê-los após o processo de aprendizagem, mesmo que a informação recebida esteja incompleta ou difusa, e também são capazes de generalizar e fazer associações (HAY- KIN, 1994; PRINCIPE et al., 2000; TSOUKALAS; UHRIG, 1997).

1Simples do ponto de vista de processamento da informação, uma vez que um neurônio é visto simplesmente

2.1 Introdução 20

A origem do campo de estudo em RNAs remonta ao trabalho do psiquiatra W. McCulloch e do matemático W. Pitts, no qual propuseram, em 1943, o primeiro modelo matemático de um neurônio artificial (MCCULLOCH; PITTS, 1943), mostrado na Figura 2.1. Com um número suficiente de unidades básicas e conexões sinápticas adequadamente ajustadas, esses pesqui- sadores sugeriram que uma rede assim constituída poderia sintetizar, em princípio, qualquer função computável (HAYKIN, 1994). A maioria das arquiteturas de redes neurais utilizam o modelo de McCulloch-Pitts (M-P), ou variações deste, como unidade básica de processamento.

Figura 2.1: Modelo do neurônio artificial de McCulloch e Pitts.

De forma geral, RNAs podem ser divididas quanto ao tipo de aprendizado em duas catego- rias: (1) redes com aprendizado supervisionado e (2) redes com aprendizado não-supervisionado. No aprendizado supervisionado, cada entrada apresentada à rede possui uma saída desejada as- sociada, de forma a permitir uma modificação dos parâmetros ajustáveis em função do erro entre a resposta fornecida pela rede e a saída real desejada. Ao final da etapa de ajuste dos parâmetros, chamada genericamente de treinamento, as respostas da rede para todas as entradas devem ser próximas das saídas desejadas. No caso não-supervisionado, a rede neural detecta pa- drões e características estatísticas do espaço de entrada, de forma a construir uma representação reduzida dos dados em seus pesos sinápticos.

As redes descritas neste trabalho utilizam aprendizagem supervisionada, sendo estas: a rede Perceptron Simples Logístico, Perceptron Multicamadas, Mistura de Especialistas com Percep- trons Simples Logísticos e rede neural recorrente de Elman. Estas diferenciam-se, entre si, na capacidade de tratar problemas não-linearmente separáveis, por utilizar métodos de aprendiza- gem locais ou globais2, ou pelo uso ou não de conexões recorrentes.

2Métodos locais capturam sub-estruturas do mapeamento, e métodos globais capturam a estrutura subjacente