Estudo e implementação de redes neurais e algoritmos genéticos para resolução de cinemática inversa de um manipulador robótico com 5 graus de liberdade

(1)

Francisco Erivaldo Fernandes Junior

Estudo e implementa¸

c˜

ao de redes neurais e algoritmos

gen´

eticos para resolu¸

c˜

ao de cinem´

atica inversa de um

manipulador rob´

otico com 5 graus de liberdade

CAMPINAS 2014

(2)

(3)

Universidade Estadual de Campinas

Faculdade de Engenharia El´

etrica e de Computa¸c˜

ao

Francisco Erivaldo Fernandes Junior

Estudo e implementa¸cão de redes neurais e algoritmos genéticos para resolu¸cão de cinemática inversa de um manipulador robótico com 5 graus de

liberdade

Disserta¸cão apresentada à Faculdade de Engenharia Elétrica e de Computa¸cão da Universidade Estadual de Campinas como parte dos requisitos exigidos para obten¸cão do t´ıtulo de Mestre em Engenharia Elétrica. Área de concentra¸cão: Automa¸cão.

Orientador: Dr. Marconi Kolm Madrid

Este exemplar corresponde à versão final da disserta¸cão defendida pelo aluno Francisco Erivaldo Fernandes Junior, e orientado pelo Prof. Dr. Marconi Kolm Madrid.

CAMPINAS 2014

(4)

Biblioteca da Área de Engenharia e Arquitetura Rose Meire da Silva - CRB 8/5974

Fernandes Junior, Francisco Erivaldo,

F391e FerEstudo e implementação de redes neurais e algoritmos genéticos para resolução de cinemática inversa de um manipulador robótico com 5 graus de liberdade / Francisco Erivaldo Fernandes Junior. – Campinas, SP : [s.n.], 2014.

FerOrientador: Marconi Kolm Madrid.

FerDissertação (mestrado) – Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação.

Fer1. Robótica. 2. Cinemática. 3. Redes neurais artificiais. 4. Algoritmos

genéticos. I. Madrid, Marconi Kolm,1962-. II. Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação. III. Título.

Informações para Biblioteca Digital

Título em outro idioma: Study and implementation of neural networks and genetic algorithms

to solve the inverse kinematics of a 5-DOF robotic manipulator

Palavras-chave em inglês:

Robotics Kinematics

Artificial neural networks Genetics algorithms

Área de concentração: Automação Titulação: Mestre em Engenharia Elétrica Banca examinadora:

Marconi Kolm Madrid [Orientador] Auzuir Ripardo de Alexandria José Raimundo de Oliveira

Data de defesa: 11-04-2014

Programa de Pós-Graduação: Engenharia Elétrica

Powered by TCPDF (www.tcpdf.org)

(5)

(6)

(7)

RESUMO

No presente trabalho é mostrado o estudo e a implementa¸cão das Redes Neurais Artificiais, RNA, e Algoritmos Genéticos, AG, para resolu¸cão da cinemática inversa de um manipulador robótico com 5 graus de liberdade. Todo manipulador robótico é constru´ıdo com o objetivo de se realize uma determinada tarefa. Para alcan¸car esse objetivo é necessário o estudo e o emprego dos seus modelos cinemáticos. A descri¸cão matemática do movimento espacial realizado por cada elo do robô é conhecida como Cinemática que é o estudo do movimento de um corpo ou um sistema de corpos r´ıgidos em rela¸cão a um referencial cartesiano fixo ignorando as for¸cas e os momentos que causam tal movimento. Existem dois problemas ao se estudar a cinemática de um robô: o problema da cinemática direta e o problema da cinemática inversa. A cinemática inversa é um ramo com grandes desafios devido as equa¸cões não serem lineares, dificultando a determina¸cão de solu¸cões de uma forma fechada. Portanto, diversos pesquisadores, ao longo dos anos, tentam resolver esse problema evitando o uso de inversões de equa¸cões. Nesse sentido, o uso das redes neurais artificiais e dos algoritmos genéticos se mostram alternativas atraentes. As solu¸cões encontradas no presente trabalho foram aplicadas a um robô educacional com 5 graus de liberdade composto de seis servomotores controlado por um microcontrolador Arduino Uno. O software MATLAB foi utilizado como ferramenta para o desenvolvimento e a aplica¸cão desses dois métodos.

Palavras-chave: Robótica, Cinemática, Redes Neurais Artificiais, Algoritmos Genéticos.

ABSTRACT

The present work shows the study and implementation of Artificial Neural Networks, ANN, and Genetic Algorithms, AG, to solve the inverse kinematics of a robotic manipulator with 5 degree of freedom. Every robotic manipulator is constructed with the goal of perform a specific task. To reach this goal, the robot needs to track a path, and for that it is necessary the study of its kinematics. The math description of the spatial movement performed by its links is known as kinematics that is the study of the movement of a rigid body or system of rigid bodies in relation to a fixed cartesian reference disregarding the forces and momentums that cause the movement. There are two problems when studying the kinematics: the forward kinematics problem and the inverse kinematics problem. The inverse kinematics is a field of study with challenges due the fact that the equations are not linear which become a problem to obtain closed form solutions. Therefore, many scientists try to solve this problem with methods that do not use equation inversions. In this sense, the use of artificial neural networks and genetic algorithms prove to be interesting alternatives for this purpose. The solutions found in this work were applied to an educational robot platform with 5 degree of freedom and six servomotors controlled by an Arduino Uno microcontroller. The MATLAB software was used as a tool to develop and application of these two methods.

Key-words: Robotics, Kinematics, Artificial Neural Networks, Genetics Algorithms.

(8)

(9)

Sum´

ario

Agradecimentos xiii

Lista de Figuras xvi

Lista de Tabelas xvii

1 Introdu¸c˜ao 1

1.1 Motiva¸c˜ao . . . 1

1.2 Objetivos . . . 2

1.3 Trabalhos relacionados . . . 3

1.4 Metodologia . . . 4

1.5 Delimita¸c˜oes do trabalho . . . 4

1.6 Estrutura do trabalho . . . 4

2 Cinemática de manipuladores robóticos 7 2.1 Introdu¸cão . . . 7

2.2 Descri¸c˜ao espacial e transforma¸c˜oes . . . 9

2.2.1 Descrevendo posi¸c˜oes no espa¸co . . . 9

2.2.2 Descrevendo orienta¸c˜oes no espa¸co . . . 9

2.2.3 Matrizes de rota¸c˜ao . . . 10

2.2.4 Descrevendo um frame . . . 10

2.2.5 Transforma¸c˜oes . . . 10

2.3 Cinem´atica Direta . . . 12

2.3.1 Cadeias Cinem´aticas . . . 12

2.3.2 M´etodo de Denavit-Hartenberg . . . 13

2.4 Cinem´atica Inversa . . . 16

2.4.1 M´etodo alg´ebrico . . . 16

2.4.2 M´etodo geom´etrico . . . 19

2.4.3 Solu¸cão algébrica por redu¸cão polinomial . . . 20

3 Redes Neurais Artificiais 21 3.1 Introdu¸c˜ao . . . 21

3.2 Hist´orico . . . 22

3.3 Fundamentos . . . 23

3.3.1 Um framework para representa¸c˜ao distribu´ıda . . . 23

3.3.2 N´os de processamento . . . 24

3.3.3 Conex˜oes entre n´os . . . 25

3.3.4 Ativa¸c˜ao e regras de sa´ıda . . . 25

(10)

3.3.7 Modificando parˆametros de conectividade . . . 27

3.4 Redes perceptron feed-forward de m´ultiplas camadas . . . 27

3.5 Algoritmo de retro-propaga¸c˜ao . . . 29

3.5.1 Regra delta generalizada . . . 29

3.5.2 Entendendo a retro-propaga¸c˜ao . . . 31

3.5.3 Trabalhando com a retro-propaga¸c˜ao . . . 31

4 Algoritmos Gen´eticos 33 4.1 Introdu¸c˜ao . . . 33

4.2 Hist´orico . . . 34

4.3 Terminologia . . . 35

4.4 Funcionamento de um algoritmo gen´etico . . . 35

4.4.1 Representa¸c˜ao cromossomial . . . 36

4.4.2 Fun¸c˜ao de avalia¸c˜ao . . . 37

4.4.3 Sele¸c˜ao de pais . . . 37

4.4.4 Operadores de crossover e muta¸c˜ao . . . 38

4.4.5 M´odulo de popula¸c˜ao . . . 39

4.5 Teorema dos Esquemas . . . 39

5 Simula¸cões e Implementa¸cão prática 43 5.1 Materiais utilizados . . . 43

5.2 Placa de controle do robˆo . . . 44

5.3 Programa para testar o robˆo . . . 45

5.4 Cinem´atica direta do robˆo em estudo . . . 46

5.5 Trajet´oria utilizada para testes . . . 47

5.6 Metodologia utilizada . . . 49

5.7 Aplica¸cão das redes neurais na resolu¸cão da cinemática inversa . . . 50

5.7.1 Resultados da utiliza¸c˜ao das redes neurais no problema simplificado . . . 50

5.7.2 Resultados da utiliza¸c˜ao das redes neurais no problema completo . . . . 52

5.8 Aplica¸cão dos algoritmos genéticos na resolu¸cão da cinemática inversa . . . 53

5.8.1 Resultados da aplica¸cão dos algoritmos genéticos no problema simplificado 54 5.8.2 Resultado dos algoritmos genéticos no problema completo . . . 55

5.9 Implementando os resultados no robˆo . . . 56

6 Conclus˜oes e perspectivas 59 6.1 Contribui¸c˜oes . . . 60

6.2 Dificuldades encontradas . . . 60

6.3 Sugest˜oes para trabalhos futuros . . . 61

Referˆencias 63

A Placa utilizada no controle do robˆo 69

B Código-fonte do programa para o controle manual do robô 73 C Código para gera¸cão da trajetória de testes 79

(11)

D Código para o treinamento da rede neural 83 E Código para verificar o erro no rastreamento da trajetória usando redes

neu-rais 87

F Código para otimiza¸cão via algoritmo genético 91 G Código da implementa¸cão dos resultados no robô 95

(12)

(13)

Agradecimentos

Agrade¸co a Universidade Estadual de Campinas e a todo o corpo docente pela educa¸c˜ao de qualidade que recebi;

Agrade¸co ao professor Madrid pela oportunidade de aprofundar meus estudos, pela orienta¸c˜ao e paciˆencia;

Agrade¸co ao colega do LSMR, Alberto Noboru Miyadaira, pelo companheirismo e conselhos durante a realiza¸c˜ao do trabalho;

Agrade¸co `a minha fam´ılia por sempre me apoiarem;

Agrade¸co à minha noiva, Mariana, por sempre está comigo mesmo separados por uma grande distância f´ısica;

Agrade¸co ao CNPq pela bolsa de estudos.

(14)

(15)

Lista de Figuras

2.1 Manipulador paralelo, adaptado de [37]. . . 8

2.2 Manipulador serial, adaptado de [1]. . . 8

2.3 O problema da cinem´atica, adaptado de [6]. . . 9

2.4 Exemplo de transforma¸c˜ao, adaptador de [5]. . . 11

2.5 Exemplo de fixa¸c˜ao de frames, adaptado de [1]. . . 12

2.6 Manipulador planar com 2 graus de liberdade, adaptado de [1]. . . 15

2.7 Manipulador planar com 3 graus de liberdade, adaptado de [5]. . . 17

2.8 Solu¸c˜ao geom´etrica para um manipulador com 3 graus de liberdade, adaptado de [5]. 19 3.1 Exemplo de uma Rede Neural Artificial, adaptado de [39]. . . 22

3.2 Componentes de uma Rede Neural Artificial, adaptado de [7]. . . 24

3.3 Exemplos de fun¸cões de ativa¸cão: (a) fun¸cão sgn, (b) fun¸cão semi-linear, (c) fun¸cão sigmoide. Adaptado de [7]. . . 26

3.4 Exemplo de uma rede perceptron com m´ultiplas camadas, adaptado de [38]. . . 28

3.5 Fluxo de sinais em uma rede perceptron com múltiplas camadas, adaptado de [38]. 29 4.1 Funcionamento básico de um algoritmo genético, adaptado de [8]. . . 36

5.1 Robˆo manipulador educacional que foi usado na realiza¸c˜ao do trabalho. . . 44

5.2 Arduino Uno Rev2. . . 45

5.3 Programa para o controle manual do robˆo. . . 45

5.4 Posicionamento dos eixos coordenados no robˆo. . . 48

5.5 Trajet´oria utilizada nos testes. . . 49

5.6 Valores de cada junta ao longo da trajet´oria. . . 49

5.7 Entradas e sa´ıdas utilizadas na RNA para resolver a cinem´atica inversa. . . 51

5.8 Erro quadr´atico m´edio do treinamento da rede neural no primeiro teste. . . 52

5.9 Evolu¸c˜ao dos erros durante o rastreamento da trajet´oria usando rede neural no primeiro teste. . . 52

5.10 Evolu¸c˜ao dos erros durante o rastreamento da trajet´oria usando rede neural no segundo teste. . . 54

5.11 Código genético dos indiv´ıduos do primeiro teste dos algoritmos genéticos. . . . 55

5.12 Evolu¸cão dos erros durante o rastreamento da trajetória usando algoritmo genético no primeiro teste. . . 55

5.13 Evolu¸cão dos erros durante o rastreamento da trajetória usando algoritmo genético no segundo teste. . . 57

A.1 Esquem´atico do circuito da placa de controle do robˆo. . . 69

A.2 Roteamento da placa de controle do robˆo. . . 70

A.3 Visualiza¸c˜ao da placa em 3D. . . 71

(16)

(17)

Lista de Tabelas

2.1 Parâmetros dos elos para um manipulador planar com 2 graus de liberdade. . . 16 2.2 Parâmetros dos elos para um manipulador planar com 3 graus de liberdade. . . 16 4.1 Terminologia usada nos algoritmos genéticos. . . 35 5.1 Parâmetros dos elos do robô em estudo. . . 47

(18)

(19)

Cap´ıtulo 1

Introdu¸

c˜

ao

Este cap´ıtulo contém as principais orienta¸cões sobre o desenvolvimento do presente trabalho, como tema, motiva¸cão, revisão bibliográfica, objetivos, delimita¸cões e estru-tura do trabalho.

1.1 Motiva¸

c˜

ao

A Robótica é um campo de pesquisa tecnológica relativamente jovem que não é limitada pelas tradicionais fronteiras existentes entre as diversas engenharias. Para o entendimento das complexidades e aplica¸cões que envolvem o estudo dos robôs são geralmente necessários conhecimentos de Engenharia Elétrica, Engenharia Mecânica, Engenharia Industrial e de Sistemas, Ciências da Computa¸cão, Economia e Matemática [1]. Além disso, os robôs são as principais ferramentas utilizadas na automa¸cão da produ¸cão industrial, em tarefas perigosas, em tarefas no espa¸co sideral e/ou em qualquer tarefa em que se deseja que uma máquina substitua ou coopere com seres humanos [2, 3]. Por isso, o estudo dessas máquinas têm vital importância para o desenvolvimento das áreas de tecnologia em Mecatrônica e Automa¸cão.

Os robôs podem ser classificados primariamente como robôs manipuladores e robôs móveis. Os robôs manipuladores consistem de uma sequência de elos, que podem ser r´ıgidos ou flex´ıveis, interconectados por meio de articula¸cões, chamadas de juntas. Um manipulador é caracterizado por um bra¸co que assegura mobilidade, um pulso que confere destreza e um end-effector, ou garra, ao qual pode ser acoplada uma determinada ferramenta para realizar a tarefa requerida pelo robô. Além disso, cada junta presente na estrutura mecânica do manipulador contribui com 1 grau de liberdade. Por outro lado, a caracter´ıstica principal dos robôs móveis é a presen¸ca de uma base móvel que permite ao robô mover-se livremente em um ambiente. Ao contrário dos manipuladores, que são usados principalmente na Indústria, os robôs móveis são usados principalmente em aplica¸cões de servi¸co em que é necessária capacidade de movimento autônomo [3].

Um manipulador robótico é projetado para executar uma tarefa em um espa¸co 2D ou 3D. A ferramenta ou a garra necessita seguir uma determinada trajetória para realizar esta tarefa. Com isso faz-se necessário o controle da posi¸cão de cada elo do robô para a obten¸cão da posi¸cão e da orienta¸cão desejada. A descri¸cão matemática do movimento espacial realizado por seus elos ´

e conhecida como Cinemática [2] que é o estudo do movimento de um corpo ou um sistema de corpos r´ıgidos em rela¸cão a um referencial cartesiano fixo, ignorando as for¸cas e os momentos que

(20)

causam tal movimento [4]. Além disso, é poss´ıvel realizar o estudo cinemático em manipuladores cujos elos são flex´ıveis, o que ficaria em outro contexto de estudos. A formula¸cão da cinemática de um robô permite o estudo de dois problemas chaves na Robótica: o problema da cinemática direta e o problema da cinemática inversa. A cinemática direta permite determinar a posi¸cão e a orienta¸cão da garra do robô, em rela¸cão a um referencial cartesiano fixo, a partir dos valores das suas juntas. Por outro lado, o modelo cinemático inverso permite determinar os valores dos posicionamentos das juntas do robô a partir da posi¸cão e da orienta¸cão da garra. Se considerarmos elos r´ıgidos, a cinemática direta pode ser facilmente obtida pela utiliza¸cão da conven¸cão de Denavit-Hartenberg. Entretanto, não existe uma forma simples de se obter o modelo cinemático inverso de um robô [1–3, 5, 6].

Os dois principais métodos encontrados na literatura para a resolu¸cão da cinemática inversa são os métodos algébricos e geométricos, ambos fazem uso de inversões das equa¸cões obtidas pela cinemática direta [1, 5]. Sendo assim, a obten¸cão do modelo cinemático de um manipulador ´

e uma tarefa complexa devido as seguintes raz˜oes [3, 5]:

As equa¸cões são em geral não-lineares e transcendentais, por isso, nem sempre é poss´ıvel encontrar solu¸cões de forma fechada;

M´ultiplas solu¸c˜oes podem existir;

Infinitas solu¸cões podem existir, por exemplo, no caso de um manipulador redundante; Podem não existir solu¸cões admiss´ıveis.

O problema da cinemática inversa é, de fato, crucial para o desenvolvimento de robôs. Entretanto, devido ao exposto acima, não existe uma forma simples de se resolver esse problema. Por isso, ao longo dos anos diversos pesquisadores estudaram e, ainda, estudam abordagens alternativas para sua solu¸cão.

Portanto, o presente trabalho foi desenvolvido buscando-se uma forma alternativa e eficiente para se resolver a cinemática inversa de manipuladores robóticos. Assim, as ferramentas escolhidas para a realiza¸cão deste trabalho foram as Redes Neurais, que são conhecidas como aproximadores universais de fun¸cões [7], e os algoritmos genéticos, que possuem a capacidade de otimizar um vasto número de equa¸cões [8]. Essas ferramentas serão explicadas em detalhes nos próximos cap´ıtulos.

1.2 Objetivos

A partir da problemática apresentada na motiva¸cão deste trabalho, os objetivos que se deseja atingir são os seguintes:

Objetivos gerais:

– Resolver a cinemática inversa de um manipulador robótico com 5 graus de liberdade com aux´ılio das Redes Neurais Artificiais e Algoritmos Genéticos;

(21)

1.3. Trabalhos relacionados 3

– Aplicar as solu¸cões encontradas em um robô real para o rastreamento de uma dada trajetória;

Objetivos espec´ıficos:

– Estudar as principais arquiteturas das Redes Neurais Artificiais;

– Determinar qual a melhor arquitetura a ser utilizada para se atingir os objetivos gerais deste trabalho;

– Estudar os Algoritmos Gen´eticos;

– Determinar qual os melhores parˆametros a serem utilizados no Algoritmo Gen´etico para se atingir os objetivos gerais deste trabalho;

– Elaborar trajet´orias para testar as solu¸c˜oes encontradas;

– Implementar as solu¸c˜oes encontradas atrav´es do interfaceamento entre computador e microcontrolador.

1.3 Trabalhos relacionados

São apresentado a seguir um breve histórico de trabalhos relacionados com o tema em estudo. O presente trabalho foi desenvolvido no Laboratório de Sistemas Modulares Robóticos, LSMR, localizado na Faculdade de Engenharia Elétrica e de Computa¸cão da Universidade de Campinas. O LSMR tem tradi¸cão no estudo e desenvolvimento de estruturas robóticas. O primeiro trabalho do LSMR a utilizar técnicas não convencionais para a resolu¸cão da cinemática inversa de manipuladores robóticos foi desenvolvido pelo professor Dr. Marconi Kolm Madrid durante seu doutorado e utilizava-se da técnica de busca heur´ıstica [9–11]. Após isso, o Dr. Fabr´ıcio Nicolato, durante seu doutorado, aperfei¸coou a técnica de busca heur´ıstica para utiliza¸cão em controle servo visual [12–14]. Pode-se citar também o trabalho desenvolvido pelo Dr. Dionne Cavalcante Monteiro durante o seu doutorado em 2003 que consiste na utiliza¸cão de algoritmos genéticos e redes neurais artificiais no planejamento e rastreamento de trajetórias e controle de posi¸cão [15]. Portanto, o presente trabalho adequa-se ao contexto histórico de pesquisas do LSMR.

Historicamente, as redes neurais artificiais são usadas em diversas áreas da Robótica. Um dos primeiros trabalhos encontrados na literatura que fazem uso dessas ferramentas é o de Kuperstein de 1987 [16]. Nele, as redes neurais são usadas no controle adaptativo de um manipulador robótico com dois graus de liberdade e guiado visualmente. Em 1988, Suzuki e Arimoto publicam um artigo em que é desenvolvido um tipo especial de rede neural para o reconhecimento de escrita a mão que foi usado em um robô com capacidade de entregar encomendas [17]. Kawato et al, também em 1989, publicaram um trabalho em que se usa uma rede neural para lidar com o controle dos motores em um sistema que imita o sistema nervoso central na realiza¸cão de movimentos [18]. Além desses, também podem-se citar os trabalhos de King e Hwang em 1989 [19]; Clement em 1993 [20]; Tzafestas em 1995 [21]; Lu e Ito em 1995 [22]; Kim et al em 1997 [23]; Yee e Lim em 1997 [24]. Todos os autores citados anteriormente desenvolveram algum tipo de trabalho em que se usava redes neurais aplicada na resolu¸cão de problemas de Robótica.

(22)

No caso do uso de Algoritmos Genéticos, os primeiros trabalhos encontrados na literatura datam do ano de 1989. Um deles é o trabalho de Parker, Khoogar e Goldberg. Nesse trabalho, utilizou-se algoritmos genéticos para resolver a cinemática inversa de manipuladores redundan-tes [25]. Em 1992, Shibata et al publicam um trabalho que utiliza algoritmos genéticos no planejamento de trajetórias de múltiplos robôs móveis [26]. Em 1994, tem-se a publica¸cão de um trabalho que utiliza um sistema fuzzy integrado com um algoritmo evolutivo. Pode-se citar os trabalhos de Tabandeh et al (2006); Rolland e Chandra (2009); Zhang et al (2009); Mehrafsa et al (2011); e Tomic et al (2012) como alguns dos mais recentes que utilizam-se dos algoritmos genéticos na resolu¸cão de diversos problemas existentes na área de Robótica.

Especificamente para a resolu¸cão da cinemática inversa de manipuladores robóticos utilizando-se redes neurais artificiais, RNA, podem-utilizando-se citar os trabalhos de Lu, Karlik, Wei, Koker, Oyama, Youssef, Daya, Dash e Tejomurtula [22, 27–34]. Existem também trabalhos nos quais os autores usam uma combina¸cão de algoritmos genéticos com RNAs [35, 36].

Todos os trabalhos citados anteriormente mostram que resolver a cinemática inversa de manipuladores robóticos usando redes neurais ou algoritmos genéticos traz grandes perspectivas para boas solu¸cões e tem grande interesse entre os pesquisadores de Robótica. Portanto, todo esse interesse da comunidade cient´ıfica justifica o desenvolvimento do presente trabalho.

1.4 Metodologia

O presente trabalho trata do estudo teórico e da implementa¸cão de ferramentas derivadas da computa¸cão bio-inspirada, redes neurais e algoritmos genéticos, na resolu¸cão da cinemática inversa de um robô educacional de 5 graus de liberdade. Utilizou-se artigos dispon´ıveis em diversos repositórios, como IEEExplore e ScienceDirect, teses de mestrado e doutorado e diversos livros que tratam de temas pertinentes na realiza¸cão da pesquisa bibliográfica. Foram feitas simula¸cões utilizando-se o software MATLAB, sendo que as melhores solu¸cões foram implementadas no robô real. Os detalhes sobre a realiza¸cão do trabalho podem ser consultados no cap´ıtulo 5.

1.5 Delimita¸

c˜

oes do trabalho

O presente trabalho limita-se ao estudo cinemático de uma determinada estrutura robótica. Esse estudo é realizado por meio de ferramentas derivadas da computa¸cão bio-inspirada, Redes Neurais Artificiais, RNA, e Algoritmos Genéticos, AG. Portanto, apesar do amplo escopo dos trabalhos citados na se¸cão anterior, o estudo e o controle da dinâmica de estruturas robóticas, o planejamento de trajetórias, etc, não são abordados neste trabalho. Assim, são discutidos formas de se utilizar RNAs e AGs na busca de se alcan¸car os objetivos apresentados anteriormente e como aplicar as solu¸cões encontradas em um robô real servo-controlado.

1.6 Estrutura do trabalho

Nos cap´ıtulos seguintes é apresentado o desenvolvimento do trabalho. No Cap´ıtulo 2 é explicado detalhadamente o processo para se obter o modelo cinemático de um manipulador

(23)

1.6. Estrutura do trabalho 5

robótico. No Cap´ıtulo 3 é apresentado as redes neurais artificiais e sua fundamenta¸cão teórica. No Cap´ıtulo 4 é explicado o que é e como funcionam os algoritmos genéticos, além de uma introdu¸cão às técnicas de busca heur´ıstica. A parte experimental e os resultados do presente trabalho estão detalhados no Cap´ıtulo 5. Por último, a conclusão, os trabalhos produzidos e as sugestões para trabalhos futuros estão no Cap´ıtulo 6.

Além disso, ao final do trabalho é apresentado uma sequência de apêndices contendo infor-ma¸cões adicionais aos dados apresentados no Cap´ıtulo 5, como os códigos fonte dos programas desenvolvidos.

(24)

(25)

Cap´ıtulo 2

Cinem´

atica de manipuladores rob´

oticos

Este cap´ıtulo apresenta a fundamenta¸cão teórica da cinemática dos manipuladores robóticos. O cap´ıtulo está dividido em quatro partes: Introdu¸cão, Descri¸cão espacial e transforma¸cões, Cinemática Direta e Cinemática Inversa.

2.1 Introdu¸

c˜

ao

Um manipulador robótico pode ser representado como uma cadeia cinemática de corpos r´ıgidos, elos, conectados por juntas prismáticas ou de revolu¸cão. Uma das extremidades da cadeia ´

e fixa em uma base, enquanto que a outra extremidade é livre para se movimentar e, geralmente, possui uma ferramenta, end-effector, para manipular objetos ou realizar tarefas diversas [3, 6]. A cadeia cinemática pode ser aberta ou fechada. Manipuladores de cadeia fechada são chamados de manipuladores paralelos, Figura 2.1, e manipuladores de cadeia aberta são chamados de manipuladores seriais, Figura 2.2 [1, 3]. O movimento da estrutura é obtido pela composi¸cão dos movimentos de cada elo em rela¸cão ao anterior. Normalmente, deseja-se saber a descri¸cão espacial do end-effector em rela¸cão a um sistema de coordenadas fixo [3, 6]. Portanto, afim de se manipular objetos no espa¸co, é necessário descrever a posi¸cão e orienta¸cão do end-effector. Isso ´

e poss´ıvel atrav´es do estudo da Cinem´atica.

A Cinemática lida com o estudo anal´ıtico da geometria do movimento do manipulador em rela¸cão a um sistema de referência coordenado fixo como uma fun¸cão do tempo sem levar em considera¸cão as for¸cas e os torques que causam o movimento. Portanto, a Cinemática estuda o movimento espacial do manipulador como uma fun¸cão do tempo, em particular, a rela¸cão entre o espa¸co das juntas com a posi¸cão e orienta¸cão do end-effector [6]. Dois problemas fundamentais surgem nesse estudo: o problema da cinemática direta e o problema da cinemática inversa.

Na cinemática direta deseja-se responder a seguinte pergunta: dados um vetor com as variáveis de juntas ~q(t) = (q1(t), q2(t), . . . , qn(t))T e os valores geométricos dos elos, onde n é o número de graus de liberdade, qual a posi¸cão e orienta¸cão do end-effector do manipulador em rela¸cão ao sistema de referência fixo [6]?

Por outro lado, na cinemática inversa deseja-se responder a seguinte pergunta: dados a posi¸cão e a orienta¸cão desejadas para o end-effector do manipulador com rela¸cão ao sistema de referência fixo e os valores geométricos dos elos, o manipulador pode alcan¸car a posi¸cão e a orienta¸cão desejadas? Se sim, qual são os valores das variáveis de juntas [6]?

(26)

Figura 2.1: Manipulador paralelo, adaptado de [37].

Figura 2.2: Manipulador serial, adaptado de [1].

Na Figura 2.3 é apresentado um esquemático que resume os dois problemas envolvidos com o estudo da cinemática.

(27)

2.2. Descri¸c˜ao espacial e transforma¸c˜oes 9

Figura 2.3: O problema da cinem´atica, adaptado de [6].

a geometria espacial dos elos de um manipulador em rela¸cão a um sistema de referência fixo utilizando matrizes. Nesse método, uma matriz de transforma¸cão homogênea 4×4 é utilizada para descrever a rela¸cão entre o deslocamento espacial do manipulador e o sistema de referência fixo. Com esse método é poss´ıvel resolver o problema da cinemática direta de forma simples. Entretanto, para a cinemática inversa não existem métodos simples que possam ser utilizados [1, 3, 5, 6].

Na próxima se¸cão é explicado como representar a posi¸cão e a orienta¸cão de um corpo no espa¸co; também é explicado as transforma¸cões necessárias para representar um sistema de coordenadas em rela¸cão a outro.

2.2 Descri¸

c˜

ao espacial e transforma¸

c˜

oes

2.2.1 Descrevendo posi¸

c˜

oes no espa¸

co

Após a fixa¸cão de um sistema de coordenadas, pode-se localizar um ponto no espa¸co como um vector 3 × 1. Os valores desse vetor estão relacionados com o sistema de coordenadas previamente fixado. Portanto, uma mesma posi¸cão no espa¸co pode produzir diferentes vetores de posi¸cão dependendo de qual é o sistema de coordenadas que está sendo referenciado. Por exemplo, na Equa¸cão 2.1, Px, Py, Pz indicam a posi¸cão do ponto P em rela¸cão aos eixos x, y e z, respectivamente, do sistema de coordenadas {A} [5].

A_{P =}   Px Py Pz   (2.1)

2.2.2 Descrevendo orienta¸

c˜

oes no espa¸

co

Para descrever a orienta¸cão de um corpo r´ıgido no espa¸co em rela¸cão a um sistema de referência coordenado faz-se necessário a fixa¸cão de um novo sistema de coordenadas no corpo. A matriz da Equa¸cão 2.2 representa a orienta¸cão de um sistema {B} em rela¸cão a um sistema {A}.

(28)

A BR = _A XB AYB AZB =   r11 r12 r13 r21 r22 r23 r31 r32 r33   (2.2)

2.2.3 Matrizes de rota¸

c˜

ao

Existem três matrizes básicas de rota¸cão que podem ser utilizadas para descrever a orienta¸cão de um corpo que são as seguintes:

Rx,α =   1 0 0 0 cos(α) − sin(α) 0 sin(α) cos(α)  ; (2.3) Ry,φ=   cos(φ) 0 sin(φ) 0 1 0 − sin(φ) 0 cos(φ)  ; (2.4) Rz,θ =   cos(θ) − sin(θ) 0 sin(θ) cos(θ) 0 0 0 1  . (2.5)

As matrizes Rx,α, Ry,φ e Rz,θ representam rota¸cões de α, φ e θ radianos em torno dos eixos x, y e z, respectivamente. Essas matrizes podem ser pré-multiplicadas ou pós-multiplicadas o que torna poss´ıvel produzir matrizes para qualquer orienta¸cão no espa¸co cartesiano.

2.2.4 Descrevendo um frame

Em Robótica, um frame descreve a orienta¸cão e a posi¸cão de um sistema de coordenadas em rela¸cão a outro. Por exemplo, um frame {B} pode ser descrito da seguinte forma:

{B} = {A BR

A_{, P}

BOrigem}. (2.6)

Em outras palavras. o frame {B} pode ser descrito como uma rota¸cão em rela¸cão ao frame {A} e a posi¸cão da origem de {B} em rela¸cão a {A}.

2.2.5 Transforma¸

c˜

oes

Frequentemente, a descri¸cão de um vetor em algum frame {B} é conhecida e deseja-se saber a descri¸cão desse vetor em um outro frame {A} com posi¸cão e orienta¸cão diferentes. Essa mudan¸ca é conhecida como uma transforma¸cão de mapeamento que pode ser descrita de forma geral como [5]:

A_{P =}A_R

BBP +APBOrigem. (2.7)

A Equa¸cão 2.7 mostra que o vetor descrito no frame {B} é primeiramente descrito em um frame intermediário que possui a mesma orienta¸cão do frame {A} e depois é adicionada a distância entre as origens do dois frames.

(29)

2.2. Descri¸c˜ao espacial e transforma¸c˜oes 11

A Equa¸c˜ao 2.7 tamb´em pode ser descrita em forma matricial: _A P 1 = _A RB APBOrigem 0 0 0 1 _B P 1 . (2.8)

Assim, um vetor pode ser descrito em outro frame da seguinte forma: A_{P =}A_T

BBP. (2.9)

Na Figura 2.4 é mostrado como um mesmo ponto pode ter diferentes vetores de posi¸cão dependendo de qual sistema de coordenadas está sendo referenciado. O vetor AP descreve a posi¸cão do ponto P em rela¸cão ao sistema {A} e o vetor BP descreve a posi¸cão do ponto P em rela¸cão ao sistema {B}. Portanto, sabendo-se os valores B_{P e a matriz de transforma¸c˜}_ao homogênea A_T

B, pode-se determinar o vetor AP pela aplica¸c˜ao da Equa¸c˜ao 2.9.

Por exemplo, se um frame {B} está com uma rota¸cão de 30 graus em torno do eixo Z em rela¸cão a um frame {A}, transladado de 10 unidades em X, 5 unidades em Y e o ponto P ´

e descrito como B_{P = [3} ₇ _0]T_{. Deseja-se saber os valores do vetor} A_{P . Das informa¸c˜}_oes fornecidas e a partir da utiliza¸cão das matrizes básicas de rota¸cão tem-se:

A_T B =     0, 866 −0, 5 0 10 0, 5 0, 866 0 5 0 0 1 0 0 0 0 1     . (2.10)

Substituindo na Equa¸c˜ao 2.9, tem-se:

A_{P =}A_T BBP =   9, 098 12, 562 0  . (2.11) XA YA {A} A_P BOrigem A_P B_P XB YB {B} P

(30)

2.3 Cinem´

atica Direta

2.3.1 Cadeias Cinem´

aticas

Assume-se que cada junta de um manipulador possui um grau de liberdade. Cada junta pode ser de revolu¸cão ou prismática. A a¸cão de cada junta pode ser descrita por um número: o ˆ

angulo de revolu¸cão, no caso das juntas de revolu¸cão, ou o deslocamento, no caso das juntas prismáticas [1].

Um manipulador com n juntas terá n + 1 elos, porque cada junta é conectada por dois elos. As juntas são numeradas de 1 a n e os elos de 0 a n, come¸cando pela base. Portanto, a junta i conecta o elo i − 1 ao elo i. Considera-se que a localiza¸cão da junta i é fixa em rela¸cão ao elo i − 1. Quando a junta i é atuada, o elo i se move. Portanto, o elo 0 é fixo e não se move quando as juntas são atuadas. Associa-se uma variável de junta a i-ésima junta, denotado por qi. No caso de juntas de revolu¸cão, qi é um ângulo de revolu¸cão e, no caso de juntas prismáticas, qi é um deslocamento [1]:

qi =

θi se i ´e uma junta de revolu¸c˜ao

di se i é uma junta prismática . (2.12) Ao se realizar uma análise cinemática é necessário fixar um sistema de coordenadas em cada elo. Para o elo i, fixa-se um sistema de coordenadas oixiyizi. Isso significa que não importa quais movimentos um robô fa¸ca, um ponto no elo i será constante quando expresso no i-ésimo sistema coordenado. Na base do robô é fixada o sistema o0x0y0z0 e é considerado o sistema de referência inercial ou fixo. Na Figura 2.5 é mostrado um exemplo de fixa¸cão de frames para um manipulador com 3 graus de liberdade [1].

Seja Ai uma matriz de transforma¸cão homogênea que expressa a posi¸cão e a orienta¸cão do frame oixiyizi em rela¸cão ao frame oi−1xi−1yi−1zi−1. A matriz Ai não será constante, ela varia conforme a configura¸cão do robô muda. Entretanto, a suposi¸cão de que todas as juntas são ou de revolu¸cão ou prismática, significa que Ai é uma fun¸cão de uma única variável de junta, ou seja:

(31)

2.3. Cinem´atica Direta 13

Ai = Ai(qi). (2.13)

Caso queira-se determinar a posi¸cão e orienta¸cão de um frame ojxjyjzj em rela¸cão ao frame oixiyizi usa-se uma matriz de transforma¸cão iTj tal que [1]

i_T j = Ai+1Ai+2. . . Aj−1Aj se i < j i_Tj _{= I} _{se i = j} i_T j = (iTj)−1 se j > i . (2.14)

Portanto, a posi¸cão e orienta¸cão do end-effector de um manipulador com n graus de liberdade em rela¸cão ao referencial inercial pode ser determinado da seguinte forma:

H =0 Tn = A1(q1) . . . An(qn), (2.15) tal que: H = ₀ Rn 0on 0 1 . (2.16) Na Equa¸c˜ao 2.16, 0_R

né uma matrix de rota¸cão 3 × 3 e0on é um vetor de posi¸cão 3 × 1 [1]. Com isso já é poss´ıvel determinar a cinemática direta de um manipulador robótico, mas na próxima sessão será apresentado o método de Denavit-Hartenberg que torna a fixa¸cão dos frames e determina¸cão das matrizes de transforma¸cão uma tarefa mais simples.

2.3.2 M´

etodo de Denavit-Hartenberg

No método de Denavit-Hartenberg, D-H, cada transforma¸cão homogênea Ai é representada como o produto de quatro transforma¸cões básicas

Ai = Rotz,θiT ransz,diT ransx,aiRotx,αi

=     Cθi −Sθi 0 0 Sθi Cθi 0 0 0 0 1 0 0 0 0 1         1 0 0 0 0 1 0 0 0 0 1 di 0 0 0 1         1 0 0 ai 0 1 0 0 0 0 1 0 0 0 0 1         1 0 0 0 0 Cαi −Sαi 0 0 Sαi Cαi 0 0 0 0 1     =     Cθi −SθiCαi SθiSαi aiCθi Sθi CθiCαi −CθiSαi aiSθi 0 Sαi Cαi di 0 0 0 1     (2.17)

onde os parˆametros θi, ai, di e αi est˜ao relacionados com o elo i e junta i. Como a matriz Ai ´

e fun¸cão de uma única variável, três parâmetros são constantes para um dado elo. O quarto parâmetro será θi para juntas de revolu¸cão ou di para juntas prismáticas [1].

Afim de simplificar a escrita das matrizes, nesta se¸cão é utilizada a seguinte nota¸cão: Cθi significa cos(θi);

(32)

Sθi significa sin(θi); Ci significa cos(θi); Cij significa cos(θi+ θj); Si significa sin(θi); Sij significa sin(θi+ θj). Passo-a-passo

´

E poss´ıvel determinar a cinemática direta de qualquer manipulador robótico pelo uso do método de Denavit-Hartenberg. Esse método pode ser utilizado seguindo uma série de passos que estão explicados logo abaixo [1–3, 5, 6].

Passo 1: Localize e nomeie os eixos das juntas z0, . . . , zn−1. O eixo zi deve ser o eixo de atua¸cão da junta i + 1. Assim, z0 está no eixo de atua¸cão da junta 1 e z1 está no eixo de atua¸cão da junta 2. Existem dois casos a serem considerados: se a junta i + 1 é de revolu¸cão, zi é o eixo de revolu¸cão da junta i + 1; se a junta i + 1 é prismática, zi é o eixo de transla¸cão da junta i + 1.

Passo 2: Determine o frame da base. Coloque a origem em qualquer lugar ao longo do eixo z0. Os eixos x0 e y0 s˜ao escolhidos de acordo com a regra da m˜ao direita.

Para i = 1, . . . , n − 1, siga os passos 3 a 5.

Passo 3: Localize a origem oi onde a normal comum de zi e zi−1 intercepta zi. Se zi intercepta zi−1 coloque oi nessa interse¸cão. Se zi e zi−1 são paralelos, coloque oi em qualquer posi¸cão conveniente ao longo de zi.

Passo 4: Estabele¸ca xi ao longo da normal comum entre zi−1e zi atrav´es de oi ou na dire¸c˜ao normal ao plano zi−1− zi se zi−1 e zi se cruzam.

Passo 5: Estabele¸ca yi de acordo com a regra da m˜ao direita.

Passo 6: Estabele¸ca o frame do end-effector onxnynzn. Assuma que a n-ésima junta é de revolu¸cão e estabele¸ca zn na dire¸cão de zn−1. Estabele¸ca a origem on convenientemente ao longo de zn, preferivelmente no centro da garra. Fa¸ca yn na dire¸cão do fechamento da garra e xn como yn× zn. Se o end-effector não possuir uma garra, estabele¸ca xn e yn de forma conveniente de acordo com a regra da mão direita.

Passo 7: Crie uma tabela com os parâmetros dos elos, θi, ai, di e αi: ai: distância ao longo do eixo xi de oi até a interse¸cão dos eixos xi e zi−1.

di: distância ao longo de zi−1 de oi−1 até a interse¸cão dos eixos xi e zi, di será variável se a junta i for prismática.

αi: ˆangulo entre zi−1 e zi medido sobre xi.

θi: ângulo entre xi−1 e xi medido sobre zi−1, θi será variável se a junta i for de revolu¸cão. Passo 8: Forme a matriz de transforma¸cão homogênea Ai substituindo os parâmetros dos elos na Equa¸cão 2.17.

Passo 9: Fa¸ca 0_T

n = Ai. . . An. Assim obtêm-se a posi¸cão e orienta¸cão da ferramenta em rela¸cão a sistema de coordenadas da base do robô.

(33)

2.3. Cinem´atica Direta 15

Um exemplo

Um exemplo de um manipulador planar com 2 graus de liberdade ser´a usado para ilustrar como se utilizar o m´etodo de Denavit-Hartenberg.

Primeiro estabelece os eixos em cada elo do manipulador, conforme mostrado na Figura 2.6. Logo após, monta-se uma tabela com os parâmetros dos elos conforme mostrado na Tabela 2.1. Após isso, monta-se as matrizes A1 e A2, Equa¸cão 2.18. Por último, determina-se a matriz de transforma¸cão conforme mostrado na Equa¸cão 2.19.

A1 =     c1 −s1 0 a1c1 s1 c1 0 a1s1 0 0 1 0 0 0 0 1     A2 =     c2 −s2 0 a2c2 s2 c2 0 a2s2 0 0 1 0 0 0 0 1     (2.18) 0 T2 = A1A2 =     c12 −s12 0 a1c1+ a2c12 s12 c12 0 a1s1+ a2s12 0 0 1 0 0 0 0 1     (2.19) ´

E fácil ver que o método desenvolvido por Denavit e Hartenberg possui muitas vantagens e torna a determina¸cão da cinemática direta de qualquer manipulador robótico uma tarefa simples. Na próxima se¸cão estão apresentados alguns métodos clássicos encontrados em diversos livros para resolver a cinemática inversa.

(34)

Elo ai αi di θi 1 a1 0 0 θ1 2 a2 0 0 θ2

Tabela 2.1: Parˆametros dos elos para um manipulador planar com 2 graus de liberdade.

2.4 Cinem´

atica Inversa

O problema geral da cinemática inversa pode ser posto da seguinte forma: dada uma matriz 4 × 4 de transforma¸cão homogênea

H =R P 0 1

, (2.20)

quais são as solu¸cões da equa¸cão [1] 0_T

n(q1, . . . , qn) = H? (2.21) Nesta se¸cão são apresentados dois métodos para resolver esse problema: o método algébrico e o método geométrico. A utiliza¸cão desses dois métodos pode ser encontrada em vários livros de robótica [1, 3, 5, 6]. Os dois métodos são aplicados ao exemplo de um manipulador planar com 3 graus de liberdade encontrado no livro Introduction to Robotics de Craig [5].

2.4.1 M´

etodo alg´

ebrico

Em resumo, resolver a cinemática inversa utilizando-se o método algébrico é basicamente realizar manipula¸cões algébricas para encontrar as solu¸cões desejadas.

Considere o manipulador da Figura 2.7. Seguindo-se o método de Denavit-Hartenberg obtêm-se os parâmetros dos elos, Tabela 2.2, e as equa¸cões da cinemática direta, Equa¸cão 2.22.

0_T 3 =     C123 −S123 0 L1C1+ L2C12 S123 C123 0 L1S1+ L2S12 0 0 1 0 0 0 0 1     (2.22) Elo ai αi di θi 1 0 0 0 θ1 2 L1 0 0 θ2 3 L2 0 0 θ3

Tabela 2.2: Parâmetros dos elos para um manipulador planar com 3 graus de liberdade. Para ter certeza que a posi¸cão e a orienta¸cão desejada para o end-effector está dentro do espa¸co de trabalho do robô, usa-se a seguinte matriz de transforma¸cão:

(35)

2.4. Cinem´atica Inversa 17 T =     Cφ −Sφ 0 x Sφ Cφ 0 y 0 0 1 0 0 0 0 1     . (2.23)

A matriz da Equa¸cão 2.23 representa todas as orienta¸cões e posi¸cões poss´ıveis do end-effector. Onde φ é a orienta¸cão do end-effector em rela¸cão rela¸cão ao eixo +X da base e x, y é a posi¸cão do end-effector em rela¸cão ao sistema de coordenadas da base.

A partir de 2.22 e 2.23 obt´em-se quatro equa¸c˜oes:

Cφ = C123, (2.24)

Sφ = S123, (2.25)

x = L1C1+ L2C12, (2.26)

y = L1S1+ L2S12. (2.27)

Elevando ao quadrado e somando x e y, obt´em-se:

x2+ y2 = L2₁+ L₂2+ 2L1L2C2, (2.28) onde usou-se as seguintes identidades trigonom´etricas:

C12 = C1C2− S1S2, (2.29)

S12= C1S2+ S1C2. (2.30)

(36)

Resolvendo 2.28 para C2, obt´em-se C2 = x2+ y2− L2 1− L22 2L1L2 . (2.31)

Para existir solu¸cão para 2.31, o lado direito precisa ficar estar no intervalo [−1, 1]. Se essa condi¸cão não for satisfeita, significa que o ponto desejado está fora do espa¸co de trabalho do robô. Assumindo que o ponto está dentro do espa¸co de trabalho, pode-se escrever S2 como

S2 = ± q 1 − C2 2. (2.32) Portanto, θ2 = AT AN 2(S2, C2). (2.33) Tendo encontrado θ2, pode-se resolver 2.26 e 2.27 para encontrar θ1. Pode-se reescrever 2.26 e 2.27 da seguinte forma: x = k1C1− k2S1, (2.34) y = k1S1+ k2C1, (2.35) onde k1 = L1+ L2C2, (2.36) k2 = L2S2. (2.37)

Para resolver essa equa¸cão é necessário fazer uma mudan¸ca de variáveis. Se r = + q k2 1+ k22 (2.38) e γ = AT AN 2(k2, k1), (2.39) então k1 = r cos γ, (2.40) k2 = r sin γ. (2.41)

Agora as equa¸c˜oes 2.34 e 2.35 podem ser reescritas como x

r = cos γ cos θ1 − sin γ sin θ1, (2.42) y

r = cos γ sin θ1+ sin γ cos θ1, (2.43) assim cos(γ + θ1) = x r, (2.44) sin(γ + θ1) = y r. (2.45)

Usando-se o arco-tangente de dois argumentos, tem-se γ + θ1 = AT AN 2( y r, x r) = AT AN 2(y, x), (2.46) portanto θ1 = AT AN 2(y, x) − AT AN 2(k2, k1). (2.47) Por fim, pode-se obter θ3 atrav´es da seguinte equa¸c˜ao:

(37)

2.4. Cinem´atica Inversa 19

Figura 2.8: Solu¸c˜ao geom´etrica para um manipulador com 3 graus de liberdade, adaptado de [5].

2.4.2 M´

etodo geom´

etrico

No m´etodo geom´etrico, tenta-se decompor a geometria espacial do manipulador em diversos planos em que se possa utilizar geometria plana.

No caso do manipulador planar com 3 graus de liberdade, pode-se aplicar geometria plana diretamente para encontrar uma solu¸cão. Na Figura 2.8 é mostrado o triângulo formado por L1, L2 e a linha que vai da origem do frame {0} até a origem do frame {3}. As linhas tracejadas mostram uma segunda configura¸cão do robô que leva a mesma solu¸cão. Considerando o triângulo, pode-se aplicar a lei dos cossenos para resolver θ2:

x2+ y2 = L2₁+ L₂2− 2L1L2cos(π + θ2). (2.49) Como cos(π + θ2) = − cos(θ2), tem-se

C2 =

x2_{+ y}2_{− L}2 1− L22

2L1L2 . (2.50)

Para resolver para θ1 é necessário encontrar expressões para os ângulos ψ e β, como indicado na Figura 2.8. Como β pode estar em qualquer quadrante, usa-se o arco-tangente com dois argumentos:

β = AT AN 2(y, x). (2.51)

Aplica-se a lei dos cossenos para encontrar ψ: cos ψ = x 2 _{+ y}2_{+ L}2 1− L22 2L1px2+ y2 . (2.52) Portanto, tem-se: θ1 = β ± ψ, (2.53)

onde o sinal positivo é usado se θ2 < 0 e o sinal negativo é usado se θ2 > 0. Por último, θ3 pode ser encontrado através da seguinte expressão:

(38)

2.4.3 Solu¸

c˜

ao alg´

ebrica por redu¸

c˜

ao polinomial

Equa¸cões transcendentais são dif´ıceis de resolver, porque mesmo quando existe apenas uma variável, ela geralmente aparece em fun¸cão se senos e cossenos. Afim de transformar uma expressão transcendental em uma expressão polinomial, que irá facilitar a obten¸cão de uma resposta, pode-se fazer as seguintes substitui¸cões [5]:

u = tanθ 2, cos θ = 1 − u 2 1 + u2, sin θ = 2u 1 + u2. (2.55)

Polinômios de até quarto grau possuem solu¸cões fechadas. Portanto, manipuladores simples podem ser resolvidos por métodos algébricos [5].

(39)

Cap´ıtulo 3

Redes Neurais Artificiais

Neste cap´ıtulo é apresentado a teoria das redes neurais artificiais. O cap´ıtulo está dividido em introdu¸cão, histórico, fundamentos, redes perceptron feed-forward de múltiplas camadas e algoritmo de retro-propaga¸cão.

3.1 Introdu¸

c˜

ao

O cérebro humano processa informa¸cões de uma forma inteiramente diferente de um compu-tador digital convencional. O cérebro é um sistema de processamento de informa¸cões altamente complexo, não-linear e paralelo; possuindo capacidade de organizar seus constituintes estruturais, conhecidos como neurônios, de forma a realizar certos processamentos muito mais rapidamente que o mais rápido computador digital existente [38]. Essas caracter´ısticas são a motiva¸cão do estudo e desenvolvimento das redes neurais artificiais, RNA [38]. Portanto, as RNAs são modelos computacionais baseados em sistemas biológicos [7]. Várias defini¸cões de RNA podem ser encontradas em livros, dois exemplos são mostrados a seguir:

Segundo Gurney [39], uma rede neural é um conjunto interconectado de elementos de processamento simples, chamados de nós, cuja funcionalidade é livremente baseada em neurônios animais. A capacidade de processamento da rede é armazenada nas for¸cas de liga¸cão entre as unidades, denominadas de pesos, obtidas pelo processo de adapta¸cão ou aprendizagem de um conjunto de treinamento.

Segundo Haykin [38], uma rede neural é um processador maci¸camente paralelamente distribu´ıdo constitu´ıdo de unidades de processamento simples, que têm a propensão natural para armazenar conhecimentos experimental e torná-lo dispon´ıvel para o uso. Ela se assemelha ao cérebro em dois aspectos:

1. O conhecimento ´e adquirido pela rede a partir de seu ambiente atrav´es de um processo de aprendizagem.

2. For¸cas de conexão entre neurônios, conhecidas como pesos sinápticos, são utilizadas para armazenar o conhecimento adquirido.

(40)

Tipicamente, uma rede neural artificial é composta por um conjuntos de entradas e um conjunto de sa´ıdas, que é denominado de camada de sa´ıda. Uma RNA pode ser composta por camadas de neurônios entre as entradas e as sa´ıdas. Essas camadas intermediária de neurônios são conhecidas pelo nome de Camadas Escondidas, do inglês Hidden Layers. Uma RNA pode ter um número arbitrário de camadas escondidas e cada uma delas podem ter um número arbitrário de neurônios [7, 39]. Por exemplo, na Figura 3.1 é mostrado uma RNA com 4 entradas, 2 sa´ıdas e 1 camada escondida com 3 neurônios.

Figura 3.1: Exemplo de uma Rede Neural Artificial, adaptado de [39].

As RNAs são objetos de interesses de diversos pesquisadores em diversas áreas por diferentes razões. Engenheiros eletricistas encontram inúmeras aplica¸cões em processamento de sinais e teoria de controle. Para engenheiros da computa¸cão, as RNAs apresentam resultados promissores para problemas dif´ıceis em áreas como Inteligência Artificial e Reconhecimento de Padrões. Para matemáticos, as RNAs são ferramentas eficientes para modelagem de problemas em que a forma expl´ıcita e as rela¸cões entre certas variáveis são desconhecidas [40]. As RNAs também encontram aplica¸cões em várias outras áreas, como Aeroespacial, Automotiva, Automa¸cão Bancária, Defesa, Eletrônica, Entretenimento, Financeira, Manufatura, Médica, Robótica, etc [41].

3.2 Hist´

orico

Considera-se que a era moderna das redes neurais come¸cou com o trabalho pioneiro de McCulloch e Pitts em 1943 em que é apresentado o primeiro modelo artificial de um neurônio biológico. Neste trabalho é apresentada uma discussão sofisticada sobre redes lógicas de neurônios artificiais, além de novas ideias a cerca de máquinas de estados finitos, elementos de decisão de limiar lineares e representa¸cões lógicas de várias formas de comportamento e memória. Nesse trabalho, McCulloch e Pitts se concentraram mais em descrever um neurônio artificial e apresentar suas capacidades computacionais do que apresentar técnicas de aprendizado [38, 42].

Em 1949, Donald Hebb apresentou um dos primeiros trabalhos a lidar com a questão do aprendizado em redes biológicas e artificiais. Ele mostrou que a capacidade de aprendizagem das redes neurais deriva da varia¸cão dos pesos das entradas dos neurônios. A teoria de Hebb é baseada no refor¸co das liga¸cões sinápticas entre os neurônios excitados. A regra de Hebb é utilizada até hoje em vários algoritmos de aprendizagem. Mais tarde, Widrow e Hoff sugeriram uma regra de

(41)

3.3. Fundamentos 23

aprendizado que utiliza o método do gradiente descendente de minimiza¸cão. Essa regra ficou conhecida como regra Delta ou Widrow-Hoff e é também bastante utilizada atualmente [38,41,42].

Em 1958, Rosenblatt demonstrou a rede neural perceptron que apresentavam sinapses ajus-táveis que podiam ser treinadas para reconhecimento de certos tipos de padrões. Rosenblatt descreveu uma topologia de RNA, estruturas de liga¸cões entre os neurônios e, o mais importante, propôs um algoritmo para treinar a rede para executar determinados tipos de fun¸cões. A rede descrita por Rosenblatt possui 3 camadas, uma camada que recebe os dados de entrada, uma camada intermediária com pesos ajustáveis e uma camada de sa´ıda de dados. A rede perceptron ´

e capaz de atuar como um classificador de padr˜oes [38, 42].

Apesar do grande interesse inicial pelo estudo das RNAs, na década de 1970, esse interesse diminuiu drasticamente. Isso aconteceu devido ao trabalho de Minsky e Papert em 1969. Eles mostraram que as redes perceptron não eram capaz de realizar tarefas consideradas simples. Por exemplo, as redes perceptron não eram capazes de detectar paridade, conectividade e simetria, que são problemas não-linearmente separáveis. A cr´ıtica de Minsky e Papert residia no fato do problema do crescimento explosivo, tanto de espa¸co ocupado como do tempo requerido para a solu¸cão de problemas complexos. Além disso, eles argumentaram que não existia um algoritmo que garantisse convergência para redes perceptron com mais de uma camada. Atualmente, os argumentos de Minsk e Papert podem ser vistos como bastante pessimistas já que hoje as redes neurais são capazes de resolver problemas não-linearmente separáveis e não sofrem do problema do crescimento explosivo [42].

O campo das redes neurais se tornou novamente de interesse dos pesquisados a partir da década de 1980. Em 1982, Hopfield publicou um artigo que chamou a aten¸cão para as propriedades associativas das RNAs. Hopfield mostrou a rela¸cão entre redes recorrentes auto-associativas e sistemas f´ısicos. Anos mais tarde pesquisadores desenvolveram o algoritmo de treinamento back-propagation, retro-propaga¸cão. O que mostrou que as ideias de Minsk e Papert eram na realidade muito pessimista e que redes neurais podem aprender até mesmo problemas considerados complexos. O que também ajudou no ressurgimento do interesse nas redes neurais foi o desenvolvimento de computadores mais potentes [38, 42].

Atualmente, diversos pesquisadores continuam interessados em desenvolver trabalhos rela-cionados as redes neurais. O foco atual é o desenvolvimento de técnicas de aprendizagem que convirjam mais rápido [42]. Além disso, também há a tentativa de implementar as redes neurais diretamente no n´ıvel de hardware [42]. Não obstante, existe a tentativa de solucionar diversos problemas atuais pela utiliza¸cão desse tipo de rede. Portanto, as redes neurais continuam sendo uma área promissora para pesquisa e desenvolvimento de novas tecnologias.

3.3 Fundamentos

3.3.1 Um framework para representa¸

c˜

ao distribu´ıda

Uma rede neural artificial consiste de um conjunto de unidades de processamento simples que se comunicam enviando sinais entre si por um grande n´umero de conex˜oes ponderadas [7].

(42)

Um conjunto de unidades de processamento ou nós, neurônios ou células;

Um estado de ativa¸cão yk para cada unidade, que é equivalente a sa´ıda da unidade; Conexões entre as unidades. Geralmente cada conexão é definida por um peso wjk que

determina o efeito do sinal;

Uma regra de propaga¸c˜ao, que determina a entrada efetiva sk de uma unidade em rela¸c˜ao `

as v´arias entradas externas;

Uma fun¸cão de ativa¸cão, também chamada de fun¸cão de transferência, Fk, que determina o novo n´ıvel de ativa¸cão baseado na entrada efetiva e na ativa¸cão atual;

Uma entrada externa, chamada de bias ou offset, θk, para cada unidade; Um m´etodo para reunir informa¸c˜ao, a regra de treinamento;

Um ambiente dentro do qual o sistema precisa operar, provendo sinais de entrada e sinais de erro.

A Figura 3.2 ilustra os aspectos discutidos acima em uma RNA.

Figura 3.2: Componentes de uma Rede Neural Artificial, adaptado de [7].

3.3.2 N´

os de processamento

Cada nó realiza um trabalho simples: receber uma entrada de seus vizinhos ou de uma fonte externa e usá-la para calcular um sinal de sa´ıda que irá se propagar para outras unidades. Uma segunda tarefa é o ajuste de pesos. O sistema é inerentemente paralelo, porque muitos nós podem operar ao mesmo tempo [7].

Faz-se necessário distinguir três tipos de nós: nós de entradas, que recebem dados de fora da rede, nós de sa´ıda que enviam dados para fora da rede e nós escondidos cujas entradas e sa´ıdas permanecem dentro da rede. [7].

Durante a opera¸cão da rede, os nós podem ser atualizados de forma sincronizada ou não sincronizada. Na atualiza¸cão sincronizada todos os nós atualizam suas ativa¸cões de forma

(43)

3.3. Fundamentos 25

simultânea. Na atualiza¸cão não sincronizada, cada nó tem uma probabilidade de atualizar sua ativa¸cão durante um certo tempo, geralmente apenas um nó será capaz de consegui isso durante esse tempo [7].

3.3.3 Conex˜

oes entre n´

os

Na maioria dos casos assume-se que cada nó provê uma contribui¸cão positiva a entrada do nó conectado a ele. A entrada total do nó k é simplesmente a soma ponderada das sa´ıdas de cada nó conectado mais o bias ou offset θk [7]:

sk(t) = X

j

wjk(t)yj(t) + θk(t). (3.1)

Uma contribui¸cão positiva de wjk é considerada uma excita¸cão e uma contribui¸cão negativa de wjk é considerada uma inibi¸cão. Em alguns casos mais complexos, regras para combinar entradas são usadas fazendo-se uma distin¸cão entre entradas excitatórias e inibitórias. Os nós que utilizam a regra de propaga¸cão 3.1 são chamados de nós sigma [7].

Existe uma regra diferente de propaga¸c˜ao, chamada de sigma-pi:

sk(t) = X j wjk(t) Y m yjm(t) + θk(t). (3.2)

Geralmente, os yjm s˜ao ponderados antes da multiplica¸c˜ao [7].

3.3.4 Ativa¸

c˜

ao e regras de sa´ıda

Faz-se necessário, a utiliza¸cão de uma regra que determine o efeito da entrada total na ativa¸cão do nó. É necessário, uma fun¸cão Fk que tome a entrada total sk(t) e a ativa¸cão atual yk(t) e produza um novo valor de ativa¸cão para o nó k [7]:

yk(t + 1) = Fk(yk(t), sk(t)). (3.3) Geralmente, a fun¸cão de ativa¸cão é uma fun¸cão não-decrescente da entrada total da unidade:

yk(t + 1) = Fk(sk(t)) = Fk(sk(t)) = Fk( X

j

wjk(t)yj(t) + θk(t)), (3.4)

embora uma fun¸cão de ativa¸cão não seja restrita a fun¸cões não-decrescentes. Alguns exemplos de fun¸cões de ativa¸cões usadas em redes neurais são mostradas na Figura 3.3. A fun¸cão sigmoide ´

e um tipo comum de fun¸c˜ao de ativa¸c˜ao usada em redes neurais:

yk= F (sk) = 1

1 + e−sk. (3.5)

Em algumas aplica¸cões a tangente hiperbólica é utilizada, produzindo valores de sa´ıda entre -1 e +1 [7].

(44)

Figura 3.3: Exemplos de fun¸cões de ativa¸cão: (a) fun¸cão sgn, (b) fun¸cão semi-linear, (c) fun¸cão sigmoide. Adaptado de [7].

Em alguns casos, a sa´ıda do nó pode ser uma fun¸cão estocástica da entrada total do nó. Nesse caso, a ativa¸cão não é determinada de forma determ´ıstica pela entrada do neurônio, mas a entrada do nó determina a probabilidade p do neurônio atingir um valor alto de excita¸cão:

p(yk ← 1) = 1 1 + e−skT

, (3.6)

onde T é um parâmetro que determina a inclina¸cão da fun¸cão de probabilidade [7].

3.3.5 Topologias de redes

A topologia de uma RNA está associada com seu padrão de conexões entre os nós e a propaga¸cão dos dados. Existem dois tipos principais de topologia [7]:

Redes feed-forward, onde o fluxo de dados dos nós de entrada para os nós de sa´ıda é estritamente direto. O processamento de dados pode se estender a várias camadas de nós, mas nenhuma conexão de realimenta¸cão está presente.

Redes recorrentes que contém conexões de realimenta¸cão. Ao contrário das redes do tipo feed-forward, as propriedades dinâmicas desta rede são importantes. Em alguns casos, os valores de ativa¸cão dos nós sofrem um processo de relaxa¸cão tal que a rede evolui para um estado estável em que não há mais varia¸cões nas ativa¸cões.

3.3.6 Treinamento de redes neurais artificiais

Uma rede neural precisa ser configurada para que a aplica¸cão de um conjunto de entradas produza um conjunto de sa´ıdas desejadas. Existem vários métodos para configurar o peso das conexões. Uma maneira é configurar os pesos explicitamente, usando conhecimentos a priori. Outra maneira é treinar e ensinar padrões à rede deixando que os pesos mudem de acordo com uma regra de treinamento.

Paradigmas de aprendizagem

Existem dois tipos de aprendizagem [7]:

Aprendizagem supervisionada na qual a rede é treinada utilizando-se entradas e padrões de sa´ıda fornecidos. Os pares de entrada e sa´ıda podem ser fornecidos por uma fonte externa, ou pelo sistema que contém a rede.

(45)

3.4. Redes perceptron feed-forward de m´ultiplas camadas 27

Aprendizagem não supervisionada na qual a sa´ıda é resultado dos nós treinados para responder a um padrão de clusters existente dentro das entradas. Nesse paradigma, o sistema pode descobrir estatisticamente caracter´ısticas na popula¸cão de entradas. Diferente do aprendizado supervisionado, não existe um conjunto de categorias nos quais os padrões podem ser classificados; o sistema precisa desenvolver sua própria representa¸cão dos est´ımulos de entrada.

3.3.7 Modificando parˆ

ametros de conectividade

Ambos os paradigmas discutidos acima resultam em um ajuste de pesos das conexões entre os nós, de acordo com alguma regra de modifica¸cão. Virtualmente todas as regras para modelos desse tipo podem ser considerados uma varia¸cão da regra de aprendizagem sugerida por Hebb em 1949. A ideia básica é que se dois nós j e k estão ativos ao mesmo tempo, suas interconexões precisam ser fortalecidas. Na versão mais simples da regra de Hebb, se j recebe uma entrada de k, a modifica¸cão do peso wjk será dada por:

∆wjk = γyjyk, (3.7)

onde γ é uma constante positiva de proporcionalidade representando a taxa de aprendizagem. Em uma outra regra comumente utilizada, o ajuste de pesos não é feito usando a ativa¸cão atual do nó k, mas a diferen¸ca entre a ativa¸cão atual e a ativa¸cão desejada, como mostrado a seguir: ∆wjk = γyj(dk− yk), (3.8) onde dk é n´ıvel de ativa¸cão desejado fornecido por uma fonte externa. Essa forma é usualmente chamada de regra de Widrow-Huff ou regra Delta [7].

3.4 Redes perceptron feed-forward de m´

ultiplas camadas

Neste trabalho são utilizadas redes neurais para resolver o problema da cinemática inversa. Esse é um clássico problema não-linear. Portanto, não seria poss´ıvel resolvê-lo utilizando redes perceptron de uma única camada porque esse tipo de rede só é capaz de resolver problemas lineares. As não-linearidades são incorporadas a redes neurais através de fun¸cões de ativa¸cão não-lineares [7, 38, 42].

Para redes de uma única camada, o aprendizado supervisionado é realizado através da aplica¸cão do ajuste ao vetor de pesos. O erro é obtido diretamente através da diferen¸ca entre a sa´ıda desejada e a sa´ıda corrente da rede. No entanto, para redes de múltiplas camadas, esse procedimento pode ser aplicado somente para a camada de sa´ıda, já que não existem sa´ıdas desejadas definidas para as camadas intermediárias. Assim, o problema passa a ser então como calcular ou estimar o erro das camadas intermediárias [38, 42].

A aprendizagem por retro-propaga¸cão consiste de dois passos: um passo para frente, a propaga¸cão, e um passo para trás, a retro-propaga¸cão. No passo para frente, um padrão de atividade é aplicado aos nós sensoriais da rede e seu efeito se propaga através da rede, camada por camada. Finalmente, um conjunto de sa´ıdas é produzido como a resposta real da rede.

(46)

Figura 3.4: Exemplo de uma rede perceptron com m´ultiplas camadas, adaptado de [38].

Durante o passo de propaga¸cão, os pesos sinápticos da rede são todos fixos. Durante o passo para trás, por outro lado, os pesos sinápticos são ajustados de acordo com uma regra de corre¸cão de erro. Especificamente, a resposta real da rede é subtra´ıda de uma resposta desejada para produzir um sinal de erro. Este sinal de erro é propagado para trás através da rede, contra a dire¸cão das conexões sinápticas. Os pesos são ajustados para fazer que a resposta real da rede se mova para mais perto da resposta desejada [38].

Na Figura 3.4 é mostrado um exemplo de uma rede perceptron com duas camadas escondidas e uma camada de sa´ıda. Considera-se que a rede é totalmente conectada, ou seja, um neurônio em qualquer camada está conectado a todos os neurônios da camada anterior. O fluxo de sinais progride para frente, da esquerda para a direita e de camada em camada [38].

Na Figura 3.5 é mostrado a dire¸cão dos sinais em uma rede perceptron com múltiplas camadas. Percebe-se que existem dois tipos de sinais nessa rede [38]:

Sinais funcionais: é um sinal de entrada que incide no terminal de entrada da rede, propaga-se para frente (nó por nó) através da rede e emerge no terminal de sa´ıda da rede como um sinal de sa´ıda. Presume-se que este sinal realize uma fun¸cão na sa´ıda da rede. Em cada neurônio que ele passa, o sinal é calculado como uma fun¸cão de suas entradas e pesos associados, aplicados àquele nó.

Sinais de erro: este sinal se origina em um nó de sa´ıda da rede e se propaga para trás, camada por camada, através da rede. Ele é chamado de sinal de erro porque sua computa¸cão para cada neurônio da rede envolve uma fun¸cão dependente do erro, de uma forma ou de outra.

As camadas ocultas da rede não fazem parte nem da entrada nem da sa´ıda da rede. Portanto, cada neurônio nas camadas ocultas é projetado para realizar os seguintes cálculos [38]:

Cálculo do sinal funcional que aparece na sua sa´ıda, que é expresso como uma fun¸cão não-linear do sinal de entrada e dos pesos sinápticos associados a ele;

(47)

3.5. Algoritmo de retro-propaga¸c˜ao 29

Cálculo de uma estimativa do vetor gradiente que é necessário para a retro-propaga¸cão através da rede.

Figura 3.5: Fluxo de sinais em uma rede perceptron com m´ultiplas camadas, adaptado de [38].

Na próxima se¸cão será apresentado o funcionamento do algoritmo de aprendizagem por retro-propaga¸cão.

3.5 Algoritmo de retro-propaga¸

c˜

ao

3.5.1 Regra delta generalizada

´

E necessária uma regra delta generalizada para fun¸cões de ativa¸cões não-lineares. A ativa¸cão será uma fun¸cão diferenciável da entrada total p, dada por [7]

y_kp = F (sp_k), (3.9)

onde

sp_k =X j

wjkykp+ θk. (3.10)

Afim de obter-se a correta generaliza¸c˜ao da regra delta, adota-se

∆pwjk = −γ ∂EP

∂wjk. (3.11)

O erro EP _´_{e definido como o erro quadr´}_{atico total do padr˜}_{ao p na sa´ıda dos n´}_{os [7]:}

EP = 1 2 No X o=1 (dp_o− ip o) 2 , (3.12)

onde dp_o é a sa´ıda desejada para o nó ”o”quando o padrão p é fixado. Além disso, pode-se fazer E =P

pE

p _{e cham´}_{a-lo de somat´}_{orio do erro quadr´}_{atico. Pode-se escrever [7]}

∂EP ∂wjk = ∂E P ∂sp_k ∂sp_k ∂wjk . (3.13)

(48)

Pela Equa¸c˜ao 3.10, tem-se ∂sp_k ∂wjk = y_jp. (3.14) Quando define-se [7] δp_k= −∂E p ∂sp_k, (3.15)

obt´em-se uma regra delta baseada no gradiente descendente. A mudan¸ca nos pesos ocorrer´a de acordo com [7]

∆pwjk = γδp_kyjp. (3.16) O problema é como determinar δ_kp para cada nó k da rede. O resultado interessante, que será derivado a seguir, é que existe uma maneira simples e recursiva de determinar os “δ’s” que pode ser implementada para propagar o sinal de erro para trás por toda a rede [7].

Para determinar δ_kp aplica-se a regra da cadeia para escrever a derivada parcial como o produto de dois fatores, um fato que reflete a mudan¸ca do erro como uma fun¸cão da sa´ıda do nó, e outro que reflete a mudan¸ca na sa´ıda como fun¸cão de mudan¸cas na entrada. Assim, tem-se [7]

δp_k= −∂E P ∂sp_k = − ∂Ep ∂y_kp ∂yp_k ∂sp_k. (3.17) Da Equa¸c˜ao 3.9, tem-se ∂yp_k ∂sp_k = F 0 (sp_k), (3.18)

que é simplesmente a derivada da fun¸cão F para o k-ésimo nó, avaliado para a entrada da rede sp_k para esse nó. Para determinar o primeiro fator da Equa¸cão 3.17, considera-se dois casos. Primeiro, assume-se que o nó k é um nó de sa´ıda da rede, k = o, onde o significa output. Nesse caso, tem-se [7]

∂EP ∂ypo

= −(dp_o− yp

o), (3.19)

que é o mesmo resultado obtido pela regra delta padrão. Substituindo a equa¸cão acima e a Equa¸cão 3.18 na Equa¸cão 3.17, tem-se

δp_o = (dp_o− yp o)F 0 o(s p o) (3.20)

para qualquer nó de sa´ıda o. No segundo caso, se k não é um nó de sa´ıda, mas um nó de uma camada escondida k = h, não se pode saber de forma direta a contribui¸cão do nó no erro de sa´ıda da rede. Entretanto, o erro pode ser escrito como fun¸cão do conjunto de entradas da camada escondida para a camada de sa´ıda; Ep = Ep(sp₁, sp₂, . . . , sp_j, . . . ) e pode-se usar a regra da cadeia para escrever [7] ∂Ep ∂yp_h = No X o=1 ∂Ep δspo ∂sp o ∂yp_h = No X o=1 ∂Ep δspo ∂ ∂yp_h Nh X j=1 wkoypj = No X o=1 ∂Ep δspo who = − No X o=1 δp_owho. (3.21)

Substituindo a equa¸c˜ao acima na Equa¸c˜ao 3.17, tem-se

δ_hp = F0(sp_h) No X o=1