Discussões e Trabalhos Futuros - Conclusões, Discussões e Trabalhos Futuros

Conclusões, Discussões e Trabalhos Futuros

6.2 Discussões e Trabalhos Futuros

Até que ponto se pode alterar estes mapas topológicos e obter um melhor resultado, baseando- se nos critérios de vizinhança? Percebe-se que nas redes SOM-DT o papel desempenhado pelas conexões está relegado à indicadores de similaridades, quando muitos marcadores de atividade neural para o controle de remoção de nodos inativos. Os testes com o STRAGEN mostraram que o papel das conexões, quando a elas se atribui uma interpretação, é essencial para a criação de mapas topológicos, e vai em última instância guiar o algoritmo de geração de trajetórias através de critérios de otimização.

Uma proposta interessante é criar uma rede que inclua simultaneamente e em paralelo di- ferentes critérios de vizinhança. Essa proposta original pode trazer uma nova forma de lidar com mapas auto-organizáveis. Tais conexões seriam classificadas, por exemplo, por arestas de cores distintas, cada qual ligando seus próprios vizinhos a partir de cada nodo, lembrando o uso de Redes de Petri para a modelagem de sistemas concorrentes (Jensen, 1994). Com este mecanismo, o algoritmo se torna capaz de alterar o critério de geração de trajetórias sem a necessidade de um novo treinamento da rede, e mais que isso, se torna capaz de achar cami-

nhos alternativos para suprir trechos desconexos em algum critério, alterando-se o critério de vizinhança.

Caracterizar a semelhança em um mapa que representa transições em um espaço de estados de um sistema dinâmico não-linear leva a interpretações muito mais complexas que a simples distância Euclidiana geralmente utilizada em mapas auto-organizáveis. Experimentos psico- físicos indicam que humanos preferem movimentar-se minimizando a energia (torque) usada (Bullock et al., 1999;Bullock & Grossberg, 1988a), o que é coerente com o que se observa na natureza em geral. Seria possível adaptar este princípio para outros sistemas dinâmicos, mesmo que não relacionados a robótica? Quais os limites de um modelo como o STRAGEN, que ma- peia espaços de estados de sistemas dinâmicos? Que tipos de critérios podem ser representados para que a geração de trajetórias nestes sistemas possa ser realizada otimizando-o?

Neste ponto se percebe a questão da escolha da métrica, além da escolha do que medir. Nas simulações realizadas até o momento, utilizou-se como métrica a distância Euclidiana. Qual seria a influência de utilizar outras métricas, como a distância de Minkowski, que é uma generalização da distância Euclidiana, ou a métrica de Tanimoto, que mede a distância entre conjuntos, para um determinado domínio de problemas? Uma das maiores dificuldades na escolha de métricas tem a ver com a invariância a transformações, tais como translações ho- rizontais, verticais, rotações, escalas e normalizações, e assim por diante. Isso se torna ainda mais complexo se for desejado que a medida de distância seja simultaneamente invariante a diversas transformações (Duda et al.,2000).

Neste momento, utilizou-se como algoritmos geradorers de trajetória a função de difusão de energia e o algoritmo de menor caminho. Estes algoritmos têm a importante propriedade de sempre achar um trajeto entre dois pontos dados, se por eles existir conexão, e esta trajetória terá o menor número de nodos possível.

Um dos problemas de buscas globais como a difusão de energia e o menor caminho é o custo computacional. Uma possível solução a ser analisada é a utilização de difusão local, que ao invés de gerar a trajetória até o nodo alvo, difundiria a energia por um número limitado de nodos (o limite pode se dar por número de nodos, número de camadas de vizinhos, ou por tempo disponível para a iteração). Uma vez difundida a energia, os nodos da borda desse campo formado são todos candidatos a fazerem parte da trajetória final resultante, e são chamados de janela de candidatos. Então é escolhido o nodo vencedor dentre os nodos da janela, aquele que faz com que a posição final da trajetória fique mais próxima. Este modelo alternativo tem a desvantagem de poder cair em mínimos locais, além de que não se garante que a trajetória formada será aquela dada pela otimização do critério de vizinhança de modo global. A trajetória gerada seria, dentro do campo de difusão, seguida pela otimização do critério de vizinhança;

porém nas transições entre cada campo, de cada iteração do processo, o ponto de escolha seria o critério de menor distância entre a posição atual e o nodo alvo, o que compromete a trajetória como um todo e não garante que uma trajetória possa ser encontrada (na presença de obstáculos, por exemplo).

Um outro algoritmo que chama a atenção por sua eficiência é o Rapidly Exploring Random Trees (RTT) (Jarvis, 2006), que faz a busca ao acaso em um grafo. Seu funcionamento básico consiste em escolher estados aleatoriamente e gerar trechos de trajetória desde o ponto inicial até este estado, aumentando gradativamente a área de busca. Este algoritmo pode trabalhar simultaneamente, partindo do ponto inicial e final e gerando trechos de trajetórias até que estas se conectem. Entretanto, como não há garantia de que os estados estejam interligados e que uma trajetória possa ser encontrada, é mais interessante utilizar o tempo de processamento apenas a partir do nodo inicial, para que os trechos de trajetórias gerados possam ser utilizados imediatamente, de modo on-line. Comparado com a difusão local, o RTT local não necessita expandir todos os nodos da rede a partir do nodo inicial, apenas os trechos escolhidos ao acaso, o que diminui a janela de canditados aumentando a velocidade da exploração da árvore.

Figura 6.1 Robô bípede MNRIM: (a) Barras de alumínio de 55mm de largura ligando o contra-peso. (b) Barra de alumínio de 90mm de comprimento da perna, ligando a junta do corpo à junta do joelho. (c) Barra de 90mm de comprimento ligando o joelho ao tornozelo. (Foresti,2006)

O processo de adaptação do mapa tolopológico do STRAGEN depende da constante ite- ração com o sistema identificado. A remoção de conexões é um ponto crucial que precisa de

aprimoramentos. O STRAGEN, tendo em vista a representação do sistema, não elimina cone- xões inativas. As remoções são feitas apenas para melhor ajustar as vizinhanças topológicas em relação ao critério utilizado e à densidade da rede, que indiretamente mede o tamanho das conexões. Este processo revelou-se adequado, de custo baixo, e capaz de preservar a topologia mesmo de áreas desconexas. Entretanto, pela própria atenção dispendida ao papel das conexões no STRAGEN, seria interessante investigar ainda outros métodos para a manutenção das transições de estados. Num olhar superficial, pode parecer não haver outro critério para remoções de conexões que não a avaliação de sua atividade, como fazem os modelos GWR e GCS pelo uso da idade, ou remover nodos em áreas de baixa probabilidade como faz o modelo GCS. Uma nova possibilidade seria aproveitar a característica de representação de informações heterogêneas dos nodos no STRAGEN para coletar do próprio sistema informações ou critérios que possam ser utilizados para determinar a remoção de nodos e conexões. Esta propriedade é dependente do sistema a se representar, porém parece mais plausível do que determinar de antemão um critério que afetará o modo como o sistema é mapeado.

Há que se analisar também a proposta de De Angulo & Torras(2005) para a redução do número necessário de pontos para o treinamento da cinemática inversa de um robô. Ao invés de aprender uma função inversa da cinemática, o método proposto consiste em expressar tal função em uma composição de funções de aprendizado, cada qual com metade da dimensão do mapa original. Seria interessante avaliar como unir este método com o método de Balbuciamento Motor do STRAGEN, para que se consiga representar com maior precisão uma base de dados com informações limitadas. No entanto, a proposta deDe Angulo & Torras(2005) é específica para cinemática inversa, e sua utilização para sistemas dinâmicos não-lineares em geral teria que ser re-avaliada.

A implementação de um sistema de memória que guarda trajetórias realizadas é um ponto interessante para se colocar. Tal sistema poderia aprender as trajetórias durante os primeiros usos, e refazê-las imediatamente quando solicitadas pela segunda vez, ou ainda podia memori- zar não só transições e estados durante o balbuciamento motor, mas trechos de trajetórias que poderiam ser utilizados já na primeira vez que o modelo for requisitado a atuar. Um sistema de memória permitiria também realizar o rastreamento de trajetórias e previsões.

O STRAGEN foi aplicado a diversos domínios neste trabalho: robô bidimensional e tridi- mensional PUMA-560, mão robótica Kanguera e estudo de progressões harmônicas. Outros domínios interessantes que podem ser desenvolvidos são: trajetórias de robôs móveis (Glasius et al., 1995; Nehmzow, 2001) em especial robôs da classe PIONEER, estudo de logística e transporte (Chauhan et al., 2005; Barr et al., 1981), e o interessante problema de equilíbrio em robôs bípedes (Miller, 1994). Foresti (2006) desenvolveu um robô bípede (Figura 6.1) e

gerou uma base de dados de posições em que o robô encontra-se em equilíbrio estático para ser treinada pelo STRAGEN. Um dos maiores problemas na movimentação de robôs bípedes é a realização de passos em equilíbrio dinâmico (Miller,1994) Os primeiros robôs a caminhar com sucesso o faziam transitando entre estados de equilíbrio estático. O movimento em equilíbrio dinâmico exige que o robô literalmente comece a “cair” e em tempo movimente seu pé para que sua base se desloque para a região que equilibra a queda em um novo passo. O STRAGEN abre caminhos em distintas áreas de pesquisa e utilizá-lo para contribuir com tais áreas é além de um desafio aprazível um trabalho de pesquisa encantador pela sua diversidade.

Agre, P. E. & Chapman, D. (1990), What are plans for?, in P. Maes, ed., ‘Designing Autono- mous Agents: Theory and Practice from Biology to Engineering and Back’, The MIT Press, Cambridge, MA, pp. 17–34.

URL: citeseer.ist.psu.edu/agre89what.html

Angeline, Saunders & Pollack (1994), ‘An evolutionary algorithm that constructs recurrent neural networks’, IEEE Transactions on Neural Networks 5(1), 54–65.

Araújo, A. F. R. & Barreto, G. A. (2002), ‘Context in temporal sequence processing: A self- organizing approach and its application to robotics’, IEEE Transactions on Neural Networks 13(1), 45–57.

Ashby, W. R. (1962), Principles of the self-organizing system, in H. Von Foerster & G. W. Zopf Jr., eds, ‘Principles of self-organization’, Pergamon, Oxford, pp. 255–278.

Atukorale, A. S. & Suganthan, P. N. (2000), ‘Hierarchical overlapped neural-gas network with application to pattern classification’, Neurocomputing 35(1-4), 165–176.

Aupetit, M., Couturier, P. & Massotte, P. (2002), ‘Gamma-observable neighbours for vector quantization’, Neural Networks 15(8–9), 1017–1027.

Baraldi, A. & Alpaydin, E. (2002), ‘Constructive feedforward ART clustering networks - part I,II’, IEEE Transactions on Neural Networks 13(3), 645–677.

Barbehenn, M. (1998), ‘A note on the complexity of Dijkstra’s algorithm for graphs with weigh- ted vertices’, IEEE Trans. Comput. 47(2), 263.

Barr, R. S., Glover, R. S. & Klingman, D. (1981), ‘A new optimization method for large scale fixed charge transportation problems’, Oper. Res. 29(3), 448–463.

Barreto, G. A. & Araújo, A. F. R. (1998), Competitive and temporal hebbian learning for pro- duction of robot trajectories, in ‘2nd Brazilian Symposium on Neural Networks (SBRN’98)’,

No documento Geração de trajetórias de estados por mapas auto-organizáveis com topologia dinâmica (páginas 195-200)