3 Módulos Neurais para Aprendizagem de
3.1.3 Subproblemas de Aprendizagem para o Agente
As definições do agente, do ambiente e do instrutor, apresentadas acima, facilitam a compreensão do problema que deve ser tratados pelo agente para alcançar seu objetivo, auxiliando em sua decomposição em subproblemas mais simples. Além disso, a adoção do paradigma da robótica desenvolvimentista implica que o agente deve aprender com suas interações com o ambiente e
com o instrutor. Então, os problemas tratados pelo agente devem ser vistos como problemas de aprendizagem. Assim sendo, o problema de compreensão e execução de comandos em linguagem natural foi subdividido nos seis subproblemas de aprendizagem descritos abaixo:
Subproblemas de Aprendizagem
A1: Aprender sobre o ambiente que o cerca, identificando objetos, suas propriedades e suas posições, além da maneira como este ambiente evoluiu e qual o impacto de suas ações e das ações do instrutor sobre o ambiente;
A2: Aprender sobre a linguagem utilizada pelo instrutor, identificando seu conjunto léxico, sua sintaxe e sua semântica.
A3: Aprender sobre si mesmo, relacionando representações internas com o movimento resultante de seus atuadores e a respectiva interação dos atuadores com os objetos do ambiente;
A4: Aprender a reconhecer diferentes situações (contextos) e identificar o contexto atual;
A5: Aprender a associar elementos da linguagem com ações, situações e elementos do ambiente;
A6: Aprender a interpretar as intenções do instrutor em função dos estímulos visuais e auditivos por ele fornecidos, e do contexto atual.
Os subproblemas de aprendizagem listados acima serão descritos de maneira formal a seguir. O foco desta Tese está nos subproblemas A1, A2, A4 e A5, os quais serão tratados nos capítulos posteriores. Estes subproblemas constituem um subconjunto passível de ser validado através de experimentos cross-situacionais, como será apresentado no Capítulo8. Os demais subproblemas serão definidos abaixo e incluídos na modelagem apresentada em seguida, para proporcionar uma visão mais completa do problema e identificar outras etapas necessárias na implementação agentes controlados por linguagem natural.
A1 - Aprendizagem do Ambiente
Para aprender sobre o ambiente, o agente deve primeiramente identificar seus componentes. Isto é parcialmente realizado pelo mapeamento sensório-perceptivo, discutido anteriormente. Neste caso, mecanismos de segmentação e extração de características dos sinais produzem como saída um conjunto de percepções (Dalle-Mole,2010). Por exemplo, identificando formas, cores e localizações.
P= {p1, p2, p3, ...}, implica em: (1) representar os estados possíveis sensoriados do ambiente,
D = {D1, D2, D3, ...} e (2) identificar o estado atual, ea. A primeira parte pode ser definida
como uma função que atualiza o conjunto dos estados conhecidos pelo agente,R(DA, P) 7→ DN,
adicionando novos estados ao conjunto ou atualizando a representação de algum dos estados previamente conhecidos. A segunda etapa pode ser descrita como uma função que identifica o estado atual do ambiente a partir de uma sequência de percepções: U(P) 7→ ea.
A2 - Aprendizagem da Linguagem Natural
A aprendizagem da linguagem natural se dá nos níveis léxico, sintático, semântico e pragmático. A aprendizagem no nível léxico inclui o reconhecimento da forma das unidades de linguagem, como radicais, prefixos e sufixos (morfemas), bem como os significados associados (Allen,
1994).
O aprendizado da forma das unidades de linguagem pode ser realizado através de uma segmentação das percepções auditivas em suas respectivas partes. Ou seja, uma sentença pode ser definida como uma sequência de percepções auditivas, S = {pa1, pa2, pa3, ...} a partir da qual deve-se relacionar com uma sequência de morfemas, ou proto-morfemas, já que o significado ainda não é conhecido M = {m1, m2, m3, ...}, para que possam ser posteriormente
associadas a seus respectivos significados (Allen, 1994). Tem-se então o mapeamento de sentenças áudio-perceptivas em sentenças morfológicas: L(S) 7→ M.
No nível sintático, o aprendizado consiste em identificar categorias gramaticais nas quais os morfemas podem ser agrupados. Além de identificar maneiras válidas de se combinar os morfemas em estruturas sintáticas. Este aprendizado busca tornar possível reconhecer a maneira como as palavras em uma frase se relacionam umas com as outras e como a posição relativa das palavras modifica o significado final do todo. Cada linguagem contém um conjunto de possíveis estruturas sintáticas formando uma gramática G = {G1, G2, G3, ...}, e sua aprendizagem pode
ser definida como uma função que atualiza a gramática conhecida em função das percepções: RG(GA, P) 7→ GN. Assim, uma vez aprendida a gramática, o reconhecimento de estruturas
sintáticas em que uma sentença pode ser definida como o mapeamento de uma sentença morfológica em um subconjunto de estruturas sintáticas possíveis, Gs, ou seja: G(M) 7→ Gs.
A informação do contexto é necessária para inferir qual a estrutura sintática correta, dentre as estruturas possíveis.
No nível semântico, o aprendizado consiste em identificar as associações entre morfemas ou sentenças morfológicas e os estados e transições de estados identificados no ambiente. Isto inclui o reconhecimento do contexto atual e das intenções do instrutor (descrito a seguir).
No nível pragmático o significado final pode ser alterado em relação ao significado literal contido na sentença, dependendo do contexto, que será tratado no subproblema A4, e da
interpretação da intenção do instrutor, que será tratado no subproblema A6.
A3 - Aprendizagem do Controle dos Atuadores
Inicialmente, o agente não sabe qual o resultado dos comandos enviados para os atuadores. O mecanismo de aprendizagem do controle dos atuadores deve aprender este mapeamento. O controle dos atuadores do agente pode ser descrito como um mapeamento que recebe um comando, c, e o estado atual dos atuadores do agente, eAa, produzindo um novo estado para os atuadores, eAn:C(c,eAa) 7→ eAn. E a aprendizagem dos controles é definida como a memorização da sequência de comandos que leva os atuadores do agente do estado atual para um novo estado: AC(eA
a, eAn) 7→ {c1, c2, c3, ...}.
O estado do ambiente é modificado por uma ação do agente ou do instrutor. Ou seja, uma ação pode ser definida como uma função que recebe como entrada o estado atual e produz um novo estado:A(ea) 7→ en.
Um mapeamento de segundo nível também pode ser definido relacionando o estado atual do ambiente, ea, e uma ação desejada, acd, como sendo a sequência de estados dos atuadores que
realizará a ação desejada:D(ea, acd) 7→ {eA1, eA2, eA3, ...}.
A4 - Aprendizagem do Contexto
Contexto pode ser definido como o conjunto de circunstâncias que acompanham um aconteci- mento. É possível diferenciar dois tipos de contexto: o espacial e o temporal (Pacheco,2004). O contexto espacial é um conjunto de informações sobre a posição espacial de um ou mais padrões com relação a outros padrões. Já o contexto temporal pode ser definido como um conjunto de informações a respeito das entradas, saídas e/ou estados passados de um sistema. Sendo assim, o contexto pode ser representado a partir de uma sequência de estados recentes até o estado atual, Ca= {ea, e(a−1), e(a−2), ...}. Então, aprender a reconhecer contextos, implica em:
(1) aprender um conjunto de contextos conhecidos, X = {C1, C2, C3, ...} e (2) identificar o
contexto conhecido mais semelhante ao atual, Cs.
A primeira tarefa pode ser definida como uma função que atualiza o conjunto dos contextos conhecidos pelo agente,X(XA, Ca) 7→ XN, adicionando novos contextos ao conjunto ou atu-
alizando a representação de algum dos contextos previamente conhecidos. A segunda tarefa pode ser descrita como uma função que identifica dentre os contextos conhecidos, qual o mais semelhante ao contexto atual: R(Ca, X) 7→ Cs.
A5 - Aprendizagem das Associações
Associações permitem que os elementos da linguagem façam referência a outros elementos do sistema. As associações podem ser consideradas mapeamentos dos elementos da linguagem em estados, ações, contextos ou em outros elementos da linguagem. Por questões de simplificação, considere uma tupla composta por estes elementos, t = {e, ac, C, m}, na qual ao menos um dos elementos precisa estar definido. Uma associação é definida como um mapeamento bidirecional de um elemento morfológico em uma ou mais tuplas: AT(m) ←→ {t1, t2, t3, ...}.
A aprendizagem das associações equivale então à formação do conjunto dos mapeamentos conhecidos A = {AT1,AT2,AT3, ...}.
A6 - Interpretação das Intenções do Instrutor
Considerando a descrição de estados do ambiente definida anteriormente. As intenções do instrutor podem ser representadas através de estados desejados do ambiente ed. Sendo assim,
reconhecer uma intenção do instrutor significa reconhecer qual o estado desejado por ele. Com isso, uma tarefa de aprendizagem pode ser definida levando-se em consideração o conjunto de estruturas sintáticas Gs, nas quais os morfemas proferidos pelo instrutor podem estar organiza-
dos, o contexto reconhecido, Cs, e as associações conhecidas, A. Ou seja, um mapeamento do
tipo:I(Gs, Cs, A) 7→ edque deve ser aprendido pelo agente.
Com isso, os diversos subproblemas de aprendizagem com os quais o agente se depara em sua tarefa de aprender com o ambiente e com o instrutor foram definidos acima. A seguir, estes subproblemas de aprendizagem serão organizadas em módulos, compondo um sistema de ALN.
3.2
Modelo Proposto
O modelo proposto nesta Tese segue a visão da “robótica desenvolvimentista”, também conhe- cida como robótica epigenética, ou metodologia de desenvolvimento autônomo mental. Esta é uma abordagem para o estudo de robôs cognitivos que leva inspiração direta de mecanismos de desenvolvimento e fenômenos estudados em crianças (Weng et al.,2001;Lungarella et al.,
2003;Cangelosi e Riga,2006). Nesta visão, os agentes são conhecidos como “agentes incor- porados”, e adquirem habilidades complexas através da aquisição de conceitos incorporados. Conceitos incorporados são estados internos obtidos a partir de experiências sensório-motoras que identificam elementos cruciais do ambiente ou da interação agente-ambiente. Tais conceitos mediam as reações motoras dos agentes e são utilizados na comunicação com outros agentes, podendo ser organizados em representações hierárquicas. Pode-se hipotetizar que conceitos incorporados podem ser influenciados também pela interação social e linguística e são utilizados
para planejar a interação com o meio ambiente (Cangelosi,2010).