Estudo dos Parˆ ametros do Perceptron Multicamadas

De acordo com o problema que pretende-se resolver, alguns parâmetros da rede neural e do algoritmo de aprendizado aplicado a ela devem ser determinados com o intuito de obter melhores resultados. Os principais parâmetros são:

Algoritmo 1 Algoritmo de treinamento de uma MLP utilizando Retroprogaca¸c˜ao do erro com gradiente descendente

Entrada: x ← entrada ⊲ A entrada do neurônio i na camada j é denotado xji e o peso do neurônio i em j é denotado wji

Entrada: d ← rotulos 1: Inicializa¸c˜ao

2: Atribui¸cão de valores aleatórios para o conjunto de vetores de pesos sinápticos w 3: Atribui¸cão do valor inicial para taxa de aprendizado η

4: Enquanto: Critério de parada Fa¸ca ⊲ Poss´ıveis condi¸cões de parada: número máximo de épocas, erro m´ınimo ou teste de desempenho no conjunto de valida¸cão 5: t← 1

6: Para cada: (x, d) Fa¸ca

7: Apresente o vetor de entrada x, propague-a pelas camadas da rede computando as sa´ıdas de cada neurˆonio j das camadas escondidas e de sa´ıda

8: Para cada neurˆonio da camada de sa´ıda, calcule a informa¸c˜ao de erro (o gradiente)

9: Para cada neurˆonio da camada escondida, calcule a informa¸c˜ao de erro (o gradiente)

10: Com as informa¸c˜oes de erro, ajuste os conjunto de vetores de pesos wji(t) = wji(t− 1) + η ∗ ∆wji(t)

• Fun¸cão de Ativa¸cão: o gradiente local de cada neurônio MLP requer a derivada da fun¸cão de ativa¸cão, sendo então necessário que essa fun¸cão seja cont´ınua em todo seu dom´ınio. Duas fun¸cões são comumente utilizadas em redes MLP, sendo elas: fun¸cão sigmoidal e a fun¸cão tangente hiperbólica. A derivada da fun¸cão sigmoidal representa uma curva na qual há uma maior altera¸cão nos neurônios cujo os sinais assumem valores intermediários, proporcionando maior estabilidade ao sistema, ao contrário da fun¸cão tangente hiperbólica, que sua derivada resulta em uma fun¸cão com uma transi¸cão mais suave.

• Taxa de Aprendizado: este parâmetro é responsável por auxiliar na mudan¸ca dos pesos sinápticos. Ele pode assumir um valor constante em [0, 1] ou pode ter o seu valor alterando, dentro deste intervalo de acordo com heur´ısticas de adapta¸cão da taxa de aprendizado. Essa taxa é aplicada ao gradiente local no momento de atualiza¸cão dos vetores de peso. Sendo assim, quanto maior for o valor desta taxa, maior a velocidade do aprendizado, no entanto, isto pode levar à uma oscila¸cão do modelo ao redor do erro.

• Critério de parada: este parâmetro geralmente está associado ao erro médio quadrático, responsável por dizer se o erro obtido na sa´ıda da rede neural já é suficientemente pequeno para que o processo de treinamento possa ser finalizado. Vale ressaltar que

este parˆametro ´e subjetivo e dependendo do valor atribu´ıdo a ele e da complexidade do problema, o algoritmo pode estacionar em um m´ınimo local.

• Número de neurônios na(s) camada(s) escondida(s): não há regras formais determina- das para tal especifica¸cão, no entanto, sabe-se que o número de camadas escondidas, bem como o número de neurônios em cada camada escondida é responsável por extrair as caracter´ısticas do padrão que pretende-se aprender.

4.4 Considera¸c˜oes Finais

Este cap´ıtulo apresentou uma breve descri¸cão da arquitetura das RNA MLPs, do algoritmo de Retropropaga¸cão do Erro e dos principais parâmetros que devem ser ajustados em um processo de treinamento de uma MLP. Como os valores de tais parâmetros são encontrados de forma emp´ırica, algumas combina¸cões de valores para eles foram testadas neste trabalho com o objetivo de encontrar a melhor combina¸cão para a resolu¸cão do problema em questão. O Cap´ıtulo 5 descreverá melhor como esses parâmetros foram explorados e o Cap´ıtulo 6 mostrará os resultados provenientes destas escolhas.

5 Reconhecimento de Express˜oes Faciais Gramaticais: con-

texto e experimentos

Como apresentado no in´ıcio desta disserta¸cão, este estudo tem como um de seus objetivos, o desenvolvimento de um conjunto de modelos de reconhecimento de padrões capazes de resolver o problema de reconhecimento de expressões faciais usadas no contexto da Libras, as Expressões Faciais Gramaticais, considerando-as em n´ıvel sintático.

Nesta disserta¸cão de mestrado, uma expressão facial EFi ∈ {EF1, EF2, ...EFn} é a forma como os pontos {p1, p2, ...pn} extra´ıdos da face humana estão dispostos no espa¸co tridimensional. Estes pontos possuem coordenadas (x, y, z), sendo o x a coordenada em pixel no eixo horizontal, y a coordenada em pixel no eixo vertical e z a coordenada de profundidade dada em mil´ımetros.

Uma EF pode possuir uma ou mais fun¸cões sintáticas no contexto das LS. Neste contexto defini-se nove fun¸cões sintáticas, as quais estão descritas na Tabela 6. Ao assumir uma fun¸cão sintática, a EF é considerada uma EF gramatical (EFG). Neste trabalho, defini- se, então, o mapeamento entre fun¸cões sintáticas e EFGs ilustrado nas primeira e segunda colunas da Tabela 6. As demais colunas dessa tabela descrevem as caracter´ısticas f´ısicas atemporais (configura¸cão dos elementos da face – colunas 3, 4 e 5) e temporais (movimento da cabe¸ca – coluna 6). A Tabela 7 descreve os caracteres que foram utilizados para representar as caracter´ısticas f´ısicas e os movimentos na Tabela 6. Observe que em termos de descri¸cão via caracter´ısticas da face, EFGs de frases interrogativas (s/n) e condicionais, assim como, de frases com tópico e foco, podem assumir as mesmas configura¸cões de face1_. Vale ressaltar que não é objetivo desta disserta¸cão de mestrado determinar a tradu¸cão semântica do que está sendo sinalizado, mas sim identificar qual configura¸cão a face assumiu durante determinado per´ıodo. Assim, o reconhecimento aqui proposto assume um caráter descritivo da LS.

A estratégia para resolu¸cão do problema de reconhecimento das EFGs adotada neste trabalho foi modelada para resolu¸cão de um probema de classifica¸cão binário, onde o modelo é preparado para identificar a ocorrência de uma EFG (classe positiva) dentro de uma frase sinalizada.

Adotar uma estratégia de classifica¸cão binária, nesta disserta¸cão, forneceu condi¸cões para a realiza¸cão de um estudo sobre a complexidade do problema estudado. O reco- 1

Para efeitos dos experimentos realizados neste trabalho, tais EFGs assumem as mesmas configura¸c˜oes de face.

Fun¸cões sintáticas Id. Sobrancelha Olhos Boca Cabe¸ca Interrogativa (qu) EF2 ↓ ↑ Interrogativa (s/n) / Condicional EF3 ↑ ↓ Interrogativa (dúvida) EF4 ↓ ∗ ∗ ⊖ Negativa EF1 ↓ ∩ ↔ Afirmativa EF5 l Relativa EF6 ↑ Tópicos / Foco EF7 ↑ ⋄ ↓

Tabela 6 – Expressões Faciais Gramaticais: mapeamento considerando as fun¸cões sintáticas; descri¸cão considerando caracter´ısticas f´ısicas atemporais e temporiais.

Caracter Descri¸c˜ao

↑ Movimento para cima ↓ Movimento para baixo

↔ Movimento para direita e para esquerda l Movimento para cima e para baixo ∗ Comprimido

⋄ Aberto ⊖ Afastar

∩ Cantos da boca para baixo

Tabela 7 – Descri¸c˜ao dos caracteres utilizados na Tabela 5

nhecimento automático de EFGs na Libras ainda não havia sido estudado pela área de Computa¸cão, até o momento de desenvolvimento deste trabalho. Portanto, pouco se sabia sobre a complexidade envolvida no problema. De fato, a complexidade inicial aqui atribu´ıda ao problema foi derivada do estudo sobre o reconhecimento de EFs em outros contextos, como no caso de reconhecimento de expressões afetivas e no contexto de outras l´ınguas de sinais.

A estratégia adotada faz uso dos dados em sua forma original e também em representa¸cão vetorial. O conjunto de dados utilizado no presente estudo, bem como os procedimentos aplicados sobre os dados para pré-processamento e constru¸cão de representa¸cão vetorial, são apresentados nas duas primeiras se¸cões deste cap´ıtulo. Na sequência, a terceria se¸cão apresenta o estudo de experimenta¸cão adotado. Os resultados obtidos bem como as respectivas análises estão descritos no Cap´ıtulo 6.

No documento Reconhecimento automático de expressões faciais gramaticais na língua brasileira... (páginas 57-61)