De acordo com o problema que pretende-se resolver, alguns parˆametros da rede neural e do algoritmo de aprendizado aplicado a ela devem ser determinados com o intuito de obter melhores resultados. Os principais parˆametros s˜ao:
Algoritmo 1 Algoritmo de treinamento de uma MLP utilizando Retroprogaca¸c˜ao do erro com gradiente descendente
Entrada: x ← entrada ⊲ A entrada do neurˆonio i na camada j ´e denotado xji e o peso do neurˆonio i em j ´e denotado wji
Entrada: d ← rotulos 1: Inicializa¸c˜ao
2: Atribui¸c˜ao de valores aleat´orios para o conjunto de vetores de pesos sin´apticos w 3: Atribui¸c˜ao do valor inicial para taxa de aprendizado η
4: Enquanto: Crit´erio de parada Fa¸ca ⊲ Poss´ıveis condi¸c˜oes de parada: n´umero m´aximo de ´epocas, erro m´ınimo ou teste de desempenho no conjunto de valida¸c˜ao 5: t← 1
6: Para cada: (x, d) Fa¸ca
7: Apresente o vetor de entrada x, propague-a pelas camadas da rede computando as sa´ıdas de cada neurˆonio j das camadas escondidas e de sa´ıda
8: Para cada neurˆonio da camada de sa´ıda, calcule a informa¸c˜ao de erro (o gradiente)
9: Para cada neurˆonio da camada escondida, calcule a informa¸c˜ao de erro (o gradiente)
10: Com as informa¸c˜oes de erro, ajuste os conjunto de vetores de pesos wji(t) = wji(t− 1) + η ∗ ∆wji(t)
• Fun¸c˜ao de Ativa¸c˜ao: o gradiente local de cada neurˆonio MLP requer a derivada da fun¸c˜ao de ativa¸c˜ao, sendo ent˜ao necess´ario que essa fun¸c˜ao seja cont´ınua em todo seu dom´ınio. Duas fun¸c˜oes s˜ao comumente utilizadas em redes MLP, sendo elas: fun¸c˜ao sigmoidal e a fun¸c˜ao tangente hiperb´olica. A derivada da fun¸c˜ao sigmoidal representa uma curva na qual h´a uma maior altera¸c˜ao nos neurˆonios cujo os sinais assumem valores intermedi´arios, proporcionando maior estabilidade ao sistema, ao contr´ario da fun¸c˜ao tangente hiperb´olica, que sua derivada resulta em uma fun¸c˜ao com uma transi¸c˜ao mais suave.
• Taxa de Aprendizado: este parˆametro ´e respons´avel por auxiliar na mudan¸ca dos pesos sin´apticos. Ele pode assumir um valor constante em [0, 1] ou pode ter o seu valor alterando, dentro deste intervalo de acordo com heur´ısticas de adapta¸c˜ao da taxa de aprendizado. Essa taxa ´e aplicada ao gradiente local no momento de atualiza¸c˜ao dos vetores de peso. Sendo assim, quanto maior for o valor desta taxa, maior a velocidade do aprendizado, no entanto, isto pode levar `a uma oscila¸c˜ao do modelo ao redor do erro.
• Crit´erio de parada: este parˆametro geralmente est´a associado ao erro m´edio quadr´atico, respons´avel por dizer se o erro obtido na sa´ıda da rede neural j´a ´e suficientemente pequeno para que o processo de treinamento possa ser finalizado. Vale ressaltar que
este parˆametro ´e subjetivo e dependendo do valor atribu´ıdo a ele e da complexidade do problema, o algoritmo pode estacionar em um m´ınimo local.
• N´umero de neurˆonios na(s) camada(s) escondida(s): n˜ao h´a regras formais determina- das para tal especifica¸c˜ao, no entanto, sabe-se que o n´umero de camadas escondidas, bem como o n´umero de neurˆonios em cada camada escondida ´e respons´avel por extrair as caracter´ısticas do padr˜ao que pretende-se aprender.
4.4
Considera¸c˜oes Finais
Este cap´ıtulo apresentou uma breve descri¸c˜ao da arquitetura das RNA MLPs, do algoritmo de Retropropaga¸c˜ao do Erro e dos principais parˆametros que devem ser ajustados em um processo de treinamento de uma MLP. Como os valores de tais parˆametros s˜ao encontrados de forma emp´ırica, algumas combina¸c˜oes de valores para eles foram testadas neste trabalho com o objetivo de encontrar a melhor combina¸c˜ao para a resolu¸c˜ao do problema em quest˜ao. O Cap´ıtulo 5 descrever´a melhor como esses parˆametros foram explorados e o Cap´ıtulo 6 mostrar´a os resultados provenientes destas escolhas.
5 Reconhecimento de Express˜oes Faciais Gramaticais: con-
texto e experimentos
Como apresentado no in´ıcio desta disserta¸c˜ao, este estudo tem como um de seus objetivos, o desenvolvimento de um conjunto de modelos de reconhecimento de padr˜oes capazes de resolver o problema de reconhecimento de express˜oes faciais usadas no contexto da Libras, as Express˜oes Faciais Gramaticais, considerando-as em n´ıvel sint´atico.
Nesta disserta¸c˜ao de mestrado, uma express˜ao facial EFi ∈ {EF1, EF2, ...EFn} ´e a forma como os pontos {p1, p2, ...pn} extra´ıdos da face humana est˜ao dispostos no espa¸co tridimensional. Estes pontos possuem coordenadas (x, y, z), sendo o x a coordenada em pixel no eixo horizontal, y a coordenada em pixel no eixo vertical e z a coordenada de profundidade dada em mil´ımetros.
Uma EF pode possuir uma ou mais fun¸c˜oes sint´aticas no contexto das LS. Neste contexto defini-se nove fun¸c˜oes sint´aticas, as quais est˜ao descritas na Tabela 6. Ao assumir uma fun¸c˜ao sint´atica, a EF ´e considerada uma EF gramatical (EFG). Neste trabalho, defini- se, ent˜ao, o mapeamento entre fun¸c˜oes sint´aticas e EFGs ilustrado nas primeira e segunda colunas da Tabela 6. As demais colunas dessa tabela descrevem as caracter´ısticas f´ısicas atemporais (configura¸c˜ao dos elementos da face – colunas 3, 4 e 5) e temporais (movimento da cabe¸ca – coluna 6). A Tabela 7 descreve os caracteres que foram utilizados para representar as caracter´ısticas f´ısicas e os movimentos na Tabela 6. Observe que em termos de descri¸c˜ao via caracter´ısticas da face, EFGs de frases interrogativas (s/n) e condicionais, assim como, de frases com t´opico e foco, podem assumir as mesmas configura¸c˜oes de face1. Vale ressaltar que n˜ao ´e objetivo desta disserta¸c˜ao de mestrado determinar a tradu¸c˜ao semˆantica do que est´a sendo sinalizado, mas sim identificar qual configura¸c˜ao a face assumiu durante determinado per´ıodo. Assim, o reconhecimento aqui proposto assume um car´ater descritivo da LS.
A estrat´egia para resolu¸c˜ao do problema de reconhecimento das EFGs adotada neste trabalho foi modelada para resolu¸c˜ao de um probema de classifica¸c˜ao bin´ario, onde o modelo ´e preparado para identificar a ocorrˆencia de uma EFG (classe positiva) dentro de uma frase sinalizada.
Adotar uma estrat´egia de classifica¸c˜ao bin´aria, nesta disserta¸c˜ao, forneceu condi¸c˜oes para a realiza¸c˜ao de um estudo sobre a complexidade do problema estudado. O reco- 1
Para efeitos dos experimentos realizados neste trabalho, tais EFGs assumem as mesmas configura¸c˜oes de face.
Fun¸c˜oes sint´aticas Id. Sobrancelha Olhos Boca Cabe¸ca Interrogativa (qu) EF2 ↓ ↑ Interrogativa (s/n) / Condicional EF3 ↑ ↓ Interrogativa (d´uvida) EF4 ↓ ∗ ∗ ⊖ Negativa EF1 ↓ ∩ ↔ Afirmativa EF5 l Relativa EF6 ↑ T´opicos / Foco EF7 ↑ ⋄ ↓
Tabela 6 – Express˜oes Faciais Gramaticais: mapeamento considerando as fun¸c˜oes sint´aticas; descri¸c˜ao considerando caracter´ısticas f´ısicas atemporais e temporiais.
Caracter Descri¸c˜ao
↑ Movimento para cima ↓ Movimento para baixo
↔ Movimento para direita e para esquerda l Movimento para cima e para baixo ∗ Comprimido
⋄ Aberto ⊖ Afastar
∩ Cantos da boca para baixo
Tabela 7 – Descri¸c˜ao dos caracteres utilizados na Tabela 5
nhecimento autom´atico de EFGs na Libras ainda n˜ao havia sido estudado pela ´area de Computa¸c˜ao, at´e o momento de desenvolvimento deste trabalho. Portanto, pouco se sabia sobre a complexidade envolvida no problema. De fato, a complexidade inicial aqui atribu´ıda ao problema foi derivada do estudo sobre o reconhecimento de EFs em outros contextos, como no caso de reconhecimento de express˜oes afetivas e no contexto de outras l´ınguas de sinais.
A estrat´egia adotada faz uso dos dados em sua forma original e tamb´em em re- presenta¸c˜ao vetorial. O conjunto de dados utilizado no presente estudo, bem como os procedimentos aplicados sobre os dados para pr´e-processamento e constru¸c˜ao de repre- senta¸c˜ao vetorial, s˜ao apresentados nas duas primeiras se¸c˜oes deste cap´ıtulo. Na sequˆencia, a terceria se¸c˜ao apresenta o estudo de experimenta¸c˜ao adotado. Os resultados obtidos bem como as respectivas an´alises est˜ao descritos no Cap´ıtulo 6.