Esta revis˜ao dos principais modelos da fonologia das LS teve como objetivos buscar um entendimento claro de quais s˜ao os elementos que formam os sinais e da forma como eles est˜ao estruturalmente organizados e podem ser combinados para a produ¸c˜ao dos sinais.
Neste contexto, uma estrutura conceitual formal foi definida para o modelo computacional com base em uma ´arvore, que agregou as caracter´ısticas gestuais-visuais mais adequadas de cada modelo fonol´ogico revisado.
Al´em disso, o modelo computacional centrado na HCI-SL deve incluir uma completude de representa¸c˜ao (descrever quaisquer sinais), um alto n´ıvel de detalhamento (conseguir
diferenciar os sinais), regras computacionais formais para a representa¸c˜ao (para minimizar ambiguidade e permitir um processamento adequado), entre outros.
Neste sentido, como apresentado no in´ıcio deste cap´ıtulo, esta fundamenta¸c˜ao te´orica se baseia em quatro pilares principais: um entendimento sobre as LS, uma s´ıntese das principais caracter´ısticas dos modelos da fonologia que foram estudados e, posteriormente, as bases computacionais necess´arias.
Percebeu-se neste estudo que cada modelo fonol´ogico apresenta caracter´ısticas es-pec´ıficas, mas de forma evidente incluem e adaptam os conceitos dos modelos previamente desenvolvidos.
Seguindo uma ordem cronol´ogica, nota-se uma evolu¸c˜ao e complementa¸c˜ao dos mo-delos a partir da inser¸c˜ao de novos parˆametros, do detalhamento de caracter´ısticas es-pec´ıficas (e.g. movimento) e de melhorias na organiza¸c˜ao estrutural baseados em novas teorias (geometria, pros´odia, dependˆencia, etc).
Como resultado deste estudo te´orico, um modelo conceitual foi constru´ıdo para repre-sentar as principais caracter´ısticas analisadas em cada modelo visando a constru¸c˜ao do modelo computacional. O conjunto dos conceitos e dos seus relacionamentos foi formali-zado na forma de um mapa conceitual, apresentado na Figura 2.17.
Na revis˜ao apresentada, ficou evidente que todos os modelos revisados tˆem como base principal ou como um segmento/camada os cinco parˆametros principais do MBP deri-vados dos estudos de [101], [10], [76] e [8]: CM (configura¸c˜oes de m˜ao), OP (orienta¸c˜ao da palma), LOC (pontos de articula¸c˜ao), ENM (express˜oes n˜ao-manuais) e MOV (movi-mento).
A percep¸c˜ao pelos surdos desses cinco parˆametros principais da fonologia das LS du-rante o discurso, como crit´erio para a distin¸c˜ao entre os sinais, pode ser suficiente, mas como mostram os estudos de [6] e [4], mesmo percebendo esses parˆametros em um si-nal, uma pessoa tamb´em percebe inconsciente e naturalmente outros detalhes espec´ıficos durante a produ¸c˜ao do sinal (e.g. pequenas varia¸c˜oes na loca¸c˜ao ou express˜oes faciais).
Nesta situa¸c˜ao, com o objetivo de criar um modelo computacional que contenha a capacidade de identificar corretamente os sinais, mesmo quando s˜ao muito similares, ´e necess´ario incluir um alto n´ıvel de detalhes. Assim, as caracter´ısticas intr´ınsecas a cada modelo fonol´ogico (Figura 2.17) (parˆametros, conceitos, organiza¸c˜ao estrutural, entre ou-tros aspectos) foram compilados e adaptados em uma estrutura computacional formal e expressiva.
A organiza¸c˜ao estrutural proposta no MP [13] e no MD [77] foram ´uteis para a cons-tru¸c˜ao da base para o modelo computacional. O MP apresenta duas caracter´ısticas prin-cipais: Inerentes (IF) e Pros´odicas (PF). As IF possuem dois grupos principais: os ar-ticuladores e os pontos de articula¸c˜ao. Este nodo do MP tem uma similaridade com o articulador manual do MD, pois descreve todas as caracter´ısticas das CM (dominante e n˜ao-dominante).
Figura 2.17: Mapa Conceitual com as principais caracter´ısticas de cada modelo Fonte: O autor (2014)
Da mesma forma, a classe principal do MD (manner of movement) tem rela¸c˜ao com as caracter´ısticas pros´odicas do MP, no que tange `as unidades respons´aveis por detalhar o movimento (e.g. forma, tens˜ao, etc.). Assim, foi poss´ıvel utilizar uma combina¸c˜ao de ambas as estruturas para a constru¸c˜ao da base estrutural do modelo computacional.
Cabe ainda ressaltar que o MD descreve os articuladores manuais em duas classes:
ativo (CM) e passivo (LOC e o espa¸co). A combina¸c˜ao de CM, LOC e OP na mesma camada parece ser mais relevante e concisa para descrever o articulador principal. O conceito de articulador passivo do MD tamb´em foi ´util para a defini¸c˜ao de movimentos de trajet´oria entre a m˜ao principal e a m˜ao passiva.
Como foi visto, esta defini¸c˜ao era necess´aria porque existem sinais onde n˜ao h´a al-tera¸c˜ao na CM durante o movimento (LOC-MOV-LOC), por´em, podem existir sinais que possuam a CM inicial diferente da CM final. Neste caso, para cada LOC (estado inicial
e final) deve ser descrita uma CM. Esta possibilidade indica que a LOC deve estar junto com a CM.
Em rela¸c˜ao `a forma como os sinais s˜ao articulados e constitu´ıdos, percebeu-se com-plexidade do ponto de vista computacional de alguns aspectos das CM, MOV, LOC e ENM. Primeiro, notou-se que devido aos detalhes e `a grande quantidade de articuladores na forma¸c˜ao de uma CM, poderiam ser criadas CM muito similares ou que contives-sem detalhes muito espec´ıficos necess´arios e diferenciadores dos sinais que as utilizam.
Este problema pode ser minimizado, posteriormente, de duas maneiras: a) padroniza¸c˜ao por linguistas em cada LS; b) valida¸c˜ao e an´alise das CM existentes para remover re-dundˆancias; e c) conjuntos fechados de CM como apresentado em [46].
A ´arvore de CM ´e bem detalhada no MMS, especificando cada um dos dedos que comp˜oem as CM e um atributo de relaxamento dos m´usculos para dar mais naturalidade
`
a configura¸c˜ao. O MP, o MHT e o MD tamb´em compartilham de um detalhamento por meio de um atributo para os dedos selecionados.
Na literatura, o MOV proporciona uma grande discuss˜ao e sua especifica¸c˜ao varia em cada modelo. Nesta tese, as caracter´ısticas de MOV que consideramos mais adequadas foram combinadas e adaptadas para a formaliza¸c˜ao computacional.
No MMS, a complexidade do MOV se mostra pelo n´umero de sub-classes distintivas, tais como o tipo, a frequˆencia, a maneira, o plano, entre outras. Esses detalhes s˜ao importantes para caracterizar o movimento, principalmente quanto `as suas especificidades.
No MHT, o MOV ´e definido pela trajet´oria entre dois sub-espa¸cos, compartilhando as caracter´ısticas da LOC. Esta proposta de estrutura foi ´util porque especifica os pontos de in´ıcio e fim de um sinal, fato que ´e importante computacionalmente.
Embora n˜ao haja uma padroniza¸c˜ao para o MOV na literatura, o modelo computaci-onal adotou e adaptou os conceitos de modelos fonol´ogicos distintos para a formaliza¸c˜ao das regras. Por exemplo, pareceu vi´avel utilizar os conceitos de estados (in´ıcio e fim) do MHT combinado com o detalhamento do MMS e do MP. Adicionalmente, o MOV tamb´em foi complementado com a categoriza¸c˜ao do MD, que dividiu os movimentos em trˆes tipos (trajet´oria, mudan¸ca de orienta¸c˜ao e de abertura).
Al´em disso, foram evidenciadas pela literatura as condi¸c˜oes de simetria e de do-minˆancia propostas por Battison (1974) [10] em rela¸c˜ao aos sinais realizados com ambas as m˜aos durante o movimento. Essas condi¸c˜oes foram importantes tamb´em para o mo-delo computacional, pois minimizam o n´umero de combina¸c˜oes e imp˜oem regras para os movimentos.
Entretanto, como apresentado em Antunes (2011) [4], existem sinais na Libras que n˜ao respeitam essas condi¸c˜oes de simetria e dominˆancia, por exemplo, no sinal JORNAL em que as duas m˜aos apresentam CM distintas e ambas realizam o movimento. Esse fato pode ter sido marcado por uma varia¸c˜ao do int´erprete que realizou o sinal ou pode ter sido por um erro ainda n˜ao revisado (esta hip´otese determinaria um desafio ainda maior
computacionalmente, ao se considerar que essas bases de dados possam incluir v´ıdeos incorretos).
Vimos que as LOC tamb´em podem ter uma alta complexidade quando ´e necess´aria uma maior precis˜ao do ponto de articula¸c˜ao do sinal. O MMS, como revisado em Kooij (2002) [77], apresenta um alto n´ıvel de detalhamento para as LOC. O modelo sub-divide as LOC em cabe¸ca, corpo, m˜aos e no espa¸co - detalhando cada ponto e eventuais varia¸c˜oes.
Esse detalhamento foi necess´ario e ´e relevante no modelo computacional.
O MHT define, tamb´em, uma boa estrutura para LOC, mas n˜ao abrange todas as possibilidades para o espa¸co de articula¸c˜ao. O modelo trabalha com valores proximal (pr´oximo ao corpo) e distal (m˜aos longe do corpo), mas n˜ao especifica uma distˆancia m´edia para a execu¸c˜ao dos sinais.
O aspecto de ENM talvez seja o atributo de maior complexidade computacional, pois al´em de ser um tra¸co articulat´orio distintivo na fonologia, pode representar marcas pros´odicas e verbo-visuais - o que gera um desafio, principalmente em sistemas de PLN, para distinguir entre os aspectos inerentes ao sinal e as caracter´ısticas do sinalizador.
Neste contexto, as ENM s˜ao elementos importantes na constitui¸c˜ao dos sinais, podendo at´e mesmo serem o ´unico tra¸co articulat´orio na representa¸c˜ao de um sinal (i.e. sinais compostos somente de ENM). Uma an´alise aprofundada das ENM na Libras foi realizada por Felipe (2013) [42], mostrando que as marca¸c˜oes n˜ao-manuais podem representar ao sinal diversos n´ıveis gramaticais.
Uma premissa importante compreendida nesta revis˜ao de literatura, que foi funda-mental para esta tese, ´e a quest˜ao de que as LS e, em particular a Libras, possuem a mesma modalidade gestual-visual e utilizam as mesmas propriedades e tra¸cos fon´eticos na produ¸c˜ao dos sinais [44], [46], [48], [74], [30], [15], [51], [13]. Esta premissa foi funda-mental, para que o modelo computacional, que contempla os modelos fonol´ogicos, tamb´em possa, por hip´otese a ser provada posteriormente, representar sinais de quaisquer LS.
Os modelos apresentados e os estudos em rela¸c˜ao a fonologia, al´em de inclu´ırem de alguma forma os parˆametros principais da fonologia (MBP) em sua estrutura, s˜ao deriva-dos das pesquisas na ASL. Como mostra Felipe (2007) [48], os estuderiva-dos lingu´ısticos sobre a Libras teve in´ıcio em 1980 baseado na ASL, com pesquisas tamb´em do ponto de vista estruturalista e gerativista.
Xavier (2006) [114] mostra que a estrutura proposta no MMS [80] ´e capaz de descrever os sinais da Libras. Segundo Brentari (2011) [14] outros pesquisadores tem mostrado que essas cinco unidades fonol´ogicas principais e suas combina¸c˜oes formam os sinais de outras LS, tais como a L´ıngua de Sinais Holandesa e a L´ıngua de Sinais de Israel, mostrando que as LS possuem propriedades similares e s˜ao de mesma modalidade.
Liddell (2011) [71] explana que em uma perspectiva fonol´ogica os sinais s˜ao formados pelas CM, LOC, OP, MOV e ENM, e s˜ao tra¸cos contrastivos e distintivos nas LS, como exemplificado tamb´em na L´ıngua de Sinais de Israel.
Para Meir et al. (2007) [85] o recurso de design universal da linguagem humana torna poss´ıvel a cria¸c˜ao de um vasto vocabul´ario de formas significativas a partir de um n´umero limitado/finito de unidades fonol´ogicas.
Na pesquisa de Karnopp (1999) [74] ´e mostrado que na aquisi¸c˜ao da LS, bem como na fonologia, a crian¸ca adquire uma estrutura de representa¸c˜ao fonol´ogica b´asica, com-posta por elementos que formam o n´ucleo em uma abordagem baseada na Fonologia de Dependˆencia. Neste sentido, esta base inicial de representa¸c˜ao fonol´ogica ´e formada pelos parˆametros de CM, LOC e OP, sendo que o MOV ´e considerado uma consequˆencia da transi¸c˜ao entre LOC ou CM.
Karnopp (1999) [74] explica que a LOC e CM“expressam propriedades nucleares deter-minadas pela Gram´atica Universal (GU)”, ou seja, na aquisi¸c˜ao da fonologia pressup˜oe-se que a articula¸c˜ao de qualquer sinal (mesmo simples) exija a utiliza¸c˜ao de um n´ucleo tanto de CM quanto de LOC. Karnopp (1999) [74] diz que “a literatura tem sido unˆanime em apontar que a configura¸c˜ao de m˜ao, ponto de articula¸c˜ao, movimento, orienta¸c˜ao de m˜ao e express˜oes n˜ao-manuais s˜ao os componentes formacionais dos sinais”.
Outro aspecto importante observado na literatura consiste nas restri¸c˜oes para a forma¸c˜ao dos sinais. Segundo Karnopp (1999) [74], devido `as restri¸c˜oes f´ısicas e lingu´ısticas somente algumas combina¸c˜oes entre as unidades de CM, LOC, OP e MOV podem ser especifica-das para a forma¸c˜ao dos sinais, ou seja, restri¸c˜oes do pr´oprio sistema perceptual (visual) e em rela¸c˜ao ao sistema de articula¸c˜ao (limitado pela anatomia das m˜aos e dos demais membros).
As propriedades do sistema de percep¸c˜ao visual tamb´em restringem a produ¸c˜ao de sinais, pois o receptor tende a fixar seu olhar na regi˜ao da face do interlocutor, prin-cipalmente, devido `as ENM [74]. Por isso, existe uma maior facilidade do receptor em reconhecer varia¸c˜oes sutis na face do que nas CM, MOV e LOC (Siple, 1978 [74]).
Esse fato tamb´em ´e percebido na pesquisa de Battison (1978) [11] que mostra que sinais s˜ao articulados com maior frequˆencia nesta regi˜ao facial, onde h´a um n´umero maior de diferentes loca¸c˜oes. Al´em disso, o campo de percep¸c˜ao dos sinais tamb´em depende da vis˜ao perif´erica, e desta forma, os sinais tendem a ser localizados mais em um ponto de vista central.
Essas regras e restri¸c˜oes foram adaptadas ao modelo computacional, visando a mini-miza¸c˜ao do n´umero de combina¸c˜oes das sub-unidades fonol´ogicas, e contribuindo, tamb´em, para garantir uma estrutura robusta e n˜ao-amb´ıgua, que possu´ısse regras de forma¸c˜ao e de representa¸c˜ao dos sinais bem definidas.
A quest˜ao dos pares m´ınimos, mostrada inicialmente por Battison (1974) [10], ´e uma quest˜ao fundamental para o tratamento computacional. Primeiramente, Liddell (2011) [71] fala que o conceito de pares m´ınimos ´e frequentemente usado em pares de sinais que possuem uma mesma sequˆencia (forma) de fonemas, exceto uma (ou seja, os sinais variam apenas em uma propriedade).
A hip´otese de existirem sinais muito similares entre si nas LS determina um desafio significativo para o modelo computacional constru´ıdo nesta tese: um sistema de indexa¸c˜ao e busca n˜ao poderia dispor de um recurso de pesquisa exata e, portanto, deve trabalhar no desenvolvimento de um sistema de busca por similaridade, o que implicou em pesqui-sar formas de construir fun¸c˜oes de distˆancia para calcular o grau de similaridade entre uma entrada e os demais sinais presentes em uma base. Adicionalmente, tamb´em foram estudados os ru´ıdos e varia¸c˜oes de cada pessoa na entrada do sistema de reconhecimento, bem como os tra¸cos distintivos muito semelhantes visualmente (i.e. no caso de algumas CM, LOC e ENM).
Na literatura, percebeu-se que a maioria dos modelos desenvolvidos ap´os a pesquisa de Liddell & Johnson (1989) [80] contempla os conceitos de sequencialidade e simultanei-dade. Ou seja, ´e de consenso e demonstrado pelas pesquisas lingu´ısticas que os sinais s˜ao formados pela organiza¸c˜ao simultˆanea de algumas sub-unidades, mas nos casos de sinais que fa¸cam a altera¸c˜ao de um dos seus cinco parˆametros b´asicos na articula¸c˜ao de um sinal, a especifica¸c˜ao da sequˆencia correta ´e tamb´em necess´aria.
Ao analisar a estrutura dos modelos apresentados juntamente com os conceitos abor-dados em rela¸c˜ao a movimentos e `a sequencialidade, uma combina¸c˜ao das estruturas do MMS, do MD e do MP pareceu mais adequada ao modelo computacional, por possuir um alto n´ıvel de detalhamento (dispondo de caracter´ısticas para descrever cada uma das cinco classes de parˆametros principais, ou seja, descrever em detalhes as CM, LOC e MOV), al´em de trabalhar no conceito de segmentos de suspens˜ao (segmento est´atico) e de movimentos (segmento dinˆamico). A transi¸c˜ao entre duas LOC trouxeram o car´ater de in´ıcio e fim, necess´arios computacionalmente.
Neste sentido, no modelo computacional precisaram ser modeladas regras nas quais sempre que houvesse movimento em um sinal fosse definido por in´ıcio-movimento-fim (i.e.
apresentando um estado est´atico, um dinˆamico e um est´atico para representar o fim do sinal).
Esta caracter´ıstica fica mais evidente quando se analisam os demais modelos, como o MHT, que tratam o movimento como uma transi¸c˜ao entre duas loca¸c˜oes. Ao se consi-derar que o segmento de suspens˜ao do MMS contempla o parˆametro de loca¸c˜ao, ent˜ao o movimento consiste de um segmento dinˆamico entre duas suspens˜oes (MMS). A quest˜ao fundamental consistiu, tamb´em, em aproveitar as estruturas dos modelos que fornecem um melhor detalhamento ao MOV, para proporcionar ao modelo computacional mais tra¸cos distintivos.
Al´em disso, considerar segmentos est´aticos e dinˆamicos mostrou-se interessante prin-cipalmente para sinais que sejam formados por uma sequˆencia de CM (soletra¸c˜oes), que apenas usem uma pequena varia¸c˜ao de CM ou que variem a LOC sem que haja necessa-riamente uma trajet´oria (e.g. alterando a CM ou a OP).
O conjunto de caracter´ısticas (CM, LOC, MOV, OP e ENM) do MBP ainda ´e
pre-dominante como o conjunto principal de tra¸cos fonol´ogicos utilizados para a forma¸c˜ao e distin¸c˜ao dos sinais durante o discurso, pois seria complexo ter que analisar um conjunto muito grande de tra¸cos articulat´orios [30] [4].
Embora o MMS tenha um grande n´umero de caracter´ısticas, cerca de 299 sub-unidades [13], e seu uso na pr´atica das l´ınguas de sinais pare¸ca invi´avel, computacionalmente, o modelo traz um conjunto adequado de elementos capazes tanto de formar quanto de distinguir os sinais, pois detalha cada um dos parˆametros principais (MBP) em rela¸c˜ao a maneira como s˜ao formados.
Por exemplo, como as CM pr´e-definidas apresentam diferen¸cas entre cada LS, era preciso ter uma estrutura capaz de descrever e formar quaisquer configura¸c˜oes. Logo, foi necess´ario considerar todos os elementos articulat´orios que comp˜oem as CM. No mesmo sentido, no parˆametro de LOC a estrutura computacional deveria ser capaz de, al´em de representar as LOC nas m˜aos e no corpo, representar os pontos no espa¸co de sinaliza¸c˜ao onde os sinais s˜ao articulados. Esses elementos s˜ao importantes para que um sistema de reconhecimento possa diferenciar um espa¸co neutro de um ponto espec´ıfico no espa¸co (constituinte do sinal), bem como para que um sistema de processamento gr´afico possa sintetizar adequadamente um avatar.
Brentari (1998) [13] analisa o MMS e remove diversas redundˆancias no modelo, cons-truindo o MP em uma base s´olida e sem repeti¸c˜oes. No parˆametro de MOV, tamb´em pareceu relevante considerar as caracter´ısticas para a representa¸c˜ao de movimentos lo-cais, pois existem uma s´erie de sinais que n˜ao apresentam trajet´oria no espa¸co, mas tˆem varia¸c˜oes nas CM nos dedos ou pulsos.