• Nenhum resultado encontrado

TESTES ESTÁTICOS DE RECONHECIMENTO DE POSTURAS

Este é o primeiro tipo de teste que foi realizado, após os testes preliminares, antes mesmo que a funcionalidade de segmentação estivesse completada ou que alternativas fossem pesquisadas para ela. Foi usada, assim, para testar diferentes tipos de características da imagem e formas de compará-lo, não só para permitir sua escolha como também para testar a viabilidade da estratégia selecionada, baseada em propriedades da imagem e não em modelos 3D e utilizando uma busca pela

postura com máxima verosimilhança. Além da forma de descrição do contorno que foi implementada neste trabalho, foi testado também o uso de Momentos de Hu, que se mostrou pouco preciso para diferenciar entre diversas posturas, e a correlação entre fases da transformada de Fourier das imagens binarizadas da mão, como descrito por Terrilllon et al. (2002), que além de consumir mais processamento, forneceu resultados piores que o método adotado (mas melhores que o uso dos momentos). Nestes testes estáticos iniciais, utilizou-se um conjunto de duas imagens para cada uma dentre 12 posturas, binarizados e segmentados manualmente utilizando um pacote de edição de imagens.

Considerou-se útil manter este teste atualizado mesmo depois da implementação da segmentação para, como já foi discutido, permitir a análise do reconhecimento de posturas com menor influência da segmentação. Foram geradas mais 4 imagens de teste para cada uma das 12 posturas iniciais e 6 imagens para as 5 posturas adicionadas posteriormente (com uma exceção), totalizando 96 imagens, que foram capturadas binarizadas e segmentadas automaticamente usando a mesma estratégia implementada no sistema, já descrita. Essas imagens foram propositadamente geradas com pequenas diferenças na forma de executar as posturas, inclinações das mesmas e a diferentes distâncias da câmera, produzindo imagens de diferentes dimensões. O momento em que foram capturadas, no entanto, foi determinado manualmente, permitindo a escolha de imagens com segmentação sem grandes falhas. As imagens também foram recortadas manualmente, embora isso não tenha influência no reconhecimento. A Figura 11 mostra alguns exemplos de imagens utilizadas nestes testes, mantendo a proporção entre suas dimensões.

Já durante a fase de captura das imagens para o conjunto final de 17 posturas apresentado na Figura 2, decidiu-se por abolir o uso da postura 7. Ao tentar gerar imagens de teste para essa postura, ao menos da forma como está modelada, foi detectada uma dificuldade muito grande, mesmo para usuários experientes, para alinhar a mão corretamente com a câmera em dois eixos simultaneamente, de forma que nem as costas ou palma da mão, nem a parte de cima ou de baixo dos dedos (aproximadamente perpendiculares à palma), fossem vistos na imagem, modificando consideravelmente o perfil da mão. Após a geração de somente um par dessas imagens, com grande esforço, decidiu-se abolir seu uso. Uma postura semelhante que pode ser utilizada com a mesma finalidade e sem os mesmos problemas é mostrada na Figura 12, estendendo somente o polegar e o indicador em vez de todos os dedos. Essa alternativa, no entanto, não foi incluída nos testes. Essa dificuldade em alinhar a postura com a câmera também existiu, em grau muito menor, para a postura 6.

Figura 12 - Alternativa para a postura 7

Com essas imagens capturadas, foi criado um aplicativo de testes no qual são definidos dezesseis gestos estáticos, com cada uma dessas posturas como inicial e final, orientações e local inicial não definidos e sem movimento. Este aplicativo lê cada uma das imagens pré-segmentadas de postura, as utiliza como entrada para os módulos de análise e reconhecimento e registra seu erro quadrático médio q para cada uma das posturas. É importante que a orientação não seja definida para permitir a comparação com todas as posturas.

Nos 6 testes estáticos para cada uma das dezesseis posturas restantes, somente 5 posturas foram identificadas incorretamente. Em dois deles, a postura 17 foi identificada como a 11 (curiosamente, o contrário nunca ocorreu) e em um terceiro caso, com a postura 1. Esse último erro não ocorreria se tivesse sido levada em conta a orientação das posturas. Em uma ocasião a postura 6 foi identificada

como a 1 e, por fim, houve um teste em que a postura 5 foi identificada como a 13. A taxa de erro nestes testes, portanto, foi de 4.2%. Somente uma das imagens, da postura 16, não foi identificada como postura alguma.

Tabela 5 - Exemplo de reconhecimento estático de posturas

A Tabela 5 exemplifica um destes seis testes, justamente aquele em que houve o falso negativo. Nesta tabela, cada linha representa uma imagem de teste para a postura que tem o mesmo número que a linha, e cada célula dela mostra o erro q, em porcentagem, calculado para essa imagem em relação a cada uma das posturas, numeradas nas colunas. Em negrito estão destacados os valores de erro mínimo de cada linha, que indicam qual postura (a coluna) é identificada para aquela imagem.

Nesta tabela todas as posturas estão identificadas corretamente, mas o erro para a postura 16, mostrado na célula com fundo cinza, tem um valor alto, maior que os 2% utilizados por padrão como tolerância. Esse erro é ainda mais alto ao comparar essa imagem com todas as outras posturas, o que sugere que a imagem utilizada para este teste é a fonte do problema. De fato, essa imagem, a terceira da esquerda para a direita mostrada na Figura 11, inclui uma região relativamente grande de braço não segmentado da mão (pode ser visto no canto inferior direito) que causa esse aumento de erro, mas ainda assim permite a identificação correta da postura, desde que se aumente a tolerância.

A Tabela 5 também mostra algo que ocorreu com frequência nos testes. Ainda que as posturas tenham sido identificadas corretamente, diversas outras

posturas tiveram um valor de erro abaixo da tolerância padrão, que já é relativamente estrita. Isso indica que, em um subconjunto de posturas possíveis que não incluísse a postura correta, a execução dessa postura pode gerar um falso positivo, sendo identificada incorretamente como outra postura quando deveria ser simplesmente ignorada. O próximo tipo de teste, no entanto, mostra que, na prática, isso ocorre com menos frequência, pois é raro que seja necessário um conjunto tão grande de posturas possíveis para um mesmo contexto de interação e o uso da orientação, ignorada nestes testes estáticos, elimina boa parte desses falsos positivos.