• Nenhum resultado encontrado

6 CONCLUSÃO

6.1 CONTRIBUIÇÕES

Este trabalho investiga a aplicação de algoritmos de detecção de saliência à tarefa de reconhecimento de instâncias por meio da definição da ordem de processamento das regiões da cena (busca visual). Os experimentos mostraram que por meio do uso da BGMS é possível encontrar o objeto buscado mais rapidamente do que (i) o mecanismo clássico de reconhecimento, em que toda a cena é processada de uma só vez, e do que (ii) uma busca aleatória, em que o reconhecimento ocorre separadamente e iterativamente em cada região da imagem, porém com a ordem de visitação de cada local definida aleatoriamente. Essas conclusões demonstram a aplicabilidade (i) da proposta de detecção e descrição de keypoints de modo iterativo (patch-based SURF) e (ii) do uso de mapas de saliência para guiar a busca visual, comprovando a Hipótese 1.

Além disso, também foi mostrado que o algoritmo de detecção de saliência proposto (BLS) obteve melhores resultados do que outros métodos de detecção de saliência do estado da arte quando estes foram aplicados na tarefa de guiar a busca visual. Mais especificamente, ao utilizar o patch-based SURF guiado pelo BLS, foi possível executar a busca utilizando, em média, apenas 53% do tempo de processamento utilizado pela busca clássica.

Por outro lado, os experimentos executados para avaliar a BGMS também serviram para destacar os seguintes problemas: (i) alguns dos métodos de detecção de saliências testados obtiveram um desempenho comparável, ou até pior, do que uma simples busca aleatória (exceto os métodos BLS, GC e RC), o que reforça a importância de mecanismos de detecção de saliências rápidos e de boa acurácia; e (ii) a sobrecarga do tempo de execução da etapa de detecção de saliência faz com que o uso da BGMS somente seja benéfico para a busca a depender da expectativa da presença do alvo na cena. Não foi encontrado na literatura nenhum tipo de abordagem para o segundo problema mencionado e, para minimizá-lo, esta Tese propôs uma forma de busca não-exaustiva (N.E.). No caso da BGMS, a busca não-exaustiva ocorre por meio do uso do mapa de saliência também para reduzir a complexidade da busca, selecionando locais onde um reconhecimento mais rápido (e com menor nível de detalhes) deve ser executado.

Dentre as nossas contribuições, também citamos o mecanismo de BGCO, que propõe a priorização de descritores da cena que sejam semelhantes aos descritores do objeto buscado. Para que isso seja feito, é proposta uma etapa de treinamento, em que todos os vizinhos de um descritor binário são gerados e inseridos em uma sequência de filtros de Bloom ordenada em ordem crescente de distância em relação aos descritores do objeto buscado. Filtros de Bloom são utilizados por proporcionarem uma consulta rápida aos elementos inseridos e uma economia significativa de memória para representar todos os descritores vizinhos gerados e inseridos nos filtros.

Além disso, o uso de descritores binários contribui para a diminuição do número de vizinhos gerados para cada descritor e torna possível a geração de vizinhos por meio de um algoritmo simples, em que os vizinhos de um descritor são gerados sem repetição. Ao utilizar descritores binários representados em filtros de Bloom, foi possível reduzir em, aproximada- mente, 55 vezes o espaço armazenado em memória em relação ao espaço necessário utilizando descritores inteiros sem filtros de Bloom.

Os experimentos realizados demonstraram que, ao utilizar a BGCO proposta, é possível detectar o alvo buscado mais rapidamente do que no reconhecimento clássico: em média, apenas 35% do tempo da etapa de matching da busca clássica foi necessário para efetuar o reconhecimento, utilizando o algoritmo AKAZE para efetuar a detecção e descrição de keypoints. Utilizando o patch-based SURF, em média, apenas 80% do tempo de total de reconhecimento (considerando as etapas de detecção, descrição e matching) da busca clássica foi necessário para efetuar o reconhecimento. Esses resultados corroboram com a Hipotese 2 deste trabalho. Além disso, os resultados do método proposto também superaram a busca aleatória, e a busca ordenada pelo valor de resposta dos keypoints, o que demonstra a eficácia da BGCO. A limitação da BGCO proposta está relacionada ao fato de ela não proporcionar redução do tempo de execução nas etapas de detecção e descrição de keypoints.

Como contribuição técnica, foi mostrado que o uso de filtros de Bloom é propício para a aplicação analisada, por apresentar (i) baixo tempo de consulta em relação a todo o processo de reconhecimento e (ii) uma taxa de falsos positivos considerada adequada. Além disso, ainda existe a vantagem de ser possível ajustar a taxa de falsos positivos de acordo com as necessidades de cada aplicação e com os recursos de memória disponíveis. É importante ressaltar que não é de nosso conhecimento outra pesquisa em visão computacional que se utilize de filtros de Bloom (estrutura comum em aplicações de Redes de Computadores).

Também foi proposta a integração entre a BGMS e a BGCO (BGMS + BGCO). Para que a detecção e descrição de keypoints iterativa do (patch-based SURF) utilizada na BGMS seja integrada à BGCO, foi utilizado um esquema de conversão dos descritores do SURF do formato de ponto flutuante para binário baseado na comparação de sub-regiões adjacentes dentro da vizinhança do keypoint. Experimentos demonstraram que por meio da BGMS + BGCO foi possível efetuar buscas utilizando, em média, 44% do tempo de processamento requerido pela busca clássica, corroborando com a terceira hipótese levantada. Além disso, foi demonstrado que a BGMS se sobressai em relação à BGCO nas etapas de detecção e descrição de keypoints, enquanto que a BGCO possui melhores resultados na etapa de matching; já a BGMS + BGCO possui resultados intermediários nas três etapas e, no geral, alcança melhores resultados do que a BGMS e a BGCO, quando usadas separadamente.

Esta Tese também propôs o uso da busca não-exaustiva (N.E.) na BGCO, em que descritores que não são semelhantes aos descritores do objeto buscado são eliminados da busca, e na BGMS + BGCO, em que a busca não exaustiva pode ser aplicada tanto na BGMS, quanto na BGCO. Experimentos mostraram que, por meio da busca não-exaustiva, foi possível reduzir

o tempo de processamento, mesmo considerando a ausência do objeto buscado: em relação ao tempo de execução da busca clássica, 71% desse tempo foi necessário para a BGMS N.E., enquanto que apenas 47% e 45% desse tempo foi utilizado pela BGCO N.E. e pela BGMS N.E. + BGCO N.E., respectivamente. A contrapartida da busca não exaustiva está relacionada à perda

de acurácia que pode ocorrer, a depender do objeto buscado: para a BGMS N.E. + BGCO N.E., houve perda de acurácia em 4 dos 7 objetos testados, sendo que em apenas um desses casos ocorreu a situação em que mais de um objeto da base deixou de ser detectado, em relação à busca exaustiva. Assim, apesar de os resultados do tempo de processamento da busca não-exaustiva estarem em conformidade com a quarta hipótese levantada, a perda na acurácia ocorrida em decorrência do modo de busca não-exaustivo reforça a necessidade de melhoria do método proposto ou de diferentes estratégias não-exaustivas.

A seguir, são listadas as publicações diretamente relacionadas com esta Tese:

 Object Recognition Using Saliency Guided Searching(periódico qualis A1) (MES-

QUITA; MELLO,2016): proposta da BGMS e BLS;

 Visual Search Guided By An Efficient Top-down Attention Approach(conferência qua-

lis A1) (MESQUITA; MELLO; CASTILHO,2016): proposta da BGCO utilizando filtros de Bloom;

 Segmentation of Natural Scenes Based on Visual Attention and Gestalt Grouping

Laws (conferência qualis A2) (MESQUITA; MELLO,2013a): parte da ideia da detecção de saliência utilizada no algoritmo BLS;

Além disso, destacamos abaixo outros trabalhos envolvendo visão computacional e percepção visual desenvolvidos durante o período desse doutorado:

 A New Thresholding Algorithm for Document Images Based on the Perception of

Objects by Distance(periódico qualis A1) (MESQUITA; MELLO; ALMEIDA,2014): algoritmo de binarização baseado na percepção de objetos vistos à distância;

 Parameter Tuning for Document Image Binarization Using a Racing Algorithm(pe-

riódico qualis A1) - (algoritmo vencedor da competição internacional de binarização – DIBCO2014) (MESQUITA; SILVA; MELLO; MIRANDA,2015): configuração dos parâmetros do algoritmo de binarização baseado na percepção de objetos vistos à distância;

 Finding Text in Natural Scenes by Visual Attention(conferência qualis A2) (MES-

QUITA; MELLO,2013b): algoritmo de detecção de saliência apropriado para detec-

Documentos relacionados