Algoritmo de C´ alculo de Distˆ ancias - Desenvolvimento do Prot´ otipo

VST-HMD: Desenvolvimento e Avalia¸ c˜ ao

4.1 Desenvolvimento do Prot´ otipo

4.1.5 Algoritmo de C´ alculo de Distˆ ancias

Considerando uma imagem dos dois pontos de laser capturada pela câmera, é poss´ıvel afirmar que a distância aparente4 entre esse pontos será fixa em uma superf´ıcie plana, mas, conforme essa superf´ıcie se distancia ou se aproxima das fontes de laser, a distância entre os pontos será modificada.

Partindo dessa premissa, um algoritmo para medi¸cão dessa distância aparente foi desenvolvido na linguagem de programa¸cão C++ utilizando a biblioteca de visão computacional OpenCV. Apesar do algoritmo de distância utilizar uma câmera externa, acoplada ao módulo de interface de usuário e conectada à unidade de processamento da ISB, a imagem mostrada ao usuário, no display Video See-Through do HMD, é capturada pela câmera do smartphone.

https://www.adafruit.com

Distância aparente corresponde à distância euclideana entre os pontos de laser na imagem capturada pela câmera.

A câmera externa está posicionada no ponto central entre os dois lasers. Além disso, os lasers são normais ao plano de imagem da câmera. A distância entre os lasers é de 21 cm. A distância aparente entre os pontos de laser aumenta quando a distância entre o objeto alvo e a fonte de laser diminui, e vice-versa.

O algoritmo de medi¸cão de distância foi desenvolvido utilizando técnicas de processamento digital de imagens. O algoritmo pode ser dividido em seis estágios, conforme é mostrado na Figura 4.7. Para cada frame capturado pela câmera todos os estágios são realizados. A seguir, cada estágio é detalhado.

Figura 4.7: Estágios do Algoritmo de Medi¸cão de Distância Fonte: [103]

Estágio 1 - Sele¸cão da Região de Interesse: Neste estágio, a região de interesse, na qual os pontos verdes aparecem, é selecionada. A câmera e os lasers verdes estão rigidamente acoplados à estrutura f´ısica do HMD, logo os pontos verdes sempre aparecem em uma região contida no centro da imagem. De forma emp´ırica, determinou-se que essa região possui uma dimensão de 35x35 pixels para distâncias acima de quatro metros. Essa região é chamada de Região de Interesse. Essa estratégia foi escolhida por duas razões. Em primeiro lugar, o custo computacional do algoritmo é reduzido, devido à redu¸cão da área de busca pelos pontos verdes. Em segundo lugar, uma grande parte dos falsos positivos, que era detectada pelo algoritmo fora da Região de Interesse, é eliminada.

Estágio 2 - Filtro de Cor e de Luminosidade: Neste estágio, é utilizada a representa¸cão da imagem no sistema HSL. A imagem resultante do estágio anterior é dividida

nos três canais que compõe a representa¸cão HSL: Hue (Cor); Saturation (Satura¸cão); e Lightness (Luminosidade). Primeiramente, cada canal é submetido a um processo de dilata¸cão da imagem. Posteriormente, são escolhidos limiares m´ınimos e máximos, empiricamente obtidos, que representam o padrão de caracter´ısticas dos pontos verdes nos canais H e L. Após a escolha dos valores de limiar, os canais são submetidos a um filtro passa-faixa. Os pixels, cujos valores estão fora da faixa definida pelos limiares, têm seus valores substitu´ıdos por zero, que representa a cor preta. Por outro lado, os pixels, que estão dentro do limiar, têm seu valor substitu´ıdo por 255, que representa a cor branca. Esse procedimento é realizado para cada pixel da imagem resultante do Estágio 1. A imagem superior do Estágio 2 da Figura 4.7 mostra o resultado para o canal L. A imagem inferior do Estágio 2 da Figura 4.7 mostra o resultado para o canal H.

Estágio 3 - Interse¸cão entre os canais H e L: Neste estágio, é determinada a interse¸cão entre as regiões brancas dos canais H e L, após o processo de filtragem.

Estágio 4 - Deteçcão de Bordas: Neste estágio, é utilizado o algoritmo Canny de deteçcão de bordas, presente na biblioteca OpenCV, para realizar a deteçcão de bordas na imagem resultante do Estágio 3.

Estágio 5 - Deteçcão de C´ırculos: Neste estágio, é realizada a tentativa de deteçcão de c´ırculos criados pelos estágios anteriores. O algoritmo é baseado em varia¸cões da Trans- formada de Hough. Ele foi apresentado em [110] e está dispon´ıvel na biblioteca OpenCV. Na maioria dos casos, os c´ırculos foram rapidamente encontrados, exceto quando a luz verde está sobre uma superf´ıcie refletiva. Nesse caso, o raio do c´ırculo aumenta para um valor fora do padrão e a deteçcão correta do c´ırculo se torna uma tarefa imposs´ıvel. Em algumas situa¸cões, ocorre a deteçcão de falsos positivos. É poss´ıvel eliminar ou reduzir essa ocorrência de falsos positivos utilizando as coordenadas do centro de cada c´ırculo detectado, pois, em teoria, os c´ırculos estão alinhados em uma reta paralela ao eixo-x da imagem e, portanto, devem apresentar aproximadamente o mesmo valor da coordenada x. Sendo assim, são atribu´ıdos valores de m´ınimo e máximo, empiricamente obtidos, para eixo-x da imagem. Se a coordenada x do centro está dentro da faixa permitida, então o c´ırculo correspondente a esse centro é considerado como um c´ırculo válido.

Estágio 6 - Média Móvel: Neste estágio, primeiramente é criado um limiar horizontal, também obtido empiricamente, que é responsável por separar os dois pontos de laser na imagem. Depois, é calculada a média móvel para os últimos 30 pontos detectados da parte superior da imagem e para os últimos 30 pontos detectados da por¸cão inferior da imagem. O uso dos últimos 30 pontos detectados para cálculo da média móvel foi definido pelo fato da câmera apresentar uma taxa de amostragem de 30 frames por segundo. Dessa forma, apenas as imagens obtidas no último segundo influenciam no cálculo da média móvel. Após esses cálculos, são determinadas as duas posi¸cões estimadas dos pontos de laser verde, uma para cada fonte de laser. Por fim, as duas posi¸cões estimadas são representadas na imagem como dois c´ırculos vermelhos.

A partir da determina¸cão da distância relativa entre esses pontos detectados na imagem, é poss´ıvel criar uma fun¸cão de regressão que, após uma etapa de calibra¸cão, con- segue calcular a distância entre o usuário e a superf´ıcie incidida pelos lasers. Como tra- balho futuro, se torna interessante o aprimoramento do algoritmo para a identifica¸cão de um conjunto maior de pontos de laser. Essa nova funcionalidade permitiria uma forma de mapeamento 3D do ambiente, auxiliando na sobreposi¸cão do mundo real com as informa¸cões virtuais exibidas em realidade aumentada pelo display do protótipo.

4.2 Experimentos e Avalia¸c˜ao do Prot´otipo

Essa Se¸cão apresenta os experimentos realizados para avalia¸cão do protótipo. Três abor- dagens foram consideradas. Em primeiro lugar, a precisão do algoritmo foi avaliada. Em segundo lugar, foi realizada a calibra¸cão do algoritmo a partir de um conjunto de distâncias conhecidas. Em terceiro lugar, o desempenho do algoritmo em diferentes placas de desenvolvimento foi avaliado. O principal objetivo do segundo conjunto de experimentos é definir qual plataforma de hardware deve ser utilizada no protótipo. Além disso, é essencial que o hardware esteja de acordo com alguns requisitos de dispositivos vest´ıveis. Portanto, atributos como baixo peso e tamanho reduzido foram considerados durante a escolha da plataforma de hardware. A seguir, os experimentos são descritos e os resultados obtidos são apresentados. Ao final, é realizada uma breve discussão sobre algumas limita¸cões e alguns problemas de experiência do usuário relativos ao protótipo constru´ıdo.

4.2.1 Precis˜ao

Com o intuito de garantir a corretude da avalia¸cão, o v´ıdeo foi gravado com os dois pontos dos lasers verdes presentes em todos os frames. Como a posi¸cão da câmera e dos lasers é fixa, a região onde os pontos verdes aparecem na imagem é conhecida. Sendo assim, é contado toda vez que o algoritmo identifica corretamente o ponto verde 1 e o ponto verde 2. A Figura 4.8 mostra o resultado de taxa de acerto ao longo do tempo, considerando todos os parâmetros de limiar que foram obtidos empiricamente. O comportamento inicial do algoritmo, com baixa taxa de acerto, se deve à necessidade de preenchimento do buffer do cálculo da média móvel, que é utilizada para calcular as coordenadas dos pontos verdes na imagem. E poss´ıvel notar que, a partir de 25´ segundos, a taxa de acerto para os pontos 1 e 2 supera 90%. Isso está relacionado ao tempo necessário para o preenchimento do buffer utilizado no cálculo da média móvel.

Figura 4.8: Porcentagem de Acerto por Segundo Fonte: [103]

4.2.2 Calibra¸c˜ao

Para possibilitar a medi¸cão da distância entre os objetos presentes no ambiente e o usuário, é preciso saber qual é a sua rela¸cão com a distância entre os dois pontos de laser detectados na imagem. Sendo assim, com intuito de demonstrar essa etapa de calibra¸cão do algoritmo, foi utilizado um anteparo de papelão posicionado em um conjunto de

Figura 4.9: Calibra¸cão do algoritmo de cálculo de distâncias

distâncias pré-determinadas em rela¸cão ao protótipo e, consequentemente, aos lasers: 1.50 m, 3.00 m, 4.50 m, 6.00 m, 7.37 m 5. Dessa forma, a distância entre os pontos de laser detectados pelo algoritmo foi medida para cada uma dessas posi¸cões do anteparo. A partir desse conjunto de dados, foi poss´ıvel determinar uma linha de tendência que relaciona a distância entre os pontos na imagem com a distância entre o usuário e os objetos no ambiente. Essa linha foi determinada através de uma regressão não-linear com fun¸cão de potência. O gráfico da Figura 4.9 apresenta o resultado obtido. Observando a fun¸cão encontrada, verifica-se a veracidade da premissa de que a distância entre os pontos na imagem é inversamente proporcional à distância relativa entre o usuário e os objetos.

4.2.3 Desempenho

Um v´ıdeo foi gravado para avaliar o desempenho do algoritmo de processamento digital de imagens em cada placa de desenvolvimento dispon´ıvel para o projeto. A utiliza¸cão de um v´ıdeo foi escolhida, pois a utiliza¸cão da câmera limitaria a execu¸cão do algoritmo a 30 frames por segundo (FPS), sendo que algumas placas de desenvolvimento conseguem processar mais do que 30 FPS.

As placas de desenvolvimento disponibilizadas para realiza¸c˜ao do teste de desempenho foram: BeagleBone Black (Processador AM335x 1 GHz ARM Cortex A8, 512 MB DDR3 RAM), Intel Edison (CPU Dual-threaded Intel Atom @ 500 MHz, Micro-

A distância máxima de 7.37 m, ao invés de 7.50 m, resultou do limite de espa¸co na sala onde a calibra¸cão foi conduzida.

Figura 4.10: Taxa de FPS da execu¸c˜ao do algoritmo para cada placa de desenvolvimento Fonte: [103]

controlador Intel Quark de 32-bit @ 100 MHz, 1GB LPDDR3 RAM, 1 MB Cache L1), Wandboard Quad (Processador Quad Core i.MX6 Freescale @ 1 GHz, 2 GB DDR3 RAM), Intel Galileo Gen2 (Processador SoC Intel Quark X1000 @ 400 MHz, 256 MB DDR3 SRAM), Raspberry Pi B+ (Processador Broadcom BCM2835 Cortex A7 @ 700 MHz, 500 MB SDRAM), Cubieboard (Processador Dual Core ARM Cortex A7 @ 1 GHz, 1 GB DDR3 RAM). Todas as placas de desenvolvimento utilizam sistema operacional Linux constru´ıdo utilizando o framework Yocto, exceto pela Cubieboard. A biblioteca OpenCV foi compilada com otimiza¸cão na maioria das placas de desenvolvimento. Por exemplo, na Intel Edison, na Freescale Wandboard e na Cubieboard, a biblioteca foi compilada com o TBB ativado, para habilitar o paralelismo do código. Na Intel Edison, a biblioteca IPP (Integrated Performance Primitives) também foi ativada, para aumentar o desempenho de processamento de imagens e sinais. Nas placas de desenvolvimento restantes não foi realizado nenhum tipo de otimiza¸cão, já que todas elas são Single Core. Apesar disso, todas as placas utilizam o codec libjpeg-turbo para ace- lerar a descompressão das imagens. A webcam Logitech C270 foi utilizada para gravar o v´ıdeo. A primeira métrica utilizada para avaliar o desempenho tratou-se da taxa de frame por segundo (FPS). A Figura 4.10 mostra o resultado obtido para cada placa de desenvolvimento, com intervalo de confian¸ca de 99%. A segunda métrica corresponde à

Tabela 4.1: Desempenho da CPU

Placa de Desenvolvimento Uso da CPU (%) BeagleBone Black 90

Intel Edison 28.5

Wandboard Quad 99. ( 25% efetivo) Intel Galileo Gen2 99

Raspberry Pi B+ 99 Cubieboard 95

Porcentagem de uso da CPU. A Tabela 4.1 mostra o uso da CPU em porcentagem para cada placa de desenvolvimento, durante a execu¸c˜ao do algoritmo.

Como pode ser visto na Figura 4.10 e na Tabela 4.1, a Intel Galileo Gen2 apresenta o pior resultado de desempenho, processando apenas 2 FPS e usando 99% da CPU. Esse fato era esperado, já que essa placa de desenvolvimento apresenta menor poder de processamento em rela¸cão a todas as outras placas. Além disso, esse baixo desempenho sequer cumpriu os requisitos básicos da aplica¸cão, não sendo capaz de executar em o algoritmo em tempo real. A BeagleBone Black apresentou um bom desempenho, com taxa de 26 FPS e 90% de uso de CPU. A Raspberry Pi B+ teve um desempenho intermediário, com taxa 15 FPS e 99% de uso de CPU.

Aplica¸cões que demandam processamento em tempo real podem ser prejudicadas pelo desempenho em FPS apresentado pelas placas anteriormente mencionadas. Nesse projeto, por exemplo, os resultados do algoritmo são mostrados para os usuários através de um HMD e, desta forma, uma taxa de FPS inferior a 20 FPS pode gerar um atraso significante na interface.

Por outro lado, as placas restantes apresentaram resultados excelentes, compat´ıveis com aplica¸cões que demandam processamento em tempo real. A Cubieboard obteve 35 FPS de com 99% de uso da CPU. A Intel Edison e a Wandboard Quad apresentaram as melhores taxas de FPS, ambas acima de 35 FPS. A principal diferen¸ca entre elas foi o uso da CPU. A Wandboard utilizou 99.5% de um núcleo do processador (o que equivale a 25%, se forem considerados todos os seus quatro núcleos) para executar o algoritmo. Enquanto isso, a Intel Edison usou 28,5% dos dois núcleos de seu processador.

No documento Desenvolvimento de dispositivos vestíveis de realidade aumentada de baixocusto para indústria 4.0. (páginas 75-83)