• Nenhum resultado encontrado

Reconhecimento de marca atrav´es da regi˜ao da logomarca

2.3 RESUMO DAS CARACTER´ISTICAS

4.2.1 Reconhecimento de marca atrav´es da regi˜ao da logomarca

decis˜ao de qual marca de autom´ovel est´a presente na imagem.

4.2.1.1 LOCALIZAC¸ ˜AO ATRAV ´ES DE SEGMENTAC¸ ˜AO

A primeira abordagem experimentada para a obtenc¸˜ao da marca constituiu em extrair a logomarca do autom´ovel e classific´a-la. Para a segmentac¸˜ao e classificac¸˜ao utilizou-se o seguinte algoritmo:

1. Extrai-se a regi˜ao contendo a placa do ve´ıculo (Feito de um software de reconhecimento de placas de autom´oveis);

2. Seleciona-se uma regi˜ao de interesse acima da placa, de altura 8 vezes a altura da placa e largura 5% maior que ela (Observou-se empiricamente que para as marcas consideradas a logomarca est´a dentro dessa regi˜ao);

3. Aplica-se um filtro gaussiano de desvio padr˜ao 1,5 para suavizar linhas pr´oximas a logomarca do ve´ıculo;

4. Aplica-se um filtro Sobel de ordem derivativa um em x e na mesma imagem aplica-se novamente o Sobel de ordem derivativa 1 em x e 1 em y. Utiliza-se esse filtro de forma a ressaltar as regi˜oes de borda

5. Em seguida aplica-se uma limiarizac¸˜ao Otsu para extrair as regi˜oes de borda das duas sa´ıdas anteriores;

6. Tamb´em nas duas imagens aplica-se uma dilatac¸˜ao de kernel 5 por 5 de forma a juntar as linhas da logomarca e criar-se um blob.

7. Somente na imagem limiarizada de bordas vertical e horizontal aplica-se uma eros˜ao de kernel 13 por 1 de forma a desconectar o blob da logomarca de linhas laterais.

8. Operac¸˜ao “E” l´ogica entre as imagens de borda resultando nos blobs parecidos com a logomarca.

9. Executa-se uma dilatac¸˜ao 15 por 15 nessa imagem para aumentar um pouco da regi˜ao ao redor dos blobs como ´area de classificac¸˜ao.

10. Extrai-se os contornos da imagem e seleciona-se o mais ao centro da regi˜ao de interesse. 11. Calcula-se o descritor HOG da regi˜ao de interesse e atrav´es de uma SVM classifica-se a

regi˜ao na marca.

O treinamento do classificador SVM foi executado na base Pre-jcars utilizando caracter´ısticas HOG de 9 orientac¸˜oes, c´elulas de 4 por 4 pixels e blocos de 1 c´elula, calculadas sobre a regi˜ao extra´ıda redimensionada para 40 por 40 pixels. E poss´ıvel visualizar as´ etapas desse algoritmo na Figura 9. Durante o desenvolvimento dessa abordagem notou-se as principais limitac¸˜oes, como a hip´otese de a logomarca estar contida na regi˜ao superior a placa veicular. Em alguns ve´ıculos isto n˜ao ocorre. Al´em disso, os tamanhos de kernel utilizados foram escolhidos empiricamente de forma a extrair as logomarcas da base Pre-jcars, por´em para imagens de tamanhos diferentes e com ve´ıculos em escalas diferentes esses tamanhos tem a necessidade de serem adaptados. Nota: Os valores emp´ıricos utilizados, foram selecionados de forma a fazer um estudo preliminar da abordagem, de forma que para um trabalho futuro, poderiam se experimentar variar-se esses parˆametros.

Figura 9: Diagrama do processo de segmentac¸˜ao para um ve´ıculo Volkswagen. Inicia-se pela imagem completa e atrav´es do ALPR obtem-se a placa veicular. ´E extraida a regi˜ao de interesse e nela aplicado o filtro gaussiano (item 2). No bloco A, ´e possivel vizualizar as saidas do item 4, ou seja, os filtros Sobel em x e em x e y. Em seguida s˜ao executadas as operac¸˜oes de dilatac¸˜ao e eros˜ao em cada uma das imagens descritas de forma a remover ruidos. At´e que em B ´e feita uma operac¸˜ao “E” logica onde se obt´em os blobs parecidos com a logomarca. Seleciona-se o mais ao centro e obtem-se a regi˜ao de interesse que deve conter a logomarca.

4.2.1.2 LOCALIZAC¸ ˜AO ATRAV ´ES DE DESLIZAMENTO DE JANELAS

Ao notar as dificuldades da primeira abordagem experimentou-se identificar a regi˜ao da logomarca atrav´es de um modelo de aparˆencia. Para isso primeiramente separou-se as ´areas das imagens do conjunto de dados Pre-jcars em duas classes: cont´em logomarca e n˜ao cont´em. Em seguida, com essas classes, treinou-se um classificador SVM sobre uma ´area de interesse de 50 por 50 pixels, utilizando caracter´ısticas HOG de 9 orientac¸˜oes, c´elulas de 8 por 8 pixels e blocos de uma c´elula.

Para a detecc¸˜ao da posic¸˜ao da logomarca partiu-se da mesma regi˜ao descrita na sec¸˜ao 4.2.1.1, que ´e baseada a partir da regi˜ao da placa. Para quatro escalas: 1,5, 1,2, 1,0 e 0,7 aplicou- se o classificador descrito atrav´es do algoritmo de deslizamento de janelas. Este, consiste em deslizar uma janela sobre a imagem e em cada momento classificar essa regi˜ao. Os parˆametros utilizados foram: janelas de 50 por 50 pixels, passos de 3 pixels na horizontal e 3 pixels na vertical. Para filtrar a quantidade de janelas geradas agrupou-se os retˆangulos de sa´ıda atrav´es da func¸˜ao groupRectangles implementada no OpenCV. Esta func¸˜ao agrupa retˆangulos de acordo com um crit´erio de equivalˆencia, combinando retˆangulos de tamanhos e localizac¸˜oes similares. Para cada grupo um retˆangulo m´edio ´e calculado e ser´a utilizado como sa´ıda do algoritmo. Em seguida, seleciona-se o retˆangulo mais pr´oximo ao centro da imagem. Essa regi˜ao ´e ent˜ao passada para o mesmo classificador descrito no ´ultimo item da localizac¸˜ao atrav´es de segmentac¸˜ao 4.2.1.1, para a obtenc¸˜ao da marca.

4.2.1.3 DESVANTAGENS DAS ABORDAGENS

Depois da implementac¸˜ao dos dois algoritmos notou-se que, para a abordagem via segmentac¸˜ao, os tamanhos de kernel eram escolhidos empiricamente de acordo com o tamanho das logomarcas. E no caso da inserc¸˜ao de logomarcas novas haveria a necessidade de se readequar o sistema aos novos tamanhos e posic¸˜oes.

Para a abordagem de deslizamento de janelas h´a a necessidade de criar um classificador de um tamanho fixo de janela. Logo, para o reconhecimento em tamanhos diferentes precisa-se rodar essa classificac¸˜ao em v´arias escalas, deixando o tempo de execuc¸˜ao elevado. Al´em disso, quando h´a logomarcas com tamanhos diferentes tamb´em ´e poss´ıvel que haja a necessidade de se usar mais de um classificador, tornando a abordagem cada vez mais complexa.

Por´em a principal desvantagem dos dois sistemas ´e que eles se baseiam no fato de que para o reconhecimento da marca h´a a necessidade de que a etapa de localizac¸˜ao funcione corretamente. Caso esta falhe, o resultado da classificac¸˜ao tamb´em ser´a falho. Levando esses problemas em considerac¸˜ao voltou-se a literatura para ver quais abordagens poderiam escalar melhor. Com isso encontrou-se as implementac¸˜oes de classificac¸˜ao global da imagem.

Documentos relacionados