2 Systematic Search Flow
2.5 Aplicação do SSF
Para atender os objetivos delimitados no Capítulo 1, onde busca-se encontrar na literatura as melhores e mais utilizadas técnicas de processamento de imagem para detecção de faixas em rodovias, aplicou-se integralmente o método SSF.
As palavras-chave pista, pistas, faixa, faixas, detecção, reconhecimento e imagem foram elencadas para compor aquery de busca. Estes termos, tanto na língua portuguesa quanto seus equivalentes em inglês, associados aos operadores lógicos AND e OR, e também ao caractere especial *, deram a fisionomia final asquerys.
Código 2.2 – Parametrização daquery de busca
2 ( ( Lane* Detection OR Lane* Recognition ) AND Image )
3 ( ( Detecção de faixa* OR Reconhecimento de faixa* ) AND Imagem )
Os trabalhos retornados após a utilização das querys acima elaboradas, conterão os termos detecção de faixa(s) ou reconhecimento de faixa(s) juntamente com a palavra imagem.
A escolha das bases de dados foi inteiramente baseada no Portal da Capes. Ao navegar pelo website do portal, é possível encontrar a sessão Acervo onde estão disponíveis na íntegra mais de 45 mil publicações, tanto nacionais como internacionais, e também, as diversas bases de dados que reúnem referências e resumos de trabalhos acadêmicos e científicos. A pesquisa pode ser feita por meio da utilização de um dos campos disponíveis, ou pela associação dos dois campos Área de conhecimento e Termo.
Como estratégia de escolha, foram lidas as descrições de todas as bases de dados da área de conhecimento:Engenharias. Após a execução desta etapa, as seguintes bases foram pré-selecionadas:
• Abstracts in New Technology and Engineering
• Aerospace Database
• Compendex Engineering Index (Ei)
• Computer and Information Systems Abstract
• Electronics and Communications Abstracts
• Institute of Electrical and Electronic Engineers (IEEE)
• Scopus
• Proquest - Technology Research Database
Uma pesquisa mais aprofundada sobre cada uma das pré-selecionadas propiciou uma redução na quantidade de bases, dado queAbstracts in New Technology and Engineering, Aerospace Database, Computer and Information Systems Abstract eElectronics and Communications Abstractsestão contidas
emProquest - Technology Research Database. As bases selecionadas são descritas abaixo:
2.5. Aplicação do SSF 31
• Technology Research Database - Base de dados de referências e resumos. Engloba, principalmente, as áreas de: ciência dos materiais; materiais de engenharia; engenharia mecânica; engenharia civil;
engenharia ambiental; engenharia sísmica; novas tecnologias em engenharia; aeroespacial; sistemas computacionais e de informação; telecomunicações; eletrônica e física. Conta com mais de 10.750 títulos de periódicos indexados, além de anais de congressos, relatórios técnicos, itens de periódicos comerciais, boletins informativos, patentes, livros e comunicados à imprensa.
• IEEE - Base de dados que disponibiliza aproximadamente 463 periódicos, mais de 17.874 conferências e conta com um número superior a 2.895 de normas técnicas. Compreende, em seus documentos, as áreas de campos elétricos, eletrônicos e computação e áreas afins de ciência e tecnologia.
• Scopus- Base referência da Editora Elsevier, indexa títulos acadêmicos revisados por pares, títulos de acesso livre, anais de conferências, publicações comerciais, séries de livros, páginas web de conteúdo científico e patentes de escritórios. As áreas de cobertura desta base são: Ciências Biológicas, Ciências da Saúde, Ciências Físicas e Ciências Sociais. Possui ferramentas para execução de bibliometria (análise de resultados).
• Ei - Base com um acervo de mais de 10 milhões de registros e referências de mais de 5.600 periódicos e anais de conferências. As publicações cobrem as áreas de Engenharia, Energia, Ciência da Computação, Robótica e Controle.
Antes de aplicar aqueryde busca nas bases, algumas delimitações foram propostas. Relacionado ao tipo de documento, a fim de padronizar e garantir a qualidade dos resultados obtidos, selecionou-se apenas trabalhos no formato de artigo ou review. Referente ao idioma do documento, restringiu-se apenas a resultados em inglês ou português devido a fluência do pesquisador nestes idiomas. Quanto ao período de publicação delimitou-se um período de 10 anos, como a pesquisa fora aplicada em 2018, apenas resultados após 2008 compuseram este trabalho. A justificativa para este intervalo é a necessidade de analisar a evolução, tanto na quantidade trabalhos publicados, como da mudança e da aptação das técnicas de processamento por estes utilizadas e até o possível surgimento de novas técnicas.
A pesquisa foi aplicada a cada uma das bases utilizando as duas querys construídas. A partir deste momento, apenas os resultados obtidos com aquery em inglês serão apresentados e discutidos, em virtude de que a pesquisa utilizando a elaborada na língua portuguesa não ter apresentado resultado em nenhuma das bases selecionadas, conforme pode ser observado na Figura 6.
Os resultados provenientes da pesquisa em inglês foram exportados, inseridos no software Mendeley e organizados por diretórios. A Tabela 1 sumariza a quantidade de trabalhos que compuseram a pesquisa após a execução de cada uma das atividades executadas neste processo.
Os678documentos, total de trabalhos obtidos, foram filtrados para que não houvessem duplicatas.
O Mendeley facilita a execução deste filtro, basta: (1) selecionar todos os artigos de um determinado diretório, (2) clicar emTools, (3) clicar emCheck for duplicates, (4) analisar as duplicatas, (5) selecionar os campos que serão fundidos e (6) clicar emMerge. Por fim, remanesceram 439trabalhos.
A Padronização da seleção de artigos reduziu a quantidade de artigos em 30%. Esta etapa englobou a leitura do título, das palavras-chave e dos resumos de todos os 439 trabalhos. Como estas características definem o tema de um determinado documento, foi possível verificar que apenas 128 artigos estavam em total acordo com o tema pesquisado neste trabalho: a detecção de faixas de rodovias via
32 Capítulo 2. Systematic Search Flow
(a) Pesquisa aplicada na base Proquest
(b) Pesquisa aplicada na base IEEE
(c) Pesquisa aplicada na baseScopus
(d) Pesquisa aplicada na base Ei
Figura 6 – Pesquisa aplicada as bases de dados utilizando aquery de busca em português.
Fonte: Elaborado pelo autor.
Atividade Quantidade de Trabalhos
Busca na base IEEE 37
Busca na base Compendex 143
Busca na base Scopus 178
Busca na base Proquest 320
Busca total 678
Após Remoção de duplicatas 439
Após Padronização da seleção de artigos 128 Após Verificação de disponibilidade 60
Após Leitura na íntegra 54
Tabela 1 – Resultado da aplicação das atividades do SSF
2.5. Aplicação do SSF 33
processamento de imagem. Artigos relacionados à áreas como agricultura e medicina foram obtidos e precisaram ser eliminados nesta etapa. Por ser uma tarefa extenuante, foi necessário reexecutá-la para uma moldagem mais precisa dos resultados.
Apesar da padronização da seleção de artigos ser um ótimo filtro, a leitura dos artigos na sua plenitude é essencial para que estes possam ser avaliados minuciosamente. Pensando neste requisito, foi feita a verificação da disponibilidade dos trabalhos ao tentar obtê-los na íntegra. Dos 128 trabalhos, apenas 60 estavam disponíveis gratuitamente paradownload.
Apoiado nos resultados das atividades anteriores, pode-se iniciar a leitura dos artigos.
Primeiramente, a leitura permitiu fazer a conferência e reexecução das etapas anteriores, dado que foram eliminados mais 6 artigos, por dois motivos distintos, ou o arquivo não estava com todo seu conteúdo disponível ou então não estava completamente de acordo com o tema da pesquisa. Uma lista completa com os trabalhos selecionados pode ser obtida no Anexo A.
Seguidamente, foi possível iniciar o processo de montagem da matriz de conhecimento. Esta matriz é essencial para que seja feita, além da análise estatística dos trabalhos (bibliometria), a síntese do conteúdo. A matriz elaborada conta com os campos gerais: Ano de publicação; Autores; Journal de publicação, Título e Palavras-chave.
Relacionado ao período de publicação é possível observar na Figura 7, representada pelo ano de publicação no eixo x e pela contagem de trabalhos publicados no eixo y, que houve uma tendência de crescimento até 2015, ano com a maior quantidade de publicações nas bases analisadas. Posteriormente, há uma variação, onde há, de fato, uma diminuição de publicações; porém, não é possível concluir se há uma predisposição a crescimento ou decrescimento.
1 2 5 4 9 7 10 4 7 4
2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
Figura 7 – Análise do período de publicação.
Fonte: Elaborado pelo autor.
A nuvem de palavras contida na Figura 8 apresenta as palavras-chave mais utilizadas nos trabalhos analisados. Em uma visualização deste tipo, uma palavra citada mais vezes tem um tamanho proporcionalmente maior do que uma palavra menos vezes. Os termosLane,Detection eHough Transform foram os que tiveram uma maior contagem dentro do cenário analisado
Relativo aos autores eJournal de publicação os resultados foram bem diversificados.
Para a obtenção de dados inerentes ao tema pesquisado, houve a demanda da adição de novas e mais específicas informações na matriz de conhecimento. Buscou-se padronizar os artigos em relação a algumas características, tais como: o cenário analisado, a qualidade das imagens e as técnicas de pré e processamento utilizados.
34 Capítulo 2. Systematic Search Flow
Figura 8 – Análise de palavras-chave.
Fonte: Elaborado pelo autor.
Referente ao cenário, a coluna Modelo de Estrada, especifica se as imagens são referentes a ruas estruturadas ou não, ou seja, se há marcações na pista. A coluna Aquisição de Imagem avalia se os trabalhos criaram seu próprio banco de imagem ou utilizaram bases de dados prontas para avaliar suas detecções.
Cerca de 90% dos trabalhos focam seu estudo apenas em ruas estruturadas, portanto, a imple-mentação utilizando puramente as técnicas por eles aplicadas não terá êxito na detecção de ruas onde não há marcações na pista. Para cumprir um dos objetivos deste trabalho, a implementação aqui desenvolvida também concentrará na detecção de imagens de ruas estruturadas.
A montagem de um banco de imagens próprio acompanhou a maioria dos trabalhos. A criação deste banco consistiu na utilização de uma ou mais câmeras montadas em um veículo, que capturavam vídeos em diversas situações do cotidiano que na sequência eram divididos emframes. A elaboração de um banco pode ser um trabalho penoso, por isso há disponíveis bancos de imagens prontos que podem ser obtidos facilmente na internet, contendo inúmeras imagens com variações de cenário interessantes.
Alguns bancos mencionados nos trabalhos foram:Caltech Lanes Dataset (ALY, 2008),Single Class Road Detection Dataset (ALVAREZ; GEVERS; LÓPEZ, 2014), Vision and Autonomous Systems Center’s Image Database(WANG, 2013) eDIPLODOC road stereo sequence - dataset (M.ZANIN S. MESSELODI, 2013), o qual foi utilizado, em partes, neste trabalho e está apresentada no Capítulo 4.
No que se refere à qualidade das imagens, foi verificada a resolução das figuras utilizadas em cada um dos artigos e também o período do dia em que estas foram capturadas. Os trabalhos fizeram uso de imagens capturadas em períodos do dia, condições meteorológicas e com resolução bem diversificados, não sendo possível obter um padrão entre eles.
2.5. Aplicação do SSF 35
A análise das técnicas de pré-processamento foi feita com o preenchimento das colunas: Utilização de Region of Interest (ROI) fixa, Inversão de Perspectiva, Alteração de Cor, Atenuação de Ruídos e Detecção de Borda. Estas, foram introduzidas na matriz de conhecimento por serem conhecidas etapas do pré-processamento de imagens e também por ser verificado, na leitura dos artigos na íntegra, que a grande maioria dos trabalhos aplicavam, se não todas, pelo menos uma destas técnicas.
A ROI é uma parte de uma imagem em que se deseja filtrar ou realizar alguma outra operação específica, sem que seja necessário aplicar a alteração para a imagem na íntegra (MATHWORKS, 1992).
A técnica de inversão de perspectiva visa eliminar o efeito de perspectiva e produzir uma imagem de vista superior (HUANG et al., 2018). A alteração de cor é comumente utilizada no processamento de imagens.
Manipular a cor de uma imagem proporciona diversas vantagens, uma vez que a cor é um poderoso descritor que pode simplificar a identificação dos objetos e sua extração (GONZALEZ; WOODS, 2009).
Em contrapartida, retirar a cor de uma imagem pode simplificar o processamento de uma imagem, pois reduz a quantidade de informação na imagem (SOLOMON; BRECKON, 2011). A técnica de atenuação de ruídos visa eliminar interferências externas introduzidas durante a aquisição e transmissão de uma imagem (GONZALEZ; WOODS, 2009). Para segmentar uma região da imagem com base em suas variações de intensidade ou de cor a técnica de detecção de borda é utilizada.
A Figura 9 traz algumas estatísticas sobre os métodos de pré-processamento das imagens. A Figura 9a mostra que não há uma técnica predominantemente em uso nos trabalhos. Relacionada as técnicas de detecção de borda, a Figura 9b mostra que neste quesito, os trabalhos dividem o uso entre os operadores de Sobel e de Canny. De fato, esses são os operadores de detecção de borda tradicionais na literatura (GONZALEZ; WOODS, 2009).
Figura 9 – Análise das técnicas de pré-processamento utilizadas nos trabalhos selecionados.
Fonte: Elaborado pelo autor.
A matriz de conhecimento foi finalizada com a adição das duas últimas colunas: a denominada Processamento, onde, por não haver subetapas, a técnica utilizada foi diretamente inserida; e a de Resultados, a qual apresenta, caso fornecido, a porcentagem de acerto na detecção de cada um dos trabalhos. Contudo, este valor não possibilita a comparação com outros trabalhos, uma vez que, as bases de dados utilizadas são distintas.
Para a técnica principal de processamento é visível na Figura 10 a predominância da Transformada Hough (Hough Transform, HT). De todas as técnicas de processamento, a HT simples, ou alguma variação, foi utilizada em 32 trabalhos, num universo de 39. Isso mostra que em identificação de linhas, a HT ainda é o método mais aplicado, mesmo tendo sido proposto em 1972 (HART; DUDA, 1972). É importante salientar que o gráfico contempla somente as técnicas utilizadas em mais de 1 trabalho.
36 Capítulo 2. Systematic Search Flow
25
5
3 2 2 2
0 5 10 15 20 25
HT Ransac
Probabilistic HT B-Spline
Improved HT Modified HT
Figura 10 – Análise das técnicas de processamento utilizadas nos trabalhos selecionados.
Fonte: Elaborado pelo autor.
Os resultados do SSF nortearam a decisão das técnicas a serem utilizadas na implementação, apresentada no capítulo 4. Escolheu-se primeiramente a técnica de processamento HT, por ter sido a utilizada na grande maioria dos trabalhos, pelos resultados obtidos com sua aplicação e pela simplicidade.
A partir desta decisão, analisou-se os trabalhos que a utilizaram e foi visto que os detectores de borda Canny e Sobel apareceram praticamente na mesma proporção. Por conta disso e pelo fato do método Canny ser considerado um aperfeiçoamento de outros métodos, como Sobel, escolheu-se utilizar Canny.
Afim de pré-processar as imagens para a entrada no detector de borda, viu-se a necessidade da alteração do formato de cor da imagem de RGB para escala de cinza, devido a requisitos da API a ser utilizada no desenvolvimento. Para garantir uma melhor qualidade de detecção, optou-se pela utilização do método de redução de ruídos Gaussianos, apesar de muitos trabalhos não especificarem se utilizaram, ou não, esta técnica. Como a seleção da ROI é utilizada basicamente para a redução do custo computacional (HUANG et al., 2018), e este fator não ser relevante para este trabalho, optou-se por não aplicar o método.
37