Análise de imagens e visão computacional M´arcio Portes de Albuquerque, Eugenio S. Caner, Aline Gesualdi Mello e Marcelo Portes de Albuquerque. mpa, caner, aline, marcelo @cbpf.br Centro Brasileiro de Pesquisas Físicas. O processamento de imagens é uma ferramenta que auxilia na busca de informações na imagem. Com qualquer organização de dados em duas (ou três) dimensões, onde estejam correlacionados espacialmente, é possível utilizar técnicas de processamento digital de imagem e visão utilizando um computador para auxiliar na extração da informação. Esta unidade curricular está dividida em duas fases: i) os conceitos de representação de imagens e algumas técnicas básicas e ii) o projeto básico de um sistema de visão computacional.
Processamento Digital de Imagens
Representa¸c˜ ao da Imagem Digital
O pixel também é um elemento de dimensões finitas na representação de uma imagem digital. Muitas vezes a organização de uma imagem é feita na forma de uma matriz de pixels em simetria quadrada. Isto se deve à facilidade de implementação eletrônica, seja de sistemas de aquisição ou de sistemas de visualização de imagens.
Este tipo de organização provoca o surgimento de dois grandes problemas nas técnicas de processamento. Primeiro, um pixel não possui as mesmas propriedades em todas as direções, ou seja, é anisotrópico. Esta propriedade garante que um pixel tenha quatro vizinhos de borda e quatro vizinhos diagonais, ilustrados na Figura 2.
Esta propriedade exige que seja definido o tipo de conectividade a ser utilizada, seja B4 (considerando apenas vizinhos de borda) ou B8 (considerando vizinhos de borda e diagonais). O segundo problema é consequência direta do primeiro, ou seja, as distâncias entre um ponto e seus vizinhos não são as mesmas para nenhum tipo de vizinho.
Etapas do Processamento de Imagens
- Aquisi¸c˜ ao de Imagens Digitais
- T´ ecnicas de Pr´ e-processamento
- Segmenta¸c˜ ao
- P´ os-processamento
- Extra¸c˜ ao de Atributos
- Classifica¸c˜ ao e Reconhecimento
A Figura 7 mostra dois exemplos de segmentação, uma binarização e uma detecção de borda. Pelo contrário, a operação de expansão permite preencher buracos dentro de um objeto ou mesmo conectá-los. A operação de abertura, uma erosão seguida de uma expansão, permite eliminar pequenas partículas da imagem (partículas do tamanho do elemento estrutural) e suavizar os contornos dos objetos.
Quando o objetivo do processamento é obter informações numéricas, são extraídos atributos da imagem. A etapa denominada Rotulagem ou Rotulagem é uma etapa intermediária na extração de atributos. Na maioria dos sistemas de reconhecimento de formas, os parâmetros da fase de extração de atributos são usados para construir um espaço de medição N-dimensional.
A escolha e qualidade dos parâmetros para a construção deste espaço são essenciais para a implementação de um bom processo de reconhecimento de forma. Podemos dizer que um sistema de aprendizagem supervisionada funciona sob o controle de outro sistema de reconhecimento (por exemplo, externo) que identificou previamente os objetos de teste e permitirá a correta construção do seu espaço de medição e da sua função discriminante. A identificação de classes geralmente é feita identificando grupos em “clusters” de objetos no espaço de medição.
Podemos aplicar este conceito à construção de um sistema de visão computacional, onde, inicialmente, conhecemos a entrada e a saída desejadas e desconhecemos seus componentes.
O Projeto Base
- Escolha do Tipo de Cˆ amera
- Escolha do ˆ Angulo de Vis˜ ao da Cˆ amera
- C´ alculo do Campo de Vis˜ ao (field-of-view)
- C´ alculo da Resolu¸c˜ ao
- Resolu¸c˜ ao da Imagem
- Velocidade de Processamento
- Sele¸c˜ ao da Cˆ amera
- Sele¸c˜ ao da Placa de Aquisi¸c˜ ao
- Sele¸c˜ ao de Lentes
- Selecionando a T´ ecnica de Ilumina¸c˜ ao
F OV = (Dp+Lv)(1 +Pa) (4) onde F OV é o campo de visão numa determinada direção; Dp é o maior tamanho do objeto na direção do ângulo de visão, Lv é a variação máxima na localização e orientação do objeto; ePa é a fração ou porcentagem que definirá o campo de visão final (incluindo a margem de erro) do campo de visão desejado. A resolução da imagem é o número de linhas e colunas na imagem, que é determinado pela câmera, sensor e placa de aquisição. Ao escolher a câmera e a placa de captura, o projetista do sistema determina a resolução da imagem.
Portanto, a maioria dos projetistas de visão computacional depende da resolução da câmera e da placa de aquisição. A resolução espacial é a distância entre os centros dos pixels quando mapeados da cena para a imagem digital. Observe que para uma determinada resolução de imagem, a resolução espacial depende do campo de visão ou da ampliação das lentes.
Por exemplo, uma determinada câmera e placa de aquisição pode ser configurada para fotografar um vagão de trem com resolução espacial de 1 cm/pixel. A mesma câmera e placa de aquisição e, portanto, a mesma resolução de imagem, podem ser montadas em um microscópio para gerar imagens de um circuito integrado com resolução espacial de 1 µm/pixel. Resolução do objeto de interesse: A resolução do objeto de interesse é a resolução mais baixa possível de um determinado objeto no sistema de imagem.
3 É comum encontrar o termo dpi para expressar resolução espacial para diversos tipos de periféricos. Resolução de Pixel: A resolução de um pixel é a sua granularidade; isto é, o número de níveis de cinza ou cores representados em um pixel. A resolução de pixels é função de um conversor analógico/digital localizado tanto na placa de aquisição quanto na câmera.
Cálculo de resolução: As especificações da aplicação nos fornecem informações para determinar a resolução de um objeto, a resolução de uma medição ou, às vezes, ambas. Se a especificação exigir a detecção de um objeto pequeno, esse objeto menor determinará a resolução. Define a resolução de medição do sistema de visão em pixels ou frações de pixels.
Até agora, o projetista já decidiu que tipo de câmera usar: varredura de linha ou área, quantas visualizações serão necessárias, o campo de visão e qual resolução de imagem a câmera e a placa de aquisição exigem. As características especiais da câmera devem ser levadas em consideração antes de resolver a imagem porque esta seleção reduz a seleção de resolução de imagem disponível. Câmeras coloridas de chip único são mais baratas, mas fornecem uma imagem com resolução de cerca de 1/3 da resolução de uma câmera monocromática.
Resolução de imagem: A maioria das câmeras possui resolução de imagem na faixa utilizada pelo CFTV; então cerca de 640×480 pixels.