Visão por Computador
http://gec.di.uminho.pt/lesi/vpc, http://gec.di.uminho.pt/mcc/vpc
LESI / LMCC – 5º Ano
Introdução
João Luís Ferreira Sobral Departamento do Informática
Universidade do Minho
Setembro 2003
Programa
Introdução e objectivos
Pretende-se com esta disciplina complementar a formação dos alunos com conhecimentos da área de Visão por Computador. Designadamente, pretende-se introduzir conhecimentos relativos aos métodos de processamento de imagens, utilizados para melhorar as características de imagens, e os processos que visam a extracção automática de informação de imagens.
Para atingir estes objectivos, e sendo o processamento de imagem uma área de índole bastante experimental, existirá uma forte ligação entre a componente teórica e a componente prática: os conceitos introduzidos na componente teórica serão experimentados na aula prática seguinte, utilizando uma ferramenta de processamento de imagem, o sistema Khoros. Desta forma são experimentadas as diversas técnicas, permitindo ao aluno obter as suas próprias conclusões relativamente a cada método.
Componente Teórica
I. Processamento de Imagem
o Introdução aos sistemas de processamento de imagem.
o Natureza de uma imagem digital. Calibração de imagem.
o Propriedades estatísticas das imagens: brilho e contraste. Histograma.
o Filtros no domínio do espaço. Convolução digital. Filtros passa-alto e passa-baixo. Suavização de imagens. Detecção e realce de contornos. Filtros não lineares.
o Filtros no domínio das frequências. Transformada de Fourier e Teorema da convolução.
o Restauração de imagem.
o Compressão de imagem: compressão sem perda e compressão com perda.
o Processamento de imagens a cor.
II. Análise de Imagem
o Binarização simples múltipla e adaptativa.
o Operadores morfológicos: erosão, dilatação e esqueletização.
o Análise de texturas: modelos estrutural, estatístico e espectral.
o Segmentação de imagens em regiões. Detecção de formas: verificação de padrões, pirâmides de resolução e transformada de Hough.
o Descrição de formas: chain codes, assinaturas, polígonos e convex hull.
o Reconhecimento de objectos
III. Visão por Computador em Tempo Real
o Requisitos de processamento em termos de hardware e software.
Componente Prática
o Sessões práticas com o sistema Khoros, Desenvolvimento de algoritmos.
Programa
Equipa Docente
João Luís Ferreira Sobral email: jls@...
telefone: 4439 (253 604439 do exterior)
Planeamento
Aula Dia Matéria Bibliografia
1 26/09 Apresentação da disciplina, caracterização da área,
natureza e características de uma imagem GZ 1, 2 2 3/10 Propriedades estatísticas das imagens, alteração do
brilho e contraste, convolução digital GZ 3 3 10/10 Transformada de Fourier, filtros no domínio das
frequências, teorema da convolução GZ 4
4 17/10 Restauração de imagem GZ 5
5 24/10 Processamento de imagens a cores GZ 6
6 31/10 Compressão de imagem GZ 8
7 7/11 Segmentação de imagens, operadores morfológicos GZ 9, 10 8 14/11 Representação e descrição de regiões. GZ 11 9 21/11 Reconhecimento de objectos / regiões GZ 12 10 28/11 Visão por Computador em tempo real
11 5/12 Projecto: processamento de imagem 12 12/12 Projecto: segmentação de imagens em regiões 13 19/12 Projecto: classificação de regiões
Bibliografia
GZ2e R. Gonzalez, R. Woods. Digital Image Processing, 2ª Ed, Prentice Hall, 2002.
(http://www.imageprocessingbook.com/)
SK2e M. Sonka, V. Hlavac, R. Boyle. Image Processing Analysis and Machine Vision, 2ª edição, Prentice Hall, 1999.
Avaliação
Um trabalho prático (ou um exame escrito).
Caracterização da área
Principais aplicações
• Realçar informação contida na imagem para facilitar a sua percepção
• Obter informação da imagem para apoio a modelos de decisão
Três níveis de processamento
• Baixo nível (processamento de imagem)
• Nível intermédio (análise de imagem)
• Alto nível (compreensão de imagem)
Alguns exemplos de aplicações de processamento de imagem/visão
• Medidas antropométricas
• Contagem de pessoas
• Reconhecimento de matrículas
• Vigilância remota
Natureza de uma imagem digitalizada
Sistema de aquisição e processamento de imagens
O processo de digitalização
• Amostragem de uma imagem 3D numa superfície 2D
• Obtenção de pixels quadrados ou rectangulares
• Tipicamente obtém imagens de 256x256 a 1024x1024 pixels
• Existem vários tipos de sensores (luz visível, infravermelho, etc.)
• Podem existir vários tipos de sensores operando em simultâneo
Alguns problemas do processo de digitalização
• Limites dos sensores (amplitude e tempo de resposta)
• Período de amostragem
• Desfasamento temporal entre os vários sensores
• Ruído de quantificação (aliasing)
Operações típicas a aplicar às imagens
• Remover ruído
• Melhorar o contraste da imagem
• Alterar o tamanho ou forma da imagem
• Corrigir a distorção espacial
• Retirar rastos do movimento
• Corrigir focagens deficientes
• Codificar imagens
• Segmentar imagens para localizar objectos ou realçar atributos
O nosso sistema de visão
Formação da imagem no nosso olho
• A luz proveniente do exterior é projectada na retina, depois de ter atravessado a córnea e a lente
• O olho adapta a forma da lente para focar objectos mais distantes (lente mais plana) ou mais próximos (lente mais curva).
• A distância entre a lente e a retina varia entre 14 mm e 17mm
• A parte da retina responsável por detectar os detalhes da imagem tem cerca de 150 000 elementos por mm2 e uma área de 1.5mm x 1.5mm
Adaptação de brilho e discriminação
• O nosso olho não utiliza um sistema de brilho proporcional à intensidade da luz (os contornos são realçados e o brilho não depende apenas de sua intensidade)
O nosso sistema de visão
Adaptação de brilho e discriminação (cont.)
• O nosso olho sofre de ilusões ópticas, fenómenos que ainda não estão completamente explicados
O nosso sistema de visão
A luz e o espectro electomagnético
• O nosso olho apenas é sensível a uma parte reduzida do especto.
• O nosso olho capta as ondas (na gamas do espectro visível) reflectidas pelos objectos. Os objectos brancos reflectem de forma balanceada todas as cores visíveis.
Aquisição de Imagem
Sensores
• Elementos sensíveis à energia, transformando-a numa voltagem.
• Cada sensor é sensível a um determinado tipo de energia (i.é., gama do especto).
• A aquisição pode ser efectuada por um único sensor, por uma linha de sensores ou por uma matriz de sensores.
Aquisição de Imagem
Sensores
• Captação de imagem com uma linha de sensores
• Captação de imagem com uma matriz de sensores
Aquisição de Imagem
Amostragem e discretização
• A voltagem produzida pelos sensores tem que ser amostrada (i.é., detectado o seu valor em intervalos fixos) e discretizada para valores inteiros, uma vez que a voltagem é um sinal contínuo.
• Quando são utilizados vários sensores, o número de sensores estabelece o número de amostragens.
Aquisição de Imagem
Representação de uma imagem digital
• Representação de uma imagem de M linhas por N colunas:
• Tipicamente o número de tons associado a cada pixel é geralmente uma potência de 2.
• Resolução espacial (i.é., amostragem)
• Resolução em número de tons (i.é., discretização)