Visão por Computador
WWW: gec.di.uminho.pt/lesi/vpc, gec.di.uminho.pt/mcc/vpc
LESI/LMCC - 5º Ano
Introdução
João Luís Ferreira Sobral
Departamento do Informática
Universidade do Minho
Programa
Introdução e objectivos
Pretende-se com esta disciplina complementar a formação dos alunos com conhecimentos da área de Visão por Computador. Designadamente, pretende-se introduzir conhecimentos relativos aos métodos de processamento de imagens, utilizados para melhorar as características de imagens, e os processos que visam a extracção automática de informação de imagens.
Para atingir estes objectivos, e sendo o processamento de imagem uma área de índole bastante experimental, existirá uma forte ligação entre a componente teórica e a componente prática: os conceitos introduzidos na componente teórica serão experimentados na aula prática seguinte, utilizando uma ferramenta de processamento de imagem, o sistema Khoros. Desta forma são experimentadas as diversas técnicas, permitindo ao aluno obter as suas próprias conclusões relativamente a cada método.
Componente Teórica
I. Processamento de Imagemo Introdução aos sistemas de processamento de imagem. o Natureza de uma imagem digital. Calibração de imagem.
o Propriedades estatísticas das imagens: brilho e contraste. Histograma.
o Filtros no domínio do espaço. Convolução digital. Filtros passa-alto e
passa-baixo. Suavização de imagens. Detecção e realce de contornos. Filtros não lineares.
o Filtros no domínio das frequências. Transformada de Fourier e Teorema da
convolução.
o Restauração de imagem. Compressão de imagem: compressão não destrutiva e
compressão destrutiva.
o Processamento de imagens a cor. II. Análise de Imagem
o Binarização simples múltipla e adaptativa.
o Operadores morfológicos: erosão, dilatação e esqueletização. o Análise de texturas: modelos estrutural, estatístico e espectral.
o Segmentação de imagens em regiões. Detecção de formas: verificação de
padrões, pirâmides de resolução e transformada de Hough.
o Descrição de formas: chain codes, assinaturas, polígonos e convex hull. o Reconhecimento de objectos
III. Visão por Computador em Tempo Real
o Requisitos de processamento em termos de hardware e software para efectuar
visão por computador em tempo real.
Componente Prática
Programa
Equipa Docente
João Luís Ferreira Sobral (jls@di.uminho.pt, ext. 4439)
Planeamento
Aula Dia Teórica Prática Bibliogr.
1 4/10
Apresentação da disciplina, caracterização da área, natureza e características de uma
imagem digitalizada Introdução ao Khoros LPS 1, 2, 3. GZ 1, 2 2 11/10
Propriedades estatísticas das imagens, alteração do brilho e contraste, convolução
digital Histograma e convolução LPS 4, 5, 6 *GZ 3 3 18/10
Transformadas de imagem, transformada de Fourier, filtros no domínio das frequências,
teorema da convolução
FFT, teorema
da convolução GZ 4.1-4.4
4 25/10 Restauração de imagem Restauração
de imagem GZ 5.1-5.4
- 1/11 Feriado - -
5 8/11 Compressão de imagem Exemplos de compressão
GZ 7.1-7.2, GZ 8.1-8.6
6 15/11 Segmentação de imagens, binarização,
operadores morfológicos Binarização
LP 7. *GZ
10.1-10.3
7 22/11 Texturas, segmentação baseada em divisão e junção de regiões
Análise de texturas
LP 7. *GZ 10.4
8 29/11 Detecção de formas, descrição de formas Detecção de formas
LP 8, 9. *GZ 11
9 6/12 Reconhecimento de objectos, transformação de perspectivas, visão estéreo Algoritmos GZ 12, SK
10 13/12 Visão por computador em tempo real Direct X
11 20/12 Livre
* Adicional
Bibliografia
LP Luís Paulo Santos. Visão por Computador, Universidade do Minho, UM-DI-TA-95-02, 1995. (Disponível na página da disciplina)
GZ2e R. Gonzalez, R. Woods. Digital Image Processing, 2ª Ed, Prentice Hall, 2002. (http://www.imageprocessingbook.com/)
SK2e M. Sonka, V. Hlavac, R. Boyle. Image Processing Analysis and Machine Vision, 2ª edição, Prentice Hall, 1999.
Avaliação
Caracterização da área
Principais aplicações
• Realçar informação contida na imagem para facilitar a sua percepção • Obter informação da imagem para apoio a modelos de decisão
Três níveis de processamento
• Baixo nível (processamento de imagem) • Nível intermédio (análise de imagem) • Alto nível (compreensão de imagem)
Alguns exemplos de aplicações de processamento de imagem/visão
• Medidas antropométricas• Contagem de pessoas
• Reconhecimento de matrículas • Vigilância remota
Natureza de uma imagem digitalizada
Sistema de aquisição e processamento de imagens
O processo de digitalização
• Amostragem de uma imagem 3D numa superfície 2D • Obtenção de pixels quadrados ou rectangulares
• Tipicamente obtém imagens de 256x256 a 1024x1024 pixels • Existem vários tipos de sensores (luz visível, infravermelho, etc.) • Podem existir vários tipos de sensores operando em simultâneo
Alguns problemas do processo de digitalização
• Limites dos sensores (amplitude e tempo de resposta) • Período de amostragem
• Desfasamento temporal entre os vários sensores • Ruído de quantificação (aliasing)
Operações típicas a aplicar às imagens
• Remover ruído• Melhorar o contraste da imagem
• Alterar o tamanho ou forma da imagem • Corrigir a distorção espacial
• Retirar rastos do movimento • Corrigir focagens deficientes • Codificar imagens
O nosso sistema de visão
Formação da imagem no nosso olho
• A luz proveniente do exterior é projectada na retina, depois de ter atravessado a córnea e a lente
• O olho adapta a forma da lente para focar objectos mais distantes (lente mais plana) ou mais próximos (lente mais curva).
• A distância entre a lente e a retina varia entre 14 mm e 17mm
• A parte da retina responsável por detectar os detalhes da imagem tem cerca de 150 000 elementos por mm2 e uma área de 1.5mm x 1.5mm
Adaptação de brilho e discriminação
• O nosso olho não utiliza um sistema de brilho proporcional à intensidade da luz (os contornos são realçados e o brilho não depende apenas de sua intensidade)
O nosso sistema de visão
Adaptação de brilho e discriminação (cont.)
• O nosso olho sofre de ilusões ópticas, fenómenos que ainda não estão completamente explicados
O nosso sistema de visão
A luz e o espectro electomagnético
• O nosso olho apenas é sensível a uma parte reduzida do especto.
• O nosso olho capta as ondas (na gamas do espectro visível) reflectidas pelos objectos. Os objectos brancos reflectem de forma balanceada todas as cores visíveis.
Aquisição de Imagem
Sensores
• Elementos sensíveis à energia, transformando-a numa voltagem.
• Cada sensor é sensível a um determinado tipo de energia (i.é., gama do especto). • A aquisição pode ser efectuada por um único sensor, por uma linha de sensores ou
Aquisição de Imagem
Sensores
• Captação de imagem com uma linha de sensores
Aquisição de Imagem
Amostragem e discretização
• A voltagem produzida pelos sensores tem que ser amostrada (i.é., detectado o seu valor em intervalos fixos) e discretizada para valores inteiros, uma vez que a voltagem é um sinal contínuo.
• Quando são utilizados vários sensores, o número de sensores estabelece o número de amostragens.
Aquisição de Imagem
Representação de uma imagem digital
• Representação de uma imagem de M linhas por N colunas:
• Tipicamente o número de tons associado a cada pixel é geralmente uma potência de 2. • Resolução espacial (i.é., amostragem)