Visão por Computador

(1)

Visão por Computador

http://gec.di.uminho.pt/lesi/vpc, http://gec.di.uminho.pt/mcc/vpc

LESI / LMCC – 5º Ano

Introdução

João Luís Ferreira Sobral Departamento do Informática

Universidade do Minho

Setembro 2003

(2)

Programa

Introdução e objectivos

Pretende-se com esta disciplina complementar a formação dos alunos com conhecimentos da área de Visão por Computador. Designadamente, pretende-se introduzir conhecimentos relativos aos métodos de processamento de imagens, utilizados para melhorar as características de imagens, e os processos que visam a extracção automática de informação de imagens.

Para atingir estes objectivos, e sendo o processamento de imagem uma área de índole bastante experimental, existirá uma forte ligação entre a componente teórica e a componente prática: os conceitos introduzidos na componente teórica serão experimentados na aula prática seguinte, utilizando uma ferramenta de processamento de imagem, o sistema Khoros. Desta forma são experimentadas as diversas técnicas, permitindo ao aluno obter as suas próprias conclusões relativamente a cada método.

Componente Teórica

I. Processamento de Imagem

o Introdução aos sistemas de processamento de imagem.

o Natureza de uma imagem digital. Calibração de imagem.

o Propriedades estatísticas das imagens: brilho e contraste. Histograma.

o Filtros no domínio do espaço. Convolução digital. Filtros passa-alto e passa-baixo. Suavização de imagens. Detecção e realce de contornos. Filtros não lineares.

o Filtros no domínio das frequências. Transformada de Fourier e Teorema da convolução.

o Restauração de imagem.

o Compressão de imagem: compressão sem perda e compressão com perda.

o Processamento de imagens a cor.

II. Análise de Imagem

o Binarização simples múltipla e adaptativa.

o Operadores morfológicos: erosão, dilatação e esqueletização.

o Análise de texturas: modelos estrutural, estatístico e espectral.

o Segmentação de imagens em regiões. Detecção de formas: verificação de padrões, pirâmides de resolução e transformada de Hough.

o Descrição de formas: chain codes, assinaturas, polígonos e convex hull.

o Reconhecimento de objectos

III. Visão por Computador em Tempo Real

o Requisitos de processamento em termos de hardware e software.

Componente Prática

o Sessões práticas com o sistema Khoros, Desenvolvimento de algoritmos.

(3)

Programa

Equipa Docente

João Luís Ferreira Sobral email: jls@...

telefone: 4439 (253 604439 do exterior)

Planeamento

Aula Dia Matéria Bibliografia

1 26/09 Apresentação da disciplina, caracterização da área,

natureza e características de uma imagem GZ 1, 2 2 3/10 Propriedades estatísticas das imagens, alteração do

brilho e contraste, convolução digital GZ 3 3 10/10 Transformada de Fourier, filtros no domínio das

frequências, teorema da convolução GZ 4

4 17/10 Restauração de imagem GZ 5

5 24/10 Processamento de imagens a cores GZ 6

6 31/10 Compressão de imagem GZ 8

7 7/11 Segmentação de imagens, operadores morfológicos GZ 9, 10 8 14/11 Representação e descrição de regiões. GZ 11 9 21/11 Reconhecimento de objectos / regiões GZ 12 10 28/11 Visão por Computador em tempo real

11 5/12 Projecto: processamento de imagem 12 12/12 Projecto: segmentação de imagens em regiões 13 19/12 Projecto: classificação de regiões

Bibliografia

GZ2e R. Gonzalez, R. Woods. Digital Image Processing, 2ª Ed, Prentice Hall, 2002.

(http://www.imageprocessingbook.com/)

SK2e M. Sonka, V. Hlavac, R. Boyle. Image Processing Analysis and Machine Vision, 2ª edição, Prentice Hall, 1999.

Avaliação

Um trabalho prático (ou um exame escrito).

(4)

Caracterização da área

Principais aplicações

• Realçar informação contida na imagem para facilitar a sua percepção

• Obter informação da imagem para apoio a modelos de decisão

Três níveis de processamento

• Baixo nível (processamento de imagem)

• Nível intermédio (análise de imagem)

• Alto nível (compreensão de imagem)

Alguns exemplos de aplicações de processamento de imagem/visão

• Medidas antropométricas

• Contagem de pessoas

• Reconhecimento de matrículas

• Vigilância remota

(5)

Natureza de uma imagem digitalizada

Sistema de aquisição e processamento de imagens

O processo de digitalização

• Amostragem de uma imagem 3D numa superfície 2D

• Obtenção de pixels quadrados ou rectangulares

• Tipicamente obtém imagens de 256x256 a 1024x1024 pixels

• Existem vários tipos de sensores (luz visível, infravermelho, etc.)

• Podem existir vários tipos de sensores operando em simultâneo

Alguns problemas do processo de digitalização

• Limites dos sensores (amplitude e tempo de resposta)

• Período de amostragem

• Desfasamento temporal entre os vários sensores

• Ruído de quantificação (aliasing)

Operações típicas a aplicar às imagens

• Remover ruído

• Melhorar o contraste da imagem

• Alterar o tamanho ou forma da imagem

• Corrigir a distorção espacial

• Retirar rastos do movimento

• Corrigir focagens deficientes

• Codificar imagens

• Segmentar imagens para localizar objectos ou realçar atributos

(6)

O nosso sistema de visão

Formação da imagem no nosso olho

• A luz proveniente do exterior é projectada na retina, depois de ter atravessado a córnea e a lente

• O olho adapta a forma da lente para focar objectos mais distantes (lente mais plana) ou mais próximos (lente mais curva).

• A distância entre a lente e a retina varia entre 14 mm e 17mm

• A parte da retina responsável por detectar os detalhes da imagem tem cerca de 150 000 elementos por mm2 e uma área de 1.5mm x 1.5mm

Adaptação de brilho e discriminação

• O nosso olho não utiliza um sistema de brilho proporcional à intensidade da luz (os contornos são realçados e o brilho não depende apenas de sua intensidade)

(7)

O nosso sistema de visão

Adaptação de brilho e discriminação (cont.)

• O nosso olho sofre de ilusões ópticas, fenómenos que ainda não estão completamente explicados

(8)

O nosso sistema de visão

A luz e o espectro electomagnético

• O nosso olho apenas é sensível a uma parte reduzida do especto.

• O nosso olho capta as ondas (na gamas do espectro visível) reflectidas pelos objectos. Os objectos brancos reflectem de forma balanceada todas as cores visíveis.

(9)

Aquisição de Imagem

Sensores

• Elementos sensíveis à energia, transformando-a numa voltagem.

• Cada sensor é sensível a um determinado tipo de energia (i.é., gama do especto).

• A aquisição pode ser efectuada por um único sensor, por uma linha de sensores ou por uma matriz de sensores.

(10)

Aquisição de Imagem

Sensores

• Captação de imagem com uma linha de sensores

• Captação de imagem com uma matriz de sensores

(11)

Aquisição de Imagem

Amostragem e discretização

• A voltagem produzida pelos sensores tem que ser amostrada (i.é., detectado o seu valor em intervalos fixos) e discretizada para valores inteiros, uma vez que a voltagem é um sinal contínuo.

• Quando são utilizados vários sensores, o número de sensores estabelece o número de amostragens.

(12)

Aquisição de Imagem

Representação de uma imagem digital

• Representação de uma imagem de M linhas por N colunas:

• Tipicamente o número de tons associado a cada pixel é geralmente uma potência de 2.

• Resolução espacial (i.é., amostragem)

• Resolução em número de tons (i.é., discretização)