Visão por Computador. WWW: gec.di.uminho.pt/lesi/vpc, gec.di.uminho.pt/mcc/vpc. LESI/LMCC - 5º Ano. Introdução

(1)

Visão por Computador

WWW: gec.di.uminho.pt/lesi/vpc, gec.di.uminho.pt/mcc/vpc

LESI/LMCC - 5º Ano

Introdução

João Luís Ferreira Sobral

Departamento do Informática

Universidade do Minho

(2)

Programa

Introdução e objectivos

Pretende-se com esta disciplina complementar a formação dos alunos com conhecimentos da área de Visão por Computador. Designadamente, pretende-se introduzir conhecimentos relativos aos métodos de processamento de imagens, utilizados para melhorar as características de imagens, e os processos que visam a extracção automática de informação de imagens.

Para atingir estes objectivos, e sendo o processamento de imagem uma área de índole bastante experimental, existirá uma forte ligação entre a componente teórica e a componente prática: os conceitos introduzidos na componente teórica serão experimentados na aula prática seguinte, utilizando uma ferramenta de processamento de imagem, o sistema Khoros. Desta forma são experimentadas as diversas técnicas, permitindo ao aluno obter as suas próprias conclusões relativamente a cada método.

Componente Teórica

I. Processamento de Imagem

o Introdução aos sistemas de processamento de imagem. o Natureza de uma imagem digital. Calibração de imagem.

o Propriedades estatísticas das imagens: brilho e contraste. Histograma.

o Filtros no domínio do espaço. Convolução digital. Filtros passa-alto e

passa-baixo. Suavização de imagens. Detecção e realce de contornos. Filtros não lineares.

o Filtros no domínio das frequências. Transformada de Fourier e Teorema da

convolução.

o Restauração de imagem. Compressão de imagem: compressão não destrutiva e

compressão destrutiva.

o Processamento de imagens a cor. II. Análise de Imagem

o Binarização simples múltipla e adaptativa.

o Operadores morfológicos: erosão, dilatação e esqueletização. o Análise de texturas: modelos estrutural, estatístico e espectral.

o Segmentação de imagens em regiões. Detecção de formas: verificação de

padrões, pirâmides de resolução e transformada de Hough.

o Descrição de formas: chain codes, assinaturas, polígonos e convex hull. o Reconhecimento de objectos

III. Visão por Computador em Tempo Real

o Requisitos de processamento em termos de hardware e software para efectuar

visão por computador em tempo real.

Componente Prática

(3)

Programa

Equipa Docente

João Luís Ferreira Sobral (jls@di.uminho.pt, ext. 4439)

Planeamento

Aula Dia Teórica Prática Bibliogr.

1 4/10

Apresentação da disciplina, caracterização da área, natureza e características de uma

imagem digitalizada Introdução ao Khoros LPS 1, 2, 3. GZ 1, 2 2 11/10

Propriedades estatísticas das imagens, alteração do brilho e contraste, convolução

digital Histograma e convolução LPS 4, 5, 6 *GZ 3 3 18/10

Transformadas de imagem, transformada de Fourier, filtros no domínio das frequências,

teorema da convolução

FFT, teorema

da convolução GZ 4.1-4.4

4 25/10 Restauração de imagem Restauração

de imagem GZ 5.1-5.4

- 1/11 Feriado - -

5 8/11 Compressão de imagem Exemplos de compressão

GZ 7.1-7.2, GZ 8.1-8.6

6 15/11 Segmentação de imagens, binarização,

operadores morfológicos Binarização

LP 7. *GZ

10.1-10.3

7 22/11 Texturas, segmentação baseada em divisão e junção de regiões

Análise de texturas

LP 7. *GZ 10.4

8 29/11 Detecção de formas, descrição de formas Detecção de formas

LP 8, 9. *GZ 11

9 6/12 Reconhecimento de objectos, transformação _{de perspectivas, visão estéreo} Algoritmos GZ 12, SK

10 13/12 Visão por computador em tempo real Direct X

11 20/12 Livre

* Adicional

Bibliografia

LP Luís Paulo Santos. Visão por Computador, Universidade do Minho, UM-DI-TA-95-02, 1995. (Disponível na página da disciplina)

GZ2e R. Gonzalez, R. Woods. Digital Image Processing, 2ª Ed, Prentice Hall, 2002. (http://www.imageprocessingbook.com/)

SK2e M. Sonka, V. Hlavac, R. Boyle. Image Processing Analysis and Machine Vision, 2ª edição, Prentice Hall, 1999.

Avaliação

(4)

Caracterização da área

Principais aplicações

• Realçar informação contida na imagem para facilitar a sua percepção • Obter informação da imagem para apoio a modelos de decisão

Três níveis de processamento

• Baixo nível (processamento de imagem) • Nível intermédio (análise de imagem) • Alto nível (compreensão de imagem)

Alguns exemplos de aplicações de processamento de imagem/visão

• Medidas antropométricas

• Contagem de pessoas

• Reconhecimento de matrículas • Vigilância remota

(5)

Natureza de uma imagem digitalizada

Sistema de aquisição e processamento de imagens

O processo de digitalização

• Amostragem de uma imagem 3D numa superfície 2D • Obtenção de pixels quadrados ou rectangulares

• Tipicamente obtém imagens de 256x256 a 1024x1024 pixels • Existem vários tipos de sensores (luz visível, infravermelho, etc.) • Podem existir vários tipos de sensores operando em simultâneo

Alguns problemas do processo de digitalização

• Limites dos sensores (amplitude e tempo de resposta) • Período de amostragem

• Desfasamento temporal entre os vários sensores • Ruído de quantificação (aliasing)

Operações típicas a aplicar às imagens

• Remover ruído

• Melhorar o contraste da imagem

• Alterar o tamanho ou forma da imagem • Corrigir a distorção espacial

• Retirar rastos do movimento • Corrigir focagens deficientes • Codificar imagens

(6)

O nosso sistema de visão

Formação da imagem no nosso olho

• A luz proveniente do exterior é projectada na retina, depois de ter atravessado a córnea e a lente

• O olho adapta a forma da lente para focar objectos mais distantes (lente mais plana) ou mais próximos (lente mais curva).

• A distância entre a lente e a retina varia entre 14 mm e 17mm

• A parte da retina responsável por detectar os detalhes da imagem tem cerca de 150 000 elementos por mm2 e uma área de 1.5mm x 1.5mm

Adaptação de brilho e discriminação

• O nosso olho não utiliza um sistema de brilho proporcional à intensidade da luz (os contornos são realçados e o brilho não depende apenas de sua intensidade)

(7)

O nosso sistema de visão

Adaptação de brilho e discriminação (cont.)

• O nosso olho sofre de ilusões ópticas, fenómenos que ainda não estão completamente explicados

(8)

O nosso sistema de visão

A luz e o espectro electomagnético

• O nosso olho apenas é sensível a uma parte reduzida do especto.

• O nosso olho capta as ondas (na gamas do espectro visível) reflectidas pelos objectos. Os objectos brancos reflectem de forma balanceada todas as cores visíveis.

(9)

Aquisição de Imagem

Sensores

• Elementos sensíveis à energia, transformando-a numa voltagem.

• Cada sensor é sensível a um determinado tipo de energia (i.é., gama do especto). • A aquisição pode ser efectuada por um único sensor, por uma linha de sensores ou

(10)

Aquisição de Imagem

Sensores

• Captação de imagem com uma linha de sensores

(11)

Aquisição de Imagem

Amostragem e discretização

• A voltagem produzida pelos sensores tem que ser amostrada (i.é., detectado o seu valor em intervalos fixos) e discretizada para valores inteiros, uma vez que a voltagem é um sinal contínuo.

• Quando são utilizados vários sensores, o número de sensores estabelece o número de amostragens.

(12)

Aquisição de Imagem

Representação de uma imagem digital

• Representação de uma imagem de M linhas por N colunas:

• Tipicamente o número de tons associado a cada pixel é geralmente uma potência de 2. • Resolução espacial (i.é., amostragem)