Aula 1
Data Science and Machine Learning
Análise e Processamento de Imagens
Prof. Dr. Diego Rafael Moraes
diegorafaelmoraes@gmail.com
https://sites.google.com/site/diegorafaelmoraes/downloads
Módulo 01 - Fundamentos de processamento de imagens Módulo 02 - Percepção visual
Módulo 03 - Sistemas de aquisição
Agenda
(M1)
Percepção
Visual
(M1)
Fund.
Proc.
Imagem
(M3 e M4)
Aquisição
Amostragem
(M1)
Armazenar
(M1)
Razão de
(M1)
Relação entre
Agenda
(M1)
Percepção
Visual
(M1)
Fund.
Proc.
Imagem
(M3 e M4)
Aquisição
Amostragem
(M1)
Armazenar
(M1)
Razão de
Aspecto
(M1)
Relação entre
Pixels
Imagens têm sido meios de expressão da cultura humana desde as pinturas pré-históricas, milênios antes do aparecimento da palavra escrita.
5
•No olho, as imagens são formadas sobre a RETINA, numa área sensível à luz localizada no fundo do olho. Na retina estão localizados dois tipos de células foto-receptoras: os bastonetes
e os cones;
•Os bastonetes distinguem a presença e a ausência de luz ou
tons intermediários;
Percepção de tons
e cores
Temos mais sensores
BASTONETES do que CONES ou seja,
Temos mais percepção a TONS do que a CORES
Distribuição de Cones e Bastonetes na Retina
Cones ==> 6 a 7 milhões (em cada olho) ==> sensível a cores (RGB) Bastonetes ==> 75 a 150 milhões (em cada olho) ==> sensível a brilho
Agenda
(M1)
Percepção
Visual
(M1)
Fund.
Proc.
Imagem
(M3 e M4)
Aquisição
Amostragem
(M1)
Armazenar
(M1)
Razão de
Aspecto
(M1)
Relação entre
Pixels
O QUE É?
PROCESSAMENTO DE IMAGENS
Processar
uma
imagem
significa
modificar as informações contidas
nessa imagem sob vários aspectos, de
modo que o resultado seja uma
imagem ou
informações extraídas
dela.
Como transformar Imagem em Informação???
VISÃO COMPUTACIONAL
Visão Artificial, Visão de Máquina, Visão Robótica, Visão de Computador, etc...
• Utilização de computadores para emular a visão humana, incluindo o aprendizado e a capacidade de fazer inferências, agindo com base em informações visuais;
• É a automatização e a integração de uma quantidade de processos e representações usadas para a Percepção Visual.
25
Algumas Áreas que fornecem subsídios à Visão Computacional
Processamento de Imagens
Reconhecimento de Padrões
Computação Gráfica
Inteligência Artificial
Visão Biológica
Psicologia (Percepção)
VISÃO COMPUTACIONAL
O processo de Visão em geral, abrange:
1. Visão em baixo-nível:
• Pré-processamento da imagem – filtros, realce, restauração 2. Visão em nível intermediário:
• Extração de Características – segmentação e descrição 3. Visão em alto-nível:
• Uso de conhecimento para fazer inferências - Análise de
27
Visão Computacional
Imagem
Digital Processamento de Imagem
Extração/ Seleção de
Características Reconhecimento
Processamento de Imagens
Imagem
Pré- Processamento
Processamento de Imagens
31 Imagem Ruidosa Filtros Segmentação de FronteiraPrimeiras Imagens Digitais
A necessidade de Processar Imagens surgiu no início do século passado quando as primeiras imagens digitais foram geradas. Imagem Digital gerada em 1921 porEspectro eletromagnético de acordo com
a energia de um fóton
Evolução das Imagens
Uma Imagem é gerada quando uma Radiação
Espectro Eletromagnético
35 Medicina Nuclear Análise da qualidade do milho.Espectro Eletromagnético
37
Imagens por raios gama
Exemplos de imagens de raios-gama:
(a) “escaneamento” do esqueleto, (b) imagem PET,
(c) constelação de Cygnus, e (d) radiação Gama
(mancha brilhante) de uma válvula
Imagens por raios x Exemplos de imagens de raios-X: (a) do tórax, (b) angiograma aórtica, (c) CT da cabeça, (d) circuitos eletrônicos, e (e) constelação de Cygnus.
Imagens por ultravioleta
Exemplos de imagens ultravioleta:
(a) milho normal, (b) milho infectado, e
Aplicações industriais
Controle de qualidade por inspeção visual Visão computacional: Robôs guiados por visão em linhade montagem Análise de características mecânicas de materiais: microscopia eletrônica
(a) impressão digital, (b) dinheiro,
(c) e (d) leitura automática de placas.
Biometria – identificação e segurança
Reconhecimento
facial impressão digitalIdentificação por Reconhecimento automático de assinaturas
• Uma imagem monocromática é uma função bidimensional da intensidade da luz f(x,y), na qual x e y denotam as coordenadas espaciais (largura x altura) e o valor de f em qualquer ponto corresponde ao brilho (nível de cinza) da imagem naquele ponto.
• A intensidade de luz pode ser modelada como: f(x,y) = i(x,y) · r(x,y) • i = iluminação do ambiente 0 ≤ i(x,y) ≤ ∞
• r = refletância dos objetos 0 ≤ r(x,y) ≤ 1
Ocorre a formação de uma imagem quando um sensor de imagem registra a radiação que interagiu com objetos físicos.
Convenção utilizada para os eixos x e y.
(a) (b)
(0,0)
y
x
* f(x,y)
Uma Imagem Digital é uma imagem contínua amostrada em um arranjo matricial M x N, sendo o valor de cada elemento da
matriz o nível de cinza do pixel correspondente no plano de imagem.
a) Convenção utilizada em Processamento de Imagens
b) Convenção utilizada pelo Toolbox de Processamento de Imagens do Matlab
Formação da imagem no olho humano
17
100
15
x
Formação da imagem em uma máquina
fotográfica
Agenda
(M1)
Percepção
Visual
(M1)
Fund.
Proc.
Imagem
(M3 e M4)
Aquisição
Amostragem
(M1)
Armazenar
(M1)
Razão de
Aspecto
(M1)
Relação entre
Pixels
Sensores de imagem
Nas máquinas digitais, no lugar do filme, as imagens são capturadas por uma matriz de sensores que detectam energia
Imagem Grade de amostragem Pixel (PIcture ELement) Imagem digitalizada Matriz em 256 níveis de
Imagem Digital
Imagem Digital
Imagem Digital
Pixel
Nível de cinza do pixel
Imagem Digital
• Imagem Digital é uma função m-vetorial f(x,y) de valores discretos, sendo (x,y) um par de coordenadas inteiras e,
onde W = (2n – 1) e n é o número de bits utilizado na quantização.
• Uma Imagem Digital é uma função contínua que é representada por amostras medidas em intervalos regulares.
• O ponto (x,y) é conhecido como Pixel ( Picture element ) e o valor de f(x,y) é o nível de cinza (graylevel) do ponto (x,y). W é o máximo valor da escala de cinza.
• Amostragem à Digitalização dos valores das coordenadas (posição)
• Quantização à Digitalização dos valores de intensidade de luz (brilho) • Uma imagem f(x,y) é amostrada resultando em
M linhas e N colunas. • Esta imagem tem tamanho: M x N
• Os valores das coordenadas (x,y) são discretos: valores inteiros e positivos
• Os valores dos níveis de cinza f(x,y) são discretos: valores reais e positivos
75
Resolução da Escala de Cinza
q É definida pelo número de bits (n) utilizado para codificar cada pixel da imagem.
q A escala de cinza é o intervalo de variação: 0 ≤ f(x,y) ≤ W, sendo W = (2n– 1)
q Uma imagem com 2 níveis de cinza (n = 1) é denominada de
Imagem Binária e seus valores serão representados por (0 e 1).
q Se n = 8, cada pixel tem resolução de 256 níveis de cinza, ou seja, 8 bits/pixel.
Resolução de níveis de cinza
16
4
8
2 (Binária)
Agenda
(M1)
Percepção
Visual
(M1)
Fund.
Proc.
Imagem
(M3 e M4)
Aquisição
Amostragem
(M1)
Armazenar
(M1)
Razão de
(M1)
Relação entre
Armazenamento
• O espaço utilizado para armazenamento de uma imagem digital é geralmente expresso em bytes.
• 1 byte corresponde a 8 bits.
• Quantidade de níveis de cinza (L) representáveis na imagem:
• Geralmente é uma potência de 2 ( L = 4, 16, 64, 256, etc.). • Se L = 256 significa que cada pixel pode ter um valor entre 0 (preto) e 255 (branco), e ocupa um byte de espaço de armazenamento no computador (8 bits → 28 = 256).
• Nesse caso, diz-se que a profundidade da imagem é de 8 bits por pixel.
Exemplo: para uma imagem de 640 x 480 e 8 bits de profundidade são necessários:
Armazenamento
• O cálculo do espaço de armazenamento de uma imagem em bytes não deve ser feito calculando-se o número de bits e dividindo o resultado por 8.
• O cálculo deve ser feito diretamente em bytes, determinando-se quantos bytes por pixel são gastos no armazenamento.
• Imagens de 5, 6, 7 e 8 bits de profundidade ocupam 1 byte por pixel e, portanto, o mesmo espaço para armazenamento.
P1 P1 P1 P1 P1 P1 P1 P1 1 byte 8 bits 7 bits P1 P1 P1 P1 P1 P1 P1 Ø P1 P1 P1 P1 P1 P1 Ø Ø 6 bits 5 bits P1 P1 P1 P1 P1 Ø Ø Ø
Armazenamento
• Uma imagem de 4 bits de profundidade ocupa ½ byte por pixel, e portanto, a metade do espaço para armazenamento que uma imagem de 5, 6, 7 ou 8 bits.
• Uma imagem de 3 bits ocupa o mesmo espaço que uma imagem de 4 bits de profundidade, já que eu um byte só é possível armazenar 2 pixels.
• Imagens de 2 bits armazenam 4 pixels em 1 byte.
• Imagens binárias (1 bit) armazenam 8 pixels em 1 byte.
Armazenamento
Para uma imagem de 640 x 480 e 4 ou 3 bits de profundidade são necessários:
640 x 480 x 1/2 = 153600 bytes = 150 Kbytes de memória Para uma imagem de 640 x 480 e 2 bits de profundidade
são necessários:
640 x 480 x 1/4 = 76800 bytes = 75 Kbytes de memória Para uma imagem de 640 x 480 e 8, 7, 6 ou 5 bits de
profundidade são necessários:
640 x 480 x 1 = 307200 bytes = 300 Kbytes de memória
Para uma imagem binária de 640 x 480 são necessários: 640 x 480 x 1/8 = 38400 bytes = 37,5 Kbytes de memória
Agenda
(M1)
Percepção
Visual
(M1)
Fund.
Proc.
Imagem
(M3 e M4)
Aquisição
Amostragem
(M1)
Armazenar
(M1)
Razão de
(M1)
Relação entre
RAZÃO DE ASPECTO
RAZÃO DE ASPECTO
Câmera Fotográfica Digital
Mega-Pixel
b
a
Câmera Fotográfica Digital
3.0 Mega-Pixel = 3 x 1024 x 1024 pixel
3.145.728 pixels
1536 2048 2048 x 1536 = 3.145.728 2048 / 1536 = 1,33333 4 / 3 = 1,33333 K MMonitor de Vídeo
3.0 Mega-Pixel ou 4.0 Mega-Pixel?
Dot Pitch ou tamanho do pixel
Scanner ou Digitalizadores
Resolução em DPI (Dot per Inch)
Tamanho do pixel (abertura)
polegadas
Exemplo: 600 DPI
600 pontos (pixel) --- 1 pol (2,54 cm)
1 ponto (pixel) --- X
Agenda
(M1)
Percepção
Visual
(M1)
Fund.
Proc.
Imagem
(M3 e M4)
Aquisição
Amostragem
(M1)
Armazenar
(M1)
Razão de
Aspecto
(M1)
Relação entre
Pixels
93
Relações Básicas entre Pixels.
Imagem ==> f(x,y)Pixel ==> p,q,r,...
Sub-conjunto de Pixels ==> S
Adjacência entre Pixels:
Um par de Pixels de uma Imagem que compartilham uma borda é dito “adjacente por borda” ou 4-adjacente.
Um par de Pixels de uma Imagem que compartilham um vértice é dito “adjacente por vértice” ou 8-adjacente.
Vizinhança de um Pixel.
Um Pixel p na coordenada (x,y) tem a seguinte vizinhança na vertical e na horizontal, chamada de N4(p)
y x (x-1,y) (x,y+1) (x+1,y) (x,y) (x,y-1)
A Vizinhança-4 de um Pixel p é um sub-conjunto de Pixels que são 4-adjacentes a ele mais o Pixel em si.
95
Vizinhança de um Pixel.
A Vizinhança Diagonal de p é formada pelos quatro Pixels que compartilham somente um vértice com p.
y
x
(x-1,y-1) (x-1,y+1)
(x+1,y-1) (x+1,y+1)
Vizinhança de um Pixel.
A Vizinhança-8 de um Pixel p é um sub-conjunto
de 8 Pixels que são adjacentes por vértice (8-adjacentes) a ele, mais o Pixel em si.
y
97
Conectividade.
Conceito usado para estabelecer fronteiras de objetos e regiões em uma Imagem.
Dois Pixels são conectados se:
1. São adjacentes
2. Seus níveis de cinza satisfazem a um critério especificado de similaridade
Exemplo: Imagem com 2 níveis de cinza (0 e 1).
Dois píxels vizinhos de 4 são conectados se tiverem o mesmo valor.
Conectividade.
Seja V = { G1, G2, ...Gk } o conjunto de “k” valores de níveis de cinza usados para definir a conectividade.
Define-se:
a) Conectividade-4 : dois Pixels p e q com valores em V e
b) Conectividade-8 : dois Pixels p e q com valores em V e
99
Exemplo:
Seja V = {1,2} os valores que definem a conectividade.
0 1 1 0 2 0 0 0 1 0 1 1 0 2 0 0 0 1 0 1 1 0 2 0 0 0 1 Conectividade-4 Conectividade-8 Conectividade-m Pixel p
A conectividade-m elimina a dupla conexão ou o “caminho duplo” entre dois Píxels p e q.
Encadeamento Lógico.
q Uma sequência de Pixels ( p1, p2, ...pn ) é uma sequência 4-conectada se pi é 4-adjacente a pi+1.
q Uma sequência é 8-conectada se pi é 8-adjacente a pi+1. Seja S um sub-conjunto não vazio de pixels de uma Imagem.
S é 4-conectado se:
1) Para quaisquer dois pixels a e b, existe uma sequência de pixels 4-conectada (p1, p2, p3, ...pn) em S tal que p1 = a e pn = b
2) S contém somente um pixel.
101
Exemplo:
Sequências 4-conectadas para V = {1}
Exemplo:
103
Métricas de Distâncias.
A distância entre dois pixels em uma imagem é uma medida fundamental para muitos algoritmos.
Dados os pixels
A função de distância D, obedece às seguintes propriedades: p de coordenadas (x1,y1)
q de coordenadas (x2,y2) t de coordenadas (x3,y3)
• Não Negatividade à D(p,q) ≥ 0 para todo p e q • Identidadeà D(p,q) = 0 somente se p=q
• Simetria à D(p,q) = D(q,p) para todo p e q
•Desigualdade Triangular à D(p,q) + D(q,t) ≥ D(p,t) para todo p, q e t
Métricas de Distâncias.
Para mosaicos quadrados,as métricas mais utilizadas para dois píxels p (x1,y1) e q (x2,y2) , são: Distância Euclidiana: 2 2 1 2 2 1
)
(
)
(
)
,
(
p
q
x
x
y
y
D
e=
-
+
-Distância City-Block (-Distância D4):
|
|
|
|
)
,
(
p
q
x
1x
2y
1y
2D
cb=
-
+
-As distâncias D4 e D8 consideram apenas ascoordenadas dos píxels, independente da
existência de conectividade entre eles.
A D4 é medida pelo caminho de 4 mais curto
105
Exemplos
p q y x p = (1,1) q = (4,3) Distância Euclidiana: 2 2 1 2 2 1)
(
)
(
)
,
(
p
q
x
x
y
y
D
e=
-
+
-1 − 4 $+ 1 − 3 $ = −3 $+ −2 $ = 9+4 = 13 = 3,6Exemplos
p q y x p = (1,1) q = (4,3)Distância City-Block (Distância D4):
|
|
|
|
)
,
(
p
q
x
1x
2y
1y
2D
cb=
-
+
-1 − 4 + -1 − 3 = −3 + −2 =107
Exemplos
p q y x p = (1,1) q = (4,3)|}
|
|,
max{|
)
,
(
p
q
x
1x
2y
1y
2D
ch=
-
-Distância Chessboard (-Distância D8):
max{ 1 − 4 , 1 − 3 }= max{ −3 , −2 }=
max{ 3,2 }=
Bibliografia
Básica:
• Gonzalez, R.C.; Woods, R.E. Processamento Digital de Imagens. São Paulo: Pearson Prentice Hall, 3.ed, 2010.
• Gonzalez, R.C.; Woods, R.E. Digital Image Processing. Pearson Prentice Hall, 3rd. Edition, 2007.
Complementar:
• Petrou, M. Image Processing: the fundamentals, 2.ed. Chichester: Wiley, 2010.
• Parker, J. R. Algorithms for image processing and computer vision, 2.ed. Indianapolis: Wiley, 2010.
FIM
Data Science and Machine Learning
Análise e Processamento de Imagens
Prof. Dr. Diego Rafael Moraes
diegorafaelmoraes@gmail.com
https://sites.google.com/site/diegorafaelmoraes/downloads
Agradecimentos aos professores da USP de São Carlos: - Prof. Adilson Gonzaga (meu orientador de doutorado)
- Prof. Dr. Marcelo Andrade da Costa Vieira (professor em disciplinas) Primeiramente pelos ensinamentos (de grande valia na minha carreira), mas também por compartilharem e permitirem o usp dos materiais de aula (de altíssima qualidade)