Aula01

(1)

Aula 1

Data Science and Machine Learning

Análise e Processamento de Imagens

Prof. Dr. Diego Rafael Moraes

diegorafaelmoraes@gmail.com

https://sites.google.com/site/diegorafaelmoraes/downloads

Módulo 01 - Fundamentos de processamento de imagens Módulo 02 - Percepção visual

Módulo 03 - Sistemas de aquisição

(2)

Agenda

(M1)

Percepção

Visual

(M1)

Fund.

Proc.

Imagem

(M3 e M4)

Aquisição

Amostragem

(M1)

Armazenar

(M1)

Razão de

(M1)

Relação entre

(3)

Agenda

(M1)

Percepção

Visual

(M1)

Fund.

Proc.

Imagem

(M3 e M4)

Aquisição

Amostragem

(M1)

Armazenar

(M1)

Razão de

Aspecto

(M1)

Relação entre

Pixels

(4)

Imagens têm sido meios de expressão da cultura humana desde as pinturas pré-históricas, milênios antes do aparecimento da palavra escrita.

(5)

5

(6)

•No olho, as imagens são formadas sobre a RETINA, numa área sensível à luz localizada no fundo do olho. Na retina estão localizados dois tipos de células foto-receptoras: os bastonetes

e os cones;

•Os bastonetes distinguem a presença e a ausência de luz ou

tons intermediários;

Percepção de tons

e cores

(7)

Temos mais sensores

BASTONETES do que CONES ou seja,

Temos mais percepção a TONS do que a CORES

(8)

(9)

Distribuição de Cones e Bastonetes na Retina

Cones ==> 6 a 7 milhões (em cada olho) ==> sensível a cores (RGB) Bastonetes ==> 75 a 150 milhões (em cada olho) ==> sensível a brilho

(10)

(11)

(12)

(13)

(14)

(15)

(16)

(17)

(18)

(19)

(20)

(21)

Agenda

(M1)

Percepção

Visual

(M1)

Fund.

Proc.

Imagem

(M3 e M4)

Aquisição

Amostragem

(M1)

Armazenar

(M1)

Razão de

Aspecto

(M1)

Relação entre

Pixels

(22)

O QUE É?

PROCESSAMENTO DE IMAGENS

Processar

uma

imagem

significa

modificar as informações contidas

nessa imagem sob vários aspectos, de

modo que o resultado seja uma

imagem ou

informações extraídas

dela.

(23)

Como transformar Imagem em Informação???

(24)

VISÃO COMPUTACIONAL

Visão Artificial, Visão de Máquina, Visão Robótica, Visão de Computador, etc...

• Utilização de computadores para emular a visão humana, incluindo o aprendizado e a capacidade de fazer inferências, agindo com base em informações visuais;

• É a automatização e a integração de uma quantidade de processos e representações usadas para a Percepção Visual.

(25)

25

Algumas Áreas que fornecem subsídios à Visão Computacional

Processamento de Imagens

Reconhecimento de Padrões

Computação Gráfica

Inteligência Artificial

Visão Biológica

Psicologia (Percepção)

(26)

VISÃO COMPUTACIONAL

O processo de Visão em geral, abrange:

1. Visão em baixo-nível:

• Pré-processamento da imagem – filtros, realce, restauração 2. Visão em nível intermediário:

• Extração de Características – segmentação e descrição 3. Visão em alto-nível:

• Uso de conhecimento para fazer inferências - Análise de

(27)

27

(28)

Visão Computacional

Imagem

Digital Processamento de Imagem

Extração/ Seleção de

Características Reconhecimento

(29)

(30)

Processamento de Imagens

Imagem

Pré- Processamento

(31)

Processamento de Imagens

31 Imagem Ruidosa Filtros Segmentação de Fronteira

(32)

Primeiras Imagens Digitais

A necessidade de Processar Imagens surgiu no início do século passado quando as primeiras imagens digitais foram geradas. Imagem Digital gerada em 1921 por

(33)

Espectro eletromagnético de acordo com

a energia de um fóton

(34)

Evolução das Imagens

Uma Imagem é gerada quando uma Radiação

(35)

Espectro Eletromagnético

35 Medicina Nuclear Análise da qualidade do milho.

(36)

(37)

Espectro Eletromagnético

37

(38)

(39)

Imagens por raios gama

Exemplos de imagens de raios-gama:

(a) “escaneamento” do esqueleto, (b) imagem PET,

(c) constelação de Cygnus, e (d) radiação Gama

(mancha brilhante) de uma válvula

(40)

Imagens por raios x Exemplos de imagens de raios-X: (a) do tórax, (b) angiograma aórtica, (c) CT da cabeça, (d) circuitos eletrônicos, e (e) constelação de Cygnus.

(41)

Imagens por ultravioleta

Exemplos de imagens ultravioleta:

(a) milho normal, (b) milho infectado, e

(42)

(43)

(44)

(45)

(46)

(47)

Aplicações industriais

Controle de qualidade por inspeção visual Visão computacional: Robôs guiados por visão em linha

de montagem Análise de características mecânicas de materiais: microscopia eletrônica

(48)

(a) impressão digital, (b) dinheiro,

(c) e (d) leitura automática de placas.

(49)

Biometria – identificação e segurança

Reconhecimento

facial _{impressão digital}Identificação por Reconhecimento _{automático de} assinaturas

(50)

(51)

(52)

(53)

(54)

(55)

• Uma imagem monocromática é uma função bidimensional da intensidade da luz f(x,y), na qual x e y denotam as coordenadas espaciais (largura x altura) e o valor de f em qualquer ponto corresponde ao brilho (nível de cinza) da imagem naquele ponto.

• A intensidade de luz pode ser modelada como: f(x,y) = i(x,y) · r(x,y) • i = iluminação do ambiente 0 ≤ i(x,y) ≤ ∞

• r = refletância dos objetos 0 ≤ r(x,y) ≤ 1

Ocorre a formação de uma imagem quando um sensor de imagem registra a radiação que interagiu com objetos físicos.

(56)

Convenção utilizada para os eixos x e y.

(a) (b)

(57)

(0,0)

_y

x

* f(x,y)

(58)

Uma Imagem Digital é uma imagem contínua amostrada em um arranjo matricial M x N, sendo o valor de cada elemento da

matriz o nível de cinza do pixel correspondente no plano de imagem.

(59)

(60)

a) Convenção utilizada em Processamento de Imagens

b) Convenção utilizada pelo Toolbox de Processamento de Imagens do Matlab

(61)

Formação da imagem no olho humano

17

100

15 x

(62)

Formação da imagem em uma máquina

fotográfica

(63)

Agenda

(M1)

Percepção

Visual

(M1)

Fund.

Proc.

Imagem

(M3 e M4)

Aquisição

Amostragem

(M1)

Armazenar

(M1)

Razão de

Aspecto

(M1)

Relação entre

Pixels

(64)

Sensores de imagem

Nas máquinas digitais, no lugar do filme, as imagens são capturadas por uma matriz de sensores que detectam energia

(65)

(66)

(67)

(68)

Imagem Grade de amostragem Pixel (PIcture ELement) Imagem digitalizada Matriz em 256 níveis de

Imagem Digital

(69)

Imagem Digital

Pixel

Nível de cinza do pixel

(70)

Imagem Digital

• Imagem Digital é uma função m-vetorial f(x,y) de valores discretos, sendo (x,y) um par de coordenadas inteiras e,

onde W = (2n _{– 1) e n é o número de bits utilizado na quantização.}

• Uma Imagem Digital é uma função contínua que é representada por amostras medidas em intervalos regulares.

• O ponto (x,y) é conhecido como Pixel ( Picture element ) e o valor de f(x,y) é o nível de cinza (graylevel) do ponto (x,y). W é o máximo valor da escala de cinza.

(71)

• Amostragem à Digitalização dos valores das coordenadas (posição)

• Quantização à Digitalização dos valores de intensidade de luz (brilho) • Uma imagem f(x,y) é amostrada resultando em

M linhas e N colunas. • Esta imagem tem tamanho: M x N

• Os valores das coordenadas (x,y) são discretos: valores inteiros e positivos

• Os valores dos níveis de cinza f(x,y) são discretos: valores reais e positivos

(72)

(73)

(74)

(75)

75

Resolução da Escala de Cinza

q É definida pelo número de bits (n) utilizado para codificar cada pixel da imagem.

q A escala de cinza é o intervalo de variação: 0 ≤ f(x,y) ≤ W, sendo W = (2n_{– 1)}

q Uma imagem com 2 níveis de cinza (n = 1) é denominada de

Imagem Binária e seus valores serão representados por (0 e 1).

q Se n = 8, cada pixel tem resolução de 256 níveis de cinza, ou seja, 8 bits/pixel.

(76)

Resolução de níveis de cinza

(77)

16

4

8

2 (Binária)

(78)

Agenda

(M1)

Percepção

Visual

(M1)

Fund.

Proc.

Imagem

(M3 e M4)

Aquisição

Amostragem

(M1)

Armazenar

(M1)

Razão de

(M1)

Relação entre

(79)

Armazenamento

• O espaço utilizado para armazenamento de uma imagem digital é geralmente expresso em bytes.

• 1 byte corresponde a 8 bits.

• Quantidade de níveis de cinza (L) representáveis na imagem:

• Geralmente é uma potência de 2 ( L = 4, 16, 64, 256, etc.). • Se L = 256 significa que cada pixel pode ter um valor entre 0 (preto) e 255 (branco), e ocupa um byte de espaço de armazenamento no computador (8 bits → 28 _{= 256).}

• Nesse caso, diz-se que a profundidade da imagem é de 8 bits por pixel.

Exemplo: para uma imagem de 640 x 480 e 8 bits de profundidade são necessários:

(80)

(81)

Armazenamento

• O cálculo do espaço de armazenamento de uma imagem em bytes não deve ser feito calculando-se o número de bits e dividindo o resultado por 8.

• O cálculo deve ser feito diretamente em bytes, determinando-se quantos bytes por pixel são gastos no armazenamento.

• Imagens de 5, 6, 7 e 8 bits de profundidade ocupam 1 byte por pixel e, portanto, o mesmo espaço para armazenamento.

P₁ P₁ P₁ P₁ P₁ P₁ P₁ P₁ 1 byte 8 bits 7 bits P1 P1 P1 P1 P1 P1 P1 Ø P1 P1 P1 P1 P1 P1 Ø Ø 6 bits 5 bits P₁ P₁ P₁ P₁ P₁ Ø Ø Ø

(82)

Armazenamento

• Uma imagem de 4 bits de profundidade ocupa ½ byte por pixel, e portanto, a metade do espaço para armazenamento que uma imagem de 5, 6, 7 ou 8 bits.

• Uma imagem de 3 bits ocupa o mesmo espaço que uma imagem de 4 bits de profundidade, já que eu um byte só é possível armazenar 2 pixels.

• Imagens de 2 bits armazenam 4 pixels em 1 byte.

• Imagens binárias (1 bit) armazenam 8 pixels em 1 byte.

(83)

Armazenamento

Para uma imagem de 640 x 480 e 4 ou 3 bits de profundidade são necessários:

640 x 480 x 1/2 = 153600 bytes = 150 Kbytes de memória Para uma imagem de 640 x 480 e 2 bits de profundidade

são necessários:

640 x 480 x 1/4 = 76800 bytes = 75 Kbytes de memória Para uma imagem de 640 x 480 e 8, 7, 6 ou 5 bits de

profundidade são necessários:

640 x 480 x 1 = 307200 bytes = 300 Kbytes de memória

Para uma imagem binária de 640 x 480 são necessários: 640 x 480 x 1/8 = 38400 bytes = 37,5 Kbytes de memória

(84)

Agenda

(M1)

Percepção

Visual

(M1)

Fund.

Proc.

Imagem

(M3 e M4)

Aquisição

Amostragem

(M1)

Armazenar

(M1)

Razão de

(M1)

Relação entre

(85)

RAZÃO DE ASPECTO

(86)

RAZÃO DE ASPECTO

(87)

Câmera Fotográfica Digital

Mega-Pixel

b

a

(88)

Câmera Fotográfica Digital

3.0 Mega-Pixel = 3 x 1024 x 1024 pixel

3.145.728 pixels

1536 2048 2048 x 1536 = 3.145.728 2048 / 1536 = 1,33333 4 / 3 = 1,33333 K M

(89)

Monitor de Vídeo

3.0 Mega-Pixel ou 4.0 Mega-Pixel?

Dot Pitch ou tamanho do pixel

(90)

Scanner ou Digitalizadores

Resolução em DPI (Dot per Inch)

Tamanho do pixel (abertura)

polegadas

Exemplo: 600 DPI

600 pontos (pixel) --- 1 pol (2,54 cm)

1 ponto (pixel) --- X

(91)

Agenda

(M1)

Percepção

Visual

(M1)

Fund.

Proc.

Imagem

(M3 e M4)

Aquisição

Amostragem

(M1)

Armazenar

(M1)

Razão de

Aspecto

(M1)

Relação entre

Pixels

(92)

(93)

93

Relações Básicas entre Pixels.

Imagem ==> f(x,y)

Pixel ==> p,q,r,...

Sub-conjunto de Pixels ==> S

Adjacência entre Pixels:

Um par de Pixels de uma Imagem que compartilham uma borda é dito “adjacente por borda” _ou_4-adjacente_.

Um par de Pixels de uma Imagem que compartilham um vértice é dito “adjacente por vértice” _ou_8-adjacente_.

(94)

Vizinhança de um Pixel.

Um Pixel p na coordenada (x,y) tem a seguinte vizinhança na vertical e na horizontal, chamada de N₄(p)

y x (x-1,y) (x,y+1) (x+1,y) (x,y) (x,y-1)

A Vizinhança-4 de um Pixel p é um sub-conjunto de Pixels que são 4-adjacentes a ele mais o Pixel em si.

(95)

95

Vizinhança de um Pixel.

A Vizinhança Diagonal de p é formada pelos quatro Pixels que compartilham somente um vértice com p.

y

x

(x-1,y-1) (x-1,y+1)

(x+1,y-1) (x+1,y+1)

(96)

Vizinhança de um Pixel.

A Vizinhança-8 de um Pixel p é um sub-conjunto

de 8 Pixels que são adjacentes por vértice (8-adjacentes) a ele, mais o Pixel em si.

y

(97)

97

Conectividade.

Conceito usado para estabelecer fronteiras de objetos e regiões em uma Imagem.

Dois Pixels são conectados se:

1. São adjacentes

2. Seus níveis de cinza satisfazem a um critério especificado de similaridade

Exemplo: Imagem com 2 níveis de cinza (0 e 1).

Dois píxels vizinhos de 4 são conectados se tiverem o mesmo valor.

(98)

Conectividade.

Seja V = { G₁, G₂, ...G_k } o conjunto de “k” valores de níveis de cinza usados para definir a conectividade.

Define-se:

a) Conectividade-4 : dois Pixels p e q com valores em V e

b) Conectividade-8 : dois Pixels p e q com valores em V e

(99)

99

Exemplo:

Seja V = {1,2} os valores que definem a conectividade.

0 1 1 0 2 0 0 0 1 0 1 1 0 2 0 0 0 1 0 1 1 0 2 0 0 0 1 Conectividade-4 Conectividade-8 Conectividade-m Pixel p

A conectividade-m elimina a dupla conexão ou o “caminho duplo” entre dois Píxels p e q.

(100)

Encadeamento Lógico.

q Uma sequência de Pixels ( p₁, p₂, ...p_n ) é uma sequência 4-conectada se p_i é 4-adjacente a p_i+1.

q Uma sequência é 8-conectada se p_i é 8-adjacente a p_i+1. Seja S um sub-conjunto não vazio de pixels de uma Imagem.

S é 4-conectado se:

1) Para quaisquer dois pixels a e b, existe uma sequência de pixels 4-conectada (p₁, p₂, p₃, ...p_n) em S tal que p₁ = a e p_n = b

2) S contém somente um pixel.

(101)

101

Exemplo:

Sequências 4-conectadas para V = {1}

(102)

Exemplo:

(103)

103

Métricas de Distâncias.

A distância entre dois pixels em uma imagem é uma medida fundamental para muitos algoritmos.

Dados os pixels

A função de distância D, obedece às seguintes propriedades: p de coordenadas (x₁,y₁)

q de coordenadas (x₂,y₂) t de coordenadas (x₃,y₃)

• Não Negatividade à D(p,q) ≥ 0 para todo p e q • Identidadeà D(p,q) = 0 somente se p=q

• Simetria à D(p,q) = D(q,p) para todo p e q

•Desigualdade Triangular à D(p,q) + D(q,t) ≥ D(p,t) para todo p, q e t

(104)

Métricas de Distâncias.

Para mosaicos quadrados,as métricas mais utilizadas para dois píxels p (x₁,y₁) e q (x₂,y₂) , são: Distância Euclidiana: 2 2 1 2 2 1

)

(

)

(

)

,

(

p

q

x

y

D

_e

=

-

+

-Distância City-Block (-Distância D₄):

|

)

,

(

p

q

x

₁

x

₂

y

₁

y

₂

D

_cb

=

-

+

-As distâncias D₄ e D₈ consideram apenas as

coordenadas dos píxels, independente da

existência de conectividade entre eles.

A D₄ é medida pelo caminho de 4 mais curto

(105)

105

Exemplos

p q y x p = (1,1) q = (4,3) Distância Euclidiana: 2 2 1 2 2 1

)

(

)

(

)

,

(

p

q

x

y

D

_e

=

-

+

-1 − 4 $₊ _{1 − 3} $ ₌ −3 $₊ ₋₂ $ ₌ 9+4 = 13 = 3,6

(106)

Exemplos

p q y x p = (1,1) q = (4,3)

Distância City-Block (Distância D₄):

|

)

,

(

p

q

x

₁

x

₂

y

₁

y

₂

D

_cb

=

-

+

-1 − 4 + -1 − 3 = −3 + −2 =

(107)

107

Exemplos

p q y x p = (1,1) q = (4,3)

|}

|

|,

max{|

)

,

(

p

q

x

₁

x

₂

y

₁

y

₂

D

_ch

=

-

-Distância Chessboard (-Distância D₈):

max{ 1 − 4 , 1 − 3 }= max{ −3 , −2 }=

max{ 3,2 }=

(108)

Bibliografia

Básica:

• Gonzalez, R.C.; Woods, R.E. Processamento Digital de Imagens. São Paulo: Pearson Prentice Hall, 3.ed, 2010.

• Gonzalez, R.C.; Woods, R.E. Digital Image Processing. Pearson Prentice Hall, 3rd. Edition, 2007.

Complementar:

• Petrou, M. Image Processing: the fundamentals, 2.ed. Chichester: Wiley, 2010.

• Parker, J. R. Algorithms for image processing and computer vision, 2.ed. Indianapolis: Wiley, 2010.

(109)

FIM

Data Science and Machine Learning

Análise e Processamento de Imagens

Prof. Dr. Diego Rafael Moraes

diegorafaelmoraes@gmail.com

https://sites.google.com/site/diegorafaelmoraes/downloads

Agradecimentos aos professores da USP de São Carlos: - Prof. Adilson Gonzaga (meu orientador de doutorado)

- Prof. Dr. Marcelo Andrade da Costa Vieira (professor em disciplinas) Primeiramente pelos ensinamentos (de grande valia na minha carreira), mas também por compartilharem e permitirem o usp dos materiais de aula (de altíssima qualidade)