• Nenhum resultado encontrado

2.4 TÉCNICAS DE TRANSFORMAÇÃO E ANÁLISE DE IMAGENS

2.4.3 Segmentação

O processo de segmentação de uma imagem consiste em subdividir uma imagem em suas partes ou objetos constituintes. Segundo Gonzalez; Woods (2000), em sistemas que necessitem identificar veículos em uma estrada, que é o caso do presente trabalho, o primeiro passo é a segmentação da estrada na imagem, seguida da segmentação dos elementos que constituem a estrada em objetos, os quais tenham um tamanho pertencente a uma faixa de tamanhos correspondente a um veículo. Nesse sentido, não existe a necessidade de segmentar objetos ou componentes que se encontram fora da estrada.

Na implementação de algoritmos de segmentação de imagens em escala de cinza (monocromáticas), duas abordagens são realizadas: descontinuidade, onde as principais áreas de interesse são a detecção de pontos isolados, linhas e bordas na imagem; e similaridade, a qual baseia-se em limiarização, crescimento, divisão e fusão de regiões (GONZALEZ; WOODS, 2000).

Detecção de descontinuidades

O processo de segmentação por descontinuidade consiste em particionar a imagem através da detecção de mudanças bruscas nos níveis de cinza. Basicamente é realizada uma varredura na imagem através de máscaras, conforme descrito na seção 2.4.2. Com isso, é possível detectar os três tipos básicos de descontinuidades em imagens digitais: pontos, linhas e bordas.

Sendo assim, seja uma máscara genérica determinada conforme a Figura 17.

Figura 17 - Máscara 3 x 3 genérica.

Fonte: MARQUES FILHO; VIEIRA NETO, 1999.

A resposta da máscara em qualquer ponto é dada pela Equação 13 (GONZALEZ; WOODS, 2000, p. 296):

𝑅 = ∑ 𝑊𝑖𝑍𝑖 9

𝑖=1

na qual 𝑊𝑖 é o coeficiente da máscara e 𝑍𝑖 representa o nível de cinza do pixel. • Detecção de pontos

A detecção de um ponto em uma imagem resume-se à utilização de um operador de convolução (máscara), como por exemplo, a ilustrada na Figura 18. Observa-se que a máscara utilizada possui valor elevado na célula central e valores baixos nas outras células (GONZALEZ; WOODS, 2000; LIMA, 2009).

Figura 18 - Máscara para a detecção de pontos isolados.

Fonte: MARQUES FILHO; VIEIRA NETO, 1999.

Conforme Gonzalez; Woods (2000), partindo do princípio de que um ponto isolado possui nível de cinza completamente diferente do nível de cinza de seus vizinhos, um ponto é detectado na posição da máscara se a condição (Equação 14) for satisfeita:

| 𝑅 | > 𝑇 (14)

na qual 𝑇 representa um limiar não-negativo e 𝑅 é a resposta da máscara dada pela Equação 13.

Dessa forma, na imagem final, obtida após a aplicação da máscara, pixels brilhantes circundados por pixels mais escuros tornam-se mais destacados (MARQUES FILHO; VIEIRA NETO, 1999). Na Figura 19(a), nota-se uma porosidade no canto superior direito da imagem da lâmina da turbina, a qual, após a aplicação da técnica de detecção de ponto torna-se claramente visível (Figura 19(b)).

Figura 19 – (a) Radiografia de uma lâmina de turbina de um motor de jato. (b) Imagem obtida após aplicação da técnica de detecção de pontos (ponto ampliado).

Fonte: Modificado de GONZALEZ; WOODS, 2010.

Detecção de linhas

De forma semelhante à detecção de pontos, o processo de detectar linhas em uma imagem também consiste basicamente da aplicação de máscaras de convolução. Nesse caso são utilizadas quatro máscaras (Figura 20), as quais possibilitam detectar linhas nas posições horizontal e vertical e nas diagonais de +45º e -45º. (GONZALEZ; WOODS, 2000; LIMA, 2009; MARQUES FILHO; VIEIRA NETO, 1999).

Figura 20 - Máscara para detecção de linhas. (a) Horizontal (b) Vertical (c) +45º (d) -45º.

Fonte: Modificado de MARQUES FILHO; VIEIRA NETO, 1999.

Detecção de bordas

Diferentemente do processo de detecção de pontos e de linhas, que utilizam a operação direta de varredura de imagens através de máscaras, o processo de detecção de bordas baseia-se na computação de um operador local diferencial. Trata- se da abordagem mais comum na detecção de descontinuidades, visto que pontos e linhas isoladas não ocorrem frequentemente em aplicações práticas (GONZALEZ; WOODS, 2000).

Segundo definição, “uma borda é o limite entre duas regiões com propriedades relativamente distintas de nível de cinza” (GONZALEZ; WOODS, 2000,

pg. 297). Idealmente uma borda envolve a transição entres dois níveis de intensidade, que ocorrem a uma distância de 1 pixel, conforme Figura 21(a). Entretanto, na prática, o comportamento da transição entre níveis designa um perfil de rampa, como a demonstrada na Figura 21(b), onde o conjunto de pontos conectados constitui um segmento de borda.

Figura 21 - Modelos de borda. (a) Ideal (b) Real.

Fonte: GONZALEZ; WOODS, 2010.

Sendo assim, seja o modelo real (perfil de rampa), o cálculo da primeira e segunda derivadas tem como resultado os formatos ilustrados na Figura 22. Percorrendo o perfil de intensidade horizontal da esquerda para a direita, a primeira derivada é positiva durante o crescimento da rampa, e torna-se zero nas áreas de intensidade constante. Para a segunda derivada, tem-se que esta é positiva no início da rampa, negativa no final dela e zero nos demais pontos (GONZALEZ; WOODS, 2010).

Figura 22 - Borda real e representação de 1ª e 2ª derivadas.

Fonte: GONZALEZ; WOODS, 2010.

Com isso, através da magnitude da primeira derivada é possível detectar a presença de borda em um ponto de uma imagem, e o sinal da segunda derivada pode ser usado para detectar se um pixel se encontra no lado escuro ou claro de uma borda. Esses conceitos originam duas classes de operadores diferenciais: Diferenciador de

Primeira Ordem, e Diferenciador de Segunda Ordem (GONZALEZ; WOODS, 2010; MATIAS, 2007).

O Diferenciador de Primeira Ordem é definido como o Gradiente de uma imagem. Trata-se de um vetor que aponta na direção de mudança mais rápida (taxa de variação) de f (intensidade) na posição (x, y). Seus valores são calculados a partir da obtenção de derivadas parciais na posição de cada pixel (GONZALEZ; WOODS, 2010; MATIAS, 2007), conforme Equação (15):

∇𝑓 = 𝑔𝑟𝑎𝑑(𝑓) = [𝑔𝑥 𝑔𝑦] = [ 𝜕𝑓 𝜕𝑥 𝜕𝑓 𝜕𝑦 ] (15)

Em termos práticos a aproximação digital das derivadas parciais é realizada filtrando f (x,y) com máscaras. Dessa forma, utilizando a operação de convolução com máscaras é possível determinar o valor do gradiente. Em seguida “o valor do gradiente em cada pixel é comparado com um limiar (threshold) em tons de cinza. A borda surgirá se o gradiente da função no pixel de coordenadas (x, y) exceder este valor de limiar” (MATIAS, 2007, p. 17).

Entre as principais máscaras utilizadas nesse processo estão as definidas como operador de Roberts (Figura 23(a)) e operador de Prewitt (Figura 23(b)).

Figura 23 - Máscaras detectoras de borda. (a) Roberts; (b) Prewitt.

Fonte: Modificado de GONZALEZ; WOODS, 2010.

Com os valores de 𝑔𝑥 e 𝑔𝑦 calculados, aproxima-se o valor do gradiente com valores absolutos, conforme Equação 16 (GONZALEZ; WOODS, 2000, p. 299).

Um resultado da aplicação do operador de Prewitt pode ser visualizado na Figura 24(b). Pode-se notar que, com a aplicação do operador as bordas são realçadas, e tornam-se de certa forma claramente visíveis na imagem.

Figura 24 - (a) Imagem original monocromática; (b) Realce de bordas utilizando o operador de Prewitt horizontal e vertical.

Fonte: Modificado de MARQUES FILHO; VIEIRA NETO, 1999.

O Diferenciador de Segunda Ordem, conhecido como Laplaciano, utiliza da diferenciação espacial de segunda ordem para realçar as bordas de uma imagem. Assim como o Gradiente, o cômputo é realizado através de derivadas parciais em relação às coordenadas (x, y) da imagem (MATIAS, 2007). O Laplaciano de uma função bidimensional é definido pela Equação 17 (GONZALEZ; WOODS, 2000, p. 300). ∇2𝑓 = 𝜕 2𝑓 𝜕𝑥2+ 𝜕2𝑓 𝜕𝑦2 (17)

A aproximação digital, da mesma forma como a do Gradiente, é realizada através da filtragem da imagem através de uma máscara 3 x 3, conforme ilustrado na Figura 25(a). Também pode-se visualizar o resultado (c) da aplicação da mesma sobre a imagem (b).

Figura 25 - (a) Máscara utilizada no cômputo do Laplaciano; (b) Imagem original monocromática; (c) Imagem após filtragem por (a).

Fonte: Modificado de MARQUES FILHO; VIEIRA NETO, 1999.

Segmentação por similaridade

O processo de segmentação por similaridade baseia-se, assim como a detecção de descontinuidades discutida anteriormente, em uma propriedade básica dos valores de níveis de cinza de uma imagem. Nesse caso, levando em consideração a semelhança entre pixels, a abordagem é realizada através de processos de limiarização, divisão, fusão e crescimento de regiões. (GONZALEZ; WOODS, 2000).

O processo de Limiarização (Thresholding) consiste em dividir uma imagem diretamente em regiões com base nos valores de intensidade (níveis de cinza). Nesse sentido, seja o histograma (Figura 26), o qual representa a distribuição dos níveis de cinza em uma imagem 𝑓(𝑥, 𝑦), composta por objetos iluminados sobre um fundo escuro (GONZALEZ; WOODS, 2000).

Figura 26 - Histograma de níveis de cinza de uma imagem.

Fonte: GONZALEZ; WOODS, 2010.

Nota-se (Figura 26) que os pixels no Histograma se organizam basicamente em dois grupos dominantes (modos). Dessa forma, através da seleção de um limiar

(T) é possível separar esses dois grupos. Basicamente é realizada uma varredura na imagem, pixel por pixel, rotulando-se cada pixel como sendo do objeto ou do fundo, levando em consideração se o nível de cinza daquele pixel for maior ou menor/igual a T (GONZALEZ; WOODS, 2000; MATIAS, 2007).

Um aspecto importante a ser observado é que o valor de T influencia diretamente na qualidade da imagem limiarizada. Nesse sentido, deve ser escolhido um valor ótimo para T de forma que a imagem não sofra limiarização inadequada, o que impossibilitaria a correta realização em posterior tarefa de análise (MATIAS, 2007).

A Limiarização é definida pela Equação 18, na qual 𝑓(𝑥, 𝑦) representa a imagem original (entrada) e 𝑔(𝑥, 𝑦) representa a imagem transformada (saída) (GONZALEZ; WOODS, 2000, p. 316).

𝑔(𝑥, 𝑦) = {1, 𝑠𝑒 𝑓(𝑥, 𝑦) > 𝑇 0, 𝑠𝑒 𝑓(𝑥, 𝑦) ≤ 𝑇

(18)

Em termo práticos, os pixels correspondentes ao objeto são rotulados como 0, o que representa o limite superior da escala de cinza (branco), e os correspondentes ao fundo são rotulados como 1 – limite inferior da escala de cinza (preto), conforme ilustrado na Figura 27. Devido a isso, a técnica de Limiarização de imagens também é conhecida como Binarização. (GONZALEZ; WOODS, 2000; MATIAS, 2007; SANTOS, 2014).

Figura 27 - Exemplo de imagem binarizada.

Documentos relacionados