Pré-processamento - ETAPAS DO PROCESSAMENTO DIGITAL DE IMAGENS

DANOS DE FACHADAS

INSPEÇÃO VISUAL

4.3 ETAPAS DO PROCESSAMENTO DIGITAL DE IMAGENS

4.3.2 Pré-processamento

O pré-processamento tem o objetivo de tratar os dados brutos, transformando a radiometria da imagem, corrigindo as distorções geométricas, atenuando os efeitos da atmosfera ou removendo os ruídos. Dessa forma, a imagem obtida passa por técnicas de processamento digital com a

5_{Resolução espacial é número de píxeis que representam uma imagem.} 6_{Profundidade de píxel é o número de bits usado para representar cada píxel.}

127

finalidade de adequar a sua qualidade que pode ser afetada por ruídos ou pouca definição de detalhes ou, ainda, realçar detalhes com algum interesse específico. O pré-processamento prepara a imagem para as próximas etapas, eliminando por processos de filtragem os ruídos e realçando detalhes importantes para a detecção de objetos, dentre outros aspectos.

Solomon e Breckon (2013) explicam que as operações de realce são implementadas por processos de filtragem no domínio espacial, isto é, o processo ocorre diretamente sobre os píxeis das imagens, alterando seus valores. O processamento no domínio da frequência é outra forma de pré-processamento e age sobre o espectro da imagem (ESQUEF et al., 2003).

As técnicas de realce de imagens são aplicadas com a função de atribuir características que permitam ao usuário obter informações visuais com clareza, isto é, facilitar a interpretação humana e também do computador. No entanto, Solomon e Breckon (2013) explicam que a aplicação de realce é subjetiva, pois dependerá da informação que se deseja extrair da imagem e que essa informação a ser extraída já exista, para que possa ser acentuada ou restaurada.

Algumas das técnicas adotadas para tornar uma imagem adequada às necessidades do usuário são: alteração de brilho e contraste e filtragens para realçar características de interesse ou remoção de ruídos e outros problemas gerados na aquisição de imagens. A abordagem destes temas será apresentada no subitem 4.2 deste capítulo.

4.3.3 Segmentação

O processo de segmentação consiste em subdividir uma imagem em uma ou mais distintas regiões como partes independentes, ou seja, uma imagem é subdividida em regiões que satisfaçam um critério de uniformidade. De acordo com Solomon e Breckon (2013), a segmentação completamente autônoma é uma das etapas mais complexas do sistema de visão computacional e continua a ser um desafio no campo de pesquisa em processamento de imagens.

Gonzalez e Woods (2010) afirmam que a segmentação é uma das tarefas mais difíceis em processamento de imagens e está diretamente ligada ao êxito da obtenção de informações e análise de uma imagem.

128

Além de uma tarefa difícil, a segmentação é, muitas vezes, a primeira etapa que deve ser concluída antes de tarefas subsequentes, como: extração de características e classificação. Conforme Esquef e colaboradores (2003), a segmentação é um processo empírico que busca se adequar às características de cada imagem e às informações que se deseja extrair.

No campo do processamento digital de imagens, existem alguns métodos de segmentação baseados em princípios, citando-se: limiarização de histogramas ou binarização, textura e detecção de bordas. No entanto, as técnicas de segmentação utilizam duas abordagens principais: a similaridade entre os pixeis e a sua descontinuidade ou, de acordo com Solomon e Breckon (2013), métodos baseados em similaridade e contorno ou fronteira, respectivamente.

Esquef e colaboradores (2003) afirmam que a técnica de similaridade mais utilizada é a limiarização ou aplicação de limiar de intensidade, em que é utilizada quando as amplitudes de níveis de cinza são suficientes para caracterizar um objeto e a saída do sistema é uma imagem com dois níveis de luminância: branco e preto. A abordagem baseada no método de contorno procura determinar mudanças abruptas, isto é, grandes diferenças entre grupos de píxeis. A técnica de segmentação baseada em descontinuidades mais utilizadas é a detecção de bordas.

A limiarização na etapa de segmentação baseia-se na atribuição de valor (limiar) para a separação de píxeis na diferença dos níveis de cinza que compõem diferentes objetos de uma imagem. Assim, píxeis cujos valores excedam o limiar são alocados em uma determinada região e os píxeis que não excedem o limiar são reservados em outra região.

De acordo com Solomon e Breckon (2013), a aplicação de limiar cria uma imagem binária b(x, y) a partir de uma imagem de intensidade I(x, Y), pela lógica matemática apresentada a seguir:

' , = K_{0 N ; :9 9! 9! 9O:;9! P L9;3! 3 > ,}1 !3 L , > Em que T é o valor de limiar.

A forma mais comum de se atribuir valores à variável T é por meio de valor estatístico e quando a limiarização é aplicada a partir de dois limiares máximos e mínimos a técnica é denominada limiarização com histerese (em inglês, hysteresis thresholding) (JEONG et al., 2006). Se a

129

intensidade de um píxel é maior que o limiar máximo, este é considerado como pertencente à borda. Se a intensidade do píxel é menor que o limiar mínimo, não é considerado como pertencente à borda. Se a intensidade estiver entre o limiar mínimo e máximo, este píxel será considerado não pertencente à borda também, a menos que esteja ligado a respostas fortes, ou seja, píxeis com intensidades maiores que o limiar máximo. Posteriormente, é obtida uma imagem binária com bordas e não bordas.

Em pesquisa desenvolvida por Vale e Dal Poz (2002), para o processo de detecção de bordas foi aplicado o operador Canny, limiares mínimos e máximos, valores fixos, de 30% e 80%. Os desvios padrão da Gaussiana usados para a suavização da imagem foram σ = 1 e σ = 3. A Figura 64 apresentam os resultados para a imagem real usada neste trabalho.

Figura 64 – Imagem inicial: (a) Resultado obtido com σ = 1; (b) Resultado obtido com σ = 3

(a) (b) (c)

Fonte: Vale e Dal Poz. (2002).

Os autores comentam que quanto maior o desvio padrão (σ), menor foram as quantidades de bordas espúrias. Foi concluído que o processo de detecção de bordas Canny permitiu a obtenção de informações de contorno com alta qualidade e riqueza de detalhes, mesmo para imagens com baixo contraste e que este operador pode auxiliar qualquer processo de extração de feições em imagens digitais.

O método de detecção de bordas Canny é tido como completo, porque se baseia em três princípios:

• baixa taxa de erro: todas as bordas devem ser encontradas e não haver respostas espúrias, ou seja, não deve existir resposta onde não existam bordas;

130

• os pontos de borda devem estar bem localizados, isto é, a distância entre um ponto marcado como borda e píxeis da borda real devem ser mínima;

• deve haver somente uma resposta a uma borda (GONZALEZ; WOOD, 2010, SOLOMON; BRECKON, 2013).

A Figura 65 (a) ilustra uma imagem obtida por microscópio ótico de uma amostra de pellet feed e a Figura 65 (b) o resultado após a etapa de segmentação, em que foram separados somente os píxeis de interesse (LESSA et al., 2007).

Figura 65 - Segmentação de uma amostra de peller feed: (a) Imagem de pelled feed adquirida ao microscópio ótico (500x); (b) Imagem binária da fase hematita

(a) (b)

Fonte: Lessa e colaboradores (2007).

O processo de segmentação pode ser realizado também no espaço de cores HSV (Hue, Saturation e Value – matiz, saturação e valor ou brilho), também muito conhecido por HSI (Hue, Saturation e Intensity - matiz, saturação e intensidade). Porém, de acordo com Gonzalez e Woods (2010), a segmentação, geralmente, tem apresentado os melhores resultados quando realizada sobre os vetores de cores RGB, pois é um método direto, apesar de ser mais intuitivo trabalhar no espaço HSV.

Entretanto, segundo Solomon e Breckon (2013), o espaço de cores HSV é muito utilizado na etapa de segmentação com base na cor pelo processo de decomposição de cores, em que parte do matiz de uma cor é isolada em função da faixa de cores de interesse, permitindo que objetos neste espaço de cor sejam identificados.

Alguns operadores podem ser utilizados para a detecção de bordas, que é um método para de segmentar uma imagem em regiões, baseando-se nas descontinuidades, como as mudanças

131

abruptas do nível de cinza. Esta técnica, detecção de bordas, é dividida em detecção de bordas de primeira ordem e de segunda ordem, baseadas nas derivadas de primeira e segunda ordem, respectivamente. Roberts, Prewitt e Sobel são os operadores mais comuns de primeira ordem. O operador Sobel possui a vantagem por suavizar a região de bordas e reduzir a chance de que o resultado seja dominado por ruídos ou píxeis isolados (SOLOMON; BRECKON, 2013). Este operador utiliza-se de duas matrizes 3 x 3 e passam por convolução com a imagem original para

calcular aproximações das derivadas em relação a x e y. A Figura 66 apresenta a máscara de

convolução do detector de bordas Sobel.

Figura 66 – (a) derivada em relação a x; (b) derivada em relação a y

(a) (b)

Fonte: próprio autor.

4.3.4 Pós-processamento

A etapa de pós-processamento visa melhorar o resultado obtido na segmentação, em que os defeitos e imperfeições podem ser corrigidos. Esquef e colaboradores (2003) explicam que esses problemas são corrigidos por meio de técnicas de morfologia matemática que aplicam uma sequência de filtros morfológicos e realizam uma análise quantitativa dos píxeis da imagem.

No documento METODOLOGIA PARA GERAÇÃO DE MAPAS DE DANOS DE FACHADAS A PARTIR DE FOTOGRAFIAS OBTIDAS POR VEÍCULO AÉREO NÃO TRIPULADO E PROCESSAMENTO DIGITAL DE IMAGENS CARLOS MARIANO MELO JÚNIOR (páginas 162-167)