Decomposição de Imagens Digitais em Cartoon e Textura Através de Uma
Equação de Difusão Não Linear
Wallace Correa de Oliveira Casaca
DCCE-IBILCE-UNESP
Rua Cristóvão Colombo, 2265
15054-000 - São José do Rio Preto - SP
wallace.coc@gmail.com
Maurílio Boaventura
DCCE-IBILCE-UNESP
Rua Cristóvão Colombo, 2265
15054-000 - São José do Rio Preto - SP
maurilio@ibilce.unesp.br
Resumo
Um tópico bastante importante área de processamento de imagens é a extração de características. Aplicações como extração de contornos, texturas e ruídos, por exem-plo, compõem uma gama de problemas analisados intensa-mente nos últimos anos. Neste contexto, recenteintensa-mente uma nova concepção foi introduzida na área de análise de im-agens: extrair de uma imagem f dois componentes u e v, tal que f = u + v, onde u representa o termo homogêneo da imagem (estrutura) e v o componente oscilatório, o qual consiste de textura e/ou ruído. Neste sentido, o presente tra-balho tem por finalidade apresentar um modelo matemático para efetuar tal decomposiçao. Para a caracterização deste modelo, utilizou-se uma modelagem matemática fundamen-tada na EDP não linear apresenfundamen-tada em [1], da qual é possível obter um método numérico para extrair de uma i-magem os componentes caracterizados como textura (e/ou ruído) e estrutura.
1. Introdução
Nos últimos anos houve um aumento significativo no desenvolvimento de novas técnicas e aplicações em áreas relacionadas à computação gráfica e processamento de i-magens. Em particular, nesta última linha de pesquisa, as equações diferenciais parciais (EDP) vem sendo utilizadas com grande sucesso na modelagem de problemas diversos, em especial em problemas da área de retoque digital ("in-painting"), remoção de ruídos e principalmente da extração de características.
No tópico extração de características, uma nova con-cepção foi introduzida recentemente, ou seja, a caracterís-tica de extrair de uma dada imagem f dois componentes u e v, de forma que f = u+v, onde u representa a estrutura da imagem ("cartoon") e v o termo oscilatório, o qual consiste
de textura e/ou ruído. Este problema foi tratado por Meyer [8] e aperfeiçoado nesses últimos anos principalmente por Yin [4]-[5], Goldfarb [4]-[5], Osher [4]-[5]-[9]-[10] e Vese [3]-[9], os quais buscaram formulações matemáticas diver-sas para solucionar o problema, tais como minimização de funcionais por métodos variacionais, SCOPs com solução por métodos de pontos interiores, entre outras abordagens.
Baseado nos artigos [1], [2], [3], [4], [8], [9] e [10], o objetivo deste trabalho é apresentar um modelo matemático para o problema de decomposição de imagens. O método aqui proposto está diretamente relacionado à EDP não line-ar (5).
2. Decomposição de Imagens Digitais
2.1. Conceitos Fundamentais
A decomposição de uma imagem f pode ser definida como uma separação desta em duas outras novas imagens, u e v, as quais são combinadas de alguma forma resultam em f .
O objetivo principal deste trabalho é decompor f em ter-mos de duas imagens componentes, u e v, de modo que f = u + v. Estes conceitos podem, então, ser traduzidos através de formulações matemáticas.
Seja−→f : D ⊂ R2 → Rk uma imagem monocromática (k = 1) ou colorida (k = 3), que associa a cada pixel da i-magem de posição (x, y) um valor real (k = 1) ou uma terna real (k = 3). O objetivo é extrair de uma imagem f (x, y) dois componentes u(x, y) e v(x, y), tal que
f (x, y) = u(x, y) + v(x, y), (1) onde u(x, y) modela os objetos da imagem (o "car-toon" e/ou a parte homogênea) e v(x, y) o componente que caracteriza a textura e/ou o ruído.
Aplicações envolvendo este processo de separação po-dem ser encontradas nas áreas de eliminação de ruídos,
seg-mentação de imagens, síntese de texturas, retoque digital, entre outras. A figura 1, exemplifica a decomposição pre-tendica.
(a) Imagem original (f )
(b) "Cartoon"(u)
(c) Textura (v)
Figura 1. Exemplo de Decomposição.
Na maioria dos casos, os termos u e v são modelados em espaços de Banach previamente definidos. Por exemplo, o componente u é geralmente modelado através da análise do espaço BV de funções de variação limitada enquanto que v é matematicamente caracterizado pelo espaço de funções generalizadas G. O objetivo deste trabalho é tratar o compo-nente u como solução de uma EDP não linear e em seguida, mediante ao termo u, gerar o componente v. Neste sen-tido, foi adotada uma modelagem matemática baseada na equação de difusão anisotrópica apresentada em [1], pro-posta inicialmente para eliminar ruídos em imagens digi-tais.
2.2. Modelos de Decomposição Cartoon-Textura
Nas subseções precedentes são apresentados dois mode-los clássicos de decomposição de imagens do tipo "cartoon-textura: o modelo de Meyer [8] e o modelo Vese-Osher [9], cujas formulações matemáticas se baseiam na minimização de variações.
2.2.1. O Modelo de Meyer O modelo proposto por Meyer [8] parte da premissa de que u ∈ BV (espaço de vari-ação limitada) e v ∈ G (espaço de funções generalizadas). Sua formulação teórica (nas versões Lagrangiana e Limi-tada) pode ser descrita por:
inf (u,v) ∈ BV ×G ½Z R2 |∇u| + λ||v||G, f = u + v ¾ (2) inf (u,v) ∈ BV ×G ½Z R2 |∇u| + ||v||G≤ η, , f = u + v ¾ (3) onde G denota o espaço de Banach constituído de todas as funções generalizadas v = v(x, y) definidas no R2 que
podem ser escritas por v = div(−→g ), −→g = (g1, g2) ∈
L∞(R2, R2), com a norma: inf − →g ∈L∞ ½¯¯ ¯ ¯ ¯ ¯ ¯ ¯ q g2 1+ g22 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ L∞ , v = div(−→g ) ¾ . Neste caso, os problemas (2) e (3) são equivalentes. A idéia de Meyer foi procurar um espaço de funções mais apropriado para a modelagem do termo oscilatório v, de modo a obter a decomposição f = u + v.
Para o algoritmo numérico deste modelo, foi adotado a implementação numérica descrita em [4].
2.2.2. O Modelo de Vese-Osher Os autores Vese e Os-her [9] propuseram o primeiro algoritmo de decomposição cartoon-textura prático baseado no modelo (2) de Meyer [8]. Para tal implementação, o modelo proposto foi: EV O= Z Ω |∇u|+λ||f −(u+div(−→g ))||2 L2+µ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ q g2 1+ g22 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ Lp inf (u,−→g ) ∈BV (Ω)×Lp(Ω,R2){EV O, f = u + v} , (4)
onde L2= L2(Ω), Lp= Lp(Ω), e λ, µ > 0 são parâmetros e Ω ∈ R2é um aberto limitado.
Este modelo difere no segundo e terceiro termo em re-lação a (2). O segundo termo é um termo forçante, o qual objetiva manter f ≈ u + v = u + div(−→g ) enquanto que o terceiro é uma aproximação da energia de v no modelo (2). Para a confecção do algoritmo numérico relativo à (4), foi adotada a implementação numérica descrita em [4].
3. EDP não linear proposto em [1]
Para a modelagem do problema de decomposição, como já foi dito anteriormente, foi considerado o modelo de re-moção de ruídos e segmentação de imagens proposto em [1]-[2], o qual havia sido projetado inicialmente para restau-rar imagens com ruído.
Os autores propuseram um modelo de remoção de ruí-dos seletivo, que efetua uma suavização mais completa nas regiões homogêneas da imagem, e superficial sobre as bor-das da mesma, preservando, desta forma, a estrutura origi-nal da imagem. O modelo proposto foi:
∂w ∂t = g|∇w|div µ ∇w |∇w| ¶ − λ(1 − g)(w − I), (5) onde w(x, y, 0) = I(x, y) é a imagem inicial adicionada de ruído e g é uma função monótona que depende da con-volução de uma função gaussiana com o termo w.
Através do estudo da equação (5), foi possível adequá-la ao problema de decomposição de imagens, em particuadequá-lar para a obtenção do componente homogêneo u. A equação obtida foi: ∂u ∂t = g|∇u|div µ ∇u |∇u| ¶ − (1 − g)(u − f ), (6) com u(x, y, 0) = f (x, y) representando a imagem ini-cial a ser decomposta e g sendo uma função tal que g = g(|∇(Gσ∗ u)|).
Na modelagem, aqui proposta, adotou-se g conforme a expressão a seguir: g = g(|∇(Gσ∗ u)|) = 1 1 + k|∇(Gσ∗ u)|2, Gσ= Gσ(x, y, t) = 1 2σπte −(x 2+ y2) 2σt ,
onde σ é um parâmetro ajustável de acordo com a imagem inicial.
As condições de contorno para este modelo são do tipo Neumann, isto é, ∂u
∂−→n = 0, onde −
→n é o vetor normal ao contorno da região de definição da imagem f .
Este modelo, o qual segue uma corrente teórica baseada em equações de difusão originadas a partir do modelo de Malik e Perona [7], consiste em aplicar seletivamente o processo de difusão descrito por (6), suavizando de forma mais incisiva regiões mais homogêneas e fazendo com que o termo forçante (u − f ) atue de forma mais in-tensa nas regiões caracterizadas como de contorno, e assim, preservando-as.
3.1. Descrição do Algoritmo Proposto
O algoritmo aqui proposto consiste inicialmente em gerar o componente estrutural u e posteriormente a tex-tura v. As etapas do algoritmo são tais que:
• 1 - Sintetização do componente u: utiliza-se um al-goritmo numérico baseado na EDP não linear (6), visando estimar uma solução numérica da mesma. • 2 - Sintetização do componente v: utiliza-se
opera-ções algébricas simples, baseado na subtração do com-ponente u da imagem inicial f , isto é,
v(x, y) = f (x, y) − k u(x, y) + c, (7) onde k é o peso e c é uma constante.
No passo 1 a idéia é construir uma seqüência de ima-gens digitais u(i, j, t) : D × N → Rk, k ∈ {1, 3}, tal que u(i, j, 0) = f (i, j) e limt→∞u(x, y, t) = u, onde u é a im-agem obtida após o fim do processo iterativo, a qual repre-senta o componente homogêneo da imagem f .
Assim, o processo iterativo descrito anteriormente pode ser represetado pela seguinte equação evolucionária:
u(i, j, t∆ + t) = u(i, j, t) + ∆t∂u(x, y, t)
∂t , (8)
onde o fator ∂u(x, y.t)
∂t é substituído pela equação (6) em sua versão discreta, juntamente com o respectivo passo tem-poral ∆t.
No caso do passo 2, efetua-se v = f − ku + c, obtendo o componente oscilatório que representa a textura e/ou ruído. Em geral, toma-se k = 1 e c = 0, o que implica na de-composição exata de f em dois componentes: a estrutura e a textura, isto é, f = u + v.
4. Resultados Experimentais
A fim de avaliar o modelo proposto, são mostrados os resultados obtidos através de dois experimentos, nos quais foram empregados tanto o método proposto quanto os mo-delos descritos anteriormente.
No primeiro experimento foi considerada uma amostra da fotografia da "Barbara", de dimensões 256×256, mostra-dos nas figuras 2, 3 e 4. Em seguida, foram realizamostra-dos testes com uma imagem de impressão digital mostrados nas fig-uras 5, 6 e 7, com dimensões de 117 × 117 pixels.
Para a implementação numérica dos modelos (3) e (4) foi adotada a formulação discreta apresentada em [4]. No modelo (4), tomou-se λ = 0 e p = 1. No caso do mode-lo proposto (6)-(8), foram utilizados os modemode-los numéricos tal como relatados na sessão anterior.
No modelo de Meyer (3) foi adotado para as exemplos 1 e 2, η = 35 e 15, respectivamente, enquanto que para o
Figura 2. Imagem experimental (Barbara).
(b) Modelo de Meyer
(c) Modelo de Vese-Osher
(c) Modelo proposto
Figura 3. Cartoons.
modelo de Vese-Osher (4), foram tomados µ = 0.1 e 0.5. Para o modelo proposto foram utilizados σ = 25 e σ = 40,
(a) Modelo de Meyer
(b) Modelo de Vese-Osher
(c) Modelo Proposto
Figura 4. Textura.
Figura 5. Imagem experimental (Impressão Digital).
(a) Modelo de Meyer (b) Modelo de Vese-Osher (c) Modelo Proposto Figura 6. Cartoons. respectivamente.
5. Conclusão
Através dos resultados experimentais obtidos, concluí-se que o modelo apreconcluí-sentado forneceu resultados extrema-mente satisfatórios em relação aos modelos clássicos da lit-eratura, como pode ser visto nos experimentos mostrados.
Uma vantagem em utilizar equações diferenciais na modelagem de problemas de extração de texturas e estru-turas é o fato de se poder contar com uma extensa variedade de resultados analíticos e numéricos.
Em termos da implementação numérica, o método numérico iterativo que retorna o componente
estru-(a) Modelo de Meyer
(b) Modelo de Vese-Osher
(c) Modelo Proposto
Figura 7. Textura.
tural u da imagem é bastante robusto, na seqüência é então obtida a componente restante v (textura e/ou ruído) em ter-mos da imagem f inicial.
5.1. Agradecimentos
Os autores agradecem à FAPESP pelo suporte financeiro.
Referências
[1] BARCELOS, C.A.Z, BOAVENTURA, M., SILVA, JR, A Well
Balanced Flow Equation for Noise Remove and Edge Detec-tion, IEEE Transactions on Image Processing, pp. 751-763,
[2] BARCELOS, C.A.Z, BOAVENTURA, M., SILVA, JR, Edge
detection and noise removal by use of a partial differential equation with automatic selection of parameters,
Computa-tional and Applied Mathematics, Brazil, vol. 24, n. 1, pp. 131-150, 2005.
[3] GARNETT, J.B., MEYER, Y., TRIET, M.L.ANDVESE, L.,
Image decompositions using bounded variation and gener-alized homogeneous Besov spaces, International Journal of
Computer Vision 68, pp. 110-125, 2007.
[4] GOLDFARB D., YIN, W. AND OSHER S., A Comparison
of Three Total Variation Based Texture Extraction Models,
IEEE TSP, pp. 913-938, 2007.
[5] YIN, W., GOLDFARB, D.ANDOSHERS., Image
cartoon-texture decomposition and feature selection using the total variation regularized L1functional, Variational, Geometric, and Level Set Methods in Computer Vision, vol. 3752, L.N. in Comp. Science, Springer, pp. 73-84, 2005.
[6] LIEU, L., Contribution to problems in image restoration,
de-composition, and segmentation by variational methods and partial diferential equations, Ph.D. thesis, UCLA, 2006.
[7] MALIK, J., PERONA, P., Scale-space and edge detection
us-ing anisotropic diffusion, IEEE Transactions Pattern
Analy-sis and Machine Intelligence, vol 12, no. 7, pp. 629-639, 1990.
[8] MEYER, Y., Oscillating patterns in image processing and
nonlinear evolution equations, Vol. 22 of University Lecture
Series, AMS, 2002.
[9] OSHER, S. AND VESE, L., Modeling textures with total
variation minimization and oscillating patterns in image processing, IJournal of Scienti´rc Computing 19, pp. 553-572,
2003.
[10] RUDIN, L., OSHER, S., FATEMI, E., Nonlinear Total
Vari-ation Based Noise Removal Algorithms, Physica D 60,
pp.259-268, 1992.
[11] TEIXEIRA, R., Introdução aos Espaços de Escala, 23ž Colóquio Brasileiro de Matemática, IMPA, Rio de Janeiro, 2001.