Experimentos - Segmentação e reconhecimento de íris

3.3 EXPERIMENTOS

Os experimentos foram executados substituindo a etapa de aquisição da imagem pelo uso de imagens de íris provenientes da base de imagens CASIA v1.

As imagens foram inicialmente submetidas apenas a etapa de segmentação, seguida por uma análise visual, de modo a descartar imagens onde os parâmetros dos círculos da pupila ou da íris fossem discrepantes e considerados incorretos.

Para encontrar os parâmetros da íris, o intervalo de 90 a 150 pixels foi utilizado para montar o espaço tridimensional necessário ao cálculo da Transformada de Hough Circular. Para a pupila, o intervalo utilizado foi de 28 a 75 pixels. Com estes parâmetros, 719 imagens (de 756) foram avaliadas como corretamente segmentadas, algumas das quais podem ser observadas na Figura 3.5. Imagens consideradas incorretas são visualizadas na Figura 3.12.

A título de comparação, quando foi utilizada a estratégia originalmente proposta por Masek (sem as modificações sugeridas), apenas 664 imagens foram consideradas corretamente segmentadas. O resultado obtido após as modificações propostas mostram um aumento de 8,28% na quantidade de imagens que possuíram os parâmetros da pupila e da íris identificados corretamente.

Para cada imagem corretamente segmentada, um template e sua respectiva máscara de ruído foram criados, usando um filtro log-Gabor 2D. Em seguida, os templates foram comparados 2 a 2 através do cálculo da distância de Hamming, com ±8 deslocamentos. Os resultados dos cálculos das distâncias foram separados nos grupos de comparações intra e inter-classes, descritos anteriormente. A Tabela 3.1 mostra o número total de comparações inter e intra classes, obtidas a partir da combinação das imagens segmentadas corretamente.

Tabela 3.1: Quantidade de comparações intra e inter-classes. Base Imagens Intra-classe Inter-classe

3.3 EXPERIMENTOS 67

(a) (b)

(e) (f)

(g) (h)

Figura 3.12: Exemplos de imagens incorretamente segmentadas. As figuras (a, c, e, g) exibem imagens de olhos e as figuras (b, d, f, h) mostram o resultado da segmentação.

3.3 EXPERIMENTOS 68 Para estimar o desempenho do esquema de codificação e, assim, escolher a melhor combinação de parâmetros para o filtro log-Gabor 2D, foi utilizada a decidabilidade. A determinação da melhor combinação foi executada por partes. Primeiro foram selecionados alguns parâmetros base e, a partir deles, foram geradas múltiplas combinações. A Tabela 3.2 mostra os parâmetros base selecionados para a primeira investigação. As escolhas contemplam 3 valores para a frequência central, 4 valores para a largura de banda radial, 4 valores para a orientação e 2 valores para a largura de banda angular. A combinação de todos os parâmetros gera um total de 96 filtros diferentes. Os valores escolhidos para σr correspondem a uma largura de banda de uma, duas, pouco mais que duas e três oitavas. Eles foram selecionados para verificar a capacidade do filtro log-Gabor 2D em capturar informações por um amplo espectro de frequências.

Tabela 3.2: Valores base para a investigação sobre a melhor combinação de parâmetros para o filtro log-Gabor 2D.

Parâmetro Valores Base

Frequência central (ω0) [ 1/14; 1/18; 1/22 ] Largura de banda radial (σr) [ 0, 41; 0, 50; 0, 55; 0, 74 ]

Orientação (θ0) [ −π/4; 0; π/4; π/2 ]

Largura de Banda angular (σθ) [ π/4; π/2 ]

As Figuras 3.13, 3.14 e 3.15 apresentam gráficos da variação da decidabilidade, em função do ângulo de orientação para as 96 combinações dos filtros. Para facilitar a visualização, cada figura foi separada em duas imagens: (a) mostra os resultados para uma largura de banda angular σθ = π/2 e (b) para uma largura de banda angular

σθ =π/4.

Na Figura 3.13 são expostos os gráficos para os filtros com frequência central ω0 = 1/14. Note que as curvas, em cada imagem são agrupadas pela largura de banda radial σr. As Figuras 3.14 e 3.15 apresentam a mesma organização. Elas mostram os gráficos para filtros com frequência central ω0=1/18 e ω0=1/22, respectivamente.

A análise geral dos gráficos mostra que a melhor orientação encontrada para os filtros é θ0 = 0 radianos. Isso indica que as regiões do espectro de frequências que possuem orientação próximas a zero contêm informações mais discriminantes. Um outro ponto de destaque é que as combinações que utilizaram largura de banda radial de uma oitava (0,74) obtiveram, em sua maioria, resultados inferiores aos demais.

3.3 EXPERIMENTOS 69

−pi/4 0 pi/4 pi/2 5pi/8

3.5 4 4.5 5 5.5 Decidabilidade Orientação θ0, (radianos)

Comparação da Decidabilidade entre diferentes filtros (ω0 = 1/14 e σθ = π/2)

σr = 0.41 σr = 0.50 σr = 0.55 σr = 0.74

(a) Largura de banda angular (σr) = π/2.

−pi/4 0 pi/4 pi/2 5pi/8

3 3.5 4 4.5 5 5.5 Decidabilidade Orientação θ0, (radianos)

Comparação da Decidabilidade entre diferentes filtros (ω0 = 1/14 e σθ = π/4)

σr = 0.41 σr = 0.50 σr = 0.55 σr = 0.74

(b) Largura de banda angular (σr) = π/4.

Figura 3.13: Comparações entre filtros log-Gabor 2D com frequência central ω0= 1/14. As imagens apresentam curvas agrupadas de acordo com a largura de banda radial, variando o ângulo de orientação. As figuras (a) e (b) apresentam resultados agrupados para cada uma das possíveis escolhas de largura de banda angular.

3.3 EXPERIMENTOS 70

−pi/4 0 pi/4 pi/2 5pi/8

3 3.5 4 4.5 5 5.5 Decidabilidade Orientação θ0, (radianos)

Comparação da Decidabilidade entre diferentes filtros (ω0 = 1/18 e σθ = π/2)

σr = 0.41 σr = 0.50 σr = 0.55 σr = 0.74

(a) Largura de banda angular (σr) = π/2.

−pi/4 0 pi/4 pi/2 5pi/8

2.5 3 3.5 4 4.5 5 5.5 6 Decidabilidade Orientação θ0, (radianos)

Comparação da Decidabilidade entre diferentes filtros (ω0 = 1/18 e σθ = π/4)

σr = 0.41 σr = 0.50 σr = 0.55 σr = 0.74

(b) Largura de banda angular (σr) = π/4.

Figura 3.14: Comparações entre filtros log-Gabor 2D com frequência central ω0= 1/18. As imagens apresentam curvas agrupadas de acordo com a largura de banda radial, variando o ângulo de orientação. As figuras (a) e (b) apresentam resultados agrupados para cada uma das possíveis escolhas de largura de banda angular.

3.3 EXPERIMENTOS 71

−pi/4 0 pi/4 pi/2 5pi/8

2.5 3 3.5 4 4.5 5 5.5 Decidabilidade Orientação θ0, (radianos)

Comparação da Decidabilidade entre diferentes filtros (ω0 = 1/22 e σθ = π/2)

σr = 0.41 σr = 0.50 σr = 0.55 σr = 0.74

(a) Largura de banda angular (σr) = π/2.

−pi/4 0 pi/4 pi/2 5pi/8

2 2.5 3 3.5 4 4.5 5 5.5 6 6.5 Decidabilidade Orientação θ0, (radianos)

Comparação da Decidabilidade entre diferentes filtros (ω0 = 1/22 e σθ = π/4)

σr = 0.41 σr = 0.50 σr = 0.55 σr = 0.74

(b) Largura de banda angular (σr) = π/4.

Figura 3.15: Comparações entre filtros log-Gabor 2D com frequência central ω0= 1/22. As imagens apresentam curvas agrupadas de acordo com a largura de banda radial, variando o ângulo de orientação. As figuras (a) e (b) apresentam resultados agrupados para cada uma das possíveis escolhas de largura de banda angular.

3.3 EXPERIMENTOS 72 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8 4.6 4.8 5 5.2 5.4 5.6 5.8 6 6.2 6.4 Decidabilidade

Largura de Banda Radial

Comparação da Decidabilidade entre diferentes filtros Orientação (θ0) = 0 ω0 = 1/14, σθ = π/2 ω0 = 1/18, σθ = π/2 ω0 = 1/22, σθ = π/2 ω0 = 1/14, σθ = π/4 ω0 = 1/18, σθ = π/4 ω0 = 1/22, σθ = π/4

Figura 3.16: Comparações de decidabilidade em função da largura de banda radial, selecionando apenas os filtros com θ0=0.

As combinações que apresentaram os melhores resultados em relação à largura de banda radial foram aquelas que capturaram informações em duas e pouco mais que duas oitavas (0,55 e 0,50). Este resultado pode ser confirmado, observando a Figura 3.16, que mostra um gráfico da variação da decidabilidade em função da largura de banda radial. O gráfico foi construído utilizando apenas as combinações dos filtros que possuíam θ0=0, sendo agrupados pela frequência central e largura de banda radial. Através dele também é possível notar que σθ = π/4 é o melhor valor para a largura de banda angular.

Com a definição dos parâmetros θ0 = 0 e σθ = π/4 foi iniciada a segunda investigação. Ela consistiu na busca pelos melhores valores para a largura de banda radial e frequência central. Devido aos resultados ruins obtidos pelas combinações que usavam σr =0, 74, este valor foi descartado. Assim prosseguiu-se apenas com os valores 0,41, 0,50 e 0,55, para um intervalo de frequência variando entre 1/10 e 1/30. Trinta e três combinações de filtros foram novamente processadas. Os resultados dos cálculos aparecem na Figura 3.17. Ela mostra a variação da decidabilidade em função de mudanças na frequência central, agrupando as curvas pela largura de banda radial. Através dela é possível observar que os picos de cada curva ocorrem em locais muito

3.3 EXPERIMENTOS 73 1/10 1/12 1/14 1/16 1/18 1/20 1/22 1/24 1/26 1/28 1/30 4 4.2 4.4 4.6 4.8 5 5.2 5.4 5.6 5.8 6 Decidabilidade Frequência, ω0 σr = 0.41, θ0 = 0, σθ = π/4 σr = 0.50, θ0 = 0, σθ = π/4 σr = 0.55, θ0 = 0, σθ = π/4

Figura 3.17: Variação da decidabilidade em função da frequência central. O gráfico mostra a comparação para os três melhores resultados encontrados na Figura 3.16. próximos. De modo a ajudar a visualização, a Figura 3.18 apresenta uma ampliação desta região.

Os filtros que apresentaram a maior decidabilidade, para cada largura de banda, foram selecionados para realizar a avaliação de desempenho do sistema de reconhecimento de íris. Os valores de decidabilidade dos filtros selecionados, assim como seus respectivos parâmetros, são exibidos na Tabela 3.3.

Os três filtros são, então, comparados com o método de codificação proposto por Masek [48]: um filtro Log-Gabor 1D. Os valores ω0 =1/18 e σr =0, 50, usados para a construção deste filtro, representam a melhor combinação de parâmetros encontrada em sua pesquisa para a base CASIA v1. Nos testes realizados neste trabalho este filtro atingiu uma decidabilidade d0 =5, 5484.

A Tabela 3.4 mostra os valores de decidabilidade, média e desvio padrão das Tabela 3.3: Os três filtros candidatos e seus parâmetros.

Filtro (parâmetros) d0

Filtro 1 - ω0=1/24; σr =0, 41; θ0 =0; σθ =π/4 5,9866 Filtro 2 - ω0=1/24; σr =0, 50; θ0 =0; σθ =π/4 6,0012 Filtro 3 - ω0=1/22; σr =0, 55; θ0 =0; σθ =π/4 5,9677

3.3 EXPERIMENTOS 74 1/22 1/24 1/26 5.8 5.85 5.9 5.95 6 6.05 Decidabilidade Frequência, ω0 σr = 0.41, θ0 = 0, σθ = π/4 σr = 0.50, θ0 = 0, σθ = π/4 σr = 0.55, θ0 = 0, σθ = π/4

Figura 3.18: Ampliação da região da Figura 3.17 que contém os pontos com maior decidabilidade.

classes intra e inter para os quatro filtros selecionados. Os três filtros log-Gabor 2D apresentam resultados de médias e desvio padrão próximos. A maior separação entre médias ocorre no Filtro 2 e a menor, no filtro proposto por Masek. Entretanto, Masek possui o menor desvio padrão na classe inter, indicando que seus dados estão mais condensados que os gerados através do filtro log-Gabor 2D. Esta característica influencia os resultados das taxas de FAR e CAR.

De posse dos quatro filtros, a terceira etapa de investigação realiza a avaliação do desempenho de cada filtro em codificar os padrões de textura da íris. Esta avaliação foi realizada através da comparação da exatidão no reconhecimento, com o auxílio da curva ROC. Os valores desta curva são determinados pelo cálculo das taxas de Tabela 3.4: Valores de decidabilidade, média e desvio padrão das classes intra e inter, dos quatro filtros usados para avaliar o desempenho.

Filtro d0 µIntra σintra µInter σinter Masek 5,5484 0,2915 0,0433 0,4701 0,0140 Filtro 1 5,9866 0,2563 0,0412 0,4490 0,0194 Filtro 2 6,0012 0,2455 0,0433 0,4479 0,0200 Filtro 3 5,9677 0,2484 0,0443 0,4505 0,0182

3.3 EXPERIMENTOS 75 0 0.005 0.01 0.015 0.02 0.025 0.03 0.99 0.991 0.992 0.993 0.994 0.995 0.996 0.997 0.998 0.999 1

Taxa de Falsa Aceitação (FAR)

Taxa de Correta Aceitação (1 − FRR)

Masek Filtro 1 Filtro 2 Filtro 3

Melhor Operação − Masek Melhor Operação − Filtro 1 Melhor Operação − Filtro 2 Melhor Operação − Filtro 3

Figura 3.19: Comparação entre o desempenho dos esquemas de codificação através da curva ROC.

genuínos corretamente aceitos (CAR) e impostores incorretamente aceitos (FAR), para cada valor de limiar escolhido. A Figura 3.19 apresenta a curva ROC para os quatro filtros. Já a Figura 3.20 exibe a curva ROC, dos mesmos filtros, com o eixo FAR em escala logarítmica. Em ambas as figuras os melhores pontos de operação aparecem destacados. Eles foram determinados em função menor distância Euclidiana em relação ao ponto ideal (CAR = 1 e FAR = 0).

Através da análise das Figuras 3.19 e 3.20 é possível notar que o Filtro 2 e o proposto por Masek possuem melhor desempenho, pois suas curvas estão mais próximas do valor ideal. A Tabela 3.5 mostra mais detalhadamente a comparação entre os quatro filtros, destacando as taxas de usuários corretamente aceitos e impostores incorretamente aceitos, calculadas em seus melhores pontos de operação. O limiar usado para obter as taxas também é mostrado na Tabela 3.5, que apresenta em sua última coluna a EER.

Uma observação cuidadosa das taxas EER e FAR para o filtro proposto por Masek revela que o melhor ponto de operação do sistema é igual ao ponto onde ocorre a EER. Já para o Filtro 2 o ponto de operação é inferior ao ponto de EER. Os Filtros 1 e 3 apesar de possuírem a mesma CAR, diferem na FAR devido a menor separação entre as médias atingida pelo Filtro 1 (Tabela 3.4).

3.3 EXPERIMENTOS 76 10−4 10−3 10−2 0.98 0.982 0.984 0.986 0.988 0.99 0.992 0.994 0.996 0.998 1

Taxa de Falsa Aceitação (FAR)

Taxa de Correta Aceitação (1 − FRR)

Masek Filtro 1 Filtro 2 Filtro 3

Melhor Operação − Masek Melhor Operação − Filtro 1 Melhor Operação − Filtro 2 Melhor Operação − Filtro 3

Figura 3.20: Comparação entre o desempenho dos esquemas de codificação através da curva ROC. Note que o eixo FAR é mostrado em escala logarítmica.

Apesar de alguns filtros apresentarem uma decidabilidade superior a outros, este fato não garante que tais filtros tenham, necessariamente, uma melhor taxa de reconhecimento. Os Filtros 1 e 3 possuem decidabilidade maior que a do filtro proposto por Masek, mesmo assim, este possui a maior taxa de correta aceitação. Entretanto, para grande parte dos sistemas de segurança é mais importante ter uma taxa de falsa aceitação baixa em detrimento de uma taxa de correta aceitação alta, o que torna o Filtro 2 a melhor combinação para codificar os padrões da íris, neste trabalho.

Tabela 3.5: Taxas CAR, FAR e limiar dos pontos de operação destacados na Figura 3.19. A última coluna mostra a EER para cada filtro.

Filtro Limiar CAR (%) FAR(%) EER(%) Masek 0,425 99,6613 0,3964 0,3964 Filtro 1 0,395 99,4194 0,3167 0,5921 Filtro 2 0,385 99,5646 0,1261 0,3870 Filtro 3 0,385 99,4194 0,2296 0,5806

CAPÍTULO 4

NOVA PROPOSTA PARA SEGMENTAÇÃO DA

PUPILA

Em sistemas de reconhecimento de íris a segmentação é uma etapa crítica. Erros na identificação desta região corrompem os modelos biométricos e comprometem a qualidade das análises realizadas pelo sistema de decisão.

Devido à importância de encontrar sua localização ótima, vários algoritmos foram propostos1. Dentre eles, um grande número de técnicas tentam melhorar os resultados obtidos através do uso da Transformada de Hough, inicialmente sugerido por Wildes et al. [25], seja na taxa de acerto ou na redução do tempo de execução.

Alguns métodos de segmentação de íris usam uma abordagem diferente da empregada por Masek [48]. Eles primeiro determinam as bordas da região da pupila e, em seguida, as bordas da íris. Estes métodos são motivados por observações simples: a pupila apresenta-se como a região mais escura da imagem e possui grande homogeneidade, exceto nos casos onde ocorrem reflexões em seu interior. Devido a essas características, estratégias que tentam identificar a pupila primeiro tendem a ser mais eficazes.

A pupila é comumente parametrizada como um círculo, entretanto não é incomum encontrar estas regiões com formato levemente elíptico. Mesmo assim, modelar a pupila por círculos continua sendo uma boa aproximação. Levando em consideração essa parametrização, Daugman [17] desenvolveu o operador integro-diferencial e Wildes et al. [25] (além de outros pesquisadores como Masek [48], Liu [52], Pereira [12], entre outros) utilizam algoritmos baseados na detecção de bordas e Transformada de Hough Circular. Entretanto, esses métodos realizam uma busca exaustiva pelas bordas da íris em um extenso espaço de parâmetros, o que torna o processo demorado, apesar de esforços para reduzir seu custo computacional [51].

1_{De forma similar a sistemas de reconhecimento de íris, o problema de localização precisa dos olhos}

(ou de seus componentes) também é enfrentado em outras situações, como em aplicações para controle de interface através dos olhos. Grande parte das aplicações desta área possui um fim extremamente nobre: prover inclusão digital (e porque não dizer social) a deficientes físicos, especialmente os tetraplégicos. Outras aplicações buscam por novos métodos de interatividade.

4.1 CONTORNOS ATIVOS 78 Este capítulo descreve um novo modelo para realizar a segmentação da região da pupila: o PP–AC, descrito no artigo A Combined Pulling & Pushing and Active Contour for Pupil Segmentation foi aceito para publicação no ICASSP (IEEE International Conference on Acoustics, Speech and Signal Processing) [78]. O modelo é uma extensão ao método Pulling-Pushing (PP), proposto por He et al. [42]. O algoritmo do PP, descrito na Seção 2.2.3, encontra os parâmetros de regiões circulares através de um método iterativo, baseado na Lei de Hooke.

O capítulo é complementado com uma introdução a métodos de segmentação via contornos ativos e um novo algoritmo para preencher reflexões especulares que aparecem na pupila.

4.1 CONTORNOS ATIVOS

Métodos de Contornos Ativos são técnicas utilizadas para realizar a segmentação de objetos em imagens. A idéia básica é a evolução de uma curva, sujeita a restrições impostas pela imagem, para detectar objetos nesta imagem. Iniciando com um contorno arbitrário ao redor do objeto a ser detectado, a curva move-se em direção ao seu interior, tendo que parar nas bordas deste objeto [80]. Devido a esse comportamento dinâmico, os métodos de contorno ativo também são conhecidos como snakes ou modelos deformáveis. A evolução da curva é guiada pela minimização de uma função de energia, o que torna as snakes autônomas e auto-adaptáveis na busca pelo contorno dos objetos.

Os modelos de contorno ativo podem ser classificados em dois grupos: os modelos paramétricos e os geométricos. Eles se diferenciam pela forma como a curva é representada. Nos modelos paramétricos, o contorno C(s) possui representação explícita, sendo definido através da relação C(s) = [x(s), y(s)], em que x(s), y(s) são as coordenadas x e y de cada ponto ao longo do contorno e s ∈ [0, 1] é o comprimento do arco normalizado. Já nos modelos geométricos, a curva é representada implicitamente através de uma função de Lipschitz φ, por C = {(x, y)|φ(x, y) = 0}. Os métodos Level-Set são os mais empregados para representar

as curvas nos modelos geométricos [81].

As abordagens que usam métodos de contorno ativo através de modelos paramétricos encontram dificuldades em relação ao tratamento matemático e numérico, dificultando a construção de um esquema computacional eficiente. Além disso, a curva parametrizada não suporta mudanças de topologia, o que impossibilita a detecção de regiões não conectadas. Nos modelos geométricos, entretanto, a

4.1 CONTORNOS ATIVOS 79 mudança de topologia acontece de forma natural e, através do sinal da função φ, é possível determinar se um ponto qualquer pertence à região interior ou exterior à curva.

A energia das snakes pode ser definida através da equação:

Esnake(C(s)) =

ˆ 1 0

Eint(C(s)) +Eext(C(s))ds, (4.1) na qual C(s) representa o contorno. A energia interna Eint é totalmente definida pela curva e a energia externa Eext é obtida através da imagem. A correspondência do contorno às bordas do objeto ocorre quando Esnake atinge seu valor mínimo. A ferramenta matemática utilizada para buscar esta solução é o cálculo variacional [79]. Um terceiro termo, Econ, pode ser adicionado a equação de energia para impor restrições ao modelo, devido ao conhecimento prévio de sua forma. A equação 4.1 pode ser, assim, reescrita:

Esnake(C(s)) =

ˆ ₁ 0

Eint(C(s)) +Eext(C(s)) +Econ(C(s))ds. (4.2) No modelo clássico de snakes [79], um detector de bordas, que depende das informações do gradiente da imagem uo, é utilizado para guiar a evolução da curva ao contorno do objeto alvo/desejado. Sua funcional de energia é definida por:

Fclassic =α ˆ 1 0 C0(s) 2 ds+β ˆ 1 0 C00(s) ds−λ ˆ 1 0 |∇u0(C(s))|2ds, (4.3) em que α, β e λ são parâmetros positivos. Os dois primeiros termos representam a energia interna, que controla a suavidade da curva. Seus parâmetros correspondem a "tensão" e "rigidez" do contorno. O terceiro termo representa a energia externa, que atrai o contorno em direção ao objeto na imagem. Ao tentar minimizar a equação 4.3, o contorno tenta se posicionar nos pontos onde |∇u0| é máximo, agindo como um detector de bordas, enquanto mantém a suavidade da curva.

Um detector de borda genérico pode ser definido como uma função positiva e decrescente g, dependente do gradiente da imagem u0, tal que

lim

z→∞g(z) = 0. (4.4)

4.1 CONTORNOS ATIVOS 80

g(|∇u0(x, y)|) =

1+|∇Gσ(x, y) ∗u0(x, y)|

p, p≥1 (4.5)

em que Gσ∗u0, uma versão suavizada de u0, representa a convolução da imagem u0 por uma Gaussiana Gσ(x, y) = σ−1/2·e

−_|x2+y2|/4σ_{. A função g}_(|∇_u

0|) é positiva em regiões homogêneas e possui valor zero nas fronteiras.

Outros modelos, como o Contorno Ativo Geodésico [82] e o GVF (Gradient Vector Flow) [83], também utilizam informações de gradiente em suas funções de energia. Devido a esta característica, esses modelos apenas detectam objetos que possuam bordas definidas pelo gradiente. Na prática, entretanto, os objetos também possuem fronteiras suaves, onde o gradiente é baixo. Nestes casos, os métodos citados tendem a passar pelas bordas desses objetos.

De modo a superar esses problemas, Chan e Vese [80] desenvolveram um modelo de contorno ativo que não possui um critério de parada definido por informações de borda, ou seja, não é baseado no gradiente da imagem para finalizar a evolução da curva. Seu critério de parada é baseado na técnica de segmentação de Mumford- Shah [84] e permite a detecção de objetos com fronteiras suaves ou até com bordas descontínuas. Esse modelo é conhecido como Active Contour without Edges.

A idéia do modelo de Chan-Vese pode ser entendida a partir de um caso simples. Assuma que a imagem u0 é formada por duas regiões de intensidade aproximadamente constante mas com valores diferentes ui₀e uo₀. Também assuma que o objeto a ser detectado é representado pela região que possui valor ui₀e que sua borda é definida por C0. Assim, tem-se u0 ≈ui0dentro do objeto [ou interno(C0)] e u0 ≈u0o fora do objeto [ou externo(C0)]. Agora considere o seguinte termo de ajuste:

F1(C) +F2(C) = ˆ interno(C) |u0(x, y) −c1|2dxdy + ˆ externo(C) |u0(x, y) −c2|2dxdy, (4.6) na qual C representa uma curva e as constantes c1e c2são, respectivamente, os valores médios das regiões interna e externa a C. Neste caso, é fácil observar que C0, a real borda do objeto, é o minimizador de

inf

4.1 CONTORNOS ATIVOS 81

Figura 4.1: Consideração dos possíveis casos de posição da curva. O termo de ajuste é minimizado apenas nos casos onde a curva encontra-se sobre as bordas do objeto. Adaptado de [80].

Por exemplo, se a curva C está externa (mas englobando) o objeto, então F1(C) > 0 e F2(C) ≈ 0. Caso C esteja totalmente dentro do objeto, então, F1(C) ≈ 0 mas F2(C) > 0. Se C está, ao mesmo tempo, dentro e fora do objeto, então

F1(C) > 0 e F2(C) > 0. Finalmente, quando C = C0, a curva encontra-se exatamente

nas bordas do objeto e a equação 4.7 é minimizada. Este processo é ilustrado na Figura 4.1.

Adicionando o termo de regularização pelo comprimento, a funcional de Chan- Vese é, então, definida como

F(c1, c2, C) = ˆ interno(C) |u0(x, y) −c1|2dxdy (4.8) + ˆ externo(C) |u0(x, y) −c2|2dxdy+µ ˆ ₁ 0 C(s)ds, (4.9) na qual µ > 0 é um parâmetro que indica a importância do comprimento da curva para alcançar o estado de convergência. Detalhes sobre a formulação Level-Set para este modelo podem ser obtidas em [80].

Ao trocar os valores de c1 e c2, na equação 4.8, pelos valores mínimo e máximo das suas respectivas regiões, o contorno ativo dá preferência a encontrar regiões escuras e, ao mesmo tempo, tende a afastar-se de regiões mais claras. Esta versão modificada do modelo de Chan-Vese é conhecida por min & max – Active Contour without Edges [78]. Este modelo se adapta ao problema da determinação da fronteira pupila/íris. Entretanto, para funcionar bem, é necessário que a região da pupila

4.2 IDENTIFICAÇÃO E PREENCHIMENTO DE REFLEXÕES NA PUPILA 82

No documento Segmentação e reconhecimento de íris (páginas 82-98)