Caracterização de impressões faciais termais utilizando a transformada imagem floresta

(1)

UNIVESIDADE ESTADUAL PAULISTA

J´

ulio de Mesquita Filho

P´

os-Gradua¸

c˜

ao em Ciˆ

encia da Computa¸

c˜

ao

Daniel Osaku

Caracteriza¸

c˜

ao de impress˜

oes faciais termais utilizando a

Transformada Imagem Floresta

UNESP

(2)

Daniel Osaku

Caracteriza¸

c˜

ao de impress˜

oes faciais termais

utilizando a Transformada Imagem Floresta

Jo˜ao Paulo Papa (Orientador)

Aparecido Nilceu Marana (Co-orientador)

Disserta¸cão de Mestrado elaborada junto ao Programa de Pós-Gradua¸cão em Ciência da Computa¸cão - Área de Concentra¸cão em Sis-temas de Computa¸cão como parte dos requi-sitos para a obten¸cão do t´ıtulo de Mestre em Ciência da Computa¸cão.

UNESP

(3)

(4)

DANIEL OSAKU

Caracterização de impressões faciais termais utilizando a Transformada Imagem Floresta

Dissertação apresentada para obtenção do título de Mestre em Ciência da Computação, área de Sistemas de Computação junto ao Programa de Pós-Graduação em Ciência da Computação do Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Campus de São José do Rio Preto.

BANCA EXAMINADORA

Prof. Dr. João Paulo Papa Professor Doutor

UNESP – BAURU Orientador

Prof. Dr. Antonio Carlos Sementille Professor Doutor

UNESP - BAURU

Prof. Dr. Alexandre Luís Magalhães Levada Professor Doutor

UFSCAR - Universidade Federal de São Carlos

(5)

Agradecimentos

Agradecemos ao Departamento de Computa¸cão, o Programa de pós-gradua¸cão, à UNESP e à FAPESP pelo apoio técnico e finaneiro, na qual permitiu a realiza¸cão deste projeto, contribuindo para a qualidade do trabalho e dos resultados. Também gostaria de agradecer o grupo de estudo RECOGNA, o qual ajudou no desenvolvimento e na forma¸cão de ideias que poderiam contribuir com o projeto.

Ao meu pai Antonio Osaku (in memoriam), a quem devo toda a minha vida pelo seu exemplo de integridade, bondade e dedica¸c˜ao `a fam´ılia.

`

A minha namorada Luana, a quem sempre me deu apoio, paz nos momentos de reflexão e pela paciência.

(6)

Sum´

ario

Agradecimentos iv

Resumo 1

1 Introdu¸c˜ao 2

2 Revisão Bibliográfica 9

2.1 Transformada Imagem Floresta . . . 9

2.1.1 Deﬁni¸c˜ao . . . 9

2.1.2 Algoritmo da IFT . . . 11

2.2 Classiﬁcadores baseados em Floresta de Caminhos ´Otimos . . . 13

2.2.1 Classifica¸cão não-supervisionada . . . 13

2.2.2 Classiﬁca¸c˜ao supervisionada . . . 18

3 Abordagem proposta 24 3.1 Pr´e-processamento . . . 25

3.2 Segmenta¸c˜ao da face . . . 26

3.2.1 Binariza¸c˜ao da imagem . . . 28

3.2.2 Filtragem morfol´ogica . . . 30

3.2.3 Localiza¸c˜ao da elipse . . . 31

3.2.4 Marcadores . . . 34

3.2.5 P´os-processamento . . . 35

3.3 Classifica¸cão das regiões isotérmicas . . . 37

3.4 Caracteriza¸cão das regiões isotérmicas . . . 39

3.5 Base de dados . . . 41

3.5.1 Sele¸c˜ao das imagens . . . 42

3.6 Extra¸c˜ao de Caracter´ısticas . . . 44

3.6.1 Saliˆencias do Contorno . . . 44

3.6.2 Extra¸c˜ao de Min´ucias . . . 46

(7)

4 Conclus˜ao e Trabalhos Futuros 50

5 Trabalhos aceitos para publica¸c˜ao 52

(8)

Lista de Tabelas

1.1 Propriedades biom´etricas do reconhecimento facial humano. . . 6

3.1 N´umero de descartes de acordo com o valor do limiar. . . 43

3.2 Tempo m´edio de execu¸c˜ao nas diferentes etapas do projeto. . . 44

3.3 Tempo médio de execu¸cão das diferentes abordagens na etapa de classifi-ca¸cão das regiões isotérmicas. . . 44

3.4 Acur´acia nas diferentes caracter´ısticas. . . 48

3.5 Taxa de acerto com altera¸c˜ao na etapa de pr´e-processamento. . . 48

3.6 Acur´acia nos diferentes n´umeros de classes. . . 49

(9)

Lista de Figuras

1.1 Caracter´ısticas biométricas utilizadas em sistemas biométricos. . . 3 1.2 Varia¸cão de ilumina¸cão com incidência de ilumina¸cão do sol à direita (acima)

e frontal (abaixo) da face nos espectros vis´ıvel (Visible), infravermelho pró-ximo (Short-wave infrared - SWIR), infravermelho médio (Medium-wave infrared - MWIR) e infravermelho distante (Long-wave infrared - LWIR). . 5 1.3 Imagem infravermelha de gêmeos. . . 6 1.4 Compara¸cão de imagens no espectro vis´ıvel e infravermelho com varia¸cões

de ilumina¸cão e expressão facial: (a) e (b) imagens de face no espectro vis´ıvel com diferentes condi¸cões de ilumina¸cão, (c) diferentes expressões faciais e (d), (e) e (f) são as imagens no espectro infravermelho correspon-dentes a (a), (b) e (c). . . 6

2.1 (a)-(c)Pixel central e seus 4-vizinhos, 8-vizinhos e uma rela¸c˜ao de adjacˆen-cia mais complexa, respectivamente. . . 10 2.2 (a) Um grafo de uma imagem 2D em tons de cinza com vizinhan¸ca 4. Os

números correspondem às intensidadesI(s) dos pixels e os pontos maiores denotam as três sementes. (b) Uma floresta de caminhos ótimos usando

fmax com d(s, t) = I(t). As setas em (b) apontam para o predecessor no caminho ótimo. . . 11 2.3 (a) Grafo cujos pesos dos nós são seus valores de fdp ρ(t). Existem dois

máximos com valores 3 e 5, respectivamente. Os pontos grandes indicam o conjunto de ra´ızes S. (b) Valores de caminho triviais f1(t) para cada amostra t. (c) Floresta de caminhos ótimos P para f1 e os valores de caminho finais V(t). O caminho ótimo P∗₍_t_{) (linha tracejada) pode ser}

obtido percorrendo os predecessoresP(t) at´e a raizR(t) para cada amostrat. 15 2.4 (a) Espa¸co de atributos com diferentes concentra¸c˜oes de amostras para cada

(10)

2.5 (a) Grafo completo ponderado nas arestas para um determinado conjunto de treinamento. (b) MST do grafo completo. (c) Protótipos escolhidos como sendo os elementos adjacentes de classes diferentes na MST (nós circulados). (d) Floresta de caminhos ótimos resultante para a fun¸cão de valor de caminho fmax e dois protótipos. Os identificadores (x, y) acima dos nós são, respectivamente, o custo e o rótulo dos mesmos. A seta indica o nó predecessor no caminho ótimo. (e) Uma amostra de teste (triângulo) da classe 2 e suas conexões (linhas pontilhadas) com os nós do conjunto de treinamento. (f) O caminho ótimo do protótipo mais fortemente conexo, seu rótulo 2 e o custo de classifica¸cão 0.4 são associados a amostra de teste. Note que, mesmo a mostra de teste estando mais próxima de um nó da classe 1, ela foi classificada como sendo da classe 2. . . 20

3.1 Imagem facial capturada no espectro infravermelho. . . 24 3.2 Etapas necessárias para a obten¸cão da impressão facial. . . 25 3.3 Imagem (a) original e (b) pré-processada após ajuste de brilho e contraste. 26 3.4 Segmenta¸cão por IFT-WT: (a) Imagem com marcadores internos (brancos)

e externos (pretos) (b) O complemento da imagem gradiente de (a) nós dá uma ideia do peso dos arcos. Os marcadores são selecionados ao redor das partes mais fracas do contorno (tons de cinza mais claros em b), com o intuito de evitar vazamentos do processo de segmenta¸cão. (c) Resultado da segmenta¸cão e (d-f) três imagens do processo de inunda¸cão da IFT-WT que resultam em (c). . . 27 3.5 Visão geral da etapa de segmenta¸cão. . . 28 3.6 Binariza¸cão da imagem: (a) Limiar fixo. Limiar variável utilizando o valor

obtido pelo método de Otsu em (b) e (c). (d) Limiar variável utilizando valor máximo entre o valor obtido pelo método de Otsu e o valor máximo da primeira linha da imagem. (e) Imagem (d) após a execu¸cão das opera¸cões de abertura e fechamento (Se¸cão 3.2.2). . . 29 3.7 Elementos estruturantes: (a) 4-conexo e (b) 8-conexo. . . 30 3.8 Imagem: (a) original e (b) o resultado da opera¸cão de erosão utilizando um

(11)

3.10 (a), (d) e (g) Imagens após a execu¸cão das etapas de binariza¸cão e aber-tura e fechamento descritas nas Se¸cões 3.2.1 e 3.2.2, respectivamente. (b) Localiza¸cão da elipse em (a) sem restri¸cões de busca e (c) com restri¸cão de tamanho máximo da elipse. (e) Localiza¸cão da elipse em (d) sem restri¸cão e (f) com restri¸cão de localiza¸cão espacial do centro da elipse. (h) Locali-za¸cão da elipse em (g) sem restri¸cão e (i) com restri¸cão de orienta¸cão da

elipse. . . 33

3.11 Exemplo de otimiza¸c˜ao feita utilizando a IFT-Euclideana: (a) Primeiro, (b) Segundo e (c) Terceiro passos. . . 34

3.12 Segmenta¸c˜ao da face. (a) Sem deslocamento dos marcadores internos. (b) Com deslocamento vertical dos marcadores internos. . . 35

3.13 Etapas da segmenta¸cão da face: imagem (a) original, (b) binarizada, (c) após a execu¸cão de opera¸cões de abertura e fechamento, (d) localiza¸cão da elipse, (e) marcadores internos e externos, (f) gradiente, (g) segmenta¸cão da face utilizando IFT-WT, (h) resultado da aplica¸cão da IFT-WT na imagem binarizada (c) com os marcadores da imagem (e), (i) fusão de (g) e (h), (j) execu¸cão de opera¸cões de abertura e fechamento na máscara binária (h), (k) imagem (a) equalizada e (l) imagem com a face extra´ıda. . . 36

3.14 Segmenta¸cão da face (a) sem pós-processamento e (b) com ajustes da etapa de pós-processamento. . . 37

3.15 (a) Imagem facial segmentada. Regiões isotérmicas classificadas de acordo com diferentes tonalidades de cinza (temperaturas) em (b) e (c), e suas respectivas caracteriza¸cões por esqueletoniza¸cão em (d) e (e). Fusão final dos diferentes esqueletos em (f). As imagens foram adaptadas de Akhloufi e Bendada [2]. . . 38

3.16 Classifica¸cão das regiões isotérmicas: (a) supersegmenta¸cão e (b) regiões isotérmicas classificadas de uma maneira mais coerente. . . 39

3.17 Elimina¸cão de pontos isolados: (a) imagem original e (b) imagem após a filtragem dos pontos isolados. . . 40

3.18 Imagens: (a) original, (b) com a face segmentada conforme descrito na Se¸cão 3.2, (c) classifica¸cão das regiões isotérmicas conforme apresentado na Se¸cão 3.3 e (d)-(f) esqueletos gerados com diferentes valores para o limiar de esqueletoniza¸cão. . . 41

3.19 Imagens do canal vis´ıvel e infravermelho da base de dados Notre Dame HumanID sob diferentes condi¸cões de ilumina¸cão e expressão facial. . . 42

3.20 Rela¸c˜ao entre o esqueleto e a saliˆencia. Extra´ıdo de [3]. . . 45

3.21 Rela¸cão de adjacência de umpixel P utilizada pelo método CN. . . 46

(12)

(13)

Resumo

(14)

Cap´ıtulo 1

Introdu¸

c˜

ao

O uso de sistemas computacionais vem aumentando nos últimos anos, gra¸cas à diminui¸cão dos custos de aquisi¸cão de tecnologia digital, desempenhando papel fundamental para o funcionamento de qualquer corpora¸cão. Com isso, as empresas necessitam disponibilizar e manter informa¸cões sobre suas opera¸cões, possibilitando o acesso a várias localidades e a qualquer momento. Com o intuito de aumentar a seguran¸ca, é necessário que sejam aplicadas medidas de seguran¸ca para proteger e evitar que pessoas não autorizadas tenham acesso a informa¸cões restritas, visto que os sistemas computacionais são, em sua maioria, suscept´ıveis a vários ataques e também controlar o acesso f´ısico de pessoas a locais que necessitam de seguran¸ca [5].

Os sistemas de seguran¸ca comumente utilizados são os baseados no conhecimento, tais como sistemas de autentica¸cão por usuário e senha, os quais consistem em utilizar aquilo que o usuário possui, como cartão, chave, documento, etc, e aquilo que o usuário conhece, como senha, palavra-chave ou nome da professora preferida, entre outros dados. Entretanto, estes mostram-se extremamente vulneráveis a falhas, pois nada impede que um indiv´ıduo mal intencionado, de posse da senha de outrem, seja capaz de acessar informa¸cões sigilosas ou mesmo em nome dessa outra pessoa. Além disso, a senha também exige a sua memoriza¸cão, o que pode ser um processo complexo para o usuário visto que, atualmente, a grande maioria dos sistemas exige um número m´ınimo de caracteres alfa-numéricos com o intuito de aumentar a sua robustez.

(15)

para a aceita¸cão dessa nova tecnologia foi a redu¸cão do pre¸co dos equipamentos de auten-tica¸cão baseados em biometria permitindo, assim, a sua incorpora¸cão nos computadores atuais, tornando viável a implanta¸cão de tais sistemas.

Figura 1.1: Caracter´ısticas biom´etricas utilizadas em sistemas biom´etricos.

A impressão digital, por exemplo, tem sido amplamente utilizada em várias aplica¸cões pela sua rapidez e confiabilidade [7]. Entretanto, sujeira ou ressecamento da pele podem afetar o desempenho do sistema. Pessoas diabéticas, por exemplo, tem relatado problemas na utiliza¸cão de sistemas biométricos baseados em impressão digital pelo desgaste ou ferimentos nos dedos, devido às constantes aplica¸cões dos aparelhos medidores do n´ıvel de insulina. Deforma¸cões temporárias, tais como arranhões e machucados, também afetam o desempenho do sistema.

Muito embora o reconhecimento da ´ıris seja um processo extremamente confiável e seguro [8], o mesmo pode causar desconforto ao usuário por ser um método bastante invasivo. Além disso, problemas de ilumina¸cão refletida na ´ıris e oclusão da mesma são comumente relatados.

(16)

entre outras [11].

Grande parte dos modelos computacionais de reconhecimento propostos até hoje é baseada no espectro vis´ıvel e apresenta desempenho satisfatório quando restrita a condi¸cões favoráveis de ilumina¸cão, expressão e pose. No entanto, ao serem aplicados em ambientes cujo contexto é menos restrito, ou seja, onde há variabilidade de expressões faciais e ilu-mina¸cão irregular, esses modelos computacionais apresentam resultados muito aquém do desejável. Outros fatores preponderantemente negativos no reconhecimento facial tradi-cional é que imperfei¸cões na pele, cicatrizes e oclusões na mesma, tais como óculos, barba e chapéus, por exemplo, dificultam o seu reconhecimento automático. Além disso, existe a dificuldade de se distinguir gêmeos e indiv´ıduos parecidos, já que a pequena varia¸cão pode não ser tão facilmente detectada.

Para superar tais deficiências, muitas pesquisas têm focado a explora¸cão de técnicas computacionais e modalidades de leituras alternativas. Um tipo de sensoriamento já estabelecido e que tem chamado aten¸cão, consiste da obten¸cão dos dados a partir das radia¸cões emitidas pelos objetos no espectro térmico do infravermelho (infrared - IR) [12]. Uma vantagem em usar este tipo de sensoriamento, ao invés do espectro vis´ıvel, está no fato de que a luz no espectro térmico do IR é emitida pelo objeto em vez de ser refletida. As emissões térmicas da pele são intr´ınsecas e independem de ilumina¸cão, conforme mostrado na Figura 1.2. Sendo assim, a energia IR pode ser percebida em qualquer condi¸cão de luz, além de ser menos sens´ıvel à fuma¸ca e poeira do que a luz vis´ıvel. Também é poss´ıvel distinguir gêmeos, embora as imagens não sejam substancialmente diferentes [10] como mostrado na Figura 1.3. Além disso, as imagens infravermelhas possuem menor varia¸cão quanto à varia¸cão de expressão facial, como demonstrado na Figura 1.4.

Diante das diferen¸cas existentes entre as modalidades, é importante conhecermos as principais propriedades biométricas de uma caracter´ıstica biométrica para saber qual delas é melhor dentro de um contexto:

1. Universalidade: todas as pessoas devem possu´ı-la;

2. Unicidade: as caracter´ısticas entre duas pessoas devem ser suﬁcientemente distintas;

3. Permanência: invariância com rela¸cão ao tempo;

4. Coletabilidade: a caracter´ıstica pode ser medida quantitativamente;

5. Desempenho: recursos necess´arios para se atingir taxa de reconhecimento satis-fat´orio;

6. Aceitabilidade: aceita¸c˜ao dos indiv´ıduos em utilizar a biometria em seu dia-a-dia;

(17)

Figura 1.2: Varia¸cão de ilumina¸cão com incidência de ilumina¸cão do sol à direita (acima) e frontal (abaixo) da face nos espectros vis´ıvel (Visible), infravermelho próximo (Short-wave infrared - SWIR), infravermelho médio (Medium-wave infrared - MWIR) e infravermelho distante (Long-wave infrared - LWIR).

Assim, fazendo-se uma análise comparativa das propriedades biométricas do reconheci-mento de face nas modalidades vis´ıvel e infravermelho, podemos notar que embora ambas apresentem n´ıveis próximos, o reconhecimento de face utilizando imagens no espectro in-fravermelho poderia ser mais vantajoso, pois tem um desempenho melhor e alto grau de circunven¸cão. Além disso, o reconhecimento de face apresenta uma alta universalidade. A Tabela 1.1 apresenta o n´ıvel de cada uma das propriedades com rela¸cão às técnicas biométricas, ondeB indica baixo, M indica médio e A indica alto n´ıvel da propriedade.

(18)

Tabela 1.1: Propriedades biom´etricas do reconhecimento facial humano.

Modalidade 1 2 3 4 5 6 7

Vis´ıvel A B M A B A B

Infravermelho A A B A M A A

Figura 1.3: Imagem infravermelha de gˆemeos.

(a) (b) (c)

(d) (e) (f)

Figura 1.4: Compara¸cão de imagens no espectro vis´ıvel e infravermelho com varia¸cões de ilumina¸cão e expressão facial: (a) e (b) imagens de face no espectro vis´ıvel com diferentes condi¸cões de ilumina¸cão, (c) diferentes expressões faciais e (d), (e) e (f) são as imagens no espectro infravermelho correspondentes a (a), (b) e (c).

(19)

Component Analysis - PCA) tamb´em tem sido amplamente utilizado com o intuito de diminuir a dimens˜ao do espa¸co amostral.

No entanto, imagens infravermelhas também possuem as suas limita¸cões, sendo uma delas a altera¸cão da temperatura facial ao longo do tempo. Problemas de saúde cotidi-anos como a gripe, por exemplo, ocasionam a febre, a qual altera a temperatura do corpo humano e, consequentemente, a imagem da face no espectro infravermelho poderá ficar alterada. Problemas de oclusão como o uso de óculos, barba e bigode também devem ser evitados. Além disso, as imagens infravermelhas podem afetar a privacidade, já que po-dem detectar se o indiv´ıduo utilizou substâncias il´ıcitas. Trabalhos recentes têm utilizado caracter´ısticas fisiológicas da face com o intuito de detectar a rede de vasos sangu´ıneos da mesma, os quais são responsáveis pela geometria das regiões com maior temperatura da face [14]. Para isso, é necessário uma câmera IR que consiga detectar as pequenas varia¸cões de temperatura na face. Os autores argumentam que a geometria dada pelos vasos sangu´ıneos é única em cada indiv´ıduo permitindo, ainda, identificar varia¸cões de pose dos mesmos. Akhloufi e Bendada [2] recentemente propuseram uma metodologia para extra¸cão das regiões isotérmicas da face com o intuito de extrair uma assinatura de cada indiv´ıduo, a qual tem obtido resultados bastante satisfatórios no reconhecimento automático através de imagens faciais IR. A utiliza¸cão deste tipo de assinatura, ao con-trário das técnicas hol´ısticas tradicionais, permite uma maior invariância dos tradicionais métodos de reconhecimento facial de imagens termais com rela¸cão a altera¸cões na tem-peratura corpórea. O sistema proposto por Akhloufi e Bendada consiste, basicamente, em (i) segmentar a face, (ii) agrupar as regiões isotérmicas e, finalmente, (iii) definir a fronteira de tais regiões através de esqueletoniza¸cão.

Falcão et al. [15] propôs uma abordagem para o projeto de operadores de imagens baseados em grafos denominada Transformada Imagem Floresta (Image Foresting Trans-form - IFT), a qual tem sido amplamente utilizada em diversas situa¸cões, tais como filtra-gens morfológicas, segmenta¸cão e descri¸cão de imafiltra-gens, dentre outras. A ideia consiste, basicamente, em um processo de disputa entre nós sementes, os quais tentarão oferecer caminhos de custo ótimo aos demais nós do grafo com o objetivo de conquistá-los. Nesse contexto, pixels são modelados como sendo nós do grafo, e uma rela¸cão de adjacência precisa ser estabelecida. Geralmente são utilizadas a 4-vizinhan¸ca ou 8-vizinhan¸ca.

(20)

similar às tradicionais Máquinas de Vetores de Suporte [18], por exemplo, porém muito mais rápidos para o treinamento dos dados [17].

(21)

Cap´ıtulo 2

Revis˜

ao Bibliogr´

aﬁca

2.1 Transformada Imagem Floresta

A IFT é uma ferramenta geral para modelar, implementar e avaliar operadores de pro-cessamento de imagens baseados em conexidade [15]. A IFT reduz problemas de proces-samento da imagem ao cálculo de uma floresta de caminhos de custo ótimo em um grafo derivado da mesma. O valor de um caminho é normalmente calculado por uma fun¸cão de-pendente da aplica¸cão e com base nas propriedades da imagem, tais como brilho, gradiente e posi¸cão do pixel ao longo do caminho.

2.1.1 Deﬁni¸

c˜

ao

Seja a imagem Î = (DI, I), onde DIˆ ⊂ Zn corresponde ao dom´ınio da imagem e I(t) associa um conjunto m de escalares Ib(t), b = 1,2, . . . , m, a cada pixel t _∈ DI. Por exemplo, a tripla (I1(t), I2(t), I3(t)) pode denotar os valores de vermelho, azul e verde de um pixel t no espa¸co de cor RGB. No caso de imagens tons de cinza, o sub´ındice b é suprimido e I(t) é adotado. Assim, uma imagem 2D pode ser vista como um grafo onde os nós são ospixels (amostras) e as arestas são definidas por uma rela¸cão de adjacência

Aentre nós (Figuras 2.1a-c mostram umpixel central e seus 4-vizinhos, 8-vizinhos e uma rela¸cão de adjacência mais complexa, respectivamente). Um caminho nesse grafo é uma seqüência de amostras πsk =s1, s2, . . . , sk, onde (si, si+1) ∈A para 1≤ i≤ k−1. Um

(22)

(b)

(a) _(c)

Figura 2.1: (a)-(c)Pixel central e seus 4-vizinhos, 8-vizinhos e uma rela¸c˜ao de adjacˆencia mais complexa, respectivamente.

suave quando, para qualquer amostrat, existe um caminho ´otimo πt o qual ´e trivial ou possui a forma πs· s, t, onde

• f(πs)_≤f(πt); • πs ´e ´otimo, e

• para qualquer caminho ´otimoτs,f(τs· s, t) = f(πt).

fmax(s) =

0 ses _∈S, +_∞ caso contr´ario

fmax(πs· s, t) = max{fmax(πs), d(s, t)}, (2.1) sendo que d(s, t) mede a dissimilaridade entre nós adjacentes e fmax(πs) computa a dis-tância máxima entre amostras adjacentes em πs, quando πs não é um caminho trivial. Suponha, por exemplo, o grafo da Figura 2.2a, onde ospixels são os nós e as arestas são formadas pela 4-vizinhan¸ca (Figura 2.1a). Note que existem três sementes (nós de maior tamanho). Se utilizarmos a fun¸cão fmax com d(s, t) =I(t), onde I(t) denota o brilho do pixel t, a IFT encontra uma floresta de caminhos ótimos com ra´ızes neste conjunto de sementes, como pode ser visualizado na Figura 2.2b. Neste caso, a IFT tenta minimizar os valores dos caminhos, os quais são dados pelo valor máximo de brilho ao longo dos mesmos (fmax).

(23)

222 222

2222 1111111111 2222222222 4444444444 4444444444 2222222222 1111111111 2222222222

1 11 1 11 1 11

1 0000000000 1111111111 3333333333 3333333333 1111111111 0000000000 1111111111

222 222

2222 1111111111 2222222222 4444444444 4444444444 2222222222 1111111111 2222222222

666 666

6666 6666666666 6666666666 6666666666 6666666666 6666666666 6666666666 6666666666

666 666

6666 6666666666 6666666666 6666666666 6666666666 6666666666 6666666666 6666666666

666 666

6666 7777777777 8888888888 9999999999 0000000000 9999999999 8888888888 7777777777

(a) (b)

Figura 2.2: (a) Um grafo de uma imagem 2D em tons de cinza com vizinhan¸ca 4. Os números correspondem às intensidades I(s) dos pixels e os pontos maiores denotam as três sementes. (b) Uma floresta de caminhos ótimos usandofmax com d(s, t) = I(t). As setas em (b) apontam para o predecessor no caminho ótimo.

2.1.2 Algoritmo da IFT

Um mapa de predecessores P é uma fun¸cão que atribui para cada pixel s da imagem algum outropixel ou uma marca distinta nilindicando a ausência de predecessor. Neste ´

ultimo caso,sé dito serraiz do mapa. É dito também queP∗₍_s_{) denota o caminho ótimo}

da raizR(s) atés. Uma floresta pode ser representada em memória através de ummapa de predecessores que não contém ciclos. O algoritmo da IFT retorna, então, um mapa de predecessores P representando a floresta de caminhos ótimos, um mapa de valores de caminho V e um mapa de ra´ızes R, o qual é utilizado para acessar em tempo constante a raiz em S de cada pixel da floresta. O mapa V armazena, para cada pixel, o valor do caminho ótimo que o alcan¸ca a partir do conjuntoS de sementes mencionado.

O algoritmo da IFT é essencialmente o procedimento de Dijkstra para o cálculo de caminhos de valor ótimo a partir de uma única fonte [19, 20], ligeiramente modificado para permitir múltiplas fontes e fun¸cões de valor de caminho mais genéricas (fun¸cões suaves).

(24)

Algoritmo 1 – IFT

Entrada: Uma imagem, uma rela¸cão de adjacência A, um conjunto de nós sementesS e

uma fun¸c˜ao de valor de caminho suave f.

Sa´ıda: Mapa de valores de caminhosV, mapa de predecessoresP e mapa de ra´ızesR

Auxiliares: Fila de prioridadesQinicialmente vazia e vari´avel cst.

1. Para cada n´o s do grafo derivado da imagem,Fa¸ca 2. P(s)_←nil, R(s)_←s eV(s)_←+_∞.

3. Para cada n´o s_∈S, Fa¸ca 4. V(s)_←0.

5. Insiras em Q.

6. Enquanto Q n˜ao for vazia,Fa¸ca

7. Remova s deQ tal queV(s)´e m´ınimo.

8. Para cada n´o t_∈A(s) tal que V(t)> V(s), Fa¸ca 9. cst_←f(V(s)_·s, t).

10. Se cst < V(t), Ent˜ao

11. Se V(t)= +_∞ for ﬁnito, Ent˜ao

12. Remova t deQ.

13. P(t)_←s, R(t)_←R(s) eV(t)_←cst.

14. Insirat em Q.

15. Retorne _{V, P, R_}

um caminho ótimo é selecionado, o qual corresponde ao caminho de menor valor entre os nós que atingem a fronteira da floresta e os seus vértices adjacentes são avaliados (Linhas 8₋14). A fronteira pode ser ampliada pela aquisi¸cão de novas conexões ou melhores rotas podem ser encontradas para pixels de fronteira já existentes. Na Linha 9 é calculado o custo cst de uma nova poss´ıvel rota, o qual é comparado com o valor do caminho atual (Linha 10). Os mapas V, P e R devem ser atualizados de forma a refletir o melhor caminho encontrado (Linha 13). A condi¸cãoV(t) > V(s) na Linha 8 é uma otimiza¸cão que explora o fato de o valor ao longo do caminho ótimo não ser decrescente. Assim sendo, quando temos várias sementes emS, estas serão propagadas ao mesmo tempo e teremos um processo competitivo. Cada semente irá definir umazona de influência composta por pixels conexos a ela por caminhos mais “baratos” do que os fornecidos por qualquer outra semente em S.

(25)

de um processamento local aplicado aos valores de custo de caminhos,mapa de predeces-sores e mapa de ra´ızes, em tempo proporcional ao número depixels. Assim, a IFT unifica e estende várias técnicas de análise de imagens que, muito embora sejam baseadas em conceitos similares, são normalmente apresentadas como métodos não relacionados [15]. A próxima se¸cão introduz o classificador Floresta de Caminhos Ótimos.

2.2 Classiﬁcadores baseados em Floresta de

Cami-nhos ´

Otimos

Esta se¸cão tem por objetivo apresentar os classificadores baseados em floresta de caminhos ótimos com aprendizado supervisionado e não-supervisionado. Tais classificadores mode-lam o problema de reconhecimento de padrões como um problema de floresta de caminhos ótimos em um grafo definido no espa¸co de atributos, onde os nós são as amostras, as quais são representadas pelos seus respectivos vetores de atributos, e os arcos são definidos de acordo com uma rela¸cão de adjacência pré-estabelecida. Tanto os nós quanto os arcos podem ser ponderados, e diversas fun¸cões de custo podem ser empregadas com o intuito de particionar o grafo em árvores de caminhos ótimos, as quais são enraizadas pelos seus respectivos protótipos (sementes) na fase de treinamento. O rótulo de uma amostra a ser classificada é o mesmo do protótipo mais fortemente conexo a ela.

2.2.1 Classiﬁca¸

c˜

ao n˜

ao-supervisionada

A presente se¸cão tem por objetivo apresentar o método de classifica¸cão não-supervisionado baseado em floresta de caminhos ótimos, proposto inicialmente por Rocha et al. [24], o qual foi desenvolvido com o intuito de identificar clusters como sendo as árvores de uma floresta de caminhos ótimos.

(26)

Fundamenta¸c˜ao te´orica

SejaZ uma base de dados tal que, para toda amostras_∈Z, existe um vetor de atributos

v(s). Seja d(s, t) a distância entres e t no espa¸co de atributos. O problema fundamental na área de agrupamento de dados é identificar grupos de amostras em Z, sendo que amostras de um mesmo grupo deveriam representar algum n´ıvel de semelhan¸ca de acordo com algum significado semântico.

´

E dito que uma amostraté adjacente a uma amostras (isto é,t _∈A(s) ou (s, t)_∈A) quando alguma rela¸cão de adjacência é satisfeita. Por exemplo,

t_∈A1(s) se d(s, t)≤df ou (2.2)

t_∈A2(s) se té k-vizinho mais próximo de s no espaco de atributos, (2.3) onde df e k > 1 são parâmetros do tipo real e inteiro, respectivamente. Assim sendo, o par (Z, Ak) define então um grafok-nn, onde Ak é uma rela¸cão de adjacência do tipoA2 e, posteriormente, do tipoA3 (Equa¸cão 2.5). Os arcos são ponderados pord(s, t) e os nós

s_∈Z s˜ao ponderados por um valor de densidadeρ(s), dado por

ρ(s) = _√ 1 2πσ2_|A₍_s₎_|

∀t∈A(s) exp

−d2₍_{s, t}₎ 2σ2

, (2.4)

ondeσ = df

3 edf é o comprimento do maior arco em (Z, Ak). A escolha deste parâmetro considera todos os nós para o cálculo da densidade, assumindo que uma fun¸cão gaussiana cobre a grande maioria das amostras comd(s, t)_∈[0,3σ].

Rela¸cões de adjacência simétricas (Equa¸cão 3.5 por exemplo) resultam em rela¸cões de conectividade simétricas, entretanto A2 na Equa¸cão 2.3 é uma rela¸cão de adjacência as-simétrica. Dado que um máximo da fdp pode ser um subconjunto de amostras adjacentes com um mesmo valor de densidade, existe a necessidade da garantia da conectividade entre qualquer par de amostras naquele máximo. Assim, qualquer amostra deste con-junto de máximos pode ser representativa e alcan¸car outras amostras desse máximo e suas respectivas zonas de influência por um caminho ótimo. Isto requer uma modifica¸cão na rela¸cão de adjacênciaA2, para que a mesma seja simétrica nos platôs deρcom o intuito de calcular os clusters:

se t _{∈ A}2(s),

s _{∈ A}/ 2(t) e

ρ(s) = ρ(t), ent˜ao

(27)

Se tivéssemos uma amostra por máximo, formando um conjunto S (pontos grandes na Figura 2.3a), então a maximiza¸cão da fun¸cãof1 resolveria o problema, ou seja:

f1(t) =

ρ(t) se t_∈S

−∞ caso contr´ario

f1(πs· s, t) = min{f1(πs), ρ(t)}. (2.6) A fun¸cãof1 possui um termo de inicializa¸cão e um termo de propaga¸cão, o qual associa a cada caminhoπt o menor valor de densidade ao longo do mesmo. Toda amostra t ∈S define um caminho trivial t devido ao fato de não ser poss´ıvel alcan¸car t através de outro máximo da fdp sem passar através das amostras com valores de densidade menores queρ(t) (Figura 2.3a). As amostras restantes iniciam com caminhos triviais de valor_−∞ (Figura 2.3b), assim qualquer caminho oriundo deS possuirá valor maior. Considerando todos os caminhos poss´ıveis de S a toda amostra s /_∈ S, o caminho ótimo P∗₍_s_{) será}

aquele cujo menor valor de densidade seja m´aximo.

1 2 2 1 3 3 3 5 5 5 (a) P(t)* 5 3 5 1 2 2 3 3 3 5 5 t P(t) R(t) 1 (b) (c)

Figura 2.3: (a) Grafo cujos pesos dos nós são seus valores de fdp ρ(t). Existem dois máximos com valores 3 e 5, respectivamente. Os pontos grandes indicam o conjunto de ra´ızes S. (b) Valores de caminho triviais f1(t) para cada amostra t. (c) Floresta de caminhos ótimos P para f1 e os valores de caminho finais V(t). O caminho ótimo P∗(t) (linha tracejada) pode ser obtido percorrendo os predecessores P(t) até a raiz R(t) para cada amostrat.

Visto que não temos os máximos da fdp, a fun¸cão de conectividade precisa ser escolhida de tal forma que seus valores iniciais h definam os máximos relevantes da fdp. Para

(28)

h(t) = ρ(t)₋δ, (2.7)

δ = min

(s,t)∈A|ρ(t)=ρ(s)|ρ(t)−ρ(s)|,

então todos os máximos deρ serão preservados. Para altos valores de δ os domos da fdp com altura menor queδ não definirão zonas de influência.

´

E desejado também evitar a divisão da zona de influência de um máximo em múltiplas zonas de influência, cada uma enraizada por uma amostra naquele máximo. Dado que o algoritmo da IFT primeiro identifica os máximos da fdp, antes de propagar suas zonas de influência, podemos modificá-lo de tal forma a detectar uma primeira amostrat para cada máximo, definindo o conjuntoS em tempo real (on-the-fly). Então foi trocadoh(t) por ρ(t) e esta amostra irá conquistar as amostras restantes do mesmo máximo. Assim, a fun¸cão de conectividadef2 final será dada por

f2(t) =

ρ(t) set _∈S h(t) caso contr´ario

f2(πs· s, t) = min{f(πs), ρ(t)}. (2.8) O problema agora direciona-se em encontrar o melhor valor dek para deﬁnir Ak. A solu¸c˜ao proposta por Rocha et al. [24] para encontrar o melhork∗ _{considera o corte m´ınimo}

no grafo provida pelos resultados do processo de clustering parak∗

∈[1, kmax], de acordo com a medida C(k) sugerida por Shi e Malik [25]:

C(k) = c

i=1

W

i

Wi+Wi

, (2.9)

Wi =

∀(s,t)∈A|L(s)=L(t)=i 1

d(s, t), (2.10)

W_i =

∀(s,t)∈A|L(s)=i,L(t)=i 1

d(s, t), (2.11)

ondeL(t) ´e o rotulo da amostrat,W

(29)

´

unico cluster. O corte m´ınimo parakmax = 100 identiﬁca quatro clusters com o melhor

k∗ _{= 37 (Figura 2.4b), e limitando a busca para} _k

max = 30, o corte m´ınimo identiﬁca cinco clusters com melhork∗ _{= 29 (Figura 2.4c).}

(a)

(b) (c)

Figura 2.4: (a) Espa¸co de atributos com diferentes concentra¸cões de amostras para cada cluster. É poss´ıvel identificar diferentes quantidades de clusters dependendo do valor de

k escolhido. Solu¸c˜oes interessantes s˜ao (b) quatro e (c) cinco clusters.

Segue abaixo o algoritmo do classificador baseado em floresta de caminhos ótimos com aprendizado não-supervisionado.

Algoritmo 2 – Agrupamento de Dados por Floresta de Caminhos ´Otimos

Entrada: Grafo (Z, Ak∗) e fun¸c˜ao ρ.

Sa´ıda: Mapa de r´otulosL, mapa de valores de caminhoV, mapa de predecessoresP.

Auxiliares: Fila de prioridade Q, vari´aveistmp e l_←1.

1. Para todo s_∈Z, Fa¸ca P(s)_←nil,V(s)_←ρ(s)₋δ, insira s emQ.

2. Enquanto Q´e n˜ao vazia, Fa¸ca

3. Remova de Q uma amostras tal queV(s) ´e m´aximo.

4. Se P(s) =nil,Ent˜ao

5. L(s)_←l, l_←l+ 1, e V(s)_←ρ(s).

6. Para cada t_∈A_k∗₍_s₎ e V(t)< V(s), Fa¸ca

7. tmp_←min_{V(s), ρ(t)_}.

8. Se tmp > V(t), Ent˜ao

9. L(t)_←L(s), P(t)_←s, V(t)_←tmp.

(30)

O Algoritmo 2 identifica uma raiz em cada máximo da fdp (P(s) = nil na Linha 4 implica que s _∈ S), associa um rótulo distinto a cada raiz na Linha 5, e calcula a zona de influência (cluster) de cada raiz como sendo uma árvore de caminhos ótimos em

P, tal que os nós de cada árvore recebem o mesmo rótulo que a sua raiz no mapa L

(Linha 9). O algoritmo também retorna o mapa de valores de caminhos ótimos V e o mapa de predecessores P, sendo também mais robusto que o tradicional algoritmo de mean-shift [26], pois não depende de gradientes da fdp, utiliza um grafo k-nn e associa um rótulo para cada máximo, mesmo quando o máximo é composto por um componente conexo em (Z, Ak∗).

Extens˜ao para grandes bases de dados

O Algoritmo 2 pode tornar-se proibitivo para grandes bases de dados, principalmente em aplica¸cões que envolvem imagens 3D, pois a estima¸cão do valor do melhor k requer o seu cálculo inúmeras vezes, aumentando ainda mais a complexidade do algoritmo. Cap-pabianco et al. [27] propôs uma extensão do algoritmo de classifica¸cão não-supervisionado baseado em OPF para aplica¸cões que possuem uma grande base de dados como, por exem-plo, segmenta¸cão de substâncias branca e cinzenta do cérebro humano. Esta extensão é baseada em uma sele¸cão aleatória de um conjuntoZ _⊂_Z_{. Seja}_V _e_L_{os mapas ótimos do}

Algoritmo 2 calculados no melhor grafok-nn (Z_{, A}

k∗). Uma amostrat ∈Z\Z pode ser

classificada como pertencente a um dos clusters simplesmente identificando qual raiz ofe-rece o caminho ótimo como se esta amostra pertencesse à floresta original. Considerando os k-vizinhos mais próximos de t em Z_{, podemos utilizar a Equa¸cão 2.4 para computar}

ρ(t), avaliar os caminhos ´otimosπs· s, t e selecionar o que satisfaz

V(t) = max

∀(s,t)∈Ak∗{

min_{V(s), ρ(t)_}}. (2.12) Sejas∗ _∈_Z _{a amostra que satisfaz a Equa¸cão 2.12. O processo de classifica¸cão}

simples-mente associa L(s∗_{) como sendo o cluster de} _t_.

2.2.2 Classiﬁca¸

c˜

ao supervisionada

(31)

ca-minhos ótimos, sendo que a união das mesmas nos remete a uma floresta de caca-minhos ótimos. Esta abordagem apresenta vários benef´ıcios com rela¸cão a outros métodos de classifica¸cão de padrões supervisionados: (i) é livre de parâmetros, (ii) possui tratamento nativo de problemas multiclasses e (iii) não faz alusão sobre forma e/ou separabilidade das classes.

O algoritmo OPF com grafo completo foi primeiramente apresentado por Papa et al. [17] e tem sido amplamente utilizado em diversas aplica¸cões. As próximas se¸cões irão discutir a fundamenta¸cão teórica e os algoritmos de treinamento e classifica¸cão do algoritmo baseado em OPF utilizando grafo completo.

Fundamenta¸c˜ao te´orica

SejaZ agora uma base de dadosλ-rotulada eZ1 eZ3 os conjuntos de treinamento e teste, respectivamente, com _|Z1| e |Z3| amostras, as quais podem ser pixels/voxels/contornos tais queZ =Z1∪Z3. Seja λ(s) uma fun¸c˜ao que associa o r´otulo corretoi, i= 1,2, . . . , c da classe i a qualquer amostras_∈Z1∪Z3.

Seja S _∈ Z1 um conjunto de prot´otipos de todas as classes (isto ´e, amostras que melhor representam as classes). Sejav um algoritmo que extrain atributos (cor, forma e propriedades de textura) de qualquer amostras _∈Z1∪Z3, e retorna um vetor de atributos

v(s)_{∈ ℜ}n_{. A distância}_d₍_{s, t}_{) entre duas amostras,}_s _e _t_{, é dada pela distância entre seus} vetores de atributosv(s) ev(t).

Nosso problema consiste em usar S, (v, d) e Z1 para projetar um classificador otimal, o qual pode predizer o rótulo corretoλ(s) de qualquer amostras _∈Z3. Assim sendo, foi proposto um classificador que cria uma parti¸cão discreta otimal, a qual é uma floresta de caminhos ótimos computada em_ℜn_{pelo algoritmo da Transformada Imagem Floresta [15].} Seja (Z1, A) um grafo completo cujos nós são as amostras em Z1, onde qualquer par de amostras define um arco emA (isto é,A =Z1×Z1) (Figura 2.5a). Note que os arcos não precisam ser armazenados e o grafo não precisa ser explicitamente representado.

O algoritmo baseado em OPF pode ser utilizado com qualquer fun¸cão de custo suave que pode agrupar amostras com propriedades similares [15]. Na versão OPF com grafo completo a fun¸cão de custo abordada foi afmax (Equa¸cão 2.1). O algoritmo baseado em OPF associa um caminho ótimoP∗₍_s_{) de}_S _{a toda amostra}_s_∈_Z

1, formando uma floresta de caminhos ótimosP (uma fun¸cão sem ciclos, a qual associa a todos_∈Z1seu predecessor

P(s) em P∗₍_s_{), ou uma marca}_nil _quando _s _∈ _S_{, como mostrado na Figura 2.5d). Seja}

R(s)_∈S a raiz deP∗₍_s_{) a qual pode ser alcan¸cada por}_P₍_s_{). O algoritmo computa, para}

(32)

0.2 0.4 0.8 0.5 1.0 0.9 0.5 0.3 0.7 0.6 1.0 0.7 0.7 0.8 0.8 0.2 0.4 0.5 0.3 0.5 (a) (b) 0.2 0.4 0.5 0.3 0.5 (0.0,1) (0.4,1) (0.5,1) (0.0,2) (0.3,2) (0.5,2) (c) (d) (0.0,1) (0.4,1) (0.0,2) (0.3,2) (0.5,2) 0.5 0.4 0.8 0.9 0.6 (0.5,1) 0.3 (?,?) (e) (f)

(33)

Algoritmo 3 –Classificador Supervisionado baseado em Floresta de

Cami-nhos ´Otimos usando grafo completo

Entrada: Um conjunto de treinamento Z1 λ-rotulado, prot´otipos S ⊂Z1 e o par (v, d)

para vetor de atributos e c´alculo das distˆancias.

Sa´ıda: Floresta de caminhos ´otimos P, mapa de valores de custo de caminhos V e

mapa de r´otulosL

Auxiliares: Fila de prioridadesQ, e vari´avelcst.

1. Para todo s_∈Z1,Fa¸ca P(s)←nil e V(s)←+∞.

2. Para todo s_∈S, Fa¸ca V(s)_←0, P(s)_←nil, L(s) =λ(s) e insira sem Q.

3. Enquanto Q´e n˜ao vazia, Fa¸ca

4. Remova de Q uma amostras tal queV(s) ´e m´ınimo.

5. Para cada t_∈Z1 tal ques=t e V(t)> V(s), Fa¸ca 6. Calcule cst_←max_{V(s), d(s, t)_}.

7. Se cst < V(t), Ent˜ao

8. Se V(t)= +_∞,Ent˜aoremova t de Q.

9. P(t)_←s, L(t)_←L(s) eV(t)_←cst.

10. Insirat em Q.

As linhas 1–2 inicializam os mapas e inserem protótipos emQ. O la¸co principal calcula um caminho ótimo de S para cada amostra s _∈ Z1 em uma ordem não decrescente de custos (linhas 3–10). A cada itera¸cão um caminho de custo de ótimo V(s) é obtido em

P (linha 4). Empates são resolvidos em Q utilizando a pol´ıtica FIFO (first-in-first-out), ou seja, quando dois caminhos atingem uma determinada amostra s com o mesmo custo m´ınimo,sé associado ao primeiro caminho que o atingiu. O restante das linhas avalia se o caminho que atinge uma amostra adjacentet através desé mais barato que o caminho que termina emt. Caso positivo, atualizaQ, P(t),L(t) e V(t). No final do algoritmo,V

armazena o valor do custo do caminho ´otimo deS a cada amostra s_∈Z1 de acordo com

fmax.

(34)

Treinamento

A fase de treinamento do classificador baseado em floresta de caminhos ótimos usando o grafo completo consiste, basicamente, em encontrar o conjunto S de protótipos, ou seja, os elementos mais representativos de cada classe. Várias heur´ısticas poderiam ser adotadas como, por exemplo, uma escolha aleatória de protótipos. Entretanto, tal escolha pode prejudicar o desempenho do classificador, tornando-o instável e com um alto grau de sensibilidade com rela¸cão aos protótipos escolhidos. Desejamos, assim, estimar protótipos nas regiões de sobreposi¸cão de amostras e nas fronteiras entre as classes, visto que são regiões muito suscept´ıveis a erros de classifica¸cão.

Computando uma MST no grafo completo (Z1, A), foi obtido um grafo conexo ac´ıclico cujos nós são todas as amostras em Z1, e os arcos são não direcionados e ponderados (Figura 2.5b). Seus pesos são dados pela distância d entre os vetores de atributos de amostras adjacentes. Esta árvore de espalhamento é ótima no sentido em que a soma dos pesos de seus arcos é m´ınima se comparada a outras árvores de espalhamento no grafo completo. Os protótipos a serem escolhidos são os elementos conectados na MST com di-ferentes rótulos emZ1, isto é, elementos mais próximos de classes diferentes (Figura 2.5c). Removendo-se os arcos entre classes diferentes, tais amostras adjacentes tornam-se pro-tótipos em S e o Algoritmo 3 pode computar uma floresta de caminhos ótimos em Z1 (Figura 2.5d). Note que uma dada classe pode ser representada por múltiplos protótipos (isto é, árvores de caminhos ótimos) e deve existir pelo menos um protótipo por classe.

O Algoritmo 3 pode computar uma floresta de caminhos ótimos com erro zero de clas-sifica¸cão emZ1, desde que a fun¸cão fmax seja modificada. A idéia consiste, basicamente, em ponderar os arcos entre amostras de diferentes classes com um valor muito alto, im-possibilitando assim que protótipos de uma classe conquistem elementos de outras classes . Desta forma, a fun¸cão de valor de caminhofmax poderia ser escrita da seguinte forma:

fmax(t) =

0 se t_{∈ S}

+_∞ caso contr´ario

fmax(πs· s, t) =

+_∞ se λ(t)=λ(s)

(35)

Classiﬁca¸c˜ao

Para qualquer amostra t _∈ Z3, foram considerados todos os arcos conectando t com amostrass _∈Z1, tornando t como se fosse parte do grafo original (ver Figura 2.5e, onde a amostra t é representada pelo triângulo no grafo). Considerando todos os poss´ıveis caminhos entre S e t, é desejado encontrar o caminho ótimo P∗₍_t_{) de} _S _até _t _{com a}

classeλ(R(t)) de seu protótipoR(t)_∈S mais fortemente conexo. Este caminho pode ser identificado incrementalmente, avaliando o valor do custo ótimoV(t) como

V(t) = min_{max_{V(s), d(s, t)_}}, _∀s_∈Z1. (2.14) Sejas∗ _∈_Z

1 o nó que satisfaz a equa¸cão acima (isto é, o predecessorP(t) no caminho ótimoP∗₍_t_{)). Dado que}_L₍_s∗_{) =}_λ₍_R₍_t_{)), a classifica¸cão simplesmente associa}_L₍_s∗_{) como}

a classe det (Figura 2.5f). Um erro ocorre quandoL(s∗₎₌_λ₍_t_).

(36)

Cap´ıtulo 3

Abordagem proposta

Uma imagem infravermelha da face contém informa¸cões térmicas da mesma, a qual apre-senta regiões com diferentes temperaturas (Figura 3.1). Este mapa térmico está rela-cionado com as redes de vasos sangu´ıneos que produzem uma impressão facial termal ´

unica para cada indiv´ıduo.

Figura 3.1: Imagem facial capturada no espectro infravermelho.

Em imagens infravermelhas, algumas transforma¸cões da face (rota¸cão, escala e transla¸cão) e varia¸cões dependentes de sensor (por exemplo, calibra¸cão de controle de ganho au-tomático e sensor de pontos ruins) poderiam prejudicar o desempenho no reconheci-mento [10]. Este impacto pode ser minimizado pela normaliza¸cão das imagens, a qual contempla alguns dos seguintes passos:

(37)

2. Equaliza¸cão de histograma para tentar minimizar a varia¸cão da imagem devido a diferen¸cas de ilumina¸cão;

3. Eliminar partes da imagem que n˜ao correspondem a face e

4. Normaliza¸cão geométrica, de tal forma que a imagem fique com o mesmo alinha-mento, posi¸cão e orienta¸cão.

A rede de vasos sangu´ıneos presente em nossa face delimita a mesma em regiões com temperaturas homogêneas (regiões isotérmicas), as quais permitem caracterizar diferentes indiv´ıduos. Entretanto, para a correta extra¸cão e constru¸cão desta impressão facial, são necessárias algumas etapas, conforme descrito na Figura 3.2. O resultado final obtido é uma imagem que simula a rede de vasculariza¸cão da face humana.

Figura 3.2: Etapas necessárias para a obten¸cão da impressão facial.

As próximas se¸cões tratam de explicar como serão realizadas cada uma das etapas acima utilizando os algoritmos da IFT e OPF.

3.1 Pr´

e-processamento

O pré-processamento das imagens tem como finalidade efetuar ajustes nas mesmas de forma a facilitar a sua utiliza¸cão no método proposto. As imagens IR possuem caracte-r´ısticas que poderiam ser exploradas em um sistema biométrico, porém tais informa¸cões não são tão aparentes, sendo necessário executar o ajuste de brilho e contraste. O ajuste de intensidade de uma imagem I é feita mapeando os valores de intensidade da imagem

I para novos valores tal que 1% dos dados são saturados nas baixas e altas intensidades deI aumentando, assim, o contraste da imagem. A Figura 3.3 ilustra a imagem antes e após a aplica¸cão do pré-processamento.

(38)

(a) (b)

Figura 3.3: Imagem (a) original e (b) pr´e-processada ap´os ajuste de brilho e contraste.

3.2 Segmenta¸

c˜

ao da face

A segmenta¸cão de imagens consiste, basicamente, em particionar uma imagem em regiões que compartilham certas caracter´ısticas com o intuito de localizar objetos e formas, ou até mesmo em obter uma versão simplificada da mesma para posterior análise. Dentre as técnicas mais utilizadas para segmenta¸cão, podemos citar a Transformada de Water-shed [29] (WT - Watershed Transform), a qual introduz a ideia de modelar a imagem como um mapa topográfico, onde regiões com tons de cinza homogêneos formam bacias de capta¸cão, sendo que o encontro delas define as linhas divisórias de águas (watersheds). Falcão et al. [15] propuseram a Transformada deWatershed baseada na IFT, isto é, a IFT-WT, na qual um processo de competi¸cão entre sementes (marcadores) escolhidas manualmente ou automaticamente simulam o processo de inunda¸cão das bacias de capta-¸cão da WT através de “frentes de onda” que denotam a região de influência das sementes. Quando duas ou mais regiões se encontram, as linhas divisoras de águas são formadas. A ideia consiste em selecionar um conjunto de marcadoresS do objeto de interesse So e do fundo Sf, tal que S = So

Sf, e executar o algoritmo da IFT (Algoritmo 1) com a fun¸cão de conectividade fmax (Equa¸cão 2.1) modificada para:

f1(s) =

H(s) se s _∈S, +_∞ caso contr´ario

fmax(πs· s, t) = max{fmax(πs), d(s, t)}, (3.1) onde 0_≤H(s) <_∞´e um valor de inicializa¸c˜ao que corresponde ao brilho dopixel t, ou seja,I(t), sendo d(s, t) =_|I(s)₋I(t)_|. A Figura 3.4 ilustra este processo.

(39)

(a) (b)

(c) (d)

(e) (f)

Figura 3.4: Segmenta¸cão por IFT-WT: (a) Imagem com marcadores internos (brancos) e externos (pretos) (b) O complemento da imagem gradiente de (a) nós dá uma ideia do peso dos arcos. Os marcadores são selecionados ao redor das partes mais fracas do contorno (tons de cinza mais claros em b), com o intuito de evitar vazamentos do processo de segmenta¸cão. (c) Resultado da segmenta¸cão e (d-f) três imagens do processo de inunda¸cão da IFT-WT que resultam em (c).

(40)

na fronteira do objeto de interesse (Figura 3.4c). O objeto é definido pela floresta de caminhos ótimos enraizada nospixels do conjunto de marcadores internos. Três imagens desse processo são apresentadas nas Figuras 3.4d-3.4f.

No presente trabalho, a etapa de segmenta¸cão foi subdividida em módulos com o in-tuito de obtermos o melhor conjunto de marcadores internos e externos, conforme ilustrado na Figura 3.5. Embora a face e o fundo possuam tonalidades de cinza bastante distintas em imagens infravermelhas (Figura 3.3b), a grande maioria delas é composta não apenas pela face, mas também pelo pesco¸co e ombros, os quais também possuempixels com tons de cinza muito próximos aos da face propriamente dita. Assim, essa subdivisão da etapa de segmenta¸cão objetiva a extra¸cão somente da face, a qual será utilizada como entrada para o processo de classifica¸cão das regiões isotérmicas, conforme ilustrado na Figura 3.2.

Figura 3.5: Vis˜ao geral da etapa de segmenta¸c˜ao.

As pr´oximas etapas tratam de descrever cada um dos m´odulos separadamente.

3.2.1 Binariza¸

c˜

ao da imagem

O método proposto pelo presente projeto de pesquisa consiste em várias etapas que per-mitem segmentar a face automaticamente. Para tal, primeiramente foi definido um limiar para realizar a binariza¸cão da imagem. A primeira abordagem testada foi a utiliza¸cão de um limiar fixo, o qual não obteve bons resultados, conforme ilustra a Figura 3.6a.

(41)

a média, mediana e o valor máximo da primeira linha da imagem. Como esta última op¸cão foi a que obteve melhores resultados (Figura 3.6d), o valor do limiar foi então definido pelo valor máximo entre o valor dado pelo método de Otsu e o valor máximo da primeira linha da mesma. A ideia de utilizar o valor máximo da primeira linha da imagem original reside no fato da necessidade de termos uma estimativa do valor do fundo da imagem. Dado que a obten¸cão de imagens faciais termais em ambiente controlado permite que os tons de cinza dospixels correspondentes ao fundo da imagem não variem muito. Assim, uma busca na primeira linha da imagem já é o suficiente para termos um valor de limiar aproximado que permita a diferencia¸cão do fundo e do objeto de interesse, no caso a face.

(a) (b)

(c) (d)

(e)

(42)

3.2.2 Filtragem morfol´

ogica

Embora o processo de binariza¸cão descrito acima fosse o que melhor obteve os resultados, as imagens resultantes desta etapa poderiam conter ainda algumas imperfei¸cões, tais como pontos irrelevantes e falhas na região de interesse, conforme ilustrado na Figura 3.6d. Com o intuito de contornar tal problema, foram executadas opera¸cões de abertura e fechamento morfológicas nas imagens da base de dados através da filtragem por reconstru¸cão mor-fológica, obtendo bons resultados (Figura 3.6e). O princ´ıpio destas opera¸cões consiste em filtrar a imagem original com outra menor, denominada elemento estruturante. A Figura 3.7 apresenta exemplos de elementos estruturantes em uma vizinhan¸ca 3x3.

(a) (b)

Figura 3.7: Elementos estruturantes: (a) 4-conexo e (b) 8-conexo.

A opera¸cão de erosão em uma dada imagem bináriaI é executada realizando-se uma varredura na imagem e comparando-a com o elemento estruturanteB, gerando a imagem erodidaJ. Ou seja, para cadapixel pde um objeto na imagemI, o elemento estruturante é centrado neste pixel e caso exista a ocorrência do elemento estruturante na imagem, o mesmo é selecionado para a imagemJ. Já para a opera¸cão de dilata¸cão, para cadapixel

pde um objeto da imagemI, é aplicado o elemento estruturante centrado nessepixel na imagem J. Exemplos da aplica¸cão destas opera¸cões utilizando o elemento estruturante da Figura 3.7a são ilustrados na Figura 3.8.

A reconstru¸cão morfológica é uma opera¸cão conexa, monotônica e idempotente, que envolve duas imagens de entrada, uma máscara Î = (DI, I) e uma marcadora ˆJ = (DI, J) e um elemento estruturante planar (isto é, rela¸cão de adjacência A). A reconstru¸cão é dita superior quandoJ(p) _≥ I(p) para todo p _∈ DI e inferior quando J(p) ≤ I(p) para todop_∈DI.

(43)

(a) (b)

(c) (d)

Figura 3.8: Imagem: (a) original e (b) o resultado da opera¸cão de erosão utilizando um elemento estruturante 4-conexo, (c) original e (d) o resultado da opera¸cão de dilata¸cão utilizando um elemento estruturante 4-conexo.

mapa de conexidadeV (resultado da reconstru¸c˜ao) usando fun¸c˜aofrsup, dada por:

frsup(q) = J(q) (3.2)

frsup(πp· p, q) = max{frsup(πp), I(q)}. (3.3) A imagem ˆJ pode ser gerada a partir da imagem Î aplicando-se uma abertura mor-fológica (erosão seguida de dilata¸cão por A), nos quais os domos de altura menor que o elemento estruturante são removidos (abertura por reconstru¸cão). A implementa¸cão da reconstru¸cão inferior é dada por uma maximiza¸cão de V (resultado da reconstru¸cão) usando a fun¸cão frinf:

frinf(q) = J(q) (3.4)

frinf(πp· p, q) = min{frinf(πp), I(q)}. (3.5) A Figura 3.9 ilustra uma imagem e os resultados da aplica¸c˜ao de opera¸c˜oes de abertura e fechamento utilizando um elemento estruturante 8-conexo.

Em ambos casos, a rela¸cão de adjacência geralmente utilizada é a 4-vizinhan¸ca.

3.2.3 Localiza¸

c˜

ao da elipse

(44)

(a) (b) (c)

Figura 3.9: Imagem: (a) original. (b) abertura e (c) fechamento. Extra´ıdo de [1].

imagem binarizada. Nesta fase, um dos grandes problemas encontrados é o fato de muitas imagens resultantes do processo de binariza¸cão e abertura e fechamento conterem outras regiões do corpo de uma pessoa, conforme ilustrado pela Figura 3.10a, e não somente a face, induzindo o algoritmo a encontrar uma elipse maior do que deveria (Figura 3.10b).

Desta forma, foi necessária a imposi¸cão de restri¸cões de busca para que a elipse fosse encontrada corretamente. Assim, foi definida uma rela¸cão entre o tamanho dos eixos horizontal e vertical, sendo que esta rela¸cão parte do princ´ıpio que uma face humana, em sua grande maioria, não possui largura maior do que o seu comprimento e também o seu comprimento não é duas vezes maior do que a sua largura. Além disto, o valor da rela¸cão varia iterativamente cada vez que uma elipse é encontrada. Isto induz o algoritmo a buscar elipses de acordo com as caracter´ısticas definidas pela face em questão (Figura 3.10c).

Entretanto, para algumas imagens, ainda que limitando o tamanho da elipse, o al-goritmo ainda selecionava elipses na região do corpo do indiv´ıduo (Figura 3.10e). Para resolver este problema, foi estabelecido um valor máximo da posi¸cão do centro da elipse para evitar que fossem levadas em considera¸cão elipses com centro próximas à região do pesco¸co ou mesmo abaixo dela, dado que as face estão normalmente localizadas em uma determinada região da imagem (Figura 3.10f).

Finalmente, para evitar a sele¸cão de uma elipse com orienta¸cão acentuada (Figura 3.10h), foram definidos limites superior e inferior, haja vista que a face não possui grande varia¸cão em sua orienta¸cão. Tal restri¸cão faz com que a elipse encontrada seja de acordo com a orienta¸cão da face (Figura 3.10i).

As elipses foram encontradas utilizando-se a IFT-Euclideana proposta por Andaló et al. [31], a qual é baseada no método proposto por Punam [32], a qual tenta encontrar a maior elipse dentro de uma região homogênea com centro em um ponto que pertence a esta região. A elipse é definida tra¸cando-se n retas em um dado pixel dentro da região homogênea, de 0 a 179 graus. Em seguida, os eixos da elipse são determinados percorrendo, a partir do centro da elipse, pelas retas alternadamente e ao mesmo tempo em sentidos opostos, até algum dos segmentos de rede encontrar a borda do objeto.

(45)

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

Figura 3.10: (a), (d) e (g) Imagens após a execu¸cão das etapas de binariza¸cão e abertura e fechamento descritas nas Se¸cões 3.2.1 e 3.2.2, respectivamente. (b) Localiza¸cão da elipse em (a) sem restri¸cões de busca e (c) com restri¸cão de tamanho máximo da elipse. (e) Localiza¸cão da elipse em (d) sem restri¸cão e (f) com restri¸cão de localiza¸cão espacial do centro da elipse. (h) Localiza¸cão da elipse em (g) sem restri¸cão e (i) com restri¸cão de orienta¸cão da elipse.

existe a necessidade de procurar por pontos de borda dentro da circunferˆencia com raio

C(p) (Figura 3.11a).

A IFT-Euclideana define os elementos do contorno da região homogênea como o con-junto de sementes. A seguir, para cada ponto nesta região é calculada a distância eu-clideana entre o pixel p e as sementes que são interceptadas pelas n retas. O segundo passo é feito encontrando-se a elipse com maior área centrada em cada pixel p. Ao final do processo, é escolhida a elipse de maior área entre todas as elipses encontradas.

(46)

longo de retas, alternadamente. Nesta abordagem, o algoritmo salta as retas ao longo do c´ırculo e visita ospixels qerao mesmo tempo (Figura 3.11b). A localiza¸cão de pontos de borda continua fora da área definida pelo custoC(p) na Figura 3.11b e o valor m´ınimo entre C(r) e C(q) indica a localiza¸cão para o próximo salto. Estes saltos poderiam continuar iterativamente até que o ponto de borda mais próximo ao longo da reta fosse encontrado.

(a) (b) (c)

Figura 3.11: Exemplo de otimiza¸c˜ao feita utilizando a IFT-Euclideana: (a) Primeiro, (b) Segundo e (c) Terceiro passos.

3.2.4 Marcadores

O próximo passo consiste em executar a segmenta¸cão através da IFT-WT, a qual requer a utiliza¸cão de marcadores internos e externos. Definida a elipse (Figura 3.13d), são executadas opera¸cões de erosão e dilata¸cão na mesma para encontrar as elipses interna e externa (Figura 3.13e), as quais serão utilizadas como marcadores internos e externos, respectivamente. Isso elimina a necessidade de sele¸cão manual de marcadores por parte do usuário. A segmenta¸cão é então realizada utilizando os marcadores na imagem gradiente (Figura 3.13f), obtendo a imagem dada pela Figura 3.13g.

Um dos grandes problemas desta etapa reside na segmenta¸cão na região do pesco¸co, a qual é uma localidade que possui uma varia¸cão de intensidade de brilho muito pequena com rela¸cão ao restante do pesco¸co e ombros, os quais foram eliminados na etapa de localiza¸cão da elipse. Assim, essa região é de dif´ıcil segmenta¸cão, podendo até eliminar por¸cões da face, conforme ilustrado na Figura 3.12a.

(47)

Além disto, para melhorar a extra¸cão da face, foi aplicada também a segmenta¸cão na imagem binarizada e em seguida efetuada a fusão dos resultados. Isto é realizado aplicando o operador E lógico (AND) nas imagens, ou seja, os pixels selecionados da imagem segmentada são ospixels maiores do que zero encontrados nas duas imagens. As Figuras 3.13h e 3.13i ilustram as imagens binarizada (também segmentada) e a resultante após o processo de fusão, respectivamente. Contudo, este procedimento acrescentou erros nos casos em que a imagem da face possu´ıa uma baixa intensidade de brilho, ou seja, imagens nas quais a face apresentava certa quantidade de áreas escuras. Esta estimativa é feita utilizando a localiza¸cão dos marcadores internos e verificando se existem regiões escuras que são interceptadas por esses marcadores. Caso haja uma região de tamanho considerável (definida por um valor), a fusão não é realizada.

(a) (b)

Figura 3.12: Segmenta¸c˜ao da face. (a) Sem deslocamento dos marcadores internos. (b) Com deslocamento vertical dos marcadores internos.

3.2.5 P´

os-processamento

A última etapa para a extra¸cão da face consiste em um pós-processamento da face segmen-tada no passo anterior, dado que algumas imagens ainda possuem certas imperfei¸cões. A ideia consiste em obter a máscara binária da imagem segmentada (Figura 3.13j) e em seguida executar a etapa de localiza¸cão da elipse novamente nessa máscara, de maneira similar à descrita na Se¸cão 3.2.3. Porém, as restri¸cões de busca devem ser reajustadas, dado que afetam diretamente a precisão da localiza¸cão da elipse, haja vista que a imagem agora utilizada para a localiza¸cão da mesma contém menos informa¸cões que a imagem original, ou seja, é esperado que elas já não contenham mais a região abaixo do pesco¸co e ombros.

(48)

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)

(49)

elipses descrito na Se¸cão 3.2.3 objetive encontrar a maior elipse com certas restri¸cões dentro do objeto de interesse, eventualmente algumas partes da elipse situam-se para fora do mesmo, dado que a técnica original proposta por Andaló et al. [31] foi embasada em modelos cont´ınuos. Nesse processo, as dimensões da elipse são reduzidas com o intuito de encontrar as que estivessem com menos de 60% de sua área fora da região segmentada. A Figura 3.14a apresenta uma imagem da face sem o pós-processamento, ou seja, sem ajuste da máscara.

Outra medida que também contribuiu para a melhoria da etapa de pós-processamento foi o ajuste do centro da elipse no eixo vertical. Isto é feito estimando-se o deslocamento da máscara em rela¸cão à região segmentada, através do cálculo do número de pixels da máscara que ficam acima e abaixo do centro da elipse. A Figura 3.14b mostra a aplica¸cão da máscara ajustada à imagem da face extra´ıda.

(a) (b)

Figura 3.14: Segmenta¸cão da face (a) sem pós-processamento e (b) com ajustes da etapa de pós-processamento.

O resultado final é então obtido aplicando a máscara à imagem equalizada (Figura 3.13k), obtendo a face segmentada (Figura 3.13l). A Figura 3.13 ilustra todo o processo de seg-menta¸cão da face descrito até o momento.

3.3 Classiﬁca¸

c˜

ao das regi˜

oes isot´

ermicas

(50)

(a) (b) (c)

(d) (e) (f)

Figura 3.15: (a) Imagem facial segmentada. Regiões isotérmicas classificadas de acordo com diferentes tonalidades de cinza (temperaturas) em (b) e (c), e suas respectivas carac-teriza¸cões por esqueletoniza¸cão em (d) e (e). Fusão final dos diferentes esqueletos em (f). As imagens foram adaptadas de Akhloufi e Bendada [2].

A abordagem proposta pelo presente projeto de pesquisa para esta etapa contempla a identifica¸cão das regiões isotérmicas utilizando classificador OPF não supervisionado descrito na Se¸cão 2.2.1. O ponto positivo de tal abordagem é que ela agrupa todas as regiões isotérmicas da imagem com apenas uma única execu¸cão do seu algoritmo, não necessitando de diversas execu¸cões para o agrupamento das regiões isotérmicas, como utilizado por Akhloufi e Bendada [2].

O primeiro experimento foi realizado utilizando apenas a intensidade de brilho de cada pixel como seu vetor de atributos. Entretanto, essa escolha nos levou a uma supersegmen-ta¸cão da imagem (Figura 3.16a), dado que essa metodologia não leva em considera¸cão o tom de cinza dos pixels vizinhos. Assim, o vetor de caracter´ısticas adotado para cada amostra foi composto pelo seu tom de cinza em conjunto com os valores dos brilhos dos seus vizinhos (8-vizinhan¸ca). A Figura 3.16b ilustra as regiões isotérmicas agora classifi-cadas de uma forma mais coerente.

(51)

(a) (b)

Figura 3.16: Classifica¸cão das regiões isotérmicas: (a) supersegmenta¸cão e (b) regiões isotérmicas classificadas de uma maneira mais coerente.

pixels da imagem. Entretanto, essa solu¸cão é inviável em termos computacionais.

Frequentemente, após a classifica¸cão das regiões isotérmicas, aparecem ainda alguns pontos isolados (Figura 3.17a), os quais poderiam prejudicar o processo de caracteriza¸cão das regiões isotérmicas, sendo necessária a sua elimina¸cão. Tais pontos podem ser definidos como pixels que possuem classifica¸cão diferente de seus 4-vizinhos. Assim, a estratégia adotada para a elimina¸cão desses pontos foi atribuir a eles a classe de maior ocorrência entre os seus 8-vizinhos (filtro da moda). Contudo, para evitar que este pixel continue sendo um ponto isolado, a classe de maior ocorrência escolhida deve estar contida entre seus 4-vizinhos, ou seja, o novo valor dopixel deve ser igual a um de seus 4-vizinhos. Caso ocorra empate, opixel será classificado pelo primeiro vizinho encontrado. A Figura 3.17b apresenta a imagem após esse processo de elimina¸cão de pontos isolados.

3.4 Caracteriza¸

c˜

ao das regi˜

oes isot´

ermicas

A última parte do sistema consiste na caracteriza¸cão das regiões isotérmicas através de sua esqueletoniza¸cão. Dado um contorno fechado, seu esqueleto interno é definido como o lugar geométrico dos centros dos discos de raios máximos contidos no contorno. Note que estes discos tocam o contorno em mais de um ponto, mas sem cruzamentos, e que o esqueleto interno é definido como a fronteira entre regiões formadas por pixels mais próximos de um ponto do contorno do que dos outros. Uma defini¸cão similar é válida para o esqueleto externo [33].

(52)

(a) (b)

Figura 3.17: Elimina¸cão de pontos isolados: (a) imagem original e (b) imagem após a filtragem dos pontos isolados.

posterior utiliza¸cão na tarefa de reconhecimento de padrões. Entretanto, as principais dificuldades encontradas são a obten¸cão de esqueletos conexos e sem ramos irrelevantes para uma descri¸cão eficiente de sua forma. Foi utilizado no presente trabalho a técnica de esqueletoniza¸cão utilizando a IFT [21].

Considere uma imagem binária Î = (DI, I) com um único objeto, representado por um único contorno fechado. Seja ˆL = (DI, L) uma imagem rotulada tal que L(p) = 0 para pixels p _∈ DI que não pertencem ao contorno e L(pi) = i para pixels p ∈ DI que pertencem ao contorno, onde i = 1,2, . . . , n e n corresponde ao número de pixels do contorno. Sejam dois pixels p = (xp, yp) e q = (xq, yq) em uma imagem. A fun¸cão de custofeucl é dada por:

feucl(q) =

0 se q_∈S, +_∞ caso contr´ario

feucl(πp· p, q) =

xorg(πp)−xq)

2 +

yorg(πp)−yq

2

, (3.6)

ondeorg(πp) corresponde ao pixel inicial do caminho ótimoπp. Assim sendo, a IFT com rela¸cão de adjacência-8, fun¸cão de conexidadefeucl e conjuto de sementesS representadas pelos pixels do contorno, propaga em ˆL os rótulos i de cada pixel pi de acordo com a transformada de distância euclideana.