• Nenhum resultado encontrado

RECONHECIMENTO DE INDIVÍDUOS ATRAVÉS DA ÍRIS USANDO VETOR NOVIDADE

N/A
N/A
Protected

Academic year: 2021

Share "RECONHECIMENTO DE INDIVÍDUOS ATRAVÉS DA ÍRIS USANDO VETOR NOVIDADE"

Copied!
71
0
0

Texto

(1)

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

RECONHECIMENTO DE INDIVÍDUOS ATRAVÉS DA ÍRIS

USANDO VETOR NOVIDADE

CLÁUDIO FRANKLIN MARTINS PINHEIRO

MANAUS

2010

(2)

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

CLÁUDIO FRANKLIN MARTINS PINHEIRO

RECONHECIMENTO DE INDIVÍDUOS ATRAVÉS DA ÍRIS

USANDO VETOR NOVIDADE

Dissertação apresentada ao Programa de Pós-Graduação Strictu Sensu em Engenharia Elétrica da Universidade Federal do Amazonas, como requisito parcial para obtenção de título de Mestre em Engenharia Elétrica, área de concentração Controle e Automação de Sistemas.

Orientador: Prof. Dr. Marly Guimarães Fernandes Costa

Co-orientador: Prof. Dr. Cícero Ferreira F. Costa Filho

MANAUS

2010

(3)

Ficha Catalográfica

(Catalogação realizada pela Biblioteca Central da UFAM)

P654r

Pinheiro, Cláudio Franklin Martins

Reconhecimento de indivíduos através da íris usando vetor novidade / Cláudio Franklin Martins Pinheiro. – Manaus: UFAM, 2010.

69 f.; il. color.

Dissertação (Mestrado em Engenharia Elétrica) –– Universidade Federal do Amazonas, 2010.

Orientadora: Profª. Dra. Marly Guimarães Fernandes Costa Co-orientador: Prof. Dr. Cícero Ferreira F. Costa Filho

1. Sistemas biométricos 2. Reconhecimento da íris 3. Filtros de novidadeI. Costa, Marly Guimarães Fernandes II. Costa Filho, Cícero Ferreira F. III. Universidade Federal do Amazonas IV. Título

(4)
(5)
(6)

AGRADECIMENTOS

A realização deste trabalho não seria possível sem as várias colaborações diretas e indiretas que me foram oferecidas. Desta forma presto meus sinceros agradecimentos a todos que me ajudaram nesta conquista.

Primeiramente agradeço à minha orientadora Marly Guimarães F. Costa por ter depositado em mim sua confiança pelo seu constante esforço para que fizéssemos um bom trabalho.

Ao professor Cícero F. F. Costa Filho que, como meu co-orientador, contribuiu com várias questões essenciais para o desenvolvimento deste trabalho.

Aos amigos de mestrado, em especial Charles Melo e Almir Kimura, pelo freqüente apoio durante as dificuldades do curso.

Ao Centro de Ciência, Tecnologia e Inovação do Pólo Industrial de Manaus – CT-PIM pelo apoio e investimento na minha qualificação, me liberando de horas de trabalho pra que eu pudesse me dedicar às atividades do mestrado. E também aos colegas de trabalho que sempre me apoiaram.

Ao Centro de Pesquisa e Desenvolvimento de Tecnologia Eletrônica e da Informação – CETELI-UFAM pela disponibilização da infra-estrutura física e laboratorial necessárias ao desenvolvimento desse trabalho.

Por fim, meu agradecimento especial à minha amada companheira Susy Freitas, pelo carinho, incentivo e apoio, além da compreensão nos momentos em que este trabalho nos privou de estarmos juntos.

(7)

RESUMO

A utilização da íris como parâmetro biométrico em sistemas de reconhecimento de indivíduos tem recebido crescente atenção por parte tanto da indústria quanto da academia, e muito esforço tem sido empregado para o desenvolvimento de novas técnicas em busca de bons resultados. Neste trabalho é proposto um classificador baseado no conceito de Filtro de Novidade para aplicação em sistemas de reconhecimento. Utilizando imagens de íris segmentadas do banco de imagens UBIRIS, são realizadas simulações de sistemas de verificação e identificação usando o classificador proposto, além de testes comparativos com uso da distância de Hamming. Diferentes técnicas são usadas para a obtenção do vetor de característica que representa a íris, tais quais os próprios níveis de intensidade das imagens, e os coeficientes da decomposição wavelet. Empregando técnicas de avaliação de sistemas biométricos, como as curvas ROC e CMC, são obtidas valores de EER de até 2,82 para verificação e taxas de identificação de até 97,97% para identificação. Os mesmos testes são realizados utilizando-se a distância de Hamming, resultando em EER de no mínimo 7,07% e taxas de identificação até 85,13%.

(8)

ABSTRACT

The use of iris as a biometric parameter for recognition systems has been received growing attention from both industry and researchers, and a lot of effort has been put into developing new techniques in order to improve results. This work proposes a new classifier based on Novelty Filter concepts for using in recognition systems. By using segmented iris images from UBIRIS database, several simulations of verification and identification systems are performed using the proposed classifier, in addition to comparative tests using Hamming Distance. Different techniques are used to obtain a feature vector for iris representation, such as taking intensity levels directly from image and the output coefficients of the discrete wavelet transform. Evaluation techniques for biometric systems, such as ROC and CMC curves, are used for evaluating the system’s performance. For verification modes they are obtained a minimum EER value of 2,82% and for identification, simulations resulted in identification taxes up to 97,97%. The same tests are made when using Hamming distance as classifier. In this case, the minimum value for EER is 7,07%, and identification taxes are up to 85,13%.

(9)

LISTA DE FIGURAS

Figura 2.1 - Exemplo de imagem disponível no banco CASIA v1.0 ...14

Figura 2.2 - Pré-processamento da imagem capturada do olho de um indivíduo. ...15

Figura 2.3 - Representação numérica da Íris ...17

Figura 2.4 - Ilustração da distância de Hamming ...19

Figura 3.1 - Diagrama do algoritmo da decomposição da Transformada Wavelet 2D ...22

Figura 3.2 – Ilustração da Aplicação da transformada wavelet 2D em um nível...23

Figura 3.3 - Projeções ortogonais em R3 (um vetor x decomposto como x = xˆ + x~ )...24

Figura 3.4 - Distribuição de probabilidade para clientes e impostores ...28

Figura 3.5 - Variação da FAR e da FRR em função do limiar ...29

Figura 3.6 - Curva ROC para três casos fictícios distintos...29

Figura 3.7 - Exemplo de Watchlist ROC ...31

Figura 3.8 – Exemplo de Curva CMC típica...33

Figura 4.1 - Configuração de captura da imagem para a sessão 1 do banco UBIRIS...35

Figura 4.2 - Imagens não utilizadas. Fonte: Banco de imagens UBIRIS ...36

Figura 5.1 - Etapas do processo de reconhecimento ...37

Figura 5.2 - Determinação da região de interesse ...38

Figura 5.3 – Separação da ROI a partir da imagem normalizada da íris...39

Figura 5.4 - Vetor de característica usando níveis de intensidade da imagem...40

Figura 5.5 - Aplicação da decomposição wavelet. (a) Nível 3. (b) Nível 4 ...41

Figura 6.1 - Curva ROC – Caso 1: Escala de Cinza, 3 imagens por base...46

Figura 6.2 - Curva ROC -Componentes RGB – Caso 2 (R), Caso 3 (G) e caso 4 (B), 3 imagens por base. ...47

Figura 6.3 - Curva ROC – Caso 5: Escala de Cinza, 4 imagens por base...48

Figura 6.4 - Curva ROC – Componentes RGB – Caso 6 (R), Caso 7 (G) e caso 8 (B), 4 imagens por base. ...49

Figura 6.5 - Curva ROC: Wavelet nível 4, Caso 9 (Vertical), Caso 10 (horizontal) e Caso 11 (Diagonal) utilizando-se 3 imagens por base. (a) Sessão 1da UBIRIS. (b) Sessão 2 da UBIRIS ...50

Figura 6.6 - Curva ROC: Wavelet nível 3, Caso 12 (Vertical), Caso 13 (horizontal) e Caso 14 (Diagonal) utilizando-se 3 imagens por base. (a) Sessão 1da UBIRIS. (b) Sessão 2 da UBIRIS ...51

Figura 6.7 - Curva CMC - Escala de Cinza, Caso 1: 3 imagens por base e Caso 5: 4 imagens por base. (a) Sessão 1da UBIRIS. (b) Sessão 2 da UBIRIS ...55

Figura 6.8 - Curva CMC - Componentes RGB – Caso 2 (R), Caso 3 (G) e caso 4 (B), com 3 imagens por base. (a) Sessão 1da UBIRIS. (b) Sessão 2 da UBIRIS...56

Figura 6.9 - Curva CMC - Componentes RGB – Caso 6 (R), Caso 7 (G) e Caso 8 (B), com 4 imagens por base. (a) Sessão 1da UBIRIS. (b) Sessão 2 da UBIRIS...57

Figura 6.10 - Curva CMC: Wavelet nível 4, com 3 imagens por base. Caso 9 (Vertical), Caso 10 (Horizontal) e Caso 11 (Diagonal) . (a) Sessão 1da UBIRIS. (b) Sessão 2 da UBIRIS ...58

Figura 6.11 - Curva CMC: Wavelet nível 3, com 3 imagens por base. Caso 12 (Vertical), Caso 13 (Horizontal) e Caso 14 (Diagonal) . (a) Sessão 1da UBIRIS. (b) Sessão 2 da UBIRIS ...59

(10)

LISTA DE TABELAS

Tabela 4.1 - Resultado da segmentação automática...35

Tabela 4.2 – Total de imagens utilizadas no desenvolvimento do método de reconhecimento proposto ...36

Tabela 6.1 – Descrição dos testes realizados...44

Tabela 6.2 - Total de verificações realizadas ...45

Tabela 6.3 - Valores obtidos de AUC e EER ...52

Tabela 6.4 - Número de possíveis bases por indivíduo em função do número de imagens por indivíduos ...53

Tabela 6.5 - Tamanho do conjunto de prova e número de galerias...54

Tabela 6.6 - Taxas de identificação obtidas para rank 1 ...60

Tabela 6.7 - Valores obtidos de AUC e EER usando Distância de Hamming ...61

(11)

LISTA DE SIGLAS

AUC Area Under Curve CAR Correct Acceptance Rate

CASIA Chinese Academy of Sciences – Institute of Automation CMC Cumulative Match Characteristic

CRR Correct Rejection Rate DWT Discrete Wavelet Transform EER Equivalent Error Rate FAR False Acceptance Rate FRR False Rejection Rate

HD Hamming Distance

LDA Linear Discriminat Analysis PNN Probabilistic Neural Network ROC Receiver Operating Characteristic ROI Region Of Interest

(12)

SUMÁRIO

1 INTRODUÇÃO ... 11

1.1 A ÍRIS HUMANA... 11

1.2 BIOMETRIA UTILIZANDO A ÍRIS... 12

1.3 OBJETIVO GERAL... 12

1.4 OBJETIVOS ESPECÍFICOS... 12

2 O PROCESSO DE RECONHECIMENTO DE INDIVÍDUOS ATRAVÉS DA ÍRIS ... 13

2.1 AQUISIÇÃO DE IMAGEM... 13 2.1.1 Bancos de Imagens... 14 2.2 PRÉ-PROCESSAMENTO... 15 2.3 EXTRAÇÃO DE CARACTERÍSTICA... 17 2.4 CLASSIFICAÇÃO... 19 3 FUNDAMENTAÇÃO TEÓRICA ... 21 3.1 TRANSFORMADA WAVELET... 21 3.2 FILTRO DE NOVIDADE... 23

3.2.1 Aplicações do filtro de novidade... 24

3.3 SISTEMAS BIOMÉTRICOS... 25

3.3.1 Desempenho de Sistemas Biométricos de Verificação ... 26

3.3.2 Desempenho de Sistemas Biométricos de Identificação... 30

4 MATERIAIS... 34

4.1 O BANCO DE IMAGENS DA UBIRIS ... 34

4.2 SEGMENTAÇÃO AUTOMÁTICA DA ÍRIS... 35

4.3 SEGMENTAÇÃO MANUAL DAIRIS... 35

5 METODOLOGIA ... 37

5.1 EXTRAÇÃO DE CARACTERÍSTICA... 37

5.1.1 Vetor de características usando Níveis de intensidade... 39

5.1.2 Vetor de características usando Decomposição wavelet ... 40

5.2 ASSINATURA DO INDIVÍDUO (BASE)... 42

5.2.1 Algoritmo para composição das bases ... 42

5.3 OBTENÇÃO DO VETOR NOVIDADE... 43

6 TESTES EXPERIMENTAIS... 44

6.1 VERIFICAÇÃO... 45

6.1.1 Resultados da Verificação: Curvas ROC ... 46

6.1.2 Resultados da Verificação: AUC e EER ... 52

6.2 IDENTIFICAÇÃO... 53

6.2.1 Resultados da Identificação: Curva CMC... 54

6.2.2 Resultados da identificação: Rank-One... 60

6.3 TESTES USANDO DISTÂNCIA DE HAMMING... 61

7 DISCUSSÃO DOS RESULTADOS... 62

8 CONCLUSÃO ... 64

(13)

1 INTRODUÇÃO

Atualmente, vem crescendo cada vez mais a importância de métodos para se determinar a identidade de pessoas, seja para restringir o acesso à ambientes seguros ou informações, ou ainda para questões de segurança pública, como identificação de criminosos. Métodos tradicionais de identificação de indivíduos são baseados no que uma pessoa possui (uma chave física, um cartão de identificação) ou no que a pessoa sabe (uma palavra secreta, por exemplo). É sabido, no entanto, que esses métodos têm alguns problemas; uma chave pode ser perdida, uma senha pode ser esquecida. Tais problemas nos levam a pensar em métodos de identificação baseados em características inerentes ao indivíduo, que não sejam tão voláteis.

A Biometria busca a identificação (ou verificação) automática de um indivíduo (ou uma identidade reivindicada) pelo uso de certos traços físicos ou comportamentais associados à pessoa. Pelo uso da biometria é possível estabelecer uma identidade baseada em “quem é você” em vez de “o que você tem” (por exemplo, um cartão de identificação) ou “o que você lembra” (por exemplo, uma senha). Nas últimas décadas, a identificação pessoal baseada em uma característica biométrica tem tido um crescente interesse por parte tanto da academia quanto da indústria. Estão disponíveis no mercado e/ou estão sendo pesquisados e desenvolvidos novos sistemas biométricos para identificação humana que usam, por exemplo, impressões digitais, geometria da mão, íris, retina, face, assinatura, impressão das mãos, padrões de voz. Dentre essas características físico-comportamentais a identificação através da íris vem ganhando bastante destaque.

1.1 A ÍRIS HUMANA

A íris, uma membrana localizada entre a córnea e o cristalino, é responsável pelo controle da quantidade de luz que atinge a retina. Em sua estrutura há músculos responsáveis por expandir ou contrair a abertura localizada eu seu centro, a pupila, conforme a necessidade de luz. A cor dos olhos de uma pessoa é a própria coloração da íris.

Basicamente duas regiões compõem a íris; a Zona Pupilar, mais interna e próxima a pupila, e a Zona Ciliar, mais externa, conectada ao músculo ciliar. As duas regiões são

(14)

divididas por uma fina camada chamada collarette (WILDES, 1997). Essas regiões formam a complexa textura da íris, que possui um padrão extremamente particular, diferindo inclusive entre os olhos esquerdo e direito de uma mesma pessoa (FLOM et al, 1987). Tal fato credencia o seu uso em sistemas biométricos.

1.2 BIOMETRIA UTILIZANDO A ÍRIS

Os primeiros passos no campo de identificação de indivíduos através a íris foram dados pelo oftalmologista Franck Burch, em 1936. Em 1987 os oftalmologistas Aran Safir e Leonard Flom patentearam um algoritmo para a identificação de indivíduos através da íris. Todo esse interesse se deve ao fato deste órgão humano possuir uma estrutura particular em cada individuo, estimando-se que a probabilidade de duas pessoas possuírem íris semelhantes seja em torno de 1 em 1072 (FLOM et al, 1987).

1.3 OBJETIVO GERAL

O presente trabalho objetiva o desenvolvimento de uma nova técnica automatizada para identificação humana através de imagens pré-processadas de sua íris, utilizando métodos computacionais e fundamentos algébricos.

1.4 OBJETIVOS ESPECÍFICOS

Entre os objetivos específicos temos a implementação do Filtro de Novidade como classificador, e o uso do mesmo em sistemas biométricos, simulação de tais sistemas e a avaliação de seu desempenho. Além disso, podemos realizar uma comparação com métodos existentes.

(15)

2 O PROCESSO DE RECONHECIMENTO DE INDIVÍDUOS

ATRAVÉS DA ÍRIS

Muito se tem feito nos últimos anos no campo do reconhecimento de padrões aplicado a identificação de indivíduos através de suas íris. Em decorrência, uma variedade de trabalhos pode ser encontrada em bases de dados literárias como Engineering Village ou IEEEXplore. Dessa forma, e utilizando as bases de dados literárias citadas, foi realizada uma busca bibliográfica a respeito do tema “identificação automática de indivíduos através de íris” com o fim de justificar e balizar o desenvolvimento do trabalho proposto.

Neste capítulo são discutidos alguns pontos importantes desses trabalhos, visando sintetizar o que vem sendo feito neste campo de estudo, além detalhar seus principais aspectos. Um ponto em comum encontrado nos vários trabalhos lidos se refere à seqüência de procedimentos que compõe um sistema de reconhecimento por imagens, que pode ser resumido em três fases: Aquisição da imagem, Pré-processamento, Extração de característica e Classificação.

A seguir, apresenta-se, de forma sumariada, um relato dos métodos propostos para cada uma das fases típicas do sistema de reconhecimento referidas acima. Também são apresentados os bancos de imagens oculares mais utilizados para teste e validação dos métodos propostos.

2.1 AQUISIÇÃO DE IMAGEM

Como estágio inicial no processo, é de suma importância um bom sistema de captura de imagens da íris de um indivíduo. Os trabalhos desenvolvidos nessa área tendem a se concentrar em dois pontos. O primeiro consiste no desenvolvimento de técnicas de captura de imagens que sejam menos intrusivas, por exemplo, evitando a exposição do olho à excessiva iluminação, e também procurando cada vez mais a menor cooperação do indivíduo, como a necessidade do indivíduo permanecer imóvel ou abrir bem os olhos.

O outro ponto é a utilização de métricas para a avaliação da qualidade das imagens capturadas, podendo classificá-las como boas ou ruins para um sistema de reconhecimento, por exemplo, a verificação do foco das imagens (BOWYER et al, 2007).

(16)

2.1.1 BANCOS DE IMAGENS

Para fins possibilitar a comparação entre os resultados de pesquisa em reconhecimento de indivíduos através da íris, alguns grupos e instituições produziram e disponibilizam bancos de imagens. A maioria das propostas de utilização da íris na identificação de indivíduos encontrada na literatura faz uso de um desses bancos na validação das técnicas desenvolvidas. O banco mais amplamente usado nos trabalhos lidos foi o produzido pela Chinese Academy of Sciences – Institute of Automation (CASIA), que é formado por 756 imagens em escala de cinza de 108 indivíduos diferentes, sendo sete imagens por indivíduos (ELSHERIEF et al, 2006).

Figura 2.1 - Exemplo de imagem disponível no banco CASIA v1.0

Uma característica que levanta algumas incertezas quanto aos resultados obtidos de testes com este banco é que em suas imagens, as áreas da pupila foram substituídas por um círculo preto, a fim de eliminar os problemas com a reflexão de luz na pupila. Dessa forma a segmentação é artificialmente facilitada (BOWYER et al, 2007).

Outro banco de imagens que vem ganhado destaque é o do Departamento de Informática da Universidade da Beira Interior (UBIRIS), que é composto por mais de 2500 imagens tanto em escala de cinza como imagens true-color. A maior particularidade deste banco é que ele foi construído com o intuito de minimizar a cooperação do individuo do qual se está capturando a imagem, diminuindo a necessidade do indivíduo se manter estático, sem mover os olhos, etc. Muitas das imagens que compõem este banco possuem ruídos, problemas

(17)

de foco, e outras adversidades, exigindo uma maior robustez do algoritmo de reconhecimento (PROENÇA et al, 2005).

Há também outros bancos de imagens, como os gerados pelo National Institute of

Standards and Technology (NIST), para os projetos ICE (Iris Challenge Evaluation), como os

desenvolvidos pela Multimedia University, denominados MMU1 e MM2, dentre outros.

2.2 PRÉ-PROCESSAMENTO

Nesse estágio, a imagem é processada de forma a facilitar a extração das características relevantes para a identificação. Como as características relevantes estão localizadas na íris, as imagens são submetidas a um processo de segmentação da íris (extração da região de interesse). Há ainda a necessidade de um processamento, denominado de padronização ou normalização da íris, o qual consiste em ajustar a região segmentada a um tamanho pré-definido, com o fim de tornar possível a comparação entre imagens de diferentes indivíduos ou do mesmo indivíduo capturadas em diferentes condições.

A Figura 2.2(a) ilustra o processo de localização das bordas interna (Pupila - Íris) e externa (Íris - Esclera) da íris em uma imagem ocular de um dado indivíduo. Com a região da íris devidamente localizada, é necessário gerar uma imagem normalizada desta região (Figura 2.2(b)).

(a) (b) Figura 2.2 - Pré-processamento da imagem capturada do olho de um indivíduo.

(a) imagem original com região da íris delimitada. (b) Imagem resultante do processo de normalização da região de interesse segmentada (a íris)

(18)

Várias técnicas são utilizadas para a segmentação da região da íris. Jong-Gook Ko et

al (2007), por exemplo, usam um conjunto de 14 máscaras de tamanho 7x7 pixels para a

detecção das bordas da íris, sendo 8 máscaras para a borda interna, e 6 para a borda externa. Os segmentos detectados relativos à borda interna e à borda externa por esse processo são conectados através de círculos. Para a obtenção da imagem normalizada final, são utilizadas apenas as regiões laterais esquerda (135° ~ 225°) e direita (45° ~ 315°) da íris

Os autores testaram o método em imagens do banco de imagens CASIA. De acordo com resultados apresentados, a íris foi segmentada corretamente em todas as imagens disponíveis.

Elsherief et al (2006) usam uma versão modificada do método de Canny para detecção de bordas a fim de se obter o contorno da íris dentro da imagem e, desta forma, isolar a região de interesse. Com o uso da transformada de Hough circular (Gonzales, Wood, 2008), os segmentos de borda internos e externos (pupila-íris e íris-esclera respectivamente) são conectados. Os melhores resultados apresentados foram taxas de reconhecimento de 99,3% e 93,9% para imagens dos bancos de imagens CASIA quanto o UBIRIS, respectivamente.

Daugman (1993), considerando as bordas da íris como círculos perfeitos, propôs um operador integro-diferencial para a determinação dos parâmetros necessários a definição da íris (coordenadas do centro e raio da circunferência). Esse operador é dado como

( )

( )

∂ ∂ ∗ 0 0 0 0 , , ) , , ( 2 , max y x r y x r ds r y x I r r G π σ , (2.1)

onde Gσ

( )

r é uma função de suavização e I

( )

x,y é a imagem ocular.

Lima (2008) utiliza informações do espaço de cores HSI de imagens oculares coloridas como entrada de uma rede neural para determinação dos pontos pertencentes à pupila. Com auxilio de operações morfológicas a pupila é separada e, em conseqüência, a borda interna da íris é obtida. Para a localização da borda externa, uma segunda rede neural, tendo também como entradas as informações das componentes HSI da imagem, é utilizada em conjunto com um algoritmo para determinar o ponto central da íris e seu raio. Como o método utiliza informações de cor da imagem, os testes foram realizados com uso de imagens do banco UBIRIS.

(19)

O processo de normalização da íris realizado em Lima (2008), assim como na maioria dos trabalhos revisados, se apresenta como uma tarefa de mapeamento geométrico inverso. Nesse processo, a região anular correspondente a região da íris é mapeada em uma região retangular de dimensões pré-definidas, convertendo-se as coordenadas polares da íris em coordenadas retangulares.

Imagens do banco UBIRIS pré-processadas (segmentadas e normalizadas) através do método de Lima (2008) serão a base para o desenvolvimento do presente trabalho.

2.3 EXTRAÇÃO DE CARACTERÍSTICA

Esta fase consiste em definir uma forma de representar uma imagem através de uma grandeza numérica ou um conjunto destas, como ilustra Figura 2.3. É nesta etapa do processo que se concentra o maior esforço dos trabalhos acerca do reconhecimento de indivíduos através da íris. Vários métodos foram propostos nos últimos anos a fim de se conseguir parâmetros que melhor caracterizassem a íris de um indivíduo e assim viabilizar o seu uso para distinguir dois ou mais indivíduos.

Figura 2.3 - Representação numérica da Íris

Diversas formas de extração de características de imagens de íris humana vêm sendo propostas, como análise da sua textura utilizando filtro de Gabor 2D (DAUGMAN, 1993;

(20)

ELSHERIEF et al, 2006), somas cumulativas baseadas na intensidade dos níveis de cinza da imagem (Jong-Gook Ko et al, 2007), transformada 2D de Wavelet (ELSHERIEF et al, 2006), Análise de componentes independentes (YOUNG WANG et al, 2005), entre muitas outras.

Um grande número dos métodos de extração desenvolvido resulta na obtenção de vetores binários, o “código da íris”. O primeiro autor a fazer uso de vetores binários para caracterizar a íris foi Daugman (1993). No entanto há alguns trabalhos que utilizam um vetor com valores reais (BOLES et al, 1998) e um grupo menor de pesquisadores que trabalham com combinações dessas duas formas de representar a íris (BOWYER et al, 2007).

Elsherief et al (2006) usam a transformada Wavelet 2D discreta para a extração do vetor de características da imagem. O algoritmo desta transformada produz quatro sub-bandas de freqüência da imagem, denominados HH, HL, LH e LL (H = High-pass e L = Low-pass), em cada nível da transformada. A partir da imagem de tamanho 360x60 obtida na fase de pré-processamento, a transformada é aplicada quatro vezes (nível quatro), gerando assim sub-imagens de tamanho 23x4. Cada imagem junto com os valores médios dos três níveis maiores compõe um vetor com 95 números reais variando de -1 a 1. A partir deste é gerado um vetor binário que é usado como vetor de características.

Elsherief et al também utilizam o filtro de Gabor para formar o vetor de características, a fim de realizar uma comparação de desempenho com a transformada

Wavelet. A vantagem da utilização do filtro de Gabor está no fato desta operação ser

invariante a transformações em imagens como rotação, translação e redução, além de apresentar alta tolerância a ruídos.

Boles e Boashash (1998) utilizam uma variação da transformada Wavelet, a transformada wavelet diática. O vetor de característica, neste caso, é baseado no número de cruzamentos por zero do resultado obtido após a transformação.

Uma nova técnica, apresentada por Jong-Gook Ko et al (2007), usa a soma cumulativa dos níveis médios de intensidade de cinza em subdivisões da imagem. O processo possui quatro etapas; a) A imagem normalizada é dividida em varias células, cujos valores médios da intensidade são usados como valor representativo de cada célula, b) as células são agrupadas vertical e horizontalmente, c) são calculadas as somas cumulativas sobre cada grupo, e d) o vetor de características binário é gerado baseado nas variações do resultado da soma em cada grupo.

(21)

2.4 CLASSIFICAÇÃO

Essa última fase do processo de reconhecimento de indivíduos através da íris consiste em comparar as características retiradas de uma imagem de prova com as retiradas de imagens de referência e, por fim, expressar essa comparação através de uma medida de dissimilaridade. Através dessa medida o sistema efetua o reconhecimento ou não de um determinado indivíduo.

Em geral, autores que utilizam vetores binários como forma de representar a íris fazem uso da Distância de Hamming normalizada como medida de dissimilaridade em seus trabalhos.

A Distância de Hamming entre dois vetores binários, A e B, corresponde ao número de bits diferentes quando é feita uma comparação bit a bit nos vetores, vide ilustração na figura 2.4. 0 1 0 1 0 0 0 0 1 1 1 1 0 0 A = B = Distância = 2

Figura 2.4 - Ilustração da distância de Hamming

A Distância de Hamming normalizada, comumente chamada apenas de Distância de

Hamming (HD), é calculada como

= ⊗ = N i I I B A N HD 1 1 , (2.2)

onde A e B são vetores com N elementos e o operador ⊗ refere-se à operação de OU – Exclusivo. Quanto menor for esse valor, mais similares são os vetores.

Essa métrica foi usada por Daugman para comparar os “Códigos da Íris” em seu trabalho de 1993 e em vários outros trabalhos revisados, tais como os descritos a seguir.

(22)

Elsherief et al (2006) usam essa medida em seus testes e traçam várias curvas de desempenho para cada técnica de representação da íris sugerida. Também informam as taxas de acerto variando o valor de limiar da distância de Hamming.

Para vetores de características compostos por valores reais, alguns autores utilizam a distância Euclidiana como medida de dissimilaridade. Yu et al (2007) utilizam essa métrica para comparar os vetores resultantes dos 32 pontos-chave encontrados após a divisão da íris em 16 sub-imagens.

Son et al (2004) utilizam o método de aprendizado supervisionado SVM (Support

Vector Machine) para fazer a classificação de vetores obtidos através de combinações entre

Análise de Componentes Principais (PCA), transformada discreta Wavelet (DWT) e análise de discriminantes lineares (LDA).

Elsherief et al (2006), além da distância de Hamming, também utilizam o Vetor de Quantização de Aprendizagem (LVQ), que é uma técnica de aprendizagem de Redes Neurais supervisionadas onde são usadas informações de classe para mover informações de autovalores desprezíveis. Outra técnica abordada pelos citados autores consiste do modelo de Rede Neural Probabilístico (PNN) orientado para problemas de classificação.

Em um grande número de propostas a medida de dissimilaridade ou score usada para classificação é obtida através da comparação entre duas imagens da íris. No entanto, há alguns trabalhos que usam mais de uma imagem para formar a base de referência de um indivíduo (BOWYER et al, 2007). Grande parte deles considera que o número de imagens usadas para representar uma mesma íris pode aumentar o desempenho dos classificadores, tal qual o algoritmo usado por Liu et al (2006), baseado em LDA, que utiliza várias imagens de treinamento para cada indivíduo cadastrado no sistema. Seus resultados confirmam que o desempenho aumenta conforme se aumenta o número de imagens de treinamento.

Além do objetivo de aumentar o desempenho do classificador, algumas técnicas requerem o uso de mais de uma imagem de uma mesma íris para compor a base de informação de cada indivíduo, como é o caso da SVM. O método proposto no presente trabalho – o Filtro de Novidade – também requer múltiplas imagens.

Da revisão bibliográfica efetuada evidenciou que a proposta de reconhecer indivíduos através de íris, utilizando-se o conceito de filtro de novidade para obtenção de uma medida de dissimilaridade é uma proposta inovadora.

(23)

3 FUNDAMENTAÇÃO TEÓRICA

Nesta seção são apresentados alguns dos conceitos fundamentais que suportam o desenvolvimento deste trabalho. É dada uma atenção especial à transformada Wavelet, necessária ao entendimento dos trabalhos revisados, bem como sua utilização em uma das etapas do processo de reconhecimento.

Como conceito base para este trabalho, é também apresentada a teoria do Filtro de Novidade, utilizado como classificador.

Além disso, são mostradas também as técnicas de avaliação de classificadores biométricos mais utilizados, tais como a curva ROC (Receiver Operating Characteristics) para testes de verificação e curva CMC (Cumulative Match Characteristic) para testes de identificação.

3.1 TRANSFORMADA WAVELET

As wavelets são funções matemáticas que são particionadas em diversas sub-funções, de acordo com uma escala de interesse. Esta escala varia conforme o nível de descrição que se deseja da sub-função. Fazendo-se uma comparação com a Transformada de Fourier, as

wavelets permitem a análise da função em relação ao tempo, o que não é possível com a

Transformada de Fourier.

Apesar de suas características, as wavelets somente atingiram a representação esperada após o estudo realizado por Stephane Mallat (1989), que relacionava filtros-espelho de quadratura, algoritmos piramidais e wavelets de base ortonormal. Poucos anos depois, Ingrid Daubechies baseou-se no trabalho de Mallat para construir o conjunto de wavelets de base ortonormal mais utilizados atualmente.

O matemático húngaro Alfred Haar propôs, em 1909, a primeira e mais simples forma de transformada Wavelet discreta, conhecida também como transformada de Haar.

Os algoritmos da transformada wavelet possuem uma estrutura de bancos de filtros em diferentes escalas, que decompõem um sinal em diferentes bandas para análise. Dada uma imagem de tamanho NxN, ela é inicialmente filtrada na direção das linhas por dois filtros, um

(24)

passa altas (P-A) e outro passa baixas (P-B). As imagens obtidas são sub-amostradas na direção das colunas, obtendo assim imagens L (passa-baixas) e H (passa-altas) de dimensões NxN/2 (NOGUEIRA et al, 2005). Em seguida, realiza-se a filtragem na direção das colunas das imagens L e H, resultando em quatro sub-imagens, que serão sub-amostradas na direção das linhas. Esse processo é conhecido como Transformada Wavelet 2D.

Figura 3.1 - Diagrama do algoritmo da decomposição da Transformada Wavelet 2D

Uma vez aplicada a transformada em uma imagem, tem-se como resultado três imagens detalhes (HL, LH e HH) e uma imagem aproximação (LL) sendo, que todas possuem um quarto da resolução da imagem inicial. Aplicando-se a transformada na imagem LL, obtêm-se três imagens detalhes HL1, LH1, HH1 e uma imagem aproximação LL1. Aplicando-se a transformada em LL1 obtém-se HL2, LH2, HH2, LL2 e assim sucessivamente.

(25)

b c a d e

Figura 3.2 – Ilustração da Aplicação da transformada wavelet 2D em um nível. (a) imagem exemplo. (b)(c)(d)(e) Imagens resultantes da transformada, LL, HL, LH e HH

respectivamente. [Fonte: MATLAB, Mathworks Coorp.]

3.2 FILTRO DE NOVIDADE

O conceito de novidade foi derivado dos trabalhos de Kohonen et al (1984) e baseia-se na reprebaseia-sentação vetorial de uma característica comparada com uma babaseia-se vetorial de referência.

Seja a base vetorial {x1, x2, x3,... xm,}∈Rn que gera um subespaço L⊂Rn, sendo m<n. Um vetor arbitrário n

R

x pode ser decomposto na soma de dois vetores, xˆ e x~ , dos quais

é uma combinação linear dos vetores xk e representa a projeção ortogonal de x no sub-espaço L. Enquanto que x~ é a projeção ortogonal de x em um sub-sub-espaço L ⊥ (complemento ortogonal L).

Na Figura 3.3, são mostradas as projeções x~ e xˆ de um vetor arbitrário x em um espaço tridimensional, com xˆ sendo a melhor representação de x em relação a L, e x~ a componente de x não “prevista” por L.

(26)

x~ xˆ x x x x = ˆ + ~ L x~⊥ L

Figura 3.3 - Projeções ortogonais em R3 (um vetor x decomposto como x = xˆ + ~x )

A componente x~ do vetor x é a parte deste vetor que não é “conhecida” pela base

{x1, x2, x3,... xm,}, representando assim a parte nova de x.

Essa componente é denominada de novidade e o sistema que extrai do dado de entrada x e o apresenta na saída é denominado de filtro de novidade. Os vetores xk

podem ser entendidos como a memória do sistema, também denominados de padrões de referências, enquanto x é o padrão-chave através do qual a informação é associativamente procurada na memória (COSTA, 1996, p.43).

3.2.1 APLICAÇÕES DO FILTRO DE NOVIDADE

Os fundamentos do filtro de novidade vêm sendo utilizados nos mais variados campos da engenharia e informática, seja na sua forma original, seja como rede neural.

Kassab et al (2005) utilizam o conceito de filtro de novidade para construir um sistema de modelagem de perfil de usuário, que se adéqua ao gosto de seu dono, conforme o histórico de web sites visitados, por exemplo. Por meio de uma avaliação do conteúdo feita pelo usuário, o sistema pode “aprender” seus costumes.

Já no campo de reconhecimento de padrões, Haltsonen et al (1978) propuseram um método de segmentação da fala usando o filtro de novidade para determinar se um determinado fonema extraído de uma amostra de áudio combina com padrões previamente armazenados no sistema.

No trabalho de Hanseok Ko et al (2000), o filtro de novidade é utilizado como rede neural para melhoramento de sinais através da supressão de ruído de fundo. A detecção de um

(27)

sinal é sensivelmente melhorada ao usar padrões de ruídos como vetores de treinamento para o filtro, resultando em valores de novidade altos na saída do filtro quando um sinal não estacionário (característico do ruído de fundo) é aplicado à entrada.

Costa (1996) utiliza o filtro de novidade para detecção de lesões em imagens de cintilografia de mama. Seu trabalho propõe um método automatizado de diagnóstico, possibilitando também a classificação das lesões – caso sejam detectadas – como malignas ou benignas. Um conjunto de imagens cintilográficas de mamas saudáveis é utilizado para compor a base do filtro (padrões de treinamento), e quando uma imagem de teste é submetida à entrada, tem-se na saída uma imagem cujos pixels referentes a regiões de lesões são marcados.

A versatilidade do filtro de novidade permite a sua utilização em uma ampla variada de aplicações nos mais diferentes campos da engenharia.

3.3 SISTEMAS BIOMÉTRICOS

Um sistema biométrico é basicamente um sistema de reconhecimento de padrões que usa informações biométricas de um indivíduo para gerar um padrão que lhe represente e compará-lo com outros padrões previamente armazenados. Cada indivíduo cadastrado no sistema possui um conjunto de dados que o representa, uma “assinatura”. A operação de reconhecimento é feita quando uma informação de teste de um indivíduo é comparada a um ou mais “assinaturas” do sistema, gerando assim uma medida de dissimilaridade entre o padrão de entrada e o padrão previamente armazenado e, conforme o valor obtido o sistema pode ou não autenticar uma identidade.

Dependendo da aplicação, o sistema biométrico pode operar de dois modos distintos: modo de Verificação e modo de Identificação (JAIN et al, 2004).

No modo de Verificação, um indivíduo solicita uma identidade cadastrada e fornece uma característica biométrica sua ao sistema, da qual é extraída a “assinatura”. O sistema então busca em sua base de dados o modelo referente ao usuário cuja identidade foi solicitada. É feita a comparação entre essas duas informações e é então gerada uma medida de dissimilaridade. A verificação é uma comparação 1:1 (um para um).

(28)

Assumindo que o valor da medida de dissimilaridade varia entre 0 e 1, por exemplo, com 0 representando a confirmação exata da identidade e, adotando-se um valor de limiar como regra de classificação, quando a comparação gerar o valor menor1 que o limiar a solicitação de identidade é validada, se for maior a solicitação é rejeitada.

No modo de Identificação, um indivíduo fornece uma característica biométrica, mas não declara nenhuma identidade. O sistema extrai a “assinatura” e a compara com todos os modelos armazenados em sua base dados, gerando um valor de dissimilaridade a cada comparação. Dessa forma, a Identificação consiste em uma comparação de 1:N (sendo N o número de indivíduos cadastrados no sistema).

Sistemas biométricos de identificação podem ser de dois tipos; Identificação em conjunto-fechado ou em conjunto-aberto.

Na identificação em conjunto-fechado o indivíduo a ser identificado sempre pertence ao conjunto de indivíduos cadastrados. Dessa forma, o sistema assume que a identidade procurada é referente ao modelo que resultou no menor valor para a medida de dissimilaridade.

Na identificação em conjunto-aberto, o indivíduo não precisa necessariamente pertencer à base de dados do sistema, cabendo ao classificador determinar se a pessoa é ou não cadastrada.

3.3.1 DESEMPENHO DE SISTEMAS BIOMÉTRICOS DE

VERIFICAÇÃO

Num ambiente de verificação, duas situações de entrada são possíveis; um indivíduo que solicita a própria identidade, denominado “cliente”, ou um indivíduo que solicita uma identidade que não é a dele, denominado “impostor” (BENGIO et al, 2004 citado por DROVETTO JUNIOR, 2007).

O sistema pode dar duas respostas distintas; identidade validada ou rejeitada. Desta forma há quatro resultados possíveis em um teste de verificação:

1. Aceitação correta (Correct Acceptance, CA) – Ocorre quando um cliente solicita sua identidade e sistema valida a solicitação.

1 A definição de qual região (acima ou abaixo do limiar) se refere à verificação fica a critério da natureza do

(29)

2. Falsa aceitação (False Acceptance, FA) – Quando um impostor solicita uma identidade e o sistema valida a solicitação.

3. Rejeição correta (Correct Rejection, CR) – Ocorre quando um impostor solicita uma identidade e o sistema rejeita a solicitação.

4. Falsa rejeição (False Rejection, FR) – Quando um cliente solicita sua identidade e o sistema rejeita a solicitação.

Tomando a medida de dissimilaridade como uma variável aleatória, seu valor tem uma distribuição de probabilidade para o caso em que clientes solicitam suas identidades, e uma distribuição de probabilidade para as solicitações de impostores. Estas distribuições são mostradas na Figura 3.4. O limiar define a regra para classificação do sistema.

A parte da curva azul (clientes) na Figura 3.4 à esquerda do valor de limiar refere-se às aceitações corretas, e a parte à direta refere-se falsas rejeições. A parte da curva verde (impostores) à esquerda do limiar representa a porção de falsas aceitações, e a parte à direita refere-se às rejeições corretas.

A probabilidade de um sistema biométrico classificar um impostor como cliente é chamada de Taxa de Falsa Aceitação, False Acceptance Rate (FAR) e pode ser calculada de acordo com a Equação 3.1.

CR FA FA N N N FAR + = (3.1)

onde NFA é o número de falsas aceitações e NCR é número de rejeições corretas, e a soma dos dois representa o total de impostores submetidos ao sistema.

Por outro lado, a probabilidade do sistema classificar um cliente como impostor é chamada de Taxa de Falsa Rejeição, False Rejection Rate (FRR), que é calculada através da equação 3.2. CA FR FR N N N FRR + = (3.2)

onde NFR é o número de falsas rejeições e NCA é número de aceitações corretas, e a soma dos dois representa o total de clientes submetidos ao sistema.

(30)

Figura 3.4 - Distribuição de probabilidade para clientes e impostores

Os valores de FAR e FRR variam conforme o valor de limiar escolhido, a Figura 3.5 mostra essa variação. Se o limiar for o valor mínimo da medida de dissimilaridade, FAR será 0 e FRR será 1, o que significa nenhum impostor será classificado como cliente, porém todos os clientes serão classificados como impostores. Se o limiar for o valor máximo da medida de dissimilaridade, FAR será 1 e FRR será 0 e nenhum cliente será classificado como impostor. No entanto, todos os impostores serão classificados como clientes. Pelo exposto, deve-se considerar um valor de limiar que resulte numa situação balanceada e mais apropriada à aplicação do sistema biométrico. Os valores de FAR e FRR variam em função do valor de limiar, conforme ilustra a Figura 3.5.

Quando ocorre sobreposição das distribuições de probabilidade para clientes e impostores, a FAR e a FRR se cruzam num determinado ponto. Esse ponto de cruzamento dá origem a um índice conhecido como Taxa de Erro Equivalente, Equal Error Rate (EER). Esse índice é muitas vezes usado como um parâmetro de desempenho de sistemas biométricos de verificação.

(31)

Figura 3.5 - Variação da FAR e da FRR em função do limiar

Uma ferramenta gráfica bastante útil para se avaliar o desempenho de um sistema de verificação é curva Receiver-Operating Characteristic (ROC). Trata-se de um gráfico onde no eixo das abscissas estão os valores de FAR e nos eixo das ordenadas estão os valores da Taxa de Aceitação Correta, Correct Acceptance Rate (CAR), que é dado por 1 – FRR.

Os termos “sensibilidade” e “especificidade”, bastante utilizados há vários anos em laboratórios médicos (ZWEIG, 1993), correspondem a CAR e 1-FAR, respectivamente, e seu uso torna a análise da curva ROC mais intuitiva. Dessa forma, a curva pode ser traçada como na Figura 3.6.

1 - especificidade

0 1

1

(32)

A sensibilidade significa o quão sensível é o sistema para detectar clientes. Já a especificidade mostra o quão criterioso é o sistema para rejeitar impostores. Quanto mais próximo de 1 forem os seus valores, melhor é o desempenho do sistema. No entanto, essa situação é extremamente difícil de ocorrer em sistemas biométricos no mundo real.

Com o propósito de avaliar o desempenho de sistemas, é possível reduzir toda a informação da curva ROC em um valor escalar (FAWCETT, 2005). O método mais comum é o cálculo da área sob a curva, Área Under Curve (AUC), que, por convenção, pode variar entre 0,5 e 1 (ZWEIG, 1993). Quanto mais próxima de 1 for a AUC mais próximo ao ponto (0,1) a curva passa. Isso significa a existência de pontos onde se tem valores de sensibilidade e especificidade próximos de 1, resultando num sistema com bom desempenho.

3.3.2 DESEMPENHO DE SISTEMAS BIOMÉTRICOS DE

IDENTIFICAÇÃO

3.3.2.1 IDENTIFICAÇÃO EM CONJUNTO ABERTO

No caso de identificação em conjunto-aberto, o sistema determina se a característica biométrica do indivíduo confere com algum dos modelos previamente inseridos no banco de dados, sem haver a solicitação por uma das identidades (NSTC, 2006).

Uma característica biométrica do indivíduo de teste é comparada a todos os modelos armazenados no sistema, gerando uma medida de dissimilaridade em cada comparação. Caso essa medida esteja na faixa de aceitação (abaixo ou acima de um dado limiar, conforme a natureza do classificador) um alarme indicando que o indivíduo pertence ao grupo é gerado. Este limiar é chamado Watchlist Threshold.

Uma vez que um indivíduo seja detectado como pertencente à base de dados, o sistema pode analisar melhor os valores obtidos da medida de dissimilaridade e tentar determinar a qual indivíduo a característica biométrica de entrada pertence.

Uma identificação bem sucedida ocorre quando o sistema identifica corretamente o indivíduo. A razão do número de identificações bem sucedidas pelo total de operações

(33)

realizadas resulta na Taxa de Identificação para Conjunto Aberto, ou Open-Set Identification

Rate.

A razão do número de indivíduos que não pertencem à base de dados, mas que são detectados como pertencentes no processo de identificação pelo total de indivíduos testados dá a Taxa de Falso Alarme, ou False Alarm Rate.

Essas duas taxas são usadas para traçar uma forma particular da curva ROC que é bastante utilizada para avaliar o desempenho de sistemas biométricos de identificação em conjunto aberto. Essa curva é chamada Watchlist ROC e pode ser vista na Figura 3.7.

0 False Alarm Rate 1

1

Figura 3.7 - Exemplo de Watchlist ROC

3.3.2.2 IDENTIFICAÇÃO EM CONJUNTO FECHADO

Em um sistema de identificação em conjunto fechado, qualquer indivíduo a ser testado deve ter um modelo previamente armazenado na base de dados, ou seja, deve ser um indivíduo cadastrado no sistema. Uma ferramenta para avaliar o desempenho desse tipo de sistema é a curva Cumulative Match Characteristic (CMC). Para a construção da curva CMC, os testes devem ser baseados em dois conjuntos (PHILIPS et al, 1997 citado por BOLLE et al, 2005):

• A galeria (G), composta pelo modelo biométrico de cada indivíduo cadastrado no sistema. Uma galeria formada por m indivíduos é representada por G = {B1, B2, ... , Bm} ou {Bi, i = 1, ..., m}.

(34)

• O conjunto de prova (Q), formado pelas n amostras biométricas dos indivíduos testados {B’1, B’2, ... , B’n} ou {B’j, j = 1, ..., n}. O conjunto Q pode conter mais de uma amostra biométrica para o mesmo indivíduo e não precisa ter amostras de todos os indivíduos, mas de forma alguma pode ter amostras de indivíduos cujos modelos não estão contidos na galeria, G. A cada comparação entre uma amostra B’j e um modelo Bi é gerado um valor de dissimilaridade s(B’j, Bi). Desta forma, a comparação de todas as n amostras de teste com todos os m modelos contidos na galeria produz um total de n x m valores de dissimilaridade correspondentes a n conjuntos Sj de m valores, conforme mostra a equação 3.3.

(

) (

) (

)

{

j j j m

}

j s B B s B B s B B

S = ′, 1 , ′, 2 ,..., ′, , j = 1, 2, ..., n. (3.3)

Esses conjuntos, então, são ordenados de forma que o valor que representa a melhor dissimilaridade na comparação, venha em primeiro lugar seguido do segundo melhor valor, e assim por diante até a pior dissimilaridade. A partir daí, é criado o conjunto Lj = { Lj(1), Lj(2),...,

Lj(m)}, sendo Lj(1) o modelo contido em G que resultou na melhor dissimilaridade, Lj(2) o modelo contido em G que resultou na segunda melhor dissimilaridade e assim consecutivamente.

Assumindo um rank K (com 1 ≤ K ≤ m), uma identificação é bem sucedida quando o modelo referente ao mesmo indivíduo que possui a amostra B’j aparece entre os K primeiros elementos do conjunto Lj, e pode ser formalmente dado por:

( )

⎪ ⎩ ⎪ ⎨ ⎧ ′ = ′ contrário. caso , 0 . de elementos K primeiros os entre de indivíduo mesmo do modelo um houver se , 1 j j j K L B B b (3.4)

Segundo ZHAO et al (2005), a Taxa de Identificação para um rank K de um teste sobre o conjunto de prova Q de tamanho n é dada por:

( )

n c Q p K K = , onde

( )

∈ ′ ′ = Q B j K K j B b c (3.5)

(35)

A curva CMC é finalmente construída traçando-se a taxa de identificação p em função do rank K. A Figura 3.8 mostra um exemplo de curva CMC típica.

1 Rank (K) 1,00 Taxa de ident if icação ( p ) 0,95 0,90 0,85 0,80 0,75 2 3 ... m - 1 m

Figura 3.8 – Exemplo de Curva CMC típica

Pode ser visto que a curva CMC sempre alcança o 1, mesmo que seja somente com

rank igual a m. Outro ponto importante é o valor da taxa de identificação para rank 1, pois o

(36)

4 MATERIAIS

Para fins de verificação do método proposto de classificação, são utilizadas imagens de íris segmentadas e normalizadas do banco de imagens da UBIRIS, considerando as duas sessões que compõem esse banco.

Inicialmente as imagens são submetidas ao processo de segmentação automático do algoritmo desenvolvido por Lima (2008). Em seguida, as imagens que não têm a íris segmentada e normalizada corretamente pelo processo automático são tratadas em um processo manual.

O objetivo é utilizar o máximo de imagens de íris disponíveis a fim de maximizar a precisão dos testes realizados.

4.1 O BANCO DE IMAGENS DA UBIRIS

Este banco se caracteriza por imagens nem sempre com foco adequado ou boa iluminação, e em muitos casos com interferência de ruídos, e obstrução da íris causada pelos cílios e pálpebra. A proposta dos criadores da base de imagens UBIRIS é dispor de um conjunto de imagens capturadas sob condições de não colaboração do indivíduo, a fim de simular um ambiente mais realístico.

Este fator demanda sistemas de localização e segmentação da íris e classificadores mais eficientes, capazes de tratar essas dificuldades presentes nas situações práticas.

As imagens desse banco foram coletadas em duas sessões; a primeira, usando a configuração mostrada na Figura 4.1, na tentativa de reduzir os ruídos, relativos especialmente à reflexão, luminosidade e contraste, e uma segunda sessão onde o ambiente de captura foi mudado com o intuito de simular a pouca ou nenhuma colaboração do indivíduo (PROENÇA et al, 2005).

(37)

Lâmpada de

halogênio Câmera

20 cm

50 cm

Figura 4.1 - Configuração de captura da imagem para a sessão 1 do banco UBIRIS

4.2 SEGMENTAÇÃO AUTOMÁTICA DA ÍRIS

Foi utilizado o algoritmo de segmentação automática da íris desenvolvido por Lima (2008) para o pré-processamento das imagens da UBIRIS. Imagens das sessões 1 e 2 foram utilizadas, tendo como resultado os valores da Tabela 4.1. A verificação do sucesso da segmentação foi realizada através da visualização direta das imagens resultantes, sem uso de critérios quantitativos.

Tabela 4.1 - Resultado da segmentação automática

4.3 SEGMENTAÇÃO MANUAL DA IRIS

As imagens cuja segmentação falhou com o processo automático foram submetidas a uma segmentação manual a fim de se obter o maior número possível de íris segmentadas.

Ressalta-se que a maioria destas falhas se deve à obstrução da íris pela pálpebra, e, por este motivo, estas imagens não podem ser utilizadas com fim de reconhecimento. Algumas destas podem ser vistas na Figura 4.2.

Sessão Número de

indivíduos Total de imagens Íris segmentadas com sucesso Percentual

1 241 1214 1169 97,01%

(38)

Figura 4.2 - Imagens não utilizadas. Fonte: Banco de imagens UBIRIS

Após o processamento das imagens restantes pelo método manual de segmentação, tem-se um total de 1843 imagens padronizadas. O que representa 98,18% das imagens disponibilizadas pela UBIRIS, distribuídas conforme mostra a Tabela 4.1. Todas imagens pertencentes ao individuo n°244, da sessão 2, não puderam ser segmentadas.

Tabela 4.2 – Total de imagens utilizadas no desenvolvimento do método de reconhecimento proposto

Sessão Distribuição das imagens entre os indivíduos Segmentadas/Normalizadas Total de imagens Percentual

1 235 indivíduos com 5 imagens 6 indivíduos com 4 imagens 1199 98,76% 2 120 indivíduos com 5 imagens 11 indivíduos com 4 imagens 644 97,13%

(39)

5 METODOLOGIA

Neste capítulo é descrita a metodologia utilizada para a realização de um processo de reconhecimento de indivíduos através da imagem digital de sua íris, quando esta é comparada com bases de imagens oculares provenientes de vários indivíduos, utilizando o conceito de filtro de novidade apresentado na seção 3.2.

Conforme foi visto na revisão bibliográfica, processo de reconhecimento através de imagens da íris é composto por 4 etapas, como pode ser visto na Figura 5.1. Este trabalho se concentra nas duas últimas etapas do processo, extração de característica e classificação.

Aquisição da imagem

Segmentação da íris

Extração de característica

Classificação

Figura 5.1 - Etapas do processo de reconhecimento

Também serão descritos, nesta sessão, a metodologia de avaliação do desempenho do processo de classificação proposto.

5.1 EXTRAÇÃO DE CARACTERÍSTICA

Esta fase consiste em definir uma forma de representar uma imagem através de uma grandeza numérica, o que pode ser chamada “assinatura da íris”, ou “código da íris”, como usado por Daugman (1993).

(40)

O processo foi dividido em três partes; Separação de uma região de interesse, melhoramento da imagem e composição do vetor de características.

A fim de minimizar os efeitos de oclusão parcial da íris por cílios ou pálpebras, no processo de reconhecimento não se utiliza toda a região da íris. Em vez disso utilizam-se partes da imagem segmentada e normalizada da íris que são mais imunes aos referidos efeitos. Em geral esta região corresponde às laterais da íris. Desta forma, as regiões laterais da íris são separadas da imagem original, e passam a constituir a nossa região de interesse (ROI). Tal abordagem é utilizada por Jong-Gook Ko et al (2007) com o mesmo propósito.

Considere uma imagem de íris como a ilustrada na Figura 5.2. Partindo de um eixo horizontal que passa pelo centro da íris (ângulo 0°), em sentido anti-horário, dois intervalos que determinam a região de interesse são delimitados; a região lateral direita entre 15° e 330°, e região lateral esquerda entre 165° e 210°.

Figura 5.2 - Determinação da região de interesse

A Figura 5.3 mostra a imagem resultante após a separação da região de interesse, onde são menores as influências de cílios e pálpebras.

(41)

Figura 5.3 – Separação da ROI a partir da imagem normalizada da íris. (a) imagem segmentada e padronizada da íris; (b) imagem da ROI

A imagem da ROI é então submetida a um processamento com o fim de melhoramento do contraste da imagem. Esse processamento consiste na equalização de histograma.

Para a obtenção da assinatura da íris, o vetor de características das imagens foi obtido de duas formas distintas, a saber:

1) Utilizando-se o nível de intensidade dos pixels da imagem; 2) Utilizando-se os coeficientes da decomposição Wavelet.

5.1.1 VETOR DE CARACTERÍSTICAS USANDO NÍVEIS DE

INTENSIDADE

As imagens de íris segmentadas utilizadas para os testes são imagens true color. Para a composição do vetor de características da ROI extraída usando níveis de intensidade, foram analisados quatro casos distintos:

• Imagem de intensidade da componente Vermelho (R); • Imagem de intensidade da componente Verde (G); • Imagem de intensidade da componente Azul (B); • Imagem de Intensidade em escala de Cinza

(42)

Para cada caso, a imagem é tida como uma matriz de tamanho MxN, com M sendo o número de linhas e N, o número de colunas. O vetor de características é obtido através da concatenação das N colunas, formando assim um vetor de números reais de dimensão N*M. A operação é ilustrada na Figura 5.4.

100 101 97 90 89 91 80 77 2 ... 112 109 100 93 91 90 92 86 20 ... 150 119 118 102 92 95 88 81 31 ... 248 239 239 228 222 199 205 198 203 ... M 1 1 N

Figura 5.4 - Vetor de característica usando níveis de intensidade da imagem

As imagens de íris normalizadas têm dimensão 200x360 pixels. As ROI’s extraídas dessas imagens têm dimensões de 200x92 pixels. Logo, os vetores de características resultantes possuem 18.400 posições.

5.1.2 VETOR DE CARACTERÍSTICAS USANDO DECOMPOSIÇÃO

WAVELET

Visando a obtenção de um vetor que represente a imagem da íris sem a utilização direta dos níveis de intensidade, é utilizada a transformada Wavelet 2D discreta (2D Discrete

Wavelet Transform, 2D DWT), a qual é largamente utilizada em análise de imagens e visão

computacional. Essa abordagem também tem a vantagem de resultar em um vetor de tamanho reduzido.

(43)

Para a representação das imagens padronizadas da íris, são usados os coeficientes gerados após a aplicação da decomposição Wavelet nas imagens. Como entrada para a transformada, é usada a ROI mostrada na Figura 5.3, convertida para escala de cinza.

A 2D DWT gera quatro sub-imagens cada vez que é aplicada. Essas, por sua vez, são formadas por: coeficientes de aproximação, coeficientes de detalhe vertical, coeficientes de detalhe horizontal e coeficientes de detalhe diagonal. Pode-se utilizar a transformada em vários níveis, aplicando-a múltiplas vezes sobre a imagem de coeficientes de aproximação resultante da aplicação anterior. Para compor o vetor de características da íris, é usada a 2D DWT em Níveis 3 e 4, utilizando a wavelet de Haar.

Após a aplicação da transformada nas ROI’s de tamanho 200x92 pixels, obtém-se sub-imagens de 25x12 pixels e 13x6 pixels para os níveis 3 e 4, respectivamente.

A obtenção de imagens binárias a partir das imagens resultantes da decomposição considera que os coeficientes maiores que zero são levados para 1, e os coeficientes negativos são considerados 0. A figura 5.5 ilustra esta operação.

(a)

(b)

(44)

As imagens binárias são transformadas em vetores binários a partir da concatenação das colunas dessas imagens, de forma similar à mostrada na Figura 5.4, resultando em vetores binários de 300 e 78 posições para os níveis 3 e 4, respectivamente.

5.2 ASSINATURA DO INDIVÍDUO (BASE)

É chamada de “Assinatura do Indivíduo”, ou modelo, a informação de referência pertencente a um determinado individuo integrante de um sistema de reconhecimento.

Durante o processo de verificação ou identificação, uma imagem de prova precisa ser comparada com as informações de referência previamente armazenadas no sistema, de tal forma que este possa classificar a imagem de prova como pertencente ou não a um determinado indivíduo.

Esta “assinatura” é denominada neste trabalho como Base do indivíduo, já que se refere à base vetorial que o representa no filtro de novidade. Para compor esta base, são utilizados múltiplos vetores, nesse caso, múltiplas imagens. Dessa forma, cada indivíduo pré-cadastrado no sistema possui um número m de imagens (de uma de suas íris) que compõe a sua base. Fazendo uma relação com o conteúdo apresentado na seção 3.2, para cada individuo, existirá uma base vetorial {x1, x2, x3,... xm}∈Rn que gera um subespaço L. Os vetores xk (k = 1, 2, 3,...,m) são os vetores de características de dimensão n, extraídos das imagens que compõem a base do indivíduo.

5.2.1 ALGORITMO PARA COMPOSIÇÃO DAS BASES

A fim de se obter as bases de referência, ao invés de se usar diretamente os vetores {x1, x2, x3,... xm}, estes passam primeiramente por uma transformação de forma que resulte em m vetores ortogonais que gerem a mesma base. Para isso é usado o método clássico conhecido como Ortogonalização de Gram-Schmidt. Adicionalmente, os vetores são normalizados pra uma padronização dos resultados.

(45)

Dessa forma, foi desenvolvido um algoritmo que realizada sucessivas operações de ortogonalização e normalização dos vetores de entrada. O tamanho dessa seqüência ortonormalização depende do número de imagens disponíveis para representar um indivíduo.

Um primeiro vetor x1 é normalizado e denominado h1. Em seguida, um segundo vetor x2 é normalizado e submetido ao processo de ortogonalização de Gram-Schmidt gerando o vetor h2⊥h1. A operação continua para o vetor x3 e assim por diante, até o vetor xm. Nesse ponto, tem-se um conjunto de m vetores unitários mutuamente ortogonais h1, h2, ..., hm.

Desta forma, o algoritmo para geração das bases tem como entrada uma matriz

[

x x xm

]

X = 1 1 L ,

e gera em sua saída a matriz:

[

h h hm

]

H = 1 2 L , com h1⊥h2⊥...⊥hm. (5.1)

5.3 OBTENÇÃO DO VETOR NOVIDADE

O vetor de novidade é obtido estendendo a operação de ortogonalização de Gram-Schmidt (usada para a obtenção da base) por mais um passo (KOHONEN, 2001). Um vetor Y que representa a íris de um indivíduo de teste é normalizado, gerando y. Este vetor é então submetido ao processo de ortogonalização, resultando em um vetor yˆ ⊥h1⊥h2 ⊥...⊥hm, que

é o próprio vetor novidade. Seu módulo, || yˆ ||, é usado como medida de dissimilaridade. Em resumo, o algoritmo de comparação tem como entrada um vetor Y (vetor de característica extraído da imagem normalizada da íris de um indivíduo de teste) e a matriz H (base de um indivíduo previamente cadastrado no sistema), e gera em sua saída o valor escalar || yˆ || (módulo do vetor novidade), que representa a novidade. Quanto menor for o valor da novidade, mais similar o vetor Y é da base H, sendo assim a novidade uma medida de dissimilaridade.

(46)

6 TESTES EXPERIMENTAIS

O método de classificação usando o filtro de novidade proposto neste trabalho foi validado através de simulações, com uso do MATLAB, de um sistema biométrico em dois cenários diferentes: Cenário de Verificação e Cenário de Identificação em conjunto fechado2.

Na verificação foram coletados dados para se traçar a curva ROC e calcular índices, tais como área sob a curva e taxa de erro equivalente. No modo de identificação são traçadas curvas CMC. Para ambos os cenários, os vetores de características usados foram os descritos na seção 5.1, e o número de imagens que compõem as bases de indivíduos pré-cadastrados variam entre 3 e 4. Cada simulação utiliza as ROI’s extraídas das imagens segmentadas e normalizadas das sessões 1 e 2 do banco de imagens UBIRIS, conforme descrito no capítulo 4. A Tabela 6.1 resume todos os casos simulados. Para fins de comparação entre a medida de dissimilaridade proposta e a medida comumente utilizada nos sistemas biométricos, a distância de Hamming, nos casos 9 até o 14, também foram realizadas simulações usando essa medida.

Tabela 6.1 – Descrição dos testes realizados

Número do caso Vetor característica Número de imagens por base 1 Níveis de intensidade em escala de cinza 3

2 Níveis de intensidade da componente R 3 3 Níveis de intensidade da componente G 3 4 Níveis de intensidade da componente B 3 5 Níveis de intensidade em escala de cinza 4 6 Níveis de intensidade da componente R 4 7 Níveis de intensidade da componente G 4 8 Níveis de intensidade da componente B 4 9 Transformada Wavelet – níveis de cinza (nível 4, Haar, Coeficientes de Detalhe Vertical) 3 10 Transformada Wavelet – níveis de cinza (nível 4, Haar, Coeficientes de Detalhe Horizontal) 3 11 Transformada Wavelet – níveis de cinza (nível 4, Haar, Coeficientes de Detalhe Diagonal) 3 12 Transformada Wavelet – níveis de cinza (nível 3, Haar, Coeficientes de Detalhe Vertical) 3 13 Transformada Wavelet – níveis de cinza (nível 3, Haar, Coeficientes de Detalhe Horizontal) 3 14 Transformada Wavelet – níveis de cinza (nível 3, Haar, Coeficientes de Detalhe Diagonal) 3

2 Para identificação, este trabalho se concentra somente em sistema de conjunto fechado. No entanto, sistemas de

(47)

6.1 VERIFICAÇÃO

Foram usadas 1199 imagens de 241 indivíduos da sessão 1 e 644 de 131 indivíduos da sessão 2 (vide Tabela 4.2). Cada imagem é comparada (verificada) com cada uma das possíveis bases de todos os indivíduos.

Como mencionado e mostrado na Tabela 4.2, o número de imagens por indivíduos varia. Quando os indivíduos possuem quatro imagens disponíveis, o número bases distintas contendo 3 imagens que se pode formar é o resultado da combinação simples, C(4,3)=4. Entretanto, quando o número de imagens por base é aumentado para 4, só é possível obter uma única base. Para os indivíduos que possuem cinco imagens disponíveis, o número bases de possíveis é 10 quando se usam 3 imagens para compor a base, e 5 quando se usam 4 imagens por base. Obviamente uma determinada imagem não é comparada com bases que possuem essa imagem.

O número total de verificação em função da sessão do banco de imagens UBIRIS e do número de imagens que compõe cada base é mostrado na Tabela 6.2. Cada verificação resulta num valor de novidade.

Tabela 6.2 - Total de verificações realizadas

Após cada simulação, foram obtidos dois conjuntos de valores de novidade. Um referente às verificações de clientes (imagem de um indivíduo sendo comparada com uma base do próprio indivíduo) e outro referente às verificações de impostores (imagem de um indivíduo comparada com uma base de outro indivíduo). Através da distribuição de probabilidades da novidade para os dois conjuntos (classes), obtêm-se as taxas FAR, CAR, FRR e CRR, e com seus valores traçam-se as curvas ROC correspondentes.

Sessão do banco UBIRIS

Número de imagens

por base Número de verificações

3 2.839.304 1 4 1.411.295 3 797.404 2 4 391.040

(48)

6.1.1 RESULTADOS DA VERIFICAÇÃO: CURVAS ROC

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 - especificidade s ens ib il idade (a) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 - especificidade s ens ib il idade (b)

Figura 6.1 - Curva ROC – Caso 1: Escala de Cinza, 3 imagens por base. (a) Sessão 1da UBIRIS. (b) Sessão 2 da UBIRIS

(49)

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 - especificidade s ens ib il idade Vermelho (R) Verde (G) Azul (B) (a) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 - especificidade s ens ib il idade Vermelho (R) Verde (G) Azul (B) (b)

Figura 6.2 - Curva ROC -Componentes RGB – Caso 2 (R), Caso 3 (G) e caso 4 (B), 3 imagens por base. (a) Sessão 1da UBIRIS. (b) Sessão 2 da UBIRIS

Referências

Outline

Documentos relacionados

Nessa situação temos claramente a relação de tecnovívio apresentado por Dubatti (2012) operando, visto que nessa experiência ambos os atores tra- çam um diálogo que não se dá

Quanto ao total removido de bário pelas plantas de arroz observa-se que em ambas as umidades houve aumento significativo de bário com o aumento da concentração de bário no solo,

Buscando compreender a dinâmica de cada curso da UFJF, nossa pesquisa também tangenciou questões outras que o espaço desta dissertação nos impediu de problematizar, como é o

nesse contexto, principalmente em relação às escolas estaduais selecionadas na pesquisa quanto ao uso dos recursos tecnológicos como instrumento de ensino e

Declaro que fiz a correção linguística de Português da dissertação de Romualdo Portella Neto, intitulada A Percepção dos Gestores sobre a Gestão de Resíduos da Suinocultura:

Para devolver quantidade óssea na região posterior de maxila desenvolveu-se a técnica de eleva- ção do assoalho do seio maxilar, este procedimento envolve a colocação de

Neste estudo, o autor mostra como equacionar situações–problema, do tipo: “Descubra dois números cuja a soma é 20 e cuja a diferença é 5”, propondo primeiro que o

dois gestores, pelo fato deles serem os mais indicados para avaliarem administrativamente a articulação entre o ensino médio e a educação profissional, bem como a estruturação