• Nenhum resultado encontrado

SDRF +: A Face Recognition System

N/A
N/A
Protected

Academic year: 2021

Share "SDRF +: A Face Recognition System"

Copied!
5
0
0

Texto

(1)

SDRF +: A Face Recognition System

Adriano da Silva Marinho, Ed Porto Bezerra, Leonardo Vidal Batista Programa de Pós-Graduação em Informática – Departamento de Informática

Universidade Federal da Paraíba João Pessoa, Brasil

adriano.marinho@ci.ufpb.br, edporto@di.ufpb.br, leonardo@ci.ufpb.br

Abstract— Identification systems have become key components for many applications. Since traditional methods of authentication can be manipulated in order to bypass the systems, biometric authentication methods have been receiving more attention in recent years. The face is an example of a biometric trait. It is possible to perform face recognition using Discrete Cosine Transform (DCT). In order to adjust a face recognition system to uncontrolled environments, in this paper we developed an image normalizing module in relation to rotation and scale. The new system (SDRF+) was tested on the UFPB-Fotos and ORL face databases. The normalizing module is efficient, but the SDRF+ is still not suitable for uncontrolled environments.

Keywords— Biometric Authentication, Face Recognition, DCT. I. INTRODUÇÃO

A proliferação de serviços que necessitam de autenticação gerou uma demanda por novos métodos para estabelecer a identidade de usuários [1]. O problema de estabelecer a identidade de um indivíduo pode ser dividido em dois: autenticação e identificação. No primeiro, um indivíduo alega uma identidade e o sistema deve confirmar ou negar. No segundo, o sistema deve estabelecer uma identidade para um indivíduo desconhecido [2] [3]. Métodos tradicionais para estabelecer a identidade de um usuário incluem mecanismos baseados em conhecimento (por exemplo, senhas) e mecanismos baseados em tokens (por exemplo, cartões de identidade). Porém, tais mecanismos podem ser perdidos, roubados ou até mesmo manipulados com o objetivo de burlar o sistema. Neste contexto, a autenticação e a identificação por Biometria [1] surgem como alternativas.

A autenticação biométrica oferece um mecanismo de autenticação mais confiável utilizando traços físicos ou comportamentais que permitem identificar usuários baseados em suas características naturais. Assim, é possível estabelecer a identidade de um usuário baseado em quem ele é. A face é um dos traços biométricos menos intrusivos.

A área de análise de faces pode ser dividida em diversas subáreas, como reconhecimento de face, detecção/localização de face, reconhecimento de expressões faciais e análise de poses [4].

O problema do reconhecimento de faces em vídeo e foto não é trivial, pois existem muitos fatores que influenciam na detecção e no reconhecimento, tais como: iluminação, posição da face, imagem ao fundo e diferentes expressões faciais. Assim, é comum encontrar na literatura sistemas de reconhecimento de faces em ambientes controlados [4] [5] [6].

Este artigo apresenta o SDRF+ (Sistema de Detecção e Reconhecimento de Faces +) e discute sobre seu desempenho. A seção II aborda o tema detecção e reconhecimento de faces, as seções III e IV apresentam, respectivamente, o SDRF e o SRDF+. Considerações finais e trabalhos futuros são apontados na seção V.

II. DETECÇÃO E RECONHECIMENTO DE FACES O reconhecimento facial é um caso específico de reconhecimento de padrões onde o padrão é uma face. É uma tarefa complexa para o computador, embora seja fácil para os seres humanos.

Algumas razões que ainda tornam o reconhecimento facial objeto de pesquisa são a preocupação crescente por segurança pública, a necessidade de verificar a identidade de um indivíduo para fins de acesso e a análise de dados para fins de entretenimento multimídia [7].

A Fig. 1 mostra a arquitetura-padrão de um sistema de reconhecimento facial [7].

Fig. 1. Arquitetura de um Sistema de Reconhecimento Facial. O sistema de reconhecimento facial recebe como entrada uma imagem contendo uma ou mais pessoas. A detecção ou localização de faces consiste na determinação da presença e posição espacial de cada face existente em uma imagem

A face detectada serve como entrada do módulo Normalizador de faces que pode operar padronizando as dimensões, a inclinação e a iluminação das imagens.

Uma vez normalizada, a imagem é passada para o módulo Seletor de Atributos, cujo funcionamento depende do método usado para o reconhecimento facial. O Seletor produz um vetor de características que é utilizado pelo módulo

(2)

Comparador para produzir a saída do sistema, que depende do tipo de reconhecimento que se está fazendo: identificação ou verificação. No processo de identificação facial, uma comparação 1:N é feita, de modo que a entrada para o sistema é uma face desconhecida que é associada a uma das faces previamente cadastradas no Banco de Faces. No processo de verificação, uma comparação 1:1 é feita, de modo que a entrada para o sistema é uma face desconhecida e uma identidade alegada pelo usuário: a saída é um valor de verdadeiro ou falso que aceita ou rejeita tal alegação [4].

O desempenho dos sistemas de reconhecimento facial depende de uma variedade de fatores, tais como iluminação, pose, expressões faciais, idade dos sujeitos, cabelo e acessórios. Assim, é comum encontrar na literatura sistemas de reconhecimento de faces em ambientes controlados [4] [5] [6].

III. UM SISTEMA DE DETECÇÃO E RECONHECIMENTO DE FACES PARA AMBIENTES CONTROLADOS

O SDRF [8] efetua reconhecimento facial holístico utilizando a DCT e um seletor de baixas frequências com uma região elíptica. Ele pode receber como entrada um vídeo ou fotos com faces. No segundo caso, ele classifica as faces presentes nas fotos, produzindo como saída a porcentagem de faces corretamente classificadas. A arquitetura geral do sistema é apresentada na Fig. 2.

A arquitetura é composta por quatro módulos: Capturador, Detector de Face, Reconhecedor de Face e Exibidor. O Capturador realiza a obtenção das imagens de entrada, que podem ser obtidas de um arquivo de vídeo previamente capturado, lidas diretamente de algum dispositivo de captura de vídeo ou lidas de diretórios do disco rígido.

O SDRF não possui um Normalizador de Face. Logo, ele não realiza nenhum tipo de pré-processamento nas imagens antes de realizar o reconhecimento de face.

O Reconhecedor de Face possui um Seletor de Atributos, que utiliza como atributos os coeficientes das imagens DCT extraídos de uma região elíptica como a região mostrada na Fig. 3. Ele também possui um módulo de classificação das imagens que implementa um classificador de Vizinho Mais Próximo. Este utiliza como métrica de comparação a distância de Minkowski de ordem um e no qual a menor distância é utilizada para classificar uma face.

Os métodos para o reconhecimento de faces se dividem em métodos holísticos, métodos analíticos (não holísticos) e métodos híbridos [9] [10]. Os métodos analíticos analisam a face como um todo. O SDRF é um exemplo de sistema holístico. Os métodos analíticos [11] objetivam construir um espaço de características no qual a manipulação da face se torna mais simples. É possível utilizar a Transformada Cosseno Discreta (DCT) [12] para realizar reconhecimento facial holístico como visto em [13] [14].

O SDRF foi testado com dois Bancos de Faces: o banco de faces ORL [15] e o banco de faces UFPB-Fotos [8]. Ele apresentou bons resultados, acima de 90%, e se adequou a exigência comercial de não necessitar ser retreinado após a inserção de novos indivíduos no banco.

Para testar o reconhecimento de faces em fotos foi utilizado o procedimento da validação cruzada leave-one-out [8]. No banco UFPB-Fotos o reconhecedor atingiu uma taxa de 97,75% de acertos e no banco ORL 99,75% de acertos. Apesar de seus bons resultados em ambientes controlados, é necessário investigar se ele é adequado para qualquer ambiente.

Fig. 2. Arquitetura Geral do SDRF (Fonte: OMAIA, 2009).

Fig. 3. Exemplo de região elíptica.

IV. UM SISTEMA DE DETECÇÃO E RECONHECIMENTO DE FACES PARA AMBIENTES NÃO CONTROLADOS

Lembramos que o SDRF não possui um módulo de normalização de imagens. Logo, não é possível adequar as imagens capturadas às mesmas condições das imagens utilizadas na etapa de treinamento do módulo Reconhecedor de Face. A Fig. 4 apresenta a arquitetura do SDRF+ e a Fig. 5 apresenta os submódulos do Normalizador de Imagens.

Fig. 4. Arquitetura do SDRF com o módulo de normalização de imagens.

O módulo normalizador recebe como entrada a imagem de face a ser normalizada e as coordenadas dos olhos da face presente nessa imagem. Então, as faces são normalizadas ou em relação à rotação ou em relação à escala. Os olhos das faces podem ser encontrados utilizando algoritmos de localização de olhos como o proposto em [16].

(3)

Fig. 5 Visão geral do normalizador de imagens. .

A. O Submódulo Normalizador de Rotação

O submódulo normalizador de rotação tem como objetivo eliminar, se existir, a inclinação do segmento de reta que une os olhos de uma imagem de face. Escolhemos este tipo de normalização porque geralmente as pessoas não são filmadas com a cabeça inclinada para terem suas faces reconhecidas.

O processo de normalização da rotação é formado por 3 passos: o cálculo da inclinação do segmento de reta que une os olhos; a rotação da imagem; e o corte da imagem.

No passo 1 calculamos o arco tangente das posições dos olhos (Fig. 6 (a)). No passo 2, rotacionamos a imagem, de acordo com a Equação 1, de modo a eliminar a inclinação

calculada no passo 1 (Fig. 6 (b)). Esta equação define a operação de rotação de um ângulo θ em torno de um ponto qualquer ( ) da imagem.

( ) ( )

( ) ( ) (1) A operação de rotação pode deixar a imagem com espaços em branco no plano de fundo. Assim, no passo 3 utilizamos uma janela de tamanho 100 x 100 pixels para cortar a imagem, de modo que não existam espaços em branco nela (Fig. 6 (c)).

B. O Submódulo Normalizador de Escala

O submódulo normalizador de escala tem como objetivo deixar todas as imagens de um determinado banco de faces com a mesma distância entre os olhos, fazendo assim com que todas elas fiquem com a mesma distância para a câmera. Escolhemos esta normalização porque os erros do SDRF no teste em fotos eram causados por diferenças de escala.

O processo de Normalização de Escala é constituído de 4 etapas: o cálculo da distância entre os olhos padrão do banco de faces; o cálculo do fator de escala; o redimensionamento da imagem; e o recorte da imagem.

A etapa 1 consiste em calcular a distância entre olhos padrão de um dado banco de faces a partir da moda de todas as distâncias entre olhos desse banco. Na etapa 2, calculamos para a imagem a ser normalizada um fator de escala, de acordo com a Equação 2.

  (2)

Sendo a distância entre os olhos da imagem que está sendo normalizada.

(a) Localização dos olhos. (b) Aplicação de rotação na imagem.

(c) Aplicação de recorte na imagem.

Fig. 6. Passos do submódulo normalizador de posição.

Na etapa 3, redimensionamos a imagem utilizando o fator de escala e a operação de redimensionamento aplicada às linhas da imagem definida na Equação 3.

( ) (3)

Sendo:

o fator de redimensionamento da imagem. Se a imagem será expandida, se a imagem será reduzida.

a coordenada do pixel original.

a coordenada do pixel redimensionado.

centro de redimensionamento, isto é, após a operação, todos os pontos das linha se afastam ou se aproximam de .

A operação de redimensionamento deixa as imagens do banco de faces com tamanhos diferentes, mas o SDRF necessita que elas sejam do mesmo tamanho para o teste do reconhecimento em fotos. Assim, é necessário recortar as imagens (etapa 4) para um mesmo tamanho.

V. RESULTADOS

Nesta seção, são descritos os resultados alcançados após o desenvolvimento do módulo normalizador de rotação e escala. O sistema foi testado com os bancos UFPB-Fotos e ORL [15].

(4)

A. Banco de Faces ORL

O banco de faces ORL (do inglês, Olivetti Research Lab) foi desenvolvido nos laboratórios da Olivetti em Cambridge, Inglaterra. Ele é composto de 400 fotos de faces de 40 pessoas diferentes, em que cada pessoa possui 10 fotos em diferentes poses, com pequenas variações de iluminação, expressões faciais, e acessórios. Todas as imagens foram fotografadas contra um fundo homogêneo, e as faces estão todas verticais e frontais, com pequenas variações de angulação. Todas as imagens possuem tamanho 92 x 112 pixels e estão em escala de cinza com 256 níveis de cinza.

B. Banco de Faces UFPB-Fotos

O banco de faces UFPB-Fotos [8] foi criado para validar o SDRF. Ele possui 20 imagens de 40 pessoas diferentes totalizando 800 imagens de faces. Todas foram capturadas frontalmente, com pouca rotação, tamanho 128 x 128 pixels e estão em escala de cinza com 256 níveis de cinza.

C. Normalização dos Bancos de Faces

Normalizamos ambos os bancos primeiramente em relação à rotação e depois em relação à escala. Para isso, uma lista das posições corretas dos olhos de cada face dos bancos foi utilizada junto com as imagens. Para avaliar a necessidade de um Normalizador no SDRF, optamos por não utilizar um localizador automático de olhos, pois uma localização automática errada gera um erro na normalização.

Normalizamos os bancos em relação à rotação seguindo os passos da Seção IV.A. Na Fig. 7 é apresentado um exemplo de imagem do banco usada nesta normalização.

(a) Detecção de posição correta dos olhos.

(b) Normalização de (a).

Fig. 7. Exemplos de imagens utilizadas na normalização de rotação.

Em seguida normalizamos os bancos em relação à escala seguindo os passos da Seção IV.B. Na Fig. 8 são apresentados exemplos de imagens do banco ORL usadas nesta normalização.

(a) Imagem original.

(b) Imagem após normalização. Fig. 8. Exemplos de imagens utilizadas na normalização de escala.

As imagens dos bancos ORL e UFPB-Fotos resultantes de ambas as normalizações possuem tamanho 100 x 100 pixels, ou seja, possuem menos informação que as versões originais. Além disso, os bancos originais mantêm a região acima da testa, como mostra a Fig. 9. Essa região contém, muitas vezes, parte do cabelo, que pode variar muito de uma captura para outra da mesma pessoa, ou seja, contem informação que não faz parte da face em si. Para contornar estes fatos e testar a necessidade de um módulo normalizador no SDRF geramos uma versão do banco UFPB-Fotos e uma versão do banco ORL de tamanho 100x100, a partir do mesmo corte 100x100 utilizado no normalizador.

(a) Imagem original (b) Imagem normalizada.

(a) Imagem original (b) Imagem normalizada. Fig. 9. Diferença de informação entre imagem original e imagem normalizada

D. Execução do SDRF nos Bancos Normalizados

Executamos o SDRF sobre as versões do banco UFPB-Fotos, tendo como resultado 96,62% de acertos no banco UFPB-Fotos 100 x 100, 97% no banco UFPB-Fotos normalizado em relação à rotação e 97,12% no banco UFPB-Fotos normalizado em relação à escala. Em ambos os casos a taxa de acertos para os bancos normalizados subiu, comprovando a necessidade de um módulo normalizador para o SDRF.

Em seguida, executamos o SDRF sobre as versões do banco ORL, obtendo como resultados 92,5% de acertos para o banco ORL 100x100, 92,5% de acertos para o banco ORL normalizado em relação à rotação e 94% de acertos para o banco ORL normalizado em relação à escala. A taxa de acertos para o banco normalizado em relação à rotação não foi alterada, enquanto que a taxa de acertos para o banco ORL normalizado em relação à escala subiu 1,5 ponto percentual. Novamente, isto confirma a necessidade de um módulo normalizador para o SDRF.

VI. CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS Este trabalho teve como objetivo geral adequar o SDRF a ambientes não controlados. Para tanto, desenvolvemos um módulo de normalização de imagens em relação à rotação e escala.

Normalizamos os bancos UFPB-Fotos e ORL em relação à rotação e escala utilizando detecção automática de olhos.

(5)

Cortamos os bancos UFPB-Fotos e ORL para que se adequassem ao nível de informação dos bancos normalizados. Fizemos isto para que a necessidade de um módulo normalizador de imagens para o SDRF fosse devidamente averiguada. Na Tabela 1 é apresentado um resumo do desempenho, em termos de porcentagem de acertos, dos bancos UFPB e ORL cortados e normalizados no SDRF original.

Nota-se que a taxa de acertos nos bancos normalizados foi igual ou superior que os bancos sem normalização, o que confirma a utilidade do módulo normalizador para o SDRF. Além disso, confirma o averiguado em [8] no que diz respeito à diferença de distância para câmera no banco ORL.

TABELA 1RESUMO DO DESEMPENHO DOS BANCOS UFPB-FOTOS E ORL NO SDRF. Banco Variação Cortado (100 x 100) Normalizado em relação à rotação Normalizado em relação à escala UFPB-Fotos 96,62% 97% 97,12% ORL 92,5% 92,5% 94%

Desenvolver um módulo normalizador para o SDRF foi uma escolha natural porque um módulo desse tipo é citado como parte integrante dos sistemas de reconhecimento facial e porque está bem documentado na literatura que normalizar imagens em sistemas de classificação, de modo que elas fiquem nas mesmas condições que as imagens de treinamento, leva à melhores resultados. Por isso a sua adição ao SDRF influenciou positivamente no desempenho do reconhecimento facial.

O SDRF+ ainda não é um sistema voltado para ambientes não controlados, mas é um sistema com mais opções de ambientes para uso.

As modificações desenvolvidas neste trabalho não são imunes a erros que podem ser corrigidos em trabalhos futuros.

REFERÊNCIAS

[1] A. A. Ross, K. Nandakumar e A. K. Jain, Handbook of Multibiometrics, 1ª ed., Secaucus: Springer-Verlag New York, 2006. [2] N. Thian, “Biometric Authentication System,” Penang, Malásia, 2001. [3] A. K. Jain, B. Klare e U. Park, “Face recognition: Some challenges in

forensics,” em 2011 IEEE International Conference on Automatic Face & Gesture Recognition and Workshops (FG 2011), 2011. [4] W. Zhao, R. Chellappa, P. J. Phillips e A. P. Rosenfeld, “Face

recognition: A literature survey,” ACM Comput. Surv., vol. 54, pp. 399-458, Dezembro 2003.

[5] H. Sellahewa e S. Jassim, “Image-Quality-Based Adaptive Face Recognition,” IEEE Transactions on Instrumentation and Measurement, vol. 59, n. 4, Dezembro 2010.

[6] K. R. Singh, M. A. Zaveri e M. M. Raghuwanshi, “Illumination and

Pose Invariant Face Recognition: A Technical Review,” International Journal of Computer Information Systems and Industrial Management Applications, vol. 02, pp. 29-38.

[7] A. K. Jain e S. Z. Li, Handbook of Face Recognition, 2ª ed., Secaucus: Springer-Verlag New York, 2011.

[8] D. Omaia, “Um Sistema para Detecção e Reconhecimento de Face em Vídeo Utilizando a Transformada Cosseno Discreta,” João Pessoa, 2009.

[9] W. Zhao e R. Chellappa, “Image-based Face Recognition: Issues and Methods,” em Image Recognition and Classification: Algorithms, Systems and Applications, 1ª ed., CRC Press, 2002.

[10] S. T. Chaudhari e A. Kale, “Face Normalization: Enhancing Face Recognition,” em Third International Conference on Emerging Trends in Engineering & Technology (ICETET 2010), 2010.

[11] R. Brunelli e T. A. Poggio, “Face recognition: Features versus templates,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 15, n. 10, pp. 1042-1052, Outubro 1993.

[12] S. A. Khayam, “The Discrete Cosine Transform (DCT): Theory and Application,” 2003.

[13] Z. M. Hafed e M. D. Levine, “Face Recognition Using the Discrete Cosine Transform,” International Journal of Computer Vision, n. 3, pp. 167-188, 2001.

[14] F. M. d. S. Matos, “Reconhecimento de Faces Utilizando a Transformada Cosseno Discreta,” João Pessoa, 2008.

[15] AT&T Laboratories, “The ORL Database of Face,” 2002. [Online]. Available:

http://www.cl.cam.ac.uk/research/dtg/attarchive/pub/data/att_faces.zip. [Acesso em Julho 2011].

[16] L. Xia, D. Yongqing, L. Su e H. Chao, “Rapid human-eye detection based on an integrated method,” em Communications and Mobile Computing (CMC), 2010 International Conference on, 2010. [17] R. O. Duda, P. E. Hart e D. G. Stork, Pattern Classification, 2ª ed.,

Wiley-Interscience, 2001.

[18] L. Xia, D. Yongqing, L. Su e H. Chao, “Rapid human-eye detection based on an integrated method,” em Communications and Mobile Computing (CMC), 2010 International Conference on, 2010.

Referências

Documentos relacionados

Relativamente á realização da peça, pode dizer-se que foram elaborados os programas para realização em CNC dos dois moldes necessários para obtenção da peça no entanto e por

O mar profundo é uma vasta região que recobre aproximadamente 70% da superfície da terra, sendo considerado ainda uma vastidão a ser explorada e estudada pelo homem. A coleção

 Compreender a importância do domínio das técnicas da escrita para a produção de uma informação de qualidade e saber aplica-las às especificidades dos diferentes géneros

Promovido pelo Sindifisco Nacio- nal em parceria com o Mosap (Mo- vimento Nacional de Aposentados e Pensionistas), o Encontro ocorreu no dia 20 de março, data em que também

Este trabalho é resultado de uma pesquisa quantitativa sobre a audiência realizada em 1999 envolvendo professores e alunos do Núcleo de Pesquisa de Comunicação da Universidade

No entanto, maiores lucros com publicidade e um crescimento no uso da plataforma em smartphones e tablets não serão suficientes para o mercado se a maior rede social do mundo

Os maiores coeficientes da razão área/perímetro são das edificações Kanimbambo (12,75) e Barão do Rio Branco (10,22) ou seja possuem uma maior área por unidade de

2. Identifica as personagens do texto.. Indica o tempo da história. Indica o espaço da história. Classifica as palavras quanto ao número de sílabas. Copia do texto três