Eigenfaces - Comparação entre algoritmos de reconhecimento de face no contexto de acessibilidad

Em seus experimentos, Dalal e Triggs descobriram que a Norma L2, L2-Hys e o L1-sqrt alcan¸cavam uma performance similar, enquanto a Norma L1 atingia uma performance pouco menos confiável; entretanto, todos os quatro métodos mostraram uma melhoria significativa sobre os dados não normalizados [22].

O último passo no reconhecimento de objetos usando descritores HOG é inserir os descritores em algum sistema de reconhecimento baseado em aprendizado supervisionado. O classificador SVM é um classificador binário que procura por um hiperplano ótimo como fun¸cão de decisão. Uma vez treinado em imagens contendo um objeto particular, o classificador SVM pode tomar decisões sobre a presen¸ca de um objeto, como um ser humano, em imagens de teste adicionais. Nos testes de reconhecimento de humanos de Dalal e Triggs, eles usaram o pacote gratuito SVMLight1 em conjunto com seus descritores HOG para achar figuras humanas em imagens de teste.

Como parte do Pascal Visual Object Classes 2006 Workshop, Dalal e Triggs apresen- taram os resultados de aplicar descritores HOG para outros objetos de imagens além de seres humanos, como carros, ônibus e bicicletas, além de animais comuns como cachorros, gatos e vacas. Eles inclu´ıram em seus resultados os parâmetros ótimos para formula¸cão dos blocos e normaliza¸cão em cada caso.

4.2 Eigenfaces

O algoritmo eigenfaces [82, 83] aplica t´ecnicas de an´alise de componentes principais (Prin-

cipal Component Analysis, ou PCA) [45] para codificar a imagem e ent˜ao compará-la com um conjunto de imagens do banco de dados previamente codificados para encontrar o melhor par como mostra a Figura 4.3. A imagem I ´e primeiramente convertida para um vetor p, juntando as colunas. A imagem vetorial m´edia ¯a cont´em o valor médio para cada pixel calculado durante o processo de treinamento, calculando a média no pixel ao longo de todas as imagens de treinamento. O vetor ¯p subtra´ıdo pela m´edia é então projetado para o subespa¸co do autovetor multiplicando o vetor pela transposta da matriz subespa¸co,

UT_{. O vetor resultante, ˘}_{p, ´}_{e o vetor codificado.}

A compara¸cão é executada por uma série de compara¸cões aos pares entre o vetor codificado ˘p, e a matriz de membros do banco de dados codificados, Z. A m´etrica da compara¸cão em par é um cálculo de distância de vetores como a distância euclidiana. Enquanto Turk usou a distância euclidiana no artigo original [82], pesquisas subsequentes demonstraram que usar a distância de mahalanobis melhora significantemente a precisão da identifica¸cão [85].

O algoritmo Eigenface ´e mostrado abaixo. A convers˜ao de um pixel N de uma imagem 1_{http://svmlight.joachims.org/}

4.2. Eigenfaces 27

Figura 4.5: Vis˜ao geral do algoritmo Eigenfaces.

I para um elemento N de um vetor p ´e mostrado como uma fun¸cão de nome Conver- terImagemParaVetor. A subtra¸cão do vetor média, ¯a, do vetor p, para formar o vetor

m´edia subtra´ıdo, ¯p, ´e mostrado na segunda linha do algoritmo, e a proje¸c˜ao de ¯p para o

subespa¸co do autovetor ´e mostrado na linha 3.

A matriz subespa¸co UT _cont´_{em M}0 _{linhas, onde cada linha ´}_{e um autovetor calculado}

4.2. Eigenfaces 28

I BestMatch = EFId((I,Z));

p = ConverterImagemParaVetor(I);

I¯p = (p − ¯a) /* Subtrai a m´edia dos pixels */ I I˘p = UT_p_¯ _{/* Projec}_¸˜_{ao no subespac}_{¸o */ I}

Para cada rosto codificado no banco de dados ZI1:M0_,g em Z I

dIg =

λ−1₁ (˘p1− Z1,g)2+ ... + λM−10(˘p_M0− Z_M0_,g)2 I

Mant´em o melhor par dg e o correspondente Z1:M0_,g;

Algorithm 1: Algoritmo de reconhecimento de face eigenfaces.

Durante o processo de treinamento, os autovalores e os autovetores s˜ao calculados na mesma quantidade que o n´umero de imagens de treinamento. O autovalor corresponde `

a quantidade de informa¸cão que o autovetor contribui para a imagem, e os autovetores correspondente aos menores autovalores podem ser descartados com m´ınima perda de informa¸cão. Dadas M imagens de treinamento, M’ é o número de autovetores que são retidos do conjunto original M de autovetores e é normalmente definido em 60% para manter a maior taxa de identifica¸cão [55].

A compara¸c˜ao do vetor codificado para cada membro do banco de imagens, Z, ´e mostrado no algoritmo acima a partir da linha 4 at´e a 6. O la¸co de repeti¸c˜ao na linha 4 itera por cada vetor codificado, Z1:M0_,g, e calcula a distˆancia de Mahalanobis, d_g, entre

os vetores codificados e os do banco de dados. O cálculo da distância de Mahalanobis é similar à distância Euclidiana e quantifica a diferen¸ca entre os dois vetores, e o par com a menor distância de Mahalanobis é o melhor casamento.

Em 2004, o trabalho de Shakunaga et al [72] apresentou um método robusto de reconhecimento de face que pode funcionar mesmo quando um número insuficiente de imagens são registradas para cada pessoa. O método é composto de corre¸cão e decomposi¸cão de imagem, ambos especificados no espa¸co de imagem normalizado (NIS ou normalized image

space). A correla¸c˜ao da imagem é realizada por proje¸cões iterativas de uma imagem para um autoespa¸co em NIS. O método funciona bem para imagens naturais que possuem vários tipos de ru´ıdo, incluindo sombras, reflexões e oclusões. Foi proposta a decomposi¸cão de um eigenface para um autoespa¸co dois-ortogonal e com isso foi mostrada que a decomposi¸cão é efetiva para realizar reconhecimento de face robusto sob várias condi¸cões de ilumina¸cão.

Em Yang et al [90] foi proposta uma estratégia de representa¸cão de faces humanas baseada na coloriza¸cão de imagens. A técnica eigenfaces foi desenvolvida para extra¸cão de caracter´ısticas faciais, e testado com o banco de dados de face AR. Os resultados demonstraram que o método é mais robusto para varia¸cões de ilumina¸cão que o tradicional eigenfaces baseado em imagens em tons de cinza.

4.2. Eigenfaces 29

No trabalho de Zuo et al [95], foi proposto um meio de resolver o problema de reconhecimento de faces com ru´ıdos e parcialmente oclusos usando um ajuste iterativo com o peso sendo ajustado a cada vez do método eigenfaces (IRF-Eigenfaces). Diferente do ajuste do eigenfaces, no qual uma simples opera¸cão de proje¸cão linear é utilizada para extrair o vetor de caracter´ısticas, o IRF-Eigenfaces define primeiro uma fun¸cão objetivo generalizada e ent˜ao usa o algoritmo IRLS (iteratively reweighted least-squares) para extrair o vetor de caracter´ısticas minimizando a fun¸cão objetivo generalizada. Os resultados no banco de dados AR mostraram que o IRF-Eigenfaces é superior a tanto o próprio Eigenfaces quanto ao método probabil´ıstico local para reconhecer faces com ru´ıdos e parcialmente oclusas.

O artigo de El-Arief et al [26] faz uma compara¸cão entre dois métodos hol´ısticos, o eigenfaces padr˜ao e o Holistic Fourier Invariant Features (Spectroface), com o primeiro baseado em PCA e o último, baseado em frequência. Ambos os métodos são testados separadamente em cinco problemas de reconhecimento facial: pose 3D, expressões faciais, ilumina¸cão não-uniforme, transla¸cão e escala, utilizando um banco de dados de imagens adequado a cada problema. Os resultados mostraram que o m´etodo spectroface supera o eigenfaces nos quatro primeiros problemas. Entretanto não houve diferen¸ca significativa entre os métodos no problema de escala. Para o problema de expressão facial, a compara¸cão mostrou que aplicar o método baseado em frequência na menor subbanda da transformada wavelet ´e muito melhor que aplicar o método baseado em PCA.

Em 2009, Sundaraj [78] propôs investigar os efeitos dos artefatos faciais na taxa de reconhecimento do eigenfaces baseado em redes neurais. Foi descoberto que o eigenfaces, junto com a distância euclidiana pode ter sucesso nesse uso para reconhecer rostos humanos em tempo quase real. O artigo investiga o desempenho da taxa de reconhecimento com rostos que possuem tais artefatos comuns e propõe a modifica¸cão dos banco de dados existentes para melhorar a taxa de identifica¸cão, utilizando um artista gráfico para mo- dificar as imagens nos experimentos, e uma rede neural baseado em múltiplos eigenface como classificador.

Mais recentemente, em 2010, um novo termo introduzido como auto-espa¸co h´ıbrido

hybrid-eigenspace foi utilizado para sintetizar vis˜oes múltiplas virtuais de uma pessoa sob pose e ilumina¸cão diferentes de uma única imagem 2D. As visões sintetizadas virtuais são usadas como amostras de treinamento em alguns classificadores de subespa¸co requerindo múltiplas imagens de treinamento para reconhecimento de face invariante a pose e ilumina¸cão. O processo completo é chamado de classificador virtual e provê uma solu¸cão eficiente para o problema de amostra única. O trabalho de Sharma et al [74] estende o eigenfaces introduzindo eigenfaces h´ıbridos que são diferentes do original proposto por Turk e Pentland em 1994. Eigenfaces h´ıbridos possuem propriedades que são comuns a faces e aos eigenfaces ao mesmo tempo. Os testes se deram em cima dos banco de da-

No documento Comparação entre algoritmos de reconhecimento de face no contexto de acessibilidade (páginas 52-56)