• Nenhum resultado encontrado

Em seus experimentos, Dalal e Triggs descobriram que a Norma L2, L2-Hys e o L1-sqrt alcan¸cavam uma performance similar, enquanto a Norma L1 atingia uma performance pouco menos confi´avel; entretanto, todos os quatro m´etodos mostraram uma melhoria significativa sobre os dados n˜ao normalizados [22].

O ´ultimo passo no reconhecimento de objetos usando descritores HOG ´e inserir os descritores em algum sistema de reconhecimento baseado em aprendizado supervisionado. O classificador SVM ´e um classificador bin´ario que procura por um hiperplano ´otimo como fun¸c˜ao de decis˜ao. Uma vez treinado em imagens contendo um objeto particular, o classificador SVM pode tomar decis˜oes sobre a presen¸ca de um objeto, como um ser humano, em imagens de teste adicionais. Nos testes de reconhecimento de humanos de Dalal e Triggs, eles usaram o pacote gratuito SVMLight1 em conjunto com seus descritores HOG para achar figuras humanas em imagens de teste.

Como parte do Pascal Visual Object Classes 2006 Workshop, Dalal e Triggs apresen- taram os resultados de aplicar descritores HOG para outros objetos de imagens al´em de seres humanos, como carros, ˆonibus e bicicletas, al´em de animais comuns como cachorros, gatos e vacas. Eles inclu´ıram em seus resultados os parˆametros ´otimos para formula¸c˜ao dos blocos e normaliza¸c˜ao em cada caso.

4.2

Eigenfaces

O algoritmo eigenfaces [82, 83] aplica t´ecnicas de an´alise de componentes principais (Prin-

cipal Component Analysis, ou PCA) [45] para codificar a imagem e ent˜ao compar´a-la com um conjunto de imagens do banco de dados previamente codificados para encontrar o melhor par como mostra a Figura 4.3. A imagem I ´e primeiramente convertida para um vetor p, juntando as colunas. A imagem vetorial m´edia ¯a cont´em o valor m´edio para cada pixel calculado durante o processo de treinamento, calculando a m´edia no pixel ao longo de todas as imagens de treinamento. O vetor ¯p subtra´ıdo pela m´edia ´e ent˜ao projetado para o subespa¸co do autovetor multiplicando o vetor pela transposta da matriz subespa¸co,

UT. O vetor resultante, ˘p, ´e o vetor codificado.

A compara¸c˜ao ´e executada por uma s´erie de compara¸c˜oes aos pares entre o vetor codificado ˘p, e a matriz de membros do banco de dados codificados, Z. A m´etrica da compara¸c˜ao em par ´e um c´alculo de distˆancia de vetores como a distˆancia euclidiana. Enquanto Turk usou a distˆancia euclidiana no artigo original [82], pesquisas subsequentes demonstraram que usar a distˆancia de mahalanobis melhora significantemente a precis˜ao da identifica¸c˜ao [85].

O algoritmo Eigenface ´e mostrado abaixo. A convers˜ao de um pixel N de uma imagem 1http://svmlight.joachims.org/

4.2. Eigenfaces 27

Figura 4.5: Vis˜ao geral do algoritmo Eigenfaces.

I para um elemento N de um vetor p ´e mostrado como uma fun¸c˜ao de nome Conver- terImagemParaVetor. A subtra¸c˜ao do vetor m´edia, ¯a, do vetor p, para formar o vetor

m´edia subtra´ıdo, ¯p, ´e mostrado na segunda linha do algoritmo, e a proje¸c˜ao de ¯p para o

subespa¸co do autovetor ´e mostrado na linha 3.

A matriz subespa¸co UT cont´em M0 linhas, onde cada linha ´e um autovetor calculado

4.2. Eigenfaces 28

I BestMatch = EFId((I,Z));

p = ConverterImagemParaVetor(I);

p = (p − ¯a) /* Subtrai a m´edia dos pixels */ Ip = UTp¯ /* Projec¸˜ao no subespac¸o */ I

Para cada rosto codificado no banco de dados ZI1:M0,g em Z I

dIg =

q

λ−11p1− Z1,g)2+ ... + λM−10(˘pM0− ZM0,g)2 I

Mant´em o melhor par dg e o correspondente Z1:M0,g;

I

Algorithm 1: Algoritmo de reconhecimento de face eigenfaces.

Durante o processo de treinamento, os autovalores e os autovetores s˜ao calculados na mesma quantidade que o n´umero de imagens de treinamento. O autovalor corresponde `

a quantidade de informa¸c˜ao que o autovetor contribui para a imagem, e os autovetores correspondente aos menores autovalores podem ser descartados com m´ınima perda de informa¸c˜ao. Dadas M imagens de treinamento, M’ ´e o n´umero de autovetores que s˜ao retidos do conjunto original M de autovetores e ´e normalmente definido em 60% para manter a maior taxa de identifica¸c˜ao [55].

A compara¸c˜ao do vetor codificado para cada membro do banco de imagens, Z, ´e mostrado no algoritmo acima a partir da linha 4 at´e a 6. O la¸co de repeti¸c˜ao na linha 4 itera por cada vetor codificado, Z1:M0,g, e calcula a distˆancia de Mahalanobis, dg, entre

os vetores codificados e os do banco de dados. O c´alculo da distˆancia de Mahalanobis ´e similar `a distˆancia Euclidiana e quantifica a diferen¸ca entre os dois vetores, e o par com a menor distˆancia de Mahalanobis ´e o melhor casamento.

Em 2004, o trabalho de Shakunaga et al [72] apresentou um m´etodo robusto de reco- nhecimento de face que pode funcionar mesmo quando um n´umero insuficiente de imagens s˜ao registradas para cada pessoa. O m´etodo ´e composto de corre¸c˜ao e decomposi¸c˜ao de imagem, ambos especificados no espa¸co de imagem normalizado (NIS ou normalized image

space). A correla¸c˜ao da imagem ´e realizada por proje¸c˜oes iterativas de uma imagem para um autoespa¸co em NIS. O m´etodo funciona bem para imagens naturais que possuem v´arios tipos de ru´ıdo, incluindo sombras, reflex˜oes e oclus˜oes. Foi proposta a decom- posi¸c˜ao de um eigenface para um autoespa¸co dois-ortogonal e com isso foi mostrada que a decomposi¸c˜ao ´e efetiva para realizar reconhecimento de face robusto sob v´arias condi¸c˜oes de ilumina¸c˜ao.

Em Yang et al [90] foi proposta uma estrat´egia de representa¸c˜ao de faces humanas baseada na coloriza¸c˜ao de imagens. A t´ecnica eigenfaces foi desenvolvida para extra¸c˜ao de caracter´ısticas faciais, e testado com o banco de dados de face AR. Os resultados demonstraram que o m´etodo ´e mais robusto para varia¸c˜oes de ilumina¸c˜ao que o tradicional eigenfaces baseado em imagens em tons de cinza.

4.2. Eigenfaces 29

No trabalho de Zuo et al [95], foi proposto um meio de resolver o problema de reconhe- cimento de faces com ru´ıdos e parcialmente oclusos usando um ajuste iterativo com o peso sendo ajustado a cada vez do m´etodo eigenfaces (IRF-Eigenfaces). Diferente do ajuste do eigenfaces, no qual uma simples opera¸c˜ao de proje¸c˜ao linear ´e utilizada para extrair o ve- tor de caracter´ısticas, o IRF-Eigenfaces define primeiro uma fun¸c˜ao objetivo generalizada e ent˜ao usa o algoritmo IRLS (iteratively reweighted least-squares) para extrair o vetor de caracter´ısticas minimizando a fun¸c˜ao objetivo generalizada. Os resultados no banco de dados AR mostraram que o IRF-Eigenfaces ´e superior a tanto o pr´oprio Eigenfaces quanto ao m´etodo probabil´ıstico local para reconhecer faces com ru´ıdos e parcialmente oclusas.

O artigo de El-Arief et al [26] faz uma compara¸c˜ao entre dois m´etodos hol´ısticos, o eigenfaces padr˜ao e o Holistic Fourier Invariant Features (Spectroface), com o primeiro baseado em PCA e o ´ultimo, baseado em frequˆencia. Ambos os m´etodos s˜ao testados separadamente em cinco problemas de reconhecimento facial: pose 3D, express˜oes faciais, ilumina¸c˜ao n˜ao-uniforme, transla¸c˜ao e escala, utilizando um banco de dados de imagens adequado a cada problema. Os resultados mostraram que o m´etodo spectroface supera o eigenfaces nos quatro primeiros problemas. Entretanto n˜ao houve diferen¸ca significa- tiva entre os m´etodos no problema de escala. Para o problema de express˜ao facial, a compara¸c˜ao mostrou que aplicar o m´etodo baseado em frequˆencia na menor subbanda da transformada wavelet ´e muito melhor que aplicar o m´etodo baseado em PCA.

Em 2009, Sundaraj [78] propˆos investigar os efeitos dos artefatos faciais na taxa de reconhecimento do eigenfaces baseado em redes neurais. Foi descoberto que o eigenfaces, junto com a distˆancia euclidiana pode ter sucesso nesse uso para reconhecer rostos huma- nos em tempo quase real. O artigo investiga o desempenho da taxa de reconhecimento com rostos que possuem tais artefatos comuns e prop˜oe a modifica¸c˜ao dos banco de dados existentes para melhorar a taxa de identifica¸c˜ao, utilizando um artista gr´afico para mo- dificar as imagens nos experimentos, e uma rede neural baseado em m´ultiplos eigenface como classificador.

Mais recentemente, em 2010, um novo termo introduzido como auto-espa¸co h´ıbrido

hybrid-eigenspace foi utilizado para sintetizar vis˜oes m´ultiplas virtuais de uma pessoa sob pose e ilumina¸c˜ao diferentes de uma ´unica imagem 2D. As vis˜oes sintetizadas virtuais s˜ao usadas como amostras de treinamento em alguns classificadores de subespa¸co requerindo m´ultiplas imagens de treinamento para reconhecimento de face invariante a pose e ilu- mina¸c˜ao. O processo completo ´e chamado de classificador virtual e provˆe uma solu¸c˜ao eficiente para o problema de amostra ´unica. O trabalho de Sharma et al [74] estende o eigenfaces introduzindo eigenfaces h´ıbridos que s˜ao diferentes do original proposto por Turk e Pentland em 1994. Eigenfaces h´ıbridos possuem propriedades que s˜ao comuns a faces e aos eigenfaces ao mesmo tempo. Os testes se deram em cima dos banco de da-

Documentos relacionados