• Nenhum resultado encontrado

Experimentos, Resultados e Discussão

4.3 Verificação de Faces

comum às duas técnicas, que embora explorem características presentes em cada região da face, atribuem a mesma importância a cada uma delas. Este tratamento dado às regiões acaba desperdiçando informações discriminatórias e ressaltando informações que poderiam ser igno- radas.

Pela análise dos resultados, constata-se que a técnica wMIMPCA além de apresentar me- lhores resultados em todos os comparativos apresentados (ver tabela 4.2), também mantém-se estável em função do número de componentes principais utilizados na representação da ima- gem. Foi mostrado ainda, que a técnica consegue explorar melhor as características locais das faces mesmo quando são particionadas em um elevado número de regiões.

Tabela 4.2 Resumo das melhores taxas de reconhecimento obtidas pelas técnicas.

UMIST ORL Yale

MPCA 96.40(3x3/07) 92.45(2x3/10) 85.22(1x3/10) IMPCA 92.40(−/02) 90.60(−/04) 84.67(−/10) MIMPCA 96.70(2x2/02) 94.33(3x2/04) 95.22(1x3/06) wMIMPCA 98.10(3x3/02) 96.31(3x3/02) 97.90(3x3/10)

4.3

Verificação de Faces

4.3.1 Class Modular Image Principal Component Analysis (cMIMPCA)

As abordagens anteriores são aplicadas a problemas de reconhecimento de faces que, em re- sumo, consiste na identificação do indivíduo ao qual a imagem apresentada pertence. Desta forma, o conjunto de treinamento é formado por faces de todos os indivíduos do banco de ima- gens. Estas abordagens caracterizam-se por utilizar toda a base de treinamento para definição da matriz de projeção. Logo, o espaço-face obtido com o uso das técnicas constitui uma ótima representação de todo o conjunto de treinamento. Entretanto, este espaço-face pode não extrair as informações necessárias para identificar se uma determinada face pertence ou não a algum indivíduo específico da base de treinamento.

Desta forma, a técnica modular bidimensional baseado em classes (cMIMPCA) propõe o uso de várias matrizes de projeção, uma por classe, de forma a capturar características que consigam distinguir se uma face pertence ou não a um determinado indivíduo. Em contrapartida a esta abordagem, há a limitação do número de instâncias de treinamento, que passa a ser muito menor que a quantidade utilizada pelas técnicas de reconhecimento tradicionais. Esta redução prejudica a qualidade das projeções das imagens, uma vez que ter poucos padrões implica uma análise mais pobre das correlações entre os dados de treinamento.

Os experimentos visam testar o desempenho da técnica cMIMPCA com as técnicas que utilizam abordagens aplicadas ao reconhecimento de faces. Os resultados também são com- parados com adaptações destas técnicas aplicadas a problemas de verificação de faces. As técnicas originais foram modificadas de forma a extrair as características de cada indivíduo sep-

46 CAPÍTULO 4 EXPERIMENTOS, RESULTADOS E DISCUSSÃO

aradamente. Esta adaptação não foi aplicada à técnica PCA original em função de limitações matemáticas inerentes à técnica, especialmente no que diz respeito à extração dos vetores base para construção do seu espaço-face.

Para problemas de reconhecimento de faces, apenas a medida de dissimilaridade foi su- ficiente para identificar qual a classe do padrão apresentado. No reconhecimento não havia rejeições, havendo apenas classificações corretas e incorretas. Já para problemas de verificação é necessário definir pelo menos dois novos conceitos: o limiar de aceitação global e o repre- sentante da classe a ser verificada. A estas etapas de definição dos parâmetros dá-se o nome de protocolo do sistema de verificação.

O protocolo de verificação adotado para a técnica cMIMPCA caracteriza-se pela definição dos pesos das classes e pelo cálculo do limiar de aceitação global. Note que é definido apenas um limiar de aceitação para todo o sistema de verificação. Este valor é utilizado para aumentar ou diminuir a segurança do sistema. O cálculo do limiar global é detalhado nos passos a seguir:

• O conjunto de faces é dividido em dois conjuntos: treinamento e teste

• Um representante (exemplar) de cada classe é definido baseado no vetor média dos dados do conjunto de treinamento.

• O peso da classe é calculado utilizando a média das distâncias entre os elementos de treinamento e o representante da classe.

• O limiar de aceitação final é calculado utilizando o peso de cada classe e o limiar de aceitação global. O limiar global é um valor parametrizável de acordo com o nível de segurança que se deseja do sistema.

O limiar de aceitação geralmente é baseado em algum tipo de métrica. Nos experimentos realizados, foi utilizada a distância euclidiana como a medida de dissimilaridade. Como men- cionado acima, apenas um limiar é calculado para todos os indivíduos da base de treinamento. Em função desta limitação, foi desenvolvido um conjunto de pesos que visa informar o quão próximo ao representante da classe as instâncias das faces estão. O objetivo do uso deste con- junto de pesos torna-se claro ao se considerar que o limiar de aceitação final é calculado pela combinação destes valores com o limiar de aceitação global. A forma de cálculo dos pesos de cada classe pode ser diferente (utilizando o valor médio, mediano, máximo, mínimo etc.), entretanto, foi adotado o valor médio das distâncias entre o representante da classe e as faces do indivído presentes na base de treinamento.

Mesmo para as técnicas modulares, que utilizam mais de uma região por face, é adotado um único limiar de aceitação global e não um limiar por região da face. Esta medida visa simplificar a técnica proposta e, por isso, não foram realizados testes utilizando mais de um limiar por classe.

Todos os experimentos foram executados sobre os mesmos conjuntos de treinamento e teste. Para cada face foram utilizadas dez instâncias sendo cinco delas utilizados para teste e as outras cinco utilizadas para treinamento. Além disso, o conjunto de teste é formado ainda por todas as instâncias dos demais indivíduos, isto é, o conjunto de teste compreende cinco imagens da classe apresentada além das dez imagens de cada uma das demais classes que constituem a base

4.3 VERIFICAÇÃO DE FACES 47

de faces. Em média, a base de teste utilizada nos experimentos é formada por aproximadamente 150(cento e cinqenta) imagens. A utilização de um número muito elevado de padrões falsos foi adotado no intuito de validar as taxas de verificações falsas (false positive), por trata-se de uma medida muito crítica para sistemas de verificação.

Após testes iniciais com a técnica proposta, foi percebido que o particionamento (2x2) foi o que obteve os melhores resultados para toda as bases de faces. Desta forma, apenas resultados obtidos utilizando esta configuração serão apresentados.

Todos os resultados serão apresentados utilizando curvas ROC [Faw06] (do inglês, Re- ceive Operating Curve). A curva ROC consiste em um gráfico bidimensional que relaciona as taxas de falsos positivos no eixo x e as taxas de verdadeiros positivos no eixo y. Note que ele apresenta as taxas e não as quantidades de verdadeiro e falso positivos, logo, seus valores são invariantes ao número de instâncias utilizadas nos experimentos. A adoção da curva ROC deve-se à forma simples e direta como estas taxas são relacionadas, além de ser muito utilizada na literatura para análise das taxas de verificação.

Além das técnicas originalmente propostas para o reconhecimento de faces foram feitas adaptações nestas técnicas para aplicá-las a problemas de verificação de imagens. Desta forma, tem-se duas baterias de testes. A primeira bateria foi realizada com as técnicas originais, de- scritas anteriormente. A segunda, visa comparar o desempenho das técnicas adaptadas a pro- blemas de verificação de faces. Em cada bateria de teste foram calculadas sua curva ROC e sua Área Sob a Curva (AUC, do inglês Area Under Curve) [Faw06] correspondente. A área sob a curva consiste em uma medida de desempenho de classificadores baseada na curva ROC do classificador.

Os experimentos serão apresentados agrupados por base de dados, com a finalidade de detalhar o desempenho das técnicas executadas sobre diferentes tipos de variações.

A Fig. 4.13(a) apresenta os resultados obtidos com as técnicas tradicionais sobre a base de faces ORL, enquanto a Fig. 4.13(b) apresenta os resultados, para os mesmos conjuntos de treinamento e teste, obtidos fazendo uso das abordagens aplicadas à verificação. Comparando- se os resultados apresentados, é visível o ganho de desempenho obtido com a técnica modular. Em sua forma original, apresenta AUC inferior a 0, 5, obtendo o valor de aproximadamente 0, 65 com a nova abordagem. Entretanto, o resultado que mais chama a atenção na comparação dos gráficos refere-se à considerável perda de desempenho que ocorreu com a técnica bidimen- sional.

A técnica MIMPCA apresenta a melhor AUC dentre as técnicas aplicadas ao reconheci- mento, mas tem seu desempenho prejudicado, em mais de quarenta pontos percentuais, após a modificação proposta. Este comportamento é explicado levando-se em consideração a grande redução no número de instâncias de treinamento. Problema este que não afeta de forma tão drástica as técnicas modulares, uma vez que cada região da face é tratada como um padrão de treinamento. Outro ganho das técnicas modulares, em relação à holística, diz respeito à redução do tamanho da matriz de covariância. Como exemplo, para o caso em que uma face é dividida em quatro regiões, o número de padrões de treinamento considerados passa a ser qua- tro vezes maior, enquanto sua matriz de covariância torna-se quatro vezes menor que a obtida pela técnica holística.

48 CAPÍTULO 4 EXPERIMENTOS, RESULTADOS E DISCUSSÃO

melhora no desempenho ao fazer uso da abordagem proposta (Figuras 4.14(a) e 4.14(b)). Examinando os resultados obtidos com a técnica modular bidimensional, que originalmente apresentou valores de AUC de aproximadamente 0, 92, vê-se uma melhora de desempenho de aproximadamente quatro pontos percentuais, obtendo resultados próximos a 0, 96. As vanta- gens já mencionadas das técnicas modulares no tratamento de problemas que envolvem poucos padrões de treinamento, aliado ao tipo de variação explorada pela base Yale contribuem para explicar este ganho. As técnicas modulares mostraram-se muito aptas à extração de caracterís- ticas em faces que exploram variações como: expressões faciais, iluminação e uso de objetos sobre a face. Logo, o ganho de desempenho de classificação das abordagens modulares pode ser parcialmente explicado pelo melhor aproveitamento das informações locais por parte destas técnicas.

Para a base de dados Yale, a técnica IMPCA também apresentou péssimos resultados ao ser adaptada para problemas de verificação, o que mostra seu estreito relacionamento com o número de padrões de treinamento. Desta forma, técnicas que aumentem virtualmente o número de protótipos de treinamento [ADD04] [TCZZ06] [Vet98] podem ser combinadas com a IMPCA no intuito de melhorar seu desempenho. Outra possibilidade de uso da técnica bidi- mensional para verificação consiste na utilização de sua abordagem original, visto que, ela obteve melhores resultados que sua abordagem por classe.

Por fim, os experimentos também foram executados sobre a base de faces UMIST, que explora problemas de rotação das faces. As Figuras 4.15(a) e 4.15(b) apresentam, respectiva- mente, os resultados para as técnicas originais e suas adaptações para verificação de faces. As abordagens originais apresentam AUC muito semelhantes devido ao tipo de variação explorado pela base. Entretanto, suas áreas diferenciam-se consideravelmente ao serem adaptadas a pro- blemas de verificação de faces. Dentre estas modificações, destacam-se: a expressiva queda no desempenho da técnica IMPCA, assim como acorreu nos demais experimentos realizados, e a grande melhora obtida pela técnica MPCA, cujo ganho com outras bases foi insignificante.

Outra característica importante sobre os resultados obtidos na base UMIST diz respeito à sua elevada AUC, especialmente ao considerar o tipo de variação explorada pela base. Ex- perimentalmente, constatou-se que as abordagens modulares quando aplicadas a problemas de verificação de faces rotacionadas obtiveram melhor desempenho que as abordagens holísticas.

Outra informação muito importante em problemas de verificação é a análise das taxas de verdadeiros positivos e falsos positivos ao se fixar um valor de rejeição. Esta medida é um importante instrumento de análise do desempenho das técnicas, uma vez que é esperado uma excelente taxa de verificações corretas, mesmo sob situações adversas de aquisição das ima- gens. Além disso, também é esperado que o sistema recuse faces pertencentes a outros indiví- duos, isto é, rejeite todos os padrões falsos apresentados. Neste contexto, as tabelas 4.3 e 4.4 apresentam as taxas de classificações corretas ao se fixar as taxas de falsos reconhecimentos em 1% e 5%, respectivamente. O tempo médio necessário para extração de características e classificação dos padrões foi coletado. Seus valores foram coletados para todas as técnicas e bases de dados. A Tabela 4.5 apresenta seus valores agrupados por técnica e base de faces. Nela percebe-se que, excetuando-se pela base ORL, a técnica proposta requer menos tempo de processamento em todos os experimentos.

4.3 VERIFICAÇÃO DE FACES 49

(a) Base ORL

(b) Base ORL (Baseado em Classes)

Figura 4.13 Curvas ROC exibindo o desempenho das técnicas tradicionais (esquerda) e das técnicas adatadas à verificação de faces (direita) para a base de faces ORL.

50 CAPÍTULO 4 EXPERIMENTOS, RESULTADOS E DISCUSSÃO

(a) Base Yale

(b) Base Yale (Baseado em Classes)

Figura 4.14 Curvas ROC exibindo o desempenho das técnicas tradicionais (esquerda) e das técnicas adatadas à verificação de faces (direita) para a base de faces Yale.

4.3 VERIFICAÇÃO DE FACES 51

(a) Base Umist

(b) Base Umist (Baseado em Classes)

Figura 4.15 Curvas ROC exibindo o desempenho das técnicas tradicionais (esquerda) e das técnicas adatadas à verificação de faces (direita) para a base de faces UMIST.

52 CAPÍTULO 4 EXPERIMENTOS, RESULTADOS E DISCUSSÃO

grande influência na escolha de um sistema de reconhecimento de faces. Especialmente nos sistemas que serão utilizados em dispositivos com restrições no poder computacional ou no armazenamento dos dados. A relação entre o custo computacional necessário para processa- mento e o custo de armazenamento das imagens é fator decisivo para adoção de tais sistemas. Baseando-se nas limitações acima, são apresentadas (Tab. 4.6) as quantidades de coeficientes necessários para armazenamento dos dados de todas as técnicas apresentadas neste trabalho.

Tabela 4.3 Taxas de verdadeiros positivos (TP) ao se fixar o valor de falsos positivos (FP) em 1%

ORL YALE UMIST

PCA 57.80 49.50 65.56

IMPCA 72.40 55.80 47.67

MIMPCA 69.60 61.00 59.11

cMIMPCA 72.37 69.70 73.11

Tabela 4.4 Taxas de verdadeiros positivos (TP) ao se fixar o valor de falsos positivos (FP) em 5%

ORL YALE UMIST

PCA 91.05 82.60 77.33

IMPCA 95.95 83.90 68.33

MIMPCA 96.45 88.20 76.44

cMIMPCA 98.15 91.60 83.33

Tabela 4.5 Tempo computacional, em segundos (s), necessário para as etapas de extração de caracterís- ticas e classificação dos padrões.

ORL YALE UMIST

PCA 580 410 470

MPCA 189 51 66

IMPCA 50 22 31

cMIMPCA 57 18 25

Examinando a tabela apresentada, percebe-se que é necessário um grande número de coe- ficientes para representação das imagens pelas técnicas propostas. O que implica uma redução de dimensionalidade menor, especialmente pelas técnicas bidimensionais e pela técnicas mo- dular bidimensional. Entretanto, pelos experimentos analisados anteriormente, percebe-se uma concentração de informação nos primeiros componentes, o que torna as projeções mais repre- sentativas, mesmo sob pequenas dimensionalidades. Desta forma, a limitação do tamanho das

4.3 VERIFICAÇÃO DE FACES 53

Tabela 4.6 Número de coeficientes utilizados para representação da imagem utilizando 1 e 3 compo- nentes principais Equação 1 #PC 3 #PC PCA #PC 1 3 MPCA 9· #PC 9 27 IMPCA 112· #PC 112 336 MIMPCA 3· 112 · #PC 336 1008 cMIMPCA 3· 112 · #PC 336 1008 wMIMPCA 3· 112 · #PC 336 1008

projeções é minimizada em função das melhores taxas de acerto serem obtidas com poucos componentes principais, e, consequentemente, com uma representação ainda compacta das faces.

Como alternativa a este problema de armazenamento, sugere-se a aplicação da técnica de análise de componentes principais tradicional sobre a matriz de dados resultante das técnicas bidimensionais. Uma vez que a técnica será executada sobre dados mais representativos dos padrões de treinamento, espera-se que os resultados obtidos sejam superiores aos alcançados utilizando-se exclusivamente o PCA tradicional. Experimentos realizados pelos autores da técnica IMPCA mostraram que, aplicando-se a técnica PCA tradicional sobre as projeções obtidas com a técnica IMPCA, não resultou em perda significativa do desempenho obtido com o uso exclusivo da técnica bidimensional.

O detalhamento dos resultados obtidos com o uso de todas as técnicas propostas pode ser visualizado no Apêncice A.

C

APÍTULO

5

Conclusão

Documentos relacionados