• Nenhum resultado encontrado

Experimentos, Resultados e Discussão

4.2 TÉCNICAS DE RECONHECIMENTO DE FACES

para segurança dos dados, em mecanismos de buscas na internet como forma de melhorar a qualidade das buscas, em sites de relacionamento e redes sociais. Também é utilizada como um importante meio de controlar acessos a museus, parques, academias entre outros lugares. Parte deste crescimento está relacionado à elevada precisão obtida pelos sistemas de reconhecimento atuais e ao baixo custo de aquisição e implantação destes sistemas.

Entretanto, alguns fatores influenciam diretamente a qualidade do reconhecimento das faces. Dentre eles podemos citar: as variações externas, que afetam a qualidade da imagem capturada, e o tempo computacional necessário para classificação das imagens. Desta forma, o objetivo principal dos experimentos conduzidos neste trabalho é o da aplicação das técnicas desenvolvi- das sobre imagens afetadas por variações locais, de forma a comprar suas taxas de acerto e custo de processamento com suas técnicas-base.

Os experimentos realizados para validar as técnicas de reconhecimento utilizaram sempre cinco imagens para treinamento e as demais para testes. Para as técnicas modulares também foram utilizadas diferentes configurações de particionamento das imagens. Foram feitos experi- mentos com as imagens particionadas em apenas duas regiões - (1x2), (2x1) -, até configurações nas quais cada imagem foi subdividida em dezesseis regiões - (4x4). Para quantificar a perda de informação global da face, ao ser utilizado um grande número de regiões nas imagens, foi realizada uma bateria de experimentos com um número ainda maior de partições. Como ex- emplo, dividindo-se as imagens em mais de dezesseis regiões cada uma delas terá tamanho inferior a 23x28 pixels, que poderá não representar adequadamente as informações da região analisada. Desta forma, a classificação final da imagem será prejudicada em função da pouca representatividade de cada região da imagem.

Exclusivamente para os problemas de reconhecimento de faces não foram utilizados li- miares de aceitação (thresholds), ou seja, não há rejeições por parte dos classificadores. Há apenas classificações corretas ou incorretas. Todos os experimentos também foram realiza- dos utilizando o classificador k-NN (do inglês, Nearest Neighbor) [CH67] que baseia-se na vizinhança para definir a classe do elemento apresentado. O classificador caracteriza-se por sua simplicidade e por obter excelentes resultados quando aplicado em diversos domínios de problemas.

Para efeito comparativo, o mesmo classificador foi aplicado às técnicas-base da abordagem modular bidimensional. Entretanto, o classificador foi alterado para adaptar-se às diferentes peculiaridades de cada conjunto de dados produzido pelas técnicas. Como exemplo, para a técnica IMPCA tem-se uma medida de dissimilaridade entre duas matrizes, enquanto na MPCA a mesma medida é feita utilizando conjuntos de vetores, e ainda, na técnica MIMPCA tal medida é feita entre conjuntos de matrizes de dados. Para as técnicas MPCA e MIMPCA, os conjuntos de vetores e matrizes possuem cardinalidade igual à quantidade de regiões nas quais as imagens foram divididas.

A Fig. 4.4 apresenta resultados para diferentes quantidades de regiões nas quais as imagens foram particionadas. Os resultados foram obtidos com a técnica MIMPCA sobre a base de faces ORL, foi utilizado o classificador 3-NN e três componentes principais para a representação das faces. Como mencionado anteriormente, todas as regiões devem ter o mesmo tamanho em função de restrições das técnicas propostas, o que restringe consideravelmente o número de regiões nas quais as imagens podem ser subdivididas.

36 CAPÍTULO 4 EXPERIMENTOS, RESULTADOS E DISCUSSÃO

Figura 4.4 Resultados obtidos para diferentes configurações de particionamento das faces para a técnica MIMPCA sobre a base de faces ORL.

4.2.1 Modular Image Principal Component Analysis - MIMPCA

Todos os experimentos foram realizados utilizando a técnica de validação cruzada com dez conjuntos (10-fold Cross Validation). Para cada indivíduo, foram utilizadas cinco imagens para treinamento e cinco imagens para teste. Os mesmos conjuntos foram utilizados em todos os experimentos realizados com a base. Exclusivamente para os experimentos realizados na base de faces UMIST, adotou-se as abordagens propostas por Gottmukkal e Asari [GA04]. Nesta abordagem, as imagens de treinamento e teste são selecionadas manualmente, de forma que as imagens de teste não contenham rotações de faces para as quais as técnicas foram treinadas. Ou seja, os ângulos de rotação das faces de teste não existem nas instâncias de treinamento. Baseando-se na abordagem descrita, são esperados resultados com taxas de acertos inferiores às obtidas com as outras bases de faces.

As Figuras 4.5, 4.6 e 4.7 apresentam os resultados obtidos para as bases Yale, ORL e UMIST respectivamente. Nestes experimentos, são apresentados os resultados obtidos com a técnica proposta (MIMPCA) além das técnicas MPCA [GA04], IMPCA [YZF+04] e PCA [TP91]. Observe a notação diferenciada para as técnicas modulares, para as quais é informado o número de partições verticais e horizontais logo após o nome da técnica. Por exemplo, MIMPCA (2 x 3) indica que os resultados foram obtidos utilizando a técnica MIMPCA sobre imagens divididas em duas regiões verticalmente e três horizontalmente.

Os resultados serão apresentados por um gráfico que relaciona as taxas de acerto com o número de componentes principais utilizados na representação da imagem. A análise destes gráficos torna-se importante uma vez que auxilia na escolha do número ideal de componentes principais necessários para atingir a classificação máxima da técnica sobre a base em estudo.

A Fig. 4.5 apresenta os resultados obtidos para a base de faces Yale. Nele, o eixo Y utiliza a escala de 80% a 100% para facilitar a visualização dos resultados.

4.2 TÉCNICAS DE RECONHECIMENTO DE FACES 37

Figura 4.5 Resultados obtidos nos experimentos com a técnica MIMPCA sobre a base de faces Yale.

Nos resultados apresentados, é perceptível um melhor desempenho da técnica MIMPCA quando é utilizado um pequeno número de componentes principais. O comportamento do grá- fico de resultados da MIMPCA é explicado considerando as diferentes quantidades de infor- mação presente em cada componente principal, esta quantidade de informação está diretamente relacionada à qualidade da representação das projeções das faces, assim como à sua classifi- cação. Embora o primeiro componente seja o que preserve a maior parte da informação, ele não é suficiente para classificar idealmente as faces, sendo necessário utilizar novos componentes principais na representação da imagem. Alguns dos componentes podem conter informações redundantes, ou até mesmo prejudicar a qualidade da projeção das imagens. Este compor- tamento pode ser visto examinando o gráfico da técnica MIMPCA. Nele, a taxa eleva-se ao adicionar os primeiros componentes e cai, estabilizando-se em seguida, com a adição de mais componentes para representação da imagem. Logo, vê-se que a técnica MIMPCA tem a maior parte da informação útil concentrada nos primeiros componentes principais.

A técnica MIMPCA teve resultados muito semelhantes aos obtidos na Fig. 4.4. Seu melhor desempenho foi obtido utilizando nove regiões por imagem, tendo seu desempenho prejudicado quando utilizou um número maior, ou menor, de regiões por face. O mesmo comportamento foi observado para a técnica MPCA, que obteve resultados inferiores aos alcançados pela técnica proposta. Os melhores resultados obtidos pelas técnicas modulares decorre do tipo de variação explorado pela base, em situações com alterações parciais na iluminação e expressões faci- ais. Técnicas que tomem proveito de informações presentes nas regiões não afetadas podem conseguir desempenho superior aos alcançados pelas abordagens holísticas.

Para a base de faces ORL, os resultados obtidos podem ser observados no Fig. 4.6. Esta base explora variações como posição da face, pequenas alterações na escala das imagens, além de mudanças de iluminação. Sob tais condições, a técnica MIMPCA obteve apenas um pe- queno ganho de desempenho quando comparada às demais. Além disso, percebe-se uma queda

38 CAPÍTULO 4 EXPERIMENTOS, RESULTADOS E DISCUSSÃO

considerável da taxa de reconhecimento da técnica quando se utiliza muitos componentes na representação da imagem.

As melhores taxas de acerto para a base foram obtidas pela técnica proposta, utilizando ape- nas oito componentes principais. Tal comportamento ressalta uma característica já apresentada da técnica: concentração de informação discriminatória nos primeiros componentes principais. Isso implica uma representação mais compacta, visto que a melhor representação do conjunto de faces já é obtido utilizando-se menos de dez componentes principais.

Figura 4.6 Resultados obtidos nos experimentos com a técnica MIMPCA sobre a base de faces ORL.

Finalmente, os resultados obtidos para a base UMIST são apresentados na Fig. 4.7. Nela, o eixo y foi escalonado para o intervalo [40% 70%] visando melhorar a análise dos resultados. Nestes experimentos, as imagens de teste possuem ângulos de rotações que extrapolam os uti- lizados no treinamento das técnicas. Desta forma, os baixos resultados obtidos eram esperados. Perceba, que mesmo nestas condições a técnica proposta apresentou, sob baixa dimensionali- dade, melhores resultados que suas técnicas-base.

É perceptível a disparidade entre o desempenho das técnicas modulares e a holística. Mesmo em se tratando de rotação de faces, variações na qual as informações locais seriam pouco dis- criminatórias, as técnicas modulares obtiveram melhor desempenho. Ainda examinando o grá- fico, percebe-se a semelhança entre as curvas das técnicas IMPCA e MIMPCA, revelando um forte relacionamento entre elas. Pela análise visual das curvas, percebe-se que seus valores foram apenas deslocados verticalmente. Por fim, analisando apenas as técnicas modulares, quando fazem uso de uma grande quantidade de componentes principais, é percebido que suas taxas se estabilizaram com o mesmo desempenho.

A Tabela 4.1 apresenta os melhores resultados obtidos para as técnicas utilizadas nos expe- rimentos. Os melhores resultados estão destacados. Entre parênteses, ao lado da taxa de acerto, são apresentadas duas informações: o número de componentes utilizados para obter o resultado e o número de divisões utilizadas no experimento em questão.

4.2 TÉCNICAS DE RECONHECIMENTO DE FACES 39

Figura 4.7 Resultados obtidos nos experimentos com a técnica MIMPCA sobre a base de faces UMIST.

Tabela 4.1 Média das taxas de acerto para a técnica

PCA MPCA IMPCA MIMPCA

UMIST 60, 00(32/−) 63,00(10/09) 62,00(06/−) 65,00(02/09) ORL 92, 50(69/−) 94,44(25/04) 93,00(05/−) 95,00(05/04) Yale 91, 11(21/−) 94,44(25/09) 91,11(30/−) 96,67(05/09)

4.2.2 Weighted Modular Image Principal Component Analysis - wMIMPCA Como visto anteriormente, técnicas baseadas em PCA que fazem uso da abordagem modu- lar apresentaram melhores resultados que as holísticas no reconhecimento de faces afetadas por pequenas variações locais. Esta abordagem beneficia-se de informações locais de algumas regiões da imagem, que contêm informações mais discriminatórias, para compensar a perda de informação das regiões afetadas pelas variações. Entretanto, a abordagem proposta baseia-se no particionamento simples das imagens, isto é, não leva em consideração qual sub-imagem conterá uma determinada região da face, tais como: olhos, nariz, boca etc. Embora esta abor- dagem tenha obtido melhores resultados que as abordagens holísticas, ela falha ao atribuir a mesma importância às regiões da imagem.

Fazendo uso apenas deste particionamento, todas as regiões da imagem têm a mesma in- fluência na classificação da face. Este comportamento pode vir a prejudicar o desempenho do sistema, uma vez que todas as regiões da imagem terão a mesma importância para a clas- sificação. Visando resolver este problema e baseando-se em pesquisas recentes [Tan05], foi desenvolvido um método que possa compensar tal limitação. É proposta uma ponderação da contribuição de cada região da face de forma a melhorar o desempenho do sistema de classi-

40 CAPÍTULO 4 EXPERIMENTOS, RESULTADOS E DISCUSSÃO

ficação. Tal método visa atribuir maior importância às regiões que possuam mais informações discriminatórias, ao passo que reduz a importância das regiões menos importantes.

A nova abordagem consiste no desenvolvimento de um sistema de pesos que atribui dife- rentes contribuições a cada região da face. O sistema de atribuição de pesos é guiado pelo desempenho do sistema, ou seja, cada região da imagem é ponderada de acordo com a sua im- portância na classificação final. Logo, regiões que representem mais precisamente a face irão ser ressaltadas, enquanto as menos representativas poderão, inclusive, ser desconsideradas.

Com a modificação proposta tem-se pelo menos duas vantagens:

• Maximizar a relação espacial entre as regiões das faces ponderando as contribuições de cada uma delas para a classificação final [CZ04];

• Minimizar, ou eliminar, o efeito de ruídos ou variações locais, que venham a prejudicar o desempenho do sistema de classificação.

Os experimentos foram feitos variando o número de regiões nas quais as imagens foram divididas, e as formas como estas partições foram feitas. Ao todo foram testadas onze config- urações diferentes: 1x2, 1x3, 2x1, 2x2, 2x3, 2x4, 3x1, 3x2, 3x3, 3x4 e 4x4. Resultados experi- mentais mostraram que utilizando doze ou mais regiões as taxas de reconhecimento tendem a piorar os resultados obtidos.

Novamente, os dados de treinamento e teste de todas as bases foram dividos em dez conjun- tos, não necessariamente disjuntos. Com isso, foram construídos 110(cento e dez) conjuntos de treinamentos diferentes para cada base de faces. Além disso, combinações dos dez primeiros componentes principais foram utilizadas na representação das imagens. Os conjuntos de treina- mento foram utilizados para encontrar o conjunto de pesos ideais que melhor classifiquem o conjunto de teste.

A escolha dos pesos ideais foi feita com o uso de um algoritmo genético (AG) [For96]. O AG foi utilizado para encontrar o conjunto de pesos que melhor classificasse as faces. Ou seja, o conjunto que melhor expresse a importância de cada região da face para a classificação final. O algoritmo adotado teve a seguinte parametrização:

• Inicialização: Aleatória e Uniforme; • Tamanho da população: 15 indivíduos; • Número máximo de gerações: 30;

• Tipo de recombinação: dois pontos com probabilidade de 70%; • Método de seleção: roleta.

Além disso, na montagem da representação final da imagem da face, foram utilizados dois métodos de combinação: método de agregação e o método modular, descritos abaixo:

4.2 TÉCNICAS DE RECONHECIMENTO DE FACES 41

• Método de agregação, ou representação única: todas as matrizes são combinadas para construir uma única matriz, para representar toda a imagem. Apenas após esta etapa, a matriz resultante é submetida ao classificador. Nesta abordagem, para desconsiderar uma região da face que não contribua significativamente para a classificação final, faz-se necessário ignorá-la na etapa de concatenação de matrizes;

• Método modular: cada matriz da região é ponderada individualmente para compor a classificação final. O procedimento de classificação verifica o vetor-peso extraído para a base de dados e o multiplica pelo vetor de similaridade entre as matrizes. O escalar final representa a similaridade ponderada entre duas faces da base de dados.

Todos os experimentos realizados utilizando a abordagem ponderada, visa comparar o de- sempenho das técnicas sobre imagens que possuam algum tipo de variação local. Por isso, os testes serão realizados sobre todas as bases de dados descritas na seção 4.1. Exclusivamente para as técnicas modulares, são exibidos os números de partições verticais e horizontais após o nome da técnica - ex: MIMPCA (A x B) - conforme definido na seção 4.2.1.

Com o objetivo de comparar o desempenho das técnicas sob as mesmas condições de ilu- minação, expressões faciais e uso de objetos, foram utilizados os mesmos conjuntos de treina- mento e teste para todas as técnicas analisadas. O primeiro experimento realizado com a nova técnica, representado graficamente na Fig. 4.8, consiste em um procedimento que relaciona o número de partições nas quais a face foi dividida e a quantidade de informação global que tais partições preservam. Nele, foi constatado que particionando-se a imagem em mais de dezesseis sub-imagens a representação global da face é prejudicada em função do pequeno tamanho de cada região, conseqüentemente, estas regiões não representarão adequadamente as informações locais e globais das faces.

Figura 4.8 Comportamento da taxa de acerto das técnicas MPCA, IMPCA e wMIMPCA variando a quantidade de sub-imagens da faces.

A Fig. 4.9 resume os resultados obtidos com a técnica wMIMPCA para as bases de faces apresentadas anteriormente. Nela, percebe-se uma variação de taxa de acerto muito semelhante

42 CAPÍTULO 4 EXPERIMENTOS, RESULTADOS E DISCUSSÃO

à obtida com a técnica MIMPCA, na qual o melhor desempenho foi obtido utilizando poucos componentes principais. Desta forma, a técnica ponderada preserva a concentração da quan- tidade de informações nos primeiros componentes, a exemplo do comportamento apresentado pela modular bidimensional.

Figura 4.9 Resumo das taxas de acerto da técnica wMIMPCA para as bases de dados testadas.

Para a base de faces Yale, os melhores resultados foram obtidos utilizando a configuração (3x3). Para outras configurações os resultados ficaram um pouco inferiores. A Fig. 4.10 apre- senta o resultado dos experimentos realizados com as técnicas MPCA, IMPCA, MIMPCA e wMIMPCA sobre a base de faces Yale. Perceba pelo gráfico que a técnica wMIMPCA obteve taxas de acerto superiores às demais, independente do número de componentes principais uti- lizados na representação das faces. A diferença de desempenho entre as técnicas modular bidimensional e a ponderada deu-se sob condições nas quais houve mudanças de iluminação e expressões faciais.

4.2 TÉCNICAS DE RECONHECIMENTO DE FACES 43

O comportamento observado na análise dos resultados pode ser explicado considerando que as variações exploradas pela base geralmente afetam apenas algumas regiões da imagem. Desta forma, embora a técnica modular bidimensional consiga melhorar as taxas de acerto comparadas às técnicas-base, ela não atribui importâncias diferentes às áreas afetadas. Logo, é esperado um melhor desempenho da técnica ponderada, uma vez que áreas muito afetadas por problemas na iluminação, ou por grandes alterações nas expressões faciais podem ser descon- sideradas e, consequentemente, influenciar pouco na classificação. Além disso, as regiões não afetadas ganham maior importância que as demais, o que pode melhorar o desempenho final do sistema.

Para a base de faces UMIST o resultado é apresentado na Fig. 4.11. Nesta base de dados, que explora grandes variações de posicionamento da face, o desempenho da técnica wMIMPCA é aproximadamente um ponto percentual superior à técnica modular bidimensional. Visual- mente, pode ser constatada uma pequena, e quase inexpressiva, melhora na taxa de desempenho com o uso da nova abordagem.

Figura 4.11 Resultados obtidos nos experimentos com a técnica wMIMPCA sobre a base de faces UMIST.

Novamente, este comportamento é explicado pelo tipo de variação explorada pela base de dados. Ao se rotacionar a cabeça do indivíduo todas as regiões da face tendem a sofrer alterações, uma vez que toda a face será deslocada. Logo, o ganho obtido com a análise mais precisa das regiões torna-se insignificante, uma vez que as imagens das regiões serão diferentes entre si. Mas mesmo sob tais condições, a abordagem ponderada consegue detectar quais regiões da face possuem mais informações discriminatórias e ponderá-las de forma a melhorar sua classificação.

Baseado na argumentação acima, é esperado um desempenho inferior das técnicas que uti- lizem a abordagem holística. Tal comportamento pode ser observado examinando o desem- penho da técnica IMPCA no gráfico. Seu desempenho foi aproximadamente cinco pontos percentuais inferior às outras técnicas.

Um outro conjunto de teste foi executado sobre a base de faces ORL. Os resultados são apresentados graficamente na Fig. 4.12. Analisando os gráficos percebe-se que os tipos de

44 CAPÍTULO 4 EXPERIMENTOS, RESULTADOS E DISCUSSÃO

variações exploradas pela base ressaltam as características da abordagem ponderada, que reduz a importância das áreas afetadas pelas variações.

Figura 4.12 Resultados obtidos nos experimentos com a técnica wMIMPCA sobre a base de faces ORL.

Também é visível uma melhor taxa de reconhecimento utilizando-se poucos componentes principais. Ao adicionar novos componentes, a taxa de reconhecimento tende a cair, estabilizando- se com a utilização de oito ou mais componentes. Embora a técnica IMPCA apresente taxas de reconhecimento muito inferiores às das abordagens modulares, seu comportamento em função da adição de novos componentes é muito semelhante à da técnica ponderada. Este comporta- mento pode ser interpretado como uma relação forte entre os efeitos globais e locais dos tipos de variações exploradas na base, cabendo um estudo mais detalhado destas variações para um melhor entendimento deste comportamento.

Uma diferença sutil, porém muito importante, entre os resultados obtidos com as técnicas MIMPCA e wMIMPCA diz respeito ao particionamento que obteve as melhores taxas de re- conhecimento. Na abordagem bidimensional, a configuração (2x2) foi a que obteve o melhor

Documentos relacionados