Agrupamento de Pixels e Autofaces Fracion´arias
para Reconhecimento de Faces
Defesa de Tese de Doutorado
Tiago Buarque Assun¸c˜ao de Carvalho
Centro de Inform´atica Universidade Federal de Pernambuco
23 de abril de 2015 Orientador: Tsang Ing Ren
Roteiro
Introdu¸c˜aoEstado da arte
Waveletfaces Autofaces
Agrupamento de Caracter´ısticas
Autofaces Fracion´arias
Autofaces Fracion´arias (AFF) AFF Melhorado (AFFM) AF Melhorado (AFM)
Experimentos com Autofaces Fracion´ario
Agrupamentos de Pixels
Peda¸cos-por-Valor Peda¸cos-por-Posi¸c˜ao
Representa¸c˜ao e Compress˜ao
Experimentos com Agrupamento de Pixels
Conclus˜ao
Roteiro
Introdu¸c˜aoEstado da arte Waveletfaces Autofaces
Agrupamento de Caracter´ısticas
Autofaces Fracion´arias
Autofaces Fracion´arias (AFF) AFF Melhorado (AFFM) AF Melhorado (AFM)
Experimentos com Autofaces Fracion´ario Agrupamentos de Pixels
Peda¸cos-por-Valor Peda¸cos-por-Posi¸c˜ao
Representa¸c˜ao e Compress˜ao
Tipos de imagens de faces
Imagem
Estática
Vídeo
3D
2D
Figura:Diagrama de tipos de imagens utilizadas no reconhecimento de faces.
Em destaque o nosso dado de interesse: imagem est´atica 2D.
Sistema de reconhecimento de faces
Reconhecimento De Faces Detecção de
Faces
Extração de Características
Imagem Estática 2D
Identificação Verificação
Holística
Local
Híbrida
Autofaces
Waveletfaces
Agrupamento de Pixels
Autofaces Fracionário
Roteiro
Introdu¸c˜ao Estado da arteWaveletfaces Autofaces
Agrupamento de Caracter´ısticas
Autofaces Fracion´arias
Autofaces Fracion´arias (AFF) AFF Melhorado (AFFM) AF Melhorado (AFM)
Experimentos com Autofaces Fracion´ario Agrupamentos de Pixels
Peda¸cos-por-Valor Peda¸cos-por-Posi¸c˜ao
Representa¸c˜ao e Compress˜ao
Experimentos com Agrupamento de Pixels Conclus˜ao
Waveletfaces
Utilizando a fun¸c˜ao Wavelet de Haar ´e equivalente a redu¸c˜ao da imagem sucessivamente para 12 da altura e 12 da largura.
Tabela:Taxa de reconhecimento em %±desvio padr˜ao, para as bases de faces
ORL das imagens sem transforma¸c˜ao e nos 5 n´ıveis de Waveletfaces utilizando
o classificador NN.
M´etodo altura× caracter´ısticas acerto ±
Waveletfaces
Conclus˜oes
◮ Porque reduzir a imagem n˜ao causa grande diminui¸c˜ao no
reconhecimento de faces?
◮ Hip´otese: agrupar caracter´ısticas semelhantes n˜ao reduz informa¸c˜ao, a face tem muitos pixels de intensidade similar (pele, cabelo, barba).
◮ Assemelha-se a t´ecnicas de agrupamento de caracter´ısticas.
An´alise dos Componentes Principais (PCA)
◮ Teoria da matriz de covariˆancia fracion´aria Gao et al. (2013) ◮ Autofaces (Eigenfaces)
◮ PCA alta dimensionalidade
◮ Sobre PCA
◮ A escala das vari´aveis
◮ Componente de ´unica vari´avel
◮ Matriz de covariˆancia fracion´aria
◮ Um grupo deqvari´aveis altamente correlacionadas
◮ Apenas um autovalor alto
Agrupamento de caracter´ısticas
◮ Reconhecimento de texto ◮ Sele¸c˜ao de caracter´ıstica
◮ Transforma¸c˜oes lineares dos dados ◮ Raro em imagens de faces
◮ Avidan (2002) com AutoSegmentos (EigenSegments)
componentes principais de cada grupo de caracter´ısticas.
Roteiro
Introdu¸c˜ao Estado da arteWaveletfaces Autofaces
Agrupamento de Caracter´ısticas
Autofaces Fracion´arias
Autofaces Fracion´arias (AFF) AFF Melhorado (AFFM) AF Melhorado (AFM)
Experimentos com Autofaces Fracion´ario Agrupamentos de Pixels
Peda¸cos-por-Valor Peda¸cos-por-Posi¸c˜ao
Representa¸c˜ao e Compress˜ao
Autofaces Fracion´arias
◮ PCA Fracion´ario (Gao et al., 2013)
◮ teoria da matriz de covariˆancia fracion´aria
◮ apresenta ganhos no reconhecimento de faces
◮ Autofaces ´e uma vers˜ao do PCA para dados de alta dimensionalidade ◮ Hip´otese: ´e poss´ıvel melhorar o reconhecimento de faces
empregando as ideias do FPCA no Autofaces ◮ Propostas
◮ Autofaces Fracion´ario (AFF)
◮ Autofaces Fracion´ario Melhorado (AFFM)
◮ Autofaces Melhorado (AFM)
PCA
◮ E assumido que´ X ´e a matriz de dados paranamostras
X = [x1. . .xn]
◮ Amatriz de covariˆancia dos dados ´e computada como:
Cm×m=
1
n
n
X
i=1
(xi−¯x) (xi−¯x)T,
e ¯x=1nPn
i=1xi ´e o vetor m´edia do dados.
◮ E ´e a matriz de proje¸c˜aom×k tal que cada uma das suas colunas ´e
um dosk autovetoresde maior autovalor entre os mautovetores de
C :
Em×k = [e1. . .ek].
◮ A redu¸c˜ao de dimensionalidade (ou extra¸c˜ao de caracter´ıstica) se
realiza projetando um padr˜ao de entradaxi de um espa¸co
m-dimensional para um espa¸cok-dimensional,k <m, tal quex′
i ´e o
padr˜ao projetado:
x′
i =E
T(x
FPCA (
Fractional PCA
)
◮ E uma extens˜ao direta do PCA baseada na teoria da matriz de´
covariˆancia fracion´ariaCr, definida por Gao et al. (2013)
Cmr×m=
1
n
n
X
i=1
((xi)r−(¯x)r) ((xi)r−(¯x)r) T
com
(xi)r = [(xi1)r. . .(xim)r]T
◮ r ´e um n´umero real chamado de ordem da covariˆancia fracion´aria ◮ se r = 1 a matriz de covariˆancia fracion´aria ´e equivalente `a matriz
de covariˆancia convencional
◮ Tal como PCA, apenas osk autovetores de maior autovalor de
Crs˜ao selecionados para se definir Er, a matriz de proje¸c˜ao
Emr×k = [e r
1. . .erk]
◮ A redu¸c˜ao de dimensionalidade se realiza projetando um padr˜ao de
entradaxi
x′
i=E
r T(x
i−¯x)
Autofaces
◮ N˜ao ´e poss´ıvel construir a matriz de covariˆancia em problemas de
alta dimensionalidade
◮ A matriz D´e uma alternativa para se achar os autovetores da matriz
de covariˆancia
Dn×n=
1
n
m
X
j=1
[x1j−x¯j, . . . ,xnj−x¯j] T
[x1j−x¯j, . . . ,xnj−x¯j]
ondexij ´e o valor cada caracter´ısticaj para o padr˜aoi,m´e o
n´umero de caracter´ısticas en´e o n´umero de amostras.
◮ Seja E′
n×k = [e
′
1. . .e
′
k], 1≤k ≤n, os k autovetores deD com
maiores autovalores, os autovetoresei emE, da matriz de
covariˆanciaC, s˜ao computados a partir deE′
como segue:
ei =
1
(nλi)1/2[(x1−¯x), . . . ,(xn−¯x)]e
′ i
comλi como autovalor dee′ i.
◮ A redu¸c˜ao de dimensionalidade se d´a desta forma
x′
i =E
T(x
Autofaces Fracion´arias - AFF
◮ Vers˜ao do FPCA para alta dimensionalidade
◮ Computa os autovetores da matriz de covariˆancia fracion´ariaque
s˜ao os mesmos da matriz
Dr n×n= 1 n m X j=1
aTa,
coma= [(x1j)r−(¯xj)r, . . . ,(xnj)r−(¯xj)r]
◮ Seja Es
n×k = [es1. . .esk],k = 1, . . . ,n, osk autovetores Dr com
maior autovalores, os autovetores er
i deE
r da matriz de covariˆancia
Cr, s˜ao computados a partir deEs como:
er
i =
1
(nλi)1/2[((x1)
r−(¯x)r), . . . ,((x
n)r−(¯x)r)]esi
◮ A redu¸c˜ao de dimensionalidade se realiza projetando xi
x′
i=Er T(xi−¯x)
[Contribui¸c˜ao original]
Autofaces Fracion´ario Melhorado - AFFM
◮ Semelhante ao AFF (Autofaces Fracion´ario)
◮ Utiliza a transforma¸c˜ao fracion´aria na proje¸c˜ao final dos dados ◮ Diferentemente de todos os m´etodos anteriormente descritos ◮ Gera o novo vetor de caracter´ısticax′
i a partir do padr˜aoxi atrav´es
da Equa¸c˜ao
x′
i =Er T((xi)r−(¯x)r),
◮ Os autovetoresEr representam as dire¸c˜oes de m´axima variˆancia para
os dados transformados de forma fracion´aria Xr
Xr = [((x1)r−(¯x)r). . .((xn)r−(¯x)r)],
◮ Enfatiza-se que esta transforma¸c˜ao n˜ao foi considerada pelos autores
do m´etodo FPCA.
Autofaces Melhorado - AFM
◮ A primeira parte ´e a mesma para o Autofaces: computar os
autovetores da matriz de covariˆanciaC,via matrizD
Dn×n=
1
n
m
X
j=1
[x1j−x¯j, . . . ,xnj−x¯j] T
[x1j−x¯j, . . . ,xnj−x¯j]
◮ Sua segunda parte ´e semelhante ao AFFM, projetar os novos
padr˜oes ap´os uma transforma¸c˜ao fracion´aria:
x′
i=E
T((x
i)r−(¯x)r),
ondeE ´e o mesmo de Autofaces, diferente de AFF e AFFM
◮ E v´alido notar que AFM n˜ao computa a matriz de covariˆancia´
fracion´aria como AFFM e AFF, apenas realiza a mesma transforma¸c˜ao fracion´aria antes da proje¸c˜ao final.
[Contribui¸c˜ao original]
Os trˆes m´etodos propostos: AFF, AFM, AFFM.
Tabela:Nomeando a t´ecnica de extra¸c˜ao de caracter´ıstica devido `a matriz de covariˆancia e m´etodo de proje¸c˜ao dos dados.
AutovetoresE AutovetoresEr
Proje¸c˜ao de dados Autofaces (AF) AF Fracion´ario (AFF) ajustados pela m´edia
xi−¯x x′
i =ET(xi−¯x) x′i =Er T(xi−¯x)
Proje¸c˜ao de dados
ajustados de forma AF Melhorado (AFM) AFF Melhorado (AFFM) fracion´aria
(xi)r−(¯x)r x′
i =ET((xi)r−(¯x)r) x′i =Er T((xi)r−(¯x)r)
Os autovetoresE s˜ao provenientes da matriz de covariˆancia.
Os trˆes m´etodos
Autovetores da
matriz de convariância canônica
Autovetores da
matriz de convariância fracionária Projeção de dados ajustados pela média Projeção de dados ajustados de forma fracionária Autofaces (AF) Autofaces Melhorado (AFM) Autofaces Fracionário (AFF) Autofaces Fracionário Melhorado (AFFM)
Figura:Fluxograma dos m´etodos propostos (AFF, AFFM e AFM) mais Autofaces, a combina¸c˜ao de um tipo de matriz de rela¸c˜ao e um tipo de proje¸c˜ao gera um m´etodo.
Roteiro
Introdu¸c˜ao Estado da arteWaveletfaces Autofaces
Agrupamento de Caracter´ısticas
Autofaces Fracion´arias
Autofaces Fracion´arias (AFF) AFF Melhorado (AFFM) AF Melhorado (AFM)
Experimentos com Autofaces Fracion´ario
Agrupamentos de Pixels Peda¸cos-por-Valor Peda¸cos-por-Posi¸c˜ao
Representa¸c˜ao e Compress˜ao
Reconhecimento de faces na base Yale
◮ AFM apresenta maior acur´acia para 11, 12 e 13 caracter´ısticas ◮ AFFM apresenta acur´acia maior ou igual nos outros casos
Yale
k AF AFM AFF AFFM
7 0,691 (−) 0,736 0,698 (−) 0,758 (+) 8 0,705 (−) 0,759 0,716 (−) 0,778 (+) 11 0,762 0,817 (+) 0,745 (−) 0,804 12 0,772 0,829 (+) 0,752 (−) 0,815 13 0,780 0,835 (+) 0,761 (−) 0,824 30 0,797 (−) 0,853 0,785 (−) 0,870 (+) 35 0,796 (−) 0,853 0,785 (−) 0,872 (+) 75 0,802 0,855 0,781 (−) 0,871 (+) 80 0,804 0,855 0,781 (−) 0,872 (+)
Escolhendo o parˆametro fracion´ario (base Yale)
◮ Valor escolhidor = 0,1◮ AFFM ´e mais sens´ıvel ar do que AFM, e AFF ´e o menos sens´ıvel
10−3 10−2 10−1 100
0.7 0.8 0.9
Parˆametro fracion´ario (r)
A
cu
r´a
ci
a
m
´ax
im
a
AF AFM AFF AFFM
Reconhecimento de faces na base ORL
◮ Para poucas (at´e 10) caracter´ısticas extra´ıdas as matriz de
covariˆancia fracion´aria melhora a acur´acia (AFF e AFFM)
◮ Para muitas caracter´ısticas extra´ıdas (mais de 20) a proje¸c˜ao
fracion´aria final aumenta a acur´acia (AFM e AFFM)
ORL
k AF AFM AFF AFFM
1 0,118 (−) 0,134 0,134 0,146 (+) 2 0,395 (−) 0,424 0,463 0,487 (+) 7 0,864 (−) 0,883 0,882 0,894 (+) 8 0,878 (−) 0,894 0,893 0,907 (+) 45 0,937 (−) 0,949 (+) 0,938 (−) 0,941 50 0,937 (−) 0,948 (+) 0,938 (−) 0,940 75 0,937 (−) 0,945 (+) 0,937 (−) 0,935 80 0,936 (−) 0,944 (+) 0,936 (−) 0,933
Visualiza¸c˜ao dos dados (base Yale)
◮ Menos sobreposi¸c˜ao (AFF)◮ Padr˜oes mais adensados no mesmo componente (AFM) ◮ Menos sobreposi¸c˜ao e mais separados (AFFM)
−20 −15 −10 −5 0 5 10 15 20
−15 −10 −5 0 5 10 15 Eigenfaces (EF) AF
−20 −15 −10 −5 0 5 10 15
−10 −5 0 5 10 15
Fractional Eigenfaces (FEF)
AFF
−20 −15 −10 −5 0 5
−4 −2 0 2 4 6 8
Improved Eigenfaces (IEF)
AFM
−5 0 5 10 15 20 25 30
−8 −6 −4 −2 0 2 4 6
Improved Fractional Eigenfaces (IFEF)
Visualiza¸c˜ao dos dados (base ORL)
◮ Fronteira de decis˜ao alargada (AFF) ◮ Sem sobreposi¸c˜ao (AFM)◮ Fronteira de decis˜ao alargada e sem sobreposi¸c˜ao(AFFM)
−4 −2 0 2 4 6 8 10 12 14 −10 −5 0 5 10 15 Eigenfaces (EF) AF
−16 −14 −12 −10 −8 −6 −4 −2 0 2
−15 −10 −5 0 5 10
Fractional Eigenfaces (FEF)
AFF
−1 −0.5 0 0.5 1 1.5 2 2.5
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 3
Improved Eigenfaces (IEF)
AFM
−3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1
−4 −3 −2 −1 0 1 2 3
Improved Fractional Eigenfaces (IFEF)
AFFM
M´edia do ´ındice de isolamento de componentes
Tabela:´Indice de isolamento de componentes para proje¸c˜ao 2D. Para duas bases de imagens de face. O ´ındice ´e melhor quanto maior seu valor.
Yale Treino Teste Treino + Teste AF 0.2810±0.0412 0.3968±0.0504 0.4234±0.0076
AFM 0.3936±0.0362 0.4825±0.0407 0.5038±0.0062
AFF 0.3020±0.0454 0.4028±0.0492 0.4273±0.0058 AFFM 0.3672±0.0309 0.4943±0.0391 0.5070±0.0090 ORL Treino Teste Treino + Teste AF 0.3575±0.0162 0.5220±0.0197 0.5959±0.0048 AFM 0.3550±0.0154 0.5318±0.0186 0.5933±0.0049
AFF 0.3787±0.0165 0.5272±0.0196 0.6044±0.0046
Experimentos Autofaces Fracion´arias
Conclus˜ao
◮ Maior taxa de acerto da classifica¸c˜ao ◮ AFM e AFFM apresentam os menores erros ◮ Geralmente AFFM tem o maior acerto
◮ Matriz de covariˆancia fracion´aria produz fronteiras de decis˜ao mais
largas
◮ A proje¸c˜ao fracion´aria funciona de maneira semelhante mas
complementar
[Contribui¸c˜ao original]
Roteiro
Introdu¸c˜ao Estado da arteWaveletfaces Autofaces
Agrupamento de Caracter´ısticas
Autofaces Fracion´arias
Autofaces Fracion´arias (AFF) AFF Melhorado (AFFM) AF Melhorado (AFM)
Experimentos com Autofaces Fracion´ario Agrupamentos de Pixels
Peda¸cos-por-Valor Peda¸cos-por-Posi¸c˜ao
Representa¸c˜ao e Compress˜ao
Agrupamentos de Pixels
◮ Metodologia inspirada no Waveletfaces ◮ Justificada pelo
◮ agrupamento de caracter´ısticas
◮ PCA com grupo de caracter´ısticas correlacionadas
◮ Explica¸c˜ao intuitiva: retirar redundˆancia dos dados
◮ Calcula a m´edia (ou outra fun¸c˜ao) de regi˜oes de intensidade
semelhante
Agrupamento de Pixels
◮ Metodologia para se definir t´ecnicas de extra¸c˜ao de caracter´ısticas
em imagens
◮ Elementos
◮ Vetor-de-pixel (por valor ou por posi¸c˜ao)
◮ Algoritmo de agrupamento (similaridade)
◮ Extraindo caracter´ısticas de cada regi˜ao
◮ Casos especiais
◮ Waveletfaces
◮ EigenSegments
Vetor-de-pixel
◮ (a)vetor-de-pixel por valor, um vetorm-dimensional que cont´em o
valor do pixel na mesma posi¸c˜ao para cada uma dasmimagens de treino,vj = [x1j, . . . ,xmj]T.
◮ (b) vetor-de-pixel por posi¸c˜ao, um vetor bidimensional que
cont´em o valor da posi¸c˜ao (x,y) do pixel,vj= [xj,yj]T.
Figura:Exemplo de vetor-de-pixel por valor (acima) e vetor-de-pixel por posi¸c˜ao (abaixo).
[Contribui¸c˜ao original]
Extraindo caracter´ısticas
Peda¸cos-por-Valor
◮ Cada imagem tem w colunas ehlinhas, o n´umero de pixels por
imagem ´ep=wh.
◮ Seja xi = [xi
1, . . . ,xip]T o i-´esimo padr˜ao de treinamento;
i = 1, ...,m, ent˜ao oj-´esimo vetor-de-pixel,j = 1, ...,p´e
vj = [x1j, . . . ,xmj]T
◮ Seja V ={v1, . . . ,vp}o conjunto de todos os vetores-de-pixel, um
algoritmo de agrupamento r´ıgido produz uma parti¸c˜ao LemV, de tal modo que Vk ´e ak-´esima parti¸c˜ao. Cada parti¸c˜ao ´e um grupo.
L={V1, . . . ,Vn}
◮ Projetando-se a imagem xi no espa¸co de caracter´ısticas produzindo
a nova caracter´ısticax′ ik,
x′
ik=wkxi,
[Contribui¸c˜ao original]
Peda¸cos-por-Valor (2)
◮ wk ´e o vetor de proje¸c˜ao para ak-´esima caracter´ıstica extra´ıda
wk = [wk1, . . . ,wkp],
e
wkj =
(
1/nk if vj ∈Vk
0 caso contr´ario,
nk =|Vk|´e o n´umero de elementos emVk.
◮ A matriz de proje¸c˜aoWque tem ak-´esima linha igual a wk,
W= w1 .. . wn ,
onden≤p´e o n´umero de caracter´ısticas extra´ıdas.
◮ O vetor de caracter´ısticas extra´ıdasx′
i de um padr˜ao de entradaxi ´e
calculado atrav´es da seguinte equa¸c˜ao:
x′
i =Wxi
= [x′ i1, . . . ,x
′ in]
Vers˜oes de Peda¸cos-por-Valor
◮ N´umero de caracter´ısticas extra´ıdasigualao n´umero de grupos ◮ N´umero de caracter´ısticas extra´ıdasmenor que n´umero de grupos ◮ Peda¸cos-por-valor Fracion´ario
◮ Peda¸cos-por-valor Melhorado
◮ Peda¸cos-por-valor Fracion´ario Melhorado [Contribui¸c˜ao original]
Peda¸cos-por-Posi¸c˜ao
◮ O vetor-de-pixel por posi¸c˜ao ´e definido como:
vj = [xj,yj]T,
◮ Cada regi˜ao da parti¸c˜ao ´e um quadrado de ladou
◮ E o resultado trivial de se agrupar o vetores-de-pixel por posi¸c˜ao´
utilizando a distˆancia de Chebychev:
d(a,b) =maxkn=1|ak−bk|.
Figura:Chebychev,city blocke Euclidiana s˜ao, da esquerda para a direita, os trˆes tipos de distˆancias utilizadas para gerar estas imagens. Elas mostras as regi˜oes de fronteira entre os 42 grupos gerados pelos algoritmo k-m´edias para os vetores-de-pixel por posi¸c˜ao.
Peda¸cos-por-Posi¸c˜ao (2)
◮ Cada agrupamento r´ıgido ´eC(r,s)=
c00 . . . c0w
..
. . .. ...
ch0 . . . chw
(1)
com
cxy =
(
1 ifru≤x <(r + 1)u, su≤y <(s+ 1)u
0 caso contr´ario , (2)
ondeu´e o n´umero de pixel do lado do quadrado que define a regi˜ao de um grupo, 0≤x<w e 0≤y<h. Cada par (r,s) define um grupo, comr = 0, ...,⌈w/u⌉ −1, e s= 0, ...,⌈h/u⌉ −1. Existem
n=⌈w/u⌉ × ⌈h/u⌉grupos, cada C(r,s) ´e transformado em um vetor
ck = [ck1,ck2, . . . ,ckp]T, (3)
comk = 1 +s+r⌈h/u⌉ep=hw, empilhando-se as colunas de
C(r,s).
Peda¸cos-por-Posi¸c˜ao (3)
Peda¸cos-por-Valor
×
Peda¸cos-por-Posi¸c˜ao
(a) defini¸c˜ao de vetor-de-pixel (b) algoritmo de agrupamento
(c) um fun¸c˜ao das intensidades dos pixels em uma regi˜ao
Peda¸cos-por-Valor Peda¸cos-por-Posi¸c˜ao
(a) por valor por posi¸c˜ao
(b) algoritmo de agrupamento caso especial de agrupamento r´ıgido (empregado: k-m´edias r´ıgido utilizando a distˆancia
com distˆancia euclidiana) de Chebychev (c) m´edia dos pixels da regi˜ao m´edia dos pixels da regi˜ao
Por que calcular a m´edia das caracter´ısticas?
◮ Mant´em dados informa¸c˜ao de baixa frequˆencia (aproxima¸c˜ao), tal
como o Waveletfaces
◮ A m´edia minimiza o erro quadr´atico m´edio de representa¸c˜ao
(compress˜ao com perda)
Compress˜ao e Reconstru¸c˜ao das imagens
Figura:Fluxo para a reconstru¸c˜ao das imagens comprimidas.
Roteiro
Introdu¸c˜ao Estado da arteWaveletfaces Autofaces
Agrupamento de Caracter´ısticas
Autofaces Fracion´arias
Autofaces Fracion´arias (AFF) AFF Melhorado (AFFM) AF Melhorado (AFM)
Experimentos com Autofaces Fracion´ario Agrupamentos de Pixels
Peda¸cos-por-Valor Peda¸cos-por-Posi¸c˜ao
Representa¸c˜ao e Compress˜ao
Experimentos com Agrupamento de Pixels
Reconhecimento de Faces no Estado-da-arte
◮ 100×holdout (50/50) ◮ 1-NN d(distˆancia Euclidiana)
N´umero de dimens˜oes Extrator de Caracter´ısticas Acur´acia UMIST
10304 dados brutos 0,971±0,013
20 Autofaces 0,963±0,014
20 Peda¸cos-por-Valor 0,968±0,012 20 Peda¸cos-por-Posi¸c˜ao 0,980±0,011
20 KSRC 0,951
20 RP 0,920
200 KSRC 0,970
200 RP 0,970
Reconhecimento de Faces no Estado-da-arte (2)
N´umero de dimens˜oes Extrator de Caracter´ısticas Acur´acia ORL
10304 dados brutos 0,941±0,016
40 Autofaces 0,936±0,018
40 Peda¸cos-por-Valor 0,940±0,017 42 Peda¸cos-por-Posi¸c˜ao 0,947±0,017
40 NPE 0,945±0,016
40 CNPE 0,932±0,019
50 LRC 0,935
50 Peda¸cos-por-Valor 0,942±0,015 56 Peda¸cos-por-Posi¸c˜ao 0,948±0,017
126 CSFR 0,939
126 Peda¸cos-por-Valor 0,945±0,016 120 Peda¸cos-por-Posi¸c˜ao 0,954±0,016
140 KSRC 0,942
Reconhecimento de Faces no Estado-da-arte (3)
◮ Peda¸cos-por-Valor apresenta taxa de acerto equivalente a Autofaces ◮ Peda¸cos-por-Posi¸c˜ao apresenta taxa de acerto maior que m´etodos no
estado-da-arte
Figura:Da esquerda para a direita: as primeiras duas imagens mostram como
as faces s˜ao divididas utilizando o m´etodo Partes da Face para as base ORL e
UMIST. As duas ´ultimas imagens mostra as regi˜oes utilizadas para o algoritmo
Peda¸cos-por-Posi¸c˜ao.
Escolhendo o n´umero de caracter´ısticas extra´ıdas
Um n´umero de caracter´ısticas adequado para o reconhecimento de faces utilizando o m´etodo Peda¸cos-por-Valor ´ek = 512.
100 101 102 103
0.4 0.6 0.8 1
N´umero de caracter´ısticas extra´ıdas
A
cu
r´a
ci
a
Yale ORL UMIST
Inserindo novas classes
Tabela:Acur´acia m´edia±desvio padr˜ao para Autofaces e Peda¸cos-por-Valor se apenas 1, 2, ou 3 classes s˜ao utilizadas para gerar as proje¸c˜oes. Classificador 1-NN, 10 repeti¸c˜oes deholdout50/50.
# classes Autofaces Peda¸cos-por-Valor YALE
1 0,5280±0,0651 0,7598±0,0288 2 0,6378±0,0390 0,7634±0,0450 3 0,6756±0,0252 0,7866±0,0395
ORL
1 0,5595±0,0623 0,9415±0,0131 2 0,7715±0,0515 0,9505±0,0142 3 0,8245±0,0369 0,9500±0,0137
UMIST
1 0,8784±0,0259 0,9721±0,0079 2 0,9237±0,0183 0,9746±0,0099 3 0,9425±0,0153 0,9735±0,0087 PV gera proje¸c˜oes discriminantes para classes que n˜ao foram vistas durante o treinamento.
Formando mais grupos do que o n´umero de caracter´ısticas
100 200 0.74
0.76 0.78
Nocaracter´ısticas
A cu r´a ci a Yale 100 200 0.6
0.7 0.8 0.9
Nocaracter´ısticas
ORL
64 grupos 128 grupos 256 grupos
PV Fracion´ario
YALE 1-NN Naive Bayes Arvore de Decis˜ao´ SVM
AF 0,804 0,433 0,594 0,891
AFM 0,844 (+)0,562 0,640 0,888
AFF 0,779 0,528 0,579 0,832
AFFM 0,863 0,376 0,629 0,901
PV 0,795 0,280 0,623 0,840
PVM 0,859 0,283 0,636 0,874
PVF 0,802 0,297 0,636 0,845
PVFM 0,861 0,305 0,642 0,870
ORL 1-NN Naive Bayes Arvore de Decis˜ao´ SVM
AF 0,945 0,370 0,500 0,707
AFM 0,944 0,430 0,540 0,691
AFF 0,947 0,368 0,532 0,695
AFFM 0,938 0,348 0,545 0,664
PV 0,946 0,432 0,583 (+)0,883
PVM 0,953 0,421 0,582 (+)0,875
PVF 0,945 0,432 0,576 (+)0,883
PVFM 0,946 0,415 0,572 (+)0,871
Experimentos com dados artificiais
Distribui¸c˜ao das vari´aveis
Experimentos com dados artificiais
Classifica¸c˜ao
Base 1/100 PCA PV
1-NN 0,3067±0,0627 0,3133±0,0450
Naive Bayes 0,3000±0,0505 0,3222±0,0673 SVM 0,3422±0,0526 0,3244±0,0613 ´
Arvore de Decis˜ao 0,3356±0,0245 0,3222±0,0631 Base 10/1.000 PCA PV
1-NN 0,3944±0,0846 0,9418±0,0280
Naive Bayes 0,4271±0,0916 0,9413±0,0287 SVM 0,4118±0,0896 0,6793±0,1273 ´
Arvore de Decis˜ao 0,4000±0,0877 0,9200±0,0262 Base 100/10.000 PCA PV
1-NN 0,3342±0,0054 1,0000±0,0000
Naive Bayes 0,3400±0,0220 1,0000±0,0000 SVM 0,3487±0,0612 0,6400±0,0755 ´
Arvore de Decis˜ao 0,3351±0,0163 1,0000±0,0000
Experimentos mais dados artificiais
Visualiza¸c˜ao (Base 10/1.000)
−5 0 5
−5 0 5
PCA
100 100.5
−10
−5 0 5 10
Peda¸cos-por-Valor
Experimentos mais dados artificiais
Visualiza¸c˜ao (Base 100/10.000)
−10 0 10
−20
−10 0 10 20
PCA
−5 0 5
99.9 100 100.1
Peda¸cos-por-valor
Figura:Base100/10.000. Diagramas de dispers˜ao para proje¸c˜ao para duas dimens˜oes utilizando PCA e proje¸c˜ao para duas caracter´ısticas utilizando Peda¸cos-por-Valor.
Experimentos mais dados artificiais
Visualiza¸c˜ao (Base 100/10.000) - PCA
990 1.000
−100 0 100
Treino
980 990 1.000
−40
−20 0 20
Teste
Figura:Base 100/10.000. Diagramas de dispers˜ao para proje¸c˜ao para duas
dimens˜oes utilizando PCA. O grafico da esquerda mostra o cojunto de treino, e
Experimentos mais dados artificiais
Visualiza¸c˜ao - Silhouette
Tabela:100 repeti¸c˜oes deholdoutpara a m´edias dos ´ındices Silhouette.
PCA Treino Teste Treino + Teste 1/100 −0,09±0,04 −0,09±0,02 −0,09±0,02 10/1.000 −0,03±0,09 −0,05±0,04 −0,08±0,04 100/10.000 0,86±0,03 0,79±0,03 0,25±0,01 PV Treino Teste Treino + Teste 1/100 −0,09±0,05 −0,09±0,04 −0,08±0,03 10/1.000 0,63±0,05 0,62±0,05 0,63±0,00 100/10.000 0,97±0,00 0,97±0,00 0,97±0,00
Compress˜ao de imagens de faces
O m´etodo de compress˜ao apresenta maior qualidade perceptual comparada ao JPEG com elevada taxa de compress˜ao
(a) Original (b) 6.158p. (c) 270 p. (d) 225 p. (e) JPG5% (f) JPG1%
(g) Original (h) 7.254p. (i) 357 p. (j) 266 p. (k) JPG5% (l) JPG1%
Figura:Imagens originais e imagens comprimidas para as bases ORL (a-f) e
Yale (g-l). As imagens s˜ao comprimidas com Peda¸cos-por-Valor e JPEG. 6.158
Compress˜ao de imagens de faces
Tabela:SSIM, ´ındice de qualidade das imagens comprimidas.
M´etodo de Tamanho SSIM (m´edia±desvio padr˜ao;
compress˜ao (bytes) intervalo de 95% de confian¸ca) ORL
JPEG 1% 225 0,6034±0,0494; [0,5986; 0,6083]
225 Peda¸cos-por-Valor 225 0,7262±0,0499; [0,7213, 0;7311]
JPEG 5% 270 0,6906±0,0337; [0,6873; 0,6939]
270 Peda¸cos-por-Valor 270 0,7407±0,0481; [0,7360; 0,7454]
JPEG 100% 6.158 0,9993±0,0001; [0,9992; 0,9993]
6.158 Peda¸cos-por-Valor 6.158 0,9659±0,0088; [0,9650; 0,9668]
Yale
JPEG 1% 266 0,5880±0,0411; [0,5818; 0,5943]
266 Peda¸cos-por-Valor 266 0,6852±0,0529; [0,6771; 0,6933]
JPEG 5% 357 0,6982±0,0351; [0,6928; 0,7036]
357 Peda¸cos-por-Valor 357 0,7154±0,0501; [0,7077; 0,7230]
JPEG 100% 7.254 0,9995±0,0001; [0,9994; 0,9995]
7.254 Peda¸cos-por-Valor 7.254 0,9658±0,0081; [0,9646; 0,9671]
Roteiro
Introdu¸c˜ao Estado da arteWaveletfaces Autofaces
Agrupamento de Caracter´ısticas
Autofaces Fracion´arias
Autofaces Fracion´arias (AFF) AFF Melhorado (AFFM) AF Melhorado (AFM)
Experimentos com Autofaces Fracion´ario Agrupamentos de Pixels
Peda¸cos-por-Valor Peda¸cos-por-Posi¸c˜ao
Representa¸c˜ao e Compress˜ao
Contribui¸c˜oes da tese
◮ M´etodos de agrupamento de pixel (PP, PV, PVF, PVM, PFFM) ◮ Justificativa de utiliza¸c˜ao da m´edia para extra¸c˜ao de caracter´ısticas
agrupadas
◮ Componente de baixa frequˆencia,
◮ Minimiza o erro quadr´atico m´edio da regi˜ao,
◮ Funciona semelhante ao PCA com dados correla¸c˜ao alta
◮ Compress˜ao de imagens
◮ Matriz de covariˆancia fracion´aria no Autofaces ◮ Proje¸c˜ao fracion´aria
◮ Efeitos no reconhecimento de padr˜oes
Artigos escritos
◮ Pixel Clustering for Face Recognition (ICIP 2015*)
◮ Pixel Clustering for Imagem Compression (Signal Processing
Letters*)
◮ Fractional Eigenfaces (ICIP 2014)
Principais trabalhos futuros
◮ Autofaces Fracion´ario
◮ Autofaces Fracion´ario Generalizado (r
1er2)
◮ Definir automaticamente o valor der
◮ Transforma¸c˜ao fracion´aria aplicada a `a transformada discreta de
cosseno (DCT)
◮ Agrupamento de pixels
◮ Buscar o algoritmo de agrupamento mais adequado para
agrupamento de pixels em imagens de face
◮ Compress˜ao de video/video telefonia/sub-quadros da imagem/base
de fotos
◮ Reconhecimento de pose do rosto
◮ Extra¸c˜ao de caracter´ısticas locais
◮ Encontrar a fun¸c˜ao Wavelet que minimiza o erro no reconhecimento
de faces