• Nenhum resultado encontrado

memória

4.1.1 Detecc¸˜ao de Vida

Em se tratando de m´etodos que detectam a presenc¸a de vida, Pan et al. (2007) propuseram a extrac¸˜ao de medidas, por meio do uso de um HMM (Hidden Markov Model) (BAUM; PETRIE,

4.1 M´etodos Baseados em Caracter´ısticas Handcrafted 64

1966;BAUM; EGON, 1967), do mapeamento dos estados dos olhos (abertos ou fechados) de uma face sob an´alise em um per´ıodo de tempo. Com isto, ´e poss´ıvel determinar se h´a ou n˜ao ataque baseado na presenc¸a ou ausˆencia do piscar dos olhos na face diante do sensor. Os autores, ap´os detectar e segmentar os olhos na sequˆencia de imagens usando uma cascata de classificadores “fracos” baseada no contraste de pixels e regi˜oes da imagem, inspirada no trabalho de Viola e Jones (2001), calculam medidas de abertura dos olhos, tamb´em com base em outro grupo de classificadores “fracos”, similares aos primeiros e atentos `as regi˜oes das bordas dos olhos, as quais servem de base para o HMM.

Segundo Li (2008), o ato de piscar ´e intr´ınseco ao funcionamento do globo ocular e todo ser humano pisca ao menos uma vez a cada 20 segundos, o que torna tal caracter´ıstica discrimi- nativa entre faces reais e fotografias impressas (ou mesmo faces de cad´averes). O autor tamb´em utiliza a detecc¸˜ao do piscar de olhos a partir da aplicac¸˜ao de filtros de Gabor (GABOR, 1946;

DAUGMAN, 1985) nas imagens para identificar ataques com faces sint´eticas est´aticas (fotografias ou imagens exibidas em display, por exemplo).

Kollreider, Fronthaler e Bigun (2009) desenvolveram um m´etodo que analisa o movimento de diversos pontos (regi˜oes) de controle na face usando um algoritmo de fluxo ´optico. Baseado na movimentac¸˜ao horizontal e vertical dos pontos da face, determina-se se o sistema est´a sob ataque ou n˜ao. Basicamente, os autores extraem coeficientes relacionando a direc¸˜ao e intensi- dade da movimentac¸˜ao das regi˜oes faciais internas com a movimentac¸˜ao das externas. Segundo eles, o padr˜ao de tais movimentac¸˜oes difere de faces reais e impressas: regi˜oes centrais em faces reais tendem a se mover mais e com direc¸˜oes diferentes das externas ao passo que, em faces impressas, as movimentac¸˜oes s˜ao homogˆeneas. Os coeficientes extra´ıdos das imagens de v´ıdeo s˜ao integrados para formar um score final referente `a presenc¸a de vida na face sendo analisada. Bao et al. (2009) analisam a movimentac¸˜ao facial a fim de identificar ataques por meio da diferenc¸a do padr˜ao de movimentac¸˜ao de objetos 3D (faces reais) e 2D (faces impressas). Eles tamb´em utilizam o algoritmo de fluxo ´optico, mas ao contr´ario de outros trabalhos que observam pontos espec´ıficos da face, eles analisam a movimentac¸˜ao da face como um todo. Como mostram os autores, o fluxo ´optico global de faces impressas (2D) tende e diferir de faces reais (3D).

Tirunagari et al. (2015) prop˜oem a detecc¸˜ao n˜ao s´o de de movimentos oculares mas tamb´em de outras partes da face, como exemplo, movimentos labiais, para a prevenc¸˜ao de ataques. Eles utilizam conceitos da dinˆamica de fluidos para a an´alise e caracterizac¸˜ao da movimentac¸˜ao dos pontos da face nas sequˆencias de imagens. Empregam o m´etodo denominado DMD (Dyna- mic Mode Decomposition) (SCHMID, 2010) em dada sequˆencia de frames para a extrac¸˜ao do

4.1 M´etodos Baseados em Caracter´ısticas Handcrafted 65

comportamento dos pontos faciais ao longo do tempo, obtendo-se “imagens” (matrizes) com as principais diferenc¸as de movimentac¸˜ao de tais pontos, e extraem caracter´ısticas de textura (his- tograma de tons de cinza) das mesmas a partir do descritor LBP (Local Binary Pattern) (OJALA;

PIETIKAINEN; HARWOOD, 1994, 1996), classificando o v´ıdeo por meio de uma SVM (Support

Vector Machine) (CORTES; VAPNIK, 1995).

Devido `a sua grande utilizac¸˜ao em m´etodos de anti-spoofing facial, dados os bons resul- tados que permite obter por sua sensibilidade `as imperfeic¸˜oes geradas na recaptura das faces sint´eticas (exibidas em displays ou papel, por exemplo), vale pontuar que o descritor LBP atua, basicamente, em imagens em tons de cinza, associando a cada pixel, um novo valor de inten- sidade, ap´os comparar sua intensidade original com a dos pixels vizinhos. Na an´alise de um pixel p da imagem, compara-se seu tom de cinza com o tom de cada vizinho q. Caso o tom de qseja maior ou igual ao do p, associa-se o label “1” a q, caso contr´ario “0”. Definido um raio de vizinhanc¸a R e um n´umero de vizinhos P, ap´os efetuar as comparac¸˜oes e percorrer os pixels vizinhos de p em sentido hor´ario a partir de seu vizinho superior esquerdo, pode-se contruir um n´umero bin´ario com base nos labels associados a tais pixels. Este n´umero ´e ent˜ao convertido para decimal e associa-se o valor ao pixel central p sob an´alise. Em termos matem´aticos o valor LBP de um pixel p ´e dado por:

LBPP,R= P−1

q=0

l(cq− cp) · 2q (4.1)

onde cpindica o tom de cinza de p, cqo tom de cinza do vizinho q e l(x) corresponde `a func¸˜ao

de limiarizac¸˜ao definida por:

l(x) = (

1, se x ≥ 0,

0, se x < 0. (4.2)

Ap´os efetuar tal procedimento para todos os pixels de uma dada imagem, um histograma ´e constru´ıdo com a frequˆencia da ocorrˆencia de cada decimal poss´ıvel a fim de caracteriz´a-la. Tal histograma ´e que serve ent˜ao de entrada, em geral, aos classificadores como as SVMs.

Kim, Suh e Han (2015) propuseram analisar a diferenc¸a de refletˆancia da luz em objetos (faces) 2D e 3D baseado na ideia de que em faces impressas ou exibidas em displays (superf´ıcies planas) a refletˆancia da luz incidente se d´a na mesma direc¸˜ao e sentido enquanto que em faces reais 3D, de maneira mais difusa. Eles calculam os chamados Local Speed Patterns (LSP) para caracterizar os pixels da face. Ap´os estimar a diferenc¸a de intensidade de cada pixel entre uma imagem de referˆencia e uma atual, eles geram os LSPs com base na comparac¸˜ao dos

4.1 M´etodos Baseados em Caracter´ısticas Handcrafted 66

pixels com seus vizinhos, de forma parecida com o LBP. Os c´odigos obtidos da regi˜ao facial formam um vetor de caracter´ısticas com base na frequˆencia de suas ocorrˆencias e alimentam um classificador SVM, treinado para distinguir c´odigos de faces impressas (ou em displays) 2D de faces reais 3D.

Liu et al. (2016) e Nowara, Sabharwal e Veeraraghavan (2017) utilizam m´etodos capa- zes de detectar a presenc¸a ou ausˆencia de fluxo sangu´ıneo na face, com base na variac¸˜ao de sua colorac¸˜ao ao longo do tempo, a fim de identificar ataques (presenc¸a ou ausˆencia de vida). Nowara, Sabharwal e Veeraraghavan (2017), por exemplo, ap´os detectarem a face nas imagens, extraem medidas de cor baseadas em regi˜oes internas das mesma, como testa e bochechas, bem como externas, a fim de se detectar se h´a variac¸˜oes de iluminac¸˜ao no ambiente. Caso os padr˜oes das regi˜oes internas sejam diferentes das externas, classifica-se a face nas imagens como real (utiliza-se uma SVM para tal fim), isto ´e, h´a pulsac¸˜ao e circulac¸˜ao de sangue na face enquanto que no fundo n˜ao, caso contr´ario, a face ´e classificada como sint´etica (caso em que as variac¸˜oes na colorac¸˜ao da pele possivelmente decorrem de variac¸˜oes no ambiente).

Documentos relacionados