Identificac¸˜ao de dispositivo baseada na PRNU

O primeiro trabalho a utilizar a PRNU para o problema de identificação de dispositivo de aquisição foi desenvolvido por Luká˘s et al. [10]. Desde então, a técnica tem sido amplamente estudada e melhorada, e utilizada em várias aplicações práticas [11–29]. Como dito, a PRNU é considerada uma espécie de impressão digital do sensor por apresentar as seguintes carac-ter´ıstica: a) é única para cada sensor; b) está presente em todas as imagens (v´ıdeos) digitais adquiridas(os) pelo sensor (com exceção de imagens completamente escuras), independente-mente das configurações do dispositivo de aquisição; c) é robusta a vários tipos de operações de processamento de imagem, como compressão com perdas, filtragem, e correção gama, por exemplo; e d) é estável no tempo e em várias condições ambientais como, por exemplo, tempe-ratura e umidade [15, 18].

As técnicas de identificação de dispositivo baseadas na PRNU são aplicadas em duas etapas: estimação e detecção. Na primeira, é realizada uma estimativa da PRNU (impressão digital) da câmera suspeita. E na segunda, utiliza-se alguma métrica de similaridade estat´ıstica para avaliar a presença da impressão digital da câmera suspeita na imagem investigada.

De acordo com Luká˘s et al. [11], a estimativa da PRNU pode ser obtida através da média de várias imagens adquiridas pela câmera suspeita. Mas para tornar o processo de estimação mais rápido, é prefer´ıvel suprimir o conteúdo das imagens antes. Dessa forma, eles obtiveram a estimativa da PRNU pela seguinte expressão,1

ˆ K= ¹ d d X k=1 Wk (3.1)

onde ˆK ´e a estimativa da PRNU da cˆamera suspeita a partir de imagens de um canal de cor

(e.g., escala de cinza);d é o número de imagens usadas na estimação da PRNU; e Wké o ru´ıdo residual dak-ésima imagem de treinamento Ik, obtida com a câmera sob suspeição, dado por

1Neste trabalho, utilizamos a nomenclatura empregada em trabalhos mais recentes, como em [15–24, 27–29] ao inv´es daquela utilizada por Luk´a˘s et al. [11].

W_k = Ik− F (Ik) (3.2) ondeF é um filtro de eliminação de ru´ıdo.

Para avaliar a presença da impressão digital da câmera suspeita ˆK na imagem investigada I_t, Luká˘s et al. [11] calcularam o coeficiente de correlação de Pearson (CC) entre o ruido resi-dual da imagem de teste W_te a PRNU da câmera suspeita ˆK. O CC, definido na equação (3.3),

´e uma medida da dependˆencia linear entre duas amostras X e Y.

r = P

i,j(X[i, j] − ¯X)(Y[i, j] − ¯Y )

kX − ¯XkkY − ¯Y k ^(3.3)

em que ¯X e ¯Y denotam a m´edia aritm´etica de X e Y, respectivamente; e k · k representa a

normaL2.

O problema de identificação de dispositivo pode ser representado por um problema de teste de hipótese binário como

H₀ : ˆK6= Wt

H1 : ˆK= Wt

(3.4)

onde a hipótese nulaH₀ indica que a imagem de teste não foi adquirida pela câmera suspeita, enquanto que a hipótese alternativaH1afirma o contrário.

No trabalho de Luká˘s et al. [11], a decisão porH0 ouH1 é obtida comparando o valor de

r a um limiar de decisão τ . Se r for maior que τ assume-se H1 como verdadeira, ou seja, a imagem foi adquirida pela câmera suspeita. Caso contrário, aceita-se H0. A Figura 3.4 apresenta as etapas da abordagem proposta por Luká˘s et al. [11].

Em aplicações forenses, em particular, deseja-se estabelecer uma metodologia para veri-ficar a hipóteseH1. Como consequência, dois tipos de erros podem acontecer: falso negativo e

falso positivo. Falso negativo ou falsa rejeição ocorre quando a hipóteseH1é rejeitada, dado que ela é verdadeira (a imagem avaliada foi adquirida pela câmera). Enquanto que, falso positivo ou falsa aceitação acontece quandoH1 é considerada verdadeira sendo ela falsa (a imagem não foi adquirida pela câmera suspeita). Assim, faz-se necessário estabelecer um limiar de decisão que satisfaça as probabilidades de falso negativo e de falso positivo. Claramente, quanto menores forem essas probabilidades, melhor o sistema de identificação. Contudo, há um compromisso entre as duas probabilidades, enquanto uma decresce a outra cresce [16, 24].

Luká˘s et al. [11] modelaram a função de distribuição de probabilidade do CC em ambas as hipóteses em (3.4) como um modelo Gaussiano generalizado. Os parâmetros desse modelo

Figura 3.4: Abordagem proposta por Luká˘s et al. [11] para o problema de identificação de dispositivo de aquisição. Estima a PRNU da câmera Correlação r ^{r > τ ?} Estima o ru´ıdo residual da imagem câmera identificada câmera não identificada fim não sim

FONTE: Autoria pr´opria.

foram estimados a partir do conjunto de imagens utilizadas nos testes. Estes foram realizados com nove câmeras, sendo duas da mesma marca e de mesmo modelo e duas equipadas com sen-sores de mesmo modelo. Para cada câmera foram adquiridas 300 imagens que foram utilizadas na estimativa da PRNU e como imagens de testes. Eles obtiveram altas taxas de acerto com baixa taxa de falso negativo. Porém, quando todos os valores de correlação para imagens não adquiridas pela câmera suspeita foram reunidos, a distribuição resultante apresentou um aspecto multimodal. Portanto, a forma da função de distribuição de probabilidade sob a hipótese nula

H0 depende do conjunto de imagens utilizado.

Com o objetivo de diminuir a taxa de falsa aceitação, Sutcu et al. [14] propuseram a utilização de artefatos causados pela interpolação dos canais de cores [5, 6] em conjunto com a abordagem proposta por Luká˘s et al. [11]. Eles primeiro realizam a identificação de dispositivo pela técnica proposta por Luká˘s et al. [11], e caso a imagem seja identificada como adqui-rida pela câmera, eles empregam a abordagem de identificação do modelo do dispositivo de aquisição [5, 6], apresentada na Seção 3.3. Em testes com três câmeras de modelos diferentes, a taxa de falsa aceitação diminuiu. No entanto, a inclusão da técnica baseada em artefatos de interpolação dos canais de cores não mudará o resultado da abordagem de Luká˘s et al. [11] se a imagem de teste for adquirida por outra câmera de mesmo modelo que a câmera suspeita.

15 Chen et al. [12] propuseram uma melhoria à técnica de Luká˘s et al. [11]. Eles observaram que o ru´ıdo residual da imagem I pode ser representado por

W= IK + Ξ (3.5) onde IK é o termo responsável pela PRNU; e Ξ é a combinação de várias fontes de ru´ıdo, como os causados pela interpolação dos canais de cores e pelo filtro de extração de ru´ıdo.

Baseados na equação (3.5), eles elaboraram um estimador de máxima verossimilhança da impressão digital (PRNU), como

ˆ K= d P k=1 W_kI_k d P k=1 (Ik)² (3.6)

onde ˆK é a estimativa da PRNU; I_kcorresponde àk-ésima imagem de treinamento obtida com a

câmera sob suspeição;d é o número total de imagens usadas na estimação da impressão digital;

e Wk é o ru´ıdo de Ikdado pela equação (3.2).

Para detecção da impressão digital na imagem investigada, eles utilizaram uma aborda-gem semelhante a de Luká˘s et al. [11]. Eles dividiram a imaaborda-gem em blocos, assumindo que a correlação tem um comportamento estacionário, e consideraram a influência de fatores, como intensidade da imagem e textura, para elaborar um preditor da correlação. Dessa forma, obtive-ram vários valores de correlação por imagem, que foobtive-ram utilizadas para calcular os parâmetros da função de distribuição de probabilidade. Nos testes realizados, foram obtidas altas taxas de acerto. Contudo, assim como na técnica proposta por Luká˘s et al. [11], a forma da função de distribuição de probabilidade da correlação para imagens não adquiridas pela câmera suspeita (hipótese H0) varia de acordo com o conjunto de imagens utilizado. Isso significa que para avaliar a probabilidade de falsa aceitação, seria necessário uma grande quantidade de imagens adquiridas por outros dispositivos diferentes do equipamento suspeito [16]. Portanto, em um cenário aberto, a aplicação dessas metodologias pode ser questionada.

Chen et al. [13] utilizaram a PRNU para realizar identificação de dispositivo de aquisição de v´ıdeos digitais. Eles estimaram a impressão digital do dispositivo (como na expressão (3.6)) a partir de uma sequência de quadros de v´ıdeo. Após a estimação, a PRNU foi filtrada para eliminar alguns artefatos causados pela compressão do sinal. Esses artefatos são comuns a PRNUs de diferentes dispositivos, portanto, influenciam no valor de correlação. O mesmo

16 processo de estimação foi utilizado para obter a impressão digital do v´ıdeo investigado. Para medir a correlação entre as PRNUs, foi utilizada a energia da correlação de pico (do inglês

peak-to-correlation energy – PCE). O PCE ´e considerado um teste estat´ıstico mais est´avel que

o CC (express˜ao (3.3)) e foi definido em [34] como

p = ^|φ^xy^{(0, 0)|}

i,j[φxy(i, j)]2 (3.7) ondeφxy(i, j) representa a função de covariância, dada por

φxy(i, j) =^X

k,l

(X[k, l] − ¯X)(Y[k + i, l + j] − ¯Y ) (3.8) sendo X e Y as amostras avaliadas; e ¯X e ¯Y a m´edia aritm´etica de X e Y, respectivamente.

Chen et al. [13] não apresentaram uma estratégia definida para dizer se o v´ıdeo investigado foi adquirido pela câmera suspeita ou não. Eles apenas afirmaram que um alto valor de PCE caracteriza o v´ıdeo como adquirido pela câmera. E um baixo valor, o contrário.

A PRNU também foi aplicada por Goljan et al. [15] em casos de identificação de disposi-tivo de aquisição de imagens que tenham sofrido algum tipo de transformação geométrica como recorte e/ou escalonamento. Para estimação da impressão digital do dispositivo sob suspeição, eles utilizaram a estratégia definida na expressão (3.6) e elaboraram um algoritmo para encon-trar os parâmetros de recorte e/ou escalonamento da imagem investigada. Primeiramente, o algoritmo executa uma busca exaustiva pelo parâmetro de escalonamento da imagem, até en-contrar aquele que maximiza o valor de PCE. Em seguida, o parâmetro de corte é determinado pelo valor máximo da correlação cruzada normalizada (do inglês normalized cross-correlation – NCC). A NCC é dada por

NCC[i, j] = m P k=1 n P l=1 (X[k, l] − ¯X)(Y[k + i, l + j] − ¯Y ) kX − ¯XkkY − ¯Yk ^(3.9)

onde X e Y são as amostras avaliadas; ¯X e ¯Y a média aritmética de X e Y, respectivamente; e k · k representa a norma L2.

Para dizer se a imagem foi adquirida pela câmera suspeita, Goljan et al. [15] modelaram a função de distribuição do PCE e determinaram um limar de decisão baseado na probabili-dade de falsa aceitação e nas diferenças entre as dimensões da imagem investigada e PRNU da câmera digital. Nos testes realizados, os resultados mostraram que a técnica consegue identifi-car corretamente a origem da imagem com até 50% de redimensionamento e 90% de recorte. O desempenho dessa técnica também foi comprovado em [17].

17 Assim, considerando apenas imagens que não tenham sofrido algum tipo de transformação geométrica [16], a utilização do PCE permite escolher uma probabilidade de falsa aceitação ou falso positivo, definir o limiar de decisão, e testar qualquer imagem. Portanto, não seria ne-cessário um conjunto de imagens não adquiridas pela câmera suspeita para estabelecer a proba-bilidade de falsa aceitação. No entanto, como mostrado em [20, 24], essa abordagem apresenta as mesmas limitações que a de Luká˘s et al. [11] e Chen et al. [12].

Todas as técnicas descritas anteriormente foram avaliadas em cenários fechados. Em cenários fechados há um conjunto de câmeras suspeitas e sabe-se que a imagem investigada foi adquirida por uma dessas. No entanto, a maioria dos casos práticos acontecem em um cenário aberto. Neste, normalmente, há uma câmera suspeita e a imagem a ser analisada ou a imagem pode ter sido adquirida por um dispositivo que não faz parte do conjunto de câmeras suspeitas. Para este cenário, até o momento, encontramos apenas uma abordagem de identificação de dispositivo que será descrita a seguir.

3.5.1.1 Identificaç ão de dispositivo em cenários abertos

A técnica de identificação de dispositivo de aquisição em cenários abertos proposta por Costa et al. [29] consiste na definição de caracter´ısticas para serem utilizadas por técnicas de aprendizado de máquina. O primeiro passo dessa abordagem é definir as regiões de interesse (do inglês Regions of Interest – ROIs) da imagem que serão utilizadas no processo de extração de caracter´ıstica. Em seguida, tem-se o processo de estimação e detecção da impressão digital na imagem suspeita.

Costa et al. [29] defendem que a utilização de regiões da imagem, ao invés dela toda, pode resultar em um melhor desempenho para o problema de identificação de dispositivo quando as imagens analisadas são de diferentes resoluções. Além disso, eles consideram que diferentes regiões das imagens contém informações diferentes com relação ao processo de aquisição de imagem. Por esses motivos, eles definem nove ROIs de 512×512 pixels, como mostrado no

lado esquerdo da Figura 3.5.

Para cada ROI da imagem, os autores estimam a PRNU (como definido na equação (3.1)) para os canais R (vermelho), G (verde) e B (azul) (padrão RGB), e para o canal Y (luminância, do espaço de cor YCbCr) (ver Figura 3.5).

Para cada imagem de teste, Costa et al. [29] extraem o ru´ıdo residual de cada ROI da imagem (como na equação (3.2)) e calculam o CC (equação (3.3)) entre esse ru´ıdo e a PRNU

Figura 3.5: Processo de estimação da PRNU para uma ROI, considerando os canais de cores R, G, B e Y. O processo é realizado para todas as nove ROIs marcadas na imagem.

FONTE: Costa [26].

da câmera suspeita correspondente a essa ROI. Assim, para cada imagem de teste, são obtidas 36 caracter´ısticas que são posteriormente utilizadas para treinamento do classificador SVM.

Costa et al. [29] realizaram testes com uma base de dados de 4411 imagens de 25 câmeras digitais, em média, 150 imagens por câmera, e 8799 imagens baixadas da internet, tiradas por 375 câmeras diferentes. Eles fizeram vários experimentos considerando a identificação de dis-positivo de aquisição como um problema de multiclassificação, em que eles tinham acesso a um conjunto de câmeras suspeitas e utilizavam todas as imagens da base de dados para teste, com exceção daquelas utilizadas para extração da PRNU e treinamento do classificador. Conside-rando 15 das 25 câmeras como suspeitas, eles obtiveram uma taxa média de sucesso de97.18%,

e considerando 2 câmeras, obtiveram taxa média de sucesso de96.56%. Porém, eles não

apre-sentaram resultados com imagens de diferentes resoluções que tenham sido adquiridas pela mesma câmera suspeita para justificar a utilização das ROIs. Além disso, o redimensionamento dos sinais influencia no valor de correlação [15, 35].

Cap´ıtulo 4

Abordagem proposta

Este cap´ıtulo apresenta a abordagem proposta para realizar identificação de dispositivo de aquisição em cenários abertos. Identificação de dispositivo de aquisição é o processo que reconhece um equipamento sob suspeição como o gerador de um determinado sinal (imagem ou v´ıdeo digital, por exemplo) sob investigação. A técnica proposta explora a correlação en-tre as impressões digitais (PRNUs) da câmera suspeita e da imagem investigada, em conjunto com um classificador baseado em rede neural. Ela é aplicada em duas etapas: estimação e detecção. Na primeira, é realizada uma estimativa da impressão digital do dispositivo suspeito. E na segunda, utiliza-se uma métrica de similaridade estat´ıstica para verificar a presença desta impressão digital na imagem investigada. A seguir, são apresentados detalhes sobre essas duas etapas. Algumas das expressões utilizadas neste cap´ıtulo já foram apresentadas anteriormente, mas, para facilitar a leitura do texto, serão apresentadas novamente.

4.1 Estimac¸˜ao

A PRNU do dispositivo é inserida na imagem digital durante o seu processo de aquisição, antes do sinal ser quantizado ou processado [18]. Para elaborar o processo de estimação da PRNU, precisa-se de um modelo de sa´ıda do sensor.

No documento UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE TECNOLOGIA FACULDADE DE ENGENHARIA DA COMPUTAÇÃO E TELECOMUNICAÇÕES (páginas 27-34)