• Nenhum resultado encontrado

O primeiro trabalho a utilizar a PRNU para o problema de identificac¸˜ao de dispositivo de aquisic¸˜ao foi desenvolvido por Luk´a˘s et al. [10]. Desde ent˜ao, a t´ecnica tem sido amplamente estudada e melhorada, e utilizada em v´arias aplicac¸˜oes pr´aticas [11–29]. Como dito, a PRNU ´e considerada uma esp´ecie de impress˜ao digital do sensor por apresentar as seguintes carac-ter´ıstica: a) ´e ´unica para cada sensor; b) est´a presente em todas as imagens (v´ıdeos) digitais adquiridas(os) pelo sensor (com excec¸˜ao de imagens completamente escuras), independente-mente das configurac¸˜oes do dispositivo de aquisic¸˜ao; c) ´e robusta a v´arios tipos de operac¸˜oes de processamento de imagem, como compress˜ao com perdas, filtragem, e correc¸˜ao gama, por exemplo; e d) ´e est´avel no tempo e em v´arias condic¸˜oes ambientais como, por exemplo, tempe-ratura e umidade [15, 18].

As t´ecnicas de identificac¸˜ao de dispositivo baseadas na PRNU s˜ao aplicadas em duas etapas: estimac¸˜ao e detecc¸˜ao. Na primeira, ´e realizada uma estimativa da PRNU (impress˜ao digital) da cˆamera suspeita. E na segunda, utiliza-se alguma m´etrica de similaridade estat´ıstica para avaliar a presenc¸a da impress˜ao digital da cˆamera suspeita na imagem investigada.

De acordo com Luk´a˘s et al. [11], a estimativa da PRNU pode ser obtida atrav´es da m´edia de v´arias imagens adquiridas pela cˆamera suspeita. Mas para tornar o processo de estimac¸˜ao mais r´apido, ´e prefer´ıvel suprimir o conte´udo das imagens antes. Dessa forma, eles obtiveram a estimativa da PRNU pela seguinte express˜ao,1

ˆ K= 1 d d X k=1 Wk (3.1)

onde ˆK ´e a estimativa da PRNU da cˆamera suspeita a partir de imagens de um canal de cor

(e.g., escala de cinza);d ´e o n´umero de imagens usadas na estimac¸˜ao da PRNU; e Wk´e o ru´ıdo residual dak-´esima imagem de treinamento Ik, obtida com a cˆamera sob suspeic¸˜ao, dado por

1Neste trabalho, utilizamos a nomenclatura empregada em trabalhos mais recentes, como em [15–24, 27–29] ao inv´es daquela utilizada por Luk´a˘s et al. [11].

13

Wk = Ik− F (Ik) (3.2) ondeF ´e um filtro de eliminac¸˜ao de ru´ıdo.

Para avaliar a presenc¸a da impress˜ao digital da cˆamera suspeita ˆK na imagem investigada It, Luk´a˘s et al. [11] calcularam o coeficiente de correlac¸˜ao de Pearson (CC) entre o ruido resi-dual da imagem de teste Wte a PRNU da cˆamera suspeita ˆK. O CC, definido na equac¸˜ao (3.3),

´e uma medida da dependˆencia linear entre duas amostras X e Y.

r = P

i,j(X[i, j] − ¯X)(Y[i, j] − ¯Y )

kX − ¯XkkY − ¯Y k (3.3)

em que ¯X e ¯Y denotam a m´edia aritm´etica de X e Y, respectivamente; e k · k representa a

normaL2.

O problema de identificac¸˜ao de dispositivo pode ser representado por um problema de teste de hip´otese bin´ario como

H0 : ˆK6= Wt

H1 : ˆK= Wt

(3.4)

onde a hip´otese nulaH0 indica que a imagem de teste n˜ao foi adquirida pela cˆamera suspeita, enquanto que a hip´otese alternativaH1afirma o contr´ario.

No trabalho de Luk´a˘s et al. [11], a decis˜ao porH0 ouH1 ´e obtida comparando o valor de

r a um limiar de decis˜ao τ . Se r for maior que τ assume-se H1 como verdadeira, ou seja, a imagem foi adquirida pela cˆamera suspeita. Caso contr´ario, aceita-se H0. A Figura 3.4 apresenta as etapas da abordagem proposta por Luk´a˘s et al. [11].

Em aplicac¸˜oes forenses, em particular, deseja-se estabelecer uma metodologia para veri-ficar a hip´oteseH1. Como consequˆencia, dois tipos de erros podem acontecer: falso negativo e

falso positivo. Falso negativo ou falsa rejeic¸˜ao ocorre quando a hip´oteseH1´e rejeitada, dado que ela ´e verdadeira (a imagem avaliada foi adquirida pela cˆamera). Enquanto que, falso positivo ou falsa aceitac¸˜ao acontece quandoH1 ´e considerada verdadeira sendo ela falsa (a imagem n˜ao foi adquirida pela cˆamera suspeita). Assim, faz-se necess´ario estabelecer um limiar de decis˜ao que satisfac¸a as probabilidades de falso negativo e de falso positivo. Claramente, quanto menores forem essas probabilidades, melhor o sistema de identificac¸˜ao. Contudo, h´a um compromisso entre as duas probabilidades, enquanto uma decresce a outra cresce [16, 24].

Luk´a˘s et al. [11] modelaram a func¸˜ao de distribuic¸˜ao de probabilidade do CC em ambas as hip´oteses em (3.4) como um modelo Gaussiano generalizado. Os parˆametros desse modelo

14

Figura 3.4: Abordagem proposta por Luk´a˘s et al. [11] para o problema de identificac¸˜ao de dispositivo de aquisic¸˜ao. Estima a PRNU da cˆamera Correlac¸˜ao r r > τ ? Estima o ru´ıdo residual da imagem cˆamera identificada cˆamera n˜ao identificada fim n˜ao sim

FONTE: Autoria pr´opria.

foram estimados a partir do conjunto de imagens utilizadas nos testes. Estes foram realizados com nove cˆameras, sendo duas da mesma marca e de mesmo modelo e duas equipadas com sen-sores de mesmo modelo. Para cada cˆamera foram adquiridas 300 imagens que foram utilizadas na estimativa da PRNU e como imagens de testes. Eles obtiveram altas taxas de acerto com baixa taxa de falso negativo. Por´em, quando todos os valores de correlac¸˜ao para imagens n˜ao adquiridas pela cˆamera suspeita foram reunidos, a distribuic¸˜ao resultante apresentou um aspecto multimodal. Portanto, a forma da func¸˜ao de distribuic¸˜ao de probabilidade sob a hip´otese nula

H0 depende do conjunto de imagens utilizado.

Com o objetivo de diminuir a taxa de falsa aceitac¸˜ao, Sutcu et al. [14] propuseram a utilizac¸˜ao de artefatos causados pela interpolac¸˜ao dos canais de cores [5, 6] em conjunto com a abordagem proposta por Luk´a˘s et al. [11]. Eles primeiro realizam a identificac¸˜ao de dispositivo pela t´ecnica proposta por Luk´a˘s et al. [11], e caso a imagem seja identificada como adqui-rida pela cˆamera, eles empregam a abordagem de identificac¸˜ao do modelo do dispositivo de aquisic¸˜ao [5, 6], apresentada na Sec¸˜ao 3.3. Em testes com trˆes cˆameras de modelos diferentes, a taxa de falsa aceitac¸˜ao diminuiu. No entanto, a inclus˜ao da t´ecnica baseada em artefatos de interpolac¸˜ao dos canais de cores n˜ao mudar´a o resultado da abordagem de Luk´a˘s et al. [11] se a imagem de teste for adquirida por outra cˆamera de mesmo modelo que a cˆamera suspeita.

15 Chen et al. [12] propuseram uma melhoria `a t´ecnica de Luk´a˘s et al. [11]. Eles observaram que o ru´ıdo residual da imagem I pode ser representado por

W= IK + Ξ (3.5) onde IK ´e o termo respons´avel pela PRNU; e Ξ ´e a combinac¸˜ao de v´arias fontes de ru´ıdo, como os causados pela interpolac¸˜ao dos canais de cores e pelo filtro de extrac¸˜ao de ru´ıdo.

Baseados na equac¸˜ao (3.5), eles elaboraram um estimador de m´axima verossimilhanc¸a da impress˜ao digital (PRNU), como

ˆ K= d P k=1 WkIk d P k=1 (Ik)2 (3.6)

onde ˆK ´e a estimativa da PRNU; Ikcorresponde `ak-´esima imagem de treinamento obtida com a

cˆamera sob suspeic¸˜ao;d ´e o n´umero total de imagens usadas na estimac¸˜ao da impress˜ao digital;

e Wk ´e o ru´ıdo de Ikdado pela equac¸˜ao (3.2).

Para detecc¸˜ao da impress˜ao digital na imagem investigada, eles utilizaram uma aborda-gem semelhante a de Luk´a˘s et al. [11]. Eles dividiram a imaaborda-gem em blocos, assumindo que a correlac¸˜ao tem um comportamento estacion´ario, e consideraram a influˆencia de fatores, como intensidade da imagem e textura, para elaborar um preditor da correlac¸˜ao. Dessa forma, obtive-ram v´arios valores de correlac¸˜ao por imagem, que foobtive-ram utilizadas para calcular os parˆametros da func¸˜ao de distribuic¸˜ao de probabilidade. Nos testes realizados, foram obtidas altas taxas de acerto. Contudo, assim como na t´ecnica proposta por Luk´a˘s et al. [11], a forma da func¸˜ao de distribuic¸˜ao de probabilidade da correlac¸˜ao para imagens n˜ao adquiridas pela cˆamera suspeita (hip´otese H0) varia de acordo com o conjunto de imagens utilizado. Isso significa que para avaliar a probabilidade de falsa aceitac¸˜ao, seria necess´ario uma grande quantidade de imagens adquiridas por outros dispositivos diferentes do equipamento suspeito [16]. Portanto, em um cen´ario aberto, a aplicac¸˜ao dessas metodologias pode ser questionada.

Chen et al. [13] utilizaram a PRNU para realizar identificac¸˜ao de dispositivo de aquisic¸˜ao de v´ıdeos digitais. Eles estimaram a impress˜ao digital do dispositivo (como na express˜ao (3.6)) a partir de uma sequˆencia de quadros de v´ıdeo. Ap´os a estimac¸˜ao, a PRNU foi filtrada para eliminar alguns artefatos causados pela compress˜ao do sinal. Esses artefatos s˜ao comuns a PRNUs de diferentes dispositivos, portanto, influenciam no valor de correlac¸˜ao. O mesmo

16 processo de estimac¸˜ao foi utilizado para obter a impress˜ao digital do v´ıdeo investigado. Para medir a correlac¸˜ao entre as PRNUs, foi utilizada a energia da correlac¸˜ao de pico (do inglˆes

peak-to-correlation energy – PCE). O PCE ´e considerado um teste estat´ıstico mais est´avel que

o CC (express˜ao (3.3)) e foi definido em [34] como

p = xy(0, 0)|

2

P

i,jxy(i, j)]2 (3.7) ondeφxy(i, j) representa a func¸˜ao de covariˆancia, dada por

φxy(i, j) =X

k,l

(X[k, l] − ¯X)(Y[k + i, l + j] − ¯Y ) (3.8) sendo X e Y as amostras avaliadas; e ¯X e ¯Y a m´edia aritm´etica de X e Y, respectivamente.

Chen et al. [13] n˜ao apresentaram uma estrat´egia definida para dizer se o v´ıdeo investigado foi adquirido pela cˆamera suspeita ou n˜ao. Eles apenas afirmaram que um alto valor de PCE caracteriza o v´ıdeo como adquirido pela cˆamera. E um baixo valor, o contr´ario.

A PRNU tamb´em foi aplicada por Goljan et al. [15] em casos de identificac¸˜ao de disposi-tivo de aquisic¸˜ao de imagens que tenham sofrido algum tipo de transformac¸˜ao geom´etrica como recorte e/ou escalonamento. Para estimac¸˜ao da impress˜ao digital do dispositivo sob suspeic¸˜ao, eles utilizaram a estrat´egia definida na express˜ao (3.6) e elaboraram um algoritmo para encon-trar os parˆametros de recorte e/ou escalonamento da imagem investigada. Primeiramente, o algoritmo executa uma busca exaustiva pelo parˆametro de escalonamento da imagem, at´e en-contrar aquele que maximiza o valor de PCE. Em seguida, o parˆametro de corte ´e determinado pelo valor m´aximo da correlac¸˜ao cruzada normalizada (do inglˆes normalized cross-correlation – NCC). A NCC ´e dada por

NCC[i, j] = m P k=1 n P l=1 (X[k, l] − ¯X)(Y[k + i, l + j] − ¯Y ) kX − ¯XkkY − ¯Yk (3.9)

onde X e Y s˜ao as amostras avaliadas; ¯X e ¯Y a m´edia aritm´etica de X e Y, respectivamente; e k · k representa a norma L2.

Para dizer se a imagem foi adquirida pela cˆamera suspeita, Goljan et al. [15] modelaram a func¸˜ao de distribuic¸˜ao do PCE e determinaram um limar de decis˜ao baseado na probabili-dade de falsa aceitac¸˜ao e nas diferenc¸as entre as dimens˜oes da imagem investigada e PRNU da cˆamera digital. Nos testes realizados, os resultados mostraram que a t´ecnica consegue identifi-car corretamente a origem da imagem com at´e 50% de redimensionamento e 90% de recorte. O desempenho dessa t´ecnica tamb´em foi comprovado em [17].

17 Assim, considerando apenas imagens que n˜ao tenham sofrido algum tipo de transformac¸˜ao geom´etrica [16], a utilizac¸˜ao do PCE permite escolher uma probabilidade de falsa aceitac¸˜ao ou falso positivo, definir o limiar de decis˜ao, e testar qualquer imagem. Portanto, n˜ao seria ne-cess´ario um conjunto de imagens n˜ao adquiridas pela cˆamera suspeita para estabelecer a proba-bilidade de falsa aceitac¸˜ao. No entanto, como mostrado em [20, 24], essa abordagem apresenta as mesmas limitac¸˜oes que a de Luk´a˘s et al. [11] e Chen et al. [12].

Todas as t´ecnicas descritas anteriormente foram avaliadas em cen´arios fechados. Em cen´arios fechados h´a um conjunto de cˆameras suspeitas e sabe-se que a imagem investigada foi adquirida por uma dessas. No entanto, a maioria dos casos pr´aticos acontecem em um cen´ario aberto. Neste, normalmente, h´a uma cˆamera suspeita e a imagem a ser analisada ou a imagem pode ter sido adquirida por um dispositivo que n˜ao faz parte do conjunto de cˆameras suspeitas. Para este cen´ario, at´e o momento, encontramos apenas uma abordagem de identificac¸˜ao de dispositivo que ser´a descrita a seguir.

3.5.1.1 Identificac¸ ˜ao de dispositivo em cen´arios abertos

A t´ecnica de identificac¸˜ao de dispositivo de aquisic¸˜ao em cen´arios abertos proposta por Costa et al. [29] consiste na definic¸˜ao de caracter´ısticas para serem utilizadas por t´ecnicas de aprendizado de m´aquina. O primeiro passo dessa abordagem ´e definir as regi˜oes de interesse (do inglˆes Regions of Interest – ROIs) da imagem que ser˜ao utilizadas no processo de extrac¸˜ao de caracter´ıstica. Em seguida, tem-se o processo de estimac¸˜ao e detecc¸˜ao da impress˜ao digital na imagem suspeita.

Costa et al. [29] defendem que a utilizac¸˜ao de regi˜oes da imagem, ao inv´es dela toda, pode resultar em um melhor desempenho para o problema de identificac¸˜ao de dispositivo quando as imagens analisadas s˜ao de diferentes resoluc¸˜oes. Al´em disso, eles consideram que diferentes regi˜oes das imagens cont´em informac¸˜oes diferentes com relac¸˜ao ao processo de aquisic¸˜ao de imagem. Por esses motivos, eles definem nove ROIs de 512×512 pixels, como mostrado no

lado esquerdo da Figura 3.5.

Para cada ROI da imagem, os autores estimam a PRNU (como definido na equac¸˜ao (3.1)) para os canais R (vermelho), G (verde) e B (azul) (padr˜ao RGB), e para o canal Y (luminˆancia, do espac¸o de cor YCbCr) (ver Figura 3.5).

Para cada imagem de teste, Costa et al. [29] extraem o ru´ıdo residual de cada ROI da imagem (como na equac¸˜ao (3.2)) e calculam o CC (equac¸˜ao (3.3)) entre esse ru´ıdo e a PRNU

18

Figura 3.5: Processo de estimac¸˜ao da PRNU para uma ROI, considerando os canais de cores R, G, B e Y. O processo ´e realizado para todas as nove ROIs marcadas na imagem.

FONTE: Costa [26].

da cˆamera suspeita correspondente a essa ROI. Assim, para cada imagem de teste, s˜ao obtidas 36 caracter´ısticas que s˜ao posteriormente utilizadas para treinamento do classificador SVM.

Costa et al. [29] realizaram testes com uma base de dados de 4411 imagens de 25 cˆameras digitais, em m´edia, 150 imagens por cˆamera, e 8799 imagens baixadas da internet, tiradas por 375 cˆameras diferentes. Eles fizeram v´arios experimentos considerando a identificac¸˜ao de dis-positivo de aquisic¸˜ao como um problema de multiclassificac¸˜ao, em que eles tinham acesso a um conjunto de cˆameras suspeitas e utilizavam todas as imagens da base de dados para teste, com excec¸˜ao daquelas utilizadas para extrac¸˜ao da PRNU e treinamento do classificador. Conside-rando 15 das 25 cˆameras como suspeitas, eles obtiveram uma taxa m´edia de sucesso de97.18%,

e considerando 2 cˆameras, obtiveram taxa m´edia de sucesso de96.56%. Por´em, eles n˜ao

apre-sentaram resultados com imagens de diferentes resoluc¸˜oes que tenham sido adquiridas pela mesma cˆamera suspeita para justificar a utilizac¸˜ao das ROIs. Al´em disso, o redimensionamento dos sinais influencia no valor de correlac¸˜ao [15, 35].

Cap´ıtulo 4

Abordagem proposta

Este cap´ıtulo apresenta a abordagem proposta para realizar identificac¸˜ao de dispositivo de aquisic¸˜ao em cen´arios abertos. Identificac¸˜ao de dispositivo de aquisic¸˜ao ´e o processo que reconhece um equipamento sob suspeic¸˜ao como o gerador de um determinado sinal (imagem ou v´ıdeo digital, por exemplo) sob investigac¸˜ao. A t´ecnica proposta explora a correlac¸˜ao en-tre as impress˜oes digitais (PRNUs) da cˆamera suspeita e da imagem investigada, em conjunto com um classificador baseado em rede neural. Ela ´e aplicada em duas etapas: estimac¸˜ao e detecc¸˜ao. Na primeira, ´e realizada uma estimativa da impress˜ao digital do dispositivo suspeito. E na segunda, utiliza-se uma m´etrica de similaridade estat´ıstica para verificar a presenc¸a desta impress˜ao digital na imagem investigada. A seguir, s˜ao apresentados detalhes sobre essas duas etapas. Algumas das express˜oes utilizadas neste cap´ıtulo j´a foram apresentadas anteriormente, mas, para facilitar a leitura do texto, ser˜ao apresentadas novamente.

4.1 Estimac¸˜ao

A PRNU do dispositivo ´e inserida na imagem digital durante o seu processo de aquisic¸˜ao, antes do sinal ser quantizado ou processado [18]. Para elaborar o processo de estimac¸˜ao da PRNU, precisa-se de um modelo de sa´ıda do sensor.

Documentos relacionados